如何让百度收录 github page

2019-01-11 17:39:02 +08:00
 changwei

我自己的主站站点有通往 github pages 的博客外链,我也做了到我自己备案域名的 cname,但是一直没有被收录

网上初步了解了一下发现是因为曾经墙劫持了百度的统计脚本 ddos github,所以 github 报复性的屏蔽了所有百度爬虫。(参考 https://zhuanlan.zhihu.com/p/19987510

请问这个屏蔽现在还在持续吗?目前有什么办法可以让百度收录呢?

(我个人觉得如果这事情是真的,github 不应该报复百度啊,上述种种证据显示这真的不是百度的错( TTL 有变化,说明是中间环节被篡改了原始脚本,而不是百度服务器判断访问者 IP 的地理位置而输出具有攻击 payload 的脚本),不应该去报复百度。要有骨气一点就直接学 google,搜索联想内容被投毒了就直接退出中国大陆市场。)

2945 次点击
所在节点    问与答
7 条回复
ysc3839
2019-01-11 18:45:13 +08:00
我更加怀疑是百度故意不收录。
GitHub 主站的 robots.txt https://github.com/robots.txt 有写:
# If you would like to crawl GitHub contact us at support@github.com.
# We also provide an extensive API: https://developer.github.com/
Google 和 Bing 都在内,而百度不在,感觉是百度自己不愿意去申请。

另外,GitHub 就没有进入中国大陆,也没有退出这种操作。
ysc3839
2019-01-11 18:50:14 +08:00
同时,搜索可以发现百度收录了一大堆 github.io 的网站,可以确定 GitHub 没有屏蔽了。
binaryify
2019-01-11 20:09:23 +08:00
我怎么记得是 GitHub 特地不让百度收录的
mmdsun
2019-01-11 20:16:34 +08:00
百度 DDoS github 还是墙亲自出面的。。
mayx
2019-01-11 20:43:39 +08:00
反代吧,Github pages 一检测到百度的 UA 就 403 了
bravecarrot
2019-01-11 21:25:48 +08:00
github 不让百度收录。
if u wanna be a president , contact me. 楼主是不是怀疑我不让你当总统
flynaj
2019-01-12 20:56:51 +08:00
Google 并没有退出中国港澳台都可以,办公室在香港,不要搞分裂

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/526140

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX