input:
www.baidu.comoutput:
www.baidu.com ,百度
目前我所考虑的找到的方法:
1.
http://data.alexa.com/data?cli=10&dat=snbamz&url=www.baidu.com ,通过这个借口确实能拿到不少信息,但似乎没有中文的网站名
2. 爬网页从title标签里提取,这个难点在于:如果把“百度一下,你就知道”这类的字符串总结为百度
3.
http://www.alexa.cn/index.php?url=www.baidu.com 这个最有价值,但是遇到两点问题:
3.1 网站有防护,我刚爬了30多个域名,就被“Access Denied”
3.2 数据的权威性,不知道这个网站是哪家的
4.
http://aws.amazon.com/cn/awis/ ,这个基本是1的收费版本,提供的信息应该差不多。
大家还有其他的方案么?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/86590
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.