发一个自己的作品 - globr 搜索 [java&nodejs]

2015-08-23 13:36:53 +08:00
 HentaiMew

globr 的主旨是让国内用户可以纯净、快速、有效的获取 google 搜索数据。

globr 分为 globr-api 和 globr-clt , clt 也就是 client , api 是一个 java 实现的 RestFul WebService 。

目前 clt 端只实现了一个 nodejs 的版本,项目名为 : "globr-nodejs-clt",这个项目是昨天突然的想法开始的,由于很紧凑,代码写得不是很规范,页面也是比较随意 没有注重细节。所以暂时就不公布 git 仓库地址了(怕丢人,确实写得很渣)。

现在 api 端运行在一台日本的主机上, nodejs 的 clt 端运行在 BAE 上。大家可以玩玩。

地址是 : http://globrv.duapp.com

.... 低调点 我在 BAE 上还有备案在审核呢。。。。

这个项目仅供个人学习和娱乐,仅仅提供了谷歌的结果 但是不提供结果的任何形式的代理获取,例如你搜索到了一个 youtube 的条目,你点击进去,如果你无法访问 youtube ,那么仍然无法访问的。

结果页面条目是真实链接 target = _blank 跳转,没有谷歌重定向!

6325 次点击
所在节点    Node.js
71 条回复
HentaiMew
2015-08-23 13:40:34 +08:00
对了,谷歌的结果页面,有些关键字会涉及到图片,"image for google"的条目。由于图片地址国内是无法直接访问到的,没有代理的朋友页面上该条目将都是坏图片,所以我干脆把图片结果给去掉了。
sparkrat
2015-08-23 14:06:55 +08:00
赞一个,,虽然我有梯子.....这想法很新颖,不过似乎不能从根本上解决问题呢?
楼主加油.最后还是弱弱的说一句, 搭梯子大法好.
HentaiMew
2015-08-23 14:16:36 +08:00
@sparkrat 梯子或者其他代理方式真的好?

代理网络或者反代谷歌都是让用户直接访问海外服务器,很多地区网络封锁或者出口原因,丢包很高,速度很慢。而且相对的服务器的压力和流量输出都会比较高。


而这个的区别就是,你是直接访问的运行在 BAE 上的应用,百度服务器。无论哪里速度基本都非常快。


连接海外服务器的只有一个点,那就是百度的服务器,并不会分散到各个地区的用户网络上。


海外服务器的数据获取封装成了 RestFul API ,每个请求传输数据不过几 KB 级别的,再加上一般 IDCj 机房网络对海外访问都比较友好(所以有些飞机提供商还用国内服务器做流量中转),所以让百度的服务器去访问海外主机,我觉得是很明智的。(虽然只是玩玩.... )

当然梯子还是必备的.... 不然搜索出来的很多国外结果没什么用,访问依然卡死你。用谷歌不就主要是搜索老外的资料么。哈哈
feijilei
2015-08-23 14:20:06 +08:00
www.gugesou.com 一直都用这个
HentaiMew
2015-08-23 14:24:28 +08:00
楼上就是一个谷歌的反代←_←
oott123
2015-08-23 14:38:10 +08:00
用 Google 的一大好处就是它可以根据你的历史点击和搜索记录提供个性化的结果。
HentaiMew
2015-08-23 14:41:27 +08:00
@oott123 我不知道能不能个性化结果。。。但是个性化广告是千真万确的.....
breeswish
2015-08-23 15:16:56 +08:00
@oott123 必应做得更绝..会根据上几次搜索进行关联搜索..
zonghua
2015-08-23 15:48:51 +08:00
是构造模拟登陆吗?然后解析的数据返回来?
flowfire
2015-08-23 16:12:52 +08:00
用的 Google search api ?
我用谷歌还有一个很重要的一点是因为他比百度好看。。。。
HentaiMew
2015-08-23 17:00:39 +08:00
@flowfire 并不是 api , api 有此数限制,我是抓取的搜索结果,解析 dom ,封装成 JavaBean 做成自己的 api 然后给 clt 端的 nodejs 使用
flowfire
2015-08-23 18:08:14 +08:00
@HentaiMew 其实就是反代吧。。。
Kokororin
2015-08-23 18:12:03 +08:00
之前也写过一个和楼主类似的。。
地址: https://niconiconi.science/
HentaiMew
2015-08-23 18:40:42 +08:00
@Kokororin 然而并不能访问.... 你是用的海外主机吧。
Kokororin
2015-08-23 18:45:57 +08:00
@HentaiMew 是的……放在 linode 上
HentaiMew
2015-08-23 18:48:37 +08:00
@Kokororin 然而上海用户表示 linode 已死,直接性的 ping 不通。所以我才要暴露成 api 让百度的服务器去访问。这样就不会因为用户网络原因造成访问问题了
Kokororin
2015-08-23 18:54:00 +08:00
@HentaiMew 然而上海电信非 CN2 用户表示无压力……我是用 php 直接获取的,比较 low
magicdawn
2015-08-23 18:56:44 +08:00
http://google.magicdawn.ml/

就是搜索, 然后在 heroku 上买, 一段时间没人访问就休眠了
HentaiMew
2015-08-23 19:07:50 +08:00
@magicdawn 这个 heroku 看起来不错 有免费的而且还是 521m 内存 不过居然 24 小时以内必须休眠 1/4 的时间。。。 持续超过 18 小时未休眠 会怎样?暂时无法访问吗?
orangleliu
2015-08-23 19:08:08 +08:00
搜中文都是日语的 。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/215324

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX