我安静地在 linux 下练习 socket,结果 baidu 连上来了

2016-04-01 21:01:12 +08:00
 cfans1993

今天学 socket ,从 windows 下连接 linux ,

linux 开着 server ,用的 8000 端口,功能就是接受客户端面发来的字符串,然后返回大写的字符串 过了不久,控制台显示百度接上来了

接收如下

received from 123.151.42.61 at port 34450
Received content:GET http://www.baidu.com/ HTTP/1.1
Host: www.baidu.com
Accept: */*
Content-Ty 

另外还有一个其它的

received from 45.78.0.11 at port 57423
Received content:GET / HTTP/1.0
Host: kiwiproxychecker.sioru.com

问题来了

这是百度的爬虫吗,是不是连接信息被跟踪了?我并没有开 httpd 服务

2982 次点击
所在节点    问与答
9 条回复
id4alex
2016-04-01 21:06:26 +08:00
[root@www data]# nslookup 123.151.42.61
Server: 100.100.2.138
Address: 100.100.2.138#53

** server can't find 61.42.151.123.in-addr.arpa.: NXDOMAIN

[root@www data]# nslookup 123.125.71.24
Server: 100.100.2.138
Address: 100.100.2.138#53

Non-authoritative answer:
24.71.125.123.in-addr.arpa name = baiduspider-123-125-71-24.crawl.baidu.com.

Authoritative answers can be found from:
125.123.in-addr.arpa nameserver = ns2.bta.net.cn.
125.123.in-addr.arpa nameserver = ns.bta.net.cn.
ns.bta.net.cn internet address = 202.96.0.133
ns2.bta.net.cn internet address = 202.106.196.28


你遇到的是假百度
billlee
2016-04-01 21:10:42 +08:00
不是,这只是开放代理扫描器,试图通过你的服务器作为代理来访问百度
littlewey
2016-04-01 21:16:30 +08:00
是搬瓦工上的扫描 bot ?
cfans1993
2016-04-01 21:51:15 +08:00
@littlewey 用 whois 查了 sioru.com 是属于搬瓦工的
cfans1993
2016-04-01 21:52:28 +08:00
@billlee 这一说明白了,谢谢
jessynt
2016-04-01 21:55:29 +08:00
扫描 HTTP 代理的,8000 端口算是代理常用端口了,打开 Baidu 是通过尝试访问百度确认代理 IP 可用性
UnisandK
2016-04-01 21:57:13 +08:00
GET http://www.baidu.com/ HTTP/1.1
这已经很清楚的告诉你是把你当代理在访问了
cfans1993
2016-04-01 22:06:20 +08:00
@id4alex 已 get 方法,谢谢
shiny
2016-04-02 17:22:16 +08:00
淘宝上五块钱两万个代理 ip 就是这么来的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/268007

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX