nginx 访问日志里为何会有其他网站的?

2016-08-29 09:50:48 +08:00
 ljcarsenal

91.196.50.33 - - [28/Aug/2016:13:30:18 +0800] "GET http://testp4.pospr.waw.pl/testproxy.php HTTP/1.1" 404 3650 "-" "Mozilla/5.0 (Windows NT 5.1; rv:32.0) Gecko/20100101 Firefox/31.0" "-" 185.25.148.240 - - [28/Aug/2016:13:31:04 +0800] "GET http://testp4.pospr.waw.pl/testproxy.php HTTP/1.1" 404 3650 "-" "Mozilla/5.0 (Windows NT 5.1; rv:32.0) Gecko/20100101 Firefox/31.0" "-" 80.82.78.38 - - [28/Aug/2016:14:44:12 +0800] "GET http://www.baidu.com/cache/global/img/gs.gif HTTP/1.1" 404 3650 "-" "Mozilla" "-"

我有个阿里云 装了 nginx 之后一直开着 80 端口,使用默认配置。也没运行什么服务。昨天看了下访问日志,为何会有访问这些网站的记录被捕获到?

6563 次点击
所在节点    NGINX
8 条回复
des
2016-08-29 09:55:18 +08:00
扫代理的
zhouyq
2016-08-29 10:30:38 +08:00
被扫了
tinyproxy
2016-08-29 11:23:19 +08:00
http proxy 的报文就是这样子的。
petelin
2016-08-29 12:48:57 +08:00
看了前面的明白了,他是向你机器发送 get 其他网站的请求,如果你这个机器是代理,就能返回真的其他网站的 html,
tianshiyeben
2016-08-29 15:14:51 +08:00
@petelin 这是怎么实现的??又没人普及下,我不懂啊
tinyproxy
2016-08-29 16:11:21 +08:00
@tianshiyeben 我说的不清楚么。。。你要有兴趣就看看这个文件吧 https://github.com/senko/tornado-proxy/blob/master/tornado_proxy/proxy.py

如果你熟悉 HTTP 协议,会点 python 看完这个 mini 的 http proxy 实现就知道了。

再伸手就不合适了。
lhbc
2016-08-29 16:12:44 +08:00
@tianshiyeben 对于一台代理服务器而言,服务器收到的请求就是 GET http://example.com
代理服务器应该以 client 的角色去抓取这个 URL 并返回给客户端
tianshiyeben
2016-08-29 16:46:57 +08:00
@lhbc 我懂了


@tinyproxy 最近在学习 python ,这个看着还是比较吃力

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/302377

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX