每天 30 万 pv 的日志怎么做日志审核?

2014-10-21 00:30:43 +08:00
 kofj
近半个月来网站访问量猛增,日pv量在25-30万之间,第三方统计(cnzz和百度)的结果远小于日志的统计结果。用脚本分析日志后发现各个搜索引擎的蜘蛛爬行量也不足5万,而且通过脚本统计单IP访问量得到的TOP10数据中也没有发现访问量特别异常的(TOP One就没有超过200)。那么,问题来了,剩余的不明PV访问量到哪里去了哪?求日志审核方法和指导。

P.S.阿里云ECS,有云盾清洗流量,服务器又运行脚本对单IP链接数超过10个的进行永久封杀(宁错杀1000勿放过1个)
3238 次点击
所在节点    站长
10 条回复
tumutanzi
2014-10-21 00:42:47 +08:00
What is your domain?
1up
2014-10-21 01:06:45 +08:00
服务器日志?怎么定义pv的
llhh
2014-10-21 01:10:28 +08:00
楼主还是说下如何定义pv吧,这应该是个大问题。
另外就是看下统计代码是否都加全了。
jiyee
2014-10-21 01:27:13 +08:00
对request uri归类做top 20分析看看。
另外对useragent可以做同样的分析。
kofj
2014-10-21 01:47:21 +08:00
@tumutanzi
@1up
@llhh
大部分css和js使用的前端公共库CDN服务,只引用了一个css,js写在了页面中。简单粗暴的把日志中两个request算作了一个pv。

@jiyee 可以试试~之前没有做过,查查资料去。
webjin
2014-10-21 01:51:30 +08:00
可以不使用阿里云啊
xupefei
2014-10-21 06:14:42 +08:00
Tianpu
2014-10-21 06:32:36 +08:00
kofj
2014-10-21 11:13:03 +08:00
@webjin 用哪家的服务器咱暂且不讨论

@xupefei
@Tianpu
谢谢两位,我来试试~
webjin
2014-10-21 18:56:17 +08:00
@tumutanzi localhost

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/140364

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX