Cloudflare 网站监测跟其它监测工具的监测结果差异这么大么?

2023-12-20 00:59:51 +08:00
 dbzz

先上网站地址(一个租房工具网站): https://dbzz.house/
网站放在 Cloudflare 上,也尽量使用了 Cloudflare 的工具,包括域名、DNS 、Cache 、HTTPS 证书、WAF 等。
Cloudflare 有个 Analytics & Logs 工具,提供了基础的网站监测功能,主要是 PV 、UV 、Bandwith 这些。

自己另外加了些监测工具,主流的应该都加了:GA4(Google Analytics 4)、Piwik 、百度统计、51.la

不同家的监测结果有些差异。比如,无论 PV/UV ,51.la 的数据都是最少的,而 Cloudflare 是最多的。
同时 Cloudflare 的数据跟其它家数据差异最大,以 2023.12.18 的数据为例,Cloudflare 统计的 UV 是第二名( Piwik )统计 UV 的 4.3 倍,PV 是第二名( GA4 )统计到的 17 倍。肉眼看其它天数据,感觉大同小异。

之前以为可能是 cache 的原因,用户的浏览器缓存没有更新,导致监测代码没有统计到这部分用户。但后来看了下,Cloudflare 上配置的 Browser Cache TTL 是 4h ,没改过。
自己手动测试访问一些 URL ,在各家的后台访问明细里都能看到。

个人猜测,可能是 Cloudflare 统计多了,毕竟其它家的统计结果差异没有那么大。
求各位给分析下,可能是啥原因呢?
谢谢大家。

3900 次点击
所在节点    Cloudflare
27 条回复
xmoer
2023-12-20 01:04:47 +08:00
第三方统计的 js 代码普遍会被各种 AdBlock 插件拦截,故偏少是正常的,我觉得反而 CF 这个更准。
dbzz
2023-12-20 01:21:58 +08:00
@xmoer 没理解。各种 AdBlock 插件不是要拦截广告的么,为啥要拦截 JS 统计代码呢?
Saniter
2023-12-20 01:56:56 +08:00
adblock 拦截统计 js 不是常规操作吗
jinliming2
2023-12-20 02:07:31 +08:00
@dbzz 因为第三方的访问统计被认为是一种隐私泄漏(这一点每个人观点不同)。
第三方的统计拿到数据之后,可以精准的分析用户在各个网站上的行为,用于精准地推送广告之类的。
所以广告屏蔽第三方统计都是常规操作了,不过大部分都有设置可以选择不屏蔽。
yyfearth
2023-12-20 02:50:49 +08:00
@dbzz 这类扩展都默认屏蔽了这些 js 代码的加载
一般的用户谁会手动去改这些
airyland
2023-12-20 03:06:33 +08:00
cf 有两个统计:
1. Account Analytics 基本会是其他工具几倍以上的数据,因为它不是页面统计,而是在服务器端统计了所有请求。
2. Web Analytics 这个仅统计页面请求,会相比其他多一点,但不会太离谱。
estk
2023-12-20 07:20:11 +08:00
Cloudflare 的统计在 js 加载出来之前就可以做到
其它统计需要等 js 加载完成,然后上报
tailf
2023-12-20 09:18:39 +08:00
服务器日志里面,大部分的请求其实都是搜索引擎爬虫发出的
Shiroka
2023-12-20 09:24:58 +08:00
Cloudflare 统计的是它收到的所有请求,你在某台服务器上 curl 好几次,它就会统计成好几个 PV ,所以有些搜索引擎的爬虫或者播测平台的测试请求都会被算入。

其他依赖 js 的统计,比如 GA 和 cnzz 是需要访客加载出来那个 js ,然后再回传数据的,这个爬虫和攻击一般做不到,通常还是真实访客居多。

所以 Cloudflare 比 GA 多的那一部分大概率是非人类用户产生的,不知道楼主能不能理解。
bingo084
2023-12-20 10:21:10 +08:00
别的不说,你这个租房工具网站挺方便的
deBaikal
2023-12-20 10:34:18 +08:00
工具挺方便的 赞一个
lizhenda
2023-12-20 11:07:16 +08:00
cf 速度这么快的吗,不管代不代理,都是秒开啊
7inFen
2023-12-20 11:18:32 +08:00
![6a154a31cf63ff71af394901fe646097.jpeg]( https://i.miji.bid/2023/12/20/6a154a31cf63ff71af394901fe646097.jpeg)

基本都被屏蔽了
admpubcom
2023-12-20 11:39:02 +08:00
页面上加的统计主要统计浏览器环境下的网页行为,无法统计类似于 curl 直接请求网页本身的行为
ShuA1
2023-12-20 12:20:09 +08:00
cf 的统计是基于四层流量的, 更准确
samhjn
2023-12-20 14:01:29 +08:00
有一些爬虫不会解析 JS ,这个也可能是一部分差量
sudoy
2023-12-20 14:49:59 +08:00
有没有可能,楼主其实是来宣传网站的 手动狗头
dbzz
2023-12-20 17:41:01 +08:00
@Shiroka 听起来 make sense 。另外,播测平台是指?
dbzz
2023-12-20 17:44:48 +08:00
@lizhenda 是不是你的网络环境比较好?
CF 套在境内网站应该是负优化,我的 VPS 是 AWS Lightsail 东京机房。
dbzz
2023-12-20 17:46:26 +08:00
@sudoy 出发点真的是来问问题的,困惑了好几天……客观上应该会有些宣传效果。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1001803

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX