百度贴吧云监控(功能:百度贴吧发帖频率统计以及贴吧帖子热门关键词统计) 仓库地址 https://github.com/cw1997/Tieba-Posting-Frequency demo 地址: http://t.changwei.me/tongji (搭建在 openshift 速度非常卡是服务器问题不是我代码有问题,大家轻喷) 代码是过程化编写的,没有用什么面向对象啊 MVC 啊之类的,不图优雅,图个简单。
代码使用方法: 上传所有文件到服务器上,添加 do_num.php 和 do_tongji.php 为监控项或者 cron 计划任务,每小时执行一次。导入 tongji.sql 到数据库中并且修改 conn.php 中的各项配置即可。
touxiang.php ——获取贴吧头像(服务端脚本获取可绕过贴吧的 Referer 检测,此脚本有被 DDOS 攻击的风险,如有需要可修改文件名以及在 do_xxx.php 文件中对应的 require 语句)
index.php ——首页展示
timer.class.php ——统计脚本执行时间类文件
do_num.php ——定时 fetch 发帖量数据并且存入数据库进行统计
do_tongji.php ——定时 fetch 帖子内容并且调用中文分词 API 进行分词并且存入数据库进行统计
中文分词部分调用的是 SCWS 的中文分词接口,特此感谢。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.