开源一个我自己写的百度贴吧云监控平台源代码(用到了中文分词以及贴吧 api 调用)

2016-05-15 12:48:15 +08:00
 changwei

百度贴吧云监控(功能:百度贴吧发帖频率统计以及贴吧帖子热门关键词统计) 仓库地址 https://github.com/cw1997/Tieba-Posting-Frequency demo 地址: http://t.changwei.me/tongji (搭建在 openshift 速度非常卡是服务器问题不是我代码有问题,大家轻喷) 代码是过程化编写的,没有用什么面向对象啊 MVC 啊之类的,不图优雅,图个简单。

代码使用方法: 上传所有文件到服务器上,添加 do_num.php 和 do_tongji.php 为监控项或者 cron 计划任务,每小时执行一次。导入 tongji.sql 到数据库中并且修改 conn.php 中的各项配置即可。

touxiang.php ——获取贴吧头像(服务端脚本获取可绕过贴吧的 Referer 检测,此脚本有被 DDOS 攻击的风险,如有需要可修改文件名以及在 do_xxx.php 文件中对应的 require 语句)
index.php ——首页展示
timer.class.php ——统计脚本执行时间类文件
do_num.php ——定时 fetch 发帖量数据并且存入数据库进行统计
do_tongji.php ——定时 fetch 帖子内容并且调用中文分词 API 进行分词并且存入数据库进行统计

中文分词部分调用的是 SCWS 的中文分词接口,特此感谢。

4483 次点击
所在节点    分享创造
26 条回复
changwei
2016-05-16 15:19:13 +08:00
@kslr 谢谢提醒:-),这个还是很早以前写的,当时连 MVC ,框架,设计模式都没学,现在看来这代码真是烂的出奇,哈哈~
changwei
2016-05-16 15:19:35 +08:00
@willhunger 我不知道他在 V2EX 里面的 id 是什么啊
changwei
2016-05-16 15:20:29 +08:00
@crab 之前我网站获取发帖人 IP 那个接口前几天百度刚刚给修复了
changwei
2016-05-16 15:20:57 +08:00
@bdbai 哈哈,我也是纯属当练练手的
crab
2016-05-16 15:52:55 +08:00
@changwei 是通过手机 app 那边接口吗。
changwei
2016-05-17 09:38:59 +08:00
@crab 不是,反正接口都已经没用了。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/278742

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX