爬了小黄鸡50万聊天话记录,除了分词、索引、关键词数据库匹配,还有其他方法做智能对话吗?

2013-02-05 12:25:04 +08:00
 xiaojay
7447 次点击
所在节点    问与答
25 条回复
leofml
2013-02-05 12:59:32 +08:00
请问能否借你这个数据库搜一个关键词?
wzxjohn
2013-02-05 13:02:54 +08:00
这么大的库?放出来看看撒~
xiaojay
2013-02-05 13:22:12 +08:00
@leofml
@wzxjohn

http://sim.robot-ja.com/query/?query=你的对话

刚做好,没有限制措施,不要太暴力哦 :)
yi719
2013-02-05 14:37:12 +08:00
@xiaojay 看到Django的报错界面了
wzxjohn
2013-02-05 18:10:04 +08:00
@xiaojay 已经挂到我的微信小黄鸡上了~看看效果撒~~~
xiaojay
2013-02-05 20:05:11 +08:00
@yi719 是django,测试中
@wzxjohn 这个是测试版本,过几天可能关掉的...
你真的要用和我联系 xiaojay@gmail.com :)
wzxjohn
2013-02-05 20:16:44 +08:00
@xiaojay 好啊~~~
icevil
2013-02-05 22:55:08 +08:00
很好奇怎么爬的。
welsmann
2013-02-06 11:36:23 +08:00
@xiaojay
随便输了个,出错了貌似...
ericFork
2013-02-06 11:39:08 +08:00
很好奇是怎么爬出来的,还满有趣的~
yoo
2013-02-06 12:46:15 +08:00
这个好强,同求是怎么爬的!
xiaojay
2013-02-06 12:49:18 +08:00
@welsmann bug已经修复,感谢 :)

为什么木有人讨论标题的问题,囧
google了下,发现这个
http://stackoverflow.com/questions/9706769/any-tutorials-for-developing-chatbots

不过用aiml or chatscript 自己建,,貌似工程浩大 ...
joby
2013-02-06 12:55:51 +08:00
什么是小黄鸡?
wong2
2013-02-06 13:09:10 +08:00
我用sphinx搭过。。你是爬的simsimi还是人人上的小黄鸡?
xiaojay
2013-02-06 13:14:25 +08:00
@wong2 哈哈,作者出来了。 人人...
sphinx 是指 cmu的的语言识别系统 http://cmusphinx.sourceforge.net/
还是 搜索索引系统 http://cmusphinx.sourceforge.net/
wong2
2013-02-06 13:16:59 +08:00
joby
2013-02-06 13:36:16 +08:00
我邪恶了:
http://sim.robot-ja.com/query/?query=舔
http://sim.robot-ja.com/query/?query=哪个酒店

我还想对话复制进去,就可以还原原始对话出来。看来我想太多了
xiaojay
2013-02-08 19:22:56 +08:00
@joby 囧 小黄鸡果然有点黄...看来要过滤下

ps: 如果做成免费api,不知道有木有人有兴趣用的?
cherrot
2013-02-13 10:56:10 +08:00
如果做成免费api,你的服务器肯定会爆掉…… 低价倒是个好主意哦~ 肯定很多人用
KiseXu
2013-02-13 11:40:57 +08:00
@wong2 你就是大鹏吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/59838

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX