V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
nonesuccess
V2EX  ›  程序员

如何开发一个特定领域的自动问答机器人(Chat Bot)?

  •  
  •   nonesuccess · 2017-09-01 18:12:32 +08:00 · 3250 次点击
    这是一个创建于 2635 天前的主题,其中的信息可能已经有所发展或是发生改变。

    想做个练手项目,顺便跟现在的业务方向结合一下。

    比如想做一个教学类的自动问答 AI,可以代替老师做 80%的日常答疑。在一定的基础算法基础上,每位用户可以设定自己的问题集。

    会编程,AI 零基础,想问一下这个任务应该怎样分解,需要哪些方面的知识才能做出来

    7 条回复    2017-09-02 14:07:26 +08:00
    jisibencom
        1
    jisibencom  
       2017-09-01 22:07:31 +08:00 via Android
    采集知乎,知道等问答呗,做自己的库
    silenc1
        2
    silenc1  
       2017-09-01 22:20:22 +08:00
    可以找一下知识图谱相关的东西
    Morriaty
        3
    Morriaty  
       2017-09-01 22:59:43 +08:00
    这东西是世界难题,哪有练手那么简单......

    从中文 NLP 最基础的分词开始,就够你吃一壶了,还有词性标注、实体命名识别、句法依存,每前进一步都很困难。

    单纯想熟悉一下,gayhub 上搜索`chatbot deep learning`,一堆,弄个测试,大概一下午就好了。当然,你训练的对话结果如果不是“你好”、“你好”、“你好”,算我输......
    Phant0m
        4
    Phant0m  
       2017-09-01 23:34:52 +08:00
    @Morriaty 哈哈 中文 NLP 可以用哈工大的 ltp 或斯坦福的 CoreNLP。至于问答形的 训练 word2vec 模型进行近义词匹配试试
    bravecarrot
        5
    bravecarrot  
       2017-09-01 23:56:08 +08:00 via iPhone
    你想啥呢
    现在各级别的会议都在研究这玩意,问答效果,只要取决于你这个 domain 的大小,以及数据集的大小。
    最近看的 paper,用神经网络做的,有两个模型:一个订餐厅,而且要提前设定好对话的状态,就是让 human 说出价格,地点,菜系..等等,才能完成;另一个,根据你的描述,从数据库一张表中找到一个 item。
    开放型的被机器人 很难。
    不过,你想练手可以:
    1. 存储一些问题以及答案,然后问一个问题,计算这个问题和已有问题的相似度
    2. rule based
    Yinz
        6
    Yinz  
       2017-09-02 14:03:57 +08:00
    前段时间编程之美比赛用了一下微软家的 bot framework,配上微软自家的 LUIS 服务和 Q&AMaker 感觉能够符合你的需求,基本不需要 AI 知识就能用。

    而且微软自家有对这一系列应用的教程,https://mva.microsoft.com/zh-cn/training-courses/bots-16759?l=yLCQoDIyC_3604668937
    Yinz
        7
    Yinz  
       2017-09-02 14:07:26 +08:00
    机器人后端可以使用 nodejs 或者 C#,然后回答逻辑你可以选择直接交给 LUIS 或者 Q&AMaker,也可以硬编码在后端里面;对接现有的聊天工具的话对于国内的 QQ 或者微信不太方便,但是可以直接放出个网页版的,直接能够使用,自己有编程基础的也可以自己折腾下连接微信。具体教程看视频就好,文档不是很全,但是足够你的需求了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1033 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 19:47 · PVG 03:47 · LAX 11:47 · JFK 14:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.