V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
1722332572
V2EX  ›  Python

DrQA 基于维基百科数据的开放域问答机器人实战教程 [人工智障的阅读理解水平有点惊人了,可以精准的回答类似斯坦福大学的位置这样的问题]

  •  
  •   1722332572 · 2018-07-20 20:02:19 +08:00 · 1866 次点击
    这是一个创建于 2351 天前的主题,其中的信息可能已经有所发展或是发生改变。

    DrQA 基于维基百科数据的开放域问答机器人实战教程

    DrQA 是一个基于维基百科数据的开放域问答系统,它由检索器和阅读器组成。其中检索器用于从海量的文本(例如维基百科)中获得相关的文章;阅读器用于从文章中获得相应的答案。

    官方介绍: DrQA 是一个应用于开放域问答的阅读理解系统。特别是,DrQA 的目标是“大规模机读”( MRS )。在这个设定中,我们在可能非常大的非结构化文档集中搜索问题的答案。因此,系统必须将文档检索(查找相关文档)的挑战与机器对文本的理解(从这些文档中识别答案)的挑战相结合。

    我们使用 DrQA 的实验侧重于回答 factoid 问题,同时使用 Wikipedia 作为文档的独特知识源。维基百科是一个非常适合大规模,丰富,详细信息的来源。为了回答任何问题,必须首先在超过 500 万个文章中检索可能相关的文章,然后仔细扫描它们以确定答案。

    请注意,DrQA 将 Wikipedia 视为一个通用的文章集合,并不依赖于其内部知识结构。因此,DrQA 可以直接应用于任何文档集合。

    数据集:维基百科

    框架:PyTorch

    版本:PyTorch torch-0.3.0

    论文:Reading Wikipedia to Answer Open-Domain Questions

    项目: https://github.com/facebookresearch/DrQA

    系统架构:

    实战: 交互模式下提问:

    where is stanford university

    可以看到检索到的文档是 Stanford University,问题的答案是:浅绿色标注的部分,答案非常的精准。

    交互模式下提问:

    where is Barack Hussein Obama from

    交互模式下提问: 回答不是很精准,我其实想问的是奥巴马来自哪里。答案返回的是奥巴马在哪里,奥巴马在华盛顿,不过也还是相当不错。

    who is Donald Trump 这个问题并没有找到准确的答案,虽然文档是相关的。

    原文链接: http://tf86.com/2018/07/20/reading-wikipedia-to-answer-open-domain-questions/

    1 条回复    2018-07-21 09:50:04 +08:00
    TimePPT
        1
    TimePPT  
       2018-07-21 09:50:04 +08:00 via iPhone
    这个开源有一阵子了。OpenDomainQA 这块其实很复杂。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3903 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 05:12 · PVG 13:12 · LAX 21:12 · JFK 00:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.