首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
›
问与答
信息抽取?如何在相似(格式不同,但结构相似)文档中抽取想要的数据?
lcqtdwj
·
2015 年 7 月 30 日
· 1983 次点击
这是一个创建于 3820 天前的主题,其中的信息可能已经有所发展或是发生改变。
其实我不知道这个问题到底属于哪个领域。我有很多相似的文档,页面,比如简历。格式各不相同,但是简历大体逻辑组成是一样的,都有姓名,联系方式,工作经历等。如何能自动化抽出需要的信息?业界有成熟的技术吗?如果没有学术界属于哪方面问题?
格式
简历
相似
1 条回复
•
2015-07-30 10:02:46 +08:00
1
xunyu
2015 年 7 月 30 日
information extraction,google它
关于
·
帮助文档
·
自助推广系统
·
博客
·
API
·
FAQ
·
Solana
·
5329 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 22ms ·
UTC 07:05
·
PVG 15:05
·
LAX 23:05
·
JFK 02:05
♥ Do have faith in what you're doing.
❯