求能从文中提取公司/单位名称,电话,日期,金额工具

2020-03-07 19:52:12 +08:00
 herozzm

谢谢,回复必感谢

1225 次点击
所在节点    问与答
9 条回复
Whsiqi
2020-03-07 20:04:06 +08:00
回复必感谢是个坏习惯,后边的人分不清哪里是重点
herozzm
2020-03-07 20:32:43 +08:00
@Whsiqi 那么重点回复呢?
Raynard
2020-03-07 20:36:19 +08:00
没有这么符合精准要求的,python 自己写
Whsiqi
2020-03-07 20:43:16 +08:00
@Whsiqi 感谢是给有意义的回复表达感谢的,所以有用肯定要感谢
herozzm
2020-03-07 20:56:53 +08:00
@Raynard 需要用到机器学习吗?通过传统的正则,词库要提取的文本指数太复杂了,感觉没法完成
Raynard
2020-03-07 21:05:42 +08:00
@herozzm 一点也不复杂。。

或者你先发段文本看看,让论坛老哥帮你写,

估计 2000 起吧
herozzm
2020-03-07 21:10:57 +08:00
@Raynard 文中公司可能是 xxx 有限公司,也能使 xx 厅,xx 局,还有简写啥的,文章中中可能会提到多个公司名称,但是要选出一个真正的目标公司名称(有一定的逻辑,但是程序无法判断,需要人工甄别),比如:我开车路过 xx 单位,遇到一个在 xxx 公司上班的朋友聊了一会,顺便去 xxx 中心办了一趟事情,最后来到了我的公司 xxxx 公司,我的公司 xxxx 才是真正的目标公司
lingalonely
2020-03-07 23:08:50 +08:00
知识点:NLP 识别命名实体,应该有相应的工具和 API 可以用
herozzm
2020-03-07 23:59:47 +08:00
@lingalonely 谢谢 大牛 找了一圈找到这家 BosonNLP,但是他们各种文档,唯独没有注册,干瞪眼

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/650763

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX