有从短文本中提取时间信息相关的技术么

2015-02-21 15:30:09 +08:00
 moshoujingli

请问从短文本(50字以内)提取时间信息这种需求
有现成的解决方案吗?有可以参考的论文吗?这算不算是某种从A提取B的特殊情况,已经有了通用性的算法了呢?应该怎么下手搜集资料呢,,,除了硬匹配关键词,完全没有头绪。

4074 次点击
所在节点    程序员
12 条回复
Wyatts
2015-02-21 16:55:02 +08:00
有一个叫做正则表达式的神奇的东西
日期(年-月-日) (\d{4}|\d{2})-((1[0-2])|(0?[1-9]))-(([12][0-9])|(3[01])|(0?[1-9]))
日期(月/日/年) ((1[0-2])|(0?[1-9]))/(([12][0-9])|(3[01])|(0?[1-9]))/(\d{4}|\d{2})
时间(小时:分钟, 24小时制) ((1|0?)[0-9]|2[0-3]):([0-5][0-9])
xenme
2015-02-21 17:22:48 +08:00
@Wyatts 估计问的不是这种简单的。
1. 上周五怎么怎么怎么了
2. 入冬第一天
3. 上届冬奥会的时候
太多了
fatea
2015-02-21 17:25:49 +08:00
@xenme 是想要自然语言处理吧?
akfish
2015-02-21 17:32:46 +08:00
shoumu
2015-02-21 18:17:59 +08:00
主要是基于规则的
temporal expression
moshoujingli
2015-02-21 19:19:23 +08:00
@xenme 嗯,就是这个意思,提取明显指代了时间的短语…
kofj
2015-02-21 19:35:45 +08:00
NLG
kofj
2015-02-21 19:36:58 +08:00
@kofj 手滑了,NLP
arachide
2015-02-21 20:44:06 +08:00
提取时间的不知道
提取摘要的一个小孩做的summply
雅虎几千万收购了
moshoujingli
2015-02-21 20:52:06 +08:00
@akfish 感觉上就是这个!谢谢!
moshoujingli
2015-02-21 20:53:40 +08:00
@arachide 小孩…
ljdawn
2016-11-21 11:49:34 +08:00
@arachide 摘要很来就很难做呀。。。 几千万很正常。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/172052

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX