一个英语单词词频统计的问题,请帮忙看下

2018-08-06 18:44:16 +08:00
 Devin36
我不会编程,但是最近在准备考试,想要统计下这个词频,遇到的问题是:单词的原形和单词的变形怎么统一统计成单词原形,有个哥们在知乎上写了代码,但不懂,运行起来出了问题,代码链接在这里,https://github.com/Enaunimes/freeq,知乎原问题链接在这里,https://www.zhihu.com/question/20632675/answer/100615805,有哪位哥哥帮我看下啊,谢谢了。
1940 次点击
所在节点    Python
2 条回复
mimzy
2018-08-06 18:54:59 +08:00
我猜你可以用 NLTK https://www.nltk.org/ 做词形还原,一个简单的例子: https://pythonprogramming.net/lemmatizing-nltk-tutorial/
Devin36
2018-08-07 19:24:08 +08:00
@mimzy 谢谢~,你们英语真好。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/477378

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX