日常书荒,今天产生了一个想法是是否可以利用训练对网络上繁杂的小说进行筛选。
比如我可以人工总结一些自己比较喜欢的小说,比如有 20 本,A B C D E F G...如果作为语料库的话也有个几百上千万字,应该不算少了。然后搞一个系统,训练,以后再看到新的小说推荐的话先跑个分(例如衡量新小说跟喜欢的语料库的相似度),相似度分太低就不看了?
对 nlp 基本上是完全不了解,不知道能不能实现,用什么技术比较合适。我感觉从逻辑上讲,要训练网络去找一本小说的情节是否跌宕起伏、引人入胜,应该是比较困难的工作。但是如果要判断一本小说的文笔是否过于小白,感觉应该还是能做到?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.