大家可能还记得我写的第 12 期-在线的文章摘要生成器,使用 NLP 生成简介
在那篇文章里我们介绍了一款通过 NLP 分析文章,自动生成摘要的一个小工具。
当时我就说这个玩意,还是很实用的,于是就上手自己撸了一个支持中文生成文章摘要的生成器。访问地址http://zhaiyao.xiezuoguan.cn/ 效果还可以,我找一篇腾讯网的新闻报道来给大家试验一下,报道为《无聊催生的一次狂欢:云蹦迪、云睡觉,虚火一场?》
经过我们的自动生成器,将内容概括如下
博主“谁家的圆三”也意外掀起了一场互联网的狂欢,带起睡觉直播的风潮,人气最旺的一晚,一共有 1850 万用 户围观他睡觉。
1 月 9 日开始,每天 5 小时,连续三天“云蹦迪”直播后,北京知名夜店 ONE THIRD 在抖音赚到了 332.36 万打赏,单日超过 100 万元,直播首日收看人数就已破百万。博主“谁家的圆三”也意外掀起了一场互联网的狂欢,带起睡觉直播的风潮,人气最旺的一晚,一共有 1850 万用户围观他睡觉。
从我个人的使用效果来看,效果并非完全令人满意,最好还是有人为介入来二次加工一下。二是现在文字阅读内容质量堪忧,自从自媒体开始兴起,每天网上产生的都是大量的文字垃圾,大部分人更是失去了对于 1000 字长文以上的阅读能力。篇篇都是几百字的小文章根本没什么好办法生成 120 字内的摘要概括啊。
另一方面流量也越来越便宜,人们的文字阅读兴趣更是被图片和短视频瓜分掉了。我自己试用这个工具时,去腾讯网上翻了很多篇新闻,结果三分之一是以图片为主,图片中有零散文字(确实排版会更精美,信息量也足够),另外三分之一都是不超过 1000 字的短篇。剩下的三分之一里面,还被视频给占据了一部分,只有极少数的文章能写到 1000 字以上用这个工具来好好概括了。
难度系数 ⭐ 我这边是用 python 写的,参考了网上的一些方案。部署时本来打算探索一下新东西用一下腾讯云的云函数和 api 网关,结果折腾了半天好麻烦啊,最终还是部署在了服务器里。 前端我不擅长,做的特别丑,能用就行吧。
上次提到的,Chrome 插件这个需求还可以做。
另外我还发现,如果以后大家倾向于视频内容,不如做一个能够支持视频自动摘要的工具。但是这个就很难了,随口一说,短期内应该还是人力才能解决的工作。