[开源] 让 ChatGPT 帮我们总结 Hacker News

2023-06-07 12:20:51 +08:00
 polythene

背景

Hacker News 是了解科技圈资讯的一个高质量数据源,但首页 30 条新闻读起来还是挺费劲的。所以我用 ChatGPT 替我们阅读新闻,直接生成摘要:

服务地址

3352 次点击
所在节点    分享创造
27 条回复
imhx233
2023-06-07 12:41:42 +08:00
看起来很棒,但是 $0.41/d 的成本也是不小;加到自己的 RSS 里面去了!
polythene
2023-06-07 12:54:45 +08:00
@imhx233 是的,所以页面里嵌了两条广告,希望能回点血
vsitebon
2023-06-07 12:59:55 +08:00
有没有办法加上 HN 的讨论链接?
polythene
2023-06-07 13:03:02 +08:00
@vsitebon 标题下的 💬 图标,可以直接链到 comments 页面,看来得标注下
vsitebon
2023-06-07 13:04:18 +08:00
@polythene #4 原来那个是可以点的。。感谢这个网站,好用
jasonslyvia
2023-06-07 13:12:27 +08:00
赞,楼主跟我想一块去了,我其实还想过用 GPT 去分析每一个链接的评论区(毕竟 HN 里的评论才是真的宝藏),看看大家的主流观点是哪些,整体是 positive 还是 negative 等等……可惜行动力太弱,而且 token 消耗可能远超解析正文的费用
codyfeng
2023-06-07 13:31:49 +08:00
看起来不错,收藏了👍
polythene
2023-06-07 13:40:32 +08:00
@jasonslyvia 确实,主要评论区的内容无法收敛,token 消耗吃不消。不过等这个赛道越来越卷,以后应该会降价的。
jasonslyvia
2023-06-07 13:43:53 +08:00
@polythene #8 HN 似乎是有 API 的?评论都有独立 ID ,应该还是可以收敛的,定一个更新时效性就够了……(例如只爬链接更新 48 小时内的评论,每 30 分钟一次),这样还能看到舆论的变化情况
sleeepyy
2023-06-07 14:07:10 +08:00
赞,建议顺便提供中文的 summary
polythene
2023-06-07 16:16:56 +08:00
@sleeepyy 好主意,可以搞个多语言版,应该在 prompt 里面加个步骤就行了
Latin
2023-06-07 17:29:48 +08:00
@polythene 附议
mingoing428
2023-06-07 18:46:18 +08:00
建议输出 rss
polythene
2023-06-07 18:59:41 +08:00
@mingoing428 建议已实现,直接把网址贴到 rss 阅读器中就行了,一楼的老哥上来就用上了
zmx976508106
2023-06-08 10:06:02 +08:00
好用
liuhuan475
2023-06-08 10:23:21 +08:00
墙裂建议搞一下国际化~~~
MstMoonshine
2023-06-08 10:23:41 +08:00
我也在开发一模一样的东西!但是号被 OpenAI 封了……
MstMoonshine
2023-06-08 10:27:47 +08:00
@polythene 我的实现里是把所有 first level comments 用爬虫合并起来,一次性发过去,prompt 是"The following is a list of comments from Hacker News. Categorize the comments and summarize the main point of each category. Less than 50 words for each category. List the categories as bullet points in markdown format."

测试发现分类效果很不错,不过输出格式不统一,需要进一步提升 prompt ,暂时不支持 comment of comment 。
其实也不用很担心 token 数量,因为你只需要最 top 的(比如十个二十个) comments 就够了。
polythene
2023-06-08 10:49:22 +08:00
@liuhuan475 能否细说下哪方面可以更国际化一点?还是你想表达的是希望做本地化?
polythene
2023-06-08 10:53:28 +08:00
@MstMoonshine 这个不错,有很多评论质量很高,但整体的评论数量太多了,读完很费劲。等你弄完了,我们可以互链合作下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/946581

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX