我对信息流应用的思考 [build in public]

33 天前
 LuckyLauncher

近期 follow 在本站大火了一把,我之前是不使用任何 RSS 应用的,但是最近 follow 的火爆也让我重新认识了 RSS 。

RSS 主张让用户自己决定信息的来源,其称这个行为为 [订阅] ,其实和我们在其他信息类平台上的关注没什么两样,关注了作者每当作者发布了新动态时你都能在第一时间收到通知,那我为什么不直接对应使用对应平台呢?我对这个问题比较疑惑。

有些人说是为了反平台的推荐算法,那我不在对应平台刷信息流,只看我关注的创作者发布的内容不是能达到一样的效果?还有这真的能达到反推荐算法的效果吗?创作者在对应平台发布内容时为了流量本来就会在创作上迎合对应平台的推荐算法,换个软件就能达到反推荐算法的作用了吗?我其实是存怀疑态度的。

还有些人单纯的把 RSS 当做一个信息聚合器使用,利用爬虫手段爬取不同平台的数据在一个软件上使用。这确实能提高信息获取的效率,但是非常规手段带来了法律和稳定性的风险。平台可能频繁变更反爬手段,对应的爬虫技术也需要人维护,这折腾下来所花的时间真的能提升多少效率呢?

回到最初的 RSS 上来,RSS 主张数据开放,RSS 是由网站即数据的拥有者主动开放的。但是现在的互联网尤其是国内的互联网更加强调封闭,尤其是近几年 AI 的兴起也让全世界的数据拥有者开始保护自己的数据。我无法评论对错,但不可否认的是 RSS 市场在进一步缩小,可能到最后仅剩一些个人创作者。

一些思考:

  1. 我们真的不需要推荐算法吗?如果是仅掌握在你自己手中的、能根据你的偏好和最近关注信息给你推荐一些资讯的算法 [基于端侧 LLM 的推荐算法] 呢?
  2. 如果使用 RPA + AI 自动提取 + 少量人工用来过人机校验实现的信息聚合器你会用吗?(优点是适合大多数网站,可以使用自己账号,甚至关注付费内容,缺点是需要人工干预,稳定性待验证)

题外话:其实之前刚好有在做 AI 辅助信息输入的工具,再研究了一段时间的 follow 让我停下了对这个产品的开发,反思了一些问题。

使用 AI 从文章中摘抄处我可能喜欢的一句话从而引起我阅读的兴趣

仿 follow 实现了文章阅读器

1863 次点击
所在节点    分享创造
21 条回复
devdes
33 天前
信息过载的背景下推荐算法是有效的过滤手段,但无算法推荐的信息流也有存在的价值。推荐算法提升了效率但削弱了多样性。最近自己在做一个文字社区 www.essay.ink ,也在思考这方面的问题。[ v 站前几天也有讨论: https://v2ex.com/t/1081778 ]

只有平台本身不具有引导性,不用数据去量化读者对内容的喜好,创作者就不会去迎合读者,从而让创作本身有意义而不是通过创作去寻求认同感。
saveai
32 天前
好!先要一个邀请码(/滑稽)
valuex
32 天前
信息的供给和消费是不平衡的。供给端有 AI 算法推荐,有圈地为王。消费端有啥?信息聚合也只是解决初阶问题--打通渠道实现信息归拢,AI 提炼关键信息也只实现了信息碎片高效阅读,还有一大步需要做,就是基于用户已有知识的信息聚类,再提取,再推荐。
说具体点,比如 follow 等软件每天提供 1 万条信息,应该是把 10000 万条里相似信息做了去重,然后基于用户定义的关键词等做好分类,自动提取关键信息,最终推给用户,同时,在用户授权前提下,持续从帮助用户完善自身知识图谱的角度,推送新信息。
EchoWhale
32 天前
我个人是不需要推荐算法的,各种平台我都是关闭个性化推荐。大部分信息都是主动获取

或许我会因此漏过感兴趣的内容?我想没关系吧,相关联的内容不一定通过算法推送,通过文章/评论或早或晚都能找到七七八八。
LuckyLauncher
32 天前
@devdes
“推荐算法提升了效率但削弱了多样性”
那 RSS 只关注自己订阅的创作者的产出是不是既反推荐算法又反多样性?

“不用数据去量化读者对内容的喜好,创作者就不会去迎合读者,从而让创作本身有意义而不是通过创作去寻求认同感”
这是一个很理想的状态,让创作回归本身的意义是很好的想法,但弱点也很明显,创作者没有激励制度去激励自己去创作,创作的数量和质量都有很高的不确定性,感觉比较难实现
LuckyLauncher
32 天前
@saveai #2 那不是所有的产品都玩饥饿营销
LuckyLauncher
32 天前
@valuex #3 "信息的供给和消费是不平衡的"这点非常同意,但是初级阶段的问题就已经是很大的问题了,现在各个平台都不开放自己的数据,就很难实现信息归拢。所以后面基于这些信息再处理基本上是不可能的,国外的风气稍微好点,但我觉得随着 AI 爬虫越来越猖獗各家都会对自己的数据进行保护。
LuckyLauncher
32 天前
@EchoWhale “通过文章/评论或早或晚都能找到七七八八” 这又何尝不是另一种推荐算法?所以我在文中说想真正反推荐算法在目前状态下很难实现
goodryb
32 天前
看了下我订阅的内容,大部分都是个人独立的博客,可能更新频率也不是很频繁,一周打开一两次看看各个博主都更新了下。

平台推荐算法都是投其所好,看得多了反而有点疲惫,像 b 站这种,我通常也是只看自己关注的 up 更新内容,其他的时候,少刷视频,多看书
LuckyLauncher
32 天前
@goodryb #9 看书也需要有一定的推荐算法帮助你筛选吧?不然书那么多你怎么选呢?
goodryb
32 天前
@LuckyLauncher #10 推荐的不一定是算法

你自己想看的,朋友推荐的,偶尔论坛上面提到的,公司书友会活动交流的,一本书起码要看个一两周

把 APP 当成工具就好了
LuckyLauncher
32 天前
@goodryb "朋友推荐的,偶尔论坛上面提到的"基本上都可以抽象成推荐算法的一种,将其抽象成 APP 功能的话和 follow 查看他人的订阅列表有点相似。所以还是那个问题,反推荐算法基本做不到。
N0vermber11
32 天前
麻烦问一下这种截图效果是怎么实现的?
LuckyLauncher
32 天前
@N0vermber11 #13 你说的是截图带阴影的效果吗?直接用 mac 上的 xnip 软件就可以,貌似 mac 上能见到的截图工具都支持阴影配置
TotoroLee
32 天前
这是 Tauri 么?方便放 github 么?正在学习这个东西。。。
LuckyLauncher
32 天前
@TotoroLee #15 这是 electron 。Tauri 支持的功能还是太少了
TotoroLee
32 天前
@LuckyLauncher 那我直接转向 electron 吧,我才发现,上次在 FastSpring 下也有问你问题
LuckyLauncher
31 天前
@TotoroLee 是的,之前 FastSpring 是为了一个其他的应用,而这个其实是基于那个应用做的一个类似 miniAPP
shenmezhidedu
30 天前
算法容易上瘾,RSS 不会。
一个是平台迎合用户的兴趣,一个是用户主动筛选;
至于在平台上只看关注的创作者,娱乐的内容可以,像文字类的,很多程序员、独立开发者只在自己的博客网站或推特更新,做这部分用户,RSS 是最好的方式;
Follow 的用户正好是这些人,所以 RSS 非常好。
LuckyLauncher
30 天前
@shenmezhidedu #19 我的想法和你有点不同
"一个是平台迎合用户的兴趣,一个是用户主动筛选;",RSS 用户筛选的是 [创作者] 而非 [内容]
“ 至于在平台上只看关注的创作者,娱乐的内容可以,像文字类的,很多程序员、独立开发者只在自己的博客网站或推特更新”,产出质量高的程序员同时又有自己博客并且开了 RSS 的加上用户自己感兴趣这几个 buf 加起来并不会很多,你可以看看你自己关注了哪些程序员自己博客的 RSS ,至于推特,通过爬虫这种不稳定的方式取得的数据不能长久,而且你还不知道什么时候就会实现,到时候又会花时间去折腾。本来是想省时间结果在折腾上越走越远。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1082704

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX