我对信息流应用的思考 [build in public]

11 小时 26 分钟前
 LuckyLauncher

近期 follow 在本站大火了一把,我之前是不使用任何 RSS 应用的,但是最近 follow 的火爆也让我重新认识了 RSS 。

RSS 主张让用户自己决定信息的来源,其称这个行为为 [订阅] ,其实和我们在其他信息类平台上的关注没什么两样,关注了作者每当作者发布了新动态时你都能在第一时间收到通知,那我为什么不直接对应使用对应平台呢?我对这个问题比较疑惑。

有些人说是为了反平台的推荐算法,那我不在对应平台刷信息流,只看我关注的创作者发布的内容不是能达到一样的效果?还有这真的能达到反推荐算法的效果吗?创作者在对应平台发布内容时为了流量本来就会在创作上迎合对应平台的推荐算法,换个软件就能达到反推荐算法的作用了吗?我其实是存怀疑态度的。

还有些人单纯的把 RSS 当做一个信息聚合器使用,利用爬虫手段爬取不同平台的数据在一个软件上使用。这确实能提高信息获取的效率,但是非常规手段带来了法律和稳定性的风险。平台可能频繁变更反爬手段,对应的爬虫技术也需要人维护,这折腾下来所花的时间真的能提升多少效率呢?

回到最初的 RSS 上来,RSS 主张数据开放,RSS 是由网站即数据的拥有者主动开放的。但是现在的互联网尤其是国内的互联网更加强调封闭,尤其是近几年 AI 的兴起也让全世界的数据拥有者开始保护自己的数据。我无法评论对错,但不可否认的是 RSS 市场在进一步缩小,可能到最后仅剩一些个人创作者。

一些思考:

  1. 我们真的不需要推荐算法吗?如果是仅掌握在你自己手中的、能根据你的偏好和最近关注信息给你推荐一些资讯的算法 [基于端侧 LLM 的推荐算法] 呢?
  2. 如果使用 RPA + AI 自动提取 + 少量人工用来过人机校验实现的信息聚合器你会用吗?(优点是适合大多数网站,可以使用自己账号,甚至关注付费内容,缺点是需要人工干预,稳定性待验证)

题外话:其实之前刚好有在做 AI 辅助信息输入的工具,再研究了一段时间的 follow 让我停下了对这个产品的开发,反思了一些问题。

使用 AI 从文章中摘抄处我可能喜欢的一句话从而引起我阅读的兴趣

仿 follow 实现了文章阅读器

507 次点击
所在节点    分享创造
8 条回复
devdes
10 小时 34 分钟前
信息过载的背景下推荐算法是有效的过滤手段,但无算法推荐的信息流也有存在的价值。推荐算法提升了效率但削弱了多样性。最近自己在做一个文字社区 www.essay.ink ,也在思考这方面的问题。[ v 站前几天也有讨论: https://v2ex.com/t/1081778 ]

只有平台本身不具有引导性,不用数据去量化读者对内容的喜好,创作者就不会去迎合读者,从而让创作本身有意义而不是通过创作去寻求认同感。
saveai
3 小时 11 分钟前
好!先要一个邀请码(/滑稽)
valuex
2 小时 23 分钟前
信息的供给和消费是不平衡的。供给端有 AI 算法推荐,有圈地为王。消费端有啥?信息聚合也只是解决初阶问题--打通渠道实现信息归拢,AI 提炼关键信息也只实现了信息碎片高效阅读,还有一大步需要做,就是基于用户已有知识的信息聚类,再提取,再推荐。
说具体点,比如 follow 等软件每天提供 1 万条信息,应该是把 10000 万条里相似信息做了去重,然后基于用户定义的关键词等做好分类,自动提取关键信息,最终推给用户,同时,在用户授权前提下,持续从帮助用户完善自身知识图谱的角度,推送新信息。
EchoWhale
1 小时 53 分钟前
我个人是不需要推荐算法的,各种平台我都是关闭个性化推荐。大部分信息都是主动获取

或许我会因此漏过感兴趣的内容?我想没关系吧,相关联的内容不一定通过算法推送,通过文章/评论或早或晚都能找到七七八八。
LuckyLauncher
1 小时 51 分钟前
@devdes
“推荐算法提升了效率但削弱了多样性”
那 RSS 只关注自己订阅的创作者的产出是不是既反推荐算法又反多样性?

“不用数据去量化读者对内容的喜好,创作者就不会去迎合读者,从而让创作本身有意义而不是通过创作去寻求认同感”
这是一个很理想的状态,让创作回归本身的意义是很好的想法,但弱点也很明显,创作者没有激励制度去激励自己去创作,创作的数量和质量都有很高的不确定性,感觉比较难实现
LuckyLauncher
1 小时 50 分钟前
@saveai #2 那不是所有的产品都玩饥饿营销
LuckyLauncher
1 小时 47 分钟前
@valuex #3 "信息的供给和消费是不平衡的"这点非常同意,但是初级阶段的问题就已经是很大的问题了,现在各个平台都不开放自己的数据,就很难实现信息归拢。所以后面基于这些信息再处理基本上是不可能的,国外的风气稍微好点,但我觉得随着 AI 爬虫越来越猖獗各家都会对自己的数据进行保护。
LuckyLauncher
1 小时 46 分钟前
@EchoWhale “通过文章/评论或早或晚都能找到七七八八” 这又何尝不是另一种推荐算法?所以我在文中说想真正反推荐算法在目前状态下很难实现

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1082704

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX