发现一个 rss 下面的 bug

2017-10-15 12:35:30 +08:00
 shoaly
一直用 feeddemon 4.5 在订阅 v2 的内容,rss 地址: https://www.v2ex.com/index.xml
时不时就会碰到乱码的情况, 如截图所示
http://oss.1024it.cn/section1/20171015/png/f94b7c434cfa4955e62fcd3cfc0a684f.png

今天仔细看了一下, 应该是 feeddemon 的 bug, 他无法正确的识别内容中 包含 😂 emoji 内容, 只要有人敲了 类似😂, rss 就无法在 feeddemon 中解析了...
由于 feeddemon 已经停止更新了, 所以 V2EX 上是否可以在输出 rss 的时候 过滤掉 emoji....
@Livid
3714 次点击
所在节点    V2EX
5 条回复
shoaly
2017-10-15 12:37:57 +08:00
附上 样本 index.xml
https://pan.baidu.com/s/1hsqy3Fu
nfroot
2017-10-15 19:01:01 +08:00
FEEDLY 有的主题地址会变成 https://www.v2ex.com 首页……·
shoaly
2017-10-16 00:26:16 +08:00
@nfroot 估计也是 emoji 造成的
shoaly
2017-10-18 11:33:23 +08:00
@Livid
交易频道 如果有 emoji 也会造成 feeddemon 乱码
https://www.v2ex.com/feed/tab/deals.xml
shoaly
2017-10-23 11:08:52 +08:00
久久没有解决, 自己写了一个脚本 过滤了, 附带上关键过滤函数:

http://oss.1024it.cn/section1/20171023/png/86b46b68083408b3a82b5535ad98aac9.png

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/397753

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX