求一个小软件,付费

2022-10-14 12:03:59 +08:00
 chenjane59

各位好,我是一个圈儿外人,现在发帖求一个小软件。内容如下,付费 100 元。

知乎是我常用的软件,痴迷不已,但最近打算戒了。 在完全离开前,不舍得自己辛辛苦苦收藏的若干文章,想把它们全打包下载。即,把知乎上的个人收藏夹的内容导出。 但自己不是程序员,写不出爬虫代码;搜索一番,也找不到合适的工具。耗费大量时间精力,解决不了。 因而来这里求助,寻找一个“能把知乎收藏夹导出”的小工具。

工具要求:1 、收藏夹里的文章,应导尽导、全部导出。它们全是精心收集的,数量上不能缺少。(核心) 2 、我有 kindle ,导出的文章日后会存在 kindle 慢慢看。希望导出的文章,版式清晰,方便 kindle 阅读。 3 、如果文章中有图片,须支持连图片一起导出。图片质量不做过高要求,尽量为高清的,原图更好。

本人承诺:该下载工具仅用于我个人的学习,不经作者同意,不会乱发共享给他人,更不会用于商业牟利。这点请放心。

1831 次点击
所在节点    二手交易
28 条回复
chenjane59
2022-10-15 17:54:32 +08:00
@catsoul 你也误会了! 或者说你把人想得太黑暗了。 我刚刚数了一下,留联系方式的,连同你在内,只有三个人。而且都是差不多前后脚留的。可能你刚留完联系方式,他们俩还没刷新网页,没看到你已经留过了,就也顺手码字留了信息,点了发送....... 网站服务器接收信息是有短暂时间差的。真的,就这么个小活儿,没人抢的! 谁会抢啊? 多说一句,我联系上的那个童鞋“q1angch0u ”,人家刚开始答应帮我导文件,人家上来就说“这是个小活儿,不收钱”。可见人家也没想着一定要抢着挣这 100 元。还是我最后坚持要给他钱。 互联网上的很多人是很有分享和互助精神的。都是月薪过万的人,再说这又不是什么几百上千万的大项目...... 就算现实职场中有各种卷和斗,但真的不至于为这点蝇头小利就截胡。 @catsoul 这位先生,哈哈,现实中,你是不是在处在一个竞争很激烈、压力很大的环境中?所以不经意间把这种思维也带进来了? 我没有讽刺或看不起的意思,但也许你要关注一下自己思维中“厚黑”的这一面。不能不防备小人,也不能把所有人都想成坏人。黑不厚是傻子,黑太后也会影响人际。
wpaygp
2022-10-15 18:35:58 +08:00
赞 op ,非常有礼貌!
catsoul
2022-10-15 21:47:46 +08:00
@chenjane59 恰恰相反,我的工作和生活环境都很轻松,所以我才不理解这么小个活儿也有人抢着做
catsoul
2022-10-15 21:57:05 +08:00
@chenjane59 再跟你解释一下为什么总共只有三个人留言,就如我上面回复提到的,这种程度的小活儿,属于没难度做着玩儿打发时间的,又不是什么几千上万起谈的项目,一般看到有人留联系方式了,就不会再留自己的了。你如果还是觉得我活得压力大心思厚黑,那就是你对
chenjane59
2022-10-15 23:54:40 +08:00
@catsoul 算了,每个人都有自己的经历,人都是根据自己的经历经验来看待和评判事务的。但以后请不要武断妄评。也要注意语气方式。能看得出来,你其实是个好人。也仍然感激你关注这个帖子。祝好,88 !
chenjane59
2023-02-02 11:41:50 +08:00
@catsoul 什么是绿色联系方式? 这个号码是你的微信还是抖音?还是什么?
chenjane59
2023-02-02 11:46:09 +08:00
@catsoul 这个号码是微信号吗?搜索了,搜不到,加不上。(摊手)
chenjane59
2023-03-06 16:22:41 +08:00
来自 OP 主的最新消息:我的收藏夹下载问题,解决了! 是辗转联系到楼上那个留“绿色联系”方式的高手,请他帮忙下载的。其实他人品还是不错的。他应该是写了一些爬虫代码,“爬”下来的。

过程也一波三折。因为不能连续下载,怕知乎平台监测到、封号。(知乎账号要是被封了,就什么也拿不到了)所以这中间他费了不少心力,间隔、阶段性地下载。最后数据都拿到了。我因为不懂技术,原本以为一二百就能搞定。但发现整个过程竟然耗费了这么多时间精力,所以经过我们双方的沟通,付了 600 元(按时薪 100 )给他。虽然超出预算,但顺利实现目的了,还是感觉很开心。谢谢他,也谢谢关注帖子的各位。

下载过程中发生了两件值得注意的事。
一是知乎收藏夹“显示”的收藏数量,与“实际”下载的数量不匹配。例如,我的某个“待看-1”收藏夹,知乎 APP 上显示收藏了 2023 条数据。但实际下载,只下载了 2008 条。用的程序代码应该没问题,但为什么会出现数量偏差呢?原因可能是知乎本身的分页算法有问题——例如,原本应该每页有 20 条数据,但知乎实际上每页只有 19 条甚至更少。不是固定某几页少数据,而是比较随机地少。还有,某些回答,我收藏了,但原作者已经删去回答,不好下载了,但知乎不会从我的收藏夹里再减去 1 ,它不会追随数量变化、及时更新。上面两个原因,可能导致实际拉取的数据条数与知乎计算的条数不太匹配。
二是数据都下载后,我打算放在 kindle 上看。要想有好的阅读体验,需要把数据转为 mobi 或 azw3 。但 kindle 是不支持 epub 的。恰恰我们拿到的数据,是 epub 型的。所以需要多一步转换。最后就是转换成 azw3 了,阅读体验很棒!

以上就是本帖子的完整进展。互联网的精神是分享。我把经历中有价值的点说出来,供人参考。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/886888

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX