今日头条与头条号初期的内容是怎么来的?

2021-05-13 08:17:51 +08:00
 leogoforit

只是爬取门户网站于公众号吗? 请问下 v 友们有知道的比较详细的吗?或者有相关的文章与图书推荐的吗?谢谢

4140 次点击
所在节点    互联网
14 条回复
happinessnch
2021-05-13 08:23:36 +08:00
找实习生来爬虫+洗稿吧, 盲猜的,这种是成本最小的,
主打算法千人前面,内容保持不慢于行业太多,慢慢用户多了,再考虑自创内容。
Rocketer
2021-05-13 08:27:12 +08:00
根本不洗稿,人家都注明出处的,只是没有授权,不让爬硬爬而已。
实习生确实有很多,但不是洗稿用的,而是给文章打 tag 的,否则怎么按兴趣推荐?
reiji
2021-05-13 08:28:10 +08:00
http://www.chinanews.com/cj/2014/06-06/6250065.shtml
随便一搜就有,当时闹得还挺大的,搞得我有几年一直以为这个项目已经没了
EIJAM
2021-05-13 08:39:45 +08:00
不要脸硬爬。反正就算打官司也要过好几年了,先抢到流量就行。
murmur
2021-05-13 08:44:01 +08:00
洗稿啊,多简单,搜今日头条 抄袭 要多少有多少
xingshu1990
2021-05-13 08:48:45 +08:00
简单:知网、万方上的 PDF 或者本身自己格式的内容,全部下载过来,购买泰比( ABBYY )训练 OCR 中文词库,然后 OCR 出来的内容,进行人工校对,混编。
或者就是开着某车头采集过来,进行软件,或者人工混编。
yitingbai
2021-05-13 08:59:28 +08:00
我是今日头条最早最早的用户, 那时候用的人都不多, 反馈问题客服马上就回复了, 可以肯定的说, 所有文章都是爬来的, 后来用户多了才开始做自己的内容, 扶持创作者
konnnnn
2021-05-13 09:10:15 +08:00
今日偷条,贴吧帖子都偷不少
lostSoul
2021-05-13 09:30:18 +08:00
你们想得太夸张了,, 这种行业很多 很多都是人工操作 可以去搜搜网站编辑岗位 基本都是这种 每天公司会给他们一个标签或者标题,然后叫他们去各种网站 copy 拼接,老缝合怪了 内容看起来多就好 不需要流畅
bullfrog
2021-05-13 09:58:38 +08:00
这类问题还有抖音的初创内容是怎么开的
aogu555
2021-05-13 09:59:34 +08:00
都是人编的,头条早期烧钱很厉害,头条发新闻几乎没有审核,1w 阅读大概 10 元左右,还在上学的我靠一个科技类账号每月赚几千生活费,那时候历史类和生活类是最赚钱的,那时候各种新闻类 app 疯狂烧钱,头条号,大鱼号,搜狐号,企鹅号,人人都能发新闻,现在假新闻泛滥字节跳动功不可没。https://www.sohu.com/a/62620237_118786
qwer666df
2021-05-13 11:41:39 +08:00
@bullfrog #10 一开始拍一条抖音直接到账 5~50 元不等
dawangyezi
2021-05-13 11:49:19 +08:00
爬来的
gxt92
2021-05-13 13:24:56 +08:00
冷启动吧,内容爬虫、寻找种子用户、核心创作者、创建社区

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/776614

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX