[开源]scrapy 爬取国内各大视频网站视频信息 [欢迎新手一起交流]

2019-01-16 23:21:28 +08:00
 skyqqcc

因为想做一个 VIP 视频网站 /APP 然后不太想用第三方的资源站或者是程序。

想做一个能够爬取国内各大视频网站的视频信息的爬虫程序。

爬的信息主要是: 标题,导演,主演,简介,类型,年份,VIP/用卷 /收费 /免费,片头时间,片尾时间,图片(横 /竖),地区,评分,集数,是否完结等....

目前我已经做好了一丢丢了。。。腾讯视频可以算是好了(还有一丢丢问题,极少部分视频不能爬取)

如果觉得这个东西可能有用的话 可以点个 star 可能很久以后,会完善

如果你需要一个项目练练手。。。那么,欢迎你来和我一起完善这个项目。。。

项目地址:https://github.com/perfect-network/scrapy_for_video.git

2868 次点击
所在节点    Python
7 条回复
luckbbs
2019-01-17 07:04:08 +08:00
有点意思,star 一个。
Belmode
2019-01-17 09:52:52 +08:00
关注一波不迷路
cherrybob
2019-01-17 11:12:30 +08:00
没有验证码,IP 反爬虫限制的处理吗?
skyqqcc
2019-01-17 14:55:49 +08:00
@cherrybob 没有,我只是爬信息而已
skyqqcc
2019-01-17 14:57:51 +08:00
@cherrybob 而且可以直接去他们这个视频 APP/小程序等客户端里抓包,直接去抓接口。。。腾讯视频里就有两个接口是从腾讯视频小程序里抓到的
woshicixide
2019-01-17 17:55:30 +08:00
楼主 ip 用的哪家的代理
skyqqcc
2019-01-17 18:05:41 +08:00
@woshicixide 目前还没有用到代理。。。。。可能以后会用到吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/527750

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX