有谁试过用 python 获取 instagram 某个账号的所有图片么

2015-07-19 11:52:21 +08:00
 plantparknet
如题,发现图片全部是javascript加载
5166 次点击
所在节点    Python
14 条回复
paulw54jrn
2015-07-19 12:25:34 +08:00
selenium / ghost.py
frittle
2015-07-19 12:39:35 +08:00
plantparknet
2015-07-19 12:48:04 +08:00
@paulw54jrn 试过selenium,但是centos精简系统,各种报错。
plantparknet
2015-07-19 12:48:19 +08:00
@frittle File "app.py", line 34
bytes = requests.get(url).content
^
IndentationError: unexpected indent

报错了。。。
plantparknet
2015-07-19 13:49:34 +08:00
@frittle 赞!搞定!不过运行过程中总是报这种错误,何解呢~~

/usr/lib/python2.7/site-packages/requests/packages/urllib3/util/ssl_.py:90: InsecurePlatformWarning: A true SSLContext object is not available. This prevents urllib3 from configuring SSL appropriately and may cause certain SSL connections to fail. For more information, see https://urllib3.readthedocs.org/en/latest/security.html#insecureplatformwarning.
InsecurePlatformWarning
felinx
2015-07-19 14:08:20 +08:00
我刚写过一个20行的代码抓,哈哈
plantparknet
2015-07-19 14:55:38 +08:00
@felinx 分享出来~~
gaotongfei
2015-07-19 15:14:07 +08:00
felinx
2015-07-19 18:34:07 +08:00
@plantparknet 跟上面的类似,我是直接通过客户端的API抓的
plantparknet
2015-07-19 20:39:30 +08:00
@felinx 上面的好像木有一个是通过客户端API抓取的~~
felinx
2015-07-19 22:07:10 +08:00
@plantparknet 好吧,放出来 https://gist.github.com/felinx/8ece2c795eee508a90f9

最后抓图我是简单的用wget,有需要可以改成用python抓。
icedx
2015-07-20 00:06:46 +08:00
plantparknet
2015-07-21 00:13:42 +08:00
frittle
2015-07-21 08:24:01 +08:00
@plantparknet 不知道。或许这是「不正当」提取,不过Intagram也没禁用……

p.s. 那个是username,Instagram的user id 是数字

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/206703

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX