Python 非常规 json 如何解析_淘宝 json

2017-03-17 15:10:34 +08:00
 xingshu1990

python 版本: 2.7 本人能力:非程序员,有一点点喜欢 python ,想折腾一些数据采集之类的,以便今后转运营助理或者运营,方便数据记录、分析。 环境模拟:想要采集皮鞋第一页、第二页全部产品的标题、图片、价格等前端展现的内容,可能详情页也需要用代码做截图处理,可能需要采集正文和评价。 问题:淘宝里的 json 是非正常的,由于技术问题,先用 sub 替换了 jsonp232(),也不能正常解析。求前辈折腾一下。

json 地址: https://s.taobao.com/api?_ksTS=1489731701469_231&callback=jsonp232&ajax=true&m=customized&rn=2e8936bb027bece89209046885ec042a&q=%E7%9A%AE%E9%9E%8B&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20170317&ie=utf8&s=36&bcoffset=-3

python 不用处理就能正常 dumps 、 load 能解析的 淘宝 json

3567 次点击
所在节点    Python
8 条回复
fy
2017-03-17 15:19:07 +08:00
这个是 JSONP 的,不光是最前面有额外字符,最后面也有字符
aegisho
2017-03-17 15:25:54 +08:00
ls +1
地址里的 callback=jsonp232 直接改为 callback= 不就是 json 了
xingshu1990
2017-03-17 15:27:25 +08:00
谢谢上面两个大神 我测试一下
burnex
2017-03-17 15:27:31 +08:00
JSONP
Jaylee
2017-03-17 16:24:03 +08:00
fhefh
2017-03-17 16:42:33 +08:00
xingshu1990
2017-03-17 16:56:15 +08:00
不一一答谢了,各位层主谢谢,搞定了。
lslqtz
2017-03-18 14:26:30 +08:00
@fhefh js=1 我觉得也要删

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/348216

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX