想学网页抓取,新手Python的编码问题

2012-06-20 09:35:52 +08:00

liuxurong

#-*-coding:utf-8-*-
#-*-encoding=utf-8
import cookielib, urllib2,urllib,sys
from bs4 import BeautifulSoup
response = urllib2.urlopen('http://www.baidu.com')
html = response.read()
soup = BeautifulSoup(html)

a=soup.prettify()

print a

UnicodeEncodeError: 'gbk' codec can't encode character u'\xa0' in position 3621: illegal multibyte sequence

搞不懂编码问题,请问怎么办.

30656 次点击

所在节点

Python

23 条回复

liuxurong

2012-06-21 00:33:26 +08:00

@c 谢谢。你介绍的都很好用。

lddhbu

2013-04-19 19:28:43 +08:00

解决了我的问题

feilong

2016-09-23 07:04:37 +08:00

@clowwindy 感谢，终于明白了是终端的问题，换一个果然没问题了

第 2 页／共 2 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/40033

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.