想学网页抓取,新手Python的编码问题

2012-06-20 09:35:52 +08:00
 liuxurong
#-*-coding:utf-8-*-
#-*-encoding=utf-8
import cookielib, urllib2,urllib,sys
from bs4 import BeautifulSoup
response = urllib2.urlopen('http://www.baidu.com')
html = response.read()
soup = BeautifulSoup(html)


a=soup.prettify()

print a



UnicodeEncodeError: 'gbk' codec can't encode character u'\xa0' in position 3621: illegal multibyte sequence

搞不懂编码问题,请问怎么办.
30656 次点击
所在节点    Python
23 条回复
liuxurong
2012-06-21 00:33:26 +08:00
@c 谢谢。你介绍的都很好用。
lddhbu
2013-04-19 19:28:43 +08:00
解决了我的问题
feilong
2016-09-23 07:04:37 +08:00
@clowwindy 感谢,终于明白了是终端的问题,换一个果然没问题了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/40033

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX