关于爬虫的话,《 Python 网络采集》一书在介绍 BbeautifulSoup 时写
from urllib.request import urlopen
同样这本书,随后
from bs4 import BeautifulSoup
html = urlopen("http://www......")
bsObj = BeautifulSoup(html.read())
print(bsObj.h1)
《用 Python 写网络爬虫》写
import urllib.request
还是这本书:
def download(url):
return urllib.request.urlopen(url).read()
#感觉是之前代码( html = )的简写?此处也没有定义 url,可能 urlopen 可以直接定义
之前崔大的 Python 2.7 的文章:
import urllib2
response = urllib2.urlopen(url) #此处突然出现 response 等内容,第一个书里的代码直接就有 read 了
print response.read()
感觉 Python 写法多种多样,自己的博客Python 爬虫初见里也总结了一下from … import …与 import 的区别,以及得出
urllib 通用库>urllib.quest>urlopen 函数
但是 import 在没有 from 的情况下也可以直接导入一个 urllib.quest 等,就很奇特?
这个是和其他语言一样,每个人的写法不一样,根据自己的风格来还是?
这是目前单看爬虫书籍学习的疑惑,求指点以及避坑~
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.