from bs4 import BeautifulSoup
import requests
import re
import random
import datetime
random.seed(datetime.datetime.now())
def getLinks(articleUrl):
html = requests.get('
http://en.wikipedia.org/wiki/Kevin_Bacon')
soup = BeautifulSoup(html.text, 'lxml')
return soup.find('div', {'id': 'bodyContent'}).findAll('a', href=re.compile('^(/wiki/)(?!:).*$'))
links = getLinks('/wiki/Kevin_Bacon')
while len(links) > 0:
newArticle = links[random.randint(0, len(links)-1)].attrs['href'] ############################################
print(newArticle)
links = getLinks(newArticle)
不明白这里 newArticle = links[random.randint(0, len(links)-1)].attrs['href']
links 为什么不能用(),一定要用[ ]
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/343359
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.