首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

推荐学习书目

› Learn Python the Hard Way

Python Sites

› PyPI - Python Package Index

› http://diveintopython.org/toc/index.html

› Pocoo

值得关注的项目

› PyPy

› Celery

› Jinja2

› Read the Docs

› gevent

› pyenv

› Stackless Python

› Beautiful Soup

› 结巴中文分词

› Green Unicorn

› Sentry

› Shovel

› pytest

Python 编程

› pep8 Checker

Styles

› PEP 8

› Google Python Style Guide

› Code Style from The Hitchhiker's Guide

这是一个创建于 2180 天前的主题，其中的信息可能已经有所发展或是发生改变。

网站源码：

<p class="profile">
                    
                        江苏省产业技术研究院智能液晶技术研究所（智能液晶所）是一个新型的、以企业方式运营的专业技术研究所，其运营实体为江苏集萃智能液晶科技有限公司。
<br/>    公司成立于 2016 年 5 月，大楼总面积达 13363.6 平...<span class="profile-open">展开+</span>
                    
                </p>

crawler.py

r = requests.get(url, headers=kv)
print(r.text)

Output

<p class="profile">
                    
<br/>    公司成立于 2016 年 5 月，大楼总面积达 13363.6 平...<span class="profile-open">展开+</span>
                    
                </p>

正在做毕设，求大佬解惑

2 条回复

1

lozzow

2020 年 3 月 18 日 via iPhone

不同地方加载的吧，你从浏览器上看到的是加载之后的数据，所以是不一样的

2

l3n641

2020 年 3 月 18 日

建议给出 url 地址吧.情况很多种
第一种是没有获取到的数据,是通过 ajax 获取或者保存到某个变量里面,然后在渲染的.第二种是有防爬虫,识别出了,你是爬虫,所以传递了不完整的数据.

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 942 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 24ms · UTC 19:43 · PVG 03:43 · LAX 11:43 · JFK 14:43
♥ Do have faith in what you're doing.