李土进 电话:18718548159 邮箱: litujin1123@gmail.com 求职岗位:爬虫开发 个人经历:一年开发经验
实习经历
2017.06-至今 python 爬虫 广州诚益信息科技有限公司 广州市
负责用 scrapy 框架抓取医院网页医院,城市,医生等可公开数据,储存到数据库(MySQL)。 项目遇到较大难点:比较容易识别爬虫,采用封 ip 等形式反爬虫,解决方案:采用多 ip,定时更新 ip,每次更换请求 ip 以及代理浏览器应对反爬虫。 另一个难点:页面多为点击触发请求才显示数据,普通请求获取不到数据,每次 post 请求带上获取 到的参数解决。 涉及技术:MySQL,python,scrapy 框架 技能爱好
专业技能 : 1.熟悉 python,flaskweb 框架 2.熟悉 scrapy 框架,爬虫原理 ,phantomjs,selenium 爬虫辅助工具 3.了解 HTML,CSS,JavaScript,jQuery 4.了解 http 协议,Mysql 数据库 5.了解 linux(半年使用) 作品展示
网址: https://github.com/mistery-li/hospital 爬虫
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.