[招聘] Python 抓取爬虫数据处理工程师

2016-11-16 18:44:28 +08:00
 sofasky
岗位职责:

1 、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析,按要求抓取金融数据;
2 、负责网页信息 /APP 数据抽取、数据清洗、数据消重等研发和优化工作,包括爬虫、调度、信息提取、信息存储等,提升平台的抓取效率;
3 、参与爬虫核心算法和策略优化,熟悉采集系统的调度策略;
4 、实时监控爬虫的进度和警报反馈;

任职要求:

1 、熟悉 Linux 系统,熟悉 Java 或者 Python ;
2 、熟悉网页抓取原理及技术,熟悉基于正则表达式、 XPath 、 CSS 等网页信息抽取技术,熟悉基于 Cookie 的登录原理;
3 、熟悉 APP 模拟及接口验签破解技术,熟悉 APP 用户授权访问机制及模拟;
4 、熟悉多线程、多进程、网络通信编程相关知识;
5 、熟悉 Selenium 优先,熟悉 APP 破解技术优先。
6 、有分布式爬虫架构,数据挖掘经验优先。
7 、对数据敏感,做过数据处理相关工作者优先,做过 ETL 工作者优先;
3300 次点击
所在节点    Python
7 条回复
sofasky
2016-11-16 18:47:19 +08:00
有没有意向的欢迎加 QQ : 1258083995 细聊

工作地点北京三元桥
tumbzzc
2016-11-16 18:59:33 +08:00
我觉得我可以试一番
sofasky
2016-11-16 19:03:50 +08:00
@tumbzzc 好啊,你的联系方式是?
tumbzzc
2016-11-16 19:07:25 +08:00
@sofasky ( ⊙ _ ⊙ )说笑啦,刚参加工作不好辞职
sofasky
2016-11-16 19:10:51 +08:00
@tumbzzc 哈哈,没关系。有朋友做这块的也可以推荐下
linuxzpf
2016-11-16 22:18:28 +08:00
瞄了两眼,岗位职责就是我现在工作的一部分,我是爬取各大 P2P 平台的数据,实时同步,互联网金融。
yanzixuan
2016-11-22 14:44:14 +08:00
@sofasky 可以远程工作么?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/320996

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX