IT 桔子(
itjuzi.com )是一家聚焦创业公司、产品、投资领域的数据公司,随着数据量的不断增多、需求深入,我们在数据方面遇到了挑战—— 包括 抓取更多的数据并程序化清洗、匹配、入库;对多个数据渠道进行交叉验证、整合;数据的结构化、可视化处理;数据建模与指数算法等~~
所以,我们希望找寻靠谱的 数据爬虫与挖掘工程师,一起升级打怪:
岗位职责:
1.负责设计和开发网络爬虫系统,进行多平台信息的抓取和分析工作;
2.负责网页信息和 APP 数据抽取、清洗、消重等工作,提升平台的抓取效率;
3.参与爬虫核心算法和策略优化,熟悉采集系统的调度策略;
4.实时监控爬虫的进度和警报反馈;
任职要求:
1.熟悉 Linux 系统,掌握 Python ;
2.了解多线程、多进程、网络通信编程相关知识,有数据挖掘经验;
3.掌握网页抓取原理及技术,了解基于 Cookie 的登录原理,熟悉基于正则表达式、 XPath 、 CSS 等网页信息抽取技术;
4.熟悉 APP 模拟及接口验签破解技术,了解 APP 用户授权访问机制,掌握 Selenium , APP 破解技术优先;
5.做过数据处理、 ETL 等相关工作优先。
薪酬: 15-25K/月
欢迎大家和我联系: wenfeixiang@itjuzi.com
O(∩_∩)O 谢谢。
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/354205
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.