工作职责:
- 理解项目需求,制定网络数据抓取规划,负责爬虫程序编写、数据清洗以及汇总
- 设计各种策略和算法,优化爬虫效率
- 构建通用可扩展的爬虫框架
基本要求:
- 3年以上开发经验,至少精通一门脚本语言(python/perl/ruby等)
- 了解HTTP协议和各种Web前端技术(HTML/JavaScript/AJAX等),熟悉正则表达式和XPath
- 熟悉至少一种数据库系统(SQL/NoSQL皆可)
- 扎实的编程基础和良好的编程习惯
- 良好的沟通能力
加分:
- 熟练使用一种开源爬虫框架(Scrapy/Nutch等)
- 具有分布式爬虫架构经验
工作地点上海徐家汇,北京国贸写字楼
公司网站:
www.meritco-group.com简历请投递至: recruiting@meritco
-group.com 标题:[爬虫工程师]_姓名_工作年限
我们会在第一时间联系你
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
https://www.v2ex.com/t/140529
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.