岗位职责:
任职要求: 1、 熟悉网页抓取原理及技术,熟悉基于 Cookie 的网站登录原理,熟悉基于正则表达式、Xpath、CSS 等网页信息; 2、 精通 Python 编程语言,精通 Javascript,对 HTTP 协议及 HTML 有深入的了解; 3、 精通正则表达式,用于从各种网络结构化和非结构化数据中抽取有用的信息; 4、 熟练掌握数据库开发,对数据处理和数据质量有较深认识;精通至少一种主流数据 NoSQL、mysql 数据库; 5、 熟悉 http client、js, ajax, webdriver、selenium 等技术优先; 6、有海量数据爬取经验者优先;有爬取过微博,微信,淘宝等平台数据优先;具有自然语言处理、机器学习相关工作经验
开放性培训,可以学习机器学习,深度学习等相关算法,欢迎加入
简历请投递邮箱: hr@webot.ai
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.