V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
bytedance
V2EX  ›  北京

[今日头条] 数据抓取实习生

  •  
  •   bytedance · 2016-03-31 15:44:40 +08:00 · 3035 次点击
    这是一个创建于 3185 天前的主题,其中的信息可能已经有所发展或是发生改变。

    工作地点:北京市海淀区知春路(离地铁站 5 分钟)

    请将简历发送至: [email protected] “姓名+抓取实习” 实习薪资:日薪 200~300 元 /天 实习时间: 3~4 天 /周,≥6 个月

    职位描述:

    今日头条的目标是给用户推荐他所感兴趣的各种信息(不只是新闻),因此数据是今日头条的核心。抓取的目标是从互联网海量信息中抓取并筛选出有价值的内容,并转换为适合移动端展示的格式以推荐给用户,涉及到的环节包括爬虫,抽取,去重,质量识别等. 实习生职位的主要工作集中在爬虫和抽取环节。 由于需要覆盖大量长尾数据,对内容的精确抽取涉及到非常多的挑战,你的加入,可以帮助头条覆盖更多的内容,并将内容以更加精准的形式展现给用户。

    职位要求:

    1.对技术有热情, 既有高远目标,也能脚踏实地 2.有扎实的数据结构和算法功底, 强悍的编码能力 3.熟悉 linux 开发环境,熟悉 C++和 python 语言的优先 4.理解 http ,熟悉 html,DOM,xpath 优先

    需要提交的材料: 1.简历 2.SNS 账号(或链接),如微博、豆瓣等 3.你经常上的 3 个技术网站 4.你阅读过的 3 本值得推荐的技术类书籍

    欢迎留言咨询 :)

    2 条回复    2016-04-15 11:51:17 +08:00
    takeoffyoung
        1
    takeoffyoung  
       2016-04-03 14:13:13 +08:00
    觉得自己勉强符合上述要求,然而第一次内推告诉我简历未通过......
    再来试一次吧
    [resume]( http://www.takeoffyoung.com/resume.pdf)
    berry10086
        2
    berry10086  
       2016-04-15 11:51:17 +08:00
    已发送简历
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1030 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 22:35 · PVG 06:35 · LAX 14:35 · JFK 17:35
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.