V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
listen1999
V2EX  ›  酷工作

钛媒体数据项目招聘 Python 工程师和数据产品经理等职位

  •  3
     
  •   listen1999 · 2016-05-03 14:11:32 +08:00 · 1867 次点击
    这是一个创建于 2928 天前的主题,其中的信息可能已经有所发展或是发生改变。

    关于公司和项目

    钛媒体( http://www.tmtpost.com ) 是一个聚焦在 TMT 领域( Technology, Media, and Telecommunication )的新媒体产品。自 2013 年上线以来,几千名作者在钛媒体上发表超过 25,000 多篇文章,主题围绕互联网行业的商业模式、科技创新、创业、投融资等方方面面,每年为数亿人提供最新和最前沿的商业分析、科技报道、创业案例等内容。

    2016 年,我们决定打破媒体产品固有的思维惯性和产品形态,突破自身的技术限制,打造一款极具技术挑战的媒体数据产品。为实现这一目标,我们需要有在如下领域具有经验和学习欲望的同学加入,一起面对挑战、学习、和攻关,共同打造出让自己骄傲的产品:

    • Python & Django
    • 爬虫技术
    • 自然语言处理
    • Hadoop
    • 数据分析 / 数据可视化

    我们的办公室紧邻东三环,处 CBD 腹地,交通极其方便。办公环境舒适自由,同事关系简单友善。公司福利优厚( 6 险 1 金),工资水平不低于行业标准。

    数据工程师( 2-3 人)

    职位描述:

    我们希望你是一名全栈工程师( Full-stack engineer ),如果现在还不是,希望你渴望未来可以是。如果你坚持只专注在服务端,我们也接受。

    在这个职位上,你需要应用 Python (或其它能够高效处理文本的编程语言,如 PERL )编写爬虫,从整个互联网获取数据,以技术手段对庞杂数据进行清洗,能应用自然语言处理的相关知识和技术,发掘文本规律,提取有价值的信息。你需要能把数据通过 MySQL 、 MongoDB 、 Neo4j 等数据库安全地存储、调用、随心所欲地操作。

    你还需要能用 Django 建造数据管理后台,搭建 API 服务,让我们的数据可以安全和高效地输出给我们授权的应用和机构。

    你该是一个数据的信仰者,相信世界上至少 90%的事情可以用数字去描述、计量、和表现。为了实现让数据说话,你愿意到数据科学领域里折腾一番,渴望利用业余时间学习数学、统计学、 R 语言等,甚至可以大开脑洞,自己动手用 JS 、 HTML5 、 CSS3 、以及各种开源 JS 库把数据画出来。

    你或许目前还不能掌握上述全部的技术,不过,不必担心,只要你现在能掌握上面说的 1-2 项,并愿意未来和我们一起不断学习和研究,你就有机会加入我们的数据工程师团队。

    任职要求:

    基本要求

    • 熟悉 Python 编程语言,有 1 年以上 Python/Django 项目开发经验。
    • 熟悉 MySQL 和 MongoDB 数据库系统,有图数据库( Freebase/Neo4j 等)经验的开发者优先考虑。
    • 熟悉常见的 Python 第三方模块和工具,遇到任何技术问题,能通过各种开发者社区快速找到解决方案。
    • 熟悉 Linux 系统,能在 Linux 上部署各种网站和服务。有 AWS 或阿里云部署经验者优先考虑。
    • 具有良好的英文阅读和听说能力,能快速阅读和学习英文技术文档和资料。

    加分项

    • 有大数据系统( Hadoop 或 Spark 等)搭建、开发、和维护经验。
    • 有 Scrapy 的搭建和开发经验。
    • 有 REST API/Oauth 的搭建经验。
    • 有中文自然语言处理的经验或兴趣。
    • 计算机科学、应用数学、统计学等专业毕业,具有本科以上学历。
    • 热爱数据科学( Data Science ),在 udacity 、 courera 等 MOOC 网站上完成过相关课程并获得相应学分。
    • 自己拥有技术博客,在 Github/StackOverFlow 等社区上活跃或有贡献。
    • 熟悉以下的一个或几个计算机语言: PHP 、 Java 、 JavaScript 、 Perl 、 R 。

    以上职位对在校学生开放实习生岗位。

    数据产品专员( 1 人)

    职位描述:

    你将参与一个非常有趣但也非常有挑战的工作:参与设计、维护、并不断改进一个数据处理的流水线。这条流水线上有各种奇奇怪怪的数据源,爬虫,进行深度学习的计算机、自然语言分析和处理的程序,当然还有几个好玩聪明的工程师。你要找到让机器进行学习的各种资料和素材,指挥爬虫去获取,命令机器去学习,让杂乱的文本通过一道又一道工序被筛选和处理,最后变成干净、整齐、乖巧的数据,被有序地储存和保存,等待各种方式的组合、调用、和分析。

    为了确保数据的干净和准确,你有时候需要深入到计算机算法中,弄清究竟什么导致了数据的各种问题。有时候,你要带着几个人,以你极其挑剔、苛求完美的工作态度,去训练计算机以人的方式去理解和处理数据,最终保证数据干净得让人无法挑剔。

    你还要参与思考我们数据产品的商业化,制定发展战略,寻找合作伙伴,总之,你要为我们的程序找各种食物,喂它长大,和它一起成长。

    任职要求:

    基本要求

    • 对 TMT 领域十分熟悉和热爱,每日通过各种渠道获取科技领域的各种资讯,有 TMT 领域记者或编辑从业经验者优先考虑。
    • 理解计算机工作原理,熟悉互联网产品(网站或 APP )的开发流程,对大数据、自然语言处理有产品经验者优先考虑。
    • 熟悉一种或多种计算机编程语言。
    • 有成为出色产品经理的强烈欲望。
    • 完美主义者,对瑕疵零容忍。
    • 乐观、开朗、不畏惧任何困难。

    加分项

    • 计算机科学、应用数学、统计学等专业毕业,具有本科以上学历。
    • 热爱数据科学( Data Science ),在 udacity 、 courera 等 MOOC 网站上完成过相关课程并获得相应学分。
    • 能够用下述一种或几种语言操作数据: Python 、 Java 、 R 、 PHP 、等。

    以上职位对在校学生开放实习生岗位。

    如何申请?

    以上描述未必反映项目或招聘要求的全部,我们欢迎各路英雄豪杰的加入和帮助。对上述职位有兴趣的同学,可将简历发送至 [email protected] 。如有任何疑问或建议,也欢迎通过电子邮件和我们联系。

    2 条回复    2016-05-05 17:50:44 +08:00
    listen1999
        1
    listen1999  
    OP
       2016-05-04 11:31:20 +08:00
    自己顶一下!
    Raidal
        2
    Raidal  
       2016-05-05 17:50:44 +08:00
    文案诚意满满,赞一个!
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1020 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 20:04 · PVG 04:04 · LAX 13:04 · JFK 16:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.