我们是一个年轻的数据科学团队,希望使用技术改变商业世界,实现数据驱动的精细化研究、运营与决策。 我们的产品正在服务国内外一流企业,包括世界最大的对冲基金、国际一线汽车品牌、快消品龙头厂商,以及时尚鞋服大牌。
我们的团队里有许多顶尖的工程师和数据科学家,来自腾讯、百度、快播、华为、BCG 和国际投资银行,毕业于海内外著名高校。
我们获得了著名众麟资本、德同资本顶尖机构的投资,资金充足,处在高速发展的上升期。但我们仍然是一个小公司,你的加入仍然可以对公司的发展轨迹产生明显的影响和贡献。
我们专注于前沿技术和产品的研发,包括数据采集沉淀 /分布式处理和存储 /高性能实时运算 /数据挖掘 /自然语言处理 /数据可视化。每天的工作都充满了挑战性,一定不会无聊。
我们的团队很扁平,只有协作没有层级。我们有高度自治的工作氛围,每一个人都有充分的自主权选择更优秀的方案完成自己负责的工作。
我们主力语言是 Python、Golang 和 Javascript,技术栈包含 Cassandra、Hive、Elasticsearch、MongoDB、Pandas、Scikit-learn、Docker,以及各种自己开发维护的黑科技。我们有着浓厚的工程师文化,乐于尝试大量的开源项目,并做出贡献。
开发工业级爬虫
设计大规模数据存储方案
优化爬虫平台
技术攻坚。主要体现在网站反爬、数据存储和多个站点爬虫管理
熟悉计算机网络相关知识,并有扎实的编程基本功
很好的沟通能力和理解能力
1年及以上 Python 项目开发经验;熟悉 MySQL 等关系型数据库以及 SQL 语言,至少掌握一种 NoSQL 数据库,对存储性能优化有了解者优先;熟悉 Linux 平台环境的开发
工作内容。我们专注于前沿技术和产品的研发,包括数据采集沉淀、分布式处理和存储、高性能实时运算、数据挖掘、自然语言处理、数据可视化。你可以接触到各种各样有挑战的事情
技术栈。我们主力语言是 Python、Golang 和 Javascript,技术栈包:含 Cassandra、Hive、Elasticsearch、MongoDB、Pandas、Scikit ‑ learn、Docker,以及各种自己开发维护的黑科技。我们有着浓厚的工程师文化,乐于尝试大量的开源项目,并做出贡献。你可以深入理解各种前沿技术,并在实际中运用自己的理念
技术分享
必须熟练使用 Python,有良好的编码习惯。熟悉 pandas, 正则表达式、并行编程
必须熟练使用 SQL,至少熟悉一种常用数据库,包括但不限于 MySQL、Postgres、SQL Server、Oracle
熟练使用 Linux 操作系统
了解 Hive, Impala 等 Hadoop 大数据技术,有 Spark 经验尤佳
良好的沟通、理解能力,工作细致、耐心、负责
有大数据处理经验
熟悉 Python Web 开发或爬虫
提供技术博客地址和 GitHub 账号
能独立负责数据模型设计和 ETL 开发
负责数据整合、转换和清洗(如字段映射,内容提取等)
根据业务需求,输出报表,给分析师提供数据提取服务
维护现有 ETL 项目,编写 ETL 文档
辅助负责数据库、集群等服务的监控和运维
必须熟练使用 Python,有良好的编码习惯。熟悉 pandas, 正则表达式、并行编程。
必须熟练使用 SQL,至少熟悉一种常用数据库,包括但不限于 MySQL、Postgres、SQL Server、Oracle
熟练使用 Linux 操作系统
了解 HDFS, Hive, Impala, Presto 等 Hadoop 大数据技术,有 Spark 经验尤佳
良好的沟通、理解能力,工作细致、耐心、负责
有数据仓库、维度建模相关工作经验
有大数据处理经验,用过或了解 Airflow
熟悉 Python Web 开发或爬虫
熟悉 ElasticSearch、Kibana
提供技术博客地址和 GitHub 账号
负责公司关键词挖掘、情感分析、信息抽取、智能问答等领域的研究
优化关键词抽取、情感分析等算法,提升算法准确度
熟悉 NLP、深度学习当前热点和前沿技术,有完整的、系统的认知
熟悉 C/C++/Python/Java 中的一种语言
拥有至少一年在分词、词性标注、关键词抽取、文本分类、实体识别、信息抽取、情感分析等 NLP 领域相关开发工作经验
拥有深度学习在 NLP 领域的实操经验,并有可靠的项目落地
良好的团队合作意识和沟通能力
开放的平台,扁平化的管理,优秀人才会立即得到重用,并为你打造一个团队
提供良好的研究环境和氛围,让你在工作中进一步深造自己的技术
代表公司参加各种有关机器学习的商业 Hackthon 比赛
与数据分析师一起,应用机器学习算法在需求规划、销量预测、动态定价等商业领域创造价值
定期与组内分享机器学习算法知识及应用经验
计算机或相关专业本科以上学历
对机器学习以及如何在行业内应用有浓厚的兴趣
熟悉 C/C++/Python/Java 中的一种开发语言
理解机器学习基本算法的设计思想和求解手段,如 SVM, LR, RF, Boosting 等
拥有机器学习实操经验,参加过线上比如 Kaggle、天池比赛者优先
较强的自主学习能力,良好的英语沟通能力者优先
提供充足的时间让您打磨自己的技术,参加线上或线下比赛
提供足够的工作自主性,自我安排学习计划
提供最接近商业应用的机器学习落地机会,提升自身价值
对 Android Framework 有深入的理解, 熟悉 Android 底层源码,Android 各种实现机制;
精通 JAVA 编程语言, 熟悉 JVM 者优;
有使用 Xposed ,Cydia,Frida 其中一种 HOOK 框架经验;
有 Android 逆向经验者优先;
有 App 数据加解密经验者优先;
有 APP 数据提取经验者优先。
有竞争力的薪酬:工资、五险一金、年终奖、节假日福利、生日礼物等。既有情怀,又有“钱”途
合理的工作时间:我们有弹性工作时间制度,并追求使用技术去高效解决问题,不提倡加班
团队活动:每周的篮球和羽毛球运动,每周的分享会,每月的聚餐、生日会等。我们是一个有凝聚力的团队
年度体检:豪华体检,健康强壮的身体是工作的基础
零食饮料:不间断的供应丰富优质的零食饮料
年度旅游:去年第一次出国旅行,随着团队的壮大,以后能去得更远
舒适的工作环境:我们有一个漂亮的办公室,开放式的设计和十分开阔壮观的窗景
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.