我们是一个年轻的数据科学团队,希望使用技术改变商业世界,实现数据驱动的精细化研究、运营与决策。 我们的产品正在服务国内外一流企业,包括世界最大的对冲基金、国际一线汽车品牌、快消品龙头厂商,以及时尚鞋服大牌。
我们的团队里有许多顶尖的工程师和数据科学家,来自腾讯、百度、快播、华为、BCG 和国际投资银行,毕业于海内外著名高校。
我们获得了来自著名投资机构的三轮投资,资金充足,处在高速发展的上升期。但我们仍然是一个小公司,你的加入仍然可以对公司的发展轨迹产生明显的影响和贡献。
我们专注于前沿技术和产品的研发,包括数据采集沉淀 /分布式处理和存储 /高性能实时运算 /数据挖掘 /自然语言处理 /数据可视化。每天的工作都充满了挑战性,一定不会无聊。
我们的团队很扁平,只有协作没有层级。我们有高度自治的工作氛围,每一个人都有充分的自主权选择更优秀的方案完成自己负责的工作。
我们主力语言是 Python、Golang 和 Javascript,技术栈包含 Cassandra、Hive、Elasticsearch、MongoDB、Pandas、Scikit-learn、Docker,以及各种自己开发维护的黑科技。我们有着浓厚的工程师文化,乐于尝试大量的开源项目,并做出贡献。
负责大数据平台的设计开发,包括平台组件选型及搭建、平台服务开发;
参与设计数据仓库模型、构建分层体系、元数据管理及核心应用开发;
参与数据清洗、转换和加工( ETL );
负责新技术的调研、选型、推广和应用。
本科及以上学历,计算机相关专业,3 年以上大数据工作经验;
熟悉 Hadoop 生态,对 HDFS, Hive, MapReduce, Spark, HBase, Impala 中至少一个有深入理解和使用经验;
熟练使用 SQL,至少熟悉一种关系型数据库;
深入理解维度模型,有数据仓库设计和开发经验;
熟练使用 Python,有良好的编码习惯;
熟悉 Kafka, Spark Streaming, Flink,有实际使用经验者优先;
熟悉 ElasticSearch, Solr, ClickHouse, Redshift 等技术优先;
提供技术博客 / GitHub 账号,有开源贡献和优质技术文章优先。
-负责常用业务逻辑的抽象、工具化;
-参与公司数据平台维护和开发。
必须熟练使用 Python,有良好的编码习惯。熟悉 Pandas, 正则表达式、文件处理、并行编程;
必须熟练使用 SQL,至少熟悉一种常用数据库,包括但不限于 MySQL、Postgres、SQL Server、Oracle ;
了解 Hive, Impala 等 Hadoop 大数据技术,有 Spark 经验尤佳;
熟悉 Web 后端开发优先;
熟练使用 Linux 操作系统;
良好的沟通、理解能力,工作细致、耐心、负责;
提供技术博客 / GitHub 账号,有开源贡献和优质技术文章优先。
负责数据模型设计和 ETL 设计、开发和文档编写;
负责离线 /实时数据同步和清洗;
根据业务需求,输出报表,给分析师提供数据提取服务。
本科及以上学历,计算机相关专业,1 年以上相关工作经验;
熟练使用 Python,有良好的编码习惯。熟悉 Pandas, 正则表达式、文件处理、并行编程;
掌握数据仓库基础理论知识和 ETL 设计技术;
熟练使用 SQL,至少熟悉一种常用数据库,包括但不限于 MySQL、Postgres、SQL Server、Oracle ;
了解 HDFS, Hive, Impala, Presto 等 Hadoop 大数据技术,有 Spark 经验尤佳;
熟练使用 Linux 系统;
良好的沟通、理解能力,工作细致、耐心、负责;
提供技术博客 / GitHub 账号,有开源贡献和优质技术文章优先。
产品的需求调研、技术方案制定以及设计报告的撰写;
产品后端数据模型以及接口开发;
产品维护。
精通 Python,有良好的编码习惯;
有独立项目开发经验,开发过完整的产品;
熟练掌握至少一门 Python Web 开发框架( Flask 优先,Django、Tornado 等);
熟悉 Redis、MySQL、MongoDB 等常用数据库,具备相关使用经验;
熟悉 Javascript,了解 HTML、CSS,具备一定前端开发能力;
熟练使用 Linux 操作系统;
有较强的学习能力、团队协作意识,有良好的沟通、需求理解能力,问题解决能力。
有优质技术博客、GitHub 积极贡献者优先;
具备大数据技术使用或开发经验者优先。
负责公司关键词挖掘、情感分析、信息抽取、智能问答等领域的研究;
优化关键词抽取、情感分析等算法,提升算法准确度。
熟悉 NLP、深度学习当前热点和前沿技术,有完整的、系统的认知;
熟悉 C/C++/Python/Java 中的一种语言;
拥有至少一年在分词、词性标注、关键词抽取、文本分类、实体识别、信息抽取、情感分析等 NLP 领域相关开发工作经验;
拥有深度学习在 NLP 领域的实操经验,并有可靠的项目落地
良好的团队合作意识和沟通能力。
开放的平台,扁平化的管理,优秀人才会立即得到重用,并为你打造一个团队;
提供良好的研究环境和氛围,让你在工作中进一步深造自己的技术。
协助改进并开发文本情感分析模型,负责模型部署及上线,并根据用户反馈调整模型,提升模型质量;
负责通过文本挖掘建立商业垂直领域行业知识图谱和通用词库,并构建新词发现系统;
运用机器学习技术,结合当前自然语言处理技术,负责文本信息抽取及任务对话系统开发。
计算机或相关专业本科及以上学历;
熟悉 C/C++/Python/Java 中的一种开发语言,拥有一年及以上软件项目开发经验;
理解机器学习基本算法的设计思想和求解手段,如 SVM, LR, RF, Boosting 等,有 kaggle 比赛经验者优先;
对机器学习以及如何在行业内应用有浓厚的兴趣,有一定自然语言处理经验者优先;
较强的自主学习能力,良好的英语沟通能力者优先。
弹性的管理方式,提供足够的工作自主性,自我安排学习与工作计划;
提供最接近商业应用的机器学习落地机会,提升自身价值。
负责细粒度情感分析标注结果的检查与确认;
负责情感分析模型调优、模型评估和指标输出;
协助组内其他人员完成自然语言处理相关工作。
计算机或相关专业的本科及以上学历;
了解自然语言处理、机器学习、深度学习等相关算法,对自然语言处理方向有浓厚的兴趣;
了解深度学习在自然语言处理方向的相关算法和框架;
具有科学探索精神和团队协作能力;
实习期要求至少 3 个月以上。
有竞争力的薪酬:工资、一年两次调薪机会、五险一金、年终奖、节假日福利、生日礼物等。既有情怀,又有“钱”途;
合理的工作时间:我们有弹性工作时间制度,并追求使用技术去高效解决问题,不提倡加班;
团队活动:YiMBA 系列课程、每周的篮球和羽毛球运动,每周分享会,每月聚餐、生日会等。我们是一个有凝聚力的团队;
年度体检:豪华体检,健康强壮的身体是工作的基础;
零食饮料:不间断的供应丰富优质的零食饮料;
年度旅游:去年第一次出国旅行,随着团队的壮大,以后能去得更远;
舒适的工作环境:我们有一个漂亮的办公室,开放式的设计和十分开阔壮观的窗景
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.