[部门介绍]
Web data,简称 WD,作为百度大搜索的核心技术部门,WD 承载着“链接全网资源,理解信息世界”的使命。部门主要由 spider、页面解析、互联网价值挖掘( base 深圳)、WD 机制架构等团队组成。作为链接百度与互联网之间的桥梁,WD 为全百度所有业务线提供全面、及时、准确的大规模数据。主要技术方向包括:全网资源发现、资源价值计算、资源更新、页面渲染、页面理解、页面转码、内容关系挖掘与计算、大规模数据处理架构等。借助于机器学习、深度学习、数据挖掘、分布式计算等基础技术,WD 每天处理高达数以千亿级别的数据,并拥有全国最大的互联网资源库; 在这里,你不但能够学习到 WD 近 10 年的技术积累,也能够和我们一起随着互联网的演变,不断进行技术创新与探索。 “链接全网资源,理解信息世界”,中国最专业的互联网数据团队,欢迎你的加入!
[团队介绍]
WD 架构团队,是百度搜索体系下历史最为悠久、技术底蕴最为深厚、业务线条最为核心的团队之一,职责为面向海量互联网资源的发现、收录、解析、存储和特征计算,团队富有活力和凝聚力,是拥有巨大成长空间的发展平台。
[岗位 JD ]
工作职责:
-参与百度内容收录系统架构的核心技术研究和开发工作,包括并不限于天级处理千亿到万亿量级数据的分布式流式计算系统、下一代离线架构、大规模机器学习应用框架、平台化机制建设等
-参与或负责至少一个子方向或业务线条的工作,包括并不限于需求拆解、问题梳理、方案设计、开发落地、产品对接等
-学习架构前沿技术,迭代知识储备,持续优化在线 /离线收录系统架构,提升百度内容收录效果
-参与高可用性、高扩展性、定制化服务架构设计、研发和重构工作,抽象通用架构模型,支撑百度公司内规模最大的内容收录平台
职位要求:
-精通 C/C++语言编程,熟悉 linux/shell,对数据结构和算法设计有较为熟练的掌握
-有大规模分布式系统研发经验,深刻理解架构设计理念,敏感于架构核心目标
-技术迁移能力强,善于理解和学习,务实自驱,具有良好的沟通能力和团队合作精神
-对搜索技术、探索未知领域有浓厚的兴趣,对解决具有挑战性问题充满激情
[薪酬福利]
20K-40K
各种节假日~团建~公司活动~
健身房、瑜伽室、各种社团等你来撩~
青松计划隆重推出,为父母提供多重保障~
团队气氛 up~up~
[工作地址]
北京市海淀区西北旺百度科技园
深圳市南山区百度国际大厦
[投递邮箱]
请按:应聘岗位-姓名的形式命名简历及主题~发送至邮箱
[email protected]