岗位名称
算法 Agent 工程师(数据采集与内容智能方向)
工作内容
面向公开媒体数据采集场景,建设页面理解、正文抽取、字段标准化、内容去重归一等核心算法能力。
负责文本分类、实体识别、属性/关系抽取、相似度计算、结构化建模等内容理解任务。
参与检索召回与相关性优化,建设关键词检索、语义检索、混合召回、实体级召回等能力。
基于规则、模型、LLM 和 Agent 工作流,提升采集链路的自适应处理能力与复杂任务自动化水平。
建立评测集、质量指标和 badcase 迭代机制,持续优化抽取、召回和数据质量效果。
推动算法能力在采集平台、内容处理平台和数据服务中的工程化落地。
我们希望你具备
扎实的 NLP/机器学习基础,熟悉分类、序列标注、抽取、匹配、聚类等任务。
熟悉 Python/java ,有良好的工程实现能力。
有信息抽取、检索召回、内容理解或数据结构化相关项目经验。
了解大模型应用,具备结构化抽取、RAG 、Tool Use 或 Agent 工作流实践经验。
了解网页采集和页面结构解析基本原理。
具备评测、优化和持续迭代意识。
加分项
搜索/知识图谱/媒体内容理解相关经验
OCR/ASR/多模态文本处理经验
Embedding / Rerank / ES / 向量检索经验
规则+模型+LLM 混合方案设计经验
绿泡泡:wxid_xw0qqs5o9t1c22
email:amp1X2NhbWlsZUAxNjMuY29t
算法 Agent 工程师(数据采集与内容智能方向)
工作内容
面向公开媒体数据采集场景,建设页面理解、正文抽取、字段标准化、内容去重归一等核心算法能力。
负责文本分类、实体识别、属性/关系抽取、相似度计算、结构化建模等内容理解任务。
参与检索召回与相关性优化,建设关键词检索、语义检索、混合召回、实体级召回等能力。
基于规则、模型、LLM 和 Agent 工作流,提升采集链路的自适应处理能力与复杂任务自动化水平。
建立评测集、质量指标和 badcase 迭代机制,持续优化抽取、召回和数据质量效果。
推动算法能力在采集平台、内容处理平台和数据服务中的工程化落地。
我们希望你具备
扎实的 NLP/机器学习基础,熟悉分类、序列标注、抽取、匹配、聚类等任务。
熟悉 Python/java ,有良好的工程实现能力。
有信息抽取、检索召回、内容理解或数据结构化相关项目经验。
了解大模型应用,具备结构化抽取、RAG 、Tool Use 或 Agent 工作流实践经验。
了解网页采集和页面结构解析基本原理。
具备评测、优化和持续迭代意识。
加分项
搜索/知识图谱/媒体内容理解相关经验
OCR/ASR/多模态文本处理经验
Embedding / Rerank / ES / 向量检索经验
规则+模型+LLM 混合方案设计经验
绿泡泡:wxid_xw0qqs5o9t1c22
email:amp1X2NhbWlsZUAxNjMuY29t