背景
• 获得原始数据后,由AI PM先用相关工具简单处理,再交付给数据标注人员进行标注,但标注人员对数据的理解和标注质量差异大,导致数据标注效率和质量不达标
• 细分领域积累了大量数据,但往往使用一次后就不再产生价值,数据无法沉淀和复用
定义
• 通过分析产品需求和相关数据,制定数据标注规则,实现“提高数据标注的效率和质量”和“积累细分领域通用数据”的价值
职责
• 制定数据标注规则:从数据中提取行业特征场景,结合行业知识,制定表达精准、逻辑清晰的数据标注规则
• 数据验收和管理:参与模型搭建和数据验收,并负责核心指标和数据的日常跟踪维护
• 积累细分领域通用数据:从已有数据中挑选通用数据(适用于同领域内不同用户),形成数据沉淀和积累
流程
AI训练师在数据标注员和AI PM之间,起到桥梁的作用
AI训练师需要和数据标注员紧密协作,把控好整个流程的输入规则和输出结果,最终输出标注准确的数据(供模型训练)
AI训练师需要和AI PM讨论需求,进而制定数据标注规则,并提出产品体验优化建议
能力模型
• 数据能力:了解科学的数据获取方法论,能运用数据处理工具,逻辑思维强
• 分析能力:基于产品的数据需求,及时发现、提炼问题特征,产出优化方案和建议
• 行业背景:熟悉公司行业领域知识,特别是语言或图像方面数据的特点
• 沟通能力:具备较强与不同岗位同事同频交流的能力,能通俗易懂的阐释专业术语信息
• AI技术理解力:能够厘清基本的AI概念,并了解其技术边界
• AI行业理解力:具备AI行业知识或相关产品运营经验,在此基础上能够预判行业趋势、深挖场景痛点、设计AI方案