国内首个大模型数据标注中心启动:数百名大模型数据标注师


(资料图片仅供参考)

百度智能云(海口)人工智能基础数据产业基地近日在海口市秀英区正式启动运营。这是百度智能云与海口市政府合作共建的国内首个大模型数据标注中心。据官方介绍,大模型正处在产业落地前期,高质量的数据是实现大模型产业化的关键要素。对于以ChatGPT、文心一言为代表的生成式AI,海量的数据训练、人工标注、指令微调、基于人类反馈的强化学习(RLHF)等环节,可以让大模型与人类价值观、思维方式不断对齐,使大模型更加可用。为保障数据标注质量,百度智能云搭建了全流程数据服务人才梯队,海口数据标注基地现拥有数百名专职大模型数据标注师,标注师的本科率达到100%。百度智能云方面表示,目前已经在全国与各地政府合作,共建了十多个数据标注基地,累计为当地提供超过1.1万个稳定就业岗位,间接带动5万人就业。

关键词: