让人工智能更“懂”人类

速读：电脑屏幕上，一款语言类人工智能大模型正在总结小说《红楼梦》第四回的内容。蔡川军毕业于重庆邮电大学计算机专业，目前是一名人工智能大模型训练师。当人们使用人工智能生成图片时，大模型能否理解“穿着西装的男人”“穿衣风格帅气的女生”等指令，给出令人满意的反馈，就看训练师的标注质量。他的日常工作就是通过标注数据、评判结果，让大模型生成的内容越来越精准。午休过后，蔡川军开始进行机器视觉大模型的标注工作。

2024-11-18 09:38:28 来源：人民日报

上午9时，重庆市渝北区菲利信科技有限公司的办公室内，25岁的蔡川军开始了一天的工作。电脑屏幕上，一款语言类人工智能大模型正在总结小说《红楼梦》第四回的内容。蔡川军发现，总结中缺少了几个重要剧情，便只给了这条结果3分，并在备注栏中将其缺漏一一列出。

蔡川军毕业于重庆邮电大学计算机专业，目前是一名人工智能大模型训练师。他的日常工作就是通过标注数据、评判结果，让大模型生成的内容越来越精准。

一个成熟的人工智能大模型，算法、算力、数据3方面缺一不可。其中，大量高质量的数据有助于不断提高大模型的准确率，这离不开训练师的努力。他们通过清洗、整合、标注等操作，生成满足机器学习训练要求的可读数据编码。

蔡川军这一上午的工作内容，是训练人工智能全文摘要功能，对大模型的摘要结果进行打分和评价。大模型在收到训练师的反馈后，会以此调整算法参数权重，不断优化生成结果。对普通用户而言，随着大模型不断优化，他们会发现人工智能越来越“懂”人类。

午休过后，蔡川军开始进行机器视觉大模型的标注工作。具体来说，他需要以自己的审美，对资料库中的服饰图片评分，并对其风格进行判断。

“这也是数据标注的一种，我如何标注图片，人工智能就如何认识这些数据。”蔡川军一边点击鼠标一边说。当人们使用人工智能生成图片时，大模型能否理解“穿着西装的男人”“穿衣风格帅气的女生”等指令，给出令人满意的反馈，就看训练师的标注质量。

“训练师的工作分为标注和质检两类，标注质量较高且稳定的训练师，就能负责质检任务。”菲利信科技员工赵杨说。2019年进入公司的赵杨，刚开始也是一名训练师，经过多个项目的历练，经验丰富的他成长为培训师，负责新员工的培训、标注标准制定等工作。

去年蔡川军初入公司时，接受了为期两周的培训，赵杨就为他授过课。“课程主要包括系统操作、数据分类、标注规则等，帮助新入职员工快速上手。”赵杨说，“做人工智能大模型训练师，我们更看重一个人的专业知识储备。”

没有经过训练的大模型就像一张白纸，需要不断投喂优质数据才能成长，这便对训练师的专业知识储备提出了更高要求。“例如，与医疗相关的大模型，我们会让有医学背景的员工来训练数据。”赵杨说。

除了专业知识，这项工作有时对训练师的性格也有要求。“训练师的审美、性格、思考方式等，都会对人工智能产生影响。例如一款大模型的定位是用户的‘伙伴’，我们就会通过性格测试，优先让具有温柔、开朗等性格特征的员工参与。”赵杨介绍。

在菲利信科技，像蔡川军、赵杨这样的训练师有1500多名，他们通过标注数据、评判结果，让大模型生成的内容越来越精准，助力人工智能行业发展。

近年来，渝北区人力资源和社会保障局持续强化数字人才培育，突出服务产业、就业与人才3个导向，促进产业链、培训链与就业链衔接。近3年，全区累计从业人员达3万人，覆盖人工智能、大数据、机器人等前沿领域。

《人民日报》（2024年11月18日10版）