据知情人士爆料和内部沟通文件显示,今年3月,30余名帮助培训爆火聊天机器人(11.190, -0.06, -0.53%)ChatGPT背后语言模型的派遣工被解雇。
Slack内部聊天截图显示,截至3月16日,总部位于旧金山的外包公司Invisible Technologies解雇了31名派遣工。不过,OpenAI在其整个公司范围内仍在继续招聘。
截图还显示,数百名被称为“高级人工智能数据训练师”的Invisible Technologies公司派遣工与OpenAI合作,帮助后者训练其GPT聊天机器人。一位派遣工表示,该公司的人工智能数据培训师负责提高模型的编码技能,增强它们的创造性写作能力,或者训练它们拒绝对某些话题做出响应。由于签署了保密协议,这名派遣工要求保持匿名,不过知情人证实了他的身份和就业情况。
Invisible Technologies公司运营副总裁卡姆伦·帕里兹班(Kamron Palizban)在3月份的一次全体员工会议上谈到了裁员问题。他在被泄露的会议录音中表示,由于业务需求发生变化,OpenAI希望减少派遣工数量。帕里兹班在会议上还说,许多被解雇派遣工从事的项目没有为OpenAI提供足够高的投资回报。
OpenAI大幅削减派遣工数量
Invisible Technologies与OpenAI的关系让人们得以一窥这家ChatGPT制造商的数据训练情况。在很大程度上,OpenAI始终对这些训练保密。
在OpenAI与Invisible Technologies的合同调整之前,有报道称前者连续六个月增加员工数量。知情人士表示,截至今年1月,OpenAI已在东欧和拉丁美洲等地雇佣了近1000名数据标注派遣工。
就在Invisible Technologies裁员两个月前,微软刚刚向OpenAI注资100亿美元。但Invisible Technologies并不是唯一一家与OpenAI合作的外包企业。
《时代》周刊的一项调查显示,2022年2月,同样位于旧金山的外包公司Sama在得知其在肯尼亚的数据标注员工正在审查性虐待、仇恨言论和暴力等有害内容后,终止了与OpenAI的合作关系。
在给《时代》周刊的一份声明中,OpenAI发言人解释称:“对有害的文本和图像进行分类和过滤,是将训练数据中包含的暴力和色情内容数量降至最低的必要步骤,并有助于创建可以检测有害内容的工具。”
人工智能训练师的工作
根据Invisible Technologies公司派遣工的说法,人工智能训练师最基本的职责包括审查人工智能与其用户之间的对话,以识别潜在的非法、侵犯隐私、攻击性或充满错误的消息。接受采访的派遣工这样描述了他们的日常生活:
开始轮班后,他们首先要打开内部工作浏览器,查看团队的任务清单。他们可能会点击这样的任务:“在禁止浏览的情况下就一个随机话题进行对话”,然后在消息框中输入一个查询。
提交查询后,OpenAI的模型将生成四个响应。派遣工通过打开下拉菜单并选择存在的错误类型,如事实错误、拼写或语法错误,抑或是存在骚扰行为,以此来评估每个响应。然后,派遣工将错误的严重程度分为一到七级,其中七级代表“基本完美”的答案。
接下来,派遣工必须精心设计一个完美的回应,并提交以示完成任务。派遣工表示,结果将被发送给OpenAI和Invisible Technologies公司的质量检查员。对于接下来的每个任务,都需要不断重复这个流程。
Invisible Technologies运营副总裁卡姆伦·帕里兹班在会议中提到OpenAI时表示:“他们正处在这样一个阶段:即将对自己的发展方向有更多的清晰认识。”
Invisible Technologies合伙人兼运营经理格蕾丝·马特利奇(Grace Matelich)在录制的会议上表示,该公司根据完成任务的“质量”和“吞吐量”等绩效指标解雇了表现不佳的派遣工。
马特利奇称,表现不佳的派遣工以及那些被录用但没有“达到认证门槛”的派遣工都被解雇,不过有些人被允许选择转移到不同的OpenAI团队。他还说:“如果你们今天还在这里,我想让你们知道,这是因为我相信你们有能力出色地完成任务。”
总结:
本来是OpenAI正常的内部工作人员调整,但是因为涉及到爆火的OpenAI的聊天机器人ChatGPT,所以让人产生好奇,并引发关注。这也无形中揭开了人工智能训练师的一层神秘面纱。
自ChatGPT问世以来,全世界都陷入了疯狂,用过它的人无不在感叹它的神通广大。从普通用户到谷歌、微软、百度、阿里等大小公司,再到各路资本,大家仿佛都陷入了“错失恐惧”,总担心自己要是没用过这玩意,就会损失N个小目标或者会被时代无情地抛弃。各种信息反馈ChatGPT好处很多,不过,要是对它报以100%的信任,ChatGPT中的漏洞百出,也会给你带来麻烦。
因此人工智能训练师的工作就显得非常重要。按照Invisible Technologies公司派遣工的说法,人工智能训练师最基本的职责包括审查人工智能与其用户之间的对话,以识别潜在的非法、侵犯隐私、攻击性或充满错误的消息。不过从ChatGPT用户角度看,用户的问题可能是海量的,那么人工智能训练师能做到海量的问题检验吗?恐怕不能。
引用来自ChatGPT的一段话:ChatGPT是一种基于深度学习技术的自然语言处理模型,它的回答是根据大规模语料库的训练数据得出的。虽然它在一定程度上可以反映当下社会的主流价值观,但它的回答仅仅是基于数据的预测结果,并不一定代表绝对的真实情况,也不应该被视为某种官方的说法或意见。
由此可见,什么样的人工智能训练师者是好的训练师,还真的很难说。因为人工智能训练师者的训练本身就有局限。OpenAI裁员也说明了训练师这个职业很难达到满意。