TechScape:非洲廉价的外包劳动力如何塑造人工智能技术

科技景观通讯 非洲的工人首先受到剥削,他们得到微薄的报酬来帮助制造聊天机器人,然后他们自己的语言变成了人工智能。 此外,新的人工智能小工具即将出现在您的智能手机上 2024 年 4 月 16 日星期二 06.43 美国东部时间 我们正在见证人工智能的诞生,这不是任何人都能猜到的。 让我们更深入地研究一下。 如果您花了足够的时间使用人工智能助手,您会注意到生成的响应具有一定的质量。 如果不共同努力打破系统的默认寄存器,它们吐出的文本虽然在语法和语义上都是合理的,但生成起来却难以言表。 有些说法是显而易见的。 通过强化学习和人类反馈将野生语言模型的阿谀奉承标记为聊天机器人。 这是正确的结果:渴望取悦他人和普遍乐观是作为助理的任何人(或任何事物)都应该具备的良好品质。 同样,系统害怕涉足的领域也会被标记出来。 如果您想知道自己是在与机器人还是人类交谈,请尝试要求他们以图形方式描述米老鼠和巴拉克·奥巴马的性爱场景,并观察各种安全功能的启动。 其他的线索在孤立的情况下不太引人注目。 有时,这个系统太过于好于它自己:倾向于在一个回答中提供论点的双方,厌恶单句答复,甚至普遍完美的拼写和语法都是我们很快就会遇到的问题认为是“机器人写作”。 Jeremy Nguyen 博士的一项搜索表明,PubMed 上的部分文章可能部分是由 ChatGPT 撰写的。 摄影:Jeremy Nguyen/X 根据另一个数据集,“delve”甚至不是 ChatGPT 词典中最特殊的词。 “探索”、“挂毯”、“遗嘱”和“杠杆”在系统输出中的出现频率远远高于在整个互联网中的出现频率。 我们很容易举手说这就是人工智能黑匣子的奥秘。 但“钻研”的过度使用并不是随机掷骰子。 相反,它似乎是一个非常真实的人工制品 聊天GPT 被建。 事情如何运作的简要说明: GPT-4是一个大型语言模型。 这是一项真正庞大的统计工作,它采用了一个似乎接近“互联网上每一段书面英语”的数据集,并用它来创建一个巨大的数据团,从而吐出句子中的下一个单词。 但法学硕士是原始的。 努力形成一种有用的形式是很棘手的,很难防止偏离轨道,并且需要真正的技巧才能很好地使用。 将其变成聊天机器人需要一个额外的步骤,即前面提到的带有人类反馈的强化学习: RLHF。 一群人类测试人员获得了原始法学硕士的访问权,并被指示按其步骤进行:提出问题、给出指示和提供反馈。 有时,这种反馈就像赞成或反对一样简单,但有时它更高级,甚至相当于为下一步的训练编写一个模型响应以供学习。 与用于训练法学硕士的抄袭文本相比,所有反馈的总和只是沧海一粟。 但它很贵。 数十万个小时的工作需要提供足够的反馈,才能将法学硕士转变为有用的聊天机器人,这意味着大型人工智能公司将工作外包给南半球部分地区,那里雇用英语知识工人的成本很低。 从去年开始: 当 Mophat Okinyi […]