OpenAI 的模型在评估眼部问题方面几乎与医生相匹配

通过免费更新随时了解情况

研究表明,OpenAI 最新的人工智能模型在分析眼睛状况方面几乎可以与专家医生相媲美,该研究强调了该技术在医学方面的潜力。

根据周三发表的一篇论文,这家微软支持的初创公司的 GPT-4 模型在评估眼部问题和建议治疗方面超过了除得分最高的专业医生之外的所有专家或取得了相同的分数。

眼科一直是将人工智能应用于临床并解决应用障碍的一个重点,例如模型通过创建虚构数据而产生“幻觉”的倾向。

研究结果论文的主要作者 Arun Thirunavukarasu 表示:“这项工作表明,这些大型语言模型在眼睛健康领域的知识和推理能力现在几乎与专家没有什么区别。” 发表 发表在 PLOS 数字健康杂志上。

“我们看到了回答相当复杂问题的能力,”他补充道。

该研究使用 87 种不同的患者场景来测试 GPT-4 相对于非专业初级医生以及见习和专家眼科医师的性能。 该论文称,该模型的表现优于初级模型,并取得了与许多专家相似的结果。

研究人员表示,这项研究值得注意,因为它将人工智能模型的能力与执业医生的能力进行比较,而不是与检查结果进行比较。 它还部署了生成式人工智能的广泛功能,而不是之前一些人工智能医学研究中测试的狭隘功能,例如通过患者扫描诊断癌症风险。

该模型在需要一阶回忆和需要高阶推理的问题上表现同样出色,例如插值、解释和处理信息的能力。

在剑桥大学临床学院学习期间进行这项研究的蒂鲁纳乌卡拉苏 (Thirunavukarasu) 表示:“我们现在正在以更加开放的方式进行训练,我们发现这些模型几乎具有未经过明确训练的能力。”药品。

现供职于牛津大学的蒂鲁纳乌卡拉苏 (Thirunavukarasu) 表示,可以通过在扩展数据集(包括管理算法、去识别化的患者笔记和教科书)上进行训练来进一步完善该模型。

他补充说,这需要在扩大来源数量和性质与确保信息保持良好质量之间取得“微妙的平衡”。 潜在的临床用途可能是对患者进行分类,或者是在接触专业医疗保健专业人员的机会有限的情况下。

人们对在临床环境中部署人工智能的兴趣飙升,有证据表明人工智能对诊断有贡献,例如标记医生可能错过的早期乳腺癌。 与此同时,考虑到错误诊断可能对患者造成的损害,研究人员正在努力解决如何管理严重风险的问题。

伦敦大学学院人工智能医学教授皮尔斯·基恩 (Pearse Keane) 表示,最新的研究“令人兴奋”,其利用人工智能来衡量专家表现的想法“非常有趣”。

基恩也隶属于伦敦莫菲尔德眼科医院,他同意在将这些技术引入临床之前还需要做更多的工作。

基恩引用了他去年的研究中的一个例子,其中他询问了一个关于眼睛黄斑变性的大型语言模型,结果它在答复中给出了“虚构”的参考资料。

“我们只需要平衡对这项技术的兴奋和潜在的巨大好处。 。 。 谨慎和怀疑,”他说。

视频:人工智能:对人类来说是福是祸? | FT科技

1713713204
#OpenAI #的模型在评估眼部问题方面几乎与医生相匹配
2024-04-17 18:00:59

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​