OpenAI 的模型在评估眼部问题方面几乎与医生相匹配

通过免费更新随时了解情况 只需注册 人工智能 myFT Digest——直接发送到您的收件箱。 研究表明,OpenAI 最新的人工智能模型在分析眼睛状况方面几乎可以与专家医生相媲美,该研究强调了该技术在医学方面的潜力。 根据周三发表的一篇论文,这家微软支持的初创公司的 GPT-4 模型在评估眼部问题和建议治疗方面超过了除得分最高的专业医生之外的所有专家或取得了相同的分数。 眼科一直是将人工智能应用于临床并解决应用障碍的一个重点,例如模型通过创建虚构数据而产生“幻觉”的倾向。 研究结果论文的主要作者 Arun Thirunavukarasu 表示:“这项工作表明,这些大型语言模型在眼睛健康领域的知识和推理能力现在几乎与专家没有什么区别。” 发表 发表在 PLOS 数字健康杂志上。 “我们看到了回答相当复杂问题的能力,”他补充道。 该研究使用 87 种不同的患者场景来测试 GPT-4 相对于非专业初级医生以及见习和专家眼科医师的性能。 该论文称,该模型的表现优于初级模型,并取得了与许多专家相似的结果。 研究人员表示,这项研究值得注意,因为它将人工智能模型的能力与执业医生的能力进行比较,而不是与检查结果进行比较。 它还部署了生成式人工智能的广泛功能,而不是之前一些人工智能医学研究中测试的狭隘功能,例如通过患者扫描诊断癌症风险。 该模型在需要一阶回忆和需要高阶推理的问题上表现同样出色,例如插值、解释和处理信息的能力。 在剑桥大学临床学院学习期间进行这项研究的蒂鲁纳乌卡拉苏 (Thirunavukarasu) 表示:“我们现在正在以更加开放的方式进行训练,我们发现这些模型几乎具有未经过明确训练的能力。”药品。 现供职于牛津大学的蒂鲁纳乌卡拉苏 (Thirunavukarasu) 表示,可以通过在扩展数据集(包括管理算法、去识别化的患者笔记和教科书)上进行训练来进一步完善该模型。 他补充说,这需要在扩大来源数量和性质与确保信息保持良好质量之间取得“微妙的平衡”。 潜在的临床用途可能是对患者进行分类,或者是在接触专业医疗保健专业人员的机会有限的情况下。 人们对在临床环境中部署人工智能的兴趣飙升,有证据表明人工智能对诊断有贡献,例如标记医生可能错过的早期乳腺癌。 与此同时,考虑到错误诊断可能对患者造成的损害,研究人员正在努力解决如何管理严重风险的问题。 伦敦大学学院人工智能医学教授皮尔斯·基恩 (Pearse Keane) 表示,最新的研究“令人兴奋”,其利用人工智能来衡量专家表现的想法“非常有趣”。 基恩也隶属于伦敦莫菲尔德眼科医院,他同意在将这些技术引入临床之前还需要做更多的工作。 基恩引用了他去年的研究中的一个例子,其中他询问了一个关于眼睛黄斑变性的大型语言模型,结果它在答复中给出了“虚构”的参考资料。 “我们只需要平衡对这项技术的兴奋和潜在的巨大好处。 。 。 谨慎和怀疑,”他说。 视频:人工智能:对人类来说是福是祸? | FT科技 1713713204 #OpenAI #的模型在评估眼部问题方面几乎与医生相匹配 […]

前 OpenAI 领导者有在工作场所的人工智能中生存的简单技巧

但 OpenAI 前领导人扎克·卡斯 (Zack Kass) 告诉《商业内幕》,在人工智能可以熟练地编码、编写和分析数据的世界里,什么使我们成为“人类”可能比以往任何时候都更加重要。 这意味着倾向于人类活动的领域 仍然超过人工智能——就像批判性思维一样。 卡斯说,在未来几年,更重要的是我们“聘用律师不是看他们的速度有多快,而是看他们对问题的独特理解程度”。 他说,拥抱让你讨人喜欢的东西也很重要,因为你是其他人最终想与之共事的人。 “人工智能将使我们的大部分知识和技能商品化,”卡斯后来在电子邮件中写道。 因此,我们“勇气、远见、智慧、同理心”等“不变的人类品质”将变得更加重要。 当人工智能接管各级员工的任务时,这些品质也可以让你脱颖而出。 研究已经表明,人工智能必将成为工作场所的均衡器。 因此,卡斯说,员工应该强调他们的个人品质。 “在一个人人都很聪明的世界里,为什么有人会雇佣‘混蛋’呢?”他笑着说。 由可爱的人组成的员工队伍也可以提高公司的利润。 有工作朋友的人不仅更有可能留在自己的工作岗位上,而且工作效率更高、更投入、更快乐、更健康。

OpenAI 聘请首位驻印度官员 Pragya Misra,预计本月晚些时候上任:报告

据彭博社周五援引匿名消息人士的话报道,OpenAI 已聘请 39 岁的普拉亚·米斯拉 (Pragya Misra),他是该公司在印度的第一位官员,以处理政府关系。 OpenAI 尚未发表正式声明确认米斯拉女士的任命,但彭博社报道称,她将担任政府关系主管,并预计于 4 月底开始履行职责。 由于印度已开始 2024 年大选投票,美国人工智能公司和印度政府之间的中间人至关重要。 (欲了解当天的热门科技新闻, 订阅 到我们的技术通讯 Today's Cache) 2 月 12 日,这家由微软支持的人工智能初创公司与印度技术政策和民间社会代表进行了互动,专家和活动人士表达了对生成式人工智能被用来损害印度选举的担忧。 OpenAI 承认这些担忧,并表示即使升级了大型语言模型 ChatGPT 和文本到图像生成器 DALL-E,安全措施也已经到位。 今年,OpenAI 还推出了文本到视频生成器 Sora 以及文本到音频克隆模型 Voice Engine。 然而,两者都是在有限的测试基础上发布的,尚未公开发布。 OpenAI 首席执行官 Sam Altman 还表示,他于 2023 年 6 月与印度总理纳伦德拉·莫迪讨论了人工智能监管问题。 今年早些时候, 印度政府痛斥谷歌并指责其违反法律 在其聊天机器人 Gemini 回答了有关莫迪和法西斯主义的问题后。 2024-04-20 09:06:08 1713616130

使用 Azure OpenAI 进行患者转诊文档摘要

介绍  本文探讨了医疗保健行业如何利用生成式人工智能、大型语言模型 (LLM) 评估指标和机器学习来简化患者转诊流程。 延迟审查转诊文件可能会影响患者的治疗结果,及时诊断和治疗至关重要。 生成式人工智能摘要使医院能够有效地压缩转诊文件,加快患者入院和诊断速度,同时减少医生审查时间。 LLM 评估指标确保对摘要流程的信任,增强医生使用人工智能生成内容的信心。 想象一下以下场景: 在繁忙的医院环境中,专家乔恩·多伊 (Jon Doe) 医生收到一位危重病人的转诊。 通常,Jon Doe 医生会花几天时间阅读多份转诊文件,试图收集相关信息。 然而,通过实施由 Azure 技术支持的生成式 AI 摘要,Jon Doe 医生在几分钟内就收到了患者病史、症状和相关测试的简明摘要。 这一加速过程使 Jon Doe 医生能够及时评估情况并启动挽救生命的治疗,最终改善患者的治疗结果。 凭借法学硕士评估指标提供的保证,Jon Doe 博士相信人工智能生成的摘要,相信它准确地捕获了所有重要细节。 此场景说明了人工智能和机器学习技术如何彻底改变医疗保健,从而实现更快的决策和更好的患者护理。 建筑学 : 用例工作流程: 1. 数据来源 医疗保健中高效的患者转诊系统依赖于对不同来源的患者信息的访问,包括来自各种来源的手写笔记和数字化数据。 其中包括电子健康记录 (EHR) 系统,可实现转诊文件的安全电子传输,以及由健康信息服务提供商 (HISP) 促进的直接安全消息传递。 健康信息交换 (HIE) 网络允许在不同医疗保健实体之间无缝共享患者数据,而患者门户则在患者和提供者之间提供安全的文档交换。 采用 HL7 或 FHIR 等互操作性标准增强了系统之间的数据交换,并辅以远程医疗平台的集成以实现安全文档共享。 综合医疗保健系统中的医院受益于集中式患者信息管理。 分析这些不同的数据源为医生提供了全面的患者健康见解,指导入院前的治疗决策。 2. 数据摄取和暂存 数据摄取是将数据从不同来源移动到特定位置的过程。 […]

aiOla 的语音 AI 技术在行话识别方面优于 OpenAI 的 Whisper

aiOla 的模型可自动创建定制流程和工作流程,用于跨行业(例如制造、供应链和物流、制药等)进行报告和检查 以色列特拉维夫,2024 年 4 月 18 日 /美通社/ — 艾奥拉是一种人工智能驱动的技术,通过捕获语音数据实现业务工作流程自动化,宣布了语音识别领域的一个重要里程碑。 aiOla 的解决方案由新颖的关键词识别模型提供支持,在理解行业特定术语方面已经达到了人类的水平。 获得专利的 AdaKWS 模型在关键词识别方面实现了 95% 的准确率,超过了 OpenAI 业界领先的 Whisper 模型(88% 的准确率)。 关键词识别是语音识别的一个重要方面,它通过检测预定义的单词和短语来解决识别行话的问题。 “想象一下您的包裹到达时已损坏的快递递送情况。快递员需要使用描述情况的特定代码和首字母缩略词提交报告 – 这些代码和首字母缩略词就是关键字。行业术语无处不在,在许多领域,它主导着沟通,包括多达一半的员工讲话。”aiOla 首席执行官兼联合创始人 Amir Haramaty 说道。 “识别关键词的能力可以实现各行各业的日常流程自动化,从提交包裹损坏报告到完成食品制造工厂的安全检查,将言论转化为行动。” 该应用程序利用 aiOla 科学家团队开发的专有模型来识别语音中预定义的关键字列表。 这使得 aiOla 的解决方案能够立即适应任何行业的术语,而无需重新训练其人工智能模型。 在包含 16 种语言的关键字和行话检测基准上,Whisper 最大的模型的准确率达到 88%,而 aiOla 的模型准确率达到 95%。 此外,在最近由英语有声读物中难以检测的关键字组成的基准测试中,苹果研究人员团队的 CED 模型准确率达到 92.7%,而 aiOla 的 AdaKWS 准确率达到 95.1%。 […]

使用语义缓存优化 Azure OpenAI 应用程序

介绍 优化大型语言模型 (LLM) 成本和性能的方法之一是缓存来自 LLM 的响应,这有时称为“语义缓存”。 在本博客中,我们将讨论使用语义缓存的方法、好处、常见场景和关键注意事项。 什么是语义缓存? 缓存系统通常存储常用检索的​​数据,以便以最佳方式进行后续服务。 在法学硕士的背景下,语义缓存维护先前提出的问题和响应的缓存,使用相似性度量从缓存中检索语义相似的查询,并在相似性阈值内找到匹配时使用缓存的响应进行响应。 如果缓存无法返回响应,则可以从新的 LLM 调用返回答案。 语义缓存层的关键构建块: LLM 包装 用于添加集成和支持不同 LLM(Llama、OpenAI 等)的能力.,)。 生成嵌入 帮助生成用户查询的嵌入表示。 生成的嵌入通常保存在向量存储中。 A 矢量商店 用于持久化查询的嵌入并支持在查询调用时快速检索嵌入,它们可以是内存中的数据库或针对存储、索引和检索进行优化的专用向量数据库。 (例如,FAISS、Hnswlib、PGVector、Chroma、CosmosDB 等)。 缓存存储 保留来自 LLM 的响应,并在缓存命中时提供响应。 (例如 SQLite、Elasticsearch、Redis、MongoDB 等)。 相似度评估 模块使用相似性度量/距离将输入查询与基于嵌入的向量存储查询进行比较。 关键绩效指标/日志记录: 一些特定于缓存的 KPI 包括缓存命中率(缓存处理的请求/总请求)和延迟(处理要处理的查询和从缓存检索相应响应的时间)。 语义缓存的好处: 成本优化: 由于在不调用 LLM 的情况下提供响应,因此缓存响应可以带来显着的成本效益。 我们遇到过这样的用例,客户报告说,缓存层可以满足用户总查询的 20-30%。 延迟的改善: 众所周知,法学硕士在生成回复方面表现出较高的延迟。 这可以通过响应缓存来减少,只要查询是从缓存层应答的,而不是每次都调用 LLM。 缩放比例: 由于缓存命中响应的问题不会调用 LLM,因此配置的资源/端点可以自由回答用户未见过的/较新的问题。 当扩展应用程序以处理更多用户时,这会很有帮助。 […]

OpenAI 的 GPT 商店引发版权投诉

在过去的几个月里,Morten Blichfeldt Andersen 花了很多时间搜索 OpenAI 的 GPT 商店。 自一月份推出以来,定制机器人市场已经充满了大量有用的、有时甚至是古怪的人工智能工具。 卡通发电机旋转起来 纽约人– 风格的插图和生动的动漫剧照。 编程和写作助手提供了编写代码和散文的快捷方式。 还有一个 颜色分析机器人, A 蜘蛛标识符,还有一位约会教练打电话给 里兹GPT。 然而,Blichfeldt Andersen 只寻找一种非常特殊类型的机器人:那些未经许可而基于其雇主受版权保护的教科书构建的机器人。 Blichfeldt Andersen 是丹麦教科书供应商 Praxis 的出版总监。 该公司一直在拥抱人工智能并创建了自己的 定制聊天机器人。 但目前GPT商店里正在进行一场打地鼠游戏,而拿着木槌的人就是Blichfeldt Andersen。 “我一直在亲自寻找侵权行为并进行举报,”Blichfeldt Andersen 说。 “他们不断出现。” 他怀疑罪魁祸首主要是年轻人,他们上传教科书上的材料,创建定制机器人与同学分享,而且他只在 GPT 商店中发现了一小部分侵权机器人。 “冰山一角”,Blichfeldt Andersen 说道。 在 GPT 商店中很容易找到机器人,其描述表明它们可能以某种方式利用受版权保护的内容,正如 > 所言 著名的 在最近的一篇文章中声称 OpenAI 的商店充斥着“垃圾邮件”。 在某些情况下,未经许可使用受版权保护的材料是允许的,但在其他情况下,权利持有人可以采取法律行动。 《连线》杂志发现了一个名为 Westeros Writer 的 GPT,声称可以“像乔治·R·R·马丁 […]

OpenAI 让 ChatGPT 对付费用户来说更快、更智能

OpenAI 通过社交媒体平台 X 宣布,他们已经为付费客户更新了名为 GPT-4 Turbo 的大型语言模型 (LLM)。 GPT-4 Turbo 是 GPT-4 的改进模型,GPT-4 通常被更广泛的社区称为生成式 AI,它提供对话。 发射 之间星期六(13/4/2024),新模型带来了写作、数学、逻辑推理和编码方面的改进。 “我们的新 GPT-4 Turbo 现已可供 ChatGPT 付费客户使用。 “我们正在提高写作、数学、逻辑推理和编码方面的技能,”X @OpenAI 帐户的公告称。 为了能够体验 GPT-4 Turbo 的最大性能,用户必须订阅,并且访问权限仅限于 Plus、Team 和 Enterprise 订阅包。 这项付费服务​​的起价为每月 20 美元或相当于 322,356 印尼盾。 除此之外,ChatGPT 通过 GPT-4 Turbo 提供的最新响应来自截至 2023 年 12 月流通的数据。 此外,在训练时,GPT-4 Turbo 使用截至 2023 年 4 月的最新数据。(ant/sya/bil/faz) […]

OpenAI 推出升级版 GPT-4 Turbo 模型至 ChatGPT 的高级级别

OpenAI 已将其 GPT-4 Turbo 大语言模型的升级版本推出到 ChatGPT 的付费版本。 该公司在周四晚些时候宣布了这一更新 邮政 “我们的新 GPT-4 Turbo 现已向付费 ChatGPT 用户开放,”OpenAI 详细介绍道。 “我们提高了写作、数学、逻辑推理和编码的能力。” GPT-4 是 ChatGPT 服务推出时支持的模型的后继者,于去年 3 月首次亮相。 与前代相比,第四代LLM在推理任务方面表现更好,并且不太可能输出错误信息。 六个月前,OpenAI 推出了名为 GPT-4 Turbo 的升级版本,响应质量再次提高。 此后,该公司发布了对该模型的多项改进。 本周向 ChatGPT 付费层推出的版本 gpt-4-turbo-2024-04-09 是最新版本。 OpenAI 使用 Simple Evals 比较了这两个模型,Simple Evals 是一种内部开发的基准测试工具,已在 GitHub 上开源。 该工具通过解决涵盖数十个主题的六组问题来评估法学硕士输出的准确性。 据 OpenAI 称,gpt-4-turbo-2024-04-09 在所有六个问题集上的表现均优于其前身。 新的法学硕士在涉及数学问题的单独基准测试中也实现了类似的准确性提高。 在 OpenAI 评估的其他四个问题集中,该模型显示出几个百分点的改进。 OpenAI 表示,ChatGPT […]

Azure OpenAI 和呼叫中心现代化

背景 关于这个问题已经写了很多 强大的用例 由 Azure OpenAI 启用。 其中一个例子是现代呼叫中心的转型,因为其操作员评估使用人工智能和自然语言处理来优化流程和改善客户交互的潜力。 呼叫中心面临着呼叫量大、等待时间长和座席流动率高的挑战。 尽管现代呼叫中心中已经存在许多工具,但利用大语言模型 (LLM) 和生成式 AI 的 Azure OpenAI 部署有潜力通过以下方式提高运营效率和客户满意度: 更快地为呼叫中心座席提供更准确的信息。 协助更复杂的查询。 提供呼叫中心交互的情绪分析,以确保客户保留。 在本文中,我们描述了一种部署,其中 Azure OpenAI 作为协助人工代理的平台。 会话聊天机器人、交互式语音应答 (IVR) 和客户关系管理 (CRM) 等现有系统均保留并补充新系统。 现代呼叫中心架构 虚构组织 Contoso 运营一个呼叫中心来支持其业务。 它决定使用 Azure OpenAI 来改善其客户服务并减少处理客户呼叫的成本和时间。 考虑人工智能解决方案很有用 三层功能 它将端到端的任务组合在一起。 部署架构 这三个 AI 功能层构成了 Contoso 现代呼叫中心架构的基础,如下所示: 人工智能平台: 这包括 Azure OpenAI (AOAI) 和 Azure AI 搜索的基线法学硕士。 […]