GPT-4 在青光眼、视网膜管理方面与眼科医生相匹配

经过 仙妮亚·肯尼迪 2024 年 2 月 23 日 – 西奈山纽约眼耳医院 (NYEE) 的研究人员 证明了 OpenAI 的生成式预训练模型 4 (GPT-4) 在青光眼和视网膜疾病的诊断和治疗方面可以与眼科医生相媲美,或者在某些情况下优于眼科医生。 这 学习,本周发表于 美国医学会眼科,试图通过确定这样的工具与人类专家相比是否可以提供完整、准确的反应来评估大语言模型(LLM)在眼科亚专业中的效用。 研究小组首先招募了来自西奈山伊坎医学院眼科的 15 名参与者,其中包括 12 名主治医生和 3 名高级实习生。 然后,参与者和 GPT-4 被问到了 20 个常见的患者问题,这些问题来自美国眼科学会提供的一组视网膜和青光眼相关问题。 你更深 还随机选择了来自西奈山附属诊所的 20 例无法识别的青光眼和视网膜病例进行分析。 使用李克特量表评估参与者和聊天机器人响应的完整性和准确性。 总体而言,法学硕士回答的准确性和完整性与眼科医生的回答相匹配或优于眼科医生。 对于视网膜问题,该工具在准确性方面与专家相当,但在完整性方面超过了专家。 GPT-4 在青光眼问题上取得了卓越的表现,在这两个指标上都优于人类。 “GPT-4 在我们的研究中的表现令人大开眼界,”主要作者、NYEE 眼科住院医师 Andy Huang 医学博士在新闻稿中说道。 “我们认识到这一领域的巨大潜力 [artificial intelligence] 从我们开始测试系统的那一刻起,我们就很着迷地发现 GPT-4 不仅可以帮助,而且在某些情况下可以匹配或超过经验丰富的眼科专家的专业知识。” “人工智能尤其令人惊讶的是,它能够熟练地处理青光眼和视网膜患者病例,与人类医生以临床记录格式提出的诊断和治疗建议的准确性和完整性相匹配,”资深作者、FARVO […]

GPT-4 开发者工具无需人工帮助即可破解网站

一些人工智能可能能够在没有任何人类帮助的情况下入侵网站 Ole.CNX/Shutterstock OpenAI的人工智能模型 GPT-4 研究人员发现,它能够在没有人类帮助的情况下侵入网站并从在线数据库中窃取信息。 这表明没有黑客专业知识的个人或组织可以释放人工智能代理来进行网络攻击。 “你实际上不需要了解任何东西 – 你可以让代理自行破解网站,”说 Daniel Kang 在伊利诺伊大学厄巴纳-香槟分校。 “我们认为这确实减少了……所需的专业知识。 1708625849 #GPT4 #开发者工具无需人工帮助即可破解网站 2024-02-22 17:00:59

我将复杂的代码库放入单个 120K 令牌提示中,并提出了 7 个问题 GPT-4 和 Gemini 1.5。 这是结果! :奇点

我是作者 HVM1,目前正在更新为 HVM2。 这是两个实现并行 inet 运行时的复杂代码库; 基本上,硬编译器的东西。 用户 @SullyOmarr 获得 Gemini 1.5 访问权限的 X 上的人善意地向我提供了提示。 因此,我将两个 HVM 代码库连接成一个 120K 令牌文件,并向 Gemini 和 GPT-4 提出了 7 个问题。 这是完整的结果。 1. 哪个基于类项演算,哪个基于原始交互组合器? 这是基本信息,在很多地方都有重复,所以应该不难。 确实,两人都做对了。 领带。 2. 每个的语法是如何工作的? 提供例子。 Gemini 的 HVM1 语法完全正确。 这是一种熟悉的、类似 Haskell 的语法,所以没什么大不了的; 但 Gemini 也理解 HVM2 的 raw-inet IR 语法背后的逻辑,这是令人兴奋的,因为它是外星人的,不像它在训练期间看到的任何东西。 不过,提供的 inet 样本是错误的,但这并没有明确要求(并且将是相当 AGI 级别的,说实话)。 […]

科大讯飞声称其最新版本的 AI 模型在某些指标上与 GPT-4 Turbo 一样强大 · 动点科技

中国人工智能开发商科大讯飞周二推出了升级版的SparkDesk模型,并声称其在语言理解和数学等指标上优于GPT-4 Turbo,而其多模态理解能力已达到OpenAI最先进模型的91%。 。 这家总部位于合肥的公司没有具体说明其索赔所使用的判断标准或方式。 据科大讯飞微信公众号发布的新闻稿称,LLM被命名为SparkDesk V3.5,是“第一个由国内算力平台训练的基础模型”。 该平台由科大讯飞和华为于10月联合推出。 [“>iFlytek, in Chinese] 有关的 1706742419 #科大讯飞声称其最新版本的 #模型在某些指标上与 #GPT4 #Turbo #一样强大 #动点科技 2024-01-31 09:57:04

Meta 免费的 Code Llama AI 编程工具缩小了与 GPT-4 的差距

Meta 对其代码生成 AI 模型的最新更新, 代码骆驼 70B,是“迄今为止最大、性能最好的模型”。 Code Llama 工具于 8 月推出 并且免费用于研究和商业用途。 根据 Meta 的 AI 博客上的一篇文章,Code Llama 70B 可以比以前的版本处理更多查询,这意味着开发人员可以在编程时向其提供更多提示,并且可以更加准确。 Code Llama 70B 在 HumanEval 基准测试中的准确率达到 53%,比 GPT-3.5 的 48.1% 表现更好,更接近 67% 一篇 OpenAI 论文 (PDF) 报告了 GPT-4。 Code Llama 基于 Llama 2 构建,可帮助开发人员根据提示创建代码字符串并调试人工编写的工作。 去年秋天,Meta 同时推出了另外两款 Code Llama 工具,Code Llama – Python 和 Code Llama […]

微软在 Copilot 中提供功能强大的 GPT-4 免费试用

微软的一项重大举措是免费提供 ChatGPT Plus,而这在过去是要花钱的。 这在人工智能领域是一件大事。 微软最近更新了 Bing Chat, 重新命名 去年 11 月,Copilot 推出了 OpenAI 最新的大语言模型 (LLM) GPT-4-Turbo。 值得注意的是,该版本的模型此前仅适用于 ChatGPT Plus 订阅者,他们每月支付 20 美元(约 15.70 英镑)。 顾名思义,Plus 模型可以响应更复杂的查询。 1. 在 Microsoft Edge 中打开 Copilot – Edge 可在 Windows 上本地使用。 – 如果您使用的是 macOS,则可以免费下载。 然后通过单击右上角的图标在任何网页上打开 Copilot。 注意:选择创意模式以使用 GPT-4 (Turbo) pic.twitter.com/JhdQ8UgiCE — 斯里克森·雷迪 (@srikerthanreddy) 2024 年 1 月 12 日 […]