病毒复杂的社会生活

不完整的病毒无论采用哪种策略复制,结果都是一样的。 这些病毒不会付出合作成本,即使它们利用了其他病毒的合作。 迪亚斯-穆尼奥斯说:“作弊者本身的表现很差,但与另一种病毒相比,它的表现更好,如果有很多作弊者,就没有人可以利用。” “从进化的角度来看,这就是定义作弊所需的一切。” 该定义的最后部分提出了一个难题。 如果作弊者如此成功——而且确实如此——他们应该让病毒灭绝。 随着一代又一代的病毒从旧细胞中爆发出来并感染新细胞,作弊者应该会变得越来越普遍。 它们应该不断复制,直到功能性病毒消失。 如果没有留下任何功能性病毒,作弊者就无法自行复制。 整个病毒种群都应该被遗忘。 当然,流感等病毒显然正在逃脱这种迅速灭绝的命运,因此它们的社交生活肯定不仅仅是作弊的死亡螺旋。 卡罗莱纳·洛佩兹圣路易斯华盛顿大学医学院的一位病毒学家认为,一些看似作弊的病毒实际上可能在病毒社会中发挥着更良性的作用。 它们没有利用其他病毒,而是合作,帮助它们茁壮成长。 洛佩兹说:“我们将他们视为社区的一部分,每个人都发挥着关键作用。” 预防倦怠 洛佩斯于 2000 年代初开始进入社会病毒学领域,当时她研究仙台病毒(一种感染小鼠的病原体)。 研究人员多年来就知道仙台病毒的两种毒株表现不同。 其中一种名为 SeV-52,能够逃避免疫系统的注意,从而使病毒引起大规模感染。 但感染另一种菌株 SeV-Cantell 的小鼠却建立了迅速、强大的防御机制,帮助它们迅速康复。 洛佩兹和她的同事发现,不同之处在于 SeV-Cantell 产生了许多不完整的病毒。 不完整的病毒是如何触发小鼠的免疫系统的? 经过一系列实验后,洛佩兹和她的同事们证实,不完整的病毒会导致其宿主细胞 启动警报系统。 这些细胞产生一种称为干扰素的信号,让邻近的细胞知道入侵者已经到来。 这些细胞可以防御病毒,并防止感染像野火一样通过周围组织蔓延。 卡罗莱纳·洛佩兹 (Carolina López) 假设,虽然不完整的病毒可能会在特定细胞内作弊,但它们的总体效果(控制感染传播)可能会使整个病毒群落受益。照片:由马特·米勒/华盛顿大学医学院提供 2024-05-19 06:00:00 1716105708 #病毒复杂的社会生活

大型语言模型的新兴能力只是海市蜃楼

原来的版本 的 这个故事 出现在 广达杂志。 两年前,在一个名为 超越模仿游戏基准或 BIG-bench,450 名研究人员编制了一份包含 204 项任务的列表,旨在测试 大语言模型,为 ChatGPT 等聊天机器人提供支持。 在大多数任务中,随着模型规模的扩大,性能可预测且平稳地提高——模型越大,性能就越好。 但在其他任务中,能力的提升并不顺利。 性能一度保持在零附近,然后性能猛增。 其他研究也发现了类似的能力飞跃。 作者将此描述为“突破性”行为; 其他研究人员将其比作物理学中的相变,就像液态水冻结成冰一样。 在 一篇论文 研究人员于 2022 年 8 月发表的论文指出,这些行为不仅令人惊讶,而且不可预测,它们应该为围绕人工智能不断发展的对话提供信息 安全、潜力和风险。 他们称这些能力为“涌现的,”这个词描述了只有在系统达到高度复杂性时才会出现的集体行为。 但事情可能没那么简单。 一篇新论文 斯坦福大学的三名研究人员认为,这些能力的突然出现只是研究人员衡量法学硕士表现方式的结果。 他们认为,这些能力既不是不可预测的,也不是突然出现的。 “这种转变比人们想象的更容易预测,”他说 山美光耀,斯坦福大学计算机科学家,该论文的高级作者。 “对出现的强烈主张与我们选择的衡量方式有关,与模型正在做什么有关。” 由于这些模型变得如此庞大,我们现在才看到并研究这种行为。 大型语言模型通过分析大量数据进行训练 文本数据集——来自在线资源的单词,包括书籍、网络搜索和维基百科——以及查找经常一起出现的单词之间的链接。 大小是用参数来衡量的,大致类似于单词连接的所有方式。 参数越多,法学硕士可以找到的联系就越多。 GPT-2 有 15 亿个参数,而支持 ChatGPT 的 LLM GPT-3.5 使用了 3500 亿个参数。 GPT-4,于 2023 年 […]

选择性遗忘可以帮助人工智能更好地学习

原来的版本 的 这个故事 出现在 广达杂志。 一组计算机科学家创建了一个 更灵活、更灵活的类型 的机器学习模型。 诀窍是:它必须定期忘记它所知道的事情。 虽然这种新方法不会取代支撑最大应用程序的庞大模型,但它可以更多地揭示这些程序如何理解语言。 这项新研究标志着“该领域的重大进步”, 权济权,韩国基础科学研究所的人工智能工程师。 当今使用的人工智能语言引擎主要由 人工神经网络。 网络中的每个“神经元”都是一个数学函数,它从其他此类神经元接收信号,运行一些计算,并通过多层神经元发送信号。 最初,信息流或多或少是随机的,但通过训练,神经元之间的信息流随着网络适应训练数据而改善。 例如,如果人工智能研究人员想要创建一个双语模型,她会用大量两种语言的文本来训练该模型,这将调整神经元之间的连接,从而将一种语言的文本与等效的文本相关联。对方的话。 但这个训练过程需要大量的计算能力。 如果模型不能很好地工作,或者用户的需求后来发生变化,就很难适应它。 “假设你有一个包含 100 种语言的模型,但想象一下你想要的一种语言没有被覆盖,”说 米克尔·阿泰克斯是这项新研究的合著者,也是人工智能初创公司 Reka 的创始人。 “你可以从头开始,但这并不理想。” Artetxe 和他的同事试图规避这些限制。 几年前、Artetxe 和其他人用一种语言训练了一个神经网络,然后删除了它对单词构建块(称为标记)的了解。 这些存储在神经网络的第一层,称为嵌入层。 他们保留了模型的所有其他层。 擦除第一种语言的标记后,他们在第二种语言上重新训练模型,用该语言的新标记填充嵌入层。 尽管模型包含不匹配的信息,但重新训练仍然有效:模型可以学习和处理新语言。 研究人员推测,虽然嵌入层存储了该语言中使用的单词的特定信息,但网络的更深层次存储了有关人类语言背后的概念的更多抽象信息,从而帮助模型学习第二语言。 “我们生活在同一个世界。 我们用不同的语言用不同的词来概念化相同的事物,” Yihong Chen,最近论文的主要作者。 “这就是为什么模型中有同样的高级推理。 苹果是一种甜甜多汁的东西,而不仅仅是一个词。”

科学家刚刚发现了一种新型磁性

研究合著者说:“我们在日常生活中之所以具有磁性,是因为电子交换相互作用的强度。” 阿塔奇·伊玛莫鲁,也是量子电子研究所的物理学家。 然而,正如长冈在 20 世纪 60 年代提出的理论那样,交换相互作用可能并不是使材料具有磁性的唯一方法。 长冈设想了一种方形的二维晶格,其中晶格上的每个位置只有一个电子。 然后他计算出了如果在特定条件下移除其中一个电子会发生什么。 当晶格中剩余的电子相互作用时,缺失电子所在的空穴将在晶格周围滑动。 在长冈的设想中,当电子自旋全部对齐时,晶格的整体能量将达到最低。 每个电子配置看起来都一样——就好像电子是世界上最无聊的瓷砖中的相同瓷砖一样 滑动瓷砖拼图。 这些平行自旋反过来又会使材料呈现铁磁性。 当两个扭曲的网格形成图案时 伊玛莫鲁和他的同事们预感到,他们可以通过试验单层原子片来创造长冈磁性,这些原子片可以堆叠在一起形成复杂的莫尔图案(发音为 姆瓦雷)。 在原子薄的层状材料中,莫尔图案可以从根本上改变电子以及材料的行为方式。 例如,2018 年,物理学家 Pablo Jarillo-Herrero 和他的同事 证明了 当两层石墨烯通过扭曲抵消时,两层石墨烯堆叠获得了超导能力。 阿塔克·伊玛莫格鲁和他的同事怀疑他们新合成的材料可能会表现出一些奇怪的磁性,但他们并不确切知道他们会发现什么。 由阿塔克·伊玛莫鲁提供 此后,莫尔材料成为一种引人注目的新系统,用于研究磁性,与过冷原子云和铜酸盐等复杂材料一起放置。 “莫尔材料为我们提供了一个基本上合成和研究电子多体态的游乐场,”伊玛莫格鲁说。 研究人员首先合成了一种由半导体二硒化钼和二硫化钨单层材料组成的材料,它们属于一类材料 过去的模拟 暗示可以表现出长冈式的磁力。 然后,他们将不同强度的弱磁场施加到莫尔材料上,同时跟踪材料的电子自旋有多少与磁场对齐。 然后,研究人员重复这些测量,同时在材料上施加不同的电压,这改变了莫尔晶格中电子的数量。 他们发现了一些奇怪的事情。 仅当该材料的电子数比晶格位点多 50% 时,该材料才更容易与外部磁场对齐,即表现出更强的铁磁性。 当晶格中的电子少于晶格位点时,研究人员没有看到铁磁性的迹象。 如果标准长冈铁磁性发挥作用,这与他们期望看到的情况相反。 然而,该材料正在磁化,交换相互作用似乎并没有驱动它。 但长冈理论的最简单版本也没有完全解释其磁性。 当你的东西被磁化并且你有点惊讶时 最终,它归结为运动。 电子通过在空间中扩散来降低其动能,这可能导致描述一个电子量子态的波函数与其相邻电子的量子态重叠,从而将它们的命运结合在一起。 在该团队的材料中,一旦莫尔晶格中的电子多于晶格位点,当多余的电子像雾气穿过百老汇舞台一样离域时,材料的能量就会下降。 然后它们与晶格中的电子快速配对,形成称为双布朗的双电子组合。 这些流动的额外电子以及它们不断形成的双布朗无法在晶格内离域和扩散,除非周围晶格位置的电子都具有对齐的自旋。 随着材料不懈地追求其最低能量状态,最终的结果是双布朗往往会产生小的、局部的铁磁区域。 达到一定阈值时,穿过晶格的双倍子越多,材料的铁磁性就越明显。 1706448398 2024-01-28 13:00:00 #科学家刚刚发现了一种新型磁性