无线接收器可阻挡干扰,提高移动设备性能 | MIT 新闻

从 5G 手机到自动驾驶汽车传感器,高速无线通信设备日益普及,导致无线电波越来越拥挤。这使得屏蔽可能影响设备性能的干扰信号的能力变得更加重要,也更具挑战性。 考虑到这些和其他新兴应用,麻省理工学院的研究人员展示了一种新的毫米波多输入多输出 (MIMO) 无线接收器架构,它可以处理比以前的设计更强的空间干扰。MIMO 系统有多个天线,使它们能够从不同方向发送和接收信号。它们的无线接收器可以在不需要的信号被放大之前尽早感知并阻止空间干扰,从而提高性能。 这种 MIMO 接收器架构的关键是一种可以瞄准和消除无用信号的特殊电路,称为非互易移相器。通过制作一种可重构、低功耗且紧凑的新型移相器结构,研究人员展示了如何使用它在接收器链的早期消除干扰。 他们的接收器可以阻挡高达一些类似设备的四倍的干扰。此外,可以根据需要打开和关闭干扰阻挡组件以节省能源。 在手机中,这样的接收器可以帮助缓解可能导致 Zoom 通话或视频流缓慢且不流畅的信号质量问题。 “我们试图用于新 5G 和 6G 系统的频率范围已经得到了大量利用。因此,我们试图添加的任何新功能都应该已经安装了这些干扰缓解系统。在这里,我们已经证明,在这种新架构中使用非互易移相器可以提高我们的性能。这非常重要,特别是因为我们与其他人使用相同的集成平台,”X-Window 联盟职业发展助理教授、电子工程和计算机科学系 (EECS) 的 Negar Reiskarimian 表示,他是微系统技术实验室和电子研究实验室 (RLE) 的成员,也是一篇论文的高级作者 本接收器上的论文。 Reiskarimian 与 EECS 研究生 Shahabeddin Mohin(第一作者)、Soroush Araei 和 RLE 博士后 Mohammad Barzgari 共同撰写了这篇论文。该论文最近在 IEEE 射频电路研讨会上发表,并获得了最佳学生论文奖。 阻断干扰 数字 MIMO 系统包含模拟和数字部分。模拟部分使用天线接收信号,信号经过放大、下变频,并通过模数转换器,然后在设备的数字域中进行处理。在这种情况下,需要数字波束成形来检索所需信号。 但是,如果来自不同方向的强干扰信号与有用信号同时到达接收器,它会使放大器饱和,从而淹没有用信号。数字 MIMO 可以滤除无用信号,但这种滤除发生在接收器链的后期。如果干扰与有用信号一起被放大,则后期滤除会更加困难。 Reiskarimian 说:“初始低噪声放大器的输出是我们能够以最小代价进行滤波的第一个地方,这正是我们采用的方法。” 研究人员在每个接收器链中第一个放大器的输出端直接构建并安装了四个非互易移相器,它们都连接到同一个节点。这些移相器可以双向传递信号,并感应传入干扰信号的角度。这些设备可以调整相位,直到消除干扰。 这些设备的相位可以精确调整,因此它们可以在干扰信号传递到接收器的其余部分之前感知并消除干扰信号,从而在干扰信号影响接收器的任何其他部分之前将其阻止。此外,如果干扰信号改变位置,移相器可以跟踪信号以继续阻止干扰。 “如果您开始断线或信号质量下降,您可以打开它并即时缓解干扰。因为我们采用的是并行方法,所以您可以打开和关闭它,而对接收器本身的性能影响最小,”Reiskarimian […]

MIT 公司选举 10 名任期成员和 2 名终身成员 | MIT 新闻

麻省理工学院董事会——麻省理工学院公司已选出 10 名全职成员,任期为一年、两年或五年,以及两名终身成员。公司主席 Mark P. Gorenberg (1976 年) 今天宣布了选举结果。 全职成员包括:Nancy C. Andrews、Dedric A. Carter、David Fialkow、Bennett W. Golub、Temitope O. Lawani、Michael C. Mountz、Anna Waldman-Brown、R. Robert Wickham、Jeannette M. Wing 和 Anita Wu。两名终身成员包括:R. Erich Caulfield 和 David M. Siegel。Gorenberg 还再次当选为公司主席。 自 7 月 1 日起,该公司将由 80 位教育、科学、工程和工业领域的杰出领袖组成。其中 24 人为终身会员,8 人为 不在办公室. 另外有 25 人为终身名誉会员。 新任 10 名成员如下: Nancy C. […]

想要在视频中寻找特定动作?这种基于 AI 的方法可以帮你找到它 | MIT 新闻

互联网上充斥着各种教学视频,这​​些视频可以教会好奇的观众各种知识,从如何烹制完美的煎饼到如何进行救生的海姆立克急救法。 但要精确定位长视频中某个特定动作发生的时间和地点可能非常繁琐。为了简化这一过程,科学家们正在尝试教计算机执行这项任务。理想情况下,用户只需描述他们想要的动作,AI 模型就会跳转到视频中该动作的位置。 然而,教导机器学习模型做到这一点通常需要大量经过精心手工标记的昂贵视频数据。 麻省理工学院和麻省理工学院 – IBM 沃森人工智能实验室的研究人员采用了一种新的、更有效的方法,即仅使用视频及其自动生成的记录来训练模型来执行这项任务,即时空基础。 研究人员用两种不同的方式教模型理解未标记的视频:通过查看小细节来确定物体的位置(空间信息),并查看更大的图景来了解动作发生的时间(时间信息)。 与其他 AI 方法相比,他们的方法可以更准确地识别包含多项活动的较长视频中的动作。有趣的是,他们发现同时训练空间和时间信息可以使模型更好地识别每个动作。 除了简化在线学习和虚拟培训流程之外,该技术还可以用于医疗保健领域,例如,可以快速找到诊断过程视频中的关键时刻。 “我们解决了试图同时编码空间和时间信息的难题,而是将其视为两个专家各自工作,事实证明这是一种更明确的信息编码方式。我们的模型结合了这两个独立的分支,取得了最佳表现,”论文的主要作者 Brian Chen 说道。 关于该技术的论文。 陈是哥伦比亚大学 2023 届毕业生,他在麻省理工学院-IBM 沃森人工智能实验室担任访问学生期间进行了这项研究,与他一起撰写这篇论文的还有詹姆斯·格拉斯,他是麻省理工学院-IBM 沃森人工智能实验室的高级研究员、计算机科学和人工智能实验室 (CSAIL) 口语系统小组负责人;希尔德·库恩,麻省理工学院-IBM 沃森人工智能实验室成员,同时也是法兰克福歌德大学的附属机构;以及麻省理工学院、歌德大学、麻省理工学院-IBM 沃森人工智能实验室和 Quality Match GmbH 的其他人员。这项研究将在计算机视觉和模式识别会议上发表。 全球和本地学习 研究人员通常使用人类注释了特定任务的开始和结束时间的视频来教模型执行时空基础。 生成这些数据不仅成本高昂,而且人类很难确定到底要标记什么。如果动作是“煎饼”,那么这个动作是从厨师开始搅拌面糊时开始的,还是从她把面糊倒进锅里时开始的? “这次的任务可能是烹饪,但下一次,可能是修车。人们需要标注的领域太多了。但如果我们能够在没有标签的情况下学习一切,那么这就是一个更通用的解决方案,”陈说。 研究人员采用的方法是从 YouTube 等网站获取未标记的教学视频和随附的文本记录作为训练数据。这些不需要任何特殊准备。 他们将训练过程分为两部分。首先,他们教机器学习模型查看整个视频,以了解特定时间发生的动作。这种高级信息称为全局表示。 其次,他们教模型将注意力集中在视频中发生动作的特定区域。例如,在一个大厨房里,模型可能只需要关注厨师用来搅拌煎饼面糊的木勺,而不是整个柜台。这种细粒度的信息被称为局部表征。 研究人员将一个附加组件添加到他们的框架中,以减轻叙述和视频之间出现的不一致。也许厨师先谈论煎饼,然后再执行操作。 为了开发出更切合实际的解决方案,研究人员将重点放在了几分钟长的未剪辑视频上。相比之下,大多数人工智能技术都是使用几秒钟的剪辑来训练的,这些剪辑被剪辑成只显示一个动作。 新的基准 但是,当他们评估他们的方法时,研究人员无法找到在这些较长的未剪辑视频上测试模型的有效基准——因此他们创建了一个基准。 为了建立基准数据集,研究人员设计了一种新的注释技术,该技术可以很好地识别多步骤操作。他们让用户标记物体的交点,例如刀刃切开西红柿的点,而不是在重要物体周围画一个框。 陈说:“这定义得更明确,加快了注释过程,减少了人力和成本。” 此外,让多个人对同一视频进行点注释可以更好地捕捉随时间发生的动作,例如倒牛奶的流动。所有注释者都不会在液体流动的同一点上进行标记。 当他们使用这个基准来测试他们的方法时,研究人员发现它比其他人工智能技术更能准确地定位动作。 他们的方法也更注重人与物体的互动。例如,如果动作是“上煎饼”,许多其他方法可能只关注关键物体,比如柜台上的一叠煎饼。相反,他们的方法关注的是厨师将煎饼翻转到盘子上的实际时刻。 接下来,研究人员计划改进他们的方法,以便模型能够自动检测文本和叙述不一致的情况,并将焦点从一种模式切换到另一种模式。他们还希望将他们的框架扩展到音频数据,因为动作和物体发出的声音之间通常存在很强的相关性。 这项研究的部分资金由麻省理工学院-IBM Watson AI 实验室提供。 1716968687 […]

受控扩散模型可以改变图像中的材料属性 | MIT 新闻

麻省理工学院计算机科学与人工智能实验室 (CSAIL) 和谷歌研究中心的研究人员可能刚刚进行了数字魔法——以扩散模型的形式,可以改变图像中物体的材质属性。 配音 炼金术士该系统允许用户改变真实图片和人工智能生成的图片的四个属性:粗糙度、金属度、反照率(物体的初始基色)和透明度。作为图像到图像的扩散模型,可以输入任何照片,然后在 -1 到 1 的连续范围内调整每个属性以创建新的视觉效果。这些照片编辑功能可能会扩展到改进视频游戏中的模型、扩展人工智能在视觉效果方面的能力以及丰富机器人训练数据。 Alchemist 背后的魔力始于一个去噪扩散模型:在实践中,研究人员使用了 Stable Diffusion 1.5,这是一个文本到图像的模型,因其逼真的效果和编辑功能而备受赞誉。之前的研究建立在流行的模型之上,使用户能够进行更高级别的更改,例如交换对象或改变图像的深度。相比之下,CSAIL 和 Google Research 的方法应用此模型来关注低级属性,通过独特的基于滑块的界面修改对象材料属性的更精细的细节,其性能优于其他同类产品。 虽然之前的扩散系统可以为图像变出一只兔子,但 Alchemist 可以将同一只动物变成半透明的。该系统还可以使小黄鸭呈现出金属质感,去除金鱼的金色,并使旧鞋发亮。Photoshop 等程序具有类似的功能,但此模型可以更直接地更改材料属性。例如,在广泛使用的应用程序中,修改照片的金属外观需要几个步骤。 “当你看到自己创建的图像时,结果往往与你想象的并不完全一致,”麻省理工学院电气工程和计算机科学博士生、CSAIL 附属机构、一篇描述这项工作的新论文的主要作者 Prafull Sharma 说道。“你想在编辑图片时控制它,但图像编辑器中现有的控件无法更改材质。借助 Alchemist,我们利用文本到图像模型输出的照片级真实感,并梳理出一个滑块控件,让我们可以在提供初始图片后修改特定属性。” 精确控制 “文本到图像的生成模型使日常用户能够像写句子一样轻松地生成图像。然而,控制这些模型可能具有挑战性,”卡内基梅隆大学助理教授 Jun-Yan Zhu(未参与该论文)表示。“虽然生成花瓶很简单,但合成具有特定材料属性(例如透明度和粗糙度)的花瓶需要用户花费数小时尝试不同的文本提示和随机种子。这可能会令人沮丧,尤其是对于需要精确工作的专业用户而言。Alchemist 通过精确控制输入图像的材料,同时利用大规模扩散模型的数据驱动先验,为这一挑战提供了一个实用的解决方案,启发未来的研究将生成模型无缝地整合到常用内容创建软件的现有界面中。” Alchemist 的设计功能可以帮助调整视频游戏中不同模型的外观。在此领域应用这种扩散模型可以帮助创作者加快设计过程,细化纹理以适应关卡的游戏玩法。此外,Sharma 及其团队的项目可以帮助改变图形设计元素、视频和电影效果,以增强照片真实感并精确实现所需的材料外观。 该方法还可以改进机器人训练数据,以完成诸如操作等任务。通过向机器介绍更多纹理,它们可以更好地理解它们在现实世界中将要抓取的各种物品。Alchemist 甚至可能有助于图像分类,分析神经网络无法识别图像的物质变化的地方。 Sharma 及其团队的工作在忠实编辑所需对象方面超越了类似模型。例如,当用户提示不同的模型将海豚调整到最大透明度时,只有 Alchemist 实现了这一壮举,同时保持海洋背景未编辑。当研究人员使用与他们的方法相同的数据训练可比较的扩散模型 InstructPix2Pix 以进行比较时,他们发现 Alchemist 获得了更高的准确度分数。同样,一项用户研究表明,MIT 模型更受欢迎,并且被认为比其同类模型更逼真。 利用合成数据保证真实性 研究人员表示,收集真实数据是不切实际的。相反,他们在合成数据集上训练模型,在流行的计算机图形设计工具 Blender 中随机编辑应用于 100 个公开、独特的 3D 对象的 […]

研究解释了为什么大脑即使没有颜色也能准确识别图像 | MIT 新闻

尽管人类视觉系统拥有处理色彩的复杂机制,但大脑在识别黑白图像中的物体时却毫无问题。麻省理工学院的一项新研究为大脑如何如此擅长识别彩色和色彩退化的图像提供了一种可能的解释。 研究人员利用实验数据和计算模型,发现证据表明这种能力的根源可能在于发育。在生命早期,当新生儿接收到的颜色信息非常有限时,大脑被迫学会根据物体的亮度或发出的光的强度而不是颜色来区分物体。在生命的后期,当视网膜和皮层能够更好地处理颜色时,大脑也会吸收颜色信息,但也会保持其先前获得的识别图像的能力,而无需过分依赖颜色线索。 该结果与之前的研究一致,表明最初退化的视觉和听觉输入实际上可能有益于感知系统的早期发育。 “这一普遍观点认为,我们的感知系统最初存在的局限性非常重要,这种观点超越了色觉和视敏度。我们实验室在听觉方面所做的一些工作也表明,限制新生儿系统最初接触的信息丰富程度非常重要,”麻省理工学院大脑与认知科学教授、这项研究的资深作者 Pawan Sinha 说道。 研究结果还有助于解释为什么天生失明、后来通过先天性白内障摘除术恢复视力的儿童,在辨别黑白物体时会困难得多。这些儿童在恢复视力后立即获得了丰富的色彩输入,他们可能会过度依赖色彩,这使得他们对色彩信息的变化或缺失的适应能力大大降低。 麻省理工学院博士后 Marin Vogelsang 和 Lukas Vogelsang 以及 Prakash 项目研究科学家 Priti Gupta 是这项研究的主要作者,该研究 今天出现 在 科学. 现任麻省理工学院研究员的退休神经病学家 Sidney Diamond 以及 Prakash 项目团队的其他成员也是该论文的作者。 黑白分明 研究人员对早期色彩体验如何影响日后物体识别的探索源于一项对先天性白内障患儿恢复视力的研究的简单观察。2005 年,Sinha 发起了 普拉卡什计划 (梵语中意为“光”),是印度为识别和治疗患有可逆性视力丧失的儿童而做出的一项努力。 许多儿童因严重的双侧白内障而失明。印度的这种疾病往往得不到治疗,该国是世界上盲童最多的国家,估计有 20 万至 70 万名盲童。 通过 Prakash 项目接受治疗的儿童还可以参与有关他们的视觉发育的研究,其中许多研究帮助科学家更多地了解视力恢复后大脑组织如何变化、大脑如何估计亮度以及其他与视觉有关的现象。 在这项研究中,辛哈和他的同事给孩子们做了一个简单的物体识别测试,同时展示了彩色和黑白图像。对于天生视力正常的儿童来说,将彩色图像转换为灰度图像对他们识别所描绘物体的能力没有任何影响。然而,当接受白内障摘除术的儿童看到黑白图像时,他们的表现显著下降。 这使得研究人员推测,儿童在生命早期接触的视觉输入的性质可能在塑造对颜色变化的适应力和识别黑白图像中呈现的物体的能力方面发挥着至关重要的作用。在视力正常的新生儿中,视网膜锥细胞在出生时发育不良,导致婴儿视力较差和色觉较差。在生命的最初几年里,随着锥体系统的发育,他们的视力会显著改善。 由于尚未成熟的视觉系统接收的色彩信息明显减少,研究人员推测,在此期间,婴儿大脑被迫熟练掌握色彩线索减少的图像识别能力。此外,他们提出,天生患有白内障并在之后进行摘除的儿童在识别物体时可能会过度依赖色彩线索,因为正如他们在论文中通过实验证明的那样,由于视网膜成熟,他们在术后一开始就具有良好的色彩视觉。 为了严格验证这一假设,研究人员使用标准卷积神经网络 AlexNet 作为视觉计算模型。他们训练网络识别物体,在训练过程中为其提供不同类型的输入。作为一项训练方案的一部分,他们最初只向模型展示灰度图像,然后引入彩色图像。这大致模拟了婴儿视力在生命最初几年成熟时色彩丰富的发展过程。 另一项训练方案仅包含彩色图像。这近似于 Prakash 计划儿童的经历,因为他们在白内障摘除后就能处理全彩色信息。 研究人员发现,受开发启发的模型可以准确识别两种图像中的物体,并且对其他颜色处理也具有弹性。然而,仅在彩色图像上训练的 Prakash-proxy 模型对灰度或色调处理图像没有表现出良好的泛化能力。 […]

Edel-Convertible mit Core Ultra 和 OLED 显示屏动手测试

安杰测试:HP Spectre x360 14 Edel-Convertible mit Core Ultra 和 OLED 显示屏动手测试 主题提供者 在惠普,Spectre 代表着专为要求严格的私人客户或自由职业者开发的高级敞篷车。 在实际测试中,配备 Intel Core Ultra CPU 和迷人的 14 英寸 2.8K 分辨率 OLED 显示屏的 Spectre x360 14 展示了它的能力。 HP Spectre x360 14 中的 OLED 面板现在具有 2.8K 分辨率和 16:10 长宽比,可呈现浓郁的色彩和深邃的黑色。 它还可管理高达 120 Hz 的刷新率。 (图片来源:沃格尔 IT 媒体) 惠普为 2024 年高端敞篷版 Spectre x360 14 配备了英特尔全新 […]

这家初创公司使用 MIT Inventor 应用程序教女孩编程

什么时候 玛丽安·史密斯 2016年在教授计算机科学 弗拉特黑德谷社区学院在蒙大拿州卡利斯佩尔,这位兼职教授注意到她班上的女学生数量严重不足,她说。 史密斯说,她认为这种差异是因为女孩在小学和中学时没有接触到科学、技术、工程和数学。 代码女孩联合 成立 2018年 总部 卡利斯佩尔,蒙大拿州 雇员 10 2017年,她决定采取一些措施来缩小差距。 这位 IEEE 成员启动了一个课外项目来教授编码和计算机科学。 最初是在当地一家餐馆举行的一个由 28 名学生组成的班级,现在是一个全州范围的项目,由 代码女孩联合是史密斯于 2018 年成立的非营利组织。该组织已为蒙大拿州 38 个城市和该州三个美洲原住民保留地的 1,000 多名小学生、初中生和高中生提供教学。 史密斯计划将非营利组织扩展到南达科他州、威斯康星州和其他州以及其他保留地。 “在蒙大拿州,计算机科学不是 K-12 的必修课程,”史密斯说。 “我们的项目创造了这种罕见的实践经验,为学生提供了一种对我们社区中的女孩非常有帮助的体验。” 该非营利组织是去年麻省理工学院的七个获奖者之一 解决 STEM 挑战中的性别平等问题。 该倡议支持致力于解决性别障碍的组织。 Code Girls United 收到了 10 万美元用于其项目。 “麻省理工学院解决 STEM 挑战中的性别平等问题对所有申请者进行彻底审查——他们的理论、实践、组织健康状况和影响力,”史密斯说。 “对于 Code Girls United 来说,被选为比赛的获胜者是一种有效的荣誉。” 从餐厅地下室到全州范围内的项目 她说,当史密斯教她的儿子们如何对机器人进行编程时,她发现编程引入了一套类似于学习新语言的逻辑和沟通技能。 她推断,这些技能是许多女孩所缺少的。 “让女孩有机会用这种编码语言说话和写作至关重要,”她说,“这样她们也有机会交流自己的想法。” 她说,起初她不确定要教什么科目,原因是 […]

Aqara Videotürklingel G4 mit HomeKit 安全视频 › ifun.de

死 Aqara Videotürklingel G4 这可能仍然是为您的公寓或前门配备兼容 HomeKit 的门铃和摄像头组合的最便宜的方式。 由于产品页面上提供了折扣券,我们目前几乎回到了黑色星期五的水平。 该设备的价格可降至仅 99 欧元。 您可以阅读我们对 Aqara 可视门铃的详细介绍 在这里读。 去年春天推出该设备时,我们就介绍了它,从那时起我们就一直愉快地使用它。 响铃变压器或电池——两者都可以 Aqara 智能门铃的第一个特点是它可以通过硬接线与门铃变压器结合使用,也可以仅由电池供电。 竞争设备通常只提供两种变体之一。 Aqara G4 可以独立于其他 Aqara 产品所需的制造商集线器使用。 这项任务是通过交付中包含的门铃来执行的,门铃放置在公寓内,并与安装在外面的门铃进行无线通信。 通过 WLAN 集成到家庭网络中,如果需要,门铃会在 HomeKit 中显示为支持 HomeKit 安全视频的摄像头。 广泛的功能 我们认为,对于配置而言,考虑到众多相关选项、常规配置,最好使用相关的 Aqara 应用程序。 该应用程序的用户界面需要一些时间来适应,特别是在配置区域,但选项非常多样化。 如前所述,摄像机录制的视频可以保存在 HomeKit 中,但 Aqara 还提供本地选项,例如将它们保存到放置在门铃中的存储卡或连接到私人 NAS 驱动器。 最后,关于当前特价的常见说明:完成购买时,请务必检查显示的价格。 我们不知道该活动将持续多久。 阿卡拉还提供 其系列中的各种其他智能家居产品 价格降低。 产品备注 Aqara 智能视频门铃 G4(包括门铃)、1080p FHD […]