电脑新闻 - Mandarinian

监控机器人可以改善下肢无力患者的康复

北京理工大学出版社华中科技大学的科学家推出了一款创新的跟随人类的监测机器人，旨在帮助下肢肌肉无力的患者。图片来源：张美萍，华中科技大学人工智能与自动化系，武汉，中国。华中科技大学的一个研究小组推出了一款创新的跟随人体的监测机器人，旨在帮助下肢肌肉无力患者，这种疾病在老年人和患有神经系统和运动系统疾病的人中很常见。这项尖端技术有望增强日常活动能力并加快康复速度，为康复工作提供重大助力。本文发布在期刊上机器人与仿生系统。张美平及其同事最近发表的一项研究中详细介绍了监控机器人的开发，该机器人专注于持续准确的意图识别和康复过程中有效的机器人跟踪，解决了当前康复技术中的关键差距。随着全球老年人口的增加，对这种先进解决方案的需求变得更加迫切，据估计，全球有 4 亿老年人受到肌肉萎缩的影响。随着全球人口老龄化，下肢肌肉无力的患病率不断上升，全球约有 4 亿老年人受其影响。这种疾病通常由神经和运动系统疾病引起，严重损害了行动能力和独立性。及时有效的康复干预对于患者康复和重返社会至关重要。辅助机器人的研究日益深入，为减轻医疗系统负担和提高患者独立性提供了有希望的解决方案。该机器人采用了一种基于不完全观测的集合成员过滤的新型人类步行意图估计算法，即使运动信号中断（例如数据传输受阻或身体遮挡），它也能保持有效的支持。这对于确保机器人能够不断适应用户的步调和预期路径，并在需要的时间和地点提供准确的支持至关重要。除了先进的意图识别功能外，该机器人还采用了人机跟随控制算法，确保其与用户保持规定的距离和方向。这不仅有助于不间断地提供支持，还可以防止机器人阻碍用户的路径，从而提高用户在使用过程中的舒适度和安全性。研究团队的实验证明了这些技术的有效性。机器人成功地在复杂的步行路径上行走，同时与用户保持近距离但安全的距离，并根据用户的步行意图和环境条件实时调整其运动。 “我们的机器人不仅提供物理支持，还集成了先进的算法，以确保它能够适应各种用户需求和环境，”这项研究的资深作者黄建说。“它代表了康复辅助技术向前迈出的重要一步，为物流、家政甚至娱乐活动等其他领域提供了潜在的应用。” 张博士及其团队开发的技术特别适合肌肉力量下降早期的患者，这些患者可以独立行走，但需要监护以防止跌倒。该机器人的设计包括易于移动的部件、人机交互界面和用于平衡支撑的扶手，所有这些都对于提高用户的移动能力和生活质量至关重要。研究人员对该技术未来的增强功能持乐观态度，包括集成更先进的传感器和算法，以进一步提高机器人在不同环境中的响应能力和适用性。最终目标是创造出不仅支持移动性，而且还能通过增强肌肉功能和协调性积极促进康复过程的机器人。更多信息：张美萍等，基于不完全观测的跟人监视机器人的规定性能控制，机器人与仿生系统 (2023)。 DOI: 10.34133/cbsystems.0085 北京理工大学出版社有限公司提供引用: 监控机器人可以改善下肢无力患者的康复情况 (2024 年 6 月 3 日) 于 2024 年 6 月 4 日检索自本文件受版权保护。除出于私人学习或研究目的的合理使用外，未经书面许可不得复制任何部分。内容仅供参考。 1717496977 #监控机器人可以改善下肢无力患者的康复 2024-06-03 19:41:47

儿童的视觉经验可能是更好的计算机视觉训练的关键

位置对图像外观、光线和相机距离/焦距的影响。图片来源：研究团队提供的图片，使用了 Federico Adolfi 拍摄的树木照片 (B) 和 James Z. Wang 拍摄的头部半身照片 (C)。宾夕法尼亚州立大学跨学科团队的研究表明，一种新颖的、受人类启发的训练人工智能 (AI) 系统识别物体和导航周围环境的方法可以为开发更先进的 AI 系统以探索极端环境或遥远世界奠定基础。在生命的最初两年里，儿童接触的物体和面孔相对较少，但视角和光照条件各不相同。受这一发展洞察的启发，研究人员引入了一种新的机器学习方法，利用空间位置信息更有效地训练人工智能视觉系统。他们发现，用新方法训练的人工智能模型比基础模型高出 14.99%。他们在 5 月期刊上报告了他们的研究结果模式。 “目前，人工智能的方法是使用来自互联网的大量随机照片集进行训练。相比之下，我们的策略则受到发展心理学的影响，该心理学研究儿童如何看待世界，”本文第一作者、宾夕法尼亚州立大学信息科学与技术学院博士生朱丽珍说道。研究人员开发了一种新的对比学习算法，这是一种自我监督学习方法，其中人工智能系统学习检测视觉模式，以识别两幅图像是否是同一基础图像的衍生品，从而产生正对。然而，这些算法通常将从不同角度拍摄的同一物体的图像视为单独的实体，而不是正对。研究人员表示，考虑到位置等环境数据，人工智能系统可以克服这些挑战，并且无论相机位置或旋转、光照角度或条件、焦距或变焦如何变化，都能检测到正对。 “我们假设婴儿的视觉学习取决于位置感知。为了生成具有时空信息的自我中心数据集，我们在 ThreeDWorld 平台中设置了虚拟环境，这是一个高保真、交互式的 3D 物理模拟环境。这使我们能够操纵和测量观察摄像头的位置，就像孩子在房子里走路一样，”朱补充道。科学家们创建了三个模拟环境——House14K、House100K 和 Apartment14K，其中“14K”和“100K”指的是每个环境中拍摄的样本图像的大致数量。然后，他们通过模拟运行了基础对比学习模型和采用新算法的模型三次，以查看每个模型对图像的分类效果如何。该团队发现，在他们的算法上训练的模型在各种任务上都优于基础模型。例如，在识别虚拟公寓房间的任务中，增强模型的平均准确率为 99.35%，比基础模型提高了 14.99%。这些新数据集可供其他科学家通过以下方式进行训练： www.child-view.com。 “模型在新环境中使用少量数据进行学习总是很困难的。我们的工作是首次尝试使用视觉内容进行更节能、更灵活的人工智能训练，”信息科学与技术杰出教授、朱的导师 James Wang 说道。科学家表示，这项研究对于未来发展用于在新的环境中导航和学习的先进人工智能系统具有重要意义。王说：“这种方法在资源有限的自主机器人团队需要学习如何在完全陌生的环境中导航的情况下尤其有用。”“为了为未来的应用铺平道路，我们计划改进我们的模型，以更好地利用空间信息并融入更多样化的环境。” 宾夕法尼亚州立大学心理学系和计算机科学与工程系的合作者也参与了这项研究。更多信息： Lizhen Zhu 等，结合模拟空间上下文信息可提高对比学习模型的有效性，模式 (2024)。 DOI：10.1016/j.patter.2024.100964 由宾夕法尼亚州立大学提供引用：儿童的视觉经验可能是更好的计算机视觉训练的关键（2024 年 5 […]

研究团队推出敏捷多机器人研究平台

配备定制计算和传感器的 Cambridge RoboMaster 近照。来源：Blumenkamp 等人。机器人团队有潜力比单个机器人完成更复杂的任务，例如，更快地覆盖长距离、同时访问不同的地点或监控更大的地理区域。结合可靠的硬件和软件用于多机器人应用的平台可以帮助推进该领域的研究，促进在特定的现实环境中测试机器人团队。剑桥大学的研究人员最近推出了 Cambridge RoboMaster，这是一个很有前途的多机器人研究平台。该平台概述如下：纸预发布于论文集，包括设计一批定制的 Robomaster 轮式机器人，以及用于模拟和训练机器人执行特定任务的软件。 “我们的使命是开发多机器人和多智能体系统中的集体智能解决方案，”首席研究员 Amanda Prorok 告诉 Tech Xplore。“这项研究结合了机器学习、规划和控制的方法，应用范围广泛，包括自动运输、物流、环境监测以及搜索和救援。为了验证我们的研究，我们需要一个强大而强大的机器人平台。” 布鲁门坎普和他的同事着手开发一个多机器人研究平台，以满足一系列要求，即最先进的计算能力、速度、灵活性和耐用性。最终，他们决定使用 DJI RoboMaster S1 机器人的定制版本，这是一种小型轮式机器人，最初是为高中和大学级别的比赛设计的。 “这个平台为我们提供了坚实的基础，我们可以在此基础上满足我们的特定需求，”Blumenkamp 说。“在过去三年中，我们一直在研究这个机器人平台，并不断迭代和改进其功能。在此期间，我们增加了功能更强大的计算机、传感器和控制软件，并将其应用于多个项目，总共六个。” 在各种项目和比赛中成功部署 DJI RoboMaster S1 机器人后，研究人员决定将其展示给机器人研究界。为此，他们创建了最近论文中介绍的平台，其中包括硬件设计、源蓝图和软件，可让该领域的其他人尝试 RoboMaster 机器人团队。 “Cambridge RoboMaster 是一款紧凑而强大的机器人平台，旨在推动多智能体研究，”Blumenkamp 解释道。“它基于 DJI RoboMaster S1 构建，我们通过用功能更强大的计算机替换主计算机来增强它的性能。我们的定制控制器将平台推向了物理极限，使其最高速度达到 4.5 米/秒。这使其成为室内环境中多机器人实验的高度灵活和有效的测试平台。” 五位剑桥 RoboMaster 处于需要严格队形控制的场景中。图片来源：Blumenkamp 等人。剑桥 RoboMaster 的最大优势之一是它在机器人尺寸和能力之间实现了完美平衡。事实上，该团队定制的 DJU RoboMaster S1 机器人克服了小型机器人（通常计算能力不足）和大型机器人（通常价格昂贵且太大而无法在室内部署）的局限性。 […]

新算法增强了社交媒体上的虚假信息检测

图片来源：IMDEA Networks 虚假信息在数字平台上日益普遍，对社会、政治和经济事件产生了重大影响。长期以来，虚假信息一直对自由和民主构成威胁。然而，由于虚假信息通过数字媒体传播的速度之快，这一问题现在变得更加紧迫。 IMDEA Networks、塞浦路斯科技大学和 LSTECH ESPAÑA SL 的研究人员开发了 HyperGraphDis 算法，该算法能够检测社交媒体上的虚假信息，有助于打击虚假新闻的泛滥。 IMDEA Networks 高级研究员、该研究的作者之一 Marius Paraschiv 博士解释说：“我们的研究‘HyperGraphDis：利用超图进行基于情境和社交的虚假信息检测'提出了一种检测方法，该方法考虑用户之间复杂的社会结构以及关系和语义元素，以确定其生成内容的性质。” IMDEA Networks 研究教授 Nikolaos Laoutaris 博士补充道：“随着社交媒体数据量的不断增加，在检测假新闻方面实现高精度是远远不够的；检测算法需要可扩展且快速，以便近乎实时地处理大量数据。我们的新 HyperGraphDis 算法不仅提高了检测准确性，还显著缩短了执行时间，使其比竞争方法更实用。” 具体来说，科学家们评估了 2016 年美国总统大选和 COVID-19 疫情的四个 Twitter/X 数据集。HyperGraphDis 在准确性和计算效率方面均优于现有方法，凸显了其在应对虚假信息传播带来的挑战方面的有效性和可扩展性。研究表明，虚假信息并不总是可以直接验证的，而且取决于具体情况。因此，帕拉斯基夫强调，“考虑背景并分析传播信息者的关系和环境、他们所属的社区或他们与已知虚假信息来源的关系”至关重要。 “此外，这些消息来源不一定是虚假信息的主要生成者；他们可能只是传播者或放大器，将虚假信息引入社区，然后由其他成员进行放大。” HyperGraphDis 的工作原理 HyperGraphDis 结合了超图神经网络、用于社区检测的图聚类和用于文本理解的自然语言处理等先进技术，从而能够更高效、更准确地检测虚假信息。研究人员之所以专注于 Twitter/X，是因为其拥有复杂的数据集，尽管 HyperGraphDis 也可以适用于其他社交平台。另一个优势是，它为平台所有者提供了一种减轻虚假信息影响的有效方法，通过促进事实核查和情境化响应，更好地了解虚假信息的传播方式以及如何有效打击虚假信息。挑战和未来发展该项目面临诸多挑战，从收集 Twitter/X 的最新数据（消息被删除、帐户被移除、消息内容可能被编辑且不反映原意等）到构建复杂的超图。然而，研究人员已经开始着眼于未来：使用 GPT-4 等先进模型进行多模态虚假信息检测。 “这可能是下一个合乎逻辑的步骤，但仍存在重大障碍需要克服，包括扩展问题和来自多个来源的信息聚合问题，”Paraschiv 总结道。更多信息： HyperGraphDis：利用超图进行基于情境和社交的虚假信息检测， hdl.handle.net/20.500.12761/1803 由 […]

合并和分裂图卷积网络的威力

北京理工大学出版社重庆理工大学的科学家开发出了一种增强交互识别的尖端方法。图片来源：重庆理工大学人工智能学院王浩强。在机器人和人工智能的进步中，重庆理工大学的研究人员与国际合作者一起开发了一种增强交互识别的尖端方法。这项研究发布在机器人与仿生系统，引入了合并和分裂图卷积网络 (MS-GCN)，这是一种专门用于解决基于骨架的交互识别的复杂性的新方法。人机交互识别在各种应用中都发挥着至关重要的作用，从增强人机界面到改进监控系统。传统方法通常依赖于 RGB 数据，难以应对诸如照明变化和遮挡等问题，因此准确识别是一项挑战。基于骨骼的方法专注于人体关节的结构，由于其对此类环境变化的稳健性而提供了一种有前途的替代方案。新推出的 MS-GCN 解决了捕捉多个人之间互动动态这一长期存在的问题，而这往往被传统的图卷积网络所忽视。通过将合并和拆分图卷积与分层引导注意力和短期依赖模块相结合，MS-GCN 能够出色地理解互动过程中不同身体部位之间的细微关系。 MS-GCN的创新特点：合并与分裂图结构：该结构以独特的方式将交互个体的联合信息合并到统一的特征空间中，从而可以对交互进行整体分析。它将两个个体的相应层次集的节点映射到同一语义空间中，从而有助于更精确地识别特定于交互的动作。层次引导注意力：此组件在强调不同层次集的重要性方面至关重要，这些层次集基于它们与当前交互的相关性。例如，在挥手等动作中，它更关注涉及手的层次集，确保不会错过关键的动作特征。短期依赖模块：认识到运动的短期变化对于区分类似动作（例如握手和击掌）至关重要，该模块增强了模型对这些细微差异的敏感度。 MS-GCN 在两个公认的数据集 NTU60 和 NTU120 上的表现证明了其有效性，并取得了最佳结果。该方法已通过大量实验进行了严格验证，证明了其在双人和单人交互场景中均优于现有方法。随着机器人和人工智能系统越来越多地融入日常生活，它们以细致入微且有意义的方式理解人类并与人类互动的能力至关重要。MS-GCN 不仅推动了动作识别领域的发展，还为开发更直观、反应更灵敏的人工智能系统开辟了新途径。这项研究标志着人工智能在无缝融入人类环境的探索中迈出了重要一步，让我们看到了未来数字系统能够以前所未有的精度和效率预测和响应人类行为的前景。更多信息： Haoqiang Wang 等，基于骨架的交互识别的合并和拆分图卷积网络，机器人与仿生系统 (2024)。 DOI: 10.34133/cbsystems.0102 北京理工大学出版社有限公司提供引用：增强交互识别：合并和拆分图卷积网络的力量 (2024 年 6 月 1 日) 于 2024 年 6 月 2 日检索自本文件受版权保护。除出于私人学习或研究目的的合理使用外，未经书面许可不得复制任何部分。内容仅供参考。 1717330059 #合并和分裂图卷积网络的威力 2024-06-01 […]

中国购物应用 Temu 面临更严格的欧盟安全规则

图片来源：Pixabay/CC0 公共领域布鲁塞尔周五将中国购物应用程序 Temu 列入面临限制的数字公司名单后，该公司将不得不遵守严格的新安全规则。尽管 Temu 于 2023 年 4 月才进入欧盟市场，但它却是欧洲增长最快的应用程序之一，其做法已经面临消费者团体的严厉审查。该应用与其他市场 AliExpress、亚马逊、Shein 和 Zalando 一起跻身 24 个“超大型在线平台”名单，这些平台在欧盟每月拥有超过 4500 万活跃用户。欧盟委员会在一份声明中表示，从 9 月底开始，即被指定为非法平台四个月后，Temu 将必须根据《数字服务法案》（DSA）实施更严格的规定，该法案是欧盟监管在线平台的庞大新法律之一。其中包括“有义务适当评估和减轻其服务带来的任何系统性风险，包括列出和销售假冒商品”。 DSA 审查的其他平台包括 Snapchat、TikTok 和 YouTube。 Temu 是中国购物应用拼多多的国际版，该公司今年早些时候表示，其在欧盟 27 个国家的平均每月活跃用户约为 7500 万。本月早些时候，欧洲 BEUC 消费者权益保护组织指责 Temu 违反 DSA，通过操纵用户让他们花费更多。 BEUC 向欧盟委员会提出申诉，而法国、德国和西班牙等 17 个成员组织也向国家当局提出了同样的申诉，要求对 Temu 进行调查。该平台在欧洲以外地区也面临压力，韩国监管机构正在对该平台进行调查，怀疑其存在虚假广告等不公平行为。 Temu 在一份声明中承认自己被指定，并表示“我们完全致力于遵守 DSA 概述的规则和条例，以确保我们在欧盟境内用户的安全、透明度和保护”。欧盟意味着生意 […]

利用“移动树木”增强网络安全

研究发现，人们并不难适应多出来的拇指

图片展示了佩戴者视角下的第三拇指设计。来源：Dani Clode Design & The Plasticity Lab 剑桥大学的研究人员已经证明，公众可以很容易地学会使用第三个拇指（可控制的假肢额外拇指）来拾取和操纵物体。该团队在各种各样的参与者身上测试了该机器人设备，他们表示，这对于确保新技术具有包容性并能为每个人服务至关重要。结果发布在科学机器人。未来技术的一个新兴领域是运动增强——使用外骨骼或额外的机器人身体部位等机动可穿戴设备来提升我们的运动能力，超越当前的生物限制。这些设备不仅能够改善想要提高生产力的健康人的生活质量，而且同样的技术也能为残疾人提供与环境互动的新方式。视频显示我们的一位年轻参与者戴着儿童尺寸的第三拇指，用夹子执行“个性化”任务。图片来源：Dani Clode Design & The Plasticity Lab 剑桥大学医学研究委员会 (MRC) 认知与脑科学部的塔玛·马金 (Tamar Makin) 教授表示：“技术正在改变我们对人类的定义，机器越来越成为我们日常生活的一部分，甚至成为我们思想和身体的一部分。 “这些技术开辟了令人兴奋的新机遇，可以造福社会，但至关重要的是，我们要考虑如何平等地帮助所有人，特别是那些经常被排除在创新研究和开发之外的边缘化群体。 “为了确保每个人都有机会参与并受益于这些令人兴奋的进步，我们需要在研发过程的最早阶段明确整合和衡量包容性。” 马金教授实验室的合作者达尼·克洛德 (Dani Clode) 开发了第三拇指，这是一种额外的机械拇指，旨在增加佩戴者的活动范围，增强他们的抓握能力并扩大手的承载能力。这使用户能够执行原本可能具有挑战性或不可能用一只手完成的任务，或者执行复杂的多手任务，而无需与其他人协调。视频显示，一名参与者戴着第三拇指，用夹子执行“个性化”任务。图片来源：Dani Clode Design & The Plasticity Lab 第三拇指戴在手掌与生物拇指相反的一侧，由放置在每个大脚趾或脚下的压力传感器控制。右脚趾施加的压力将拇指拉过手，而左脚趾施加的压力将拇指向上拉向手指。拇指运动的程度与施加的压力成正比，释放压力会使其回到原来的位置。 2022 年，该团队有机会在皇家学会年度夏季科学展览会上测试第三拇指，各个年龄段的公众都可以在不同的任务中使用该设备。在为期五天的时间里，该团队对 596 名参与者进行了测试，他们的年龄从 3 岁到 96 岁不等，人口背景也各异。其中，只有四人无法使用第三拇指，要么是因为它不适合他们的手，要么是因为他们无法用脚控制它（专为展览开发的压力传感器不适合体重过轻的儿童）。参与者有最多一分钟的时间来熟悉该设备，在此期间，团队会解释如何执行两项任务之一。不同用户佩戴的 Third Thumb。图片来源：Dani Clode […]

受控扩散模型可以改变图像中物体的材质属性

麻省理工学院 CSAIL 的研究人员帮助开发了一种扩散模型，该模型可以改变图像中物体的四种材料特性：粗糙度、金属度、反照率和透明度。图片来源：Alex Shipps/MIT CSAIL 麻省理工学院计算机科学与人工智能实验室 (CSAIL) 和谷歌研究中心的研究人员可能刚刚进行了数字魔法——以扩散模型的形式，可以改变图像中物体的材质属性。该系统名为 Alchemist，允许用户改变真实图片和 AI 生成图片的四个属性：粗糙度、金属度、反照率（物体的初始基色）和透明度。作为图像到图像的扩散模型，可以输入任何照片，然后在 -1 到 1 的连续范围内调整每个属性以创建新的视觉效果。这些照片编辑功能可能会扩展到改进视频游戏中的模型、扩展 AI 在视觉效果方面的能力以及丰富机器人训练数据。 Alchemist 背后的魔力始于一个去噪扩散模型：在实践中，研究人员使用了 Stable Diffusion 1.5，这是一个文本到图像的模型，因其逼真的效果和编辑功能而备受赞誉。之前的研究基于这个流行的模型，使用户能够进行更高级别的更改，例如交换对象或改变图像的深度。相比之下，CSAIL 和 Google Research 的方法应用此模型来关注低级属性，通过独特的基于滑块的界面修改物体材料属性的更精细的细节，其性能优于其他同类产品。虽然之前的扩散系统可以为图像变出一只兔子，但 Alchemist 可以将同一只动物变成半透明的。该系统还可以使小黄鸭呈现出金属质感，去除金鱼的金色，并使旧鞋发亮。Photoshop 等程序具有类似的功能，但此模型可以更直接地更改材料属性。例如，在广泛使用的应用程序中，修改照片的金属外观需要几个步骤。 “当你看到自己创造的图像时，结果往往与你想象的并不完全一致，”麻省理工学院电气工程与计算机科学博士生、CSAIL 附属机构、论文第一作者 Prafull Sharma 说道。新文章描述这项工作。“你想在编辑图片时控制它，但图像编辑器中现有的控件无法更改材质。借助 Alchemist，我们利用文本到图像模型输出的照片级真实感，并梳理出一个滑块控件，让我们可以在提供初始图片后修改特定属性。” 精确控制 “文本到图像的生成模型使日常用户能够像写句子一样轻松地生成图像。然而，控制这些模型可能具有挑战性，”卡内基梅隆大学助理教授朱俊彦 (Jun-Yan Zhu) 表示，他没有参与这篇论文。 “虽然生成花瓶很简单，但要合成具有特定材料属性（例如透明度和粗糙度）的花瓶，用户需要花费数小时尝试不同的文本提示和随机种子。这可能会令人沮丧，尤其是对于需要精确工作的专业用户而言。Alchemist 为这一挑战提供了一个实用的解决方案，它能够精确控制输入图像的材料，同时利用大规模扩散模型的数据驱动先验，从而激发未来的工作将生成模型无缝地整合到常用内容创建软件的现有界面中，”Zhu 继续说道。 Alchemist 的设计功能可以帮助调整视频游戏中不同模型的外观。在此领域应用这种扩散模型可以帮助创作者加快设计过程，细化纹理以适应关卡的游戏玩法。此外，Sharma 及其团队的项目可以帮助改变图形设计元素、视频和电影效果，以增强照片真实感并精确实现所需的材料外观。该方法还可以改进机器人训练数据，以完成诸如操作等任务。通过向机器介绍更多纹理，它们可以更好地理解它们在现实世界中将要抓取的各种物品。Alchemist 甚至可能有助于图像分类，分析神经网络无法识别图像的物质变化的地方。该团队的工作在忠实地编辑请求的感兴趣对象方面超越了类似的模型。例如，当用户提示不同的模型将海豚调整到最大透明度时，只有 Alchemist 实现了这一壮举，同时保持海洋背景未编辑。当研究人员使用与他们的方法相同的数据训练可比较的扩散模型 […]

Tag: 电脑新闻