您所在的位置:首页 - 艺术 - 正文艺术
神经网络也有空间意识!学会在创建地图,登上子刊
昭亮
2024-08-12
【艺术】
715人已围观
摘要机器之心报道机器之心编辑部这是人类首次证明神经网络可以创建自己的地图。想象一下,你身处一个陌生的小镇,即使一开始周围的环境并不熟悉,你也可以四处探索,神经网络也有空间意识!学会在创建地图,登上子刊并最终在大脑中绘制出一张环境地图,里面包含建筑物、街道、标志等相互之间的位置关系。这种在大脑中构建空间地图的能力是人类更高级认知类型的基础:例如,有理论认为,语言是由大脑中类似地图的结构编码的。然而,即使是最先进的人工智能和神经网络,也无法凭空构建这样的地图。计算生物学助理教授、HeritageMedi
机器之心报道
机器之心编辑部
这是人类首次证明神经网络可以创建自己的地图。想象一下,你身处一个陌生的小镇,即使一开始周围的环境并不熟悉,你也可以四处探索,神经网络也有空间意识!学会在创建地图,登上子刊并最终在大脑中绘制出一张环境地图,里面包含建筑物、街道、标志等相互之间的位置关系。这种在大脑中构建空间地图的能力是人类更高级认知类型的基础:例如,有理论认为,语言是由大脑中类似地图的结构编码的。
然而,即使是最先进的人工智能和神经网络,也无法凭空构建这样的地图。
计算生物学助理教授、HeritageMedical研究所研究员MattThomson说:「有一种感觉是,即使是最先进的人工智能模型,也不是真正的智能。它们不能像我们一样解决问题;不能证明未经证实的数学结果,也不能产生新的想法。」
「我们认为,这是因为它们无法在概念空间中导航;解决复杂问题就像在概念空间中移动,就像导航一样。人工智能做的更像是死记硬背——你给它一个输入,它给你一个回应。但它无法综合不同的想法。」
最近,Thomson实验室的一篇新论文发现,神经网络可以使用一种叫做「预测编码」的算法来构建空间地图。该论文于7月18日发表在《自然-机器智能》(NatureMachineIntelligence)杂志上。
论文地址:https://www.nature.com/articles/s42256-024-00863-1代码地址:https://github.com/jgornet/predictive-coding-recovers-maps在研究生JamesGornet的带领下,两人在游戏《我的世界》(Minecraft)中构建了环境,将树木、河流和洞穴等复杂元素融入其中。他们录制了玩家随机穿越该区域的视频,并利用视频训练了一个配备预测编码算法的神经网络。

他们发现,神经网络能够学习Minecraft世界中的物体彼此之间是如何组织的,并且能够「预测」在空间中移动时会遇到的环境。
预测编码算法与Minecraft游戏的结合成功地「教会」了神经网络如何创建空间地图,并随后使用这些空间地图来预测视频的后续帧,结果预测图像与最终图像之间的均方误差仅为0.094%。
更重要的是,研究小组「打开」了神经网络(相当于检查内部结构),发现各种物体的表征是相对于彼此进行空间存储的。换句话说,他们看到了存储在神经网络中的Minecraft环境地图。
神经网络可以导航人类设计者提供给它们的地图,例如使用GPS的自动驾驶汽车,但这是人类首次证明神经网络可以创建自己的地图。这种在空间上存储和组织信息的能力最终将帮助神经网络变得更加「聪明」,使它们能够像人类一样解决真正复杂的问题。
这个项目展示了人工智能真正的空间感知能力,而这在OpenAI的Sora等技术中仍然看不到,后者存在一些奇怪的故障。
JamesGornet是加州理工学院计算与神经系统(CNS)系的学生,该系涵盖神经科学、机器学习、数学、统计学和生物学。
「CNS项目确实为James提供了一个地方,让他从事其他地方不可能完成的独特工作,」Thomson说。「我们正在采用一种生物启发的机器学习方法,让我们能够在人工神经网络中反向设计大脑的特性,我们希望反过来了解大脑。在加州理工学院,我们有一个非常容易接受这类工作的社区。」
执行预测编码的神经网络
受预测编码推理问题中隐式空间表示的启发,研究者开发了一个预测编码智能体的计算实现,并研究了该智能体在探索虚拟环境时学习到的空间表示。
他们首先使用Minecraft中的Malmo环境创建了一个环境。物理环境的尺寸为40×65格单位,囊括了视觉场景的三个方面:一个山洞提供了一个全局视觉地标,一片森林使得视觉场景之间具有相似性,而一条带有桥梁的河流则限制了智能体如何穿越环境(图1a)。
智能体遵循路径,路径由A*搜索确定,以找到随机取样位置之间的最短路径,并接收每条路径上的视觉图像。
为了进行预测编码,作者构建了一个编码器-解码器卷积神经网络,编码器采用ResNet-18架构,解码器采用转置卷积的ResNet-18架构(图1b)。编码器-解码器架构使用U-Net架构将编码的潜在单元传递到解码器中。多头注意力处理编码潜在单元序列,以编码过去的视觉观察历史。多头注意力有h=8个头。对于维度为D=C×H×W的编码潜在单元,在高度H、宽度W和通道C的情况下,单个头部的维度为d=C×H×W/h。
预测编码器通过最小化实际观测值与预测观测值之间的均方误差来近似预测编码。预测编码器在82,630个样本上进行了200个epoch训练,使用了具有Nesterov动量的梯度下降优化,权重衰减为5×10^(-6),学习率为10^(-1),并通过OneCycle学习率调度进行调整。优化后的预测编码器预测图像与实际图像之间的均方误差为0.094,具有良好的视觉保真度(图1c)。
更多细节请参见原论文。
参考链接:
https://techxplore.com/news/2024-07-neural-network-minecraft.html
https://www.tomshardware.com/tech-industry/artificial-intelligence/neural-network-learns-to-make-maps-with-minecraft-code-available-on-github
Tags: 神经网络也有空间意识!学会在创建地图登上子刊
版权声明: 感谢您对【奚诗百科网】网站平台的认可,无特别说明,本站所有文章均归【奚诗百科网】平台所有,转载请说明文章出处“来源【奚诗百科网】”。 https://sptgyg.com/post/12670.html
最近发表
- 文学常识100个,从古至今的文学知识宝库
- 索尼T700,一款时尚与性能兼备的数码相机
- 文学常识,让生活更有诗意
- vivo手机最新款的价格指南,了解最新型号及其价值
- 三星i9228,智能手机界的全能战士
- 经典再现,苹果iPhone 4S的外观与设计解析
- 云中的城堡,音乐剧的魅力与创新之旅
- 音乐剧猫,主题曲的魅力与魔力
- 芝加哥,百老汇音乐剧的经典之作
- 探索魅族魅蓝3,小身材,大能量
- 芝加哥,百老汇音乐剧的璀璨明珠
- 文学常识一百条,开启你的文学之旅
- 穿越时空的课堂,小学生必背历史知识
- 在线毛笔书法字体生成,传统艺术与现代科技的完美融合
- 文学世界的探险,五年级的文学常识之旅
- 五年级学生必知的文学常识,开启文学世界的大门
- 探索在线毛笔字生成,传统艺术与现代技术的完美融合
- 书籍编码查询,解锁图书世界的钥匙
- 百老汇音乐剧芝加哥,演员的魅力与舞台艺术的融合
- 书籍书号查询,解锁知识宝库的金钥匙
- 全面评测,联想ThinkPad X1系列—商务精英的移动办公利器
- 探索书籍编号查询网站,数字化时代的阅读新助手
- 探索书籍编号查询系统的奥秘,你的图书馆新伙伴
- 探索在线字体设计,如何生成个性化的毛笔字效果
- 变身怪医音乐剧开票,经典故事的现代演绎,一场视听盛宴即将启幕
- 图书编号对照,图书馆的魔法钥匙
- 图书编号,解密图书馆的语言
- 图书编号模板,图书馆的身份证系统
- 图书编目,艺术与科学的结合
- 潮起东方,音乐的浪潮,伴奏的艺术
- 大专专业选择指南,探索适合你的职业道路
- 联想U410笔记本电脑,轻薄便携与性能的完美结合
- 大专专业选择指南,揭秘最无用三大专业
- 探索出版图书编号,书籍的身份证及其奇妙旅程
- 探索图书馆的秘密,文学类索书号的指南
- 潮起东方,一首描绘时代精神的歌曲
- 文学类书籍的编号,探索图书分类的奥秘
- 探索三星6200,您的智能生活新伙伴
- 华为荣耀10x,性能与设计的完美融合
- 技校十大吃香专业,未来就业市场的黄金选择
- 探索文学宝藏,文学类书籍的分类与编号系统
- 潮起东方,用音符唤醒东方巨龙的觉醒
- 潮起东方,音乐的力量与时代的精神
- 文学宝库的钥匙,轻松掌握文学类书籍编号的艺术
- 佳能相机全解析,从经典到现代,型号、上市时间与价格一览
- 文学类书籍分类,探索文学宝库的指南
- 探索Lumia 750,一款智能手机的前世今生
- 经典依旧,探究苹果4s的现代价值
- 烹饪专业专升本考试科目全解析,如何准备和成功
- 青岛单招培训,揭秘青岛地区优质单招培训机构及其特色