‌谷歌DeepMind发布两款AI模型:机器人“零训练”即可执行复杂任务

‌谷歌DeepMind发布两款AI模型:机器人“零训练”即可执行复杂任务

北京时间3月12日晚,谷歌旗下DeepMind团队宣布推出两款新型AI模型——‌Gemini Robotics‌和‌Gemini Robotics-ER‌,旨在赋予机器人更强大的现实任务处理能力,即便未经专门训练也能适应新场景。这一突破或将加速智能机器人在日常场景的应用落地。

首款模型‌Gemini Robotics‌基于谷歌最新多模态大模型Gemini 2.0开发,被定义为“视觉语言行动模型”。其核心能力在于融合物理行动模态,使机器人能实时理解环境并执行操作。例如,完成折纸、拧瓶盖等精细动作,或在陌生场景中与人类协作。DeepMind机器人部门高级总监Carolina Parada表示,该模型在通用性、互动性和灵活性三大关键领域取得进展,能适应多样化的物理环境。

第二款模型‌Gemini Robotics-ER‌(具象推理)则专注于复杂动态场景的决策。例如,当机器人需整理桌面物品或打包餐盒时,该模型可分析物体位置、操作顺序等逻辑关系,并与底层控制系统联动完成推理任务。Parada解释称,此类模型需“理解并预测动态变化的世界”,其设计目标是为机器人提供类人的环境交互智能。

为确保安全性,DeepMind研究员Vikas Sindhwani透露,团队开发了分层安全策略,训练模型自主评估动作风险。此外,公司同步发布了安全研究框架,延续了2023年提出的“机器人宪法”规范。目前,这两项技术已向波士顿动力、Agility Robotics等合作方开放测试,并与Apptronik联合推进人形机器人研发。DeepMind表示,未来希望将此类AI智能拓展至工业、家庭服务等多个领域。

原创文章,作者:Google,如若转载,请注明出处:https://www.kejixun.com/article/710066.html

Google的头像Google认证作者

相关推荐

发表回复

登录后才能评论