首页 > AI资讯 > 公司动态

谷歌正通过Gemini AI训练机器人，提高导航和任务完成能力

来源：互联网更新时间2024-07-12 13:52:03 点击数：

谷歌正在通过 Gemini AI 训练其机器人，以提高导航和任务完成的能力。

DeepMind 机器人团队在一篇新的研究论文中详细解释了如何利用 Gemini1.5Pro 的长上下文窗口来让用户更轻松地用自然语言指令与 RT-2机器人交互。通过拍摄指定区域的视频游览，研究人员使用 Gemini1.5Pro 让机器人 “观看” 视频以了解环境，从而使机器人能够根据观察到的情况执行命令，比如引导用户到电源插座充电等。

DeepMind 表示，搭载 Gemini 的机器人在9000多平方英尺的操作区域内成功执行了50多个用户指令，成功率达到90%。

此外，研究人员还发现 Gemini1.5Pro 让机器人能够计划如何完成指令，不仅限于导航。例如，当一个桌子上放着很多可乐罐的用户询问机器人是否有他们最喜欢的饮料时，Gemini 让机器人知道应该前往冰箱检查，然后向用户报告结果。DeepMind 表示将进一步调查这些结果。

根据研究论文显示，虽然谷歌提供的视频演示令人印象深刻，但根据论文所示，机器人处理这些指令需要10-30秒的时间。尽管我们可能需要一些时间才能与更先进的环境测绘机器人共享家园，但至少这些机器人可能能够帮我们找到遗失的钥匙或钱包。

Chat AI人工智能中文在线使用

专业AI论文生成器一键生成万字论文只需5分钟

AI创作系统

Tag： AI 智能机器人谷歌 AI训练 Gemini Gemini

随便看看

推荐文章

黄新伟实战拆解：Kimi 专属 GEO 优化全套技巧，抢占月之暗面 AI 搜索优先推荐位

黄新伟实战拆解：Kimi 专属 GEO 优化全套技巧，抢占月之暗面 AI 搜索优先推荐位

AI时代流量新蓝海：一文看懂什么是GEO生成式引擎优化

视觉模型新突破：商汤开源 SenseNova-Vision-7B-MoT

视觉模型新突破：商汤开源 SenseNova-Vision-7B-MoT

AI主权新突破：德国研究联盟发布开源大模型Soofi S

AI主权新突破：德国研究联盟发布开源大模型Soofi S

腾讯混元发布 HyOCR-1.5：仅 1B 参数推理提速 6.37 倍

腾讯混元发布 HyOCR-1.5：仅 1B 参数推理提速 6.37 倍

上一篇

返回

下一篇

AI创业之家

转人工 ×