李弘扬

报告题目:闭环反馈机制的机器人操控任务思考

报告摘要:

对于具身多模态模型而言,良好的视觉表征能力是其理解环境的基础,它的效果很大程度上依赖于视觉表征的质量和表现力,因此视觉表征预训练方法尤为重要。考虑到机器人数据的稀缺性,可利用大规模人类视频数据集来提取可泛化特征,用于视觉驱动的运动控制策略学习。本次报告将深入讲解视觉表征预训练方法Learning Manipulation by Predicting Interaction (MPI)。MPI通过预测交互帧以及定位交互对象,使模型对于“如何交互”和“在哪里交互”有了更好地理解,增强了编码器捕捉操作过程中的行为模式及交互特征的能力。在多个下游机器人任务上,MPI相比于R3M、MVP、Voltron等表征学习方法取得了显著的提升。

报告人简介:

李弘扬博士攻克端到端自动驾驶核心难点,提出UniAD技术方案,获得IEEE CVPR 2023最佳论文奖。UniAD在工业界和学术界都产生了明显的社会经济效益,包括特斯拉推出的FSD V12。他提出的俯视图感知工作BEVFormer,获得了2022年百强影响力人工智能论文榜单,并得到英伟达CEO黄仁勋、Mobileye CEO Shashua教授在相关公开演讲的单独提及。他是《自然·通讯》审稿人,IEEE汽车委员会自动驾驶国际标准工作组组长。

你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.