林洲汉 副教授

1721024526525167.png

讲者简介:林洲汉,理学博士、上海交通大学John Hopcroft计算机科学中心副教授、副主任,国家海外高层次青年人才、上海市浦江学者。博士师从于深度学习领域图灵奖得主Yoshua Bengio,目前主要从事机器学习与自然语言处理等方向的研究,已发表学术论文60余篇,谷歌学术总引用量9000余次。他曾于Facebook AI ResearchFAIR)、Google AIMicrosoft ResearchIBM Watson等核心AI研究部门实习或工作。担任Journal of Machine Learning ResearchJMLR)、IEEE Transactions on Audio, Speech and Language ProcessingTASLP)、 IEEE Transactions on Neural Networks and Learning SystemsTNNLS)等国际权威期刊的审稿人,ICLRNeurIPSICMLAAAIACLEMNLPNAACLAACL等国际顶级会议的审稿人,以及EMNLPAAAIAACLCOLING会议的领域主席。

报告题目:从多模态联合预训练到多模态大语言模型:架构、训练、评测

报告摘要:GPT-4的“大视觉语言模型”是最近多模态领域的热潮。目前的大模型,包括BLIP-2MiniGPT4LLaVALynx等等,已经展现了令人惊喜的能力。这些模型可以回答图片相关的问题,做OCR,理解网上的梗图,但也会产生幻觉(object hallucination)而胡言乱语。本次报告介绍大视觉语言模型发展的三个阶段,即多模态联合预训练、以语言模型为中心的大视觉语言模型和原生大视觉语言模型,并介绍课题组推出的多模态大模型评测基准(Reform-Eval)。


你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.