黄萱菁 教授

黄萱菁.png

个人简介:黄萱菁,复旦大学教授、国家“万人计划“科技创新领军人才。主要从事人工智能、自然语言处理和信息检索研究。兼任中国中文信息学会理事、中国计算机学会自然语言处理专委会主任、计算语言学学会亚太分会副主席。近年来承担了多项国家级/省部级科研项目,在国际重要学术刊物和会议发表论文200余篇,被引2万余次,8次入选优秀论文奖。获钱伟长中文信息处理科学技术奖、上海市优秀学术带头人、上海市育才奖、人工智能全球女性学者、福布斯中国科技女性等多项荣誉。

报告题目:大模型对齐技术初探

报告摘要:大模型对齐指的是优化大模型的行为和输出,使其符合人类意图和价值伦理的过程,对确保生成式人工智能的安全性和可靠性具有重要意义。该报告聚焦于大模型的能力与价值对齐,首先探讨如何通过基于人类反馈的强化学习算法,利用人类偏好数据训练奖励模型,再使用近端策略优化等算法将复杂的人类价值观和伦理原则注入大模型,实现模型的价值对齐;然后讨论如何通过人类偏好学习多角度提升大模型能力,确保模型在处理复杂任务时的安全性、公平性和透明度;之后介绍复旦大学团队所研发的对话式大模型和多模态大模型,分享如何将大模型有效应用于各类现实场景,如智能助手、多模态交互等。


你知道你的Internet Explorer是过时了吗?

为了得到我们网站最好的体验效果,我们建议您升级到最新版本的Internet Explorer或选择另一个web浏览器.一个列表最流行的web浏览器在下面可以找到.