米兰·(milan)中国官方网站-讲座预约丨四位专家大论道 :大模型时代的强化学习丨GAIR live
站于科技立异的海潮之巅,咱们见证了人工智能范畴的巨年夜奔腾,特别是年夜模子技能与强化进修中的联合及冲破性运用,正于引领咱们进入一个全新的智能时代。
于已往几年中,强化进修作为人工智能的一个主要分支,已经经从理论研究的深奥殿堂走向了实践运用的广漠六合,从试验室的关闭空间走向了咱们一样平常糊口的各个角落。于主动驾驶、游戏AI、呆板人节制等范畴,强化进修的身影无处不于,它们正慢慢成为咱们糊口中不成支解的一部门。
而当咱们瞻望将来时,年夜模子技能将于强化进修范畴饰演何种脚色?它们将怎样进一步联动,鞭策强化进修及年夜模子技能的成长,使其越发智能、高效,并更好地办事在人类社会?
这些问题不仅引发了科技界的无穷联想,也引领着咱们不停摸索及进步。跟着年夜模子技能的不停前进,咱们有理由信赖,将来的强化进修将越发切近人类的需求,成为咱们糊口中越发慎密的互助伙伴。
为了深切剖析这一话题,雷峰网将在8月28日(周三)晚间8点~10点,举办一场主题为「年夜模子时代的强化进修」的线上圆桌论坛。

本次论坛侥幸约请到了:新加坡南洋理工年夜黉舍长讲席传授,人工智能系主任安波传授、南京年夜学人工智能学院俞扬传授、天津年夜学智能与计较学部、华为诺亚决议计划推理试验室主任郝建业副传授、清华年夜学交织信息研究院许华哲助理传授,将分享他们的深刻看法及最新研究结果。
于这场论坛中,咱们将深切切磋如下几个焦点议题:
全世界视线下的冲破: 于海内外,哪些学术团队及工业团队于强化进修范畴取患了显著成绩?他们的研究结果怎样鞭策了这一范畴的成长?
年夜模子的交融与立异: 怎样使用年夜模子技能晋升强化进修的效率及智能性?于这一历程中,咱们面对哪些技能难题,又是怎样逐一降服的?
强化进修的现实运用: 强化进修技能于主动驾驶、游戏AI、呆板人节制等范畴有哪些乐成的运用案例?这些运用怎样转变了咱们的糊口?
将来趋向与挑战: 跟着技能的不停前进,强化进修将面对哪些新的挑战及机缘?咱们应该怎样预备迎接这些变化?
技能与伦理的均衡: 于强化进修技能快速成长的同时,咱们应该怎样确保技能的伦理性及可连续性?
添加筹谋人 岑峰 微信(微旌旗灯号:8019788),备注“姓名+职位”,便可约请进入专家群,及时交流与发问。
佳宾先容

安波,南洋理工年夜学计较机科学与工程学院校长讲习传授、人工智能系主任
安波博士现任南洋理工年夜学计较机科学与工程学院校长讲席传授、人工智能系主任,人工智能研究院联席院长。重要研究范畴包括人工智能、多智能系统统、算法博弈论、强化进修和优化。他是国际人工智能顶级期刊 AIJ、JAIR、JAAMAS 等副主编,有 150 余篇论文发表于人工智能范畴的国际顶级集会 AAMAS、IJCAI、AAAI、ICAPS、KDD、UAI、EC、WWW、ICLR、NeurIPS、ICML,前后屡次得到集会卓异论文奖,于国际评测角逐中也屡获佳绩。他于人工智能范畴内有主要影响力及专业承认度,2018 年入选 IEEE Intelligent Systems 杂志评比的“AI’s 10 to watch”。他将担当IJCAI’27的步伐委员会主席。

俞扬,南京年夜学人工智能学院传授
俞扬博士现任南京年夜学人工智能学院传授,博士生导师。重要研究范畴为人工智能、呆板进修、强化进修、演化进修。配合出书专著《Evolutionary Learning: Advances in Theories and Algorithms》(2019)和此中文版本《演化进修:理论与算法进展》(2021)。于Artificial Intelligence、TPAMI、TKDE、TNNLS、NeurIPS、ICML、IJCAI、AAAI、KDD等人工智能、呆板进修及数据挖掘国际顶级期刊及顶级集会发表多篇论文,研究结果得到DAI 23 Best Paper、IDEAL 16 Best Paper、KDD 12 Best Poster、GECCO 11 Best Theory Paper、PAKDD 08 Best Paper等论文奖,得到ICAPS 21 L2RPN with Trust冠军、OpenAI RetroContest 2018冠军、PAKDD’06数据挖掘竞赛冠军等竞赛奖。

郝建业,华为诺亚决议计划与推理试验室主任,天津年夜学智算学部副传授
郝建业博士,华为诺亚决议计划推理试验室主任,天津年夜学智算学部副传授。重要研究标的目的为深度强化进修、多智能系统统。发表人工智能范畴国际集会及期刊论文100余篇,专著2部。 主持国度科技部2030人工智能庞大项目课题、基金委人工智能庞大培育项目、国防科技立异重点项目课题等项目10余项,研究结果荣获国际集会最好论文奖3次,NeurIPS20-22年夜会竞赛冠军4次。相干结果于工业基础软件智能化、主动驾驶、游戏AI、告白和保举、5G优化、物流调理等范畴落地运用。

许华哲,清华年夜学交织信息研究院助理传授
许华哲博士现任清华年夜学交织信息研究院助理传授,博士后就读在斯坦福年夜学,博士卒业在加州年夜学伯克利分校。其研究范畴是具身人工智能(Embodied AI)的理论、算法与运用,详细研究标的目的包括深度强化进修、呆板人学、基在感知的节制(Sensorimotor)等。其科研缭绕具身人工智能的要害环节,体系性地研究了视觉深度强化进修于决议计划中的理论、模拟进修中的算法设计及高维视觉猜测中的模子及运用,对于解决具身人工智能范畴中数据效率低及泛化能力衰等焦点问题做出多项孝敬。其发表顶级集会论文四十余篇,代表性事情曾经被MIT Tech Review,Stanford HAI等媒体报导。
讲座信息
主题: 年夜模子时代的强化进修
时间: 8月28日(周三),北京时间20:00-22:00
不雅看方式:「雷峰网」视频号 与 「AI科技评论」 视频号同步直播
参考资料:
1,TWOSOME: An Efficient Online Framework to Align LLMs with Embodied Environments via Reinforcement Learning
https://gairdao.com/doi/10.1142/S2972335324500042
2,《对于话南洋理工年夜学安波传授:怎样让年夜语言模子顺应动态情况?丨IJAIRR》https://mp.weixin.qq.com/s/85TOawIFQ6uZaGXR4Y2RCA
IJAIRR正于邀约论文及专题
《International Journal of Artificial Intelligence and Robotics Research》(简称IJAIRR),是由新加坡GAIR研究院与世界科技出书社(WSP)结合出书的国际学术期刊。
作为全世界首本专注在人工智能(AI)、呆板人技能(Robotics)以和基础科学交织研究(Research)的期刊,IJAIRR致力在成为AI与呆板人范畴研究的权势巨子发布平台。
IJAIRR接待各种研究论文、评论文章、短篇论文、书评以和专题(Special Issue)情势的投稿。咱们尤其存眷那些于顶级AI集会上发表并现场展示,但缺少持久沉淀平台的优异论文。为了给这些论文和其作者提供一个更广泛的发表及推广渠道,IJAIRR现正踊跃邀约相干论文投稿。
假如您于本事域顶级集会上发表的文章(或者行将发表)不跨越一年,咱们将协助您稍作修改后于IJAIRR期刊上发表。
假如您带领的团队于顶级集会上有多篇论文发表,并但愿于IJAIRR上缭绕特定主题筹谋一个专题(Special Issue),咱们诚挚约请您深切会商互助事宜。
假如您是顶级集会的构造者,并成心与IJAIRR互助,针对于特定集会筹谋一个专题(Special Issue),咱们也期待与您详细参议互助细节。
IJAIRR期待与您联袂,配合鞭策人工智能与呆板人研究的成长。
接洽人:IJAIRR创刊主编朱晓蕊博士,xiaorui_zhu@gair.sg
关在期刊创刊主编等更多信息,可点击https://mp.weixin.qq.com/s/gEctQolbEqqf2eVwBAkdoA
关在雷峰网(公家号:雷峰网)(公家号:雷峰网)、GAIR年夜会、GAIR研究院(期刊及于线社区)的具体先容,请浏览朱晓蕊传授的专访:
https://mp.weixin.qq.com/s/Qn7Gc3rVijQhhK0hTSrgxw
IJAIRR期刊的主页链接为:
https://gairdao.com/journals/ijairr
雷峰网原创文章,未经授权禁止转载。详情见转载须知。





