米兰·(milan)中国官方网站-专访GAIR研究院院长朱晓蕊:以Web3技术为引擎,推动「去中心化科学期刊」的新时代
作为一位创投配景的学术带头人,朱晓蕊方才迎来她的47岁人生。
从学术成绩看,1977年出生的朱晓蕊,前后于1998年及2000年取患上哈尔滨工业年夜学学士及硕士学位,2006年,她于美国犹他年夜学得到博士学位,具备电机一体化及机械工程多重配景;学成归来后,朱晓蕊进入哈尔滨工业年夜学(深圳)任教,2011年被破格评为博士生导师,2014年被评为正传授。
于她担当哈工年夜传授的14年中,作为项目卖力人主持了不少国度级项目,总经费跨越万万,并屡次介入构造了呆板人范畴的全世界顶级学术集会,曾经被IEEE评价为“呆板人范畴的卓异女性”。
从创投成绩看,她是“全世界无人机霸主”年夜疆前首席科学家、“港股激光雷达第一股”速腾聚创首席科学家、呆板人公司年夜道智创的结合开创人及投资人、自立驾驶导航技能研发商一清立异的开创股东。一拿资金二拿技能,走出了一条“导师+学生”的独角兽孵化之路。
但业内少有人知的是,朱晓蕊还有是中国科技媒体雷峰网开创人林军的另外一半。两人在2011年于深圳建立雷峰网(公家号:雷峰网),五年后结合大作院士、徐扬生院士等人配合倡议海内第一个具备全世界视线的年夜型AI论坛——全世界人工智能与呆板人年夜会(GAIR)。
作为历届年夜会的组委会主席或者步伐主席,朱晓蕊所积攒的人脉图谱被再次开释。她曾经定下佳宾约请的三条准则:
一是海内于某个研究标的目的上的知名院士、
二是海外包括华人于内的某一范畴的领甲士士、
三是于以科技立异为特点,有很强学术配景的至公司任职的知名科学家。
她暗示,“之前,学术界、工业界、投资界各自为营,年夜部门人感觉这三个范畴是彻底分隔的。但于咱们的会上,这三界的交融必然要成为年夜会一个新看点。”
科技圈内用一句话总结朱晓蕊:不会创业的传授不是好的投资人,技能身世的她长于联手一众学术界、财产界、投资界人士,投身中国硬科技财产化的汗青进程。

新加坡GAIR研究院院长朱晓蕊博士
2023年,除了了传授、投资人、结合开创人以外,朱晓蕊有了第四个身份--学术期刊创刊主编--《人工智能与呆板人研究国际期刊》(IJAIRR)。
IJAIRR是全世界第一本聚焦于人工智能(AI)、呆板人(R)以和基础科学研究范畴(R)的跨学科国际学术期刊。延续以往思绪,这本期刊将重点存眷来自产学研各界的研究进展,而且入选该期刊的优异作者,将会受邀于GAIR年夜会上作主题演讲。
但差别在其他期刊,“鼓动勉励互动”是IJAIRR最年夜的特色,即以“去中央化科学”为焦点理念,采用激励方式倡导科学家公然分享及会商他们的研究。
期刊主页链接:https://gairdao.com/journals/ijairr
近日,经科学论证、严酷评审、扎实筹办,首期五篇论文已经上线。借此契机,雷峰网对于话朱晓蕊传授,深切切磋了她的人生履历、创刊过程,以和扼要先容首期收录论文。
揭秘创刊心路Q:朱教员,起首请您讲一讲,作为一位有产学研投配景,介入构造过量届年夜型科技峰会的女性科学家,为什么于此刻这个时间点决议开办一本学术期刊?
朱晓蕊:我于2021年就有创建一本“人工智能+呆板人+基础科学”聚焦交织学科的国际期刊的设法,并于2022年下半年最先筹办。其时我先接洽了新加坡世界科技出书集团的董事会主席潘国驹传授。
这个出书社是他一手创建,如今已经经成为亚洲最年夜的科学出书社之一。这是咱们初次正式互助,但我很早就对于他们的学术出书及期刊有所相识,潘国驹传授很是承认及撑持我,便向我保举了他们出书社的总司理李志伟博士。
紧接着我最先选择结合主编人选,接洽持久从事人工智能、呆板人或者基础科学等跨学科研究的学者。
我与孙宇传授熟悉多年,他于呆板人抓取研究范畴体现精彩,已往几年曾经来GAIR年夜会做过演讲,效果很好,还有担当过年夜会的session chair,是以是结合主编的抱负人选之一。但我但愿于期刊的研究标的目的上拥有多样化的团队。
人工智能与医学联合是一个有趣的范畴,并经由过程伴侣的先容接洽到了于这个范畴造诣颇深的许东传授。于会商后,许东传授认为该期刊于定位上怪异,没有其他近似的刊物,便很爽直地允许了作为结合主编的约请。并且于后续历程中他很是有热忱,咱们一路会商了期刊的运作模式。

人工智能与呆板人研究国际期刊(IJAIRR)建立典礼,李志伟、孙宇、朱晓蕊、许东
更为要害的是,许东及孙宇两位传授于已往的职业生活生计中,曾经经担当过很多顶级期刊的编纂,他们对于期刊的运作有富厚的经验,知道怎样治理及运营一个期刊。这是咱们能顺遂做统一件事的主要缘故原由。
Q:能先容下《人工智能与呆板人研究国际期刊》(IJAIRR)吗,包括这本期刊的定位及面向对于象?
朱晓蕊:这本期刊虽然于新加坡创建,并且互助出书社的董事会主席潘国驹是华侨首脑,结合主编们也是华人配景,但咱们的期刊其实不是专门面向华人。
可以理解为,这是一个由华人科学家构造的,面向人工智能、呆板人和基础科学研究的交织范畴的期刊,但咱们的方针是成为一个全世界性的平台,吸引来自差别国度及地域的科学家介入投稿及浏览。
为了具备全世界影响力,期刊的编委成员应该具备多样性,笼罩差别的地区及国度,以反应全世界规模内的科学研究。并且期刊于新加坡建立也会放年夜这类国际上风。新加坡作为一个毗连亚洲、欧洲及北美的主要流派,具备怪异的地舆位置上风。
我但愿经由过程于新加坡设立期刊,吸引更多的国际科学家及读者介入进来,揭示多种文化及研究配景的视角。将来IJAIRR期刊与GAIR年夜会是相辅相成的瓜葛,优异的期刊作者会约请到年夜会做演媾和宣传,也有助在促成全世界规模内的学术交流及互助。
Q:这个期刊及雷峰网GAIR年夜会有何接洽?从雷峰网2011年景立,到2016年开办GAIR年夜会,一直到2023年景立GAIR研究院,开办期刊,暗地里是如何的蜕变成长逻辑?
朱晓蕊:雷峰网最初以智能手机和其生态为重点,跟着时间的推移,其存眷范畴逐渐扩大到更广泛的深科技范畴。
2016年,雷峰网开办了GAIR全世界人工智能与呆板人年夜会,目的是促成学术界、财产界、投资界以和处所当局的交流与互助,鞭策产学研的深度交融。由于已往它们之间存于较着的隔膜及界限。
学术界往往专注在本身的学术研究,工业界则存眷产物研发及进级,而处所当局则存眷宏不雅政策及财产计划。这类隔膜及界限的存于,致使三方之间的交流及碰撞时机很少。
好比学术界的人所做的研究本来只需要获得偕行的承认,界限就到这了。可是你把这些工具拿给工业界的人看,给当局做宏不雅政策的人看,他们是甚么设法、他们认不承认这个工具、或者者是从他们的角度对于你有些甚么样的建议。
工业界的人也是同样的。特别是于中国工业界,之前各人自立研发的工具其实不太多,后面逐步地跟着整个财产去做进级,工业界的人发明本来那种粗放的方式已经经不克不及见效了,必需要有自立研发,是以会第一时间想到要跟学术界形成对于接。
为了把整个财产进级的生态链条搭建起来,雷峰网于2016年举办了GAIR年夜会,旨于搭建一个学术界、财产界、投资界及当局之间的交流平台。可以说这是一个各界双向奔赴的历程。2023年GAIR研究院的建立,是于GAIR年夜会基础长进一步深化这类跨界互助,经由过程各类方式将集会内容的英华部门沉淀下来。
集会竣事后,会商及交流的内容往往很难被生存及延续。是以,咱们决议创立一个于线的社区及一本高质量期刊,以便更好地将集会中的会商及交流内容举行收拾及生存。如许可以促成学术交流及互助,并使更多的学者可以或许分享他们的研究结果。
Q:为何这件事是你来做?于您本身此前修业及博导履历中,您及财产界、投资界的互动就比力多了,并且还有鼓动勉励学生去开办公司,以是从你小我私家来讲,甚么触动了你去做“桥梁”的事情?
朱晓蕊:我是2006年末博士卒业从美国回来的,2007年正式最先于哈工年夜深圳研究生院做教员,正好是深圳市财产转型的要害期间。其时,深圳市重要因此低端制造业为主,而当局但愿将其转向高端财产。
深圳市当局但愿经由过程设置装备摆设年夜学城来吸引优异的高校及学生,以鞭策财产进级,以是最早才有了哈工年夜、北年夜、清华三个黉舍的深圳研究生院(没有本科)。
我其时也是由于这个工作,于深圳最先了我做教员的生活生计。2002年哈工年夜与深圳共建建立研究生院,因为建立早期全职教员的数目相对于较少,试验室的研究标的目的有限,而每一位研究生必需重新到尾完成一项研究课题才能到达卒业要求。
只管深圳市有财产进级的需求,但其时拥有研发的企业其实不多,在是我最先思量怎样让学生介入到更成心义的项目中,而不是仅仅去企业里做一些反复性的低端技能事情。
是以,我那时辰鼓动勉励学生于完成基础课程学业后开办公司,将前沿课题转化为创业项目。经由过程这类方式,学生可以于创业历程中完成卒业论文,又能为财产进级做出孝敬。
这个历程中,我加深了对于工业界的相识,也促使我梳理出一种学术研究与财产实践联合的模式。已往咱们于黉舍试验室里做了许多工具,但往往被华侈失了,许多研究结果被弃捐,没有进一阵势转化为运用。
特别是咱们偏工程的一些学科,做出来的许多研究结果差未几就是 3 到 5 年的生命周期。也就是说,假如这3 到 5 年以内,你这个结果没有去更进一阵势转化成运用,很年夜可能就会过时了。
以是其时年夜概5年摆布我会换一个新的课题标的目的。是以黉舍的传授们可以引领研究标的目的,去找财产界里的缝隙、短板、持久需要进级之处,然后把后续的财产转化时机交给有兴致有能力的学生,这于某种水平上也是一种传承。
总的来讲,我认为与财产界的合作无懈及鼓动勉励学生创业是将研究结果转化为现实运用的主要路子,同时需要不停地更新研究标的目的,连结研究的时效性及价值。
Q:为何要开办一本席卷了AI、呆板人及基础科学的交织研究的期刊,这与您自身的研究标的目的有关吗?朱晓蕊:我本科就读在哈尔滨工业年夜学(哈工年夜),于年夜三时选择进入了黉舍新建立的“电机一体化系”,属在最早建立的一个交织学科的系,哈工年夜呆板人研究所其时就隶属在这个系。这个研究所是黉舍的主要研究机构之一,呆板人研究所的建立标记着黉舍对于呆板人技能这一前沿范畴的器重,此刻基本上算是呆板人范畴的“黄埔军校”了,很多从事呆板人研究的学者及专家都与该研究所有联系关系。
我其时是考研第一位顺遂进入了呆板人研究所读硕士,于那里对于呆板人研究范畴孕育发生了稠密的兴致,并于博士阶段去了美国犹他年夜学做进一步深切研究。
跟着呆板人技能的成长,我意想到呆板人不单单需要存眷身体部门(呆板人的物理布局),还有需要存眷年夜脑部门(即智能决议计划及感知能力),即人工智能。是以,我于博士后半程最先侧重在呆板人+AI标的目的的研究。比及我本身最先自力做研究的时辰,基本上都是于往呆板人与 AI 这个交织标的目的去做。
我其时以做“感知定位技能“最先,感知技能是呆板人+AI标的目的的一个主要分支,触及理解周围情况,包括视觉、听觉、触觉等。我认为,将呆板人与人工智能相联合是一个具备挑战性及远景的范畴,但愿经由过程本身的努力,为这个范畴做出更多的孝敬,咱们此刻开办的这本期刊重点存眷之一即是呆板人学与人工智能范畴的慎密联合。
这本期刊存眷的别的一个重点是AI或者呆板人及基础科学的交织研究,这块是我本身很感兴致可是时间精神所限没有时机开展的跨学科研究标的目的,也是引领将来的研究标的目的。
我信赖人工智能与呆板人技能将成为将来人类社会的基础举措措施。
一方面,更多的基础科学研究会于人工智能与呆板人的赋能下取患上范式转移层面的理论冲破及运用进展。别的一方面,人工智能与呆板人研究的进展也将受益在与差别基础科学的互助,包括数学、物理、生物学、生理学、语言学等。这类彼此影响、彼此成绩才是跨学科研究的魅力地点。
Q:首期上线的五篇论文,能先容它们各自的特色及研究范畴,以和你们的筛选评审历程吗?
朱晓蕊:首期论文很是主要,但愿为后面投稿的作者们提供有利的启迪及借鉴。以是终极入选的论文来自差别国度及地域,包括美国、新加坡及中国,揭示了期刊的国际性。同时,这些论文也代表了AI、呆板人、基础科学范畴的跨学科研究结果,切合期刊的定位要求。
我别离来简朴先容一下IJAIRR首期发表的五篇文章:
Bud Mishra传授的论文《AI, Thinking Machines and A Vast Active Living Intelligent System》
Bud传授来自美国纽约年夜学,是该校Courant数学研究所,Tandon工程学院及医学院的传授,以和西奈山医学院及冷泉港试验室的客座传授,同时也是咱们期刊的编委会声誉参谋。
他持久从事生物信息学研究,以是他从生物学的一些观点类比过来,切磋了生物学开导的AI研究,提出了一种超前的不雅点性文章。我称之为 Biology-inspired AI ,即,该文章立异性地从生物学的维度思索及畅想人工智能的将来,使用信息不合错误称性博弈论的东西去阐发及会商将来人工智能时代人及智能呆板共生的可能性。
论文全文链接:
https://gairdao.com/doi/10.1142/S2972335323020015
田英利传授团队的文章《Multi-Modal Multi-Channel American Sign Language Recognition》
田传授来自美国纽约都会年夜学,2000年先后曾经于卡内基梅隆年夜学呆板人研究所举行博士后研究事情,师从现今计较机视觉及呆板人范畴巨子金出武雄(Takeo Kanade)传授,曾经于 IBM T. J. Watson 研究中央带领视频阐发团队,是工业界走向学术界的主要女性代表。
她的这一论文触及研究AI于语言学范畴的运用(AI for Linguistics),提出了一个基在呆板进修的多流框架,用在从RGB-D视频中及时辨认美国手语(ASL)手动手势及非手动手势(脸部及头部运动)。详细要领是基在3D卷积神经收集(3DCNN),经由过程交融来自多个通道(RGB、深度、运动及骨骼枢纽关头)的多模态特性,包括手势、脸部心情及身体姿式。
论文全文链接:
https://gairdao.com/doi/10.1142/S2972335324500017
Ling Feng传授团队的《Asymptotic edge of chaos as guiding principle for neural network training》
Ling Feng传授来改过加坡高机能计较研究所,使用数学要领研究AI,试图解决AI的“黑箱”问题,即AI决议计划历程的可注释性及理论引导。
论文全文链接:
https://gairdao.com/doi/10.1142/S2972335323500011
周伯文传授团队的文章《Generative AI for Complex Scenarios: Language Models are Sequence Processors》
周伯文传授拥有富厚的前沿研究履历与业界经验,曾经任IBM Research人工智能基础研究院院长、IBM Watson Group首席科学家、IBM卓异工程师、京东集团高级副总裁、集团技能委员会主席、云与AI总裁,2022年从财产界回到学术圈。
本篇论文中,他从宏不雅框架层面会商人工智能运用从解决狭义问题到导航繁杂的实际场景的范式改变。由于如今以GPT-4为代表的年夜型语言模子(LLMs),已经经逾越了语言处置惩罚的传统边界,于理解及天生精妙文本方面体现出了特殊的能力。这篇触及AI 及呆板人的交织研究,也是一篇不雅点类论文。
论文全文链接:
https://gairdao.com/doi/10.1142/S2972335324010014
孙宇传授团队的文章《Consolidating Trees of Robotic Plans Generated Using Large Language Models to Improve Reliability》
孙宇传授来自美国南佛罗里达年夜学计较机科学与工程系,重要研究范畴为呆板人、智能体系、医疗康健运用。他的这篇论文也是AI 及呆板人的交织研究,但差别在周伯文传授,他会商了怎样将AI中的年夜型语言模子运用在呆板人的使命计划,这是一个详细的场景运用研究。
论文全文链接:
https://gairdao.com/doi/10.1142/S2972335324500029
总之,首期发表的五篇文章涵盖了AI与生物学、语言学、数学以和呆板人学的交织研究,不仅存眷AI的详细运用场景,还有切磋了AI的理论基础及可注释性,以和研究范式切磋。并且偕行评审是学术期刊中很是主要的一环,可以确保论文的质量及学术价值。
于咱们的编委会成员中,已经经有Prof Bud Mishra、Prof. Dr.-Ing. Tamim Asfour、Prof I-Ming Chen、ProfessorZhidong Wang等5位编委会声誉参谋,以和15位来自全世界各地的编纂,他们会按照文章的研究范畴及内容,再选择适合的偕行评审者。以确保评审历程的公道性及正确性。
详细可看:
https://www.worldscientific.com/page/ijairr/editorial-board
Q:于这本期刊的运营方式上,您提到了“去中央化科学”“Web3技能撑持”两个词,这对于期刊成长有何影响?
朱晓蕊:这是针对于学术界持久存于的“学术中央化”而提出的一种解决要领,旨于打破学术思惟的不流动性枷锁束缚,促成学术交流及立异。咱们会使用Web 3技能提供的东西来撑持将来于线学术社区的运作。
由于Web 3技能的焦点特色是去中央化,这象征着数据及信息的节制权再也不集中于单一的实体手中,而是分离于收集的各个节点。这类模式有助在促成开放及透明的学术交流。
一个好的学术社区平台是可以或许促成科学出产资料的畅通,包括论文、数据库、试验视频、算法原始代码等。(平台为gairdao.com,今朝还有于设置装备摆设中,将于2024年3月开放测试)帮忙学者们将他们的研究结果推广到更广泛的受众,而不单单是发表于期刊上后就被沉没。如许的平台可以鼓动勉励更多的学术交流及反馈,让学者们可以或许看到他们的事情被现实运用及复现,从而得到偕行的承认及进一步的改良建议。
就像社交媒体上的互动同样,学者们可以于平台上分享他们的进展,获得偕行的点赞及评论。这类互动不仅可以或许晋升研究的可见度,还有可以或许促成学术界的平易近主化,让研究者们可以或许直接从偕行那里得到反馈,而不是仅仅依靠在有限的偕行评审历程。更主要的是,对于在公然分享他们研究并介入社区设置装备摆设的人,咱们会提供响应的经济回报,形成一个良性轮回。
这里就会用到Web3东西中的经济功效。将来社区将会有差别级另外勾当,以激励学者们于差别层面上介入平台上的交流及互助。总的来讲,我假想的去中央化学术社区平台,将有助在促成常识的开放同享,提高研究的透明度及可复现性,同时也为学者们提供了一个越发活跃及互动的学术交流情况。
咱们从已往的GAIR年夜会到此刻的期刊及于线社区,都是为了形成一个完备的学术交流平台,办事在于该范畴的所有人。
Q:末了,请您说说后续期刊的上线进程,以和对于期刊的寄语。
朱晓蕊:咱们规划于每一三个月摆布发布一期,每一年发布四期,也就是每一年的3月、6月、9月、12月。除了了学术界,期刊还有鼓动勉励企业界学者及专家投稿,特别是那些于企业内部研究院从事AIR研究的学者。
因为AIR范畴成长迅速,很多企业都于举行相干研究以连结竞争力。经由过程期刊这个平台,企业界及学术界可以更好地交流及互助,配合鞭策AIR范畴的成长及立异。
末了,我想说,《人工智能与呆板人研究国际期刊》(IJAIRR)是人工智能与呆板人(AIR)范畴,第一本专注在人工智能、呆板人技能及基础科学相联合的跨学科研究的科学期刊。
接待送达IJAIRR期刊,咱们朴拙地但愿你能从浏览文章中获得开导,同时,咱们也接待更多前沿科研职员插手编委团队 ijairr@wspc.com 但愿这本期刊极力做到最佳!
首期论文已经上线论文一
标题问题:《Multi-Modal Multi-Channel American Sign Language Recognition》
作者:Elahe Vahdani、Longlong Jing、Matt Huenerfauth、Yingli Tian(田英利)
择要:In this paper, we propose a machine learning-based multi-stream framework to recognize American Sign Language (ASL) manual signs and non-manual gestures (face and head movements) in real-time from RGB-D videos. Our approach is based on 3D Convolutional Neural Networks (3DCNN) by fusing multimodal features including hand gestures, facial expressions, and body poses from multiple channels (RGB, depth, motion, and skeleton joints). To learn the overall temporal dynamics in a video, a proxy video is generated by selecting a subset of frames for each video which are then used to train the proposed 3DCNN model. We collected a new ASL dataset, ASL-100-RGBD, which contains 42 RGB-D videos captured by a Microsoft Kinect V2 camera. Each video consists of 100 ASL manual signs, along with RGB channel, depth maps, skeleton joints, face features, and HD face. The dataset is fully annotated for each semantic region (i.e. the time duration of each sign that the human signer performs). Our proposed method achieves 92.88% accuracy for recognizing 100 ASL sign glosses in our newly collected ASL-100-RGBD dataset. The effectiveness of our framework for recognizing hand gestures from RGB-D videos is further demonstrated on a large-scale dataset, Chalearn IsoGD, achieving the state-of-the-art results.
要害词:American Sign Language Recognition; Hand Gesture Recognition; RGB-D Video Analysis; Multimodality; 3D Convolutional Neural Networks; Proxy Video
论文援用链接:
https://www.worldscientific.com/doi/10.1142/S2972335324500017#:~:text=Add%20To%20Favorites-,Download%20Citations,-Track%20Citations
论文二
标题问题:《Generative AI for Complex Scenarios: Language Models are Sequence Processors》
作者:周伯文、打发
择要:Large Language Models (LLMs), exemplified by GPT-4, have transcended traditional boundaries in language processing, demonstrating remarkable capabilities in understanding and generating nuanced text. Crucially, these models are pioneering a paradigm shift in AI applications—from solving narrowly defined problems to navigating complex, real-world scenarios. Such a shift is based on a simple and fundamental principle: LLMs can process any data that can be serialized and tokenized, enabling them to engage in multifaceted reasoning and utilize diverse tools. This capability positions LLMs to operate effectively in broader, more intricate contexts, marking a leap in AI s practical applicability and potential.
要害词:Large language models; Generative AI; Complex scenarios
论文援用链接:
https://www.worldscientific.com/action/showCitFormats?doi=10.1142%2FS2972335324010014 area=0000000000000010
论文三
标题问题:《Asymptotic edge of chaos as guiding principle for neural network training》
作者:Lin Zhang、Ling Feng、Kan Chen、Choy Heng Lai
择要:It has been recently demonstrated that optimal neural networks operate near the asymptotic edge of chaos for state of art feedforward neural networks, where its generalization power is maximal due to the highest number of asymptotic metastable states. However, how to leverage this principle to improve the model training process remains open. Here by mapping the model evolution during training to the phase diagram in the classic analytic result of Sherrington–Kirkpatrick model in spin glasses, we illustrate on a simple neural network model that one can provide principled training of the network without manually tuning the training hyper-parameters. In particular, we provide a semi-analytical method to set the optimal weight decay strength, such that the model will converge towards to edge of chaos during training. Consequently, such hyper parameter setting leads the model to achieve highest test accuracy. Another benefit for restricting the model at the edge of chaos is its robustness against the co妹妹on practical problem of label noise, as we find that it automatically avoids fitting the shuffled labels in the training samples while maintaining good fitting to the correct labels, providing simple means of achieving good performance on noisy labels without any additional treatment.
要害词:Complexity science; Deep learning theory; Dynamical systems; Critical phase transitions; Spin Glasses; Order and Chaos
论文援用链接:https://www.worldscientific.com/action/showCitFormats?doi=10.1142%2FS2972335323500011 area=0000000000000001
论文四
标题问题:《Consolidating Trees of Robotic Plans Generated Using Large Language Models to Improve Reliability》
作者:Md Sadman Sakib、Yu Sun(孙宇)
择要:The inherent probabilistic nature of Large Language Models (LLMs) introduces an element of unpredictability, raising concerns about potential discrepancies in their output. This paper introduces an innovative approach aims to generate correct and optimal robotic task plans for diverse real-world demands and scenarios. LLMs have been used to generate task plans, but they are unreliable and may contain wrong, questionable, or high-cost steps. The proposed approach uses LLM to generate a number of task plans as trees and amalgamates them into a graph by removing questionable paths. Then an optimal task tree can be retrieved to circumvent questionable and high-cost nodes, thereby improving planning accuracy and execution efficiency. The approach is further improved by incorporating a large knowledge network. Leveraging GPT-4 further, the high-level task plan is converted into a low- level Planning Domain Definition Language (PDDL) plan executable by a robot. Evaluation results highlight the superior accuracy and efficiency of our approach compared to previous methodologies in the field of task planning.
要害词:Robotics; LLM; GPT-4; Task Planning; PDDL
论文援用链接:https://www.worldscientific.com/action/showCitFormats?doi=10.1142%2FS2972335324500029 area=0000000000000010
论文五
标题问题:《AI, Thinking Machines and A Vast Active Living Intelligent System》
作者:Bud Mishra
择要:Biology-inspired AI: a descriptive discussion of the information-asy妹妹etric game theory of AI, thinking machines and a vast active living intelligent system, and a prescriptive analysis of likely symbiosis of individual humans and bots resulting in a hierarchy of multi-cellularization.
论文援用链接:
https://www.worldscientific.com/action/showCitFormats?doi=10.1142%2FS2972335323020015 area=0000000000000001
后续雷峰网将推出IJAIRR论文作者专访,首篇为纽约都会年夜学田英利传授团队的事情,《多模态多通道的美国手语辨认》。假如你也从事手语事情或者其他医学基础研究,接待添加作者吴彤微信沟通,微旌旗灯号:icedaguniang
雷峰网原创文章,未经授权禁止转载。详情见转载须知。





