米兰·(milan)中国官方网站-Jurassic

作者：米兰·(milan)文化更新时间：2026-03-31 20:47:06 点击数：

Jurassic-X: 让神经模型学会符号推理

解读 | Antonio

编纂丨陈彩娴

近期，一家以色列NLP研究机构AI21 Labs开发了一个名叫Jurassic-X的算法体系，它基在该试验室提出来的MRKL（它与miracle谐音）体系。Jurassic-X的前身是对于标GPT-3的Jurassic-1，然而却降服了它们不擅在推理、更新昂贵、不克不及有用处置惩罚时序数据等错误谬误。

论文地址：https://arxiv.org/pdf/2204.10019.pdf

1MRKL体系

MRKL的全称是模块化推理、常识及语言体系（Modular Reasoning, Knowledge and Language），它试图将现有的神经收集模子，如年夜范围语言模子LLM，及外部常识库，以和已往风行的符号专家体系联合于一路，从而来统筹神经模子及符号推理能力。

这一体系是针对于现有的年夜范围语言模子的诸多错误谬误举行的改良。于GPT-3以和Jurassic-1等年夜范围语言模子举行预练习，以后运用于多个下流使命，经常有两种极度的方式：

（1）多个使命直接经由过程零样本进修的方式举行。这类方式无需更新任何参数，从而包管了多功效性（versatility）；

（2）于每一个使命上都对于在年夜范围语言模子举行微调。这类方式不仅需要年夜量的资源，具备很差的迁徙性，还有会常常致使于一个使命微调完以后，其余使命体现患上很差——灾害性遗忘（catastrophic forgetting）的困境。

基在MRKL体系的Jurassic-X则重要借鉴了近似在prompt learning的方式，来冻结年夜部门模子原本的参数，仅更新一部门使命相干的参数来防止上述问题。以后会对于这块的要领有一个开端的先容。

同时，仅仅依靠神经语言模子，也会有许多素质上的问题：它们对于在外部常识没法高效使用，特别对于在一些时序更新的数据，例如新冠疫情最新的数据以和钱币汇率等信息，它们的推理能力很弱，例如最简朴的算术题（天然语言给出的）有时辰城市犯错。

举例来讲：

Jurassic-X: 让神经模型学会符号推理

问题：于近来的一个月里，哪一家清洁能源公司有最年夜的份额增加？

这是一个组合的“多专家”问题：起首模子会从例如百科库WIKI接口中获取有哪些清洁能源公司，以后它会从日历中获取上个月指的是何时，以和从数据库中获取响应的份额增加；以后于汇总了上述信息后，它可以经由过程一个计较器去计较“最年夜的增加”，末了经由过程语言模子来给出谜底。

要完成这些方针需要练习离散的专家体系，将他们的接口及神经收集之间举行光滑，并于差别的模块之间去选择等等。一些技能细节可以参考先容MRKL的文章，以后会针对于此中于下流使命上的练习方式做一个扼要的先容，更具体的技能细节可以参考论文。

财富杂志从贸易角度阐发了MRKL以和Jurassic-X反应了今世AI的四个趋向：通用性、基在LLM、混淆体系、削减权重练习。

2通用性及基在LLM

MRKL致力在仅利用单一模子解决各类各样的天然语言使命，而其实不是像现阶段许多模子只能解决特定的单一使命，这是朝着通用人工智能的必经之路。例如，一个流利的呆板人对于话体系不单单能顺畅地完成对于话，还有可以同时对于某些话语举行感情阐发。事实上，GPT-3等年夜范围模子已经经显示出它的于多个使命上零样本进修的巨年夜潜力了，而年夜范围语言模子预练习，多个使命同享该模子举行微调早已经成为研究界认识的练习范式了，贸易上紧跟其后，也是预料之中。

对于标GPT-3的LLM：Jurassic-1

3混淆体系

只管基在神经模子的方式得到了使人印象深刻的机能，不外GPT-3于触及到一些哪怕是很简朴的推理时也会犯一些初级过错，特别触及到比力繁杂的语言描写，例如多个数相加；触及到最新的动静，例如纽约此刻的气候。它仅仅从已往练习好的数据中举行揣度气候环境，难以迁徙到新的场景下，而假如用更新的数据，则需要从头练习模子，而这需要巨年夜的价钱。

差别专家体系之间的毗连

是以MRKL利用了代表今世AI于贸易角度下的第三个趋向——利用神经及符号联合的混淆体系。MRKL交融了差别的模块，有些模块利用了深度进修，有些则利用符号推理模式的专家体系，例如直接从某些数据常识库中举行检索等模块，来获取更新的信息。

MRKL中一个精彩的设计被称作是路由（router）的模块，它可以按照用户的问题匹配一个专家体系：例如假如问题触及到数学，它会转向一个计较器，假如问题触及到汇率，它会路由到一个汇率转换器，假如是气候的话，它会转到一个气候网站等等；假如路由对于在问题不确定，它会先经由过程Jurassic-1等语言模子使用上下文揣度出应该转向哪一个专家模块。

4权重更新方式

MRKL还有采用了prompt tuning的方式对于在模子的下流使命举行更新，如上述，这类方式防止了灾害性遗忘的微调模式以和零样本进修的低机能。与传统的prompt tuning方式比拟，Jurassic-X利用了越发邃密的设计:（1）依靠在模子输入的prompt进修方式。（2）检索加强的prompt天生方式。（3）递归式地运用冻结了的LM模子。论文中做了越发具体的技能先容，感兴致的读者可以直接浏览论文。

MRKL中采用递归方式触及prompt learning

5运用实例

博客中先容了几种MRKL的运用场景举例，都是一些值患上存眷及实用的一些话题，触及到各个方面可能呈现于一样平常场景中的问题。

用人类语言去浏览及更新数据库

Jurassic-X: 让神经模型学会符号推理

问题：买玫瑰味的洗发水

Jurassic-X会从人类语言中提取中要害信息，并从市肆清单中去检索产物，插手到购物车的数据库中。这于智能助理，电子商务等都有运用远景。

对于在当下问题的文本天生

Jurassic-X: 让神经模型学会符号推理

问题：谁是当下的美国总统

Jurassic-X会交融当下和时更新的外部数据库，例如维基百科去孕育发生更和时的数据。

数学操作

Jurassic-X: 让神经模型学会符号推理

问题：公司的655400份份额被94个员工平均分配，每一个员工获得几多？

Jurassic-X会经由过程语言模子提出去要害信息，而且应该去寻觅一个“数学专家”，也就是计较器，从而患上出准确成果。

组合型问题

Jurassic-X: 让神经模型学会符号推理

问题：更多的人住于Tel Aviv还有是Berlin？

Jurassic会将组合型问题分化为若干子问题：Tel Aviv的人口是几多？Berlin人口是几多？哪一个数字更年夜？等，解决了每一个子问题后再把它们汇总于一路。更主要的是，如许也增长了可注释性，申明了模子给出谜底的依据。

气候、汇率等动态信息

Jurassic-X: 让神经模型学会符号推理

问题：100美元可以换几多摩洛哥币？

Jurassic会把语言模子及一些和时更新的常识库交融于一路，从而轻易获取到实践性敏感的动态信息。

透明性及可托性

Jurassic-X: 让神经模型学会符号推理

问题：克林顿是否曾经经被选过美国总统

这里触及到Clinton的歧义问题，问题的谜底取决在哪一个Clinton，是Bill Clinton还有是他的老婆。Jurassic-X可以做出越发明确、透明的回覆，而其他神经模子则不行。

6AI21 Labs

AI21试验室位在以色列的一家天然语言处置惩罚的研究机构；它同时也是一个贸易机构，旨于将现有的NLP技能快速部署到贸易运用中。开创人包括从斯坦福年夜学退休了的人工智能传授Yoav Shoham；一家主动驾驶公司Mobileye的开创人Amnon Shashua，以和众包平台CrowdX开创人Ori Goshen。这家公司的标语是“重构人们的读写方式，朝向更夸姣的将来”（reimaging the way people read and write, for the better）。

Jurassic-X: 让神经模型学会符号推理