米兰·(milan)中国官方网站-专访腾讯AI Lab姚建华、杨帆:腾讯 AI Lab 为何瞄准单细胞蛋白质组学?
于生物医学研究的前沿范畴,“单细胞卵白质组学”是如何的存于?
用一个比方来讲,它就像一把钥匙,可以或许开启细胞内部世界的年夜门,让咱们患上以窥见细胞怎样经由过程卵白质的彼此作用来履行生命勾当。
这一研究范畴的冲破,不仅可以或许鞭策科学界对于生命历程的理解,也为精准医疗的实现奠基了基础。
近期,腾讯的 AI Lab,无疑成了这一前沿研究范畴率先“揭开英雄榜 ”的阿谁研究机构。
3月20日,腾讯 AI Lab 的 3 篇卵白质组论文正式入选国际顶级学术期刊。论文别离于数据库、AI 建模、AI 辅助临床三个角度提出了全新的研究方案,为人类从底子上阐释生命提供了主要技能参考。
《SPDB: a comprehensive resource and knowledgebase for proteomic data at the single-cell resolution》,被生物信息学范畴数据库方面的的权势巨子期刊 Nucleic Acids Research收录。
《 scPROTEIN: a versatile deep graph contrastive learning framework for single-cell proteomics embedding》,被Nature旗下的要领学期刊Nature Methods收录。
《Deep domain adversarial neural network for the deconvolution of cell type mixtures in tissue proteome profiling》,被Nature旗下呆板进修专业期刊 Nature Machine Intelligence 所收录。
借此契机,雷峰网近期对于话腾讯 AI Lab 科学家姚建华及研究员杨帆,他们是三篇论文的配合作者。于访谈中,他们深切论述了这些论文暗地里的技能冲破、运用价值及将来的研究计划。
他们注释道,这三篇论文的立异的地方于在,它们初次为单细胞卵白质组提供了周全的数据常识库及体系的AI阐发要领。
论文一中成立的 SPDB 数据库,经由过程尺度化处置惩罚差别来历的单细胞卵白质组学数据,使患上数据易在比力及阐发,是今朝全世界数据量最年夜、笼罩技能及数据集最为广泛的单细胞卵白质数据库。
论文二中的 scPROTEIN 框架,针对于单细胞卵白组数据的非凡性提出相识决方案,可以或许处置惩罚数据中的不确定性、缺掉值、批次效应及噪声问题。为基在单细胞卵白质组的肿瘤发生成长机制研究、药物靶点发明及肿瘤早筛及微情况研究提供主要的AI辅助作用。
第三篇论文中提出的 scpDeconv 要领,是一种全新的反卷积要领,可以或许从“构造卵白质组”数据中挖掘出特定细胞类型比例,为肿瘤辅诊及预后阐发提供了新的视角,是三篇论文中与临床运用最为切近的一项结果。
姚建华,作为腾讯 AI Lab 的 AI 医疗首席科学家,增补道:
“AlphaFold 于卵白质布局范畴取患了使人瞩目的成绩,它重要存眷单个卵白质的布局及功效,或者几个卵白质之间的彼此作用。
而咱们的研究则聚焦在细胞内所有卵白质的表达模式,这些信息反应了整个细胞的状况及微情况,使咱们的事情越发切近临床运用及疾病机制的摸索。”
值患上一提的是,当咱们于会商论文结果的同时,一个更深远的议题逐渐浮现:建立在2016年的腾讯 AI Lab,是否有能力于接下来的五年中,引领生命科学范畴的将来成长?
这个问题不仅磨练着试验室的科研实力,也反应出科技公司于生物医学范畴的影响力及责任。如今的腾讯 AI Lab,走的每一一步都比以往更受存眷。
如下为对于话(经编纂):
数据、建模、运用,「三管齐下」雷峰网:起首请两位先容下,三篇论文的立异点,扼要先容技能实现情势,运用价值,以和对于单细胞卵白质组学这一研究范畴的孝敬(好比最合适哪些人/机构利用)。
杨帆:单细胞测序技能已经经取患了飞速成长,只管单细胞转录组相干的测序技能及计较要领已经经相称成熟,但转录程度与卵白质程度的相干性凡是低在 50% 。于单细胞层面,这类相干性更低。
是以,只有经由过程研究卵白质组,咱们才能深切理解生命勾当及疾病的素质。
单细胞卵白质组测序技能也于不停前进,技能改造层见叠出,并遭到了国际顶级期刊如 Nature Methods 的存眷及报导。尤其因此 SCOPE-MS(Single-Cell Proteomics by Mass Spectrometry)、nanoPOTS (nanodroplet processing in one pot for trace samples) 为代表的基在质谱的卵白质测序技能,可以或许检测到单细胞中数千种卵白质的存于。这比以往基在抗体的单细胞卵白质组测序技能有了显著的晋升。
然而,这些数据的繁杂性,使患上专门针对于单细胞卵白质组数据的AI计较要领相对于缺少。
恰是基在这一配景,咱们的三篇论文缭绕单细胞卵白质组数据阐发举行了深切研究。咱们初次为单细胞卵白质组提供了一套体系的 AI 阐发要领及数据常识库。
此中,第一篇论文网络了今朝世界上最周全的、差别来历、差别测序技能、差别物种的单细胞卵白质组数据,并举行了尺度化处置惩罚及体系性评估。
第二篇论文基在迁徙进修技能,从单细胞卵白质组数据中揣度构造卵白质组中的细胞比例;
第三篇论文则采用对于比进修要领对于单细胞卵白质组举行表征;
咱们的计较要领经由过程试验验证,较着优在直策应用单细胞转录组的要领。这些要领已经经开源,并配备了详尽的利用申明,可供全世界规模内的研究职员利用。
咱们的算法尤其合适那些从事单细胞卵白质组数据天生的团队,他们可以直策应用咱们的技能举行细胞级另外数据阐发及下流运用。
对于在临床医学专家而言,他们可以使用咱们的反卷积算法阐发公然的TCGA或者CPTAC等卵白质组数据库,或者者基在本身网络的临床构造样本,以深切理解肿瘤微情况,辅助疾病机制的研究及诊断猜测。
此外,咱们的数据库答应生物学家及医学事情者于线摸索他们感兴致的卵白质或者细胞类型,不雅察这些卵白质于差别细胞类型中的变化纪律,从而撑持他们于特定卵白质研究标的目的上的研究。
雷峰网:由于三篇论文结果都是集中于单细胞卵白质组学范畴,切磋了怎样经由过程差别的计较要领及数据库资源来阐发及理解单细胞程度上的卵白质表达数据。那末,于此以前你们做了哪些事情?于三篇论文结果出来后,紧接着有哪些研究规划?
杨帆:于此以前,咱们团队已经经举行了年夜量事情,包括医学多模态数据阐发、疾病猜测以和精准医疗等范畴的研究。同时,咱们也于单细胞转录组及空间组学等生命科学基础计较范畴举行了深切摸索,并于多个AI顶级集会及期刊上发表了相干论文。
是以,咱们于医学、生命科学、精准医疗及数据阐发等范畴堆集了富厚的经验。
举个例子:
咱们于预练习语言模子还没有广泛运用在单细胞数据阐发范畴时,就意想到预练习模子于天然语言处置惩罚(NLP)范畴已经经取患了巨年夜乐成。其时,单细胞数据阐发重要依靠在简朴的呆板进修要领,而且经常需要针对于每一个数据集举行手工处置惩罚,这限定了模子的泛化能力。
针对于这一问题,咱们于 2021 年启动了一个项目,设计了一种基在单细胞数据的年夜范围预练习语言模子,名为scBERT。咱们按照单细胞数据的特征,开发了基因嵌入(gene embedding)及表达嵌入(expression embedding),使患上这些数据可以或许被 Transformer 这类进步前辈的计较模子处置惩罚及辨认。
咱们初次引入了 BERT这类预练习及微调的范式,从而充实使用了其时还没有充实使用的年夜范围单细胞数据举行预练习,显著晋升了模子的泛化性及处置惩罚跨批次、跨数据集数据的能力。
这一结果发表于了 Nature Machine Intelligence上,开启了单细胞年夜模子研究的新篇章。
于这三篇论文发表以后,咱们规划越发聚焦在庞大科学问题的研究,并看重其临床运用及转化。咱们将进一步整合多组学数据及卵白质年夜模子,赋能更多的运用场景。
姚建华:我可以增补一些配景信息。
尽人皆知,生物体内的焦点规则是中央规则,即 DNA、RNA 及卵白质之间的瓜葛。
DNA 携带遗传信息,经由过程转录成为 RNA,形成转录组。
而RNA进一步翻译成卵白质,即卵白质组。
咱们的研究事情恰是基在这一道理。基因测序技能的成长过程显示,DNA 测序是相对于轻易的部门,而 RNA 及卵白质的测序难度逐渐增长,由于它们需要更繁杂的扩增及丈量技能。
从上个世纪 70 年月最先,人类基因组测序技能已经经履历了几代的成长。
最初,人类重要存眷 DNA 信息的测序。约莫 10 年前,单细胞技能最先鼓起,最初重要集中于 RNA 信息的测序。而单细胞卵白质组学则是近来五六年才最先成长的新兴技能。
咱们的研究事情也是沿着这一脉络慢慢推进的,从较简朴的数据最先,慢慢过渡到更繁杂的数据阐发。
例如,咱们以前的事情 scBERT 重要针对于转录组数据举行阐发。而此刻,咱们进一步研究卵白质组数据,这是一个更为繁杂及具备挑战性的范畴。跟着数据难度的增长,对于算法及计较能力的要求也愈来愈高。咱们的研究恰是于这一配景下不停前进及成长的。
雷峰网:整体从技能层面来讲,论文一提供了一个数据资源库,论文二及论文三则别离提出了新的深度进修框架来处置惩罚差别类型的数据阐发问题。论文二偏重在经由过程图进修处置惩罚单细胞卵白质组数据,而论文三偏重在利用域匹敌神经收集举行细胞类型比例的解卷积。
不知道我如许理解是否准确,请两位再先容下三篇论文的接洽与区分。以和,全世界规模内,还有有哪些课题组或者企业于做近似的事情?
杨帆:您的理解很是正确。
数据资源库是算法研究的基石,咱们深知AI算法的成长离不开数据的支撑。于单细胞卵白组学范畴,数据的正确表征是举行下流运用的要害。
把握了单细胞卵白组数据后,咱们可以或许具体相识每一种细胞类型于细胞内卵白质表达的模式。
基在这些数据,联合AI算法,咱们可以进一步揣度构造卵白组中细胞类型的比例,这对于在理解肿瘤微情况至关主要。
今朝,临床上已经有年夜量基在构造卵白组的数据,这些数据凡是来历在肿瘤患者癌构造和其周围正常构造的样本,经由过程质谱技能得到的是多种细胞类型混淆后的卵白质表达平均程度。
咱们的反卷积算法可以或许切确揣度出差别细胞类型的比例,使全世界研究者可以或许从公然数据集中挖掘出有关细胞比例的信息,从而更好地舆解肿瘤微情况。
此外,纵然于没法举行单细胞卵白组测序的临床环境下,咱们的算法也能提供一种解决方案,帮忙理解细胞微情况,从而辅助临床举行疾病预后及猜测。
这三篇论文可以视为一个总体,此中数据资源库为基底,上面有两个差别角度的AI运用,犹如一棵年夜树上结出的两个果实。
据咱们所知,今朝全世界规模内尚无其他团队或者企业开展与咱们彻底不异的事情。其他机构重要于举行单细胞转录组或者卵白质布局的研究,这些研究固然也很主要,但咱们的事情弥补了单细胞卵白组学范畴的一个空缺,具备立异性及前瞻性,将来势必吸引更多研究聚焦在此范畴。
姚建华:正如杨帆所提到的,卵白质布局于AI范畴中,特别是 AlphaFold 如许的技能最为人所熟知。
AlphaFold 重要阐发的是单个卵白质的布局,例如卵白质的折叠方式或者几个卵白质之间的彼此作用,它存眷的是单个卵白质的三维布局,以和其功效及对于人体细胞的作用。
而咱们的研究则是从另外一个角度出发,阐发细胞内所有卵白质的表达模式。
咱们知道,人体有数以亿计的卵白质,纵然是单个细胞内也有成千上万的卵白质。咱们的方针是阐发这些卵白质之间的彼此作用及表达模式,这些信息反应了整个细胞的状况及微情况。
经由过程卵白质组或者转录组等组学数据,咱们可以更周全地舆解细胞的微情况及疾病孕育发生的缘故原由,这对于在临床医治及疾病机制的研究具备主要意义。
与 AlphaFold 等存眷单个卵白质布局的技能比拟,咱们的研究更偏重在整个细胞及微情况的体系性阐发,这使患上咱们的事情更靠近临床运用及疾病机制的摸索。
雷峰网:虽然是三个论文结果,但实在是于一个研究项目之中的吗(由于研究是顺着数据库、AI建模、AI辅助临床三个层面一一睁开)?三篇论文的作者团队于专业配景上有何区别?总体来讲,从立项到出论文结果,连续时间多久?
杨帆:这三篇论文是于统一个年夜的研究标的目的下天然睁开的。重要作者包括我及姚教员。
此外,咱们的团队还有包括来自差别范畴的互助者,如生物信息学及 AI 呆板进修范畴的专家,以和校企结合造就的学生。
腾讯 AI Lab 作为一个跨学科的平台,为跨学科AI运用提供了富厚的泥土。试验室搜集了 数百位顶尖科学家,这为咱们的研究提供了强盛的撑持。
于 AI Lab,咱们有来自生物信息学范畴的研究员,他们从生物医学问题出发,网络数据并界说研究问题。
于模子研发阶段,特别是面临原创性研究中的新问题及挑战时,咱们需要AI技能的立异。于这方面,咱们有AI范畴世界顶级的科学家与咱们互助,配合应答图模子、可托 AI 以和迁徙进修等范畴的挑战。
恰是于 AI Lab 如许一个布满世界级专家、慎密交流及跨学科互助的情况中,咱们才可以或许引发出立异的火花,并鞭策一系列跨学科AI运用研究的成长。
咱们的试验室主任张正友教员及AI医疗首席科学家姚建华博士,别离是 IEEE Fellow 及 AIMBE Fellow,ACM fellow,是世界知名的学术首脑。于他们的引导及把关下,咱们的研究员于举行科研及立异时越发自傲及自在。
一般来讲,咱们的项目从启动到结果发表约莫需要一年到一年半的时间。
雷峰网:杨帆博士,您的配景及履历是如何的?同时请问姚建华教员,如今腾讯 AI lab 的事情者于专业配景上有何共性?
杨帆:我是清华年夜学的博士卒业生,于博士时期重要从事临床组学阐发的研究。自2016年起,我最先接触人工智能范畴。博士卒业后,我插手了腾讯随后于 AI Lab 做研究,至今已经近六年。于这里,我相称在又完成为了一个 AI 范畴的博士学位,举行了广泛的AI研究。
我觉得本身的常识布局像是“T”字型。
一方面,于组学生物数据阐发范畴有深切的研究及跨越十年的经验;
另外一方面,于AI范畴,包括多模态研究、医学影像、临床文本数据处置惩罚、图模子、深度进修等多个方面都有所涉猎,并发表了相干论文。
这类“一专多能”的配景使我于跨学科范畴,如 AI for Science ,可以或许提出怪异的看法及研究标的目的。
姚建华:咱们团队确凿需要如许的跨学科人材。正如杨帆所提到的,AI Lab 涵盖了人工智能、呆板进修、语音辨认、多模态等多个研究标的目的。咱们尤其看重生命科学范畴的人工智能运用,是以团队中的很多研究员都具有 AI 及生物学的两重配景。
只有经由过程如许的交织互助,才能真正鞭策这一范畴的成长。咱们也常常与其他专注在人工智能的团队举行技能上的交流及切磋,配合促成科学的前进。
三篇论文一一追问:幸亏哪、不足于哪、给谁用|论文一:《SPDB: a comprehensive resource and knowledgebase for proteomic data at the single-cell resolution》
链接:https://academic.oup.com/nar/article/52/D1/D562/7416372

该论文已经入选生物信息学范畴数据库方面专业期刊 Nucleic Acids Research
雷峰网:SPDB 怎样整合差别来历及技能的单细胞卵白质组学数据?团队于数据库设计及实行历程中碰到的重要挑战和解决方案。还有有哪些研究不足及优化规划?
杨帆:SPDB旨于为差别技能类型的单细胞卵白组学数据提供一个专门的数据处置惩罚框架。
咱们经由过程于同一的情况中对于来自差别基础来历的数据举行尺度化处置惩罚及阐发,使患上用户可以或许于一个平台上对于比及摸索差别技能来历的数据。
为了确保数据集的自力性及靠得住性,SPDB 并无直接整合差别来历的数据集,而是提供了对于单个数据集的自力摸索功效,以和对于统一卵白质于差别数据集中的对于比摸索。
于SPDB数据库设置装备摆设的早期,咱们面对的一年夜挑战是:怎样处置惩罚及阐发一些咱们以前不曾接触过的数据类型。
例如质谱卵白质组数据,以和这些原始数据的处置惩罚水平及存储格局的多样性。
咱们经由过程广泛浏览相干文献,并具体研究每一个数据集的源文献中关在数据处置惩罚的描写,为每一个数据集制订了针对于性的数据处置惩罚步调,从而确保了数据的正确性及靠得住性。
今朝,SPDB 的一个不足的地方于在:缺少于线东西供用户直接利用。将来,咱们规划将研究团队开发的相干算法集成到SPDB平台上,以便用户可以或许更利便地利用这些东西。
此外,SPDB 今朝还有没有提供卵白质对于应的基因表达信息,即转录组数据。是以,咱们的后续事情将包括为卵白质表达提供响应的基因表达数据,以便在用户举行更周全的对于比展示及阐发。

SPDB数据库 概述图
雷峰网:于我的理解,这应该是这一事情的最年夜孝敬,是网络了年夜量数据,还有对于这些数据举行了尺度化处置惩罚,使患上差别来历的数据可以放于一路比力及阐发。这就比如把差别语言的册本翻译成统一种语言,让读者更易理解。为何当下这类事情成为须要?
杨帆:您的理解很是正确。咱们构建这个数据库的初志,是由于单细胞转录组及空间组学范畴的研究已经经日趋成熟,堆集了年夜量的数据。
市场上也存于一些对于单细胞转录组及空间组数据举行整合及统计的数据库,这些数据库不仅为生物学家及临床事情者提供了摸索及发明的东西,也为生物信息学研究者提供了基在尺度化数据举行算法开发的平台。
因为很多研究者更偏向在利用已经经处置惩罚好的尺度化数据举行开发,而并不是所有人都具有从年夜量分离的原始生物学文献中提取数据的经验或者常识,咱们的论文及事情的方针就是为单细胞卵白组学范畴做出孝敬。
咱们但愿经由过程尺度化的数据,让更多的AI研究者及生物信息学事情者可以或许看到单细胞卵白组学数据的潜力,并于此基础长进行算法的研发及立异。
这就像是为整个单细胞卵白组学研究社区提供了一片膏壤,让更多立异患上以孕育。
此外,这个数据库也为那些一样平常事情忙碌、非生物信息学专长的生物科学事情者及医疗事情者提供了便当。有了这个实用的东西,他们可以从单细胞卵白组学的角度得到新的启迪及发明,纵然这不是他们的重要研究范畴。
姚建华:成立如许一个数据库的事情量很是巨年夜,数据分离于各个处所。以是这类事情实在很是合适像咱们如许资源相对于足够的公司来开展。
特别是于年夜模子时代,数据的主要性愈发凸显。
之前练习一个模子可能只需要几十万、几百万的数据,但此刻练习一个年夜型模子可能需要数亿的数据量。
咱们的数据库已经经网络了 3 亿个细胞的数据,如许的数据量才有可能支撑年夜型模子的练习。咱们将连续更新数据库,跟着新数据的插手,咱们但愿这个数据库可以或许真正为整个范畴的成长做出孝敬。
|论文二:《 scPROTEIN: a versatile deep graph contrastive learning framework for single-cell proteomics embedding》链接:https://www.nature.com/articles/s41592-024-02214-9

已经入选 Nature 旗下要领学专业期刊 Nature Methods
雷峰网:我的理解是,scPROTEIN 是一种新型的数据阐发框架,它可以或许处置惩罚及阐发单细胞卵白质组数据。这就比如咱们有了一台超等显微镜,不仅可以或许看到细胞,还有可以或许看到它们内部的卵白质怎样互动。立异的地方于在它可以或许解决数据中的不确定性、缺掉值、批次效应及噪声问题,这些都因此往研究中的难题。
为何要这么做?还有有哪些研究不足,应答措施?
杨帆:scPROTEIN 框架的开发是为相识决单细胞卵白组数据阐发中的怪异挑战。
于单细胞卵白组的测定历程中,从细胞分散、裂解、卵白质提取,到经由过程质谱技能举行肽段检测,每个步调均可能引入不确定性及噪声。
例如,样本制备的差异、标志计谋的差别、质谱仪的状况变化,以和肽段于质谱仪中的离子化及检测历程,均可能致使批次效应及数据中的噪声问题。
此外,与单细胞转录组数据差别,单细胞卵白组旌旗灯号没法经由过程扩增来加强,只能依赖质谱技能的敏捷度来检测微量卵白。
现有的很多单细胞转录组数据阐发要领,并未充实思量单细胞卵白组数据的非凡性,直策应用这些要领效果其实不抱负。
是以,咱们提出了 scPROTEIN 框架,它不仅思量了单细胞卵白组数据的条理布局,还有采用了基在可托度的要领来预计肽段测定的不确定性,并经由过程图对于比进修举行表征及去噪,有用解决了数据中的繁杂问题。
颠末下流使命的充实验证,scPROTEIN 的机能显著优在现有的单细胞卵白组数据阐发要领及直接套用单细胞转录组的要领。
姚建华:咱们的算法现实上提供了一种“数据加强”功效,可以或许有用去除了数据中的噪声及批次效应,使患上数据阐发更为一致及正确。
此外,咱们还有提出了一种数据编码的 embedding 要领,这于某种水平上起到了“数据降维”的作用。
正这样多年夜型模子如 Transformer 及 GPT 所做的那样,经由过程 embedding ,咱们可以将繁杂的卵白质信息以一种高效的方式暗示出来。
这类要领不仅可以或许帮忙咱们提取数据中的焦点信息,还有可以或许展现差别卵白质之间的瓜葛,为单细胞卵白组数据阐发提供了一种全新的视角及东西。
雷峰网:其他现有的单细胞数据阐发东西,为何差能人意?
杨帆:正如咱们以前提到的,scPROTEIN 框架是专门为解决单细胞卵白组数据所面对的挑战而设计的。现有的年夜大都单细胞数据阐发东西,并无专门针对于单细胞卵白组数据的特征。例如数据的条理布局及丈量不确定性等,举行优化。
scPROTEIN 框架则彻底针对于单细胞卵白组数据的特有问题举行了算法开发,是以可以或许有用解决这些数据独有的问题。
姚建华:今朝而言,险些没有其他要领专门针对于单细胞卵白组阐发。这项技能很是前沿,相干数据也相对于稀缺,很少有研究可以或许网络到云云多的单细胞卵白组数据。
此外,阐发这些数据自己也存于很年夜的难度,由于数据量年夜且繁杂。
于咱们最先这个项目的时辰,市场上还有没有专门针对于单细胞卵白组的阐发东西,年夜部门事情都是集中于单细胞转录组上。
咱们估计于将来几年,研究者们将会更多地存眷卵白质组学,是以咱们于这方面的事情现实上是领先一步,提早举行了摸索及开发。
|论文三:《Deep domain adversarial neural network for the deconvolution of cell type mixtures in tissue proteome profiling》链接:https://www.nature.com/articles/s42256-023-00737-y

已经被Nature旗下呆板进修专业期刊 Nature Machine Intelligence 所收录
雷峰网:我理解的是,这篇论文的一年夜亮点:提出了一种新的基在深度进修的解卷积要领(定名为scpDeconv),专门针对于卵白质组数据,获取此中的肿瘤微情况信息。
可否先容一下scpDeconv于临床诊断及医治中的运用远景及潜于挑战。scpDeconv要领于现实运用中可能碰到哪些问题,以和是否有解决方案。
杨帆:scpDeconv 的临床运用远景很是广漠。如咱们以前提到的,该要领可以挖掘构造样本中的细胞比例信息,从而反应肿瘤微情况的状态。
例如,于咱们的研究中,对于玄色素瘤样本举行 scpDeconv 阐发后,咱们发明差别细胞类型比例的患者预后存于显著差异。
这类阐发可以作为一种辅助诊断东西,帮忙大夫猜测疾病预后,是精准医疗的一个主要运用场景。
然而,scpDeconv 的潜于挑战于在:单细胞卵白质组数据的笼罩规模可能不敷广泛,包括细胞类型及构造类型。
为了降服这一挑战,咱们需要与举行单细胞卵白质组测序的试验室互助,配合孝敬更多的公然数据,以便举行更正确的阐发。
姚建华:“构造卵白质组”阐发相对于轻易举行,由于它基在的是整个构造样本,包括了成千上万个细胞的卵白质总及,而“单细胞卵白质组”阐发则需要对于每一个细胞零丁举行丈量,难度及成本都显著增长。
今朝,临床上重要举行的是构造卵白质组阐发,由于成本较低,技能相对于成熟。
咱们的scpDeconv 要领,可以或许从构造卵白质组数据中解析出细胞类型的异质性,从而提供近似在单细胞阐发的成果,只管可能不如单细胞数据那末切确,但至少可以或许展现构造中细胞构成的信息。
如许的技能使患上临床大夫可以或许使用现有的数据得到更多的诊断信息,帮忙更正确地举行疾病诊断及医治决议计划,实现精准医疗的方针。
怎样对于患上起年夜厂AI lab 的名号?雷峰网:末了,请说一下,腾讯 AI Lab 于单细胞卵白质组学范畴的将来研究规划。
杨帆:我抛砖引玉,分享一下咱们的将来计划。
起首,咱们将贯彻及落实咱们试验室主任张正友博士的引导思惟,越发聚焦在解决世界级的庞大科学问题,并于 AI for Science 范畴实现 AI Lab 的任务——于学术界孕育发生影响,于工业界创造产出。
咱们的研究标的目的与腾讯公司的“科技向善”愿景相契合。将来,咱们将继承使用现有基础,整合单细胞多组学及卵白质年夜模子,鞭策临床运用研究,并致力在产出具备世界影响力的原创AI运用研究结果。
姚建华:咱们的事情重点是使用人工智能技能解决现实问题及科学挑战。
作为 AI Lab,咱们的上风于在资源的相对于富厚性及研究的聚焦性。与高校比拟,公司的情况答应咱们集中气力举行年夜范围的研究项目。
此外,公司的构造布局也使患上差别范畴的研究员可以或许协同互助,配合推进统一项目。虽然高校的研究情况更为自由,但咱们这里的研究可以越发集中及深切。
咱们的方针是聚焦在最前沿的课题及标的目的,解决最具挑战性的问题,以此形成强盛的影响力。
咱们将继承于单细胞卵白质组学范畴深耕,不仅鞭策科学的成长,也为临床运用提供立异的解决方案。咱们期待经由过程这些努力,为整个范畴带来踊跃的变化,并为社会做出更年夜的孝敬。
雷峰网:我相识到,腾讯 AI Lab 也于摸索脑科学等范畴,这是否象征着咱们将来可能会看到更多相干结果?
姚建华:咱们今朝的重点还有是集中于生命科学的一些基础问题上,如卵白质及基因组学等范畴。
咱们确凿举行了一些年夜脑相干的研究,但重要是为了摸索年夜脑的素质。例如,去年咱们举行了年夜脑图谱的研究,这更倾向在脑科学的基础研究。
咱们试图经由过程卵白质组学及基因组学的信息来区别差别类型的神经元,并理解它们是怎样彼此接洽及作用的。如许的研究有助在咱们深切理解年夜脑的机制。
经由过程咱们的AI算法阐发基因组学及卵白质组学数据,咱们帮忙神经科学家对于差别脑细胞举行分类,并描绘它们于年夜脑中的空间位置。如许的年夜脑图谱研究是神经科学研究的基础。
固然,要真正深切到脑图谱的研究,终极还有需要回到基因及卵白质的层面。咱们的方针是撑持更高条理的科学研究。
雷峰网(公家号:雷峰网):那末三篇论文结果以后,还有有关在临床运用及结果转化的计划吗?
姚建华:今朝,咱们更偏重在研究结果的产出,由于工业产出往往需要更多的资源及工程团队。
咱们现阶段重要致力在解决一些基础科学问题。固然,跟着技能堆集到必然水平,咱们可能会经由过程与其他团队互助或者寻觅互助伙伴来实现这些技能的落地及财产化。
咱们的方针是先于科研范畴取患上冲破,为将来的工业运用打下坚实的基础。
本文作者 吴彤 持久存眷人工智能、生命科学及科技一线事情者,习气体系完备记载科技的每一一次前进,接待同志微信交流:icedaguniang
雷峰网原创文章,未经授权禁止转载。详情见转载须知。





