掌叶半夏

注册

 

发新话题 回复该主题

Cell肺腺癌的蛋白质组学特征 [复制链接]

1#

七月初,国际顶级期刊Cell同时发表了三篇肺癌蛋白质组学的成果,本期iProteome与大家分享的是来自中国科学院上海药物研究所,国家蛋白质科学中心(北京),国家癌症中心,中国医学科学院等几个团队的“IntegrativeProteomicCharacterizationofHumanLungAdenocarcinoma”一文。

Highlights

1.在早期LUAD中发现了预后相关蛋白与通路

2.揭示了与临床和分子特征有关的三种亚型

3.鉴定了亚型特异性激酶和癌症相关磷酸化蛋白

4.识别LUAD中潜在预后生物标志物和药物靶标

Introduction

肺癌是世界范围内发病率最高的癌症,而肺腺癌(LUAD)是非小细胞肺癌(NSCLC)最常见的组织学亚型,约占肺部恶性肿瘤的40%。肺腺癌最主要的诱因是吸烟,但除吸烟外的其他风险因素(如长期接触放射性物质、职业性接触致癌物和室外空气污染,等等)对也肺腺癌发展过程有着潜在影响。

在过去的十年中,大规模的基因组研究揭露了肺腺癌的驱动基因,其中最常见的突变为TP53、KRAS、KEAP1、STK11和EGFR。在中国和其他亚洲国家,无吸烟史的EGFR突变女性患者在肺腺癌病例中占比很大(40%–50%)。

肺腺癌的治疗方法包括手术、放疗、化疗、靶向疗法、免疫疗法或这些治疗方法的组合。最新的一系列针对几种致癌驱动物的靶向疗法和针对免疫检查点的免疫疗法获得了显著成效。

尽管取得了这一进展,但仍有大量的肺腺癌没有可选用的靶向治疗方法,其中一个原因是关键的致癌信号通路中缺乏已知的基因突变,或是难以靶向致癌性突变(例如KRAS突变)。除此之外,肺癌患者身上经常出现靶向疗法的内在和获得性耐药现象。

蛋白质是细胞的功能执行者,因此,肺腺癌蛋白质组和信号转导(磷酸化蛋白质组)的深度表征将为全面了解该疾病的分子机制和开发新的治疗方法奠定基础。

在本研究中,研究人员使用从个肺腺癌肿瘤及其配对的癌旁组织(NATs)中收集到的蛋白质组学、磷酸化蛋白质组学和基因组学数据进行了综合性的组学分析,该研究提供了探索遗传变异与转录或翻译调控之间关系的数据资源。其中,蛋白质组学数据的进一步分析揭示了不同基因型亚型中与肺腺癌相关的分子特征及其相关的临床结果。

Results

中国肺腺癌的Profiling

研究人员收集了来自未接受治疗的中国患者的个初级肺腺癌肿瘤样本及其配对癌旁组织。

实验设计的示意图如图1A所示:蛋白质组学的研究采用了中国人类蛋白质组计划基于质谱的无标记定量策略,并且使用TiO2富集策略对79个配对样品进行了磷酸化蛋白质组学分析;同时对所有配对样本进行基因组测序以寻找癌症基因组中任何可能的遗传突变;此外还对51个肿瘤和49个配对的癌旁组织进行了mRNA测序。

基因组测序数据识别到的个遗传变异事件,揭示了中国LUAD患者的独特突变情况,该突变情况与癌症基因组图谱(TCGA)联盟报告的白种人患者不同,表明了种族之间癌症基因组的遗传多样性。中国患者的EGFR(50%)突变明显高于白种人;相反,KRAS突变率低于白种人,而TP53的突变率相似(如图1B)。

对所有患者样品进行蛋白质组学检测,总共得到个蛋白质群组(图1C),鉴定出22,个磷酸化位点,对应5,个磷酸化蛋白(如图1D)。

以上研究在基因组学、转录组学、蛋白质组学和磷酸化蛋白质组学水平上构建了中国肺腺癌的全景。

图1

中国人肺腺癌多组学综合分析

多维度的组学数据为研究人员探索肺腺癌转录组与蛋白质组之间的关系提供了完美的契机。研究人员对49对普通配对样品的RNA-seq和蛋白质组学数据,以及79对配对样品的磷酸蛋白质组学数据进行了主成分分析(PCA)。通过对RNA-seq和蛋白质组学数据常见基因的富集分析确定了具有相对较强或较弱mRNA-蛋白质相关性的KEGG通路:相关性较强的基因主要涉及缬氨酸、亮氨酸和异亮氨酸的降解以及柠檬酸循环;而相关性弱或呈负相关的基因在剪接体和核糖体通路中富集,该情况在肿瘤和NATs中大体一致。

随后,研究人员在51个常见肿瘤样本的两组数据集(转录组和蛋白质组)中比较了单个基因的预后能力。有52个基因与临床结果显著相关,此外,个具有预后能力的基因仅能在转录组数据中观察到,而个具有预后能力的基因仅在蛋白质组学数据中被发现,这意味着需要mRNA和蛋白质数据共同提供可互补的预后信息。

研究人员随后进行了基于基因组的体细胞拷贝数改变(CNA)分析并考察了23,个拷贝数改变对mRNA、蛋白质和磷酸化蛋白表达的调节作用(图2A)。CNA可以顺式或反式方式正向或负向影响基因表达。

MS数据库可用于探索DNA、RNA突变体及它们的蛋白产物(图2B、C)。

当对转录组、蛋白质组和磷酸化蛋白质组进行合适的整合分析时,可能会产生独特的特征,发现新的具有重要功能的基因产物。

图2

肿瘤组织和癌旁中的蛋白质组学特征在比较

肿瘤与NAT的蛋白质组PCA分析揭示了二者之间清晰的界限(图3A),提示肺腺癌的发生发展中存在异常的蛋白质组变化。共有3,种蛋白质在肿瘤和NAT之间差异表达,其中有个蛋白上调,个蛋白下调。基因集富集分析(GSEA)表明,在肿瘤中富集的蛋白质主要在蛋白酶体、糖酵解或糖异生、核糖体、泛素介导的蛋白水解、核苷酸切除修复和细胞周期等通路中;而在NAT中富集的蛋白质主要参与肺部生理功能(肺通气和免疫功能)相关通路,这些通路中代表性的差异表达蛋白质如图3B所示,其中一些与临床结局密切相关(图3C)。值得注意的是,先前报道过的七种肺标签蛋白(AGER,SFTPA2,CACNA2D2,LAMP3,SCGB1A1,SFTPB和SFTPC)在肿瘤中失去了表达;除此之外,肿瘤患者中多种肺富集蛋白表达量更高的患者似乎预后较好(图3D)。

研究人员还用肿瘤和NAT转录组的GSEA结果与相应蛋白质组中的富集通路作比较。值得注意的是,蛋白质组学数据中代谢通路(在肿瘤中上调)和黏附相关通路(在肿瘤中下调)的富集更为显著,而RNA-seq数据中增殖相关途径的富集更为显著。

图3

早期肺腺癌的蛋白质组学特征

尽管肿瘤转移I期的肺腺癌病人接受切除手术后有很高的的康复率,但仍有20%至30%的早期病人预后不良。因此,调查预后良好(DG)或不良(DP)病人的蛋白质组可以为临床结果的差异提供线索。GSEA显示与能量代谢相关联的通路在DG组中富集(图4A)。相反,上皮间质转移(EMT)以及其他炎症和原癌信号通路在DP组中富集,肺腺癌组织学标志TTF-1也在DP组中高表达。

随后研究人员找到了在不同预后组之间差异表达的蛋白:DG组中,脂肪酸代谢中的MAOA和ACSS1以及血红素代谢中的ANK1较高,并与良好的预后成正相关;而DP组中,EMT中的THBS1和PLOD2糖酵解过程和IGFBP3在糖酵解中表达较高,并且与良好的预后负相关(图4B)。

图4

EGFR和TP53突变的肺腺癌的蛋白质组学特征

为了研究单个驱动基因的突变如何影响蛋白质组和相关通路,研究人员检测了有或没有肺腺癌驱动突变的患者中蛋白质的显著变化,并进一步建立起基因突变与下游通路之间的联系。这些蛋白质大部分都与EGFR或TP53突变相关,TP53突变患者的几种致癌途径(包括DNA复制、错配修复和剪接体等)均发生了明显变化;剪接体和丙酸酯代谢等途径中的蛋白质在EGFR突变患者体内升高。肺腺癌的两个组织学标志物TTF-1(NKX2-1)和Napsin-A(NAPSA)在具有EGFR突变的肿瘤样品中表达量更高(图4C)。相反,NAPSA的表达量在有TP53突变的肿瘤样品中更低,但TTF-1无明显区别。而同时具有EGFR和TP53突变的病人预后较差(图4D),这些病人的代谢途径(如氧化磷酸化、脂肪酸代谢等)被下调,许多原癌通路(如DNA复制、泛素介导的蛋白水解等)则被上调。该研究为EGFR和TP53突变状态不同的患者的蛋白质组学特征提供了新的见解。

图5

肺腺癌蛋白质组亚型及其相关临床结果

研究人员通过共识聚类分析70%以上肿瘤样本中存在的1,种变化最大的蛋白质(标准差前25%的蛋白质)确定了三种蛋白质组学亚型,它们被命名为SI(环境和新陈代谢[EM-H],n=21),S-II(混合型,n=48)和S-III(增殖和蛋白酶体[PP],n=34),分别具有独特的分子和临床特征(图5A-E)。S-I患者的临床预后最好,而S-III患者的预后最差(图5B)。进一步基因组分析表明,S-II具有最高的EGFR突变频率,而S-III具有最高的肿瘤突变负担,并且S-III患者中两种组织学标记物TTF-1和NAPSA的表达最低(图5C)

基因组数据的突变特征分析确定了例患者的9个主要特征。其中,特征1(年龄相关)是最为显著的特征,该特征主要出现在非吸烟者和女性患者身上。三种亚型中,S-III患者特征1表达量最低(图5D)。

GSEA显示S-I的环境和能量代谢(包括ECM受体相互作用、脂肪酸代谢和氨基酸代谢)

水平更高,与通气和免疫应答的肺功能相关;S-III与蛋白质稳态和肿瘤增殖更相关,包括核糖体、蛋白酶体、蛋白水解、DNA复制以及补体和凝血级联;而S-II则具有S-I和S-III的中间特征(图5E)。在三种亚型的代表性途径中具有显著变化的蛋白质可在细胞附着和细胞周期过程中发挥作用(图5F)。几种肺标签蛋白在S-I中表达但在S-III中丢失。

综上所述,S-I与正常组织更相关,而S-III具有更多的恶性特征。

研究人员还对肿瘤磷酸化蛋白质组(n=79)和转录组(n=51)进行了聚类分析,并在每个数据集中确定了三种亚型(图5A)。总生存期较差的一种磷酸化蛋白质组学亚型(pS-III)与蛋白质组学亚型S-III很好地吻合,而蛋白质组学S-I型与其相应的基于mRNA的亚型(tS-I)具有较好的一致性。

在免疫方面,在抗原呈递细胞(APC)上正常发现的几种主要的来自II型主要组织相容性复合物(MHC)的人类白细胞抗原(HLA)蛋白在S-III亚型中表达量最低,而MHCI类的HLA蛋白在这三种亚型中的表达没有明显差异;相反,S-III中补体和凝血级联反应中的蛋白质显着高于其他两个亚型(图5G)。

图6

磷酸蛋白质组特征及其临床相关性

研究人员在至少50%的患者样本中定量检测到1,种磷酸化蛋白,其中有种(38%)磷酸化蛋白质的水平在肿瘤组织中相较于对应NATs显着增加,而种(15%)显着减少(图6A)。GSEA指出,肿瘤中的磷酸化蛋白富集于致癌性相关的途径,例如mTORC1信号转导和糖酵解,而NAT中的磷酸化蛋白则大多参与生理功能。肿瘤与NAT之间的磷酸化蛋白质组的激酶底物富集分析(KSEA)确定了多种在肿瘤中被激活激酶;而通过比较三种蛋白质组亚型的磷酸化蛋白质组,可以发现亚型特异性活化的激酶(图6B)。在三种蛋白质组学亚型中均发现了与预后相关联的磷酸化差异(图6C)。而且,蛋白质组和磷酸化蛋白质组的变化之间存在高度相关性,研究人员将其定义为癌症相关的磷酸化蛋白。对差异磷酸位点的进一步研究表明,某些磷酸化位点与总体生存率相关(图6D)。

为了查明这些癌症相关的磷酸化蛋白对致癌信号通路的影响,研究人员通过计算这些致癌通路中蛋白质成员表达水平的相关性建立了一个磷酸化调控网络,显示多种蛋白质可能受到癌症相关的磷酸化信号的调节(图6E)。总的来说,磷酸化蛋白质组学数据可提供有关肺腺癌分子特征的更多信息。

图7

肺腺癌中潜在的预后生物标志物和药物靶点

在临床实践中,血浆或血清是发现生物标志物最广泛使用的标本,本研究的数据集提供了一个很好的机会来识别肺腺癌的潜在预后生物标志物。由于之前已经观察到血浆HSP90β与肺癌的病理分级和临床分期之间存在潜在的关联,因此研究人员进一步探究了HSP90β是否可以作为LUAD的预后生物标志物。蛋白质组学结果表明,HSP90β在肿瘤中的表达要比NAT高得多(图7A),且HSP90β的高表达与预后不良有关(图7A)。为了证实HSP90β作为肺腺癌的预后生物标志物的潜在用途,研究人员在名肺腺癌患者和名健康人对照组成的独立队列中使用ELISA检测了HSP90β的血浆蛋白水平,结果证实了LUAD患者中HSP90b的水平确实更高(图7B)。而对名肺腺癌患者预后数据的分析表明,HSP90β与预后呈负相关(图7C)。在癌症药物敏感性基因组学(GDSC)数据库中,HSP90的小分子抑制剂tanespimycin的效果在LUAD细胞系和LUSC细胞中显著优于SCLC细胞系(图7D)。这些数据证实HSP90β可以作为肺腺癌潜在的生物标记物。

随后,为了在LUAD中寻找潜在的药物靶标,研究人员考虑了药物敏感性、预后能力、基因依赖性和T/N比,最终确定了11种候选药物,其中两个(IMPDH2和GAPDH)是美国食品药品监督管理局(FDA)批准的药物靶标(图7E、F)。

Discussion

1.本研究对肺腺癌蛋白质组学的分析填补了基因组异常和致癌蛋白机制之间的研究空缺,通过与相应NAT蛋白质组的比较,发现了肺腺癌相关的癌症通路。在对中国肺腺癌患者的蛋白质组学分析基础之上增加了磷酸化蛋白质组的分析,进一步揭示了肺腺癌中激活的信号通路和激酶。

2.本研究确定了三种新的蛋白质组学亚型,它们具有可以连接肺腺癌临床、病理和预后的独特分子特征。在蛋白质组学特征中,细胞环境和能量代谢与良好的预后有关,而细胞增殖和蛋白质组稳定性与较差的预后有关。本研究的基因组分析表明,EGFR和TP53的基因突变在中国肺腺癌患者中占主导地位,且两种诊断性生物标志物TTF-1(NKX2-1)和NAPSA与EGFR突变呈正相关。但是,EGFR突变如何调节TTF-1表达的确切机制仍有待研究。与来自西方国家的TCGA研究相比,EGFR突变的发生频率和KRAS突变的发生频率存在明显不同,具有种族偏向的遗传特征;值得一提的是,最近在西方国家的LUAD患者中进行的一项大型队列研究显示TP53/EGFR共突变对预后没有影响。综合上述两点,种族是LUAD精准肿瘤学中应该评估的关键因素之一。

3.蛋白质组学数据证实了HSP90β是LUAD的预后标志物,并确定了一组蛋白质作为潜在的药物靶标,其中许多与癌症的发展有关,研究结果表明这些候选物在LUAD中具有潜在的治疗益处。

综上所述,多组学综合分析是一种宝贵而强大的工具,可提供对LUAD的补充和更全面的理解,并加快从基础研究到临床精确诊断和治疗的转换。

作者:许梓妍

原文引用:Doi:10./j.cell..05.

往期精彩:

Nature|小鼠20个器官单细胞图谱数据库TabulaMuris

Science|血液因子传递运动对老年人大脑神经发育和认知改善的益处

NatureMethods|Philosopher-shotgun蛋白质组学数据分析功能包

-扫码
分享 转发
TOP
发新话题 回复该主题