摘要: 第一部分 基于UHPLC-QTOF/MS筛选食管鳞癌代谢生物标志物 研究背景 食管癌是全球第七大最常见的癌症,具有地域和种族特征。在中国,食管癌的发病率在肿瘤发病中位居第五,食管鳞状细胞癌(esophageal squamous cell carcinoma,ESCC)是最主要的病理类型,能够占到所有病例的90%以上。近年来,尽管食管癌的诊断方法和治疗手段都取得了一些进展,患者的预后仍没有得到显著改善,五年生存率仅为15%至25%,是严重威胁国人健康的疾病。 目前,X线钡餐造影、CT等影像学检查常用于食管癌的诊断,但对早期食管癌不甚敏感,更适用于中晚期患者的诊断和分期。食管内镜+活检是食管癌临床诊断的金标准,但该方法为有创检查,且技术难度大、检查成本高。癌胚抗原(carcinoembryonic antigen,CEA)、细胞角蛋白19片段(cytokeratin-19-fragment,CYFRA21-1)、鳞状上皮细胞癌抗原(squamous cell cancer antigen,SCC)等是常用的食管癌标志物,但灵敏度不高。临床尚缺乏灵敏可靠,且经济高效的食管癌生物标志物,适合在常规体检中推广。代谢组学是后基因时代生物医学研究领域的新热点。基因或转录水平的改变提示机体发生特定行为的可能性,而代谢物处在下游,是一系列生物学效应的最终表现,能够更加具体、准确地反映出机体的生理或病理状态。因此,代谢生物标志物更适合用于临床诊断疾病。 ESCC的代谢生物标志物研究正在逐步展开,但仍然存在一定局限性。目前的研究大多采用体液样本,其中最常用的是血液。血液参与人体各种组织和器官的生理生化反应和病理过程,其优点是采样方法简便,缺点是与混杂因素常常导致假阳性生物标志物的发现。组织样本来源于肿瘤发生的直接场所,使用患者组织的不同部分配对地进行代谢组学分析,可以消除个体差异,受混杂因素的影响相对较小,不足之处是组织样本的获得需要有创操作,不利于大规模推广。所以,组织代谢组学与体液代谢组学互相配合,有利于扬长避短,能够发现肿瘤组织所诱导的特定代谢失调。 研究目的 认识ESCC的代谢特点,筛选ESCC血清生物标志物,为进一步探索可靠、高效的ESCC诊断方法奠定理论基础。 研究方法 我们采集ESCC患者配对的癌组织和癌旁组织样本,及其治疗前的血清样本,并招募健康志愿者采集其血清样本。利用UHPLC-QTOF/MS平台进行代谢组学检测,获得代谢指纹图谱,并借助MetDNA方法对代谢物进行分析注释。采用主成分分析和偏最小二乘判别分析对获得的数据进行多维统计分析,并结合单变量Wilcoxon秩和检验进行组间比较,分别筛选出ESCC组织及血清中的异常代谢物。最后,根据代谢物的极性、质量电荷比及保留时间,将组织和血清差异代谢物进行匹配,发现两类样本之间一致性的代谢改变,并利用这些代谢物构建随机森林模型。 研究结果 1.癌组织和癌旁组织之间,以及ESCC患者血清和对照血清之间均存在明显的代谢轮廓差异。经过单变量和多维统计分析,根据Padj<0.05且VIP>1的标准,癌组织中共筛选出1692个差异代谢物,ESCC患者血清中共筛选出457个差异代谢物。 2.对组织和血清中的差异代谢物进行匹配,共有36种代谢物在两类样本中表现出一致性的代谢失调,主要涉及氨基酸代谢(4-氨基丁醛、3-磺基丙酮酸、1-氨基环丙烷-1-羧酸盐等)、中心碳代谢(L-谷氨酸、L-天冬氨酸、甘油等)以及嘌呤代谢(次黄嘌呤、黄嘌呤)等代谢通路。 3.将36种差异代谢物纳入构建随机森林模型,ROC分析结果显示模型的判别效能良好,在早期(TNM:0-Ⅱ)和中晚期(TNM:Ⅲ-Ⅳ)ESCC患者的判别中灵敏度分别为97.5%和92.7%,特异性分别为98.9%和93.8%。 研究结论 ESCC中存在明显的代谢扰动,通过对两类样本中的差异代谢物进行匹配,共鉴定出36种潜在的血清生物标志物;将其用于构建ESCC诊断模型,显示出良好的判别效能。 第二部分 利用转录组学验证食管鳞癌代谢生物标志物及通路 研究背景 在第一部分中,我们通过代谢组学研究,综合比较了 ESCC患者组织和血清中的异常代谢特征,筛选并鉴定出36种潜在的代谢生物标志物。然而,目前的研究结果实现临床转化存在一定局限性。首先,生物标志物数量过多,在诊断效能提高的同时也会增加检测成本与技术难度,需要进一步筛选出对于ESCC更为关键的代谢物,争取以最少的检测指标实现尽可能大的诊断效能;其次,单一组学无法揭示不同层面分子之间的交叉与联系,所以在探索分子标志物与生物表型之间的因果关系方面能力有限。 多组学技术联合已逐步应用于不同研究领域,借助组学数据之间的整合分析,不仅可以有效去除单个分子层面的随机事件,锁定真正的疾病候选因子,还可以将不同层面的调节关联到一起,从而更好地诠释疾病发生机制。代谢物是细胞生物学过程的最终产物,能够反映上游生物学事件,如基因表达改变和环境变化。而基因及其编码的蛋白质在代谢物的代谢过程中起着重要的作用,与机体的代谢调节密切相关。转录组学能够反映在特定时间、特定环境下,机体基因表达所发生的特定改变,是揭示疾病机制的有效手段。所以,通过代谢组学来探索肿瘤的代谢特征和生物标志物,然后通过转录组学验证筛选出的代谢物和代谢途径,不仅可以进一步验证代谢层面的研究发现,还提供了一个系统水平的视角,有助于我们更好地理解肿瘤的代谢失调。 研究目的 通过整合代谢组学与转录组学数据,更深入的了解ESCC中的代谢变化,寻找代谢标志物相关通路的关键基因线索,进一步缩小候选生物标志物范围,建立可靠且经济高效的ESCC诊断方法,并为研究ESCC发生发展的分子机制奠定基础。 研究方法 研究第一部分收集到的组织样本,我们随机抽取23组配对的癌组织和癌旁组织进行转录组学测序和差异基因分析,并借助KEGG数据库,采用超几何检验方法对ESCC组织差异代谢物和基因共同进行通路富集,通过分析失调代谢通路,挖掘ESCC中步调一致的代谢物-基因变化。然后,利用组织测序数据以及免疫组织化学染色技术(immunohistochemistry,IHC)分析关键基因在ESCC中的表达情况。采用Wilcoxon秩和检验比较组间的基因表达水平差异;利用Fisher精确检验和Logistics回归分析比较基因与患者临床病理特征的相关性;使用Pearson相关性分析代谢物与基因表达之间的相关性。最后,通过代谢物-基因的分析结果,缩小生物标志物范围,并对生物标志物的诊断效能进行外部验证。 研究结果 1.经过差异基因分析,根据Padj<0.05且abs(log2(Foldchange))>1的筛选标准,共获得了差异表达的mRNA 3110个,其中表达上调的mRNA有1742个,表达下调的mRNA有1368个。 2.将ESCC组织差异代谢物和差异表达的mRNA共同进行通路富集,结果显示两类分子主要富集在神经活性配体-受体相互作用、cAMP信号通路、蛋白质消化吸收、嘌呤代谢及氨基酸生物合成等通路。 3.通过对富集通路的逐一检查,我们在嘌呤挽救途径中发现了步调一致的代谢物-基因变化。在ESCC组织中,次黄嘌呤、黄嘌呤和调控二者利用的关键基因HPRT1表现出显著上调,同时下游代谢产物鸟苷酸(GMP)丰度增加。并且,组织中次黄嘌呤和黄嘌呤的丰度上调与血液中相一致,而GMP在血液中的丰度没有显著变化。 4.HPRT1在ESCC患者癌组织中的表达水平显著高于癌旁组织。测序数据显示,HPRT1 mRNA的高表达与患者较大的肿瘤组织(≥5cm)显著相关(OR=29.33,95%CI:3.52-675.53,p=0.007)。IHC结果显示:肿瘤组织较大(≥5cm)的患者,其HPRT1蛋白表达水平显著高于肿瘤组织较小(<5cm)的患者(p=0.039)。 5.与癌旁组织相比,癌组织中的次黄嘌呤和黄嘌呤丰度均显著增高(p<0.001);ESCC患者血清中次黄嘌呤和黄嘌呤丰度均显著高于对照血清(p<0.001)。组织和血清中次黄嘌呤和黄嘌呤的丰度,均与ESCC组织中的HPRT1 mRNA水平(p<0.001)及蛋白表达量显著相关(p<0.001)。Pearson相关性分析结果显示,ESCC组织和血清中的次黄嘌呤和黄嘌呤水平与血尿酸水平之间均不存在显著的相关性(p>0.05)。 6.利用次黄嘌呤和黄嘌呤构建随机森林模型并进行交叉验证。ROC分析结果显示,模型在血清内部发现集(第一部分代谢组学数据)中判别ESCC的AUC为0.825(95%CI=0.758-0.889),灵敏度为74.7%,特异度为85.2%;在外部验证集中判别ESCC的AUC为0.765(95%CI=0.680-0.843),灵敏度为72.4%,特异度为80.2%。次黄嘌呤和黄嘌呤作为生物标志物,其灵敏度高于CEA(17-28%)、CYFRA21-1(19.7-40%)以及SCC(64%)。 研究结论 ESCC组织中发生了与嘌呤挽救途径相关的代谢物-基因显著改变,这些改变既减轻了嘌呤核苷酸从头合成的压力,也减轻了嘌呤核苷酸降解及排出的压力,同时满足了癌细胞生长增殖的需要。代谢生物标志物次黄嘌呤与黄嘌呤有实现无创、经济、高效诊断ESCC的潜力,嘌呤挽救途径有可能成为治疗ESCC的关键靶点。第三部分 次黄嘌呤和HPRT1在食管鳞癌中的作用机制研究 研究背景 在前两部分的研究中,我们首先利用代谢组学筛选并鉴定出36种潜在的ESCC血清生物标志物,进而通过整合分析代谢组学与转录组学数据,在嘌呤挽救途径中发现次黄嘌呤和黄嘌呤及其调控基因HPRT1呈现步调一致的上调趋势。但代谢物与基因是否在肿瘤发生发展中发挥作用,需要我们通过基础实验进行深入探索。 HPRT1编码的蛋白-次黄嘌呤鸟嘌呤磷酸核糖转移酶1是嘌呤挽救途径中的关键酶。HPRT1曾经被认为是一种管家基因,但是最近的研究揭示它可能与多种癌症的发生发展有关。目前,HPRT1在ESCC中的生物学功能尚无报导。此外,次黄嘌呤与黄嘌呤在ESCC中的异常增高是否也具有生物学意义,仍需要我们进行研究探讨。 研究目的 研究次黄嘌呤与HPRT1在ESCC中的相互作用关系,并探讨次黄嘌呤与HPRT1在ESCC发生发展中发挥的生物学功能。 研究方法 分析TCGA数据库中HPRT1在各类癌组织中的表达及其与患者预后的相关性,验证HPRT1的研究价值。利用qRT-PCR以及western blot技术检测5种ESCC细胞系(KYSE-30、KYSE-150、KYSE-180、KYSE-450 和 KYSE-510)中 HPRT1 的表达水平,选择HPRT1表达水平居中的两种细胞系,利用慢病毒转染技术在两种细胞系中分别构建HPRT1稳定沉默和过表达的细胞株。黄嘌呤与次黄嘌呤在体内可以互相转化,所以本部分我们以次黄嘌呤为代表进行研究。细胞计数实验、克隆形成实验、Transwell实验以及次黄嘌呤Elisa检测实验,用于研究次黄嘌呤与HPRT1在ESCC细胞中的相互作用关系。细胞计数实验和克隆形成实验评估HPRT1对ESCC细胞增殖的影响。划痕愈合实验和Transwell实验评估HPRT1对ESCC细胞迁移的影响。流式细胞术评估稳定沉默HPRT1表达对ESCC细胞周期进程及细胞凋亡的影响。构建裸鼠移植瘤模型评估稳定沉默HPRT1表达对ESCC细胞体内成瘤能力的影响。细胞转录组学测序用于研究稳定沉默HPRT1表达所影响的信号通路,western blot技术验证HPRT1对通路的调控作用。 研究结果 1.TCGA数据库中,与正常组织相比,HPRT1在食管癌、乳腺癌、宫颈癌等12类癌症中表达显著上调。Cox比例风险模型结果显示,在包括食管癌在内的17类癌症中,与HPRT1低表达组相比,高表达组的死亡风险显著增加。在食管癌中,HPRT1高表达组的死亡风险较低表达组增加了 2倍以上(HRs=2.215,95%CI:1.143-4.293,p=0.018),HPRT1高表达组的中位OS为18.2个月,明显短于HPRT1低表达组的31. 摘要译文