本文作者:kaifamei

一种基于自噬相关基因预测喉鳞状细胞癌的预后模型及其构建方法与流程

更新时间:2025-12-16 04:45:38 0条评论

一种基于自噬相关基因预测喉鳞状细胞癌的预后模型及其构建方法与流程


一种基于自噬相关基因预测喉鳞状细胞癌的预后模型及其构建方法
【技术领域】
1.本发明涉及生物医学技术领域,具体是涉及一种基于自噬相关特征基因预测喉鳞状细胞癌的预后模型及其构建方法。


背景技术:



2.喉癌是头颈部第二大常见的恶性肿瘤,超过90%以上的喉癌病理类型属于喉鳞状细胞癌。在全球范围内,喉癌每年影响约65万的人,并且夺走了约35万人的生命。近年来,随着烟草使用量的减少,喉鳞状细胞癌的发病率也有所下降,但患者近5年的生存率并无明显变化,且约60%的患者确诊时已处于癌症iii期或iv期。喉鳞状细胞癌会极大地影响患者的社会心理健康,并会对患者的发音、呼吸和吞咽功能产生直接影响,其传统的方法主要包括根治性手术切除和放化疗,虽然在一定程度上提高了患者的生存率,但通常也会严重影响患者的生活质量。因此,探索喉鳞状细胞癌的潜在生物标志物对于临床改善患者预后而言具有至关重要的作用。
3.自噬是在溶酶体将细胞内受损、变性或衰老的蛋白质以及细胞器进行消化降解的过程。在正常生理情况下,细胞自噬有利于细胞保持自稳状态;在发生应激时,细胞自噬防止有毒或致癌的损伤蛋白质和细胞器的累积,抑制细胞癌变。但是当肿瘤形成后,癌细胞的营养可经细胞自噬提供,促进肿瘤生长。细胞的自噬过程主要受自噬相关基因调控。近年来的研究表明自噬相关基因在部分肿瘤患者的预后判定中起着重要作用。如有研究发现自噬相关基因atg5的表达与胃壁浸润深度、tnm分期、胃癌远处转移以及所研究胃癌队列的总体存活率和无病生存期显著相关,这表明atg5的表达可能是胃癌的独立预后标志物。也有研究发现自噬相关基因ulk1在外阴鳞癌中表达下降,且与患者figo分期、肿瘤浸润深度及淋巴结转移状况相关,这可作为判断外阴鳞癌预后新的生物学标志物。此外,在卵巢浆液性癌中,自噬相关基因beclin1和lc3在卵巢浆液性癌组织中的表达下降,导致自噬功能减弱,这可能与卵巢浆液性癌的发生、发展和预后不良相关。
4.由此可见,自噬相关基因的表达与肿瘤的发生发展和患者的预后密切相关,但目前有关自噬基因在喉鳞状细胞癌中的作用尚不明确。近年来,基于自噬相关基因对喉鳞状细胞癌患者进行预后分层的研究也比较少。因此,对自噬相关基因在喉鳞状细胞癌中的表达和预后进行分析是必要的,这不仅可以为喉鳞状细胞癌构建预后风险模型提供理论依据,还可以辅助患者改善预后。


技术实现要素:



5.本发明的目的是针对现有技术存在的不足,提供了一种含有十个自噬相关特征基因作为生物。标志物预测喉鳞状细胞癌预后的模型,其中涉及到的十个与自噬相关的特征基因为dapk2、ero1a、hif1a、gapdh、capn10、rab7a、hspa8、map1lc3c、capn1和ccr2,这些基因可作为喉鳞状细胞癌的生物标记物,应用于基础医学研发、基因芯片开发以及试剂盒研
发。本发明还构建了一种基于自噬相关基因的喉鳞状细胞癌的预后模型,该预后模型公式为:其中n表示筛选到的特征基因数量,expi表示特征基因的表达量,βi为预后基因对应的多因素cox回归分析系数。
6.本发明还提供了一种基于自噬相关基因预测喉鳞状细胞癌预后模型的构建方法与验证方法,其具体包括如下步骤:
7.(1)从tcga数据库中下载喉鳞状细胞癌的mrna表达量数据以及对应的临床数据,同时从人类自噬数据库下载自噬相关的基因,并在喉鳞状细胞癌的mrna表达量数据中提取自噬相关基因的表达量;
8.(2)对正常组和肿瘤组中的自噬相关基因进行差异分析,其中差异分析的筛选标准为:|logfc|=1,padj=0.05,最终获得了33个差异表达的自噬相关基因;
9.(3)对上述33个差异表达的自噬相关基因进行go功能富集分析和kegg功能富集分析;
10.(4)将喉鳞状细胞癌肿瘤样本按随机比例(7:3)分为训练集和验证集;在训练集中,利用单因素cox回归分析,计算每个差异表达的自噬相关基因与患者预后的关系,并筛选出与患者预后显著相关的18个自噬相关基因;
11.(5)构建lasso回归模型,利用lasso cox回归分析,基于r包“glmnet”使用1000次cox lasso回归迭代和10倍交叉验证,获得10个与患者预后显著相关的候选特征基因;
12.(6)对这10个候选特征基因进行多因素cox回归分析,即可获得与患者预后显著相关的10个特征基因以及构建相关基因的预后模型;为进一步验证该模型是否普遍适用于临床使用,我们根据每个基因的表达量水平和风险系数计算出患者的风险评分;并根据风险评分的中位值将患者分为高风险和低风险两组,判断患者预后不良风险,同时通过时间相关的受试者工作特征曲线(roc)分析评估其准确性,以相同的方法在验证集中验证模型的有效性;
13.(7)为了评估预后预测模型的临床独立性,进一步将风险评分作为患者的一个预后因素,结合患者的临床性状(年龄、性别、n分期、t分期、stage分期),对tcga-lscc训练集进行单因素和多因素cox回归分析,并绘制临床性状及risk score的roc曲线;
14.(8)列线图的构建与验证,通过结合临床信息和风险评分值生成列线图来预测患者3年和5年os的可能性,并获得列线图3年生存率和5年生存率的校正曲线,以用来验证列线图的预测效果。
15.一种如上检测所述喉鳞状细胞癌预后模型的方法,具体包括mrna表达量的获取,自噬相关基因的筛选,模型的构建与验证以及风险评分的计算。
16.进一步地,所述的筛选首先是筛选与自噬相关的基因,然后在筛选后的基因中对比其在肿瘤样本与正常样本之间是否有显著的差异表达。
17.与现有技术相比,本发明具有以下有益效果:
18.本发明提供一种基于自噬相关基因建立的预测模型来对喉鳞状细胞癌患者的预后进行评估,其在验证集中验证了该模型的可行性。这可以辅助临床有效区分并甄选出预后差的喉鳞状细胞癌患者,即将喉鳞状细胞癌患者进行分层,筛选出高风险、预后差的喉鳞状细胞癌患者,这有利于医生对高风险患者提供更精准的方案,同时也能避免对低风险患者进行过度。
【附图说明】
19.图1为差异表达的自噬相关基因的火山图和箱线图,其中图1(a)为33个差异表达的自噬相关基因火山图;图1(b)为33个差异基因在正常样本和肿瘤样本中的表达量箱线图;
20.图2为差异表达的自噬相关基因的go和kegg功能富集分析图,其中图2(a)为33个差异表达的自噬相关基因的go富集分析图;图2(b)为33个差异表达的自噬相关基因的kegg富集分析图;
21.图3为自噬相关基因预后模型的构建图,其中图3(a)为lasso回归模型图,通过引入惩罚参数lambda将每项特征的系数逐渐缩小为零,去除冗余度较高的特征,从而防止模型过拟合;图3(b)是对lasso回归模型进行交叉验证的数据图,其确定了惩罚参数的lambda最优值;图3(c)为多因素cox回归分析森林图;
22.图4为评估自噬相关基因预后模型准确性的数据图,其中图4(a)为风险评分曲线图;图4(b)为喉鳞状细胞癌患者生存情况的散点图(浅点表示存活患者,深点表示死亡患者);图4(c)训练集中高风险组和低风险组患者的kaplan-meier生存曲线图;图4(d)训练集中喉鳞状细胞癌患者3年和5年总生存率的roc曲线图;图4(e)验证集中高风险组和低风险组患者的kaplan-meier生存曲线图;图4(f)验证集中喉鳞状细胞癌患者3年和5年总生存率的roc曲线图;
23.图5为自噬相关基因预后模型的独立预后价值评估图;结合临床性状对10个特征基因风险评分进行(a)单因素cox回归分析、(b)多因素cox回归分析以及(c)临床性状和风险评分的roc分析;
24.图6为预测喉鳞状细胞癌患者生存率的列线图;图6(a)为用于预测生存时间的target队列列线图;图(b)、图(c)分别为预测3年和5年生存率的校准图。
【具体实施方式】
25.下面结合附图对本发明提供的具体实施方式作详细说明,实施例基于自噬相关基因的喉鳞状细胞癌预后模型的构建及临床应用。
26.一、方法与材料
27.1.数据下载及预处理
28.从the cancer genome atlas(tcga)数据库(https://portal.gdc.cancer.gov/)下载喉鳞状细胞癌的mrna表达量数据及对应的临床数据,其中具体包括12个正常样本和111个肿瘤样本;同时还需要从人类自噬数据库中(http://www.autophagy.lu/)下载222个与自噬相关的基因,再从喉鳞状细胞癌的中的mrna表达量数据中提取自噬相关基因的表达量;然后利用r包“limma”对正常组和肿瘤组的自噬相关基因进行差异分析(|logfc|=1,padj=0.05),最终获得了差异表达的自噬相关基因。
29.2.go和kegg富集分析
30.利用r包“cluster profiler”对差异表达的自噬相关基因进行go和kegg富集分析,并利用r包“digest”和“go plot”绘制圈图,通过对上述数据的分析,揭示了差异表达的自噬相关基因所富集的生物学功能和信号通路。
31.3.预后模型的构建与验证
32.将喉鳞状细胞癌癌症样本按随机比例(7:3)分为训练集和验证集,在训练集中,利用r包“survival”对差异表达的自噬相关基因进行单因素cox回归分析(p《0.05),即可获取与预后显著相关的自噬相关基因;然后利用r包“glmnet”对获得的预后显著相关的自噬相关基因进行lasso cox回归分析,即可获取候选特征基因;再使用r包“survival”对候选特征基因进行多因素cox回归分析,即可获取特征基因以及对相关特征基因的预后模型。
33.为进一步验证该模型是否普遍适用于临床使用,我们根据每个基因的表达量水平和风险系数计算出患者的风险评分。将患者按风险评分的中位值分为高风险组和低风险组,并利用r包“survival”绘制高低风险组的kaplan-meier生存曲线。同时,利用r包“survival roc”分析时间相关的受试者工作特征曲线(roc)以用来计算预后模型中患者3年和5年总生存期(os)的auc值,然后用相同的方法在验证集中验证模型的有效性。
34.4.评估预后模型的临床独立性
35.采用风险评分作为患者的一个预后因素,结合患者的临床性状(年龄、性别、n分期、t分期、stage分期),对tcga-lscc训练集进行单因素和多因素cox回归分析,进一步评估预后预测模型的临床独立性。同时,绘制临床性状及risk score的roc曲线。
36.5.列线图的构建与验证
37.利用r包“rms”通过结合临床信息和风险评分值生成列线图来预测患者3年和5年os的可能性;并利用r包“foreign”生成患者生存率的列线图,并进行3年生存率和5年生存率的曲线校正,以用来验证列线图的预测效果。
38.二、结果
39.1.数据预处理和差异分析
40.利用r包“limma”对正常组和肿瘤组中的自噬相关基因进行差异分析,如图1a所示,在喉鳞状细胞癌中有33个差异表达的自噬相关基因,其中上调基因有21个,下调基因有12个。并且从图1b的箱线图中,我们可以更直观的观察到差异基因在正常样本和肿瘤样本中的表达情况。
41.2.go和kegg富集分析
42.如图2a和图2b所示,对33个差异表达的自噬相关基因进行go富集分析和kegg富集分析,并通过绘制圈图对其进行可视化分析。其中go富集结果显示:差异表达的自噬相关基因主要富集在自噬调节、神经元死亡和凋亡过程等与自噬相关的生物学功能(图2a);kegg富集结果显示:差异表达的自噬相关基因主要富集在细胞凋亡、类风湿关节炎、il-17等信号通路(图2b)。
43.3.预后模型的构建
44.如图3a、图3b和图3c所示,用验证集进行单因素cox回归分析(p《0.05),获得了与患者预后显著相关的18个自噬相关基因。对上述18个与患者预后显著相关的自噬相关基因进行lasso cox回归分析,并采用交叉验证法选择惩罚参数lambda,随即获得了10个候选特征基因,然后可用于后续的模型分析。后续利用r包“survival”对10个候选特征基因进行多因素cox回归分析,最终筛选出10个最优的预后特征基因(dapk2、ero1a、hif1a、gapdh、capn10、rab7a、hspa8、map1lc3c、capn1和ccr2)作为喉鳞状细胞癌的独立预后因素。根据这10个特征基因的表达水平及其风险系数来计算风险评分。risk score=(-0.627
×
表达量dapk2)+(0.048
×
表达量ero1a)+(0.558
×
表达量hif1a)+(0.273
×
表达量gapdh)+(-0.136
×
表达量capn10)+(0.074
×
表达量rab7a)+(0.323
×
表达量hspa8)+(-0.009
×
表达量map1lc3c)+(0.449
×
表达量capn1)+(-0.958
×
表达量ccr2)。
45.4.评估10个特征基因风险评估模型的预测能力
46.如图4a和图4b所示,根据预后预测模型risk score的中位值将tcga-lscc样本分为高风险组和低风险组;其中风险曲线和散点图显示了所有喉鳞状细胞癌患者的风险评分和生存状态,结果表明低风险组的死亡率和危险系数均低于高风险组。图4c的kaplan-meier生存曲线表明,低风险组患者的生存期明显长于高风险组患者。图4d的roc曲线展示了风险评估模型预测样本3年和5年生存率的准确性,其auc值分别为0.872和0.805。然后用验证集对多因素预后模型进行了验证,kaplan-meier生存曲线同样表明,低风险组患者的生存期明显长于高风险组患者(图4e),验证集中风险评估模型预测样本3年和5年生存率的auc值分别为0.804和0.7(图4f)。综上表明,本发明构建的10个特征基因的风险评估模型用于预测喉鳞状细胞癌患者的预后,具有较好的预测能力。
47.5.评估10个自噬相关特征基因作为喉鳞状细胞癌患者的独立预后因素
48.为了进一步分析本发明所构建的10个特征基因风险评估模型的临床独立性。我们根据10个特征基因风险评估模型的风险评分和临床信息进行单因素cox回归分析。如图5a所示,单因素cox回归分析显示了性别、n分期和风险评分对患者的预后有显著影响。如图5b所示,多因素cox回归分析结果显示了风险评分和性别对患者的预后有显著影响(p《0.001)。如图5c所示,临床性状和risk score的roc曲线显示risk score的roc曲线下面积为0.784,这高于所有临床性状的roc曲线下面积。这些结果表明,本发明构建的10个特征基因风险评估模型有望成为优于患者临床性状的预后预测指标,且不受患者自身临床性状的影响,能够作为评估患者预后的独立因素。
49.6.列线图的构建与验证
50.通过结合患者的临床性状(年龄、性别、t分期、n分期、stage分期)和risk score值,其生成的列线图可以用来预测患者3年和5年总生存率的可能性(图6a)。并且预后3年的生存率(图6b)和5年的生存率(图6c)的校正曲线和理想模型的拟合度较高。综合分析表明基于10个自噬特征基因构建的预后模型可以作为喉鳞状细胞癌患者预后的独立因素。
51.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。

技术特征:


1.一种基于自噬相关特征基因预测喉鳞状细胞癌的预后模型,其特征在于,含有主要和喉鳞状细胞癌预后相关的10个特征基因:dapk2、ero1a、hif1a、gapdh、capn10、rab7a、hspa8、map1lc3c、capn1、ccr2,这些特征基因能够成为喉鳞状细胞癌相关的生物标志物。2.根据权利要求1所述的一种基于自噬相关特征基因预测喉鳞状细胞癌的预后模型,其特征在于,计算公式为risk score=(-0.627
×
表达量dapk2)+(0.048
×
表达量ero1a)+(0.558
×
表达量hif1a)+(0.273
×
表达量gapdh)+(-0.136
×
表达量capn10)+(0.074
×
表达量rab7a)+(0.323
×
表达量hspa8)+(-0.009
×
表达量map1lc3c)+(0.449
×
表达量capn1)+(-0.958
×
表达量ccr2)。3.一种如权利要求1或2任一项所述的基于自噬相关特征基因预测喉鳞状细胞癌的预后模型的构建方法,具体包括如下步骤:(1)数据收集和处理从tcga数据库中获取喉鳞状细胞癌的mrna表达量数据及其对应的临床数据,其中包含正常样本和肿瘤样本;从人类自噬数据库中获取与自噬相关的基因;然后在喉鳞状细胞癌的mrna表达量数据中获取自噬相关基因(autophagy related gene,atg)的表达量,并对正常组和肿瘤组的atg进行差异分析,最终获得差异表达的atg;(2)go和kegg功能富集分析对差异表达的atg进行go和kegg功能富集分析,并对其进行可视化分析;(3)预后模型的构建与验证将喉鳞状细胞癌肿瘤样本按随机比例分为训练集和验证集;并在训练集中,对差异表达的atg进行单因素cox回归分析,获得与预后相关的atg;然后通过lasso回归建模,对单因素回归分析后的预后相关的atg进行进一步分析筛选并获取候选特征atg;同时对获取的候选特征atg进行多因素cox回归分析,接下来可以得到特征基因及相应的预后模型;为进一步验证该模型是否普遍适用于临床使用,在训练集和验证集中根据每个基因的表达量水平和风险系数计算出患者的风险评分,将患者按风险评分的中位值分为高风险组和低风险组,并且通过kaplan-meier生存分析和log-rank检验比较高低风险组患者之间的总生存期是否存在差异,通过分析时间相关的roc曲线以计算风险评估模型预测患者3年和5年总生存期(os)的auc值,最后以相同的方法在验证集中验证模型的有效性;(4)预后模型的临床独立性验证以风险评分作为患者的一个预后因素,结合患者的临床性状(年龄、性别、n分期、t分期、stage分期),对tcga-lscc训练集进行单因素和多因素cox回归分析,进一步评估风险模型预测患者预后的独立性,并绘制临床性状及risk score的roc曲线;(5)列线图的构建与验证通过结合临床信息和风险评分值生成列线图来预测患者3年和5年os的可能性;同时,获得列线图3年和5年的校正曲线,以验证列线图的预测效果;(6)统计分析使用r软件包进行统计分析,使用的软件包主要包括:“clusterprofiler”、“survival”、“glmnet”、“survivalroc”、“rms”和“foreign”。4.根据权利要求3所述的一种基于自噬相关特征基因预测喉鳞状细胞癌的预后模型的构建方法,其特征在于,步骤(3)所述的喉鳞状细胞癌患者风险评分与生存期相关,风险评
分高的患者生存期短、预后差。5.一种如权利要求1-4任一项所述的自噬相关特征基因表达量的检测样本为肿瘤组织;自噬相关特征基因表达量的检测产品为基因芯片、试剂盒。

技术总结


本发明公开了一种基于自噬相关基因预测喉鳞状细胞癌的预后模型及其构建方法,该模型含有主要和喉鳞状细胞癌预后相关的10个特征基因:DAPK2、ERO1A、HIF1A、GAPDH、CAP10、RAB7A、HSPA8、MAP1LC3C、CAP1、CCR2。本发明所构建的预后预测模型可以对喉鳞状细胞癌患者的预后进行评估,并且能够区分并甄选出预后较差的喉鳞状细胞癌患者,从而辅助临床医生为不同风险的患者提供更为精准的方案。同时,本发明提供多个自噬相关基因作为潜在的预后生物标记物,提高了对于预测喉鳞状细胞癌的预后灵敏度和准确性,从而降低喉鳞癌患者的死亡率和局部复发率。率和局部复发率。率和局部复发率。


技术研发人员:

吴柏旭 白春晟 黄国玉

受保护的技术使用者:

洛兮基因科技(杭州)有限公司

技术研发日:

2022.10.16

技术公布日:

2023/1/19


文章投稿或转载声明

本文链接:http://www.wtabcd.cn/zhuanli/patent-1-87294-0.html

来源:专利查询检索下载-实用文体写作网版权所有,转载请保留出处。本站文章发布于 2023-01-29 15:26:08

发表评论

验证码:
用户名: 密码: 匿名发表
评论列表 (有 条评论
2人围观
参与讨论