本文作者:kaifamei

甲状腺癌CD8+T细胞免疫相关基因预后预测模型的制作方法

更新时间:2025-12-17 02:01:43 0条评论

甲状腺癌CD8+T细胞免疫相关基因预后预测模型的制作方法


甲状腺癌cd8+t细胞免疫相关基因预后预测模型
【技术领域】
1.本发明属于生物医学领域,具体涉及一种预测甲状腺癌患者肿瘤免疫浸润和预后生存率的免疫相关基因预后模型。


背景技术:



2.甲状腺癌是一种起于甲状腺滤泡上皮或滤泡旁上皮细胞的恶性肿瘤,也是头颈部最常见的内分泌恶性肿瘤。根据其起源和分化差异分为乳头状甲状腺癌、滤泡性甲状腺癌、间变性甲状腺癌和甲状腺髓样癌这四类。根据世界卫生组织(who)统计,2020年全球共有586,000例甲状腺癌患者,全球发病率排名第9。目前甲状腺癌的以外科为主,辅以其他方法。由于甲状腺癌易转移,现研究发现甲状腺癌无法治愈,但与其他恶性肿瘤之间的区别是甲状腺癌的早期发现率高,且五年生存率也比其他肿瘤高得多。然而不同类型的甲状腺癌的预后存在差异,复发转移性甲状腺癌和未分化的甲状腺癌预后往往较差。因此,深入了解影响甲状腺癌患者预后的因素尤为重要。
3.在人类癌症中,t细胞浸润是调节肿瘤进展的关键因素,也决定了患者对免疫的临床情况。一般来说,患者的t淋巴细胞浸润越高,免疫的反应越好,预后也越好。而cd8+t细胞对细胞内肿瘤的保护性免疫十分重要。已有研究证实,肿瘤浸润cd8+t细胞的密度或结直肠组织中驻留的cd103+cd8+t细胞的数量可以作为结直肠癌的重要预后预测因子。有研究人员对结肠癌的免疫基因进行分析,证明cd4+t细胞和cd8+t细胞相关基因与结肠癌预后相关。有研究人员根据cd8+t细胞相关基因,确定了肾透明细胞癌的潜在预后生物标志物。有研究人员通过对cd8+t细胞的细胞丰度进行评分,证明cd8+t细胞的丰度评分可以作为三阴乳腺癌的预后标志物。有研究人员将regorafenib和抗pd-1联合,通过升高肝细胞癌细胞中cxcl10表达增加肿瘤内cxcr3+cd8+t细胞浸润来抑制肿瘤生长并增加存活率。yang等人,发现接受根治性前列腺切除术的前列腺癌患者,其肿瘤内cd8+t细胞浸润程度与生存率有关,cd8+t细胞的浸润程度高,患者术后效果好,但现有技术中并不能快速、准确地筛选到与甲状腺癌患者生存相关标志物,无法有效建立相关预后模型,因此挖掘开发cd8+t细胞浸润相关的生物标志物与预后模型有助于甲状腺癌患者预后评估。


技术实现要素:



4.本发明的目的是能快速、准确地筛选到与甲状腺癌患者生存相关标志物,利用筛选出来的标志物构建预后模型,同时该模型可以对甲状腺癌患者的免疫浸润情况进行评估,为临床医生对甲状腺癌患者的预后判断提供判断依据。
5.本发明提供甲状腺癌生物标志物筛选、预后模型构建与验证及其与肿瘤免疫浸润之间的关系,其方法具体步骤如下:
6.从癌症基因组图谱tcga中下载甲状腺癌tcga-thca数据集,其中包括510个肿瘤组织样本和58个癌旁组织样本的mrna表达量数据以及临床数据;
7.利用cibersort分析tcga-thca数据集中甲状腺癌样本mrna表达量数据,得到所有
甲状腺癌样本22种免疫细胞的组成比例,根据细胞丰度中值对样本分组,结合生存分析,发现cd8+t细胞与患者生存状况显著相关;
8.根据cd8+t细胞的丰度对甲状腺癌肿瘤样本进行差异分析,对免疫相关差异基因进行go和kegg富集分析;
9.通过单因素cox回归分析在训练集中筛选与预后相关的免疫相关基因;
10.通过lasso cox回归分析,去除相关性比较强的基因,以降低模型复杂度;
11.通过多因素cox回归分析,得到特征基因并构建风险评估模型,风险评分公式为:
[0012][0013]
其中n为与cd8+t细胞免疫相关特征基因数量,expi为每个预后特征基因的表达值,βi为对应的多因素cox回归系数。
[0014]
其中用于构建模型的基因包括myl3,cilp,pcolce2,hmgcs2,ppbp,gcgr;
[0015]
所述预后风险评估模型为:风险评分==(0.9703*myl3的表达水平)+(0.5322*cilp的表达水平)+(0.7225*pcolce2的表达水平)+(0.6878*hmgcs2的表达水平)+(0.7626*ppbp的表达水平)+(0.7528*gcgr的表达水平);
[0016]
根据模型的计算公式计算训练集中每个样本的风险评分,基于样本风险评分的中位数将患者分为高风险组和低风险组,分析两组患者生存情况和特征基因在不同风险组的表达量;
[0017]
在训练集和验证集中结合k-m生存曲线和roc曲线评估模型的预测性能;
[0018]
通过gsea富集分析,到在高低风险组中出现差异的信号通路;
[0019]
高低风险组免疫浸润评估:利用estimate评估训练集中甲状腺癌肿瘤样本的基质分数、免疫分数和estimate分数,并对高低风险组肿瘤样本进行ssgsea分析,同时利用wilcoxon检验高低风险组间差异。
[0020]
本发明提供了利用上述构建方法获得的甲状腺癌预后模型。
[0021]
本发明还提供了一种前面所述甲状腺癌预后模型的应用方法,所述应用方法包括:
[0022]
获得甲状腺癌患者样本的mrna表达数据,其中,所述甲状腺癌样本的转录谱数据包括用于构建所述风险评分模型的基因表达量;以及基于所述甲状腺癌样本转录谱表达数据,根据所述风险评分模型计算所述甲状腺癌患者的风险评分。
[0023]
本发明中的“样本”可以包括但不限于,单个细胞或多个细胞、细胞层、组织活检物、切除的组织、组织提取物、组织、全血、血小板、血浆、血细胞等。样本可以通过下列手段从对象中获得,所述手段包括但不限于,静脉穿刺、活体组织检查、针刺抽吸、手术切除或本领域中已知的其他手段。
[0024]
与现有技术相比,根据本发明的基于cd8+t细胞免疫相关模型的甲状腺癌评估方法,考虑到免疫细胞在甲状腺癌生物学中的重要意义,确定了一个与cd8+t细胞免疫相关的模型来预测甲状腺癌样本的预后,为甲状腺癌的辅助诊断及提供理论依据,能够对甲状腺癌样本的预后进行较为准确的判定。
【附图说明】
[0025]
图1本发明的技术流程图;
[0026]
图2免疫细胞丰度与总体生存的相关性分析;图2中(a)甲状腺癌样本中各类免疫细胞丰度比;(b)免疫细胞在正常组织和肿瘤组织样本之间的丰度差异;蓝代表正常组织样本,红代表肿瘤组织样本;(c)b cells 高低丰度组患者的生存曲线;(d)t cells cd8高低丰度组患者的生存曲线;(e)t cells follicularhelper高低丰度组患者的生存曲线;(f)macrophages m0高低丰度组患者的生存曲线;(g)macrophages m1高低丰度组患者的生存曲线;(h)macrophages m2高低丰度组患者的生存曲线;
[0027]
图3甲状腺癌肿瘤样本中cd8+t细胞高低丰度组的差异表达基因火山图;红表示显著上调基因,蓝表示显著下调基因;
[0028]
图4cd8+t细胞相关差异表达基因富集分析;图4中(a)degs go富集分析气泡图;和(b)degs kegg通路富集分析结果,图中nodes代表富集的terms,nodes越大表明富集的基因数越多,nodes颜趋于红代表p值越小;
[0029]
图5cd8+t细胞免疫相关基因特征;图5中(a)lasso回归分析中61个预后相关基因系数随惩罚参数lambda的变化轨迹;(b)最佳惩罚参数的选择区间,上坐标表示不同lambda值对应的基因个数;(c)6个特征基因多因素cox回归分析森林图(*p《0.05,**p《0.01,***p《0.001);
[0030]
图66-基因预后风险模型能力评估;图6中(a)训练集中甲状腺癌患者高低风险得分分布图,绿代表低风险,红代表高风险;(b)基于风险评分绘制训练集甲状腺癌患者生存状态分布图,绿代表生存患者,红代表死亡患者;(c)训练集中,高低风险组患者k-m生存曲线(d)验证集中,高低风险组患者k-m生存曲线,蓝代表低风险,红代表高风险;(e)6个特征基因患者高低风险热图;
[0031]
图76-基因预后模型性能评估;图7中(a)训练集中,6-基因预后模型roc曲线;(b)验证集中,6-基因预后模型roc曲线;
[0032]
图8高低风险组gsea富集分析;图8中(a)高低风险组在ecm receptor interaction通路中富集情况;(b)高低风险组在tgf beta signaling pathway通路中富集情况;(c)高低风险组在hedgehog signaling pathway通路中富集情况;
[0033]
图9甲状腺癌免疫浸润评估;图9中(a)高低风险组中基质组分评分、免疫组分评分、总评分的差异分析(b)高低风险组中免疫细胞组分差异分析;(c)高低风险组中免疫功能差异分析;蓝代表低风险组,红代表高风险组。
【具体实施方式】
[0034]
下面通过具体的实施例进一步说明本发明的技术方案,具体实施例不代表对本发明保护范围的限制。其他人根据本发明理念所做出的一些非本质的修改和调整仍属于本发明的保护范围。
[0035]
实施例1筛选甲状腺癌预后相关基因
[0036]
数据下载与处理
[0037]
从the cancer genome atlas(tcga,https://portal.gdc.cancer.gov/)数据库下载甲状腺癌mrna表达量数据集tcga-thca(fpkm格式和count格式;normal:58tumor:510)
及其临床数据。
[0038]
免疫细胞丰度及其与生存相关性的评估
[0039]
利用cibersort分析tcga-thca数据集中甲状腺癌样本mrna表达量数据(fpkm格式),迭代计算1000次,得到所有甲状腺癌样本22种免疫细胞的组成比例,选择pvalue《0.05的163份样本进行后续分析(图2a)。利用“vioplot”包对正常样本和肿瘤样本的22种免疫细胞的细胞丰度进行差异分析,结果发现,b cells naive、t cells cd8、t cells follicularhelper、macrophages m0、macrophages m1和macrophages m2等免疫细胞差异显著且丰度较高(图2b)。以这六种免疫细胞的细胞丰度中值将样本分为高丰度组和低丰度组。结合临床信息,我们绘制了六种免疫细胞高丰度组和低丰度组患者生存曲线,结果显示cd8+t细胞高丰度组甲状腺癌患者生存率更高(图2c-h)。相比之下,其它免疫细胞的丰度与总体生存率的相关性并不显著。
[0040]
cd8+t细胞差异表达分析
[0041]
利用“edger”包并根据cd8+t细胞高低丰度组对甲状腺癌肿瘤样本进行差异分析,以|logfc|》1.5,padj《0.05为标准,共得到397个差异基因,其中包含144个上调基因和253个下调基因(图3)。利用“clusterprofiler”包对免疫相关差异基因进行go和kegg富集分析,go分析结果显示,差异表达基因大多富集在receptor ligand activity,g protein-coupled receptorbinding,cytoking activity和chemokine activity等分子功能上(图4a);kegg分析结果显示,差异表达基因大多富集在cytokine-cytokine receptor interaction,neuroactive ligand-receptor interaction,chemokine signaling pathway和il-17signaling pathway等信号通路上(图4b)。这些免疫基因的差异表达很可能是造成甲状腺癌患者预后出现明显差异的原因。
[0042]
基于cd8+t细胞免疫相关基因特征构建
[0043]
结合免疫相关的差异表达基因,利用“survival”包进行单因素cox分析,筛选到61个与预后相关的免疫基因。为防止模型中预后特征过拟合,利用“glmnet”包对这61个基因进行lasso cox回归分析,筛选到11个重要的特征基因(图5a-b)。利用“survival”包对lasso筛选到的11个基因构建多因素cox回归模型,最终筛选出6个与预后相关的特征基因(myl3,cilp,pcolce2,hmgcs2,ppbp,gcgr)(图5c),并得到风险模型:riskscore=0.9703*myl3+0.5322*cilp+0.7225*pcolce2+0.6878*hmgcs2+0.7626*ppbp+0.7528*gcgr。
[0044]
6-基因预后模型预测能力评估
[0045]
基于6-基因预后模型计算训练集中每个甲状腺癌肿瘤样本的风险值,根据风险评分中位值将患者样本划分为高风险组和低风险组(图6a)。基于风险评分绘制甲状腺癌患者生存情况分布图和高、低风险组k-m生存曲线(图6b-c),同时使用验证集中的高低风险组进行生存分析(图6d),结果显示,低风险组患者的生存情况明显优于高风险组。随后我们绘制了高低风险组6-特征基因热图,可以看出随着风险评分增高,特征基因表达量增高(图6e)。利用“timeroc”包进行time-roc曲线绘制,结果显示,训练集中预后模型预测甲状腺癌患者1、3、5年生存acu值分别为0.9,0.97,0.88(图7a);使用验证集进行进一步的验证,验证集中预后模型预测甲状腺癌患者1、3、5年生存acu值分别为0.98,0.79,0.79(图7b)。证明基于训练集构建的6-基因预后风险评估模型得到的风险评分,对甲状腺癌患者预后具有一定的预测能力。
[0046]
高低风险组gsea富集分析
[0047]
利用gsea软件对甲状腺癌患者高低风险组进行kegg富集通路分析,发现高、低风险组在ecm receptor interaction、tgf beta signaling pathway和hedgehog signaling pathway等通路上存在差异(图8)。这些通路均与免疫相关,与免疫相关通路出现差异可能是导致甲状腺癌患者出现高低风险的原因。
[0048]
高低风险评分组免疫浸润评估
[0049]
利用“estimate”包对tcga-thca数据集中甲状腺癌肿瘤样本的基质细胞组分、免疫细胞组分进行打分,基质得分范围为-1677.8078至1591.0739,免疫得分范围为-1285.1845至3204.7238,estimate得分范围为-2418.0121至4167.0835。对高低风险组中的基质细胞组分评分、免疫组分评分、总评分进行差异分析,我们发现高风险组的基质细胞组分评分显著低于低风险组,而免疫组分评分和estimate评分在高低风险组中的差异并不显著(图9a)。高低风险组ssgsea富集结果表明,与高风险组相比,低风险组nk cells浸润水平更高;在免疫功能方面,低风险组在apc co-inhibition,cytolytic activity,hla和t cell co-inhibition等方面表达更高(图9b-c)。

技术特征:


1.一种甲状腺癌cd8+t细胞免疫相关基因预后预测模型,其特征在于:预后风险评分由6个cd8+t细胞免疫相关基因表达水平和相应系数经权重后的总和计算获得,可以预测患者的预后不良风险。2.如权利要求1所述的一种甲状腺癌cd8+t细胞免疫相关基因预后预测模型,其特征在于:所述6种cd8+t细胞免疫相关基因包括myl3,cilp,pcolce2,hmgcs2,ppbp和gcgr。3.如权利要求1所述一种甲状腺癌cd8+t细胞免疫相关基因预后预测模型的确立方法,其包括以下步骤:步骤一:从tcga数据库中tcga-thca数据集,其中包括510个肿瘤组织样本和58个癌旁组织样本的mrna表达量数据和临床数据;步骤二:利用cibersort对mrna表达量数据进行分析,得到所有甲状腺癌样本免疫细胞的组成;利用“vioplot”包对正常样本和肿瘤样本进行细胞丰度差异分析,根据细胞丰度中值进行分组,并利用“survival”包进行生存分析;根据差异分析和生存分析结果,发现cd8+t细胞与生存情况显著相关;步骤三:对cd8+t细胞相关基因进行差异表达分析;步骤四:通过单因素cox回归分析,筛选预后相关免疫基因;lasso cox回归分析,筛选预后相关重要的免疫基因;最后利用多因素cox回归分析,最终筛选得到6个与预后相关的特征基因,并构建了预后风险评估模型;步骤五:根据模型的计算公式计算训练集中每个样本的风险评分,将样本风险评分中位值作为截断值,将患者分为高风险组和低风险组,分析两组患者后的总体生存差异;在训练集中k-m生存曲线和roc曲线评估预后风险模型的预测性能;步骤六:将上述基于免疫基因相关的预后模型在验证集中验证其预后价值。4.根据权利要求1所述的一种甲状腺癌cd8+t细胞免疫相关基因预后预测模型,其特征在于,所述预后预测模型为多因素cox回归模型,所述预后预测模型的公式为风险评分=(0.9703*myl3的表达水平)+(0.5322*cilp的表达水平)+(0.7225*pcolce2的表达水平)+(0.6878*hmgcs2的表达水平)+(0.7626*ppbp的表达水平)+(0.7528*gcgr的表达水平)。5.一种如权利要求1所述用于预测甲状腺癌预后风险的模型在对患者的免疫浸润中的用途。

技术总结


本发明公开了一种基于CD8+T细胞免疫相关基因模型的甲状腺癌预后评估方法,其中,所述基于CD8+T细胞免疫相关基因模型的甲状腺癌预后评估方法用于预测甲状腺癌的预后,所述基于CD8+T细胞免疫相关基因构建的甲状腺癌预后预测模型的评估方法包括:根据多个甲状腺癌样本以及多个正常甲状腺样本的mRA信息筛选出与CD8+T细胞免疫相关特征基因;对所述与CD8+T细胞相关的特征基因信息和临床数据进行分析,构建CD8+T细胞免疫相关基因的预后模型;基于所述与CD8+T细胞免疫相关基因的预后模型进行预后预测。本发明所建立的基于CD8+T细胞免疫相关基因模型的甲状腺癌预后评估方法能够对甲状腺癌患者预后进行较为精准的判定。状腺癌患者预后进行较为精准的判定。状腺癌患者预后进行较为精准的判定。


技术研发人员:

吴柏旭 程翎 朱梦娇

受保护的技术使用者:

洛兮医疗科技(杭州)有限公司

技术研发日:

2022.09.16

技术公布日:

2023/1/19


文章投稿或转载声明

本文链接:http://www.wtabcd.cn/zhuanli/patent-1-87292-0.html

来源:专利查询检索下载-实用文体写作网版权所有,转载请保留出处。本站文章发布于 2023-01-29 15:25:50

发表评论

验证码:
用户名: 密码: 匿名发表
评论列表 (有 条评论
2人围观
参与讨论