一种基于全血细胞计数融合指标HBI的癌症风险评估系统的制作方法
一种基于全血细胞计数融合指标hbi的癌症风险评估系统
技术领域
1.本发明涉及癌症的风险评估技术领域,尤其是涉及一种基于全血细胞计数融合指标hbi的癌症风险评估系统。
背景技术:
2.随着我国城市化、工业化、老龄化进程的加快,恶性肿瘤已成为危害我国居民生命和健康的主要慢性病之一。根据世界卫生组织国际癌症研究机构(iarc)发布的2020年全球最新癌症负担数据,中国已经成为了名副其实的“癌症大国”。2020年中国新发癌症病例457万例,其中男性248万例,女性209万例,2020年中国癌症死亡病例300万例,其中男性182万例,女性118万例。目前,我国恶性肿瘤发病、死亡数持续上升,每年恶性肿瘤所致的医疗花费超过2200亿。因此,我国应在扩大相关肿瘤的筛查及早诊早治覆盖面、肿瘤临床诊治规范化和同质化推广应用两方面共同发力,降低我国恶性肿瘤死亡率。
3.现有基于全血细胞计数指标预测癌症的方法需要使用全部的20余项指标进行训练,结构复杂、预测效果不佳、可解释性差,无法将指标数据的高低与癌症直接联系起来,不利于在医疗场所投入使用。这些不利因素大大限制了使用全血细胞计数指标判断患癌风险在医学筛查中的应用。
技术实现要素:
4.本发明的目的是提供一种基于全血细胞计数融合指标hbi的癌症风险评估系统,可解释性强,效果稳定,便于医务工作者使用,提高了癌症筛查工具的便捷性和普及性,对于癌症的筛查具有较高的实际应用价值。
5.为实现上述目的,本发明提供了一种基于全血细胞计数融合指标hbi的癌症风险评估系统,可以基于待筛查者hbi打分和癌症hbi风险分类标准输出带筛查者患癌风险,基于机器学习预测模型输出待筛查者患癌预测概率,包括以下步骤:
6.步骤s1:获取大规模人样本,分为癌症患者和健康人;
7.步骤s2:利用健康人和癌症患者的数据建立癌症hbi风险分类标准;
8.步骤s3:利用健康人和癌症患者的数据建立预测癌症发病概率的机器学习预测模型;
9.步骤s4:将待测样本数据输入癌症风险评估系统,根据下述公式计算出待测样本的hbi打分:
[0010][0011]
其中age为年龄,rdw-cv为红细胞体积分布宽度cv,mono%为单核细胞百分比,hct为红细胞比容,lymph%为淋巴细胞百分比,然后根据癌症hbi标准确定对应的患癌风险,将4项全血细胞计数指标、年龄和hbi输入保存好的机器学习模型,获得患癌概率。
[0012]
优选的,步骤s2具体包括:
[0013]
步骤s21:计算出每个样本的hbi打分,计算公式为:
[0014][0015]
步骤s22:将两类样本的hbi以间隔为1划分区间,统计两类样本的hbi打分分布情况;
[0016]
步骤s23:最后根据统计学结果对多区间进行合并,得出癌症hbi风险分类标准。
[0017]
优选的,步骤s3具体包括:
[0018]
步骤s31:将癌症患者的标签定为1,将健康人的标签定为0,将样本的4项全血细胞计数指标、年龄和hbi打分作为特征;
[0019]
步骤s32:将两类样本均分为训练集和测试集,比例为4:1;
[0020]
步骤s33:将训练集输入xgboost模型中进行训练,得到机器学习预测模型。
[0021]
优选的,步骤s4具体包括:
[0022]
步骤s41:计算出待测样本的hbi值,根据癌症hbi风险分类标准输出对应的患癌风险;
[0023]
步骤s42:将4项全血细胞计数指标、年龄和hbi打分载入机器学习预测模型,获得患癌预测概率。
[0024]
优选的,计算公式
[0025][0026]
其中,年龄(age,单位(岁));红细胞体积分布宽度cv(rdw-cv,单位(%));单核细胞百分比(mono%,单位(%));红细胞比容(hct,单位(%));淋巴细胞百分比(lymph%,单位(%))。
[0027]
优选的,发现的癌症hbi风险分类标准为:hbi小于3且大于等于1,定为“极低风险”;hbi小于5且不小于3或hbi不小于0且小于1,定为“低风险”;hbi小于8且不小于5,定为“中风险”;hbi大于8,定为“高风险”。
[0028]
因此,本发明采用上述的一种基于全血细胞计数融合指标hbi的癌症风险评估系统,与现有技术相比,具有以下有益效果:
[0029]
(1)使用了统计学和机器学习两种方法,创新并简化了癌症筛查预警的模式,可解释性强,效果稳定,便于医务工作者使用;
[0030]
(2)提高了癌症筛查工具的便捷性和普及性,对于癌症的筛查具有较高的应用价值。
[0031]
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
[0032]
图1为本发明一种基于全血细胞计数融合指标hbi的癌症风险评估系统的流程图;
[0033]
图2为统计学结果柱状图;
[0034]
图3为本发明一种基于全血细胞计数融合指标hbi的癌症风险评估系统实施例实例示范流程图。
具体实施方式
[0035]
实施例
[0036]
癌症风险评估系统,其用于基于待筛查者hbi打分和癌症hbi风险分类标准,预测出待筛查者患癌风险;基于机器学习模型,预测出待筛查者患癌预测概率,如图1分为四步:
[0037]
第一步:获取大规模人样本,分为癌症患者和健康人两类。其中癌症患者包括肺癌、胃癌、肝癌、食管癌、甲状腺癌、胰腺癌、淋巴癌、白血病、膀胱癌、肾癌、胆囊癌、口腔癌、鼻咽癌、喉癌、骨癌、结直肠癌、前列腺癌、睾丸癌、乳腺癌、宫颈癌、卵巢癌和子宫内膜癌。使用的4项全血细胞计数指标为红细胞体积分布宽度cv(rdw-cv)、单核细胞百分比(mono%)、红细胞比容(hct)和淋巴细胞百分比(lymph%);样本中含有年龄。
[0038]
第二步:利用健康人和癌症患者的数据计算癌症hbi风险分类标准。首先计算出每个样本的hbi打分,计算公式为:
[0039][0040]
其中,年龄(age,单位(岁));红细胞体积分布宽度cv(rdw-cv,单位(%));单核细胞百分比(mono%,单位(%));红细胞比容(hct,单位(%));淋巴细胞百分比(lymph%,单位(%))。然后将两类样本的hbi以间隔为1划分区间,统计两类样本的hbi打分分布情况。最后根据统计学结果(图2)对多区间进行合并,得出癌症hbi风险分类标准。癌症hbi风险分类标准如表1:hbi小于3且不小于1,定为“极低风险”;hbi小于5且大于等于3或hbi不小于0且小于1,定为“低风险”;hbi小于8且不小于5,定为“中风险”;hbi大于8,定为“高风险”。
[0041]
hbi数值所在区域患癌风险判定[1,3)极低风险[0,1)∪[3,5)低风险[5,8)中风险[8,+∞)高风险
[0042]
表1
[0043]
第三步:利用健康人和癌症患者的数据建立预测癌症发病概率的机器学习预测模型并保存。首先将癌症患者的标签定为“1”,将健康人的标签定为“0”,将样本的4项全血细胞计数指标、年龄和hbi打分作为特征。然后把两类样本都分为训练集和测试集,比例为4:1。将训练集输入xgboost模型中进行训练,使用测试集进行评估。
[0044]
第四步:将待测样本数据输入癌症风险评估系统,根据公式:
[0045][0046]
其中,年龄(age,单位(岁));红细胞体积分布宽度cv(rdw-cv,单位(%));单核细胞百分比(mono%,单位(%));红细胞比容(hct,单位(%));淋巴细胞百分比(lymph%,单位(%)),计算出待测样本的hbi,根据癌症hbi风险分类标准输出对应的患癌风险。将待测样本的4项全血细胞计数指标、年龄和hbi载入保存好的机器学习模型,获得患癌概率。
[0047]
具体示例见图3,取三个不同年龄的待测样本,计算出hbi打分,待测1号的hbi为7.04,待测2号的hbi为13.74,待测3号的hbi为3.76,根据癌症hbi风险分类标准输出对应的患癌风险;将样本的4项全血细胞计数指标、年龄和hbi打分作为特征输入到保存好的机器
学习模型中,获得患癌概率。最后得出待测1号的风险评定为“中风险”,患癌概率为65.36%,待测2号的风险评定为“高风险”,患癌概率为77.37%,待测3号的风险评定为“低风险”,患癌概率为31.73%。
[0048]
因此,本发明采用上述的一种基于全血细胞计数融合指标hbi的癌症风险评估系统,使用了统计学和机器学习两种方法,创新并简化了癌症筛查预警的模式,可解释性强,效果稳定,便于医务工作者使用,提高了癌症筛查工具的便捷性和普及性,对于癌症的筛查具有较高的应用价值。
[0049]
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。
技术特征:
1.一种基于全血细胞计数融合指标hbi的癌症风险评估系统,其特征在于,基于待筛查者hbi打分与癌症hbi风险分类标准确定待筛查者患癌风险,基于机器学习模型输出待筛查者患癌预测概率,主要包括以下步骤:步骤s1:获取人样本,分为癌症患者和健康人;步骤s2:利用健康人和癌症患者的数据确立癌症hbi风险分类标准;步骤s3:利用健康人和癌症患者的数据建立预测患癌概率的机器学习预测模型;步骤s4:将待测样本数据输入癌症风险评估系统后,根据下述公式计算出hbi:其中age为年龄,rdw-cv为红细胞体积分布宽度cv,mono%为单核细胞百分比,hct为红细胞比容,lymph%为淋巴细胞百分比,然后根据癌症hbi标准输出对应的患癌风险,将4项全血细胞计数指标、年龄和hbi载入保存好的机器学习模型,获得患癌概率。2.根据权利要求1所述的一种基于全血细胞计数融合指标hbi的癌症风险评估系统,其特征在于,步骤s2具体包括:步骤s21:计算出每个训练样本的hbi打分,计算公式为:步骤s22:将两类训练样本的hbi打分以间隔为1划分区间,统计两类样本的hbi打分分布情况;步骤s23:根据统计学结果对多区间进行合并,得出癌症hbi风险分类标准。3.根据权利要求1所述的一种基于全血细胞计数融合指标hbi的癌症风险评估系统,其特征在于,步骤s3具体包括:步骤s31:将癌症患者的标签定为1,将健康人的标签定为0,将样本的4项全血细胞计数指标、年龄和hbi打分作为特征;步骤s32:将两类样本均分为训练集和测试集,比例为4:1;步骤s33:将训练集输入xgboost模型中进行训练,得到机器学习预测模型。4.根据权利要求1所述的一种基于全血细胞计数融合指标hbi的癌症风险评估系统,其特征在于,步骤s4具体包括:步骤s41:计算出待测样本的hbi打分,根据癌症hbi风险分类标准输出对应的患癌风险;步骤s42:将4项全血细胞计数指标、年龄和hbi打分载入机器学习预测模型,获得患癌预测概率。5.根据权利要求1所述的一种基于全血细胞计数融合指标hbi的癌症风险评估系统,其特征在于,发现的癌症hbi风险分类标准为:hbi小于3且大于等于1,定为“极低风险”;hbi小于5且不小于3或hbi不小于0且小于1,定为“低风险”;hbi小于8且不小于5,定为“中风险”;hbi大于8,定为“高风险”。
技术总结
本发明公开了一种基于全血细胞计数融合指标HBI的癌症风险评估系统,包括以下步骤:获取癌症患者和健康人的人样本;利用健康人和癌症患者的4项全血细胞计数指标和年龄数据计算出HBI(Hybrid Blood Index)打分,根据样本HBI打分的统计学结果建立癌症HBI风险分类标准;使用4项全血细胞计数指标、年龄和HBI打分建立预测患癌概率的机器学习预测模型;计算出待测样本的HBI打分;对照癌症HBI风险分类标准输出对应的患癌风险;将4项全血细胞计数指标、年龄和HBI打分载入机器学习预测模型,获得患癌预测概率。本发明采用上述的一种基于全血细胞计数融合指标HBI的癌症风险评估系统,提高了癌症筛查工具的便捷性和普及性,对于癌症的筛查具有较高的实际应用价值。筛查具有较高的实际应用价值。筛查具有较高的实际应用价值。
