XGBoost机器学习模型对乙型肝炎肝硬化诊断的应用价值研究

doi:10.11569/wcjd.v31.i13.544

高级检索

BPG致力于知识的发现和传播

Home / Archive / Volume 31, Issue 13

本文章

本文章的引用

本文章的通讯作者

本文章的研究领域

本文章的类型

本文章的开放获取政策

本文章的Google引用次数

本文章的点击和下载次数

本文章浏览次数 (5796)

All Articles published online

The chart showing PDF series, HTML series.

Item

Count

PDF

269

HTML

2630

总和 = 2899

Featured Article

The chart showing Browse series, Download series.

Item

Count

Browse

360

Download

622

总和 = 982

Publishing Process of This Article

Item

Count

Browse

353

Download

493

总和 = 846

2023-07-08 (publication date) through 2025-08-19

本文章的被引频次

被引频次 (0)

本文章的期刊信息

出版物名称

世界华人消化杂志

ISSN

1009-3079

本文章的出版商

Baishideng Publishing Group Inc, 7041 Koll Center Parkway, Suite 160, Pleasanton, CA 94566, USA

临床研究 Open Access

世界华人消化杂志. 2023-07-08; 31(13): 544-554
在线出版日期: 2023-07-08. doi: 10.11569/wcjd.v31.i13.544

XGBoost机器学习模型对乙型肝炎肝硬化诊断的应用价值研究

李季, 韩可兴, 沈佳培, 孙伟杰, 高龙, 郜玉峰

李季, 韩可兴, 沈佳培, 孙伟杰, 高龙, 郜玉峰, 安徽医科大学第一附属医院感染病科安徽省合肥市 230032

李季, 主治医师, 主要研究方向是肝硬化的早期诊断及治疗.

ORCID number: 孙伟杰 (0000-0003-0112-0461); 郜玉峰 (0000-0003-1822-8161).

基金项目: 安徽省自然科学基金, No. 2208085MH204.

作者贡献分布: 李季与韩可兴对此文所作贡献两均等; 此课题由李季、韩可兴、沈佳培、孙伟杰设计; 研究过程由李季、韩可兴、沈佳培、孙伟杰、高龙、郜玉峰操作完成; 数据分析由李季、韩可兴、郜玉峰完成; 本论文写作由李季、韩可兴、孙伟杰完成; 郜玉峰提供了基金支持.

通讯作者: 郜玉峰, 主任医师, 23000, 安徽省合肥市蜀山区绩溪路218号, 安徽医科大学第一附属医院. aygyf@ahmu.edu.cn

收稿日期: 2023-04-20
修回日期: 2023-05-25
接受日期: 2023-06-21
在线出版日期: 2023-07-08

摘要

背景

慢性乙型肝炎病毒感染(chronic hepatitis B virus infection, CHBV)进展成肝硬化是缓慢且容易被忽略的, 通过临床常规指标来构建肝硬化无创诊断模型成为研究热点. 然而, 目前有关肝硬化早期诊断的机器学习模型仍是缺乏的.

目的

探讨极限梯度提升机(eXtreme gradient boosting, XGBoost)机器学习模型在乙肝肝硬化无创诊断中的效能.

方法

回顾性分析2010-2018年首次就诊于安徽医科大学第一附属医院和第二附属医院感染病科的CHBV患者1087例, 按照随机原则以3:1的比例分为训练集和验证集. 收集所有研究对象的临床资料并利用XGBoost机器学习模型构建预测模型. 同时, 计算谷草转氨酶与血小板比率指数(aspartate aminotransferase/platelet ratio index, APRI)、纤维蛋白-4(fibrosis-4 index, FIB-4)评分并与XGBoost机器学习模型进行比较. 受试者工作特征曲线下面积(area under curve, AUC)以评估模型区分度, 校准曲线(calibration curve, CA)及决策曲线(decision curve analysis, DCA)以评估模型校准度及获益度.

结果

共纳入CHBV病例1087例, 其中训练集817例, 验证集270例. 训练集与验证集两组间所有预测变量均无统计学差异(P>0.05). 训练集中有103例患者发生肝硬化, 肝硬化患者APRI和FIB-4评分明显高于非肝硬化患者(P<0.05). 在所有预测因子中血小板的相对重要度最高. 训练集和验证集的AUC分别为0.95和0.86(P<0.05), 两者Kappa值分别为0.78和0.74, 提示模型可重复性较好. CA曲线提示模型预测情况与真实情况拟合情况吻合度较高. 训练集和验证集的DCA曲线提示所建立模型能够使患者获得较高的获益度. XGBoost机器学习模型对于肝硬化的效能优于APRI评分和FIB-4评分.

结论

本研究利用CHBV患者常见的临床信息构建的XGBoost模型对肝硬化的诊断具有良好的性能, 值得临床进一步推广.

关键词: 慢性乙型病毒性肝炎; 肝硬化; 预测模型; XGBoost机器学习模型

核心提要: 本研究重点探究以慢性乙型肝炎病毒感染患者年龄和临床常见指标构建极限梯度提升机机器学习模型, 为肝硬化的早期管理提供参考依据.

引文著录: 李季, 韩可兴, 沈佳培, 孙伟杰, 高龙, 郜玉峰. XGBoost机器学习模型对乙型肝炎肝硬化诊断的应用价值研究. 世界华人消化杂志 2023; 31(13): 544-554

Value of XGBoost machine learning model for diagnosis of hepatitis B cirrhosis

Ji Li, Ke-Xing Han, Jia-Pei Shen, Wei-Jie Sun, Long Gao, Yu-Feng Gao

Ji Li, Ke-Xing Han, Jia-Pei Shen, Wei-Jie Sun, Long Gao, Yu-Feng Gao, Department of Infection, The First Affiliated Hospital of Anhui Medical University, Hefei 230032, Anhui Province, China

Supported by: Natural Science Foundation of Anhui Province, No. 2208085MH204.

Corresponding author: Yu-Feng Gao, Chief Physician, The First Affiliated Hospital of Anhui Medical University, No. 218 Jixi Road, Shushan District, Hefei 23000, Anhui Province, China. aygyf@ahmu.edu.cn

Received: April 20, 2023
Revised: May 25, 2023
Accepted: June 21, 2023
Published online: July 8, 2023

Abstract

BACKGROUND

The progression of chronic hepatitis B into cirrhosis is slow and easily ignored, and the construction of a noninvasive diagnostic model for cirrhosis based on routine clinical indicators has become a hot research topic. However, there is still a lack of machine learning models regarding the early diagnosis of cirrhosis.

AIM

To investigate the performance of the extreme gradient boosting (XGBoost) machine model in the diagnosis of hepatitis B cirrhosis.

METHODS

A retrospective analysis was performed on 1087 patients with chronic hepatitis B virus infection (CHBV) diagnosed for the first time at the Department of Infection, The First/Second Affiliated Hospital of Anhui Medical University from 2010 to 2018. The patients were divided into training and validation sets in a 3:1 ratio according to the randomization principle. Clinical data of all study participants were collected and prediction models were constructed using XGBoost machine learning model. Meanwhile, the aspartate aminotransferase/platelet ratio index (APRI) and fibrosis-4 index (FIB-4) scores were calculated and compared with the XGBoost machine learning model. Area under the curve (AUC) was used to assess the model discrimination, and calibration curve (CA) and decision curve analysis (DCA) were used to assess the model calibration and benefit.

RESULTS

A total of 1087 CHBV patients were included, including 817 in the training set and 270 in the validation set. There was no statistical difference between the training and validation sets for all predictor variables (P > 0.05). Cirrhosis occurred in 103 patients in the training set, and APRI and FIB-4 scores were significantly higher in cirrhotic patients than in non-cirrhotic patients (P < 0.05). The relative importance of platelets was the highest among all predictors. The AUCs of the model in the training and validation sets were 0.95 and 0.86 (P < 0.05), respectively, and the Kappa values were 0.78 and 0.74, which suggested that the model was reproducible. CA curve analysis indicated that the model predicted a high degree of agreement with the true situation fit. DCA of the training and validation sets implied that the developed model could result in a high degree of benefit for patients. XGBoost machine learning model was significantly more efficient for the diagnosis of cirrhosis than APRI and FIB-4 scores.

CONCLUSION

The XGBoost machine learning model constructed in this study based on common clinical information of CHBV patients has an excellent performance for the diagnosis of cirrhosis and deserves further clinical promotion.

Key Words: Chronic hepatitis B virus infection; Cirrhosis; Prediction model; XGBoost machine learning model

Citation: Li J, Han KX, Shen JP, Sun WJ, Gao L, Gao YF. Value of XGBoost machine learning model for diagnosis of hepatitis B cirrhosis. Shijie Huaren Xiaohua Zazhi 2023; 31(13): 544-554
URL: https://www.wjgnet.com/1009-3079/full/v31/i13/544.htm
DOI: https://dx.doi.org/10.11569/wcjd.v31.i13.544

0 引言

乙型肝炎病毒(hepatitis B virus, HBV)感染对世界公共卫生带来巨大的挑战, 相关研究表明全球估计有2.4亿人最终转变为慢性乙型肝炎病毒感染(chronic hepatitis B virus infection, CHBV)[1]. 我国作为HBV感染大国, CHBV是引起肝硬化的主要原因[2]. 同时, 由于CHBV进展到肝硬化的患者常在失代偿期后才会出现一系列临床症状, 例如门静脉高压以及由此导致的急危重症, 这导致肝硬化代偿期常因无明显的临床症状而被患者所忽略[3]. 然而, 失代偿期肝硬化会进一步增加患者的死亡率和肝细胞癌(hepatocellular carcinoma, HCC)的发生率[4]. 正因如此, 如何更早的识别CHBV合并肝硬化具有重要的临床意义.

肝活检是诊断肝硬化的金标准, 但由于有创性且费用昂贵难以被需要反复进行肝脏状态评估的患者所接受[5,6]. 此外, 由于活检样本通常很小, 这导致肝活检的准确性依然是值得怀疑的[7,8]. 并且由于观察者之间存在解释误差, 病理学家之间的诊断意见可能不同[9]. 肝脏超声瞬时弹性成像(liver ultrasound transient elastography, LUTE)是近年来被大家所接受的能够准确评估肝脏硬度的有效工具[10]. 然而, 不仅LUTE设备的价格, 检查中需要配备的探头和后期的维护费用都是昂贵的[11], 这导致基层医疗机构可能无法满足患者接受LUTE检查的需求. 所以, 基于实验室血清学检查指标而建立的针对肝硬化及肝纤维化的无创评分成为研究的热点. 例如如谷草转氨酶与血小板比率指数(aspartate aminotransferase/platelet ratio index, APRI)、纤维蛋白-4(fibrosis-4 index, FIB-4)、BARD评分等已经被用于临床工作. 其中APRI和FIB-4主要应用于慢性丙型肝炎患者晚期肝纤维化的诊断, 但容易受年龄和体重因素的干扰[12,13]. 而BARD评分虽然简便易行, 但准确性很低并且仍需有效的验证队列对其准确性进行验证[14]. 因此, 上述评分可能主要应用于严重肝纤维化的诊断, 但对于代偿期肝硬化的预测价值仍需进一步明确[12,13]. 总之, 目前仍需要寻求有效的针对肝硬化的无创评分[15], 虽然部分影像学诊断可以有效的判别肝硬化, 但在大规模筛查研究中基于血清标志物的无创评分仍是必不可少的[16].

极限梯度提升机(eXtreme gradient boosting, XGBoost)机器学习模型是一种集成的学习算法, 与传统机器学习模型不同的是, XGBoost机器学习模型是取所有模型的和为输出, 其能在模型运算过程中寻找最优树结构从而发挥更好的拟合作用并且具备更好的模型稳定性, 对于存在缺失特征值的样本, XGBoost算法还可以自动学习其分裂方向从而获得最佳的预测效果[5]. XGBoost机器学习模型作为一种人工智能算法在医学领域中逐渐成熟, 在各种疾病的诊断、治疗和管理中发挥巨大的作用[6-8].

综上, 本研究拟基于临床获取的患者一般特征学信息和实验室指标构建XGBoost机器学习模型用以预测CHBV合并肝硬化的发生, 为临床对于肝硬化的管理提供参考依据.

1 材料和方法

1.1 材料

选取2010-01/2018-10初次就诊于安徽医科大学第一和第二附属医院感染科的CHBV患者为研究对象, 所有患者均未接受治疗. 依据中华医学会感染病学分会制定的《慢性乙型肝炎防治指南(2019版)》[17]诊断CHB; 依据中华医学会肝病学会制定的《肝硬化诊治指南》诊断肝硬化[18]. 对以下患者进行排除[19]: (1)合并其他病毒性肝炎; (2)合并酒精性肝病、自身免疫性肝病、药物毒物肝病、遗传代谢性肝病、寄生虫肝病、胆汁淤积性肝病、循环障碍导致肝病及肝脏肿瘤患者; (3)合并其他可能引起肝脏硬度发生改变的肝外疾病, 如结缔组织病、慢性阻塞性肺疾病、肺间质纤维化、糖尿病、血液病等. 本研究经医院医学伦理委员会批准, 所有研究对象均签署了书面的知情同意书.

1.2 方法

收集所有研究对象就诊时的年龄、性别信息. 留取24 h内血液样本送检, 包括血常规、生化常规、HBV DNA定量检测等. 具体指标包括白细胞计数(white blood cell, WBC)、血小板计数(platelet counts, PLT)、甲胎蛋白(alpha fetoprotein, AFP)、白蛋白(albumin, ALB)、球蛋白(globulin, GLB)、谷氨酸氨基转移酶(alanine aminotransferase, ALT)、谷草转氨酶(aspartate aminotransferase, AST)、谷氨酰转肽酶(glutamyl transpeptidase, GGT)、HBV DNA定量.

统计学处理 所有数据的处理均通过R(http://www.R-project.org)和EmpowerStats(http://www.empowerstats.com)软件实现. 符合正态分布的连续性变量采用均数±标准差(mean±SD)的形式表示, 否则采用中位数及四分位数表示, 分类变量采用百分比表示. 加权线性回归(用于连续性变量)和加权χ²(用于分类变量)用于评估组间差异. 在建立XGBoost机器学习模型前, 首先基于正则化原理消除了预测变量之间的共线性以防止过度拟合. 随后, 设置了相应的迭代次数(n-rounds)以提高模型的预测效能. 最终模型的主要设置参数如下: booster = gbtree, objective = binary:logistic, learning rate (eta) = 0.3, gamma = 5, max depth = 6, min_child_weight = 1, subsample = 1, colsample_bytree = 1, n-rounds = 100. 通过获取每个预测变量的Gain值绘制出所有预测变量的相对重要度的排序图. 计算公式为: 相对重要度 = [(1/第一位变量Gain值)×其他变量Gain值]. 我们计算了系统的评价指标以对我们建立的模型进行评估. 准确度和AUC主要用于评估模型的预测能力, Logloss表示预测概率与实际概率之间的拟合程度, 其值越小表示拟合概率越高. 而召回率和F1评分主要评估数据不均衡时该模型的综合评估能力[20]. Kappa值主要用于评估所建立的模型是否具有较好的可重复性, 依据既往研究我们认为当Kappa值≥0.40时提示所建立的模型具有良好的可重复性[5]. 绘制DCA曲线以评估临床适用性, 产生CA曲线以评估模型的校准度. ^aP<0.05说明具有统计学差异.

2 结果

2.1 训练集与验证集研究对象临床特征

最终本研究共纳入研究对象1087例, 按照3:1的比例随机原则拆分为训练集(817例)和验证集(270例). 其中训练集研究对象发生肝硬化103例, 验证集32例. 训练集和验证集之间所有的临床资料具有均衡性(表1). 在训练集中除HBV DNA、GLB、ALT之外, 两组间其余指标均存在明显的统计学差异(P<0.05)(表2).

表1 训练集与验证集临床特征资料.

特征	训练集(n = 817)	验证集(n = 270)	P值
年龄(岁)	36.85±11.49	37.91±11.66	0.173
性别(n/%)			0.512
男性	607(74.30%)	206(76.30%)
女性	210(25.70%)	64(23.70%)
肝硬化(n/%)			0.744
是	103(12.61%)	32(11.85%)
否	714(87.39%)	238(88.15%)
HBV DNA(lg10cp/mL)	5.54±1.82	5.55±1.75	0.968
AFP(ng/mL)	3.29(2.13-10.38)	3.37(2.07-7.36)	0.729
ALB(g/L)	40.77±4.89	41.56±5.46	0.059
GLB(g/L)	27.09±4.84	27.11±5.62	0.755
ALT(U/L)	47.00(28.00-78.00)	44.00(28.00-86.00)	0.745
AST(U/L)	33.00(25.00-50.00)	34.00(24.00-55.00)	0.694
GGT(U/L)	29.00(17.00-45.68)	27.50(17.25-45.68)	0.961
WBC(10⁹/L)	5.42±1.68	5.45±1.69	0.850
PLT(10⁹/L)	158.66±62.11	157.04±57.63	0.947
APRI评分	0.86(0.36-0.96)	0.90(0.37-1.12)	0.470
FIB-4评分	1.70(0.74-1.91)	1.74(0.78-2.11)	0.299

HBV DNA: 乙型病毒性肝炎脱氧核糖核酸; AFP: 甲胎蛋白; ALB: 白蛋白; GLB: 球蛋白; ALT: 谷氨酸氨基转移酶; AST: 谷草转氨酶; GGT: 谷氨酰转肽酶; WBC: 白细胞计数; PLT: 血小板计数; APRI: 谷草转氨酶与血小板比率指数; FIB-4: 纤维蛋白-4.

表2 训练集患者临床特征资料.

特征	非肝硬化(n = 714)	肝硬化(n = 103)	P值
年龄(岁)	36.09±11.37	42.07±10.96^a	<0.001
性别(n/%)			0.022
男性	520(72.93%)	86(83.50%)
女性	193(27.07%)	17(16.50%)
HBV DNA(lg10cp/mL)	5.57±1.85	5.33±1.61	0.157
AFP(ng/mL)	11.32(1.98-7.04)	45.60(3.85-19.00)^a	<0.001
ALB(g/L)	41.18±4.71	37.91±5.20^a	<0.001
GLB(g/L)	26.97±4.78	27.94±5.18	0.057
ALT(U/L)	64.88(27.00-77.00)	73.19(35.00-84.00)	0.059
AST(U/L)	41.86(24.00-49.00)	58.24(31.00-64.00)^a	<0.001
GGT(U/L)	38.81(16.00-45.68)	58.52(31.00-68.50)^a	<0.001
WBC(10⁹/L)	5.53±1.63	4.66±1.79^a	<0.001
PLT(10⁹/L)	165.48±56.72	111.48±76.16^a	<0.001
APRI评分	0.75(0.35-0.87)	1.66(0.84-1.70)^a	<0.001
FIB-4评分	1.45(0.69-1.66)	3.49(1.57-4.09)^a	<0.001

^aP<0.05, 肝硬化组 vs 非肝硬化组, 与非肝硬化组比较. HBV DNA: 乙型病毒性肝炎脱氧核糖核酸; AFP: 甲胎蛋白; ALB: 白蛋白; GLB: 球蛋白; ALT: 谷氨酸氨基转移酶; AST: 谷草转氨酶; GGT: 谷氨酰转肽酶; WBC: 白细胞计数; PLT: 血小板计数; APRI: 谷草转氨酶与血小板比率指数; FIB-4: 纤维蛋白-4.

2.2 肝硬化XGBoos机器学习模型的建立

所有预测变量均进入模型, 依据图1结果可知血小板的相对重要度最高. 通过混淆矩阵图展示了训练队列中真阳性、真阴性、假阳性和假阴性参与者的具体细节(图2A). 训练集阳性预测值(0.90)和阴性预测值(0.95)提示所建立的模型对肝硬化和非肝硬化的研究对象都具有较高的预测率, 模型准确度为0.95. 运用ROC曲线下面积评估所建立模型对于CHB合并肝硬化患者的预测效能, AUC为0.95, 提示所建立模型具有较高的预测效能(表3, 图3). 训练集建立的模型Logloss值为0.15, 提示肝硬化的预测概率与实际概率之间拟合度良好. 同时, 召回率(0.73)和F1评分(0.81)提示所建立模型对不均衡数据同样具有较好的预测效能. Kappa值为0.78, 提示目前所建立的模型具有较好的可重复性. 利用训练集所建立的XGBoost机器学习模型评估指标见表2. 校准曲线提示预测值与实际值之间具有良好的一致性(图4A). DCA曲线的含义是经预测模型评估后进行干预的患者是否能够比那些未经评估直接进行干预或者不进行干预的患者有更好的获益度. 依据图5可知经预测模型评估后能够使患者获得更好的获益度.

Open in New Tab Full Size Figure Download Figure

图1 预测变量相对重要度排序图. PLT: 血小板计数; AFP: 甲胎蛋白; ALB: 白蛋白; GGT: 谷氨酰转肽酶; AST: 谷草转氨酶; WBC: 白细胞计数; GLB: 球蛋白; HBV DNA: 乙型病毒性肝炎脱氧核糖核酸; ALT: 谷氨酸氨基转移酶.

Open in New Tab Full Size Figure Download Figure

图2 XGBoost机器学习模型预测CHB合并肝硬化混淆矩阵图. A: 训练集; B: 验证集. TP: 真阳性; FP: 假阳性; TN: 真阴性; FN: 假阴性. XGBoost: 极限梯度提升机; CHB: 慢性乙型肝炎.

表3 训练集和验证集模型评价指标.

指标	训练集	验证集
阳性预测值	0.90	0.79
阴性预测值	0.95	0.89
召回率	0.73	0.51
特异度	0.98	0.96
准确度	0.95	0.88
F1评分	0.81	0.62
Logloss值	0.15	0.29
AUC	0.95	0.86
Kappa值	0.78	0.74

AUC: 受试者工作特征曲线下面积.

Open in New Tab Full Size Figure Download Figure

图3 XGBoost机器学习模型预测CHBV合并肝硬化ROC曲线图. ROC曲线: 受试者工作特征曲线; AUC: 受试者工作特征曲线下面积; XGBoost: 极限梯度提升机; CHBV: 慢性乙型肝炎病毒感染.

Open in New Tab Full Size Figure Download Figure

图4 XGBoost机器学习模型预测CHBV合并肝硬化校准曲线图. A: 训练集; B: 验证集. XGBoost: 极限梯度提升机; CHBV: 慢性乙型肝炎病毒感染.

Open in New Tab Full Size Figure Download Figure

图5 XGBoost机器学习模型预测CHB合并肝硬化决策曲线图. XGBoost: 极限梯度提升机; CHB: 慢性乙型肝炎.

2.3 肝硬化XGBoos机器学习模型的内部验证

我们利用验证集对上述建立的模型进行了验证, 验证集中模型评估指标见表3. 混淆矩阵图提示XGBoost模型筛选出的真阳性(肝硬化)病例数为25, 真阴性(非肝硬化)的病例为213例(图2B). 验证集阳性预测值(0.79)和阴性预测值(0.89)提示所建立的模型在验证集中对肝硬化和非肝硬化的研究对象同样具有较高的预测率. 验证集中XGBoost模型准确度为0.88, AUC为0.86, 提示模型具有较高的预测效能(图3). 召回率(0.51)和F1评分(0.96)提示所建立模型在验证集中对不均衡数据同样具有较好的预测效能. Kappa值为0.74, 提示目前所建立的模型在验证集中同样具有较好的可重复性(表3). 校准曲线提示验证集中预测值与实际值之间具有良好的一致性(图4). DCA曲线提示验证集中经XGBoost模型评估后接受干预的患者较未经评估直接进行干预或者不进行干预的患者有更好的获益度(图5).

2.4 多个模型的比较

为了更好地展示本研究中肝硬化XGBoos机器学习模型的优势, 我们将其与经典的用以评估肝硬化的APRI评分和FIB-4评分进行了比较. 依据结果可知, 在训练集中APRI评分与FIB-4评分的AUC分别为0.772和0.809, 验证集中分别为0.747和0.785(图6). 两个经典评分对于肝硬化的区分度都小于XGBoost机器学习模型. 此外, APRI评分和FIB-4评分的校准曲线提示训练集和验证集中的预测值与实际值之间的一致性较差(图7). 两个经典评分的DCA曲线提示经APRI评分和FIB-4评分评估后接受干预的患者虽然能够提高患者的获益度, 但明显低于XGBoost机器学习模型(图8).

Open in New Tab Full Size Figure Download Figure

图6 APRI评分和FIB-4评分预测CHBV合并肝硬化ROC曲线图. A: APRI评分(训练集); B: APRI评分(验证集); C: FIB-4评分(训练集); D: FIB-4评分(验证集). AUC: 受试者工作特征曲线下面积; CHBV: 慢性乙型肝炎病毒感染; ROC曲线: 受试者工作特征曲线.

Open in New Tab Full Size Figure Download Figure

图7 APRI评分和FIB-4评分预测CHBV合并肝硬化校准曲线图. A: APRI评分(训练集); B: APRI评分(验证集); C: FIB-4评分(训练集); D: FIB-4评分(验证集). CHBV: 慢性乙型肝炎病毒感染; APRI: 谷草转氨酶与血小板比率指数; FIB-4: 纤维蛋白-4.

Open in New Tab Full Size Figure Download Figure

图8 APRI评分和FIB-4评分预测CHB合并肝硬化决策曲线图. A: APRI评分(训练集); B: APRI评分(验证集); C: FIB-4评分(训练集); D: FIB-4评分(验证集). CHB: 慢性乙型肝炎; APRI: 谷草转氨酶与血小板比率指数; FIB-4: 纤维蛋白-4.

3 讨论

我国是慢性HBV感染大国, 不幸的是, 尽管核苷(酸)类似物或干扰素可以有效地抑制HBV复制, 但这些都不是治愈性的治疗方法[21]. 这些药物不直接靶向共价闭环DNA, 这是负责肝内病毒持续存在的关键分子[22]. 持续活化的乙型肝炎病毒通过介导免疫应答导致肝脏细胞的坏死和炎症, 长期的肝细胞坏死和纤维组织增生导致许多患者最终发展成为肝硬化甚至肝纤维化[23]. 尽管肝活检能够准确肝硬化, 但很多因素限制了这种检测手段被更多的患者所接受, 尤其是没有任何临床症状的早期肝硬化群体. 为了克服肝活检的局限性, 目前对于非侵入性技术来评估肝脏僵硬度逐渐成为了热点[24]. 本研究利用临床便于获取的资料构建了能够有效预测CHB合并肝硬化的XGBoost机器学习预测模型并进行了内部验证.

通过相对重要度排序图可知排在前5位的预测因子分别是血小板、AFP、ALB、GGT和年龄. 血小板是骨髓中来源于巨核细胞的无核细胞碎片, 在止血中起关键作用[25]. 血小板减少是肝硬化患者常见的并发症, 其发病机制不是单一的[26,27]. 既往研究已经报道了血小板在脾脏中被破坏增加是由于门静脉高压引起的脾脏增大的结果[28], 最近的研究表明[29], 肝脏中TPO生成减少和骨髓中血小板生成受损是额外的因素. 除此之外, PLT相关的免疫球蛋白升高导致PLT刺激因子减少也是主要的原因[30]. 因此, 以PLT为预测因子能够建立对肝硬化的预测模型得到了研究者们的一致认可[19,31]. 甲胎蛋白于1964年首次在肝细胞癌(hepatocellular carcinoma, HCC)患者的血清中发现, 此后一直是HCC的主要诊断生物标志物[32]. 除此之外, 非HCC疾病也可以出现AFP的升高, 例如肝硬化、肝炎、胆管癌、睾丸生殖细胞瘤和转移性结肠癌[33], 在肝脏良性疾病中, 相关研究表明肝硬化的AFP含量较肝炎升高明显[34], 这也与本研究的结果相似. 白蛋白是血清(3.5 g/dL-5.0 g/dL, 约占所有血清蛋白的一半)和细胞外液中最丰富的蛋白质[35], 主要由肝脏细胞产生, 其不仅反应机体的基础营养水平, 而且可以反应肝脏细胞结晶片段受体(FcRn)的表达能力, 肝硬化患者由于FcRn表达的减低而白蛋白生成减少[36]. γ-GGT位于肝细胞的毛细血管表面和胆管上皮细胞的膜侧, 是一种膜结合酶[37], 其不仅反应胆汁分泌阻塞和胆管损伤的程度, 也是是反应肝细胞损伤的重要标记物[38], 并且既往研究证明GGT与单纯的ALT及AST相比对肝硬化可能具有更好的预测价值[39], 这与本研究的结果相同. 随着公共卫生工作的努力, 目前HBV的主要传播途径是母婴传播, 这也导致CHB的年龄分布与其他非传染性慢性疾病不同. 既往研究表明CHB患病率与年龄成负向相关关系[40], 因此年龄越高的CHB患者往往有更长的CHB病程让人容易理解, 这使得年龄成为CHB合并肝硬化的高危因素, 本研究结果与既往研究类似[41].

4 结论

本研究依然存在一定的局限性. 首先, 所有纳入的研究对象均未接受任何病毒治疗, 经治疗后的患者能否适用于本研究的结论仍需经标准治疗方案条件下的队列研究证明. 第二, 由于发生肝硬化的阳性病例数不足所有病例数的20%, 目前建立的模型整体敏感性一般, 目前的结论仍需更多样本的支持. 最后, 本研究中对模型进行了内部验证, 但未能得到外部队列的验证, 这也导致目前的研究结果在外推时受到一定的局限性. 然而, 目前模型所利用的预测变量在既往研究中均以得到了证明, 本研究的结果依然能够证明XGBoost机器学习模型在CHB合并肝硬化预测中的价值.

文章亮点

实验背景

慢性乙型肝炎病毒感染(chronic hepatitis B virus infection, CHBV)进展至肝硬化是一个缓慢的过程, 在肝硬化失代偿期发生之前常因无明显的临床症状而被患者忽略. 肝硬化失代偿期时不良事件的结局发生率升高明显, 这使得肝硬化的无创评估成为研究热点. 然而, 目前有关肝硬化早期诊断的机器学习模型仍是缺乏的.

实验动机

本研究重点探究CHBV患者的年龄、性别以及常规血清学指标所建立的极限梯度提升机(eXtreme gradient boosting, XGBoost)机器学习模型预测肝硬化的有效性. 旨在为CHBV患者提供安全、无创、简便、实用的诊断方法.

实验目标

基于CHBV患者的年龄、性别以及常规血清学指标等信息建立预测CHB进展为肝硬化的机器学习模型, 为肝硬化的管理提供参考.

实验方法

选取2010-2018年首次就诊于安徽医科大学第一附属医院和第二附属医院并行肝活检的CHBV患者. 按照随机原则以3:1的比例将所有患者分为训练集和验证集. 利用训练集患者一般资料及常规血清学指标构建XGBoos机器学习模型, 并利用验证集进行内部验证. 同时, 计算谷草转氨酶与血小板比率指数(aspartate aminotransferase/platelet ratio index, APRI)、纤维蛋白-4(fibrosis-4 index, FIB-4)评分并与研究中构建的模型进行比较. 受试者工作特征曲线下面积(area under curve, AUC)以评估模型区分度, 校准曲线(calibration curve, CA)及决策曲线(decision curve analysis, DCA)以评估模型校准度及获益度.

实验结果

最终纳入研究的CHBV病例1087例, 其中训练集817例, 验证集270例. 训练集中有103例患者发生肝硬化, 肝硬化患者APRI和FIB-4评分明显高于非肝硬化患者(P<0.05). 在训练集中, 所有预测因子中血小板的相对重要度最高. 利用训练集构建的XGBoost机器学习提示后的结果提示AUC为0.95, 验证集的AUC为0.86, 两者Kappa值分别为0.78和0.74. CA曲线提示模型预测情况与真实情况拟合情况吻合度较高. 训练集和验证集的DCA曲线提示所建立模型能够使患者获得较高的获益度. 研究中构建的XGBoost机器学习模型对于肝硬化的预测效能优于APRI评分和FIB-4评分.

实验结论

以CHBV患者的年龄、性别以及常规血清学指标为预测变量构建的XGBoost机器学习模型具有较好的预测效能, 有助于肝硬化早期发现, 使患者获益.

展望前景

本研究证实了利用常规资料构建XGBoost模型在预测CHBV进展为肝硬化时的可行性. 基于XGBoost的优势, 随着更多有效的预测变量被纳入模型, 预测效能将会进一步提升. 未来的研究重点在于提高临床资料的完整性和多样性, 保持对有关CHBV的新型血清标志物的关注并及时纳入模型进行验证.

备注

学科分类: 胃肠病学和肝病学

手稿来源地: 安徽省

同行评议报告学术质量分类

A级 (优秀): 0

B级 (非常好): 0

C级 (良好): 0

D级 (一般): D, D, D, D

E级 (差): 0

科学编辑: 张砚梁制作编辑:张砚梁

参考文献

Raptopoulou M, Papatheodoridis G, Antoniou A, Ketikoglou J, Tzourmakliotis D, Vasiliadis T, Manolaki N, Nikolopoulou G, Manesis E, Pierroutsakos I. Epidemiology, course and disease burden of chronic hepatitis B virus infection. HEPNET study for chronic hepatitis B: a multicentre Greek study. J Viral Hepat. 2009;16:195-202. [PubMed] [DOI]

2.	Liang P, Zu J, Yin J, Li H, Gao L, Cui F, Wang F, Liang X, Zhuang G. The independent impact of newborn hepatitis B vaccination on reducing HBV prevalence in China, 1992-2006: A mathematical model analysis. J Theor Biol. 2015;386:115-121. [PubMed] [DOI]

3.	Wu JF, Chang MH. Natural history of chronic hepatitis B virus infection from infancy to adult life - the mechanism of inflammation triggering and long-term impacts. J Biomed Sci. 2015;22:92. [PubMed] [DOI]

4.	Moon AM, Singal AG, Tapper EB. Contemporary Epidemiology of Chronic Liver Disease and Cirrhosis. Clin Gastroenterol Hepatol. 2020;18:2650-2666. [PubMed] [DOI]

5.	Agbim U, Asrani SK. Non-invasive assessment of liver fibrosis and prognosis: an update on serum and elastography markers. Expert Rev Gastroenterol Hepatol. 2019;13:361-374. [PubMed] [DOI]

6.	Loomba R, Adams LA. Advances in non-invasive assessment of hepatic fibrosis. Gut. 2020;69:1343-1352. [PubMed] [DOI]

Poynard T, Munteanu M, Imbert-Bismut F, Charlotte F, Thabut D, Le Calvez S, Messous D, Thibault V, Benhamou Y, Moussalli J, Ratziu V. Prospective analysis of discordant results between biochemical markers and biopsy in patients with chronic hepatitis C. Clin Chem. 2004;50:1344-1355. [PubMed] [DOI]

8.	Bedossa P, Dargère D, Paradis V. Sampling variability of liver fibrosis in chronic hepatitis C. Hepatology. 2003;38:1449-1457. [PubMed] [DOI]

9.	Robert M, Sofair AN, Thomas A, Bell B, Bialek S, Corless C, Van Ness G, Huie-White S, Stabach N, Zaman A. A comparison of hepatopathologists' and community pathologists' review of liver biopsy specimens from patients with hepatitis C. Clin Gastroenterol Hepatol. 2009;7:335-338. [PubMed] [DOI]

10.	Sigrist RMS, Liau J, Kaffas AE, Chammas MC, Willmann JK. Ultrasound Elastography: Review of Techniques and Clinical Applications. Theranostics. 2017;7:1303-1329. [PubMed] [DOI]

11.	Thavorn K, Coyle D. Transient Elastography and Controlled Attenuation Parameter for Diagnosing Liver Fibrosis and Steatosis in Ontario: An Economic Analysis. Ont Health Technol Assess Ser. 2015;15:1-58. [PubMed] [DOI]

12.	Wai CT, Greenson JK, Fontana RJ, Kalbfleisch JD, Marrero JA, Conjeevaram HS, Lok AS. A simple noninvasive index can predict both significant fibrosis and cirrhosis in patients with chronic hepatitis C. Hepatology. 2003;38:518-526. [PubMed] [DOI]

13.

Sterling RK, Lissen E, Clumeck N, Sola R, Correa MC, Montaner J, S Sulkowski M, Torriani FJ, Dieterich DT, Thomas DL, Messinger D, Nelson M; APRICOT Clinical Investigators. Development of a simple noninvasive index to predict significant fibrosis in patients with HIV/HCV coinfection. Hepatology. 2006;43:1317-1325. [PubMed] [DOI]

14.	Xiao G, Zhu S, Xiao X, Yan L, Yang J, Wu G. Comparison of laboratory tests, ultrasound, or magnetic resonance elastography to detect fibrosis in patients with nonalcoholic fatty liver disease: A meta-analysis. Hepatology. 2017;66:1486-1501. [PubMed] [DOI]

15.	Vilar-Gomez E, Chalasani N. Non-invasive assessment of non-alcoholic fatty liver disease: Clinical prediction rules and blood-based biomarkers. J Hepatol. 2018;68:305-315. [PubMed] [DOI]

16.

European Association for the Study of the Liver (EASL); European Association for the Study of Diabetes (EASD); European Association for the Study of Obesity (EASO). EASL-EASD-EASO Clinical Practice Guidelines for the management of non-alcoholic fatty liver disease. Diabetologia. 2016;59:1121-1140. [PubMed] [DOI]

17.	王瑞, 李嘉. 《慢性乙型肝炎防治指南(2019年版)》更新要点解读. 实用器官移植电子杂志. 2021;9:1-5. [PubMed] [DOI]

18.	中华医学会肝病学分会. 肝硬化诊治指. 实用肝脏病杂志. 2019;22:770-786. [PubMed] [DOI]

19.	王娟, 李会师, 梁乐, 李昱蓉, 张鸿. 慢性乙型肝炎患者发生肝硬化的影响因素分析及预测模型构建. 胃肠病学和肝病学杂志. 2022;31:752-757. [PubMed] [DOI]

20.

Dulai PS, Singh S, Patel J, Soni M, Prokop LJ, Younossi Z, Sebastiani G, Ekstedt M, Hagstrom H, Nasr P, Stal P, Wong VW, Kechagias S, Hultcrantz R, Loomba R. Increased risk of mortality by fibrosis stage in nonalcoholic fatty liver disease: Systematic review and meta-analysis. Hepatology. 2017;65:1557-1565. [PubMed] [DOI]

21.	Lok AS, Zoulim F, Dusheiko G, Ghany MG. Hepatitis B cure: From discovery to regulatory approval. J Hepatol. 2017;67:847-861. [PubMed] [DOI]

22.	Inoue T, Tanaka Y. Novel biomarkers for the management of chronic hepatitis B. Clin Mol Hepatol. 2020;26:261-279. [PubMed] [DOI]

23.	Revill P, Yuan Z. New insights into how HBV manipulates the innate immune response to establish acute and persistent infection. Antivir Ther. 2013;18:1-15. [PubMed] [DOI]

24.	Agbim U, Asrani SK. Non-invasive assessment of liver fibrosis and prognosis: an update on serum and elastography markers. Expert Rev Gastroenterol Hepatol. 2019;13:361-374. [PubMed] [DOI]

25.	Brass LF, Diamond SL, Stalker TJ. Platelets and hemostasis: a new perspective on an old subject. Blood Adv. 2016;1:5-9. [PubMed] [DOI]

26.	Ding R, Zhou X, Huang D, Wang Y, Li X, Yan L, Lu W, Yang Z, Zhang Z. Nomogram for predicting advanced liver fibrosis and cirrhosis in patients with chronic liver disease. BMC Gastroenterol. 2021;21:190. [PubMed] [DOI]

27.	Lv Y, Yee Lau W, Wu H, Han X, Gong X, Liu N, Yue J, Li Q, Li Y, Deng J. Causes of peripheral cytopenia in hepatitic cirrhosis and portal hypertensive splenomegaly. Exp Biol Med (Maywood). 2017;242:744-749. [PubMed] [DOI]

28.	Sun Y, Lan X, Shao C, Wang T, Yang Z. Clinical features of idiopathic portal hypertension in China: A retrospective study of 338 patients and literature review. J Gastroenterol Hepatol. 2019;34:1417-1423. [PubMed] [DOI]

29.	Peck-Radosavljevic M. Thrombocytopenia in chronic liver disease. Liver Int. 2017;37:778-793. [PubMed] [DOI]

30.	Gallo P, Terracciani F, Di Pasquale G, Esposito M, Picardi A, Vespasiani-Gentilucci U. Thrombocytopenia in chronic liver disease: Physiopathology and new therapeutic strategies before invasive procedures. World J Gastroenterol. 2022;28:4061-4074. [PubMed] [DOI]

31.	Wang J, Zhang P, Liao J, Zhu Y, Liu X, Tang H. Association of α-fetoprotein levels with liver stiffness measurement in outpatients with chronic hepatitis B. Biosci Rep. 2021;41. [PubMed] [DOI]

32.	Liu Z, Pu Y, Bao Y, He S. Investigation of Potential Molecular Biomarkers for Diagnosis and Prognosis of AFP-Negative HCC. Int J Gen Med. 2021;14:4369-4380. [PubMed] [DOI]

33.	Ayoub WS, Steggerda J, Yang JD, Kuo A, Sundaram V, Lu SC. Current status of hepatocellular carcinoma detection: screening strategies and novel biomarkers. Ther Adv Med Oncol. 2019;11:1758835919869120. [PubMed] [DOI]

34.	Wu M, Liu H, Liu Z, Liu C, Zhang A, Li N. Analysis of serum alpha-fetoprotein (AFP) and AFP-L3 levels by protein microarray. J Int Med Res. 2018;46:4297-4305. [PubMed] [DOI]

35.	Bernardi M, Angeli P, Claria J, Moreau R, Gines P, Jalan R, Caraceni P, Fernandez J, Gerbes AL, O'Brien AJ, Trebicka J, Thevenot T, Arroyo V. Albumin in decompensated cirrhosis: new concepts and perspectives. Gut. 2020;69:1127-1138. [PubMed] [DOI]

36.

Pyzik M, Rath T, Kuo TT, Win S, Baker K, Hubbard JJ, Grenha R, Gandhi A, Krämer TD, Mezo AR, Taylor ZS, McDonnell K, Nienaber V, Andersen JT, Mizoguchi A, Blumberg L, Purohit S, Jones SD, Christianson G, Lencer WI, Sandlie I, Kaplowitz N, Roopenian DC, Blumberg RS. Hepatic FcRn regulates albumin homeostasis and susceptibility to liver injury. Proc Natl Acad Sci USA. 2017;114:E2862-E2871. [PubMed] [DOI]

37.	Ren T, Wang H, Wu R, Niu J. Gamma-Glutamyl Transpeptidase-to-Platelet Ratio Predicts Significant Liver Fibrosis of Chronic Hepatitis B Patients in China. Gastroenterol Res Pract. 2017;2017:7089702. [PubMed] [DOI]

38.	Bortolotti M, D'Ambrosio R, Fraquelli M, Pedrotti P, Consonni D, Migone De Amicis M, Scaramellini N, Di Pierro E, Graziadei G. Liver damage and sickle cell disease: genotype relationship. Ann Hematol. 2020;99:2065-2072. [PubMed] [DOI]

39.	Yu Y, Fan Y, Yang Z, Lu Y, Xu Q, Chen X. Elevated serum gamma-glutamyltransferase predicts advanced histological liver damage in chronic hepatitis B. Discov Med. 2016;21:7-14. [PubMed] [DOI]

40.	Wang H, Men P, Xiao Y, Gao P, Lv M, Yuan Q, Chen W, Bai S, Wu J. Hepatitis B infection in the general population of China: a systematic review and meta-analysis. BMC Infect Dis. 2019;19:811. [PubMed] [DOI]

41.

Liu YY, Lin CL, Weng CH, Chang PH, Chien CH, Huang KC, Hua MC, Hu CC. Older Age and High α-Fetoprotein Predict Higher Risk of Hepatocellular Carcinoma in Chronic Hepatitis-B-Related Cirrhotic Patients Receiving Long-Term Nucleos(t)ide Analogue Therapy. Diagnostics (Basel). 2022;12. [PubMed] [DOI]