修回日期: 2008-12-27
接受日期: 2008-12-29
在线出版日期: 2009-02-08
目的: 采用Meta分析的方法评价幽门螺杆菌粪便抗原(H pylori stool antigen, HpSA)诊断儿童H pylori感染的价值, 为临床应用提供依据.
方法: 以"幽门螺杆菌"、"儿童""诊断性试验"、"粪便抗原"、"诊断准确性"为检索词, 通过联机检索CNKI中国期刊全文数据库、CBM中国生物医学文献数据库, 文献追溯和手工检索的方法收集发表时间为1998-01/2008-05国内正式刊物上公开发表的有关评价粪便抗原检测H pylori感染准确性的相关研究文献. 按确定的纳入、排除标准进行筛选, 采用QUADAS工具对纳入的文献进行质量评价, 应用MetaDisc1.4软件进行Meta分析, 综合评价灵敏度、特异度、似然比、诊断优势比和SROC曲线下面积、Q*指数等指标.
结果: 共17篇文献符合纳入标准, 各研究间具有同质性.共累计样本含量1466例, 由金标准确诊H pylori感染737例, 非感染729例. Meta分析结果显示各研究之间的一致性较高, 粪便抗原诊断H pylori感染的合并敏感度、特异度分别是92%(95%CI 90%-94%)和92%(95%CI 90%-94%); 合并阳性似然比、阴性似然比分别为11.44(95%CI 8.83-14.81)和0.10(95%CI 0.08-0.13). 合并诊断优势比DOR126.14(84.84-187.55). 绘制SROC曲线, 估计SROC曲线下面积AUC = 0.9696, Q* = 0.9193.
结论: 粪便抗原检测儿童及青少年H pylori感染的方法准确度较高.
引文著录: 张天哲, 张铁民, 韩健, 高静云. 粪便抗原检测儿童及青少年幽门螺杆菌感染诊断试验的系统评价. 世界华人消化杂志 2009; 17(4): 405-410
Revised: December 27, 2008
Accepted: December 29, 2008
Published online: February 8, 2009
AIM: To systemically evaluate the accuracy of H pylori stool antigen (HpSA) test for diagnosing H pylori infection in children and teenagers through meta-analysis.
METHODS: Articles related to diagnosis of H pylori infection by HpSA test published from 1998-01 to 2008-05, were retrieved in CNKI and CBM. Related journals were also searched manually. Data analysis was conducted by software of MetaDisc1.4. Indexes reflecting accuracy of HpSA test for diagnosing H pylori infection such as sensitivity, specificity, likelihood ratio, diagnostic odds ratio were pooled using fixed effect model. SROC (Summary receiver operating characteristic) curve was used to summarize overall diagnostic performance.
RESULTS: We included 17 studies which were homogeneous, including 1466 subjects among whom there were 737 people were positive and 729 were negative. Sensitivity of HpSA test for the diagnosis of H pylori infection was 92% (95%CI 90%-94%), specificity was 92% (95%CI 90%-94%), PLR(positive likelihood ratio)was 11.44 (95%CI 8.83-14.81), NLR (negative likelihood ratio) was 0.10 (95%CI 0.08-0.13), DOR (diagnostic odds ratio) was 126.14(95%CI 84.84-187.55). The area under SROC curve was 0.9696. Q index was 0.9193.
CONCLUSION: HpSA test as a non-invasive test is a highly accurate method to diagnose H pylori infection in children and teenagers.
- Citation: Zhang TZ, Zhang TM, Han J, Gao JY. Diagnosis of H pylori infection in children and teenagers by H pylori stool antigen test: a systematic review. Shijie Huaren Xiaohua Zazhi 2009; 17(4): 405-410
- URL: https://www.wjgnet.com/1009-3079/full/v17/i4/405.htm
- DOI: https://dx.doi.org/10.11569/wcjd.v17.i4.405
幽门螺旋杆菌(H pylori)的发现及其相关胃、十二指肠疾病的认识是近二十年来胃肠学领域中最大的研究进展之一, 对胃、十二指肠疾病以及其他相关疾病的防治产生了深远的影响. 我国是H pylori高感染国家. 近年来,流行病学资料显示成人H pylori感染不少在儿童期获得, 儿童是H pylori感染的易感人群, H pylori感染不仅是儿童胃炎、胃溃疡、再发性腹痛的病因之一, 而且与儿童生长发育及成年后消化性溃疡、胃癌的发生密切相关. 因此, 在儿童期快速、准确地检测出H pylori具有重要意义. 近年来粪便抗原检测H pylori感染的方法逐步广泛用于临床检测, 也有学者对这种非侵入性诊断方法进行过综合评价[1], 但仅是对多个研究灵敏度、特异度、预测值、似然比的合并, 而诊断试验的性能不仅由灵敏度决定, 也由特异度决定, 即诊断试验的Meta分析需要同时考虑这两个指标, ROC曲线(接受试者工作特征曲线)才是评价试验准确性的综合指标. 对于同一诊断试验的多个不同研究进行综合评价的方法, 有学者介绍了诊断试验Meta分析的方法[2-3]: 综合接受者工作特征(summary receiver operation operating characteristic, SROC)曲线方法. 本研究在考察灵敏度、特异度、似然比、诊断优势比等指标的同时, 结合SROC曲线法对国内10年来运用粪便抗原检测儿童H pylori感染的结果进行系统评价, 为临床应用提供科学依据.
以"幽门螺杆菌"、"诊断性试验"、"粪便抗原"、"准确性"为检索词, 通过计算机检索中国期刊全文数据库CNKI、中国生物医学文献数据库CBM, 文献追溯和手工检索的方法收集1998-01/2008-05国内正式刊物上发表的有关评价粪便抗原检测幽门螺杆菌感染准确性的相关文献. 按确定的纳入、排除标准进行筛选.
1.2.1 纳入与排除标准: 文献纳入标准: (1)研究类型: H pylori粪便抗原检测儿童幽门螺杆菌感染的诊断试验研究的全文文献, 无论是否采用盲法; (2)检测方法为酶联免疫吸附法(ELISA); (3)各个临床试验明确说明采用什么检测作为"金标准"; (4)且要有完整的临床数据包括真阳性数(TP)、真阴性数(TN)、假阳性数(FP)、假阴性数(FN); (5)样本含量大于30例. (6)研究对象为有上消化系症状者, 年龄<18岁; (7)同一作者发表的内容相近的文章, 纳入样本量最大者. 文献排除标准: (1)文摘、综述、讲座和述评类文献; (2)数据有误或数据不完整无法获得诊断四格表数据; (3)感染未经金标准证实; (4)重复发表的文献.
1.2.2 数据提取: 提取研究作者、发表时间、患儿年龄、病例类型、四格表数据、临界值、金标准、试剂盒生产公司等信息.
1.2.3 文献质量评价: 参考系统评价中评价诊断性研究质量的工具-QUADAS评价条目, 结合实际情况, 增加了是否说明诊断性试验所确定的临界值; 样本含量的大小几方面对纳入研究进行质量评价.
1.2.4 数据分析: (1)分析指标: 利用MetaDsic1.4软件[4]计算各研究的合并灵敏度(SEN)、合并特异度(SPE)、阳性似然比(PLR)、阴性似然比(NLR)、诊断优势(DOR)及其95%可信区间(concidence interval, CI). 并进行综合接受者工作特征(SROC)曲线分析, 估计SROC曲线下面积(area under curve, AUC)和Q*指数. (2)异质性检验: 对上述分析指标在综合分析前均作异质性检验, 如存在异质性, 则采用随机效应模型进行汇总处理, 反之则采用固定效应模型. 利用MetaDsic1.4软件[4], 在各指标合并前分别采用χ2检验、Cochran-Q检验进行异质性检验. I2指数也可大致反映异质性的严重程度, I2<25%则异质性较小, 25%<I2<50%则为中等度异质性, I2>50%则研究间的异质性较大[5].
最初检索到121篇相关中文文献, 均已全文形式发表, 发表时间为1998-2008, 符合纳入标准的共17篇[6-22], 患者年龄1.7-18岁, 共计1466名研究对象, 其中经金标准确定H pylori感染者737例, 非感染者729例. 未纳入的文献为没有说明具体实验数据、没有明确的金标准、重复发表、被研究者超过18岁. 各研究的基本特征见表1.
第一作者 | 金标准 | 临界值(A) | TP | FP | FN | TN | n | SEN | SEP | PLR | NLR | DOR |
刘敏 et al[6] | 联合试验 | 0.161 | 40 | 6 | 4 | 43 | 93 | 0.909 | 0.878 | 7.42 | 0.104 | 71.67 |
余幼民 et al[7] | 联合试验 | 0.161 | 19 | 3 | 4 | 49 | 75 | 0.826 | 0.942 | 14.32 | 0.185 | 77.58 |
耿岚岚 et al[8] | 联合试验 | 0.120 | 53 | 2 | 5 | 24 | 84 | 0.914 | 0.923 | 11.88 | 0.093 | 127.20 |
王东来 et al[9] | 联合试验 | 0.161 | 36 | 4 | 2 | 40 | 82 | 0.947 | 0.909 | 10.42 | 0.058 | 180.00 |
金宗平 et al[10] | 呼气试验 | 0.120 | 36 | 5 | 8 | 56 | 105 | 0.818 | 0.918 | 9.98 | 0.198 | 50.40 |
郭鹏涛et al[11] | 联合试验 | 0.161 | 101 | 3 | 2 | 16 | 122 | 0.981 | 0.842 | 6.21 | 0.023 | 269.33 |
曾至荣 et al[12] | 联合试验 | 0.120 | 17 | 2 | 1 | 20 | 40 | 0.944 | 0.909 | 10.39 | 0.061 | 170.00 |
张艳玲 et al[13] | 呼气试验 | 0.120 | 13 | 1 | 2 | 15 | 31 | 0.867 | 0.938 | 13.87 | 0.142 | 97.50 |
刘风霖 et al[14] | 联合试验 | 0.120 | 39 | 5 | 3 | 74 | 121 | 0.929 | 0.937 | 14.67 | 0.076 | 192.40 |
吴力力 et al[15] | 联合试验 | 无 | 34 | 4 | 2 | 60 | 100 | 0.944 | 0.938 | 15.11 | 0.059 | 255.00 |
蒲秀红 et al[16] | 呼气试验 | 0.120 | 68 | 3 | 7 | 104 | 182 | 0.907 | 0.972 | 32.34 | 0.096 | 336.76 |
陈宇翔 et al[17] | 联合试验 | 0.120 | 51 | 3 | 2 | 20 | 76 | 0.962 | 0.870 | 7.38 | 0.043 | 170.00 |
关克涛 et al[18] | 联合试验 | 0.120 | 29 | 1 | 4 | 20 | 54 | 0.879 | 0.952 | 18.46 | 0.127 | 145.00 |
张艳玲 et al[19] | 呼气试验 | 0.120 | 4 | 4 | 1 | 22 | 31 | 0.800 | 0.846 | 5.20 | 0.236 | 22.00 |
张瑾 et al[20] | 联合试验 | 无 | 32 | 2 | 5 | 33 | 72 | 0.865 | 0.943 | 15.14 | 0.143 | 105.60 |
刘光华 et al[21] | 呼气试验 | 0.151 | 66 | 6 | 4 | 54 | 130 | 0.943 | 0.900 | 9.43 | 0.063 | 148.50 |
康红莊 et al[22] | 联合试验 | 0.120 | 40 | 2 | 3 | 23 | 68 | 0.930 | 0.920 | 11.63 | 0.076 | 153.33 |
对纳入17篇文献进行质量评价发现: 所有研究均有明确的金标准并与其比较, 所有研究的研究对象都经金标准的检查, 即不存在证实偏倚; 12篇文献明确描述待评价试验的实验步骤、操作方法等, 使他人易在相同条件下重复; 多数研究(12篇)写明试验结果判读的临界值. 但在有些条目上还有欠缺, 表现在: 对金标准的试验操作过程没有足够清楚的描述, 只详细叙述待评价试验的操作过程, 试验重复性考虑得不全面; 仅有3篇提及结果观察采用盲法; 多数研究只笼统地将研究对象归为有上消化系症状者, 不清楚疾病类型是否全面, 其中2篇为反复腹痛患儿, 4篇具体说明研究对象分别为慢性胃炎, 十二指肠球部溃疡,十二指肠球炎, 浅表性胃炎, 结节性胃炎, 胃溃疡, 反流性食管炎, 出血性胃十二指肠炎患儿; 研究的样本含量不足, 样本含量在31-182例之间, 普遍偏低, 多数没有达到诊断试验应有的样本含量, 从以上信息可见国内诊断性研究的质量、科学性还不是很高. QUADAS评价[23]结果见表2.
QUADAS评价条目 | 文献数量 | ||
是 | 否 | 不清楚 | |
病例谱是否包含了各种病例及易混淆的疾病病例 | 4 | 2 | 11 |
研究对象的选择标准是否明确 | 6 | - | 11 |
金标准是否能准确区分有病、无病状态 | 17 | - | - |
金标准和待评价试验检测的间隔时间是否足够短, 以避免出现疾病病情的变化 | 17 | - | - |
是否所有病例无论待评价试验的结果如何, 都接受了相同的金标准试验 | 17 | - | - |
金标准试验是否独立于待评价试验即待评价试验不包含在金标准中 | 17 | - | - |
待评价试验的操作是否描述的足够清楚且可进行重复 | 12 | 5 | - |
金标准试验的操作是否描述的足够清楚且可以进行重复 | 2 | 15 | - |
待评价试验的结果判读是否是在不知晓金标准试验结果的情况下进行的 | 3 | - | 14 |
金标准试验的结果判读是否是在不知晓待评价试验结果的情况下进行的 | 3 | - | 14 |
是否报告了难以解释中间试验结果 | 17 | - | - |
对退出研究的病例是否进行解释 | 17 | - | - |
2.3.1 异质性检验及各指标的Meta分析合并结果: 从I2指数的大小上看, 各指标的I2指数在0%-22.4%之间, I2<25%, 也表明异质性较小. 17项研究的合并SEN及SPE均为92%, 95%CI: 90%-94%(图1A-B), PLR为11.44, 95%CI: 8.83-14.81(图1C), NLR为0.10, 95%CI: 0.08-0.13(图1D), DOR为126.14, 95%CI: 84.84-187.55(图2), SROC曲线下面积(AUC)为0.9696, Q* = 0.9193(图3).
2.3.2敏感性分析结果: 为了考察本次Meta分析结论的稳定性, 从四个角度进行敏感性分析: (1)去除2个未注明临界值的研究; (2)去除试剂生产厂家非协和药业的3个研究; (3)去除金标准仅为单项试验(呼气试验)的5个研究; (4)去除样本含量小于70例的5个研究. 结果与原有纳入的17项研究相比结果一致, 由表3结果显示: 各评价指标均变化不大, 且可信区间大部分重叠. 说明本次研究的结论可靠、稳定.
分析角度 | 研究个数 | SEN(95% CI) | SPE(95% CI) | PLR (95% CI) | NLR (95% CI) | DOR(95% CI) | AUC | Q* |
原17项研究 | 17 | 0.92 (0.90, 0.94) | 0.92 (0.90, 0.94) | 11.44 (8.83, 14.81) | 0.10 (0.08, 0.13) | 126.14 (84.84, 187.55) | 0.9696 | 0.9193 |
去除未注明临界值的研究 | 15 | 0.92 (0.90, 0.94) | 0.92 (0.90, 0.94) | 11.06 (8.41, 14.54) | 0.10 (0.08, 0.13) | 122.37 (80.39, 186.26) | 0.9687 | 0.9178 |
去除试剂为非协和药业研究 | 14 | 0.91 (0.88, 0.93) | 0.93 (0.91, 0.95) | 12.49 (9.42, 16.57) | 0.11 (0.08, 0.14) | 119.62 (78.12, 183.16) | 0.9684 | 0.9172 |
去除金标准为单项试验研究 | 12 | 0.93 (0.91, 0.95) | 0.92 (0.89, 0.94) | 10.67 (7.84, 14.52) | 0.09 (0.07, 0.13) | 139.73 (84.58, 230.85) | 0.9707 | 0.9209 |
去除小样本研究 | 12 | 0.92 (0.90, 0.94) | 0.93 (0.90, 0.95) | 11.00 (8.34, 14.52) | 0.10 (0.07, 0.13) | 132.06 (84.90, 205.43) | 0.9704 | 0.9205 |
目前临床检测H pylori感染的方法较多, 主要包括侵入性和非侵入性检查两大类. 前者是指通过内窥镜检查先取得胃黏膜标本, 再行组织学、快速尿素酶试验、细菌培养, 有一定的创伤性, 对于儿童及青少年这一群体, 不易被接受, 非侵入性检查相对更适宜这一人群, 在非侵入性的H pylori检测方法中, 除了已有的13C尿素呼吸试验和血清抗H pylori抗体的检测, 粪便HpSA检测是一新的非侵入性的检测方法, 其标本易于获得、操作简便、省时, 不需要昂贵的仪器. 可反映现症感染情况, 适用于治疗后复查, 判断疗效.我国近几年, 有关评价该方法诊断价值的研究也有许多报道, 但大多为小样本研究. 因此本研究采用Meta分析这种可对多个同类研究结果进行汇总定量分析的方法, 从统计学角度达到增大样本含量, 提高检验效能, 对我国近十年使用粪便抗原检测H pylori感染的诊断试验做一系统评价.
纳入的17个研究其灵敏度从80.0%-98.1%, 特异度从84.2%-97.2%不等, 但经异质性检验有较高的一致性, 这可能与各研究所设定的临界值较为相近有关, 另外其他影响试验结果的因素都比较一致, 如试验试剂盒多数为协和药业出品; 金标准多为联合试验, 且较为一致,并对H pylori阳性或阴性的判断较为严格, 错分偏倚小.
17项粪便抗原检测H pylori感染的诊断研究的综合定量分析结果显示合并灵敏度和特异度较高, 均为92%(95%CI: 90%-94%), 似然比属于同时反映灵敏度和特异度的复合指标, 本研究PLR为11.44, 提示H pylori感染者经粪便抗原检测结果为阳性的机会是非感染者11.44倍; NLR为0.10, 提示粪便抗原检测试验错误判断阴性的机会是正确判断的10%. 一般来说如果似然比大于10或小于0.1, 使验前概率到验后概率发生决定性变化, 基本可以确定或排除诊断[24]; 总诊断优势比为126.14, 远远大于1, 说明H pylori感染者比非感染者更有可能获得粪便抗原试验阳性结果, 前者是后者的126.14倍, 他反映了诊断效能, 能全面评价了诊断试验准确性及判别能力. SROC曲线分析通过曲线下的面积及Q*之大小进一步显示了诊断试验准确度的高低, AUC = 0.9696, Q* = 0.9193, 均接近1, 表明粪便抗原检测H pylori感染的准确度很高.国外学者对国外粪便抗原检测H pylori的研究文献也进行过系统评价[25], 论证了他是一个较好的非侵入性试验, 我国学者[1,26-27]也对我国开展的粪便抗原检测H pylori感染的实验进行综合评价, 他们的结果为灵敏度94%-95.57%、特异度93.17%-94%. 与其他两种非侵入性检查Meta分析相比, 粪便抗原检测的特异度高于血清学检测的特异度(87.7%), 灵敏度与其相近; 但低于13C尿素呼气试验的灵敏度(95.49%)和特异度(94.76%). 在诊断优势比方面, 幽门螺杆菌粪便抗原检测方法的DOR均高于上述两种非侵入性方法[28].
本研究尚存在以下不足: (1)检索文献仅限于中文, 存在语种偏倚; (2)虽然采取多种途径从多个数据库广泛检索正式发表文献, 那些由于种种原因未能发表的文献不在研究之列, 另外阳性结果的研究往往比阴性结果的研究更容易发表, 所以不能排除潜在的发表偏倚.
虽然本研究存在上述不足, 但我们还是利用中国近十年来使用HpSA检测儿童及青少年H pylori感染有关文献资源,从循证检验与诊断的角度得出了在儿童及青少年中,粪便抗原检测H pylori感染方法具有较高准确度. 需要指出的是, 鉴于发表文献的质量不高, 希望将来能有更多的学者和儿科医生能更多的开展一些设计严谨、大样本量、甚至多个地区共同合作的诊断试验的研究, 以获得可信度高的循证医学证据, 更准确地为广大临床工作者和医疗卫生决策者服务.
幽门螺杆菌粪便抗原检测是一种新的非侵入性检测H pylori的方法, 他不仅克服了血清抗H pylori抗体不能用于对近期根除效果判断的缺陷, 能反映现症感染情况, 而且没有13C尿素呼吸试验诸如受特殊设备限制、费用昂贵不易普遍推广、操作过程还需患儿配合及适当禁食的缺点. 检测标本易于获得、操作简便、省时, 不需要昂贵的仪器.
沈薇, 教授, 重庆医科大学附属第二医院消化内科
国外学者也对国外粪便抗原检测H pylori的研究文献进行过系统评价, 论证了粪便抗原检测是一个较好的非侵入性试验, 我国学者对我国开展的此种方法的检测结果进行综合评价, 结果为灵敏度94%-95.57%、特异度93.17%-94%, 高于血清学检测的特异度(87.7%), 灵敏度与其相近; 但低于13C尿素呼气试验的灵敏度(95.49%)和特异度(94.76%).
本文通过Meta分析不仅综合定量描述了灵敏度、特异度、似然比等反映粪便抗原检测H pylori感染诊断试验真实性的指标, 而且引入了总诊断优势比DOR这一反映了诊断效能、全面评价诊断试验准确性及判别能力的指标, 同时采用综合接受者工作特征(SROC)曲线分析方法, 通过曲线下的面积及Q指数(Q*)之大小进步显示了诊断试验准确度的高低, 为临床应用提供科学依据.
Meta分析结果显示粪便抗原检测H pylori感染诊断试验诊断效能较高, 是一无创、简便、经济的准确性较高的检测方法.
1 诊断优势比DOR: 表示病例组中阳性结果的优势(真阳性率与假阴性率之比)与对照组中阳性结果的优势(假阳性率与真阴性率之比)的比值. 如果DOR>1说明由金标准确定的阳性组比阴性组更有可能获得诊断试验阳性结果.
2 Q*指数: 是SROC曲线与直线TPR+FPR = 1(在这条直线上灵敏度 = 特异度)相交处的灵敏度, 取值范围为0.5-1,反映了SROC曲线与左上角接近的程度, 当SROC曲线接近于左上角时, 指标Q*接近于1. Q*指数越大, 表示诊断试验的准确度越高.
3 SROC曲线: 一种反映诊断试验准确度的图形, 由曲线方程可得到曲线下的面积, 可利用这一面积的估计值作为诊断试验准确度的综合指标, 取值范围为0.5-1, 值越大, 表示诊断试验的准确度越高.
儿童幽门螺杆菌粪便抗原检测价值的Meta分析未见相关报道, 本文具有一定的学术价值.
编辑:史景红 电编:吴鹏朕
4. | Zamora J, Abraira V, Muriel A, Khalid K, Coomarasamy A. Meta-DiSc: A software for meta-analysis of test accuracy data. BMC Med Res Methodology. 2006;6:31. [PubMed] [DOI] |
25. | Gisbert JP, Pajares JM. Diagnosis of Helicobacter pylori infection by stool antigen determination: a systematic review. Am J Gastroenterol. 2001;96:2829-2838. [PubMed] [DOI] |
28. | Jiang JH, Xu DZ, Yan YP, Ke M, Shao ZJ. Diagnosis of Helicobacter pylori infection: A meta-analysis. J Med Coll PLA. 2007;22:246-249. [DOI] |