研究快报 Open Access
Copyright ©The Author(s) 2009. Published by Baishideng Publishing Group Inc. All rights reserved.
世界华人消化杂志. 2009-05-18; 17(14): 1443-1447
在线出版日期: 2009-05-18. doi: 10.11569/wcjd.v17.i14.1443
气象因素对干旱地区消化系传染病疫情的影响及发病预测
曲波, 郭海强, 关鹏, 周宝森
曲波, 郭海强, 关鹏, 周宝森, 中国医科大学流行病与卫生统计学教研室 辽宁省沈阳市 110001
基金项目: 国家自然科学基金资助项目, No. 30700690, No. 30170833; 辽宁省教育厅基金资助项目, No. 20061020.
作者贡献分布: 此课题由周宝森设计; 研究过程由曲波、郭海强及关鹏操作完成; 数据分析由曲波完成; 本论文写作由曲波与关鹏完成.
通讯作者: 周宝森, 110001, 辽宁省沈阳市和平区北二马路92号, 中国医科大学公共卫生学院流行病学教研室. bszhou@mail.cmu.edu.cn
电话: 024-23256666-5401
收稿日期: 2009-02-22
修回日期: 2009-03-23
接受日期: 2009-03-30
在线出版日期: 2009-05-18

目的: 探讨在干旱条件下影响消化系传染病流行的关键气象因子, 建立干旱地区消化系传染病的BP神经网络预测模型.

方法:  收集辽宁省朝阳市1981-1994年的气象资料和消化系传染病发病资料. 利用SPSS 15.0 统计软件进行气象因素与消化系传染病发病率的相关分析. 利用Matlab 6.5软件构建BP人工神经网络模型, 建立干旱地区消化系传染病的BP人工神经网络预测模型.  

结果: 消化系传染病细菌性痢疾的发病率与年平均气压、平均降水量呈负相关(r = -0.770, -0.591, P = 0.001, 0.026), 与平均蒸发量呈正相关(r = 0.703, P = 0.005). 病毒性肝炎的发病率与年平均气压呈负相关(r = -0.570, P = 0.033), 与最高温度呈正相关(r = 0.722, P = 0.004). 伤寒副伤寒的发病率与平均气压呈负相关(r = -0.713, P = 0.004), 与平均蒸发量和最高温度呈正相关(r = 0.655, 0.562, P = 0.011, 0.037). BP神经网络模型的拟合效果较好. 细菌性痢疾、病毒性肝炎和伤寒副伤寒BP神经网络模型的预测精度分别为24.3%、3.5%和8.3%.

结论:  平均气压、平均蒸发量、平均降水量和最高温度与消化系传染病发病率关系较为密切. BP神经网络模型对干旱地区消化系传染病具有较高的拟合和预测能力, 预测效果较好.

关键词: 消化系传染病; 气象因素; 反馈神经网络

引文著录: 曲波, 郭海强, 关鹏, 周宝森. 气象因素对干旱地区消化系传染病疫情的影响及发病预测. 世界华人消化杂志 2009; 17(14): 1443-1447
Influence and prediction of meteorological factors on epidemic situation of digestive system infectious diseases in drought area
Bo Qu, Hai-Qiang Guo, Peng Guan, Bao-Sen Zhou
Bo Qu, Hai-Qiang Guo, Peng Guan, Bao-Sen Zhou, Department of Epidemiology and Health Statistics, China Medical University, Shenyang 110001, Liaoning Province, China
Supported by: National Natural Science Foundation of China, No. 30170833, No.30700690; and the Foundation of Education Department of Liaoning Province, No. 20061020.
Correspondence to: Bao-Sen Zhou, Department of Epidemiology, School of Public Health, China Medical University, 92 Beierma Road, Heping District, Shenyang 110001, Liaoning Province, China. bszhou@mail.cmu.edu.cn
Received: February 22, 2009
Revised: March 23, 2009
Accepted: March 30, 2009
Published online: May 18, 2009

AIM: To explore the key meteorological factors which affect the infectious diseases of digestive system and establish the back-propagation (BP) neural network prediction model of digestive system infectious diseases in drought conditions.

METHODS: The data on incidence of digestive system infectious diseases and meteorological factors in drought area (Chaoyang, Liaoning Province) from 1981 to 1994 were collected and analyzed using SPSS 15.0. The prediction model of BP artificial neural network was built by Matlab 6.5.

RESULTS: The incidence of bacillary dysentery was negatively correlated to the annual mean atmospheric pressure and annual mean precipitation (r = -0.770, -0.591; P = 0.001, 0.026), and was positively correlated to the annual mean evaporation (r = 0.703, P = 0.005). The incidence of viral hepatitis was negatively correlated to the annual mean atmospheric pressure (r = -0.570, P = 0.033), but positively correlated to the maximum temperature (r = 0.722, P = 0.004). The incidence of typhoid fever and paratyphoid fever was negatively correlated to the annual mean atmospheric pressure (r = -0.713, P = 0.004), but positively correlated to the annual mean evaporation and maximum temperature (r = 0.655, 0.562; P = 0.011, 0.037). The predictive precision of bacillary dysentery, viral hepatitis and typhoid fever and paratyphoid fever BP model was 24.3%, 3.5% and 8.3%, respectively.

CONCLUSION: The incidence of digestive system infectious diseases is correlated to the atmospheric pressure, precipitation, evaporation and maximum temperature. The BP neural network model fits very well in the study of digestive system infectious diseases.

Key Words: Digestive system infectious diseases; Meteorological factor; Back-propagation artificial neural network


0 引言

地球由于自身的变化和天体的影响, 使其整体和各个圈层处于不断的运动和变化之中, 使人类生存的自然环境时刻发生着变化. 近年来, 地球表面温度的上升幅度是最近一万年所未有过的[1-3], 气象学家们推测, 2000-2010年我国气候将进入干暖期[4]. 根据我国的气候、环境和目前水资源的供需形式分析, 21世纪我国旱灾发生的频度、强度将明显增强, 旱灾造成的危害及其深远影响有可能超过水灾, 成为对人类社会影响最严重的自然灾害[5]. 因此研究干旱条件下气象因素对消化系传染病的影响, 科学预测其发生、发展规律, 对于预防和控制干旱地区的传染病流行具有重要意义.

1 材料和方法
1.1 材料

辽宁省朝阳市1981-1994的年平均气压、平均气温、平均降水量、平均日照和平均蒸发量等气象资料由当地气象局提供. 在朝阳市疾病预防控制中心获得同期朝阳市常见消化系传染病的发病率资料. 将气象资料和同期传染病的疫情资料输入计算机, 建立数据库.

1.2 方法

1.2.1 气象因素与传染病发病率的相关分析: 以1981-1994年平均气压、平均蒸发量、平均降水量、平均气温、平均最低气温、平均最高气温、平均地面温度、平均最低地面温度和平均最高地面温度作为自变量. 同期的细菌性痢疾病、病毒性肝炎(甲型肝炎和戊型肝炎)和伤寒副伤寒的发病率作为因变量, 利用SPSS15.0软件进行气象因素与传染病发病率的相关分析, 找出与传染病发病关系密切的气象因子.

1.2.2 BP(Back-Propagation)神经网络模型的原理及方法: BP神经网络从模拟生物的神经网络出发, 通常包含一个输入层、一个或几个隐含层和一个输出层, 各层中对数据的处理单位称为处理单元. 其信息的传递过程为由输入层单向传递要利用神经网络进行判别分析, 必须事先对其进行训练. 训练的目的是调节神经元间的联系强度(或称权重系数), 训练准则是使网络的计算输出应变量向量与已知训练样本的应变向量之差为最小. 输入信息从输入层经隐含层逐层处理, 并传向输出层, 每层神经元的状态仅影响下一层神经元的状态. 如果输出层没有得到期望的输出, 则转入反向传播, 将输出值与期望值间的误差信息沿原路返回. 通过修改各神经元的权值, 减少误差, 继续循环, 直至全网络误差收敛到规定的值内为止. 所以这种网络称为BP神经网络[6-8].

本文采用BP神经网络模型的结构为4-2-1, 其中4为输入层节点数, 2为隐层节点数, 1为输出层节点数. 网络的初始权值为-1到1之间的随机数, 训练最终目标是使网络的误差均方(SSE)全局最小, 采用梯度下降算法修改网络的权值. 激活函数取sigmoid函数, 即: F1(x)=1/(1+e(-x))(图1).

图1
图1 BP神经网络模型. X: 输入向量; Y: 输出向量; wjk和wij分别为输入层第k个神经元与隐层第j个神经元之间的连接权重以及隐层经j个神经元与输出层第i个神经元之间的连接权重.

1.2.3 效果评价: 利用1981-1993年资料对人工神经网络BP模型进行构建、训练及模拟, 建立干旱地区传染病疫情的BP神经网络预测模型, 并用平均误差绝对值, 平均误差率(MER)以及决定系数(R2)指标检验模型的拟合程度, 并用模型预测1994年消化系传染病发病率. 平均误差率 = 平均误差绝对值/实际值的均值. 决定系数R2 = (corrcoef(a, t))2即实际值与预测值相关系数的平方.

2 结果
2.1 气象因素与消化系传染病发病率的相关分析

消化系传染病细菌性痢疾的发病率与年平均气压、平均降水量、最低地温呈负相关(P<0.01或0.05), 与平均蒸发量呈正相关(P<0.01). 病毒性肝炎的发病率与平均气压呈负相关(P<0.05), 与最高温度呈正相关(P<0.01). 伤寒副伤寒的发病率与年平均气压呈负相关(P<0.01), 与平均蒸发量和最高温度呈正相关(均P<0.05, 表1).

表1 1981-1994年消化系传染病发病率与气象因子相关分析.
分组平均气压平均蒸发量平均降水量平均气温平均地温最低地温最高温度最低温度
细菌性痢疾r-0.7700.703-0.591-0.225-0.207-0.5910.406-0.475
P0.0010.0050.0260.4390.4770.0260.1500.086
病毒性肝炎r-0.5700.515-0.3690.2000.215-0.2110.722-0.181
P0.0330.0590.1940.4930.4600.4690.0040.573
伤寒副伤寒r-0.7130.655-0.531-0.119-0.098-0.5030.562-0.414
P0.0040.0110.0510.6850.7380.0670.0370.141
2.2 变量的选取及BP人工神经网络模型的构建

在神经网络变量的选择方面, 选取了在相关分析中与消化系传染病发病率关系较为密切的平均气压、平均蒸发量、平均降水量和最高温度4个气象因子作为自变量, 传染病发病率作为因变量, 构建BP神经网络模型.

2.3 神经网络模型的拟合及预测效果分析

消化系传染病发病率的拟合值和实际值比较结果表明, 病毒性肝炎和伤寒副伤寒发病率实际值和回代值的绝对误差较小, 细菌性痢疾发病率实际值和回代值的绝对误差较大, 但三种传染病发病率实际值与回代值的相对误差均较小, 结果见表2.

表2 消化系传染病发病率回代值和实际值的比较.
年份细菌性痢疾
病毒性肝炎
伤寒副伤寒
实际值回代值绝对误差实际值回代值绝对误差实际值回代值绝对误差
1981874.9881.16.2256.3256.30.014.4814.480.00
1982550.0502.347.797.997.90.05.135.130.00
1983348.0384.136.148.948.90.01.361.360.00
1984395.2421.326.144.935.99.02.492.490.00
1985213.3195.318.044.244.20.01.071.070.00
1986293.4149.9143.536.136.10.01.591.590.00
1987134.8176.842.032.535.93.40.250.240.01
1988163.4175.311.930.235.95.70.080.140.06
1989139.689.250.489.987.52.40.240.240.00
199098.472.426.092.892.80.00.060.100.04
199189.3120.531.2108.4108.40.00.250.230.02
199284.6131.947.360.760.61.00.220.230.04
199325.391.466.160.660.60.00.190.110.08
2.4 消化系传染病发病率预测模型的回代效果比较

细菌性痢疾、病毒性肝炎和伤寒副伤寒发病率线性回归和神经网络模型的回代值效果相比, 伤寒副伤寒和病毒性肝炎的神经网络模型回代效果明显优于线性模型, 结果见表3.

表3 消化系传染病发病率预测模型的回代效果比较.
细菌性痢疾
病毒性肝炎
伤寒副伤寒
线性回归神经网络线性回归神经网络线性回归神经网络
MER(%)54.1616.624.602.11119.430.84
R20.95840.94670.34340.99600.75341.0000
2.5 BP人工神经网络模型的预测值及其效果评价

细菌性痢疾、病毒性肝炎和伤寒副伤寒发病率预测结果表明, 伤寒副伤寒和病毒性肝炎相对误差分别为3.5%和8.3%, 预测效果较好, 结果见表4.

表4 消化系传染病发病率的预测值和实际值比较.
实际值预测值绝对误差(%)
细菌性痢疾41.5051.6010.10(24.3)
病毒性肝炎85.2088.203.00(3.5)
伤寒副伤寒0.120.110.01(8.3)
3 讨论

传染病的流行过程就是传染病在人群中发生、发展和转归的过程[9]. 本次研究最高温度范围在29.0℃-32.8℃, 温度越高则相应的传染病发病率越高. 长期的高温条件不仅降低身体抵抗力, 而且可以导致空气和水源的污染、食物的短缺以及细菌、病毒的产生, 从而影响传染病在人群中的分布. 陈深峡 et al研究表明水旱灾害可通过不同形式促成消化系传染病传播途径的实现, 使传染病的发病率升高. 水旱灾害促使潜伏期较短的传染病和好发于夏季的疾病病例明显增多, 前者因传染周期短, 后者则因传染源增加[4]. 朝阳市位于中纬度属北温带大陆性季风气候区, 由于北部蒙古高原的干燥冷空气经常侵入, 形成了半干燥半湿润易旱的气候特点, 在民间有"十年九旱"之称. 主要气候特点为四季分明, 雨热同季, 日照充足, 蒸发量大, 降水偏少且分布不均, 年降水量450-580 mm, 全年平均气温约在6℃-9℃. 本次研究中1981-1994年疫情资料由朝阳市疾病预防控制中心获得, 气象资料由朝阳市气象局提供, 资料的真实可靠. 研究结果显示, 平均气压与细菌性痢疾、病毒性肝炎、伤寒副伤寒的发病率呈负相关(P<0.01或0.05). 一方面, 在低气压的条件下, 空气稀薄, 体内的血氧分压低, 会降低机体抵抗力; 另一方面, 当地面受低气压控制时, 四周高气压回流向中心, 中心的空气便上升, 由于地球自转作用, 北半球的上升气流向反时针方向旋转, 形成气旋, 此时云量较多, 通常风较大, 利于污染物扩散[10], 病毒容易随着尘埃飞扬而污染水源或者食物, 引起传染病爆发流行感染, 因此提示风速可能对传染病的发生起作用. 本次研究结果还显示, 平均蒸发量与细菌性痢疾、伤寒副伤寒的发病率呈正相关; 平均降水量与细菌性痢疾、伤寒副伤寒的发病率呈负相关(P<0.01或0.05). 蒸发量大、降水量少则易形成干旱的条件, 常常导致一些水源枯涸, 造成饮用水源集中, 一旦这些水源受到污染, 将会造成传染病严重的消化系传染病的爆发流行. 裴标

et al研究表明特大旱灾期, 该区地面饮用水微生物污染甚为严重[11-12]. 49份样的大肠菌群、粪大肠菌群及细菌总数均严重超标[13].

本次研究结果显示, BP人工神经网络模型对干旱地区的消化系传染病发病率预测结果显示, BP神经网络模型的回代和预测效果优于传统的多元逐步回归模型, 进一步说明人工神经网络具有良好的容错性、大规模的并行处理方式以及强大的自组织、自学习和自适应能力[14-16]. 气象因素对传染病并不是直接作用, 而是通过影响传染病发生的各个环节(传染源、传播途径与易感人群), 间接影响传染病在人群中的分布. 多元逐步回归模型是一种线性模型, 不能很好地把握气象因素与传染病发病率之间的非线性关系, 模型的回代和预测效果差. BP神经网络模型与传统的线形模型相比, 神经网络对变量间的非线性关系具有较高的建模和回代能力, 能够很好地把握变量间的非线性关系, 因此模型的回代和预测能力好.

评论
背景资料

21世纪我国旱灾发生的频度、强度将明显增强, 成为最严重的自然灾害. 因此研究干旱条件下气象因素对消化系传染病的影响, 科学预测其发生、发展规律, 对于政府部门预防和控制干旱地区的传染病流行具有重要意义.

同行评议者

喻荣彬, 副教授, 南京医科大学公共卫生学院流行病与卫生统计学系

研发前沿

人工神经网络是一种新兴的疾病预测方法, 他是机器模拟人脑智能活动的杰出代表, 已经广泛应用于信息科学、认知科学、控制论等科学及工程技术领域, 近年来也开始用于解决医学领域的问题.

相关报道

目前关于传染病发病率的预测主要是传统的线性回归、时间序列、Logistic回归和灰色预测等方法.

创新盘点

本文应用BP神经网络模型进行消化系传染病的发病率预测, 并和Logistic回归模型的预测效果进行对比, 提示BP神经网络模型在预测消化系传染病中有着广泛地应用前景.

名词解释

神经网络(BP): 即反馈神经网络, 他是模拟生物的神经网络, 其信息的传递过程为由输入层单向传递, 输入信息从输入层经隐含层逐层处理, 并传向输出层, 如果输出层没有得到期望的输出, 则转入反向传播, 将输出值与期望值间的误差信息沿原路返回. 通过修改各神经元的权值, 减少误差, 继续循环, 直至全网络误差收敛到规定的值内为止.

同行评价

本文选题新颖, 设计合理, 研究指标选择恰当, 具有较好的实用价值.

编辑:李军亮 电编:吴鹏朕

1.  Páles E, Mikulecký M sr. Sr. 500-year periodicity of political instability in the history of ancient Egypt and China. Androgens at work? Neuro Endocrinol Lett. 2008;29:589-597.  [PubMed]  [DOI]
2.  Paul VJ. Global warming and cyanobacterial harmful algal blooms. Adv Exp Med Biol. 2008;619:239-257.  [PubMed]  [DOI]
3.  Verdin J, Funk C, Senay G, Choularton R. Climate science and famine early warning. Philos Trans R Soc Lond B Biol Sci. 2005;360:2155-2168.  [PubMed]  [DOI]
4.  Diaz JH. The influence of global warming on natural disasters and their public health outcomes. Am J Disaster Med. 2007;2:33-42.  [PubMed]  [DOI]
5.  Zuskin E, Sarić M, Vadić V, Mustajbegović J, Doko-Jelinic J, Pucarin-Cvetković J, Milosević M. [Causes of climatic changes and their consequences on human health]. Acta Med Croatica. 2008;62:293-299.  [PubMed]  [DOI]
6.  de Kamps M, van der Velde F. From artificial neural networks to spiking neuron populations and back again. Neural Netw. 2001;14:941-953.  [PubMed]  [DOI]
7.  Lamb DJ, Niederberger CS. Artificial intelligence in medicine and male infertility. World J Urol. 1993;11:129-136.  [PubMed]  [DOI]
8.  杨 宝华. 基于Matlab的BP神经网络应用. 电脑知识与技术. 2008;15:124-125.  [PubMed]  [DOI]
9.  Greer A, Ng V, Fisman D. Climate change and infectious diseases in North America: the road ahead. CMAJ. 2008;178:715-722.  [PubMed]  [DOI]
10.  Dufour B, Moutou F, Hattenberger AM, Rodhain F. Global change: impact, management, risk approach and health measures--the case of Europe. Rev Sci Tech. 2008;27:529-550.  [PubMed]  [DOI]
11.  Greenough G, McGeehin M, Bernard SM, Trtanj J, Riad J, Engelberg D. The potential impacts of climate variability and change on health impacts of extreme weather events in the United States. Environ Health Perspect. 2001;109 Suppl 2:191-198.  [PubMed]  [DOI]
12.  陈 深侠, 陈 先清. 气象灾害对传染病疫情的影响. 中国公共卫生. 1998;14:583-584.  [PubMed]  [DOI]
13.  裴标 高峻, 刘 玉娥, 陶 墨奎. 旱灾期地面饮用水弧菌污染监测及病原学研究. 江苏预防医学. 1995;5:14-16.  [PubMed]  [DOI]
14.  Trujillano J, March J, Sorribas A. [Methodological approach to the use of artificial neural networks for predicting results in medicine]. Med Clin (Barc). 2004;122 Suppl 1:59-67.  [PubMed]  [DOI]
15.  Gil J, Wu HS. Applications of image analysis to anatomic pathology: realities and promises. Cancer Invest. 2003;21:950-959.  [PubMed]  [DOI]
16.  Dreiseitl S, Ohno-Machado L. Logistic regression and artificial neural network classification models: a methodology review. J Biomed Inform. 2002;35:352-359.  [PubMed]  [DOI]