修回日期: 2019-01-17
接受日期: 2019-02-24
在线出版日期: 2019-03-08
从分子水平探析胃癌(gastric cancer, GC)病理机制对改善患者预后至关重要. 目前, COL6A3在GC中的表达情况及临床意义鲜有报道.
研究COL6A3基因在GC中的表达情况和临床意义, 并探究可能的作用机制.
收集GC相关生物大数据, 对肿瘤样本的基因表达谱数据及其对应的临床信息进行回顾性分析和生存分析; 采用基因集富集分析方法探讨COL6A3在GC中可能的作用机制.
COL6A3在GC中表达明显升高(P<0.0001), 且具有较大诊断价值(AUC = 0.9516). COL6A3高表达与T分期显著相关(P = 0.001), COL6A3高表达的GC浸润深度更大. COL6A3高表达患者的预后明显差于低表达患者(P = 0.0018). COL6A3高表达样本中, 富集了多个肿瘤相关通路的基因集(n = 68).
COL6A3高表达与GC的发生发展相关, 具有较大的临床意义.
核心提要: 本文利用大数据分析的方法, 系统分析了COL6A3表达在胃癌(gastric cancer, GC)中的临床意义, 提示COL6A3在GC中可能是一种可靠的生物标志物. 同时, 本文所使用的研究方法, 也为其它疾病中生物标志物的挖掘提供了借鉴.
引文著录: 韩一帆, 朱少俊. COL6A3基因在胃癌中的表达及临床意义. 世界华人消化杂志 2019; 27(5): 293-298
Revised: January 17, 2019
Accepted: February 24, 2019
Published online: March 8, 2019
Elucidating the molecular mechanism of gastric cancer (GC) is of great significance, especially for improving the prognosis, and few studies have focused on the clinical significance of COL6A3 expression in GC.
To analyze the clinical significance of COL6A3 expression in GC, and to identify the potential role of COL6A3 in GC.
The biological big data of GC were collected, and retrospective analysis and survival analysis were conducted on the expression profile of COL6A3 in tumor samples and its relationship with clinical data. Gene set enrichment analysis was used to identify the potential role of COL6A3 in GC.
COL6A3 was highly expressed in GC (P < 0.0001) with good diagnostic value (AUC = 0.9516). High COL6A3 expression was associated with deeper tumor invasion (P = 0.001). Patients with high expression of COL6A3 showed a poorer prognosis than those with low expression (P = 0.0018). The tumor-related gene sets were enriched in the samples with high COL6A3 expression.
The high expression of COL6A3 is related to the occurrence and development of GC.
- Citation: Han YF, Zhu SJ. Clinical significance of COL6A3 expression in gastric cancer. Shijie Huaren Xiaohua Zazhi 2019; 27(5): 293-298
- URL: https://www.wjgnet.com/1009-3079/full/v27/i5/293.htm
- DOI: https://dx.doi.org/10.11569/wcjd.v27.i5.293
胃癌(gastric cancer, GC)是我国最常见的恶性肿瘤之一, 其死亡率占恶性肿瘤死亡率的第二位[1]. GC早期症状缺乏特异性, 诊断较难, 多数患者确诊时已属于中晚期, 五年生存率很低. 其浸润深度、分化程度与转移是影响其预后的重要因素, 肿瘤细胞的某些基因及其表达产物在这些病理过程中发挥着重要作用. 因此, 从分子水平探析GC病理机制对改善患者预后至关重要.
COL6A3(Collagen type Ⅵ alpha 3 chain)是Ⅵ型胶原蛋白三条α链的编码基因之一. 已有研究表明COL6A3与肌张力障碍、结直肠癌、胰腺癌等疾病有关[2-4], 但COL6A3在GC中的表达及作用鲜有报道. 因此, 明确COL6A3在GC中的表达情况及预后作用, 对阐明COL6A3参与肿瘤发生发展的作用机制具有重要意义.
在NCBI的GEO数据库(http://www.ncbi.nlm.nih.gov/geo)中下载69例GC组织及癌旁组织的基因表达谱数据(研究号为GSE13911). 在UCSC数据库(https://genome-cancer.ucsc.edu/)中下载421例GC样本的RNA测序数据(均使用Illumina Hiseq技术)及相关临床数据.
1.2.1 COL6A3与GC发生的相关性研究: GSE13911数据集收集了38例GC组织样本和31癌旁组织样本. 该数据集使用了Affymetrix公司的Human Genome U133 Plus 2.0表达谱芯片. 该芯片包含54675个探针, 其中201438_at为COL6A3的特异性探针.
1.2.2 COL6A3与临床病理学参数的相关性研究: 421例GCRNA测序数据中仅保留包含临床参数的病例. 根据表达谱数据, 对样本COL6A3的表达进行由高到低的排序, 前50%的样本作为高表达组, 后50%的样本作为低表达组.
1.2.3 COL6A3与预后的相关性研究: 在线工具Kaplan-Meier Plotter (http://kmplot.com/analysis/)收集了1065例GC患者的基因芯片数据及生存数据. 该工具可将样本根据指定基因的表达水平分成高表达组和低表达组, 分析两组患者在生存时间上的差异.
1.2.4 基因富集分析: 采用基因富集分析(gene set enrichment analysis, GSEA) 2.2.2版软件进行分析. 根据COL6A3的表达水平分成高表达组和低表达组. 利用GSEA网站MSigDB数据库中的c2.cp.kegg.v5.1.symbols.gmt数据集作为功能基因集, 按缺省加权富集统计的方法, 设置随机组合次数为1000次, 分析COL6A3表达水平对各种生物通路基因集的影响.
统计学处理 计量资料采用GraphPad Prism 5软件进行t检验和作图. 计数资料使用SPSS 21.0软件进行χ2检验. 生存分析采用Kaplan-Meier和log-rank检验法. P<0.05认为差异有统计学意义. 在GSEA分析中, P<0.05及错误发现率<0.05的基因集作为显著富集基因集.
GSE13911数据集中, 与癌旁组织(n = 31)相比, COL6A3在GC组织(n = 38)中表达明显增高(P<0.0001), 见图1. 同时, COL6A3在癌组织和癌旁组织的鉴别诊断中也具有较高的诊断价值, 其受试者工作曲线下面积[area under the receiver operating characteristic curve (ROC), AUC]达到了0.9516.
421例GCRNA测序数据中, COL6A3表达水平与年龄、性别、肿瘤分级、N分期、转移均无明显关系(P>0.05), 与T分期显著相关(P = 0.001), 提示COL6A3高表达的GC浸润深度更大, 见表1.
因素 | n | COL6A3表达水平 | χ2值 | P值 | |
高表达(%) | 低表达(%) | ||||
年龄(岁) | |||||
<60 | 124 | 63 (50.8) | 61 (49.2) | 0.079 | 0.779 |
≥60 | 284 | 140 (49.3) | 144 (50.7) | ||
性别 | |||||
男性 | 146 | 72 (49.3) | 74 (50.7) | 0.001 | 0.981 |
女性 | 267 | 132 (49.4) | 135 (50.6) | ||
肿瘤分级 | |||||
G1 | 10 | 5 (50.0) | 5 (50.0) | 4.104 | 0.128 |
G2 | 150 | 84 (56.0) | 66 (44.0) | ||
G3 | 244 | 111 (45.5) | 133 (54.5) | ||
T分期 | |||||
T1 | 23 | 20 (87.0) | 3 (13.0) | 15.928 | 0.001 |
T2 | 87 | 46 (52.9) | 41 (47.1) | ||
T3 | 188 | 91 (48.4) | 97 (51.6) | ||
T4 | 112 | 47 (42.0) | 65 (58.0) | ||
N分期 | |||||
N0 | 131 | 65 (49.6) | 66 (50.4) | 2.038 | 0.565 |
N1 | 113 | 60 (53.1) | 53 (46.9) | ||
N2 | 84 | 43 (51.2) | 41 (48.8) | ||
N3 | 77 | 33 (42.9) | 44 (57.1) | ||
转移 | |||||
是 | 21 | 12 (57.1) | 9 (42.9) | 0.502 | 0.479 |
否 | 374 | 184 (49.2) | 190 (50.8) |
Kaplan-Meier Plotter在线数据分析发现, COL6A3高表达患者的预后明显差于低表达患者(P = 0.0018), 见图2. 更一步提示, COL6A3是预后不良因素, 高表达与患者生存期缩短显著相关.
GSEA分析结果提示, COL6A3高表达样本中, 富集了多个肿瘤相关通路的基因集(n = 68), 提示COL6A3可能参与GC多个生物过程(图3).
骨骼肌肌细胞外基质中, Ⅵ型胶原蛋白参与构成了微纤维网, 连接肌纤维和其它结缔组织, 起着结构支持等作用. 此外, Ⅵ型胶原纤维也广泛存在于肌腱、关节软骨、皮肤等多种组织. Ⅵ型胶原蛋白由α1、α2、α3等三条多肽链组成, 分别由COL6A1、COL6A2、COL6A3基因编码. 目前, 已有研究发现, COL6A3基因异常与多种肌肉疾病相关[5,6].
COL6A3也参与了结直肠癌、胰腺癌、卵巢癌等肿瘤的发病, 多个研究有所报道. Qiao等[3]通过蛋白定量及数据库连锁分析后, 发现COL6A3与结直肠癌的Dukes分期、T分期、复发明显相关, 且与正常人相比, 结直肠癌患者外周血中的COL6A3表达量明显上调, 提示COL6A3在结直肠癌中是较好的诊断和预后指标. 对22例结直肠癌患者全外显子测序, 及对160例结直肠癌患者靶向测序后发现, CDH10、COL6A3、SMAD4、TMEM132D、VCAN等基因突变与结直肠癌预后明显相关. Kang等[4]对44例胰腺导管腺患者、30例年龄匹配的正常健康对照的外周血COL6A3进行分析后, 发现外周血COL6A3在胰腺癌中具有较高的诊断价值. Ismail等[7]也发现COL6A3在卵巢癌中高表达, 且与卵巢癌细胞低分化相关.
COL6A3在GC中的表达及作用报道较少. Sun[8]将12例GC标本和15例正常对照标本进行基因表达谱芯片检测后, 发现细胞外基质受体作用通路相关基因集在GC中显著富集, 其中包括COL6A3基因, 提示COL6A3可能参与了GC的发生. Xie等[9]通过基因芯片Meta分析, 也发现COL6A3基因在GC组织中表达明显升高. 尚无研究报道COL6A3表达与GC患者临床特征的相关性以及在GC中的预后作用. 本研究通过基因芯片数据分析发现COL6A3在GC中表达明显升高, 提示该基因参与了GC的发生. 然后, 通过大样本测序数据探究COL6A3表达与GC临床特征的关系, 发现其表达水平与T分期显著相关, COL6A3高表达的GC浸润深度更大. 对大规模基因芯片数据进行生存分析后, 也发现COL6A3高表达患者的预后明显差于低表达患者. COL6A3可能通过影响GC组织浸润深度来影响患者的预后.
为了进一步探究COL6A3在GC中可能的作用机制, 我们根据基因表达水平分组后进行了GSEA分析. 结果发现, COL6A3高表达的样本中, 富集了多个肿瘤相关通路的基因集, 提示COL6A3在GC中具有较大生物学意义, 值得进一步深入研究.
总之, 本研究通过生物大数据分析, 发现COL6A3在GC中表达明显增高, 且其高表达与肿瘤浸润深度、预后明显相关. 同时, GSEA提示COL6A3可能与多个肿瘤相关通路相关.
从分子水平探析胃癌(gastric cancer, GC)病理机制对改善患者预后至关重要.
目前, COL6A3在GC中的表达情况及临床意义鲜有报道.
本研究利用生物大数据分析的方法, 系统分析了COL6A3表达在GC中的临床意义.
首先, 我们利用基因芯片数据, 发现COL6A3在GC中高表达, 且具有较大的鉴别诊断价值. 然后, 利用RNA测序数据, 分析了COL6A3表达水平与GC临床病理学参数的相关性. 同时, 分析了COL6A3表达水平与GC预后的关系.
为了进一步探究COL6A3在GC中可能的作用机制, 我们利用基因集富集分析发现, COL6A3与多个肿瘤相关通路相关.
COL6A3在GC中具有较大的临床意义和生物学意义.
COL6A3在GC中具有较大生物学意义, 值得进一步深入研究.
学科分类: 胃肠病学和肝病学
手稿来源地: 浙江省
同行评议报告分类
A级 (优秀): 0
B级 (非常好): 0
C级 (良好): C
D级 (一般): D, D
E级 (差): 0
编辑:崔丽君 电编:张砚梁
1. | Rahman R, Asombang AW, Ibdah JA. Characteristics of gastric cancer in Asia. World J Gastroenterol. 2014;20:4483-4490. [PubMed] [DOI] |
2. | Jochim A, Zech M, Gora-Stahlberg G, Winkelmann J, Haslinger B. The clinical phenotype of early-onset isolated dystonia caused by recessive COL6A3 mutations (DYT27). Mov Disord. 2016;31:747-750. [PubMed] [DOI] |
3. | Qiao J, Fang CY, Chen SX, Wang XQ, Cui SJ, Liu XH, Jiang YH, Wang J, Zhang Y, Yang PY, Liu F. Stroma derived COL6A3 is a potential prognosis marker of colorectal carcinoma revealed by quantitative proteomics. Oncotarget. 2015;6:29929-29946. [PubMed] [DOI] |
4. | Kang CY, Wang J, Axell-House D, Soni P, Chu ML, Chipitsyna G, Sarosiek K, Sendecki J, Hyslop T, Al-Zoubi M, Yeo CJ, Arafat HA. Clinical significance of serum COL6A3 in pancreatic ductal adenocarcinoma. J Gastrointest Surg. 2014;18:7-15. [PubMed] [DOI] |
7. | Ismail RS, Baldwin RL, Fang J, Browning D, Karlan BY, Gasson JC, Chang DD. Differential gene expression between normal and tumor-derived ovarian epithelial cells. Cancer Res. 2000;60:6744-6749. [PubMed] |
8. | Sun H. Identification of key genes associated with gastric cancer based on DNA microarray data. Oncol Lett. 2016;11:525-530. [PubMed] [DOI] |
9. | Xie X, Liu X, Zhang Q, Yu J. Overexpression of collagen VI α3 in gastric cancer. Oncol Lett. 2014;7:1537-1543. [PubMed] [DOI] |