临床研究 Open Access
Copyright ©The Author(s) 2016. Published by Baishideng Publishing Group Inc. All rights reserved.
世界华人消化杂志. 2016-04-18; 24(11): 1664-1675
在线出版日期: 2016-04-18. doi: 10.11569/wcjd.v24.i11.1664
基于RNA-Seq技术的跨种属跨病因肝癌差异表达基因的筛选
史俊林, 罗旺, 李瑗, 杨春, 唐艳萍, 李科志, 曹骥
史俊林, 罗旺, 李瑗, 杨春, 唐艳萍, 李科志, 曹骥, 广西医科大学附属肿瘤医院实验研究部 广西壮族自治区南宁市 530021
史俊林, 广西医科大学转化医学研究中心 广西医科大学研究生院 广西壮族自治区南宁市 530021
史俊林, 助理研究员, 主要从事肝癌病因学的基础与临床研究以及肿瘤转移和肿瘤微环境方面的研究.
基金项目: 国家自然科学基金资助项目, Nos. 30960428, 81260080; 广西医科大学青年科学基金资助项目, No. GXMUYSF2014023.
作者贡献分布: 本课题由曹骥设计; 研究过程由史俊林、罗旺、杨春、唐艳萍及李科志完成; 论文撰写由史俊林、曹骥及李瑗完成.
通讯作者: 曹骥, 研究员, 530021, 广西壮族自治区南宁市河堤路71号, 广西医科大学附属肿瘤医院实验研究部. caojicn@163.com
收稿日期: 2016-02-01
修回日期: 2016-02-26
接受日期: 2016-03-08
在线出版日期: 2016-04-18

目的: 运用全转录组测序(RNA sequencing, RNA-Seq)技术和跨种属、跨病因筛选策略, 定位出影响肝癌发生发展的关键因子.

方法: 运用RNA-Seq技术, 对人肝癌、癌旁和正常肝组织, 以及乙型肝炎病毒(hepatitis B virus, HBV)和黄曲霉毒素B1(aflatoxins, AFB1)诱发的树鼩肝癌、癌旁和正常肝组织标本进行全转录组测序、基因表达水平分析和比较; 分别筛选出人肝癌差异表达分子、HBV和AFB1致癌的树鼩肝癌差异表达因子, 最后定位出跨人和树鼩两个物种、跨HBV和AFB1两种致癌因素的肝癌共同差异表达分子.

结果: 各标本总RNA提取质量合格, RNA-Seq测序数据质量合格, 测序数据与参考基因对比匹配率合格, 样品间基因表达相关性合格. 人肝癌差异表达基因有68个, 其中上调基因14个, 下调基因54个; HBV诱发的树鼩肝癌差异表达基因有314个, AFB1诱发的树鼩肝癌差异表达基因有20个, HBV和AFB1诱发的树鼩肝癌共同差异表达基因11个, 均为下调基因. 人肝癌和树鼩肝癌共同差异表达基因为2个, 分别是载脂蛋白F(apolipoprotein F, APOF)和人胰岛素样生长因子酸不稳定亚基(insulin-like growth factor binding protein, acid labile subunit, IGFALS), 其mRNA表达水平在肝癌中均下调.

结论: 运用RNA-Seq技术, 跨种属、跨病因筛选肝癌关键基因的研究策略有可能推动肝癌关键基因的定位; APOF和IGFALS有可能是影响肝癌发生发展的重要分子.

关键词: 全转录组测序; 肝癌; 跨种属; 跨病因; 载脂蛋白F; 胰岛素样生长因子酸不稳定亚基

核心提示: 基于全转录组测序这一新的技术, 结合跨种属、跨病因肿瘤关键基因筛选策略, 我们初步发现了载脂蛋白F和胰岛素样生长因子酸不稳定亚基两个可能影响肝癌发生发展的候选关键基因.


引文著录: 史俊林, 罗旺, 李瑗, 杨春, 唐艳萍, 李科志, 曹骥. 基于RNA-Seq技术的跨种属跨病因肝癌差异表达基因的筛选. 世界华人消化杂志 2016; 24(11): 1664-1675
Screening differentially expressed genes in hepatocellular carcinoma by cross-species and cross-carcinogenic factors strategy based on RNA-Seq
Jun-Lin Shi, Wang Luo, Yuan Li, Chun Yang, Yan-Ping Tang, Ke-Zhi Li, Ji Cao
Jun-Lin Shi, Wang Luo, Yuan Li, Chun Yang, Yan-Ping Tang, Ke-Zhi Li, Ji Cao, Department of Experimental Pathology, Tumor Hospital of Guangxi Medical University, Nanning 530021, Guangxi Zhuang Autonomous, China
Jun-Lin Shi, Center for Translational Medicine of Guangxi Medical University; Graduate School of Guangxi Medical University, Nanning 530021, Guangxi Zhuang Autonomous Region, China
Supported by: National Natural Science Foundation of China, Nos. 30960428 and 81260080; Youth Foundation of Guangxi Medical University, No. GXMUYSF2014023.
Correspondence to: Ji Cao, Researcher, Department of Experimental Pathology, Tumor Hospital of Guangxi Medical University, 71 Hedi Road, Nanning 530021, Guangxi Zhuang Autonomous, China. caojicn@163.com
Received: February 1, 2016
Revised: February 26, 2016
Accepted: March 8, 2016
Published online: April 18, 2016

AIM: To identify key molecules involved in progression of hepatocellular carcinoma (HCC) by cross-species (human and tupaia) and cross-carcinogenic factors (HBV and AFB1) strategy based on RNA sequencing (RNA-Seq).

METHODS: The transcripts in human and tupaia HCC, tumor adjacent liver tissue (para-HCC) and normal liver tissue were thoroughly analyzed by RNA sequencing. Tupaia HCC was induced by HBV infection or aflatoxin B1 (AFB1). Differentially expressed genes were collected between these tissues, and common differential genes which cross human and Tupaia as well as HBV and AFB1 carcinogenic factors were identified.

RESULTS: Compared to human para-HCC and normal liver tissues, 68 differential genes were screened in human HCC, among which 14 were up-regulated and 54 down-regulated. Compared to Tupaia para-HCC and normal liver tissues, 314 differential genes were screened in HBV induced Tupaia HCC, and 20 were screened in AFB1 induced Tupaia HCC. There were 11 common differential genes between HBV and AFB1 induced Tupaia HCC, all of which were down-regulated. There were 2 common differential genes between human HCC and Tupaia HCC, and they were apolipoprotein F (APOF) and insulin-like growth factor binding protein, acid labile subunit (IGFALS), both of which were down-regulated in HCC.

CONCLUSION: The cross-species, cross-carcinogenic factors screening strategy based on RNA-Seq may promote the process of identifying key molecules for human HCC. APOF and IGFALS may be important factors for HCC.

Key Words: RNA sequencing; Hepatocellular carcinoma; Cross-species; Cross-carcinogenic factors; Apolipoprotein F; IGFALS


0 引言

肝细胞癌(hepatocellular carcinoma, HCC)是世界第五大恶性肿瘤[1,2], 严重危害人类健康. 我国是肝癌重灾区, 发病率和死亡率均居亚洲之首[3,4]. 全转录组测序(RNA sequencing, RNA-Seq)是转录组测序的新一代技术, 已成为转录组研究中的一项强大平台[5-7], 并得到越来越广泛的应用. 在肿瘤研究领域, RNA-Seq已广泛应用于白血病、淋巴瘤、前列腺癌、结肠癌、肺癌、乳腺癌、卵巢癌、宫颈癌及肝癌等的肿瘤标志物、致癌机制及干预措施的研究[8-16].

跨种属筛选肿瘤关键基因是本课题组前期提出的一项肿瘤研究策略[17], 并通过应用这一研究策略和基因芯片、蛋白芯片技术, 对人、树鼩和大鼠的肝癌、癌旁及正常肝组织进行了跨种属差异表达因子的筛选和验证等研究[18,19]. 本研究应用新技术RNA-Seq进一步对人肝癌、癌旁及正常肝组织以及对乙型肝炎病毒(hepatitis B virus, HBV)和黄曲霉毒素B1(aflatoxins, AFB1)暴露诱发的树鼩肝癌、癌旁及正常肝组织, 进行了全转录组测序和比较、分析, 筛选出由不同因素诱发的、不同种属的肝癌组织中共同存在的差异表达分子, 后者作为候选的肝癌关键因子值得进一步研究.

1 材料和方法
1.1 材料

3例人肝癌及其相应的癌旁组织(距离肿瘤边缘2 cm以外)冷冻标本为广西医科大学肿瘤医院肝胆外科2014/2015年手术切除后保存, 均为男性, 平均年龄59岁, 术前均未接受放化疗、生物治疗等干预措施; 3例正常人肝组织冷冻标本为广西医科大学第一附属医院普通外科保存. 1例HBV感染诱发的树鼩肝癌及其癌旁组织、3例AFB1摄入诱发的树鼩肝癌及其癌旁组织以及3例树鼩正常肝组织来自本课题组的前期动物实验[20,21].

1.2 方法

1.2.1 高通量测序: RNA测序由北京诺禾致源生物信息科技有限公司完成, 主要步骤为: 提取样品总RNA, 对样品进行质量检测, 用带有Oligo(dT)的磁珠富集样品中的mRNA, 随后将mRNA打成短片段并以其为模板合成双链cDNA, 后者经纯化、末端修复、加A尾并连接测序接头后进行片段大小选择, 然后通过PCR富集得到cDNA文库, 对文库进行库检, 最后对库检合格的cDNA进行HiSeq测序.

1.2.2 生物信息学分析: 首先对测序获得的高通量原始数据进行质量评估, 包括测序错误率分布检查(Phred分值表示, 20对应的碱基正确识别率为99%, 30对应的碱基正确识别率为99.9%)、A/T/C/G含量分布检查、测序数据过滤(去掉带接头的以及低质量的原始序列); 然后应用软件TopHat2对测序数据与参考基因组进行比对, 正常情况下, 实验所产生的测序序列定位的百分比会高于70%(Total Mapped), 其中具有多个定位的序列(Multiple Mapped)占总体的百分比通常不超过10%. 采用FKPM(Fragments Per Kilo bases per Million reads, 来自某一基因每千碱基长度的测序片段数目, 是目前最常用的基因表达水平估算方法)[22]估算样本中的基因表达量, 我们认为FKPM>1为基因表达. 应用Pearson相关系数来检测样本间表达基因的相关程度, 即线性相关程度. 本实验在进行低等灵长类动物树鼩和人基因对比时, 通过Ensemble进行基因名称转换.

1.2.3 差异基因表达分析: 首先分别将人肝癌组织、癌旁组织与人正常肝组织的基因表达水平进行对比, 找到与癌旁组织和正常肝组织相比均有差异的人肝癌组织的差异表达基因, 再以同样的方法找到HBV和AFB1致癌的树鼩肝癌组织的差异表达基因, 然后将这些差异表达基因分别进行对比, 最终筛选出跨物种、跨病因的人和树鼩肝癌共有的差异表达基因.

统计学处理 差异表达基因的筛选, 从基因表达水平分析中得到数据经过校正后, 先应用DESeq方法[23]进行生物学变异的消除, 再以padj<0.05为标准筛选差异表达基因.

2 结果
2.1 测序数据质量评估

如表1所示, 所有样本的Q20在95.38%-97.46%之间, Q30在89.33%-93.69%之间(Q20、Q30分别显示Phred数值大于20、30的碱基占总体碱基的百分比). 其中Raw reads为统计原始序列数据; Clean reads为统计过滤后的测序数据, 此系列数据是后续的生物信息分析的基础; Clean bases为Clean reads的个数乘以长度, 并转化为以G为单位; 错误率是通过公式Qphred = -10log10(e)计算得到的; GC含量显示碱基G和C的数量总和占总的碱基数量的百分比.

表1 测序产出数据质量情况一览表.
样品名称Raw readsClean readsClean bases错误率(%)Q20(%)Q30(%)GC含量
HUC137206882364457224.56G0.0197.4693.6950.49
HUC239980478392869744.91G0.0197.2393.1751.93
HUC341432656408441925.11G0.0197.3493.3649.73
HUP130008898288250383.60G0.0296.0290.7451.36
HUP230599356294169823.67G0.0295.6689.8352.33
HUP327131834261214483.26G0.0296.0790.7950.29
HUNL131350434301303743.76G0.0296.2591.1850.02
HUNL235092444339429444.24G0.0296.3391.2948.28
HUNL340344662388021324.84G0.0296.2691.3449.48
TSBC 25802062 24849984 3.10G 0.02 95.94 90.43 50.08
TSBP 30744812 29447898 3.67G 0.02 96.03 90.74 50.77
TSFC1 27993940 26848966 3.35G 0.02 95.89 90.40 49.62
TSFC2 31917292 30852496 3.85G 0.02 96.20 91.00 49.10
TSFC3 30277814 29078526 3.63G 0.02 95.75 90.02 51.59
TSFP1 28105204 26992530 3.37G 0.02 96.03 90.66 50.46
TSFP2 30496114 29218694 3.64G 0.02 96.10 90.81 50.88
TSFP3 27089406 26041320 3.25G 0.02 95.73 89.77 50.90
TSNL1 26407954 25418372 3.17G 0.02 96.02 90.66 49.41
TSNL2 28104302 26866832 3.35G 0.02 95.38 89.33 49.61
TSNL3 33759030 31788066 3.96G 0.02 96.24 91.28 52.30
2.2 生物信息学分析

如表2所示, 本研究所有标本的Total Mapped在70.11%-90.68%之间, Multiple Mapped在1.97%-3.40%之间. Total reads为测序序列经过测序数据过滤后的数量统计(Clean data); Uniquely mapped为在参考序列上有唯一比对位置的测序序列的数量统计; Reads map to '+'和Reads map to '-'分别为测序序列比对到基因组上正链和负链的统计; Non-splice reads为整段比对到外显子的测序序列的统计; Splice reads为Total mapped中分段比对到两个外显子上的测序序列(也称为Junction reads)的统计, 他的百分比取决于测序片段的长度. 表3所示为所有标本在不同表达水平区间的基因数量统计.

表2 Reads与参考基因组比对情况一览表.
样品名称Total readsTotal mapped[n(%)]Multiple mapped[n(%)]Uniquely mapped[n(%)]Reads map to '+'[n(%)]Reads map to '-'[n(%)]Non-splice reads[n(%)]Splice reads[n(%)]
HUC1 36445722 32670253(89.64) 902942(2.48) 31767311(87.16) 15883705(43.58) 15883606(43.58) 19414598(53.27) 12352713(33.89)
HUC2 39286974 35182541(89.55) 1337075(3.40) 33845466(86.15) 16902604(43.02) 16942862(43.13) 22266843(56.68) 11578623(29.47)
HUC3 40844192 37036980(90.68) 894244(2.19) 36142736(88.49) 18044358(44.18) 18098378(44.31) 22278103(54.54) 13864633(33.95)
HUP1 28825038 24692788(85.66) 729078(2.53) 23963710(83.14) 11974500(41.54) 11989210(41.59) 16050121(55.68) 7913589(27.45)
HUP2 29416982 25345056(86.16) 842482(2.86) 24502574(83.29) 12251984(41.65) 12250590(41.64) 16617415(56.49) 7885159(26.80)
HUP3 26121448 22625535(86.62) 711245(2.72) 21914290(83.89) 10951977(41.93) 10962313(41.97) 14151326(54.18) 7762964(29.72)
HUNL1 30130374 26312376(87.33) 715190(2.37) 25597186(84.95) 12793386(42.46) 12803800(42.49) 15534005(51.56) 10063181(33.40)
HUNL2 33942944 30050836(88.53) 841963(2.48) 29208873(86.05) 14587310(42.98) 14621563(43.08) 15736894(46.36) 13471979(39.69)
HUNL3 38802132 33493766(86.32) 1004978(2.59) 32488788(83.73) 16234641(41.84) 16254147(41.89) 22506362(58.00) 9982426(25.73)
TSBC 24849984 18710366(75.29) 705691(2.84) 18004675(72.45) 8974953(36.12) 9029722(36.34) 9993900(40.22) 8010775(32.24)
TSBP 29447898 22482581(76.35) 637820(2.17) 21844761(74.18) 10898661(37.01) 10946100(37.17) 13060258(44.35) 8784503(29.83)
TSFC1 26848966 20049832(74.68) 654623(2.44) 19395209(72.24) 9657952(35.97) 9737257(36.27) 12109987(45.10) 7285222(27.13)
TSFC2 30852496 21632114(70.11) 609183(1.97) 21022931(68.14) 10470694(33.94) 10552237(34.20) 12900309(41.81) 8122622(26.33)
TSFC3 29078526 21826058(75.06) 669998(2.30) 21156060(72.75) 10547223(36.27) 10608837(36.48) 11840645(40.72) 9315415(32.04)
TSFP1 26992530 20716728(76.75) 591861(2.19) 20124867(74.56) 10060447(37.27) 10064420(37.29) 11516169(42.66) 8608698(31.89)
TSFP2 29218694 20576757(70.42) 604349(2.07) 19972408(68.35) 9978186(34.15) 9994222(34.20) 11189601(38.30) 8782807(30.06)
TSFP3 26041320 20182818(77.50) 654774(2.51) 19528044(74.99) 9774814(37.54) 9753230(37.45) 10583948(40.64) 8944096(34.35)
TSNL1 25418372 18226500(71.71) 514545(2.02) 17711955(69.68) 8828112(34.73) 8883843(34.95) 9953996(39.16) 7757959(30.52)
TSNL2 26866832 19460969(72.43) 617362(2.30) 18843607(70.14) 9401317(34.99) 9442290(35.14) 9717239(36.17) 9126368(33.97)
TSNL3 31788066 24301296(76.45) 663093(2.09) 23638203(74.36) 11765212(37.01) 11872991(37.35) 15042194(47.32) 8596009(27.04)
表3 不同表达水平区间的基因数量统计表 n(%).
FPKM Interval0-11-33-1515-60>60
HUC1 41566(72.63) 3578(6.25) 5650(9.87) 4640(8.11) 1798(3.14)
HUC2 43595(76.17) 3153(5.51) 5182(9.05) 3534(6.17) 1768(3.09)
HUC3 42720(74.64) 3072(5.37) 5268(9.20) 4340(7.58) 1832(3.20)
HUP1 43421(75.87) 3713(6.49) 5610(9.80) 3071(5.37) 1417(2.48)
HUP2 42840(74.85) 3663(6.40) 5687(9.94) 3410(5.96) 1632(2.85)
HUP3 43430(75.88) 3640(6.36) 5649(9.87) 3179(5.55) 1334(2.33)
HUNL1 43776(76.49) 3506(6.13) 5538(9.68) 3129(5.47) 1283(2.24)
HUNL2 43678(76.32) 3388(5.92) 5647(9.87) 3274(5.72) 1245(2.18)
HUNL3 42677(74.57) 3727(6.51) 5837(10.20) 3478(6.08) 1513(2.64)
TSBC 22965(64.12) 2187(6.11) 5201(14.52) 3786(10.57) 1679(4.69)
TSBP 23101(64.50) 2773(7.74) 5739(16.02) 2964(8.28) 1241(3.46)
TSFC1 21840(60.97) 2298(6.42) 5296(14.79) 4505(12.58) 1879(5.25)
TSFC2 23561(65.78) 2658(7.42) 5047(14.09) 3081(8.60) 1471(4.11)
TSFC3 23693(66.15) 2395(6.69) 5062(14.13) 3184(8.89) 1484(4.14)
TSFP1 23276(64.98) 2732(7.63) 5355(14.95) 3014(8.41) 1441(4.02)
TSFP2 24445(68.25) 2825(7.89) 4806(13.42) 2597(7.25) 1145(3.20)
TSFP3 24571(68.60) 3080(8.60) 4923(13.74) 2166(6.05) 1078(3.01)
TSNL1 24162(67.46) 2932(8.19) 4956(13.84) 2514(7.02) 1254(3.50)
TSNL2 24347(67.97) 3052(8.52) 4948(13.81) 2311(6.45) 1160(3.24)
TSNL3 24544(68.52) 3271(9.13) 4591(12.82) 2197(6.13) 1215(3.39)
2.3 差异表达基因分析

2.3.1 人肝癌差异表达基因: 在人的组织标本中, 样品间基因表达相关系数均>0.8(图1A), 整体FPKM层次聚类图分析表明人肝癌、癌旁和正常肝组织间的差异表达基因分布情况(图1B). 火山图分析表明人肝癌、癌旁和正常肝组织间有统计学意义的差异表达基因分布情况. 与相应的癌旁组织相比, 人肝癌组织的差异表达基因有100个, 其中上调14个、下调86个(图1C); 与人正常肝组织相比, 人肝癌组织的差异表达基因有272个, 其中上调90个、下调182个(图1D); 与相应的癌旁和人正常肝组织相比, 人肝癌组织的差异表达基因有68个(图1E), 其中上调14个、下调54个.

图1
图1 人肝癌差异表达基因. A: 人肝癌、癌旁和人正常肝组织中表达的基因之间的相关性; B: 整体FPKM层次聚类图. 以log10(FPKM+1)值进行聚类, 红色表示高表达基因, 蓝色表示低表达基因. 颜色从红到蓝, 表示log10(FPKM+1)从大到小; C, D: 差异表达基因火山图. 红点: 筛选出的有统计学意义的差异表达上调基因, 绿点: 筛选出的有统计学意义的下调差异表达基因, 蓝点: 无显著统计学意义的差异表达基因; E: 与相应的人癌旁组织及人正常肝组织相比, 人肝癌差异表达基因. R2: Pearson相关系数. HUC1、2、3为人肝癌组织标本, HUP1、2、3为相应的人肝癌癌旁组织, HUNL1、2、3为人正常肝组织标本; TSBC为HBV诱发的树鼩肝癌组织, TSBP为相应树鼩癌旁组织, TSFC1、2、3为AFB1诱发的树鼩肝癌组织, TSFP1、2、3为相应的树鼩癌旁组织, TSNL1、2、3为树鼩正常肝组织.

2.3.2 树鼩肝癌差异表达基因: 在树鼩组织标本中, 样品间基因表达相关系数均>0.8(图2A), 整体FPKM层次聚类图分析表明树鼩肝癌、癌旁和树鼩正常肝组织间的差异表达基因分布情况(图2B). 火山图分析表明树鼩肝癌、癌旁和树鼩正常肝组织间有统计学意义的差异表达基因分布情况. 经对比, 与相应的癌旁组织相比, HBV致癌的树鼩肝癌差异表达基因为2717个, 其中上调1702个、下调1015个(图2C); 与树鼩正常肝组织相比, HBV诱发的树鼩肝癌组织中的差异表达基因为400个, 其中上调252个、下调148个(图2D); 另一方面, 与相应的癌旁组织相比, AFB1诱发的树鼩肝癌差异表达基因为30个, 均为下调(图2E); 与树鼩正常肝组织相比, AFB1致癌的树鼩肝癌差异表达基因为203个, 其中上调26个、下调177个(图2F); 同时与相应的癌旁和正常肝组织相比, HBV诱发的树鼩肝癌组织中的差异表达基因有314个, 其中上调203个、下调111个(图2G). 与相应的癌旁组织和树鼩正常肝组织相比, AFB1致癌的树鼩肝癌差异表达基因有20个, 均为下调(图2H). 而将HBV及AFB1诱发的树鼩肝癌差异表达因子进行对比, 发现这两种致癌因素所致的树鼩肝癌共同差异表达基因共11个, 均为下调(图2I).

图2
图2 树鼩肝癌差异表达基因. A: 树鼩肝癌、癌旁和树鼩正常肝组织中表达的基因之间的相关性; B: 整体FPKM层次聚类图. 以log10(FPKM+1)值进行聚类, 红色表示高表达基因, 蓝色表示低表达基因. 颜色从红到蓝, 表示log10(FPKM+1)从大到小; C-F: 差异表达基因火山图. 红点: 筛选出的有统计学意义的差异表达上调基因, 绿点: 筛选出的有统计学意义的下调差异表达基因, 蓝点: 无显著统计学意义的差异表达基因; G: 与相应的树鼩癌旁组织及树鼩正常肝组织相比, HBV树鼩肝癌差异表达基因; H: 与相应的树鼩癌旁组织及树鼩正常肝组织相比, AFB1树鼩肝癌差异表达基因; I: HBV和AFB1致癌的树鼩肝癌共同差异表达基因. R2: Pearson相关系数. HUC1、2、3为人肝癌组织标本, HUP1、2、3为相应的人肝癌癌旁组织, HUNL1、2、3为人正常肝组织标本; TSBC为HBV诱发的树鼩肝癌组织, TSBP为相应树鼩癌旁组织, TSFC1、2、3为AFB1诱发的树鼩肝癌组织, TSFP1、2、3为相应的树鼩癌旁组织, TSNL1、2、3为树鼩正常肝组织.

2.3.3 人肝癌组织和两种不同因素诱发的树鼩肝癌组织的共同差异表达基因: 经对比发现跨种属、跨病因的肝癌差异表达基因共有2个(图3), 分别为载脂蛋白F(apolipoprotein F, APOF)和胰岛素样生长因子酸不稳定亚基(insulin-like growth factor binding protein, acid labile subunit, IGFALS). 其在肝癌组织中的差异表达方式均为下调. 两者测序中的reads数如表4.

图3
图3 跨种属、跨病因的肝癌差异表达基因.
表4 差异表达基因的reads数.
基因APOFIGFALS
HUC1694 28
HUC2450 258
HUC3153 47
HUP11928 2839
HUP22619 1319
HUP32657 2292
HUNL14383 2760
HUNL24439 1769
HUNL33960 3006
TSBC22 22
TSBP473 605
TSFC135 46
TSFC28243
TSFC3335
TSFP1579559
TSFP2295215
TSFP3299414
TSNL12143922
TSNL22121934
TSNL310182318
3 讨论

本课题组在早期研究中发现不同因素诱发的树鼩肝癌的基因表达谱存在一些相同改变[21,24], 随后在此基础上提出人和其他动物肝癌共同拥有的基因改变可能是影响肝癌发生发展的关键因子以及跨种属的肿瘤基因筛选策略[17], 并应用这一策略发现和研究了表皮型脂肪酸结合蛋白(E-FABP), 认为其可能在肝癌的发生发展过程中起重要作用[18,19]. 近年来, 跨物种研究策略在肿瘤相关研究中已经得到广泛的应用[25-28].

RNA-Seq是近年兴起的一项新技术. 与芯片相比, RNA-Seq可进行全基因组水平的基因表达差异研究, 具有定量更准确、可重复性更高、检测范围更广、分析更可靠等特点. 其提供的是目标区域的序列读取计数, 而非芯片那样仅能提供间接的, 模拟的信号[29]. 由于不同物种的基因表达可能存在一些差异, RNA-Seq能够更加直接的对不同物种的同一基因进行比较, 因而更适合于本研究中的跨种属分析. 已经有学者将RNA-Seq技术用于跨种属的研究中[30-34].

基于上述研究策略和分子生物学技术的高速发展, 本研究应用RNA-Seq进行跨种属、跨病因地筛选影响肝癌发生发展的关键基因, 初步结果显示的2个候选基因为APOFIGFALS.

APOF被认为是转脂蛋白抑制剂[35], 主要功能为抑制胆固醇酯转移蛋白的活性, 在脂质代谢中发挥重要作用[36], 与胆固醇逆向转运[37]、高脂血症[38]、动脉粥样硬化[39]等病变关系密切, 却至今罕有与肿瘤相关的报道. 本研究结果显示APOF可能与肝癌的发生发展有关, 这一新的发现可能会给肝癌防治相关研究带来新的线索.

胰岛素样生长因子(insulin-like growth factors, IGFs)的半衰期非常短, 不足以维持其到达靶器官发挥作用. IGFALS具有通过与IGFs及胰岛素样生长因子结合蛋白-3/5(insulin-like growth factor binding protein-3/5, IGFBP-3/5)(IGFs-IGFBP-3/5)结合形成异源三聚体复合物从而延长IGFs在血液中半衰期的功能[40], 是小鼠血清中IGF-1和IGFBP-3累积的必要条件[41]. 此外, 已有一些研究表明IGFALS与肝癌或肿瘤的发生发展有关, 如Gu等[42]2010年报道IGFALS通过调节循环中IGF-1和IGFBP-3的水平而与前列腺癌和乳腺癌的发生危险性相关, Neumann等[43]2012年报道的研究发现IGFALS在肝癌中是肿瘤抑制因子, Marquardt等[44]随后也于2014年报道发现IGFALS在肝癌中表达下调. 这些结果与本研究结果相符, 提示该基因值得进一步、多方面的研究探讨.

总之, 本研究运用了新技术RNA-Seq对肝癌差异表达基因进行了跨种属、跨病因筛选, 初步定位出候选的肝癌关键基因APOF和IGFALS. 下一步, 一方面我们将对这些候选基因进行表达验证及体内外功能验证, 另一方面还将通过增加筛选的标本量、与时俱进地应用新技术和新数据库等资源进行更大范围的筛选, 以期通过推动肝癌关键基因的定位来揭示肝癌发生发展的机制及防治手段.

评论
背景资料

肝细胞癌是世界第五大恶性肿瘤, 我国则是肝癌重灾区, 发病率和死亡率均居亚洲之首. 肝癌的分子发病机制极其复杂, 迄今被报道的海量肝癌相关基因罕有被一致认可者. 这一局面向大家调整肝癌研究策略提出了新的课题.

同行评议者

王友亮, 副研究员, 中国人民解放军军事医学科学院生物工程研究所; 李成刚, 副教授, 副主任医师, 解放军总医院肿瘤外二科

研发前沿

全转录组测序(RNA sequencing, RNA-Seq)技术为肿瘤研究提供了强大的新平台, 而跨种属与跨病因肿瘤研究策略国内除作者所在课题组外尚少见这方面的相关报道. 本研究首次将RNA-Seq技术, 与跨种属、跨病因的研究策略相结合, 其可能在人类战胜肿瘤的进程中有所作为.

创新盘点

本文基于RNA-Seq这一新的技术, 同时运用跨种属、跨病因筛选策略初步筛选出肝癌关键基因载脂蛋白F(apolipoprotein F, APOF)和人胰岛素样生长因子酸不稳定亚基(insulin-like growth factor binding protein, acid labile subunit, IGFALS). 目前国内外均尚未见与本文报道相似的研究路线及结果.

应用要点

本文不仅提示了APOFIGFALS有可能是肝癌发生发展的关键基因, 同时, 本研究涉及的这种将RNA-Seq技术与跨种属、跨病因筛选策略相结合的研究肝癌差异表达基因的方法, 或可为肿瘤相关研究提供新的思路和线索.

名词解释

RNA-Seq: 即转录组测序技术, 就是把mRNA, small RNA, NONcoding RNA等或者其中一些用高通量测序技术把他们的序列测出来, 反映出他们的表达水平; 跨种属、跨病因肝癌差异表达基因: 是指通过比较2个以上的物种, 2种以上的诱癌病因在肝癌基因表达谱间的相似改变.

同行评价

本文基于RNA-Seq技术, 结合跨种属跨病因筛选策略, 初步发现APOF和IGFALS在肝癌中均下调, 提示APOF和IGFALS有可能在肝癌发生发展过程中发挥重要作用, 选题新颖, 技术新, 结果可靠, 具有较好的研究前景, 也有一定的临床意义.

编辑:于明茜 电编:都珍珍

1.  Wachsmann J, Peng F. Molecular imaging and therapy targeting copper metabolism in hepatocellular carcinoma. World J Gastroenterol. 2016;22:221-231.  [PubMed]  [DOI]
2.  Siegel RL, Miller KD, Jemal A. Cancer statistics, 2016. CA Cancer J Clin. 2016;66:7-30.  [PubMed]  [DOI]
3.  Ma L, Chua MS, Andrisani O, So S. Epigenetics in hepatocellular carcinoma: an update and future therapy perspectives. World J Gastroenterol. 2014;20:333-345.  [PubMed]  [DOI]
4.  Lin H, van den Esschert J, Liu C, van Gulik TM. Systematic review of hepatocellular adenoma in China and other regions. J Gastroenterol Hepatol. 2011;26:28-35.  [PubMed]  [DOI]
5.  Wang Z, Gerstein M, Snyder M. RNA-Seq: a revolutionary tool for transcriptomics. Nat Rev Genet. 2009;10:57-63.  [PubMed]  [DOI]
6.  Mutz KO, Heilkenbrinker A, Lönne M, Walter JG, Stahl F. Transcriptome analysis using next-generation sequencing. Curr Opin Biotechnol. 2013;24:22-30.  [PubMed]  [DOI]
7.  Mantione KJ, Kream RM, Kuzelova H, Ptacek R, Raboch J, Samuel JM, Stefano GB. Comparing bioinformatic gene expression profiling methods: microarray and RNA-Seq. Med Sci Monit Basic Res. 2014;20:138-142.  [PubMed]  [DOI]
8.  Mansouri L, Gunnarsson R, Sutton LA, Ameur A, Hooper SD, Mayrhofer M, Juliusson G, Isaksson A, Gyllensten U, Rosenquist R. Next generation RNA-sequencing in prognostic subsets of chronic lymphocytic leukemia. Am J Hematol. 2012;87:737-740.  [PubMed]  [DOI]
9.  Lee CS, Ungewickell A, Bhaduri A, Qu K, Webster DE, Armstrong R, Weng WK, Aros CJ, Mah A, Chen RO. Transcriptome sequencing in Sezary syndrome identifies Sezary cell and mycosis fungoides-associated lncRNAs and novel transcripts. Blood. 2012;120:3288-3297.  [PubMed]  [DOI]
10.  Zhang XM, Ma ZW, Wang Q, Wang JN, Yang JW, Li XD, Li H, Men TY. A new RNA-seq method to detect the transcription and non-coding RNA in prostate cancer. Pathol Oncol Res. 2014;20:43-50.  [PubMed]  [DOI]
11.  Zhai W, Yao XD, Xu YF, Peng B, Zhang HM, Liu M, Huang JH, Wang GC, Zheng JH. Transcriptome profiling of prostate tumor and matched normal samples by RNA-Seq. Eur Rev Med Pharmacol Sci. 2014;18:1354-1360.  [PubMed]  [DOI]
12.  Wu Y, Wang X, Wu F, Huang R, Xue F, Liang G, Tao M, Cai P, Huang Y. Transcriptome profiling of the cancer, adjacent non-tumor and distant normal tissues from a colorectal cancer patient by deep sequencing. PLoS One. 2012;7:e41001.  [PubMed]  [DOI]
13.  Zhuang X, Herbert JM, Lodhia P, Bradford J, Turner AM, Newby PM, Thickett D, Naidu U, Blakey D, Barry S. Identification of novel vascular targets in lung cancer. Br J Cancer. 2015;112:485-494.  [PubMed]  [DOI]
14.  Stephens PJ, Tarpey PS, Davies H, Van Loo P, Greenman C, Wedge DC, Nik-Zainal S, Martin S, Varela I, Bignell GR. The landscape of cancer genes and mutational processes in breast cancer. Nature. 2012;486:400-404.  [PubMed]  [DOI]
15.  Cohen S, Mosig R, Moshier E, Pereira E, Rahaman J, Prasad-Hayes M, Halpert R, Billaud JN, Dottino P, Martignetti JA. Interferon regulatory factor 1 is an independent predictor of platinum resistance and survival in high-grade serous ovarian carcinoma. Gynecol Oncol. 2014;134:591-598.  [PubMed]  [DOI]
16.  Peng G, Dan W, Jun W, Junjun Y, Tong R, Baoli Z, Yang X. Transcriptome profiling of the cancer and adjacent nontumor tissues from cervical squamous cell carcinoma patients by RNA sequencing. Tumour Biol. 2015;36:3309-3317.  [PubMed]  [DOI]
17.  史 俊林, 李 瑗. 应用跨种属肿瘤基因筛选策略探寻肿瘤关键分子. 世界华人消化杂志. 2010;18:1255-1260.  [PubMed]  [DOI]
18.  史 俊林, 曹 骥, 苏 建家, 杨 春, 欧 超, 汪 多平, 李 瑗. 表皮型脂肪酸结合蛋白在跨种属肝癌组织中的表达. 中华肝脏病杂志. 2012;20:270-274.  [PubMed]  [DOI]
19.  史 俊林, 曹 骥, 苏 建家, 杨 春, 欧 超, 汪 多平, 李 瑗. 表皮型脂肪酸结合蛋白在不同种属肝癌组织中的高表达及其临床意义. 世界华人消化杂志. 2013;21:963-969.  [PubMed]  [DOI]
20.  Yang C, Ruan P, Ou C, Su J, Cao J, Luo C, Tang Y, Wang Q, Qin H, Sun W. Chronic hepatitis B virus infection and occurrence of hepatocellular carcinoma in tree shrews (Tupaia belangeri chinensis). Virol J. 2015;12:26.  [PubMed]  [DOI]
21.  Li Y, Wan DF, Su JJ, Cao J, Ou C, Qiu XK, Ban KC, Yang C, Qin LL, Luo D. Differential expression of genes during aflatoxin B(1)-induced hepatocarcinogenesis in tree shrews. World J Gastroenterol. 2004;10:497-504.  [PubMed]  [DOI]
22.  Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B. Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nat Methods. 2008;5:621-628.  [PubMed]  [DOI]
23.  Anders S, Huber W. Differential expression analysis for sequence count data. Genome Biol. 2010;11:R106.  [PubMed]  [DOI]
24.  Li Y, Su JJ, Cao J, Ou C, Qiu XK, Yang C, Ban KC, Yue HF, Wei W, Ou SJ. [Differentially expressed genes in hepatocellular carcinoma of tree shrew induced by different factors]. Ai Zheng. 2003;22:1018-1022.  [PubMed]  [DOI]
25.  Caulin AF, Graham TA, Wang LS, Maley CC. Solutions to Peto's paradox revealed by mathematical modelling and cross-species cancer gene analysis. Philos Trans R Soc Lond B Biol Sci. 2015;370.  [PubMed]  [DOI]
26.  White RM. Cross-species oncogenomics using zebrafish models of cancer. Curr Opin Genet Dev. 2015;30:73-79.  [PubMed]  [DOI]
27.  van der Weyden L, Patton EE, Wood GA, Foote AK, Brenn T, Arends MJ, Adams DJ. Cross-species models of human melanoma. J Pathol. 2016;238:152-165.  [PubMed]  [DOI]
28.  Tong Y, Merino D, Nimmervoll B, Gupta K, Wang YD, Finkelstein D, Dalton J, Ellison DW, Ma X, Zhang J. Cross-Species Genomics Identifies TAF12, NFYC, and RAD54L as Choroid Plexus Carcinoma Oncogenes. Cancer Cell. 2015;27:712-727.  [PubMed]  [DOI]
29.  Raz T, Kapranov P, Lipson D, Letovsky S, Milos PM, Thompson JF. Protocol dependence of sequencing-based gene expression measurements. PLoS One. 2011;6:e19287.  [PubMed]  [DOI]
30.  Zhu Y, Li M, Sousa AM, Sestan N. XSAnno: a framework for building ortholog models in cross-species transcriptome comparisons. BMC Genomics. 2014;15:343.  [PubMed]  [DOI]
31.  LoVerso PR, Cui F. A Computational Pipeline for Cross-Species Analysis of RNA-seq Data Using R and Bioconductor. Bioinform Biol Insights. 2015;9:165-174.  [PubMed]  [DOI]
32.  LoVerso PR, Wachter CM, Cui F. Cross-species Transcriptomic Comparison of In Vitro and In Vivo Mammalian Neural Cells. Bioinform Biol Insights. 2015;9:153-164.  [PubMed]  [DOI]
33.  Jiang Z, Dong H, Zheng X, Marjani SL, Donovan DM, Chen J, Tian XC. mRNA Levels of Imprinted Genes in Bovine In Vivo Oocytes, Embryos and Cross Species Comparisons with Humans, Mice and Pigs. Sci Rep. 2015;5:17898.  [PubMed]  [DOI]
34.  Lamanna F, Kirschbaum F, Waurick I, Dieterich C, Tiedemann R. Cross-tissue and cross-species analysis of gene expression in skeletal muscle and electric organ of African weakly-electric fish (Teleostei; Mormyridae). BMC Genomics. 2015;16:668.  [PubMed]  [DOI]
35.  Wang X, Driscoll DM, Morton RE. Molecular cloning and expression of lipid transfer inhibitor protein reveals its identity with apolipoprotein F. J Biol Chem. 1999;274:1814-1820.  [PubMed]  [DOI]
36.  Shen XB, Huang L, Zhang SH, Wang DP, Wu YL, Chen WN, Xu SH, Lin X. Transcriptional regulation of the apolipoprotein F (ApoF) gene by ETS and C/EBPα in hepatoma cells. Biochimie. 2015;112:1-9.  [PubMed]  [DOI]
37.  Vlachová M, Heczková M, Jirsa M, Poledne R, Kovář J. The response of hepatic transcriptome to dietary cholesterol in Prague hereditary hypercholesterolemic (PHHC) rat. Physiol Res. 2014;63 Suppl 3:S429-S437.  [PubMed]  [DOI]
38.  Morton RE, Nunes V, Izem L, Quintão E. Markedly elevated lipid transfer inhibitor protein in hypercholesterolemic subjects is mitigated by plasma triglyceride levels. Arterioscler Thromb Vasc Biol. 2001;21:1642-1649.  [PubMed]  [DOI]
39.  Lagor WR, Fields DW, Bauer RC, Crawford A, Abt MC, Artis D, Wherry EJ, Rader DJ. Genetic manipulation of the ApoF/Stat2 locus supports an important role for type I interferon signaling in atherosclerosis. Atherosclerosis. 2014;233:234-241.  [PubMed]  [DOI]
40.  Domené HM, Hwa V, Argente J, Wit JM, Camacho-Hübner C, Jasper HG, Pozo J, van Duyvenvoorde HA, Yakar S, Fofanova-Gambetti OV. Human acid-labile subunit deficiency: clinical, endocrine and metabolic consequences. Horm Res. 2009;72:129-141.  [PubMed]  [DOI]
41.  Ueki I, Ooi GT, Tremblay ML, Hurst KR, Bach LA, Boisclair YR. Inactivation of the acid labile subunit gene in mice results in mild retardation of postnatal growth despite profound disruptions in the circulating insulin-like growth factor system. Proc Natl Acad Sci U S A. 2000;97:6868-6873.  [PubMed]  [DOI]
42.  Gu F, Schumacher FR, Canzian F, Allen NE, Albanes D, Berg CD, Berndt SI, Boeing H, Bueno-de-Mesquita HB, Buring JE. Eighteen insulin-like growth factor pathway genes, circulating levels of IGF-I and its binding protein, and risk of prostate and breast cancer. Cancer Epidemiol Biomarkers Prev. 2010;19:2877-2887.  [PubMed]  [DOI]
43.  Neumann O, Kesselmeier M, Geffers R, Pellegrino R, Radlwimmer B, Hoffmann K, Ehemann V, Schemmer P, Schirmacher P, Lorenzo Bermejo J. Methylome analysis and integrative profiling of human HCCs identify novel protumorigenic factors. Hepatology. 2012;56:1817-1827.  [PubMed]  [DOI]
44.  Marquardt JU, Seo D, Andersen JB, Gillen MC, Kim MS, Conner EA, Galle PR, Factor VM, Park YN, Thorgeirsson SS. Sequential transcriptome analysis of human liver cancer indicates late stage acquisition of malignant traits. J Hepatol. 2014;60:346-353.  [PubMed]  [DOI]