Copyright
©The Author(s) 2004. Published by Baishideng Publishing Group Inc. All rights reserved.
小鼠和大鼠NS5ATP4同源基因序列的生物信息学分析
成军, 杨倩, 刘妍, 王建军, 纪冬
成军, 杨倩, 刘妍, 王建军, 纪冬, 中国人民解放军第302医院传染病研究所基因治疗研究中心、全军病毒性肝炎防治研究重点实验室 北京市 100039
成军, 男, 1963-08-17生, 山东省淄博市人, 汉族. 1994年北京医科大学传染病学博士, 1994年美国得克萨斯大学健康科学中心临床免疫与传染病科完成博士后. 教授, 主任医师, 博士生导师, 出版专著5部, 发表论文400篇. 学会传染病与寄生虫病学分会副主任委员.
ORCID number: $[AuthorORCIDs]
基金项目: 国家自然科学基金攻关项目, No. C03011402, No. C30070689, No. C39970674, No. C30371288; 军队"九、五"科技攻关项目, No. 98D063; 军队回国留学人员启动基金项目, No. 98H038; 军队"十、五"科技攻关青年基金项目, No. 01Q138; 军队"十、五"科技攻关面上项目, No. 01MB135.
通讯作者: 成军, 100039, 北京市西四环中路100号, 中国人民解放军第302医院传染病研究所基因治疗研究中心、全军病毒性肝炎防治研究重点实验室. cj@genetherapy.com.cn
电话: 010-66933391 传真: 010-63801283
收稿日期: 2004-02-03
修回日期: 2004-03-10
接受日期: 2004-05-11
在线出版日期: 2004-07-15
目的: 克隆、鉴定、分析小鼠和大鼠NS5ATP4基因序列, 确定编码产物序列, 并对于其与人的NS5ATP4基因及其编码产物的序列的同源性进行分析.
方法: 利用基因芯片技术获得了人NS5ATP4的cDNA序列, 利用生物信息学技术确定小鼠、大鼠的NS5ATP4的基因及其编码产物的序列, 并对于其同源性进行生物信息学分析.
结果: 利用生物信息学技术确定了小鼠和大鼠的NS5ATP4的基因及其编码产物的序列, 小鼠和大鼠的NS5ATP4编码基因区分别由762和756个核苷酸(nt)组成. 编码产物分别由263和261个氨基酸残基(aa)组成. 与人NS5ATP4基因和蛋白质一级结构序列的同源性分别为90.29%, 84.25%和95.65%, 86.96%.
结论: 应用生物信息学技术确定了小鼠和大鼠的NS5ATP4的基因及编码产物的序列.
关键词: N/A
引文著录: 成军, 杨倩, 刘妍, 王建军, 纪冬. 小鼠和大鼠NS5ATP4同源基因序列的生物信息学分析. 世界华人消化杂志 2004; 12(7): 1582-1587
Identification and analysis of murine and rat homologous gene to human NS5ATP4 by bioinformatics method
Jun Cheng, Qian Yang, Yan Liu, Jian-Jun Wang, Dong Ji
Jun Cheng, Qian Yang, Yan Liu, Jian-Jun Wang, Dong Ji, Gene Therapy Research Center, Institute of Infectious Diseases, The 302 Hospital of Chinese PLA, Beijing 100039, China
Supported by: the National Natural Science Foundation of China, No. C03011402, No.C30070689, No. C39970674, No.C30371288, and Returned Scholarship of General Logistics Department of PLA, No. 98H038.
Correspondence to: Dr. Jun Cheng, Gene Therapy Research Center, Institute of Infectious Diseases, the 302 Hospital of PLA, 100 Xisihuanzhong Road, Beijing 100039, China. cj@genetherapy.com.cn
Received: February 3, 2004
Revised: March 10, 2004
Accepted: May 11, 2004
Published online: July 15, 2004
0 引言
病毒性肝炎的发病机制, 就是肝炎病毒与肝细胞生物大分子之间相互作用的过程和结果[1-3]. 丙型肝炎病毒(HCV)感染肝细胞之后, HCV的复制和表达过程, 即HCV的生活周期的完成, 需要有肝细胞生物大分子的参与与配合, 这是HCV等肝炎病毒相对嗜肝特性的分子生物学基础. 然而, 肝炎病毒与肝细胞之间相互作用的性质属于双向性的, 不仅肝细胞对于肝炎病毒的生活周期有影响, 肝炎病毒对于肝细胞正常的功能也产生显著的影响[4-6]. 因此, 探索HCV对于肝细胞的影响及其机制也十分重要. HCV表达出各种各样的病毒蛋白, 通过直接或间接途径, 更多的是通过间接途径, 对于肝细胞正常的信号转导通路产生影响, 最终改变肝细胞的基因表达谱和表达水平, 这是HCV引起慢性肝炎、肝硬化、肝细胞癌(HCC)的重要的分子生物学机制所在[7-10]. 我们曾经应用抑制性消减杂交技术、基因表达谱芯片技术, 研究了HCV各种病毒蛋白对肝细胞基因表达谱的影响, 发现HCV非结构蛋白5A反式激活基因4(NS5ATP4)基因并进行克隆化[11]. 为了阐明不同生物种属来源的基因的结构关系, 我们利用生物信息学(bioinformatics)技术对于小鼠和大鼠的NS5ATP4基因序列进行鉴定和分析.
1 材料和方法
人的NS5ATP4的基因克隆化, 是通过构建HCV NS5A表达载体, 利用基因芯片技术筛选NS5A蛋白表达时, 反式调节的新型靶基因的克隆化完成的, 具体见文献[11]. 以人NS5ATP4的cDNA基因序列作为参照, 应用BLASTn检索途径, 对于美国国立卫生研究院(NIH)国立医学图书馆(NLM)生物工程学中心(NCBI)建立的核苷酸序列数据库(GenBank)进行同源基因序列的搜索, 获得来源于小鼠和大鼠的同源基因序列[12-15]. 将人、小鼠、大鼠NS5ATP4基因的的序列进行比较, 获得同源性的数据.将人、小鼠、大鼠NS5ATP4蛋白质一级结构序列的序列进行比较, 获得同源性的数据.
2 结果
利用GenBank同源基因序列的搜索功能, 以人的NS5ATP4作为参照, 寻找并获得小鼠来源的基因序列, 并命名为小鼠NS5ATP4, 小鼠NS5ATP4编码基因由762 nt组成, 编码产物由253 aa. 小鼠NS5ATP4基因序列在GenBank中注册, 登录号为: AY533135(图1). 利用GenBank同源基因序列的搜索功能, 以人的NS5ATP4作为参照, 寻找并获得大鼠来源的基因序列, 并命名为大鼠NS5ATP4, 大鼠NS5ATP4编码基因由756 nt组成, 编码产物由251 aa组成. 大鼠NS5ATP4基因序列在GenBank中注册, 登录号为: AY533136(图2). 将人、小鼠、大鼠的NS5ATP4基因核苷酸序列进行同源性比较, 人NS5ATP4基因和小鼠NS5ATP4基因同源性为90.29%(74/762); 人NS5ATP4基因和大鼠NS5ATP4基因同源性为84.25%(120/762图3). 将人、小鼠、大鼠的NS5ATP4蛋白质一级结构序列进行同源性比较, 人NS5ATP4和小鼠NS5ATP4氨基酸残基序列的同源性为95.65%(11/253); 人NS5ATP4和大鼠NS5ATP4氨基酸残基序列的同源性为86.96%(33/253图4).
图1 小鼠NS5ATP4基因序列及其编码产物的一级结构序列.
图2 大鼠NS5ATP4基因序列及其编码产物的一级结构序列.
图3 人、小鼠、大鼠NS5ATP4基因序列的比较.
"x"-缺失核苷酸; "-"-相同核苷酸.
图4 人、小鼠、大鼠NS5ATP4蛋白质序列的比较.
"x"-缺失氨基酸残基; "-"-相同氨基酸残基.
3 讨论
生物信息学的出现, 改变了单纯的分子克隆技术在发现新基因中的独一无二的地位, 使得目前基因克隆化的技术进入到分子克隆技术和生物学信息技术并存的状态[16-26]. 随着数据库技术及其分析技术的不断进步, 生物信息学技术在分子生物学领域中的地位和作用日益受到重视. 生物信息学技术正处在一个快速发展的阶段, 一些生物信息学分析技术已经十分成熟, 一些分析技术则处在不断的完善之中. 例如不同种属生物核苷酸序列同源性的分析技术就已经相对成熟, 这种核苷酸序列的同源性比对分析, 不仅可以明确来源于不同生物的同一基因的核苷酸序列的同源性, 及其结构的一些特点, 而且也可以用来在核苷酸序列数据库中进行数据的发掘, 发现新的基因. 因为在基因组计划中, 世界上许多重要的实验室, 构建了一系列的不同生物种属的cDNA文库和基因组DNA文库, 对于不同来源的文库进行了序列测定, 这些序列构成了目前核苷酸序列数据库的一个组成部分. 这一部分文库的序列测定工作, 还必须结合其他的分子生物学分析和研究结果, 才能阐明编码基因序列及其产物的生物学功能. 因此, 在目前的核苷酸序列的数据库中还有很多发现新基因的机会. 我们应用抑制性消减杂交技术和表达谱及因芯片技术, 寻找HCV NS5A蛋白的反式激活新基因, 首先克隆了人的NS5ATP4基因[11], 为了比较来源于不同种属生物的NS5ATP4基因序列的结构特点, 我们利用生物信息学技术克隆了小鼠和大鼠NS5ATP4基因序列, 并在GenBank中进行注册. 小鼠和大鼠NS5ATP4基因的克隆和鉴定, 再一次证明了生物信息学技术在新基因的发现和鉴定中的独特的作用和地位[27-36]. 本结果表明, 不同种属生物的NS5ATP4的序列和结构是存在一定差别的. 首先从基因的长度来说就存在差别, 人、小鼠、大鼠NS5ATP4的cDNA序列长度分别为762 nt、762 nt、756 nt, 人与小鼠、大鼠NS5ATP4的cDNA序列的同源性分别为90.29%和84.25%. 从其结构来说, 在NS5ATP4分子结构中还存在一些位点的插入和缺失的位点.
人NS5ATP4的基因是肝细胞中存在的一种新的基因, 其结构和功能、表达与调控、分子生物学意义及其医学意义目前还不十分清楚, 目前只知道这种NS5ATP4是HCV NS5A蛋白的反式激活新基因, 但是具体的还需要进行细致的研究. 我们曾经利用基因表达谱芯片技术对于NS5ATP4的反式调节基因类型进行筛选, 在1 152个候选基因序列中, 发现12种基因的表达水平显著上调, 6种基因的表达水平显著下调[37]. 这些基因包括细胞生长、细胞凋亡、信号转导、免疫调节、肿瘤发生等基因, 如: 细胞色素P450, 肝细胞生长因子(HGF)激活因子, 谷胱甘肽过氧化酶1, 肿瘤抑制亚转移物候选物1. CD95 (CD95/APO-1) 受体/CD95配体(CD95L)是调节不同细胞凋亡的关键信号转导系统. 表达水平上调的基因谷胱甘肽过氧化酶1能够阻断CD95诱导的凋亡, 保护细胞免受过氧化作用诱发的凋亡[38-42]. 表达水平上调的基因富含半胱氨酸的血管生成诱导因子(CYR61)是生长调节因子家族成员之一, 能够与细胞外基质、细胞表面受体结合促进细胞生长、迁移. 研究者发现CYR61能够通过激活MAPK和Akt信号传导途径, 诱导胸壁肿瘤的形成及肿瘤血管化. 研究者亦发现CYR61是整合素受体的配体之一, 当配体与整合素受体结合可以介导细胞内外的信号传导, 从而激活5种与血管化有关的反应, 包括: 上皮细胞的黏附、迁移、增生、存活、血管化[43-50]. 在下调表达的基因中, 转胶质蛋白2(transgelin 2)的缺失与肿瘤的发生密切相关. 但是关于NS5ATP4的深入研究还有待于进一步进行.