Copyright
©The Author(s) 2004. Published by Baishideng Publishing Group Inc. All rights reserved.
HBV前-S1蛋白结合蛋白大鼠同源基因的克隆化
成军, 董菁, 张健, 王建军, 纪冬, 刘妍, 钟彦伟, 王琳
成军, 董菁, 张健, 王建军, 纪冬, 刘妍, 钟彦伟, 王琳, 中国人民解放军第302医院传染病研究所基因治疗研究中心 北京市 100039
成军, 男, 1963-08-17生, 山东省淄博市人, 汉族. 1994年北京医科大学传染病学博士, 1994年美国得克萨斯大学健康科学中心临床免疫与传染病科博士后. 教授, 主任医师, 博士生导师, 出版专著5部, 发表论文400篇. 中华医学会传染病与寄生虫病学分会副主任委员.
ORCID number: $[AuthorORCIDs]
基金项目: 国家自然科学基金攻关项目, No. C03011402, No. C30070689, No. C39970674, No. C30371288; 军队九五科技攻关项目, No. 98D063; 军队回国留学人员启动基金项目, No. 98H038; 军队十五科技攻关青年基金项目, No. 01Q138; 军队十五科技攻关项目, No. 01MB135.
通讯作者: 成军, 100039, 北京市西四环中路100号, 中国人民解放军第302医院传染病研究所基因治疗研究中心、全军病毒性肝炎防治研究重点实验室. cj@genetherapy.com.cn
电话: 010-66933391 传真: 010-63801283
收稿日期: 2004-02-14
修回日期: 2004-04-10
接受日期: 2004-05-11
在线出版日期: 2004-07-15
目的: 利用生物信息学(bioinformatics)技术克隆, 鉴定人HBsAg前-S1蛋白结合蛋白(PS1BP)编码基因的同源基因.
方法: 人PS1BP由表达型cDNA文库的噬菌体展示技术筛选获得. 以人的PS1BP的cDNA序列作为参照, 对于美国国立卫生研究院(NIH)国立医学图书馆(NLM)生物工程信息学研究中心(NCBI)建立的核苷酸序列数据库GenBank, 利用同源基因序列比对的在线分析软件BLASTn进行同源基因序列的比对, 发现新的来源于大鼠的同源基因. 确定大鼠PS1BP的cDNA序列之后, 对于大鼠PS1BP蛋白质一级结构序列与人和小鼠的PS1BP蛋白质一级结构序列的同源性进行分析. 利用在线分析软件, 对于大鼠PS1BP一级结构序列中潜在的修饰和功能位点进行初步的预测分析.
结果: 利用噬菌体展示技术获得了人的PS1BP的cDNA序列. 以生物信息学技术确定了大鼠PS1BP的cDNA及其编码产物的序列. 大鼠PS1BP的cDNA由1 455 nt组成, 编码产物由484 aa组成. 大鼠PS1BP蛋白质一级结构与人和小鼠PS1BP蛋白质一级结构的同源性分别为80.79%(391/484)和92.98%(450/484). 利用在线分析软件, 在大鼠PS1BP蛋白质一级结构中还发现了一系列潜在的蛋白质修饰结构位点.
结论: 大鼠PS1BP基因及其编码产物序列被确定.
关键词: N/A
引文著录: 成军, 董菁, 张健, 王建军, 纪冬, 刘妍, 钟彦伟, 王琳. HBV前-S1蛋白结合蛋白大鼠同源基因的克隆化. 世界华人消化杂志 2004; 12(7): 1569-1573
Identification and analysis of rat homologous gene to human HBV pre-S1 protein-binding protein
Jun Cheng, Jing Dong, Jian Zhang, Jian-Jun Wang, Dong Ji, Yan Liu, Yan-Wei Zhong, Lin Wang
Jun Cheng, Jing Dong, Jian Zhang, Jian-Jun Wang, Dong Ji, Yan Liu, Yan-Wei Zhong, Lin Wang, Gene Therapy Research Center, Institute of Infectious Diseases, The 302 Hospital of Chinese PLA, Beijing 100039, China
Supported by: National Natural Science Foundation of China, No. C03011402, No. C30070689, No. C39970674, No. C30371288 and Returned Scholarship of General Logistics Department of PLA, No. 98H038.
Correspondence to: Dr. Jun Cheng, Gene Therapy Research Center, Institute of Infectious Diseases, the 302 Hospital of Chinese PLA, 100 Xisihuanzhong Road, Beijing 100039, China. cj@genetherapy.com.cn
Received: February 14, 2004
Revised: April 10, 2004
Accepted: May 11, 2004
Published online: July 15, 2004
0 引言
乙型肝炎病毒(HBV)的包膜蛋白由表面抗原(HBsAg)基因编码, 因为HBsAg编码基因存在着2段启动子调节序列, 而且在基因序列中存在3个串连的框架内(in frame)翻译起始密码子, 因此, HBsAg基因可以从不同的起始密码子开始翻译, 在同一个终止密码子处终止翻译过程, 构成不同长度的HBsAg[1-3]. 从第1个起始密码子开始翻译的蛋白是HBsAg的大蛋白, 从中间的起始密码子开始翻译的蛋白是HBsAg的中蛋白, 从最下游的起始密码子开始翻译的蛋白是HBsAg的主蛋白.上游和中间起始密码子之间的序列成为前-S1(pre-S1)区, 一般由108个氨基酸残基(aa)组成. 关于HBsAg的前-S1区的具体功能, 虽然进行了较长时间的研究, 但是还有许多方面不清楚.我们利用cDNA文库的噬菌体展示技术, 筛选到了一种新的前-S1结合蛋白(pre-S1-binding protein, PS1BP)[4], 再利用生物信息学技术克隆, 鉴定了大鼠的PS1BP基因, 并进行初步分析.
1 材料和方法
利用表达型cDNA文库的噬菌体展示技术的筛选, 获得了人PS1BP的编码基因序列[4-5]. 以人的PS1BP的cDNA序列作为参照, 对于美国国立卫生研究院(NIH)国立医学图书馆(NLM)生物工程信息学研究中心(NCBI)建立的核苷酸序列数据库GenBank, 利用同源基因序列比对的在线分析软件BLASTn进行同源基因序列的比对, 发现新的来源于大鼠的同源基因. 确定大鼠PS1BP的cDNA序列之后, 对于大鼠PS1BP蛋白质一级结构序列与人和小鼠的PS1BP蛋白质一级结构序列的同源性进行分析. 利用在线分析软件, 对于大鼠PS1BP一级结构序列中潜在的修饰和功能位点进行初步的预测分析.
2 结果
利用噬菌体展示技术从cDNA文库中筛选得到的人PS1BP基因由1 437 nt组成, 编码产物由478 aa组成[4]. 利用生物信息学技术克隆, 鉴定的大鼠PS1BP的基因由1 455 nt组成, 编码产物由484 aa组成(图1).大鼠PS1BP基因序列被美国核苷酸序列数据库GenBank收录, 收录号为AY535002.大鼠与人的同源性为80.79%(391/484), 大鼠和小鼠的同源性为92.98%(450/484)(图2).
图1 乙型肝炎病毒前-S1蛋白结合蛋白大鼠同源基因及其编码产物序列.
图2 人和小鼠乙型肝炎病毒前-S1蛋白结合蛋白一级结构序列同源性比较.
对于大鼠乙型肝炎病毒前-S1蛋白结合蛋白一级结构序列生物信息学分析, 发现一系列潜在的蛋白修饰位点结构域.例如1个潜在的N-糖基化位点124-127 aa(NHSK); 2个潜在的cAMP, cGMP依赖性蛋白激酶磷酸化位点11-14 aa (KRgS), 100-103 aa(KKrT); 3个潜在的蛋白激酶C(PKC)磷酸化位点5-7 aa(SnR), 217-219 aa (TkK), 431-433 aa(SlR); 4个潜在的酪蛋白激酶II磷酸化位点6-19 aa(SqaD), 28-31 aa(TsvD), 250-253 aa(TfeD), 305-308 aa(SedE); 4个潜在的N-豆蔻酯酸化修饰位点4-9 aa(GSnrGG), 24-29 aa(GLrpTS), 75-80 aa (GGllAE), 322-327 aa(GAteTS); 6段双向核靶向序列 94-110 aa(KKkeprkkrtwvqkksk), 95-111 aa(KKeprkkrtwvqkkskh), 340-356 aa(Kteqqr rrekaarklr), 384-400 aa(Rrlaelarrkeqrrirr), 396-412 aa(RRirrlaeadkprrlgr), 451-467aa(KRnmieprerakfkrky); 2段富含精氨酸序列35-50 aa(RrrrrgprnkkrgwrR), 346-412 aa(Rrrekaarklrvqqaalraarlqhqelfrlrgikaqvarrlaelarrkeqrrirrlaeadkprr lgR); 1段富含谷氨酸序列 260-318 aa(Eahevelqrekeaeklerqlalptaeqaatqesvfremceglleesededgpgc aeqpE).
3 讨论
研究蛋白-蛋白之间的相互作用是分子生物学中的一个重要的研究内容[6-10]. 病毒性肝炎的发病机制, 在很大程度上也取决于肝炎病毒蛋白-肝细胞蛋白之间相互结合和相互作用[11-16]. 研究蛋白-蛋白相互结合的分子生物学技术很多, 主要包括酵母双杂交技术[17-20]、体外免疫共沉淀技术等. 近年来, 随着噬菌体展示技术的不断成熟, 噬菌体cDNA表达型文库的构建和应用, 也逐渐发展成为研究蛋白-蛋白之间相互作用的重要的分子生物学技术[21-30]. 与酵母双杂交技术一样, 噬菌体展示技术不仅可以研究已知蛋白之间的结合, 而且由于是一种cDNA文库的筛选技术, 因此可能会筛选到以前没有发现有相互作用的新的蛋白类型. 由于目前的功能基因还没有鉴定完毕, 因此, 利用这一策略也可以克隆到新基因.我们应用cDNA文库的噬菌体展示技术, 以重组纯化的前-S1蛋白作为固相筛选基质, 经过5轮的"黏附-洗脱-扩增"的所谓的"淘洗"过程, 从T7噬菌体cDNA文库中筛选得到了能够与前-S1蛋白结合的克隆[4-5]. 对于插入片段的基因序列进行测定, 结果表明, HBV的前-S1蛋白可以结合一种未知功能的蛋白, 我们命名为PS1BP[4]. 我们曾经应用cDNA表达型文库的噬菌体展示技术, 筛选到一系列的蛋白结合蛋白. 不仅如此, 我们通过聚合酶链反应(PCR)引物探针的生物素化修饰, 结合链亲和素(streptavidin)的固相包被技术, 巧妙地将PCR扩增产物的一端固定在免疫酶联板上, 建立了筛选基因启动子DNA结合蛋白的技术系统, 并取得了满意的结果[24-25]. 噬菌体展示技术的出现和早期应用, 主要是用于单链可变区抗体的基因工程抗体研究, 之后又构建了随机多肽库, 包括7肽库和12肽库, 随后又出现了表达型cDNA文库, 进一步扩大了噬菌体展示技术的应用范围.结果表明, 噬菌体展示技术在蛋白结合蛋白、基因启动子DNA结合蛋白的筛选研究中也具有重要的应用前景.我们首先利用表达型cDNA文库的噬菌体展示技术, 以纯化的重组前-S1蛋白作为固相化基质, 筛选得到了前-S1蛋白的结合蛋白新基因, 即人的PS1BP, 再利用生物信息学技术[31-43], 经过核苷酸序列同源性的比对, 克隆了大鼠的PS1BP, 从而为研究不同生物种属的PS1BP蛋白的结构与功能奠定了基础.说明分子生物学研究领域, 生物信息学技术的发展和应用已经进入到了一个新阶段.
PS1BP蛋白是一种功能目前还不十分清楚的蛋白质, 在核苷酸数据库的比对中, 我们筛选得到的PS1BP与神经胶质瘤抑制基因区候选基因2(GLTSCR2)是同一基因. Smith et al[44]在研究神经胶质瘤的过程中, 发现第19号染色体有一段150 kb的缺失区, 因而推测这一区域存在肿瘤抑制基因. 对于这一区域的基因序列进行测定和分析, 可推断有2个肿瘤抑制基因候选基因, 其中包括GLTSCR2. 说明我们发现的PS1BP, 即GLTSCR2可能是潜在的一种肿瘤抑制基因类型. 但是, 这一推测只是基于核苷酸序列的生物信息学分析, 还没有得到进一步的证实, GLTSCR2基因的编码序列甚至是一种生物信息学的推断, 究竟是否存在这样的编码基因都不一定[45-51]. 我们的筛选结果是一种表达型cDNA文库的筛选结果, 因此至少可以肯定PS1BP/GLTSCR2是一种具有表达和编码功能的基因, 因此在原来的基础上又进了一步.从大鼠的PS1BP/GLTSCR2基因克隆化结果来看, 大鼠与人的同源性为80.79%(391/484), 大鼠和小鼠的同源性为92.98%(450/484), 说明这种基因的序列高度保守, 推测具有重要的生物学功能. 利用Northern blot杂交技术证实, 在心脏、胰腺中PS1BP/GLTSCR2基因有很高水平的表达, 肝脏、骨骼肌、肾脏中有中等水平的表达, 脑、肺组织中的表达水平较低. 这些研究结果表明, PS1BP/GLTSCR2基因的功能可能十分广泛. PS1BP/GLTSCR2蛋白的结构与功能、表达与调控、生物学意义、医学意义, 在神经胶质瘤和乙型病毒性肝炎发病机制中的作用目前我们还一无所知, 还需要进行系统的研究加以证实.