Copyright
©The Author(s) 2003. Published by Baishideng Publishing Group Inc. All rights reserved.
噬菌体展示技术的原理及应用
张忠东, 成军, 张树林
张忠东, 成军, 中国人民解放军第302医院传染病研究所基因治疗研究中心, 全军病毒性肝炎防治研究重点实验室 北京市 100039
张树林, 西安交通大学第一医院传染科 陕西省西安市 710061
ORCID number: $[AuthorORCIDs]
通讯作者: 成军, 100039, 北京市, 中国人民解放军第302医院传染病研究所基因治疗研究中心. cj@genetherapy.com.cn
电话: 010-66933391 传真: 010-63801283
收稿日期: 2002-10-29
修回日期: 2002-11-10
接受日期: 2002-11-18
在线出版日期: 2003-04-15
0 引言
1985年Smith[1]首次证实丝状噬菌体fd基因组能通过基因工程的手段进行改造, 将EcoRⅠ内切酶的部分基因片段(171 bp和132 bp)与pⅢ基因融合, 获得的重组噬菌体可在体外稳定增生, 表达产物能被抗EcoRⅠ内切酶抗体所识别. 1988年Parmley et al[2]将已知抗原决定族与pⅢ的N端融合呈现在表面, 可特异性地被抗体选择出来, 并提出通过构建随机肽库可以了解抗体识别的抗原决定簇表位的设想. 1990年McCafferty et al[3]也报道了用噬菌体展示技术筛选溶菌酶的单链抗体的方法, 从而开始了这项技术的广泛应用的新时代.
1 噬菌体的基本特征
噬菌体属于单链DNA病毒, 包括f1、fd和M13三类. 噬菌体DNA在细菌内滚环复制, 细菌不被裂解, 但生长速度减慢, 而且可分泌出大量成熟的噬菌体颗粒. 噬菌体的单链DNA长约7000 bp, 不同类型噬菌体其一级结构极为相似, 基因组编码11种蛋白质, 其中5种为结构蛋白, 与噬菌体展示密切相关的是二种不同的结构蛋白pⅢ和pⅢ. 噬菌体单链DNA被包裹在大约2700-3000个主要衣壳蛋白pⅢ分子组成的管状结构中, 另外次要衣壳蛋白pⅢ通过与大肠杆菌的F菌毛结合而引起感染, 是噬菌体感染宿主所必需的. pⅢ前体由73个氨基酸残基组成, 其中信号肽为23个氨基酸残基, 根据构成外壳的功能可分为四个区, 6-24氨基酸残基区域占据噬菌体表面的大部分, 25-35氨基酸残基区域高度疏水性, C端(35-50氨基酸残基区域)与DNA相结合, 构成完整的内壁, N端(1-5氨基酸残基区域)为可活动的、外露在噬菌体表面的肽段, 是插入外源基因的最佳位置. pⅢ前体由424个氨基酸残基组成, 形成3-5个拷贝, 位于噬菌体的尾部, 他由四个功能区组成, 信号肽区(18个氨基酸残基)引导pⅢ至细菌胞间质, 在pⅢ分泌后被细菌蛋白酶水解, 其后的穿膜区与噬菌体的侵入有关, 受体结合区负责结合F菌毛, 而C端的疏水区组装前黏附在细菌内膜上, 组装后这段氨基酸序列锚在噬菌体外壳上, 穿膜区是最外露的区域, 因而成为插入外源基因的理想位置.
2 噬菌体展示技术的基本原理
噬菌体展示技术是一种基因表达产物和亲和选择相结合的技术, 他以改构的噬菌体为载体, 把待选基因片段定向插入噬菌体外壳蛋白质基因区, 使外源多肽或蛋白质表达并展示于噬菌体表面, 进而通过亲和富集法表达有特异肽或蛋白质的噬菌体. 其建立基于三个原因: (1)在pⅢ和pⅢ衣壳蛋白的N端插入外源基因, 形成的融合蛋白表达在噬菌体颗粒的表面, 不影响和干扰噬菌体的生活周期, 同时保持的外源基因天然构象, 也能被相应的抗体或受体所识别; (2)利用固定与固相支持物的靶分子, 采用适当的淘洗(panning)方法, 洗去非特异结合的噬菌体, 筛选出目的噬菌体; (3)外源多肽或蛋白质表达在噬菌体的表面, 而其编码基因作为病毒基因组中的一部分可通过分泌型噬菌体的单链DNA测序推导出来. 该技术实现了基因型和表型的转换.
噬菌体结构蛋白pⅢ和pⅢ均可作为载体来展示外源多肽或蛋白质, 在基因操作上, 他们基本相同. 在信号肽与成熟蛋白质编码区之间有单一的克隆位点便于插入, 插入的外源多肽或蛋白质以融合的形式表达出来并分泌到胞间质内, 当宿主蛋白酶切除信号肽后, 融合蛋白组装成熟, 呈现在病毒粒子的表面, 新的N端位置正是外源蛋白或多肽的插入点. 与pⅢ基因融合时拷贝数低(不超过5个), 这可以减少多价结合, 利于选择高亲和力的配体分子, 可容许插入大的片段. 与pⅢ基因融合时, 拷贝数高(2 700个), 当将属于多肽的表位用作免疫源时可产生良好的免疫应答, 具有反应优势, 故在疫苗开发上具有潜在的应用价值.
亲和筛选可用直接法和间接法. 直接法是将蛋白质分子耦联到固相支持物上, 文库噬菌体与固相支持物温育, 洗去未结合的噬菌体, 既获得亲和噬菌体; 间接法是将生物素标记的蛋白质分子与文库噬菌体温育后铺在结合有链亲和素的平皿上, 洗去未结合的噬菌体, 保留的就是结合状态的噬菌体, 再洗脱结合的噬菌体, 用这部分噬菌体感染细菌, 扩增噬菌体, 开始新一轮的筛选, 通过几次这样的亲和纯化反应, 就能选择性地富集并特异性扩增结合这种蛋白质或DNA分子的噬菌体. 筛选出的噬菌体的结合特性可以进一步验证并从DNA序列推导出来, 分析各个克隆间编码短肽的一致序列, 以确证筛选的特异性. 最后, 利用化学合成含一致序列的氨基酸短肽, 研究他们的亲和特性并推测可能配体的生物学活性和结合或游离状态的结构特点.
3 噬菌体展示技术的应用
3.1 噬菌体随机多肽文库
肽库是感染性噬菌体的集合, 其中每个病毒粒子的衣壳表面都含有以融合蛋白形式显露的唯一的核苷酸顺序编码寡肽, 通过选择步骤可以富集与靶分子结合的噬菌体. 构建随机多肽文库一般先体外合成编码短肽的随机DNA片段, 经PCR扩增或杂交使其形成携带适当酶切位点的基因片段, 或经PCR扩增某特定基因后再用DNaseⅠ酶解, 使其形成长短不一的小基因片段. 随机肽库的应用范围依采用的筛选分子而言, 这些筛选分子包括抗体、小分子、细胞表面受体类、细胞分子类、完整细胞等, 这些分子称为受体类. 筛选出的结合该类受体的目的分子称为配体. 用纯化的单克隆抗体作受体, 进行抗体的表位分析应用最广泛也最成熟, 筛选出的配体通常表明了抗原抗体的结合部位. Blond-Elguindi et al[4]采用甲胎蛋白(AFP)洗脱的策略筛选出Bip结合短肽的共有序列, 阐明Bip识别和蛋白质折叠的机制. 用细胞表面的天然受体作筛选分子是筛选技术的一大进步, Doorbar et al[5]采用竞争洗脱的方法筛选出细胞表面受体特异性结合的短肽, Pasqualini et al[6]成功地筛选出肠和胃组织特异性的短肽, 预示有可能用于体内基因的定向转移. 噬菌体展示技术也可以用于病毒的诊断、治疗和疫苗的发展, Folgori et al[7]以乙型肝炎病毒表面抗原(HbsAg)为模型, 用乙型肝炎患者特异性血清筛选肽库, 用免疫印迹鉴定噬菌体表位, 用正常人血清反向筛选, 最终得到的短肽可模拟HBsAg并由竞争结合试验验证. Motti et al[8]在对HBV的研究中, 用抗病毒单克隆抗体筛选出模拟表位, 免疫后可引起机体特异性的对HBsAg的机体免疫, 提示模拟短肽可用于疫苗的发展. Arnon et al[9]用八肽随机肽库筛选曼氏血吸虫的模拟表位, 认为模拟表位可以作为多肽疫苗的重要成分. 利用肽库技术确定了沙眼衣原体主要外壳蛋白的表位[10]、HCV核心抗原表位[11]、HIV gp 120蛋白和HCV核心蛋白的表位[12]. 利用噬菌体肽库技术已经确定了许多蛋白分子的相互作用位点, 包括组成的SH3与酪氨酸蛋白激酶的结合位点[13]、胞质蛋白p47phox与细胞色素b558的结合位点[14]. 用亲和纯化的HLA-DR13从噬菌体肽库中钓出与之结合的多肽, 通过MHC与多肽的结合基序分析MHC-I分子的结合特点[15]. Wrighton et al[16]筛选到具有促红细胞生成素(EPO)功能活性的由二键连接的环形短肽. 他用重组可溶性红细胞生成素受体(EPO-R)先筛选与gp120融合表达的构象约束型噬菌体八肽库, 得到与EPO-R特异性结合, 且不与牛血清白蛋白(BSA)、肿瘤坏死因子受体(TNFR)的胞外区、神经生长因子受体(NGF-R)、白介素-2受体(IL-2R)的α和β亚基以及E选择素结合的环肽[16].
3.2 噬菌体抗体库
噬菌体抗体库技术利用丝状噬菌体载体构建抗体文库, 通过已知抗原筛选特异性高亲和性抗体的技术. McCaffery et al[3]首先证明, 完整的抗体可变区可表达于噬菌体的表面, 通过亲和筛选获得了与已知抗原特异性结合的单链抗体片段, Hogrefe et al[17]又从构建的Fab文库筛选到特异的Fab片段.
每种抗体的可变区由超变区和骨架区(FR)组成, 超变区又称互补决定区(CDR)决定抗原的结合位点, 其氨基酸序列变异较大, 而连接超变区的骨架区很保守. 噬菌体抗体库运用了三项实验技术: (1)逆转录多聚酶链反应(RT-PCR)技术, 用一种引物克隆出全套免疫球蛋白可变区基因; (2)采用大肠杆菌分泌表达具有生物活性的抗体功能片段; (3)噬菌体表面展示技术的建立, 其主要技术流程是, 从免疫或不经免疫的人和小鼠的脾淋巴细胞中提取mRNA, 反转录成cDNA, 使用与抗体可变区基因两侧保守区互补的引物, 通过多聚酶链反应(PCR)分别扩增抗体可变区的重链(VH)和轻链(VL)基因, 构建文库. 插入噬菌体载体后有二种表达模式, 即表达scFv单链抗体或Fab抗体, scFv由VH和VL之间通过人工接头相连; 而Fab片段的VH+CH1和VL+CL分别插入不同的噬菌体载体, 二种重组噬菌体超感染同一宿主菌, VL+CL就可与VH+CH1片段通过二硫键结合形成Fab片段. 将噬菌体抗体文库通过特异性抗原的筛选, 就可以得到含特异性抗体片段的噬菌体.
噬菌体抗体库技术模拟了机体免疫系统的选择作用, 呈现在噬菌体表面的抗体能够在体外用固相化抗原进行筛选, 同时由于噬菌体对大肠杆菌的感染性, 噬菌体抗体库技术能够以淘筛的方式, 为快速选择特异性抗体提供简便而高效的操作系统, 具体的步骤: (1)噬菌体黏附靶抗原. (2)反复洗涤去除非特异性结合, 洗脱并收集与抗原结合的噬菌体. (3)再次感染大肠杆菌, 使特异的噬菌体抗体淘筛. 除此之外, 也有用固相淘筛、捕获淘选、完整细胞淘筛、组织淘筛及器官淘筛等方法获得结合抗体成功的报道, 但各有侧重, 为噬菌体抗体的淘筛增添新的途径[18]. Clackson et al[19]首先把他用到scFv的表达中来. 他使用基因工程改造噬菌体载体, 再在辅助者(Helper)噬菌体的帮助下, 结果使scFv在噬菌体的衣壳蛋白G3P的顶部表达. 这种scFv已具有结合活性, 因此能很方便地从一个库中筛选出需要的scFv噬菌粒(phagemid)来. 1996年, Tang et al[20]用噬菌体展示技术的方法, 对一个连接肽库作了筛选, 结果得到很多结合能力较强的scFv的连接肽.
3.3 蛋白质的定向改造
蛋白质的定向改造指的是用盒式突变、错误倾向PCR等方法来突变蛋白质或结构域的某一特定编码序列, 产生蛋白质或结构域的突变文库呈现在噬菌体表面, 通过亲和筛选获得所需的已定向改变的噬菌体克隆, 他们的一级结构可以从DNA的序列中推导出来. 可用来筛选具有更强受体结合能力的细胞因子、新的酶抑制剂、转录因子的DNA结合新位点、新的细胞因子拮抗剂、新型酶和增强生物学活性的蛋白质等.
3.4 cDNA文库的表达筛选
cDNA文库的表达筛选系统除利用λ噬菌体、酵母双杂交系统外, 噬菌体表面展示技术也可达到同样的目的[21-23]. cDNA编码的所有蛋白质融合在fos结构域C末端, 与Jun-gⅢ或Jun-gⅧ结构域相互作用; 也可将cDNA直接融合在pⅢ的C末端; 另外是直接利用蛋白质之间的相互作用来选择cDNA, 将目的蛋白和cDNA文库分别与gⅢ的C末端和N端融合, 如果目的蛋白与某一个cDNA的蛋白相互作用, gⅢ蛋白的二个功能域将彼此互补导致有感染性的病毒产生. 噬菌体展示技术引出了分子文库的概念, 根据文库呈现的部位不同, 有噬菌体表面展示文库、细菌表面展示文库、质粒展示文库和核糖体文库, 也可以是用化学方法合成的肽库或小分子化合物库. 其中噬菌体表面展示技术比较成熟, 根据文库内分子的性质可以分为cDNA文库、随机肽库、抗体文库、蛋白质文库等. 目前已越来越广泛地用于抗原表位分析、蛋白质-蛋白质相互作用位点分析、酶作用底物的分析、寻找具有生物功能的蛋白的模拟肽、先导化合物的发现、分离与鉴定疾病特异性抗原模拟肽、筛选细胞和器官特异性结合肽、研究蛋白质与核酸结合特性、定位信号转导途径等. 该技术迅速发展的原因是他有效地实现了基因型和表型的转换, 在分子克隆的基础上, 实现蛋白质构想的体外控制, 从而可获得具有生物学活性的表达产物. 若将蛋白质三维结构预测、分子模拟技术及噬菌体表面展示技术完美融合, 对分子相互作用、分子识别、受体作用、酶学机制以及疫苗的研究进程将起极大的推动作用.