修回日期: 2004-07-09
接受日期: 2004-08-20
在线出版日期: 2004-10-15
N/A
引文著录: 成军. 蛋白质组学与肝脏疾病研究. 世界华人消化杂志 2004; 12(10): 2276-2279
Revised: July 9, 2004
Accepted: August 20, 2004
Published online: October 15, 2004
N/A
- Citation: N/A. N/A. Shijie Huaren Xiaohua Zazhi 2004; 12(10): 2276-2279
- URL: https://www.wjgnet.com/1009-3079/full/v12/i10/2276.htm
- DOI: https://dx.doi.org/10.11569/wcjd.v12.i10.2276
蛋白质组学(proteomics)的概念是在1995年提出来的, 当时的含义是对于细胞系、组织以及生物中的全部蛋白进行大规模研究的一门科学[1]. 目前有两种不同的蛋白质组学的定义: 第一种是较为经典的定义, 限于对基因编码产物进行大规模的分析, 研究内容仅限于蛋白质. 第二种定义包容性更大, 除了蛋白质的研究之外, 还包括遗传信息的流向, 即mRNA、基因组学(genomics)以及研究蛋白-蛋白相互作用的酵母双杂交(yeast-two hybrid)分析等. 但是, 无论概念上怎么改变, 蛋白质组学的任务还是一样, 即通过对所有的蛋白, 而不是单一的蛋白进行整体、有机的研究, 阐明这些蛋白质的结构和生物学功能.
采用更加具有包容性的蛋白质组学的概念, 许多不同研究领域都可以归属在蛋白质组学的范围之内[2-5]. 例如, 蛋白-蛋白之间的相互作用、蛋白的修饰、蛋白的功能、蛋白在细胞内的定位等. 蛋白质组学的任务不仅是要鉴定一个细胞内全部的蛋白成分, 而且要建立起各种蛋白之间相互关系的3维(3D)立体关系图, 这么庞大的计划当然需要许多专业的科学家的共同参与, 如分子生物学家、生物化学家、生物信息学家等. 在这项研究中, 生物信息学专家的作用尤其重要, 需要建立更为强大的数据库和相应的计算机分析技术, 对于研究过程中所产生的大量数据进行快速而准确的计算、分析和处理.
对于一个特定的细胞或生物类型来说, 其蛋白质的组成并不是一成不变的, 而是无时无刻不出在变化之中, 这是进行蛋白质组学研究必须考虑的一个重要的因素[6-10]. 细胞所处的外环境因素的改变, 可导致细胞蛋白质组学参数的显著改变. 细胞外和细胞内刺激信号都可以诱导细胞内蛋白的翻译后修饰, 在细胞内发生转位, 或者有新型蛋白的合成, 或者有蛋白进行降解. 因此, 任何一项蛋白质组研究的结果, 都只是反映了当时条件下的蛋白质的结构和功能.
可以称得上是蛋白质组学最早的研究当数1975年进行的蛋白质双向电泳(2-DE)分析. 利用双向电泳技术对于大肠杆菌、小鼠、豚鼠等的蛋白进行作图分析. 尽管利用双向电泳技术可以分离出一系列的蛋白质, 但是却不能进一步的鉴定[11-14]. 尽管如此, 此后不久随着蛋白质双向电泳资料的不断累计, 建立了相应的蛋白质2-DE参数数据库, 对于人体中的各种蛋白进行分类.
2-DE分析将蛋白质组学研究向前推进了一步, 但是一直到Edman降解法对于蛋白的序列进行测定出现之后, 与2-DE技术相结合, 才真正形成了新的突破. 在蛋白质组学研究中最为重要的技术突破是蛋白质的质谱分析(MS, mass spectrometer)技术的应用, 近10年来, 应用质谱技术分析的蛋白种类增加了数个数量级. 蛋白质质谱分析技术非常敏感, 可以分析混合物中的蛋白成分, 而且可以进行高通量技术分析, 基本上可以替代Edman序列分析技术.
蛋白质组学的发展, 直接得益于表达序列标签(EST, expressed sequence taq)以及基因组DNA的大规模序列分析. 没有基因组计划的实施, 即使质谱分析和Edman测序技术再有效, 也不可能在如此之短的时间内将如此大量的蛋白进行鉴定. 基因序列和蛋白序列大部分都是在最近的5-10年内完成的. 1995年完成了第一个生物, 即流感嗜血杆菌(Haemophilus influenza)基因组的测序工作, 到2002年的第一季度已经完成了45种生物的全基因组测序, 另外170种生物全基因组的测序也在进行之中. 到目前为止, 已经有5种真核生物的基因组测序完成, 包括Arabidoposis thaliana、酵母(Saccharomyces cerevisiae)、Schizosaccharomyces pombe、美丽隐杆线虫(Caenorhabditis elegans)、果蝇(Drosophila malanogaster )等, 小鼠和人的基因组测序工作已经接近完成.
许多生物学信息仅仅研究基因的序列是得不到的. 只有蛋白质分子才能赋予细胞特定的表型[15-17]. 只有基因组学的资料不足以阐明疾病、衰老、机体对于环境因素刺激的应答机制. 发展蛋白质组学具有多方面的意义. (1) 注解基因组信息. 蛋白质组学的第一个任务就是鉴定基因组中所有的编码基因序列. 基因组的功能注解是非常重要的, 因为只有全基因组序列还不足以阐明其编码的功能. 大部分的外显子(exon)和内含子(intron)序列, 都不能通过生物信息学技术进行预测, 只有将基因组序列和蛋白序列研究结果结合起来, 才能真正有效阐明基因组中的编码基因组列. (2)蛋白表达研究. 近年来对于mRNA表达的研究发展很快, 特别是基因表达系列分析(SAGE, serial analysis of gene expression)和DNA芯片(DNA microarray)技术的应用, 但是mRNA的分析并不能代替细胞内蛋白的分析, 许多研究发现mRNA转录水平和细胞内蛋白的实际水平往往有很大的差别. 从mRNA到蛋白质还需要经过一系列的转录后和翻译后修饰. 因此不能简单解释"一个基因, 一个蛋白"的理论, 况且在血液和体液中只有蛋白, 没有mRNA存在. (3)蛋白功能研究. 在基因组研究中发现1/3的基因还没有对应的功能. 对于细胞中所有蛋白进行研究, 有助于建立细胞中蛋白之间的3D关系, 必须对于蛋白的功能进行研究. (4)蛋白修饰研究. 对于蛋白质翻译后的修饰研究是蛋白质组学的重要内容. 细胞在受到细胞外、细胞内的刺激之后, 细胞内的蛋白发生翻译后的修饰. 蛋白激酶对于底物蛋白的磷酸化修饰、蛋白磷酸酶对于底物蛋白的去磷酸化修饰, 都是调节蛋白生物学功能的重要机制和途径. (5)蛋白定位研究. 研究表明蛋白的异常定位对于细胞的功能将产生显著的影响. (6)蛋白-蛋白相互作用研究. 细胞生长、细胞凋亡、细胞周期等的调节, 都是通过蛋白-蛋白之间的相互作用实现的. 利用酵母双杂交技术对于幽门螺杆菌(Helicobacter pylori)蛋白的结合蛋白进行研究, 发现了1 200种不同形式的蛋白-蛋白之间的相互作用. 对于Saccharomyces cerevisiae蛋白结合蛋白的作图分析也正在进行之中.
根据不同的目的和采用的不同的技术, 蛋白质组学可以分成不同的类型[18-20]. (1)蛋白表达蛋白质组学(protein expression proteomics): 对于不同样品中的蛋白进行定量分析, 以发现信号转导或疾病相关的蛋白类型, 称为蛋白表达蛋白质组学. (2)结构蛋白质组学(structural proteomics): 研究细胞器等特殊细胞内部位的蛋白及蛋白复合体中的蛋白质分子结构的研究, 称为结构蛋白质组学. 结构蛋白质组学的主要任务就是确定各种蛋白质的结构、亚细胞定位、结合蛋白等. (3) 功能蛋白质组学(functional proteomics): 功能蛋白质组学具有多方面的含义. 功能蛋白质组学的研究, 有助于阐明信号转到的机制、疾病发生的机制、以及蛋白-药物之间的相互作用等.
蛋白质组学研究中主要涉及的技术主要包括蛋白的分离和鉴定、蛋白质结构研究、数据库的应用等方面[21-22].
在蛋白质的分离和鉴定中, 聚丙烯酰胺凝胶电泳(PAGE), 包括2-DE和质谱分析得到了广泛的应用. 分析的蛋白样品可以是从细胞或组织中提取的全部蛋白, 也可以是组分; 可以是原始状态的蛋白成分, 也可以经过加工、初步分离纯化以后在进行分析. 2-DE和MS技术还可以联合使用, 以提高蛋白分离鉴定的效率和精确度. 胰蛋白酶消化、质谱分析、液相层析、毛细管电泳(capillary electrophoresis)、多维蛋白鉴定、阳离子交换层析、反向层析等技术的相互组合, 可以显著提高蛋白分离鉴定的工作效率.
蛋白质结构和序列的测定, 较早应用的技术包括Edman末端测序分析、质谱分析(mass spectrometer). 蛋白质的质谱分析技术包括样品的制备、样品的离子化、质谱分析等过程.
在蛋白质组学研究中数据库的建立和应用也是一个关键. 利用Edman末端测序分析、质谱分析技术获得了一系列的蛋白质结构数据, 建立了庞大的数据库, 并且相继建立了复杂的计算机分析技术. 目前可以利用的蛋白质结构数据库包括肽谱指纹数据库(peptide mass fingerprinting database)、氨基酸序列数据库(amino acid sequence database)、新生多肽序列数据库(de novo peptide sequence database)、不能分子的质谱数据库(uninterpreted MS/MS database)等.
蛋白质组学研究的用途十分广泛.
目前许多实验室都致力于应用MS技术鉴定蛋白复合物. 先将已知蛋白与谷胱甘肽S-转移酶(GST)基因融合, 表达带有GST标签的融合蛋白作为诱饵, 然后与特定细胞的蛋白进行混合, 经过混合蛋白的序列测定, 鉴定出已知蛋白的结合蛋白. Joberty et al[1]将已知蛋白Borg3这种Cdc42效应分子与GST基因融合, 在大肠杆菌中标出带有GST标签的融合蛋白, 然后与小鼠成纤维细胞NIH 3T3的蛋白混合, 对于结合的蛋白复合进行序列分析, 证实与Borg3蛋白结合的蛋白包括热休克蛋白70(HSP70), 3中septin蛋白, 包括Septin 6、Cdc10和Nedd5蛋白等. 利用免疫共沉淀技术也证实了Borg3蛋白与Cdc10和Nedd5蛋白之间的结合能力. 虽然利用这种pull-down技术可以很快鉴定与Borg3蛋白结合的蛋白, 但是随后的研究证实他们之间的结合作用需要花费数个月的时间.
蛋白质组学技术应用最为广泛的是蛋白表达谱的研究. 2-DE和同位素编码的亲和标签(isotope-coded affinity tags)分析技术在2种蛋白样品中蛋白表达水平的比较分析中具有广泛的应用, 可以快速鉴定信号转导相关蛋白以及疾病相关蛋白. 目前大部分蛋白表达谱的研究都是采用2-DE技术完成的, 包括心脏病、肿瘤等. 2-DE技术特别适用于肿瘤的研究, 将肿瘤组织和相应的没有发生转化的正常组织进行对比研究就可以获得一系列的研究资料. 2-DE技术的应用可以发现肿瘤特异性的生物学标志物、肿瘤发生和发展相关的蛋白分子、抗肿瘤治疗的新的药物作用靶位. 除了2-DE技术之外, 将2种蛋白样品, 与1种或2种ICAT试剂通过分子结构中的半胱氨酸残基结合, 并产生一个生物素(biotin)基团, 利用亲和素层析系统对于结合的蛋白进行纯化. 然后再利用MS技术进行进一步的分析. 蛋白芯片(protein array)技术也是蛋白表达谱研究的重要技术途径. 蛋白芯片技术在蛋白-蛋白结合、蛋白-配体结合的分析中也具有十分重要的应用前景.
蛋白的翻译后修饰是细胞调节的一种基本方式, 对于蛋白翻译后修饰是研究蛋白质生物学功能的关键环节. MS技术是研究蛋白质翻译后修饰的重要的技术途径, 因为MS可以分析蛋白分子中任何一种形式的修饰[23-26].例如, 蛋白的磷酸化修饰就是蛋白翻译后修饰的一种重要类型. 分析蛋白的磷酸化修饰, 第一步是对于磷酸化修饰蛋白的富集, 通过富集, 可以对低拷贝的磷酸化蛋白进行分析. 对于磷酸化修饰的蛋白的分离有多种技术. 例如对于磷酸化的丝氨酸残基转变成为生物素化的氨基酸残基, 利用亲和素层析方法获得发生磷酸化修饰的蛋白, 对于发生磷酸化修饰的蛋白进行富集. 然后利用Edman降解法对于磷酸化的位点进行定位分析. 因为MS可以直接测定发生磷酸化修饰的氨基酸残基, 因此利用MS技术可以对磷酸化修饰的位点进行直接的测定.
蛋白发掘(proteome mining)是功能蛋白质组学的一种研究策略. 理论基础是认为任何一种药物样的分子, 都是选择性地结合靶蛋白分子, 而且是与天然的配体分子进行竞争性的结合. 在蛋白发掘研究中, 首先将配体分子高密度固相化, 而且结合的方式的立体化学特点有利于结合蛋白靶分子. 然后将细胞或组织来源的蛋白与配体分子进行结合, 对于结合配体分子的蛋白进行序列分析, 就可以找到与配体结合的蛋白质分子.
蛋白质组学研究的历史还很短, 在肝脏疾病研究中的应用还不是十分广泛, 但是, 蛋白质组学技术在肝脏疾病的研究中肯定也具有十分重要的应用前景.
质谱分析技术是一种快速、敏感的研究蛋白质辅助因子立体化学的重要技术类型. Orsatti et al研究了丙型肝炎病毒(HCV)NS3蛋白酶及其辅助因子NS4A. NS3/NS4A复合物中的2种蛋白是通过非共价键结合的. 质谱分析非常敏感, 样品的需要量仅仅是纳摩尔级. 高效液相色谱(HPLC)何止谱分析结果表明, NS3/NS4A复合物中2种蛋白成分的比例是1:1, 与其他研究方法所得出的结果一致. Orsatti et al对于HCV的NS2/3蛋白复合物进行分析, 在100 mmol/L b-巯基乙醇和变性条件下, 发现在半胱氨酸残基上出现修饰.修饰后的蛋白复性之后活性下降. 液相色谱和质谱的联合分析发现在9个半胱氨酸残基位点有5个发生巯基化修饰. 但是所有修饰后的蛋白活性都有不同程度的下降. Anbar et al利用质谱技术对于病毒性肝炎患者尿液中的多种成分进行分析, 发现24种中性代谢产物中与正常人不同, 应用这些指标对于病毒性肝炎患者的诊断率达到100%. 这一结果显然优于对尿中的酸性物质的质谱分析, 病毒性肝炎患者尿液中仅9种酸性物质与正常人不同, 而且对于病毒性肝炎的诊断率只有91%.
Poon et al设计筛选慢性肝病患者中肝细胞癌(HCC)的蛋白芯片技术. 对20例AFP阳性的慢性肝病患者和38例 HCC患者进行分析, 顺序进行阳离子交换层细、蛋白芯片和质谱分析. 结果表明蛋白质组学理论和技术在肝脏疾病的研究中具有十分重要的应用前景.
1. | Joberty G, Perlungher RR, Sheffield PJ, Kinoshita M, Noda M, Haystead T, Macara IG. Borg proteins control septin organization and are negatively regulated by Cdc42. Nat Cell Biol. 2001;3:861-866. [PubMed] [DOI] |
2. | Soellick TR, Uhrig JF. Development of an optimized interaction-mating protocol for large scale yeast-two hybrid analyses. Genome Biol. 2001;2:1-7. [DOI] |
3. | Lawrence DS. Functional proteomics: large-scale analysis of protein kinase activity. Genome Biol. 2001;2:1-3. [DOI] |
6. | 李 克, 王 琳, 成 军, 陆 荫英, 张 玲霞, 李 莉, 刘 妍, 段 惠娟. 丙型肝炎病毒NS2基因酵母双杂交"饵"载体构建及表达. 世界华人消化杂志. 2002;10:129-132. [DOI] |
9. | 王 琳, 李 克, 成 军, 陆 荫英, 王 刚, 刘 妍, 钟 彦伟, 段 惠娟, 洪 源. 筛选与克隆肝再生增强因子结合蛋白的基因. 世界华人消化杂志. 2002;10:161-164. [DOI] |
11. | Lu YY, Li K, Cheng J, Wang L, Liu Y, Zhang LX. Cloning and expression of the preS1 gene of hepatitis B virus in yeast cells. Hepatobiliary Pancreat Dis Int. 2002;1:238-242. [PubMed] |
12. | 李 克, 王 琳, 成 军, 陆 荫英, 张 玲霞, 牟 劲松, 洪 源, 刘 妍, 段 惠娟, 王 刚. 丙型肝炎病毒核心蛋白与染色体转位蛋白的相互作用. 中华医学杂志. 2002;82:673-677. |
13. | 李 克, 王 琳, 成 军, 张 玲霞, 段 惠娟, 陆 荫英, 杨 继珍, 刘 妍, 邵 得志, 夏 小兵. 筛选与克隆丙型肝炎病毒核心蛋白结合蛋白6基因. 中华实验和临床病毒学杂志. 2002;16:351-354. |
14. | 陆 荫英, 李 克, 成 军, 王 琳, 刘 妍, 张 玲霞. 乙型肝炎病毒前-S2基因酵母表达载体的构建及表达. 胃肠病学和肝病学杂志. 2002;11:222-224. |
15. | 王 琳, 李 克, 成 军, 陆 荫英, 张 健, 洪 源, 刘 妍, 王 刚, 钟 彦伟, 段 惠娟. 丙型肝炎病毒核心蛋白与载脂蛋白A1结合的研究. 世界华人消化杂志. 2002;10:1018-1021. [DOI] |
17. | 陆 荫英, 王 琳, 刘 妍, 于 敏, 李 克, 张 玲霞, 王 业东, 成 军. 乙肝病毒表面抗原单链抗体细胞内免疫抗乙肝病毒基因治疗研究. 军医进修学院学报. 2003;24:49-51. |
18. | 王 琳, 李 克, 成 军, 陆 荫英, 张 健, 刘 妍, 王 刚, 洪 源, 王 贺, 芮 莉莉. 筛选与克隆丙型肝炎病毒NS5A蛋白结合蛋白基因. 解放军医学杂志. 2003;28:50-52. |
19. | 李 克, 王 琳, 成 军, 张 玲霞, 段 惠娟, 陆 荫英, 杨 继珍, 刘 妍, 洪 源. 酵母双杂交技术筛选克隆丙型肝炎病毒NS3蛋白结合蛋白. 解放军医学杂志. 2003;28:31-33. |
22. | Li K, Wang L, Cheng J, Lu YY, Zhang LX, Mu JS, Hong Y, Liu Y, Duan HJ, Wang G. Interaction between hepatitis C virus core protein and translin protein--a possible molecular mechanism for hepatocellular carcinoma and lymphoma caused by hepatitis C virus. World J Gastroenterol. 2003;9:300-303. [PubMed] [DOI] |