第一节 蛋白质结构与功能 下载本文

内容发布更新时间 : 2024/5/24 2:18:49星期一 下面是文章的全部内容请认真阅读。

第一章 蛋白质的结构与功能

蛋白质译自albuminoid,该词来自拉丁文albumina(蛋白)。1838年,德国化学家Mulder建议采用protein一词,立即得到瑞典著名化学家Berzelius的支持,逐渐被学术界普遍采用,该词源自希腊文προτο,意为最原始、最基本、最重要的。可见,蛋白质自发现后一直受到化学家和生物学家的重视。因为蛋白质是活细胞中含量最丰富、功能最复杂的生物大分子,是各种生物功能主要的体现者。蛋白质是以核酸为模板合成的,是基因表达的主要产物,因此人们将核酸称为“遗传大分子”,而把蛋白质称为“功能大分子”。近 半个多世纪以来,以核酸-蛋白质的结构、功能及其相互关系为中心,逐渐形成了分子生物学,成为带领生命科学进入新时代的龙头。

蛋白质是20种天然氨基酸缩合成的大分子,分子量从10kDa至数百kDa,有着极其复杂的结构。1952年丹麦生物化学家Linderstrom-Lang提出蛋白质三级结构概念,把蛋白质研究纳入正轨。越来越多的证据雄辩地表明,蛋白质的功能与其特殊的结构有着十分密切的内在联系,结构是特定功能的内在依据,功能则是特定结构的外在表现。目前,对于蛋白质功能的认识包括以下三个方面:①蛋白质对生命活动的贡献,即其生物学意义;②蛋白质的分子功能,即它参与完成的生化活动;③蛋白质的亚细胞定位,即其发挥功能的位置与环境。以水通道蛋白(aquaporin)为例,它的四聚体定位于红细胞、肾细胞等的质膜中,形成一个通道,其功能就是允许水分子通过,为维持细胞内外渗透压平衡作出贡献。因此,阐明蛋白质的分子结构及其与功能的关系是现代生物化学的基本命题,是揭示生命运动规律的必由之路,应当受到所有生命科学工作者的关注。随着这些生物大分子及其复合物精确三维结构的测定以指数曲线增长,已累积了相当多的有关数据。在此基础之上,十多年来形成了以研究生物大分子及其复合物和组装体的三维结构、运动和相互作用,以及它们与生物学功能和病理现象的关系为主要内容的新兴学科——结构生物学,把生命科学推进到新的时代。

1.1 蛋白质的分子结构

按结构特点天然蛋白质可划分为:球形蛋白质(globular protein)、纤维状蛋白质(fibrous protein)、膜蛋白(membrane protein)和天然无序蛋白质(intrinsically disordered protein),其中,被研究得最早、最多和最深入的当属球形蛋白质。1952年,丹麦生物化学家Linderstrom-Lang把球形蛋白质的分子结构划分为三个不同的组织层次(level, hierarchy):一级结构(primary structure)指多肽链中氨基酸残基的数目、组成及其排列顺序(N-端→C-端),即由共价键维系的多肽链的一维(线性)结构,不涉及空间排列。二级结构(secondary structure)是多肽链主链(backbone)在氢键等次级键作用下折叠成的构象单元或局部空间结构,未考虑侧链的构象和整个肽链的空间排布。三级结构(tertiary structure)则指整个肽链的氨基酸残基侧链基团互相作用以及与环境间的相互作用下形成的三维结构。1958年英国晶体学家Bernal发现寡聚蛋白由具有三级结构的亚

1

基在次级键作用下结合而成,遂把寡聚体内亚基的空间排列称为四级结构(quaternary structure)。上述蛋白质分子一、二、三、四级结构的概念已被国际生物化学与分子生物学学会命名委员会正式采纳和定义。1973年Rossman发现相邻的二级结构往往形成某种有规律的、空间上可辩认的、更高层次的折叠单元,称为超二级结构(super-secondary structure)或折叠单元(folding unit),主要涉及这些构象元件在空间上如何聚集。与此同时,Wetlaufer观察到蛋白质分子中存在相对稳定的球状亚结构,其间由单肽链相互连接,命名为结构域(structural domain)。图1.1和图1.2展示蛋白质(主要指球状蛋白)分子结构的不同层次及其相互联系。

图1.2 球状蛋白分子结构的不同水平

图中A代表组成一级结构的各种氨基酸;S和sS分别代表蛋白质中的二级结构和由它们组合成的超

2 二级结构;D/T表示蛋白质的结构域,如果是单结构域的蛋白质,此结构域即蛋白质的三级结构;同样,

T/α表示由结构域构成的蛋白质的三级结构或亚基;Q代表蛋白质的四级结构,可以是n个相同亚基α装配成的同源聚集体,也可以是n个α亚基和m个β亚基(甚至更多种亚基)形成的异源聚集体。

图1.1 蛋白质分子的结构层次:

A、一级结构,B、二级结构,C、结构域,D、三级结构,E、四级结构,F、大分子子组

1.1.1 蛋白质的一级结构

1.1.1.1 蛋白质氨基酸

氨基酸是蛋白质的构件分子。在蛋白质生物合成中,mRNA指令20种α-氨基酸依次参入,形成特定的多肽链。这20种蛋白质氨基酸除Gly外,其α碳原子均属不对称碳原子,因而都具有光学活性,且均为L-型氨基酸。多肽链中氨基酸残基的侧链基团(R)各不相同,对多肽链的构象有很大影响。蛋白质氨基酸的一些重要参数可参看表1.1。

表1.1 蛋白质氨基酸的某些特性

氨基酸 分子量 体积 可接触面积 疏水性 总频率* 在内部的在外部的频转移自由能 缩写符号 (Da) (?3) (?2) (K-D法相) (%) 频率(%) 率(%) (kcal·mol-1) Ala (A) Arg (R)

71.08 156.20

88.6 173.4 117.7 111.1 108.5 143.9 138.4 60.1 153.2 166.7 166.7 168.7 162.9 189.9 122.7 89.0 116.1 227.8 193.6 140.0

115 225 160 150 135 180 190 75 195 175 170 200 185 210 145 115 140 255 230 155

1.8 (7) -4.0 (20) -3.5 (15) -3.5 (15) 2.5 (5) -3.5 (15) -3.5 (15) 0.4 (8) -3.2 (14) 4.5 (1) 3.8 (3) -3.9 (19) 1.9 (6) 2.8 (4) -1.6 (13) -0.8 (10) -0.7 (9) -0.9 (11) -1.3 (12) 4.2 (2)

8.7 3.1 5.2 6.1 2.7 3.6 4.9 9.0 2.2 4.9 6.5 6.7 1.5 3.8 4.0 7.0 6.4 1.6 4.4 6.6

11.0 0.4 2.0 2.2 5.4 1.3 1.0 9.7 2.4 10.5 12.8 0.3 3.0 7.7 2.2 5.0 4.6 2.7 3.3 12.7

7.9 4.0 6.3 7.4 1.8 4.5 6.2 8.8 2.2 3.0 4.3 8.9 0.9 2.5 4.7 8.9 7.1 1.3 4.8 4.6

0.20 -1.34 -0.69 -0.72 0.67 -0.74 -1.09 0.06 0.04 0.74 0.65 -2.00 0.71 0.67 -0.44 -0.34 -0.26 0.45 -0.22 0.61

Asn (N) 114.11 Asp (D) 115.05 Cys (C) Gln (Q) Glu (E) Gly (G) His (H) Ile (I) Leu (L) Lys (K)

103.13 128.14 129.12 57.06 137.15 113.17 113.17 128.18

Met (M) 131.21 Phe (F) Pro (P) Ser (S) Thr (T)

147.18 97.12 87.08 101.11

Trp (W) 186.21 Tyr (Y) Val (V)

163.18 99.14

*46种蛋白质共5436个残基中各种氨基酸残基所占百分比为总频率;在分子内部每种残基总数被内部残基总数(1396)除所得百分比为在内部的频率;在分子表面每种残基总数除以表面残基总数(4040)得到的百分比为在表面的频率。

根据侧链基团的性质,20种蛋白质氨基酸可划分为非极性氨基酸(Ile、Val、Leu、Phe、Ala、Pro、Met、Trp)和极性氨基酸,后者又可分为碱性氨基酸(Arg、Lys、His)、酸性氨基酸(Asp、Glu)和中性氨基酸(Gly、Cys、Ser、Thr、Tyr、Asn、Gln)。一般认为,如果发生同类氨基酸取代,不会对蛋白质的结构和性质产生明显影响。但是,如果这种取代发生在蛋白质的关键位点,尤其是许多同类氨基酸的翻译后修饰有很大区别,

3