高通量名词解释 下载本文

内容发布更新时间 : 2024/6/29 13:22:43星期一 下面是文章的全部内容请认真阅读。

高通量测序常用名词汇总

一代测序技术: 即传统的 Sanger 测序法, Sanger 法是根据核苷酸在待定序列模板上的引 物点开始, 随机在某一个特定的碱基处终止, 成,每个反应含有所有四种脱氧核苷酸三磷酸

并且在每个碱基后面进行荧光标记,

T、 C、 G 结束的四组不同长度的一系列核苷酸,每一次序列测定由一套四个单独的反应构

(dNTP) ,并混入限量的一种不同的双脱氧核

苷三磷酸 (ddNTP) 。由于 ddNTP 缺乏延伸所需要的 3-OH 基团,使延长的寡聚核苷酸选择 性地在 G、A、T 或 C 处终止,使反应得到一组长几百至几千碱基的链终止产物。它们具有 共同的起始点, 但终止在不同的的核苷酸上, 片段,通过检测得到 DNA 碱基序列。 二代测序技术: next generation sequencing

产生以 A、

可通过高分辨率变性凝胶电泳分离大小不同的

( NGS )又称为高通量测序技术,与传统测序

相比,二代测序技术可以一次对几十万到几百万条核酸分子同时进行序列测定, 一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(

+

从而使得对

Deep

sequencing )。 NGS 主要的平台有 Roche ( 454 & 454 ), Illumina ( HiSeq 2000/2500

GA IIx 、 MiSeq ), ABI SOLiD 等。

基因 :Gene ,是遗传的物质基础, 是 DNA 或 RNA 分子上具有遗传信息的特定核苷酸序列。 基因通过复制把遗传信息传递给下一代,使后代出现与亲代相似的性状。 DNA :Deoxyribonucleic acid

,脱氧核糖核酸,一个脱氧核苷酸分子由三部分组成:含氮碱

基、脱氧核糖、磷酸。脱氧核糖核酸通过 的载体。

RNA :Ribonucleic Acid

3',5'- 磷酸二酯键按一定的顺序彼此相连构成长链,

是绝大部分生物遗传信息

即 DNA 链,DNA 链上特定的核苷酸序列包含有生物的遗传信息,

,,核糖核酸,一个核糖核苷酸分子由碱基,核糖和磷酸构成。核

糖核苷酸经磷酯键缩合而成长链状分子称之为 毒、类病毒中的遗传信息载体。不同种类的 参与蛋白质生物合成的

RNA 链。RNA 是存在于生物细胞以及部分病 RNA 链长不同,行使各式各样的生物功能,如

RNA 有信使 RNA 、转移 RNA 和核糖体 RNA 等。

16S rDNA :\是沉降系数, 是反映生物大分子在离心场中向下沉降速度的一个指标, 高,说明分子越大。 rDNA ( ribosome DNA )指的是原核生物基因组中编码核糖体 (rRNA )分子对应的 DNA 序列, 16S rDNA rDNA 是细菌染色体上编码 16S rRNA

是原核生物编码核糖体小亚基

值越 RNA

16S rRNA 的基

因。细菌 rRNA (核糖体 RNA )按沉降系数分为 16S rRNA 普遍存在于原核生物中。 16S rRNA

3 种,分别为 5S 、16S 和 23S rRNA 。16S 分子,其大小约

将 16S rDNA

相对应的 DNA 序列,存在于所有细菌染色体基因中。

1540bp ,既含有高度保守

恒定区

片段扩增出来, 通过高通量

的序列区域, 又有中度保守和高度变化的序列区域, 序列基本保守, 所以可利用恒定区序列设计引物,

其可变区序列因细菌不同而异,

测序利用可变区序列的差异来对不同菌属、菌种的细菌进行分类鉴定。 cDNA : complementary DNA ,互补脱氧核糖核酸,与 为模板,在反转录酶的作用下所合成的

DNA 。

RNA 链互补的单链 DNA ,以 RNA

Small RNA :生物体内一类高度保守的重要的功能分子, 其大小在 18-30nt ,包括 microRNA 、

)等,它的主要功能是诱导基

siRNA 、 snRNA 、 snoRNA 和 piRNA (piwi-interacting RNA 因沉默,调控细胞生长、发育、基因转录和翻译等生物学过程。以 功能: miRNA 与 RNA 诱导沉默复合体( 将此复合体与其互补的

序列降解或干扰靶序列蛋白质的翻译过程。

mRNA 序列结合,根据靶序列与

miRNA 为例介绍它们的

)结合,并

RNA induced silencing complex, RISC

miRNA 的互补程度,从而导致靶

SD 区域: Segment duplication ,串联重复是由序列相近的一些 DNA 片段串联组成。串联

重复在人类基因多样性的灵长类基因中发挥重要作用。 Genotype and phenotype

:基因型与表型,基因型是指某一生物个体全部基因组合的总

称;表型,又称性状,是基因型和环境共同作用的结果。

基因组 :Genome ,单倍体细胞核、细胞器(线粒体、分子或 RNA 分子。

叶绿体)或病毒粒子所含的全部

DNA

全基因组 de novo 测序 :又称从头测序,它不依赖于任何现有的序列资料,而直接对某个

物种的基因组进行测序, 然后利用生物信息学分析手段对序列进行拼接、 物种的基因组序列图谱。

全基因组重测序 :对已有参考序列(

组装,从而获得该

Reference Sequence )物种的不同个体进行基因组测

全基因组重测序能够发现大量的

, CNV )、插入缺失

序,并以此为基础进行个体或群体水平的遗传差异性分析。 单核苷酸多态性位点(

SNP )、拷贝数变异( Copy Number Variation

( InDel , Insertion/Deletion )、结构变异( Structure Variation ,SV )等变异类型,以准确快速的方法将单个参考基因组信息上升为群体遗传特征。

转录组 : Transcriptome ,是指特定生长阶段某组织或细胞内所有转录产物的集合;狭义上指所有 mRNA 的集合。

转录组测序 :对某组织在某一功能状态下所能转录出来的所有 态下的该物种的几乎所有转录本序列信息。通常转录组测序是指对 关序列的过程。其根据所研究物种是否有参考基因组序列分为转录组 考基因组序列)和转录组重测序(有参考基因组序列)。

RNA 进行测序,获得特定状

mRNA 进行测序获得相

de novo 测序(无参

外显子组 : Exome ,人类基因组全部外显子区域的集合称为外显子组,是基因中重要的编码蛋白的部分,并涵盖了与个体表型相关的大部分的功能性变异。

外显子组测序 :是指利用序列捕获技术将全基因组外显子区域

DNA 捕捉并富集后进行高通

量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的 SNP 、 InDel 等具有较大的优势。

目标区域测序: 应用相关试剂盒对基因组上感兴趣的目标区域进行捕获富集后进行大规模测序,一般需要根据目标区域专门定制捕获芯片。

宏基因组: Metagenome ,指特定生活环境中全部微小生物遗传物质的总和。它包含了可培养的和未可培养的微生物的基因。目前主要指环境样品中的细菌和真菌的基因组总和。

宏基因组 16S rRNA 测序 :可以对特定环境下的细菌和古细菌群体的微生物种类和风度进

16S rRNA 的 PCR 产物平行测序,可

行有效的鉴定。对不同地点、不同条件下的多个样本

以比较不同样本间的微生物组成及成分差异,进而阐明物种丰度、种群结果等生态学信息。 表观遗传学 :Epigenetics ,是指在基因组 DNA 性状发生了可遗传的变化。 核仁显性,休眠转座子激活和 全基因组甲基化测序

序列没有改变的情况下,基因的表达调控和

表观遗传的现象很多, 已知的有 DNA 甲基化( DNA methylation ),

),基因沉默( gene silencing ),

基因组印记( genomic impriting ),母体效应( maternal effects

RNA 编辑( RNA editing )等。

:DNA 甲基化是指在 DNA 甲基化转移酶的作用下,在基因组

CpG 二 DNA 甲基

核苷酸的胞嘧啶 5' 碳位共价键结合一个甲基基团。 DNA 甲基化已经成为表观遗传学和表观

DNA 用标准亚硫

U,经 PCR

基因组学的重要研究内容。甲基化是基因表达的主要调控方式之一,研究染色体 化情况是了解基因调控的重要手段。对已经有参考基因组的物种的基因组 酸氢盐( Bisulfite )处理后,未甲基化的胞嘧啶 替换为胸腺嘧啶 T,而发生甲基化的胞嘧啶

C 会脱氨基形成尿嘧啶

扩增, U

C 保持不变。将处理组与参考基因组序列进行

比对,可发现甲基化位点并对甲基化情况进行定量分析的方法叫做全基因组甲基化测序。 ChIp-Seq :Chromatin Immunoprecipitation sequencing 即通过染色质免疫共沉淀技术特异性地富集目的蛋白结合的 片段进行纯化与文库构建,

相互作用的 DNA 片段的方法叫做 ChIP-Seq 。 数字表达谱 :Digital Gene Expression Profile 况,即运用特定的酶对

,即染色质免疫共沉淀

-测序技术,

DNA 片段。对富集得到的 DNA

然后进行高通量测序, 从而得到全基因组范围内可以与目的蛋白

,利用新一代高通量测序技术和高性能计算

分析技术,能够全面、经济、快速地检测某一物种特定组织在特定状态下的基因表达情

mRNA 距 polyA tail 21-25nt

的位置进行酶切,所获得的带

polyA

尾的序列 (Tag) 通过高通量测序,该 tag 被测得的次数即是对应基因的表达值。数字基因表 达谱已被广泛应用于基础科学研究、医学研究和药物研发等领域。特点是经济,但获得 的数据量有限。若想获得转录本的更多信息的话,一般都采用转录组测序的方法来测序。 SBS : sequencing by synthesis ,边合成边测序反应,是指在 基所进行的测序。

DNA 聚合酶的作用下延伸碱

Run :指高通量测序平台单次上机测序反应。