内容发布更新时间 : 2024/11/6 7:02:14星期一 下面是文章的全部内容请认真阅读。
CRISPR/Cas9-based genome editing technology
A robust CRISPR/Cas9 vector system for multiplex targeting of
genomic sites in monocot and dicot plants
亚热带农业生物资源保护与利用国家重点实验室
华南农业大学生命科学学院
刘耀光课题组
(ygliu@scau.edu.cn)
1. pYLCRISPR/Cas9多靶点载体介绍
CRISPR/Cas9是新近发展的基因组编辑技术(图1)。CRISPR/Cas9切割靶序列仅需要single-guide RNA (sgRNA)以及由sgRNA引导的Cas9蛋白,比锌指核酸酶(ZFNs),TALENs更加简便,高效,因而成为基因组编辑工具的首选。
我们利用CRISPR/Cas9技术可方便地进行多重靶向的特征,构建了一套用于单子叶和双子叶植物的多靶点CRISPR/Cas9基因打靶载体系统。
本套载体将Cas9蛋白表达盒整合到双元载体上,用于装载多个sgRNA表达盒的多克隆位点Bsa I位于靠近双元载体RB位置。sgRNA表达盒元件设在中间质粒载体上,利用酶切连接和PCR方法拼装好,再利用Golden Gate或Gibson Assembly克隆方法组装到双元载体上。
Cas9 nucleaseRuvC-like domainHNH domainTarget Site PAMNGGNNNNNNNNNNNN-3’genome NCCNNNNNNNNNNNN-5’sequenceAA5’ NNNNNNNNNNNN3’ NNNNNNNNNNNNGNNNNNNNNNNNNNNNNNNNCleavage siteNNNNNNNNNNNNNNNNNNNN5’-G/ANNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAACUAUUGCCUGAUCGGAAUAAAAUUCGAUAGAAFigure 1. A working model of the CRISPR/Cas9 system. The Cas9-sgRNA complex locates to the target site to cleave the DNA to produce double strand break (DSB).
1
CUUGAAAAAGUGGCACCGAUUUUU-3’GCGUGGCU
2.CRISPR/Cas9载体与sgRNA载体图谱
2.1CRISPR/Cas9双元载体
本套载体系统的双元载体骨架为pCAMBIA-1300 (ACCESSION: AF234296),Cas9p为本实验室设计合成的植物优化密码子基因,它模拟了禾本科植物基因具有5’端GC含量较高的特征 (Figure 2)。
这些质粒在E. coli TOP10F’(LacIq) 菌株繁殖,该菌株LacIq基因型产生的阻碍蛋白可抑制ccdB大肠杆菌致死基因的表达。
pYLCRISPR/Cas9Pubi-H, -B载体中的Cas9p用pUbi驱动,优选用于单子叶植物的基因打靶;对于双子叶植物,目前优先使用pYLCRISPR/Cas9P35S-H, -N,-B。我们用pYLCRISPR/Cas9Pubi-H在拟南芥也打靶成功,但与pYLCRISPR/Cas9P35S-H对拟南芥的打靶效率比较正在测试中。
我们对pYLCRISPR/Cas9载体采用了新的命名,与旧的命名对应关系见表1。
Figure 2. A CRISPR/Cas9 system for monocot and dicot plants.
pYLCRISPR/Cas9Pubi-H, -B (above); pYLCRISPR/Cas9P35S-H, -N,-B (below); HPT (-H), Bar (-B), and NPT II (-N) encode hygromycin B phosphotransferase, PPT acetyltransferase and neomycin phosphotransferase II, respectively. NLS, nuclear localization sequence. The key sequences including restriction sites for cloning and analysis of sgRNA expression cassettes are given. Two Bsa I-cutting sties [Bsa I (B-L) and Bsa I (B-R)] for cloning the sgRNA expression cassettes are
separated by a shorten form of the ccdB negative selection gene.
2
表一 pYLCRISPR/Cas9载体新旧命名对应关系 新命名
pYLCRISPR/Cas9Pubi-H
原命名
pYLCRISPR/Cas9-MH, pYLCRISPR/Cas9-MTmono
pYLCRISPR/Cas9Pubi-B pYLCRISPR/Cas9P35S-H pYLCRISPR/Cas9P35S-B pYLCRISPR/Cas9P35S-N
pYLCRISPR/Cas9-MB pYLCRISPR/Cas9-DH pYLCRISPR/Cas9-DB pYLCRISPR/Cas9-DN
单子叶/双子叶 双子叶 双子叶 双子叶
草甘磷 潮霉素 草甘磷 卡那霉素
适用植物种 单子叶/双子叶
植物抗性 潮霉素
2.2 CRISPR/sgRNA vectors
sgRNA序列全长96 nt,分为两部分,5’决定靶序列的20碱基 (seed sequence)和3’区域为保守的结构序列。因此构建针对特定靶位点的sgRNA,只需要克隆决定靶序列的5’端20 nt (seed sequence)。 sgRNA用small nuclear (sn) RNA U6/U3启动子驱动,以保证转录出的sgRNA停留在细胞核中与Cas9结合。
本方案用PCR扩增的方法构建包含靶序列的sgRNA表达盒,并在扩增引物5’端引入顺次排列的位置特异Bsa I 酶切位点,用于Golden Gate克隆。或在扩增引物5’端加入互补序列用于Gibson Assembly 连接克隆。
为了提高构建好的多靶点载体的稳定性,避免在农杆菌或者植物基因组中sgRNA表达盒之间发生同源重组,从水稻克隆了4个不同snRNA启动子(OsU3,OsU6a,OsU6b,OsU6c),用于单子叶植物;从拟南芥中克隆了4个不同snRNA启动子(AtU3b,AtU3d,AtU6-1,AtU6-29),用于双子叶植物。
3
Figure 3.(A) Overall structure of eight basic sgRNA intermediate vectors. (B) The two Bsa I cutting
sequences are given in twelve sgRNA vectors (in a linear form), including other four vectors (pYLsgRNA-OsU3/LacZ, pYLsgRNA-OsU6a/LacZ, pYLsgRNA-AtU3b/LacZ, and pYLsgRNA-AtU3d/LacZ) that have an additional LacZ gene (198 bp) as a cloning selection marker. The U3 and U6 promoters from rice (Os) and Arabidopsis (At) and the sgRNA sequence are separated by the vector backbone, to avoid amplification of the uncut plasmids by PCR with short extension time during the construction of sgRNA expression cassettes. Cutting (small arrows) with Bsa I produces different non-palindromic sticky ends to the promoters and an end to the sgRNA sequence. (C) A representative regular target and an irregular target, their target adaptors for the OsU6a promoter, and the transcribed 5’ sequences are shown. A ligated target-sgRNA expression cassette is amplified by nested PCR using primers U-F/gR-R and Pps/Pgs. Pps and Pgs are position-specific primers with Bsa I sites for the Golden Gate ligation (Table S1), or with overlapping ends for Gibson Assembly (Table S3).
3.靶位点选择和接头设计
3.1 靶位点选择
建议对1个目的基因设计2个靶点(尤其只有一个靶基因),以降低某靶点打靶不成功的风险。可在ORF 5’区和功能结构域各设计1个靶点,使之任何1个靶点的突变都可以产生功能缺失,或2个靶点之间的序列被敲除。设计靶点的原则:
(1) 目的基因的正链和负链靶点的打靶效率大致相同,都可以设计靶点; (2) Regular targets & irregular targets (见以下说明)有同等打靶效率;
(3) 靶点的GC%尽量不要低于40%,靶点序列GC%偏高(50-75%)有较高的打靶效率。靶点内(按
5-N20NGG-3方向)不要有连续4个以上的T,以防RNA Pol III将其作为转录终止信号;
(4) 虽然非特异打靶(脱靶)对植物基因打靶不是很重要的问题,但应进行靶点特异性分析:用靶点+NGG
(前后各加几十碱基)与基因组做blast (选Somewhat similar sequences),避免使用与同源序列差异少于5个碱基的靶点(在切点附近和PAM可有2个碱基差异就具有特异性)。可以使用在线软件CRISPR-P (http://cbi.hzau.edu.cn/crispr/)做这个分析,但可使用的靶点序列不一定为Regular targets (AN19NGG或GN19NGG),见以下关于Regular target & irregular target说明。
(5) 打算用一个靶序列敲除2个或以上的同源基因时,选择同源基因中碱基完全相同的区域为靶位点。
(6) 把靶点序列连接到sgRNA序列的5’端[(20 bp target)GTTTTAGAGCTAGAAATAGCAAGTTAAAATAA
GGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT],利用在线软件
(http://mfold.rna.albany.edu/?q=mfold/RNA-Folding-Form2.3)做二级结构分析。靶序列与sgRNA序列产生连续配对7 bp(注意:RNA可以产生U-G配对)以上会抑制其与染色体DNA靶序列结合靶点,因此要避免使用连续配对7 bp以上的靶序列。
3.2靶点接头设计
U6/U3基因由III型RNA聚合酶转录,转录起始点是确定的碱基位置。例如,U6为G碱基,U3为A碱基。因此,由U6/U3启动子驱动的sgRNA首碱基一定是G或者A。但是设计的靶序列的首碱基不一定刚好是G或者A,因此设计接头引物时需分两种情况考虑: (1)如果目标区NGG(PAM)上游第20碱基是A(用U3启动子)或G(用U6a~c启动子),作为常规靶点(regular target),将A/G下游19碱基可按下图所示合成接头。
4