撰文 | 木蘭之枻
責編 | 兮
自CRISPR-Cas系統的機制被釐清並被改造用於真核細胞的基因編輯之後,相關基因編輯工具的開發、改造和應用呈現出爆炸式的增長,這也讓終極夢想—「隨心所欲」的精準基因編輯—不再遙不可及。目前而言,CRISPR-Cas相關的工具在基因編輯、轉錄調控、表觀遺傳學修飾、RNA編輯(詳見BioArt報道:『珍藏版』綜述 | RNA靶向的CRISPR系統——從宏基因組到RNA調控 )和核酸檢測等多個研究領域均有重要應用。近年來以改變基因組DNA序列為目標的基因編輯工具的開發更是突飛猛進:除最基本的Cas核酸酶外,單鹼基編輯器(base editors)、Cas轉座及重組酶系統和引導編輯器(prime editors)的出現讓基因編輯有了更多選擇。不同的基因編輯工具各有其適用場景,此外,研究者也正針對各類工具在編輯活性、編輯範圍和編輯特異性中的不足之處加以改進,這讓CRISPR-Cas相關的基因編輯工具更加多樣化,卻也讓工具的合理選擇和針對性優化更具挑戰性。
2020年6月22日,來自美國哈佛大學與麻省理工學院Broad研究所的David R. Liu實驗室在Nature Biotechnology發表題為Genome editing with CRISPR–Cas nucleases, base editors, transposases and prime editors的綜述。文章重點關注CRISPR-Cas相關的基因編輯工具,分別對Cas核酸酶、單鹼基編輯器、Cas轉座及重組系統和引導編輯器(圖1)的編輯特性、應用場景及近來的發展態勢進行了總結,希望此文能為CRISPR-Cas系統的應用和研究人員在工具的合理選擇和針對性優化過程中提供指導。


圖1 本文所關注的基因編輯系統
CRISPR-Cas核酸酶介導的基因組編輯
CRISPR-Cas系統是細菌和古細菌的適應性免疫系統,因其嚮導RNA的可程式設計特性和Cas核酸酶在多種細胞和組織中的明顯活性而被廣泛用於基因編輯研究。本小節著眼於自然界中發現的多種Cas核酸酶,對其在基因編輯中的多種應用方式進行總結,並對以拓展編輯範圍和增加酶切特異性為目標的各種Cas突變體的開發加以彙總。
目前的研究表明,自然界中的CRISPR-Cas系統可分為兩大類:1型藉助於多蛋白複合物實現核酸的切割;2型則依賴於單一的蛋白核酸酶實現切割。考慮到單一核酸酶的應用優勢,2型CRISPR系統被廣泛用於生物醫學的基礎和轉化研究。此外,根據Cas核酸酶的不同,類型2可細分為II、V和VI三種亞類,其中大多數II型Cas9和V型Cas12 具有RNA介導的DNA內切酶活性;而VI型Cas13蛋白則具有靶向和切割RNA的能力。此處將著眼於能實現DNA編輯的Cas9和Cas12核酸酶。
Cas9核酸酶 自然界中,Cas9需要依賴於兩條短鏈的 crRNAs(CRISPR來源的RNAs)和 tracrRNA(反式作用的crRNA)方能形成功能性的核糖核蛋白複合物發揮切割雙鏈DNA的功能。而後研究者將crRNA與tracrRNA融合獲得單鏈嚮導RNAs(sgRNAs),sgRNA可引導Cas9定位至含特定PAM序列的靶位點DNA處,隨後開啟雙鏈DNA的解旋並誘導RNA-DNA雜合鏈的形成。此過程中,非互補的DNA鏈被嚮導RNA替換,最終形成單鏈DNA的「R-loop」結構。Cas9切割雙鏈DNA時,主要在PAM位點上游3bp處引入平末端的DSBs。
R-loop的形成會改變Cas9構象而激活其核酸酶功能域,最終誘導DNA雙鏈斷裂(DSBs)。Cas9對DNA雙鏈的切割分別依賴於HNH和類RuvC兩大功能域。失活單一的核酸酶功能域可獲得Cas9單切口酶;而同時失活兩種核酸酶功能域則可獲得仍保留結合DNA能力的失活型Cas9(dCas9)。
目前用於真核生物基因編輯的Cas9同源蛋白眾多,它們在大小、PAM特性、嚮導RNA結構、間隔序列長度、編輯效率和編輯特異性上各有特點。這讓研究者在應用中有了更多選擇。
Cas12核酸酶 與Cas9不同,Cas12核酸酶只有單一的類RuvC核酸酶功能域發揮誘導DSBs的功能。Cas12核酸酶依賴於單一的crRNA引導實現DNA定位,並在原間隔序列的遠PAM端切割併產生粘性末端,這與Cas9通常在近PAM端切割產生平末端的特性恰好相反。
Cas12a(早期被命名為Cpf1)是最早被發現並廣泛用於基因組編輯的Cas12核酸酶,它可以通過自身的RNA酶功能域對包含多個crRNA的表達陣列進行剪切,從而實現多基因同時編輯。此外,多種Cas12同源蛋白在完成對目標位點的識別並激活內在的核酸酶活性之後,會無差別的切割單鏈DNA和RNA,這一特性可被用於核酸檢測(詳見BioArt報道:一個悲喜參半的故事丨植生所王金博士等報道Cas12a對於靶標ssDNA和非靶標ssDNA的切割特性研究 )。
修復通路 細胞內存在多種DSBs的修復機制,細胞類型、細胞狀態以及DSBs的特性均會影響修復機制的選擇。總體而言,DSBs修復機制可分兩大類:一是斷裂的DNA雙鏈末端連接,此過程中通常會隨機引入插入缺失突變;另一類則是DNA模板介導的同源重組修復(HDR)。在絕大多數哺乳動物細胞中,末端連接途徑佔據主流,而HDR則通常只在分裂的細胞中發揮修復作用,且依賴於多種主要在細胞S期和G2期表達的蛋白。
總體而言,CRISPR-Cas核酸酶誘導的DSBs主要由末端連接介導的易錯通路加以修復。為增強HDR介導的修復效率,研究者嘗試過多種策略,一種策略是使用Cas9單切口酶抑制DSBs的形成並增強HDR修復效率;此外,HDR修復效率還可通過基因沉默、小分子抑制劑或蛋白過表達等方式抑制非同源末端連接修復或增強HDR通路活性等策略加以提高。不過,考慮到DNA修復蛋白的重要性,這類策略通常難以用於在體研究。為改善HDR修復的效率,研究者還嘗試多種其它策略,或對DNA模板加以優化,或促進模板DNA在DSBs位點的富集,或增強細胞週期的同步化,或使用AAV病毒基因組做模板。雖然這類策略可不同程度的改善HDR修復效率,絕大多數情況下,細胞內DSBs修復的主要途徑依然是非同源末端連接介導的易錯修復,這在非分裂細胞中尤為明顯。
值得注意的是,除了激活DNA修復通路,細胞內DSBs的產生還可能引發不可預知的安全風險:導致非必要的基因組改變如染色體易位和大片段缺失,p53通路的活化等等(詳見BioArt報道:NBT丨CRISPR編輯技術面臨新的安全隱患——胡家志點評;特別關注丨 CRISPR-Cas9系統的新風險——破壞DNA-PK依賴的修復通路引發DNA損傷;Nat Genetics | Cas9蛋白本身可激活p53通路並促進p53失活型突變的擇性富集),這種潛在的安全風險提示我們,CRISPR-Cas系統仍有諸多有待優化之處。
拓展編輯範圍為目的的Cas9突變體的開發 在CRISPR-Cas技術的研發過程中,拓展其編輯範圍是研究的主要方向之一。Cas蛋白要實現DNA定位,主要依賴於PAM序列。目前發現的多種Cas9及Cas12同源蛋白對PAM序列的要求各不相同,這種多樣性也被研究者充分利用,以拓展基因組的可編輯範圍。不過目前PAM序列依然嚴重限制了CRISPR-Cas系統的應用,使得基因組的很大一部分難以被編輯。為此,眾多研究者努力的改造優化Cas9和Cas12蛋白,以求最大程度的解除PAM對其應用的限制(詳見BioArt報道:特別推薦丨基因魔剪CRISPR/Cas9新進展——新型利器xCas9 3.7利刃出鞘;NBT | 升級版ScCas9——高活性、高特異性與更好的PAM兼容性;Science | 擺脫PAM困擾—Cas9強勢升級獲得基因編輯新利器SpRY)。
目前,自然界來源的Cas同源蛋白及其各種突變體可識別的PAM特徵序列已經過半,這標誌著該領域已取得長足進步。不過,進一步改善Cas蛋白的編輯範圍依然任務艱鉅,這其中尤以非嘌呤PAM序列的識別最具挑戰性。目前的研究多集中於SpCas9編輯範圍的拓展,不過Cas12同源蛋白及突變體的研究依然值得重視。此外,研究者還注意到,Cas突變體的活性普遍不如其野生型蛋白,這在人類疾病動物模型的研究及部分內源蛋白結合的DNA位點處尤為顯著。因此,構建更具活性的Cas突變體並進一步拓展其PAM特徵序列將是未來研究的重要方向。
改善編輯特異性為目的的Cas9突變體的開發 Cas核酸酶介導的精準編輯依賴於其區分靶位點和高相似度非靶位點的能力。雖然部分Cas9及Cas12同源蛋白本身具有較高特異性,當下研究的熱點之一依然是開發Cas突變體以增強其區分靶位點序列和高相似度非靶位點的能力,從而提高Cas系統的編輯特異性。當下可檢測Cas核酸酶脫靶活性的高靈敏度方法的開發極大的推動了高特異性Cas突變體的研究。
改善編輯特異性的思路之一是藉助於結合於臨近位點的兩個Cas9以誘導單一的DSB。此外研究者通過構建Cas9的突變體為改善Cas9蛋白本身的編輯特異性。除針對Cas蛋白進行突變外,研究發現對sgRNAs進行優化有助於脫靶活性的降低(詳見BioArt報道:Nat Biotech丨提高CRISPR特異性的新方法)。
儘管高特異性Cas突變體的研究取得了長足進步,研究者注意到,這類突變體的靶位點編輯活性常不盡如人意。此外,大多數高特異性Cas9突變體對嚮導RNA有更高要求,嚮導RNA的些許改變很可能導致其活性的喪失。這一系列不足之處極大的限制了高特異性Cas9突變體的應用,因此對CRISPR-Cas系統進行進一步的優化,在降低脫靶活性的同時保持其有效的靶位點編輯活性,並保障系統與各類嚮導RNA變體的兼容性,是未來研究的重要方向。
單鹼基編輯器介導的基因組編輯
單鹼基編輯器無需誘導DSBs和補充DNA模板的條件下便可實現靶位點的精準點突變,且該過程不依賴於HDR修復途徑。目前可用的單鹼基編輯器是將活性受損的CRISPR-Cas核酸酶(無誘導DSBs的能力)與單鏈DNA脫氨基酶融合而得,特定條件下,還需融合可調控DNA修復機制的蛋白。現有的單鹼基編輯器有兩大類:一類是融合胞苷脫氨基酶的胞嘧啶鹼基編輯器(CBEs),可催化C·G–T·A鹼基對的轉換;另一類則是融合優化過TadA*脫氧腺苷脫氨基酶的腺嘌呤鹼基編輯器(ABEs),可實現A·T–G·C鹼基對的轉換。CBEs和ABEs可有效介導四種鹼基轉換突變(C-T,A-G,T-C和G-A),這類突變約佔目前人類致病變異的30%。目前單鹼基編輯器被廣泛用於多種細胞系和模式生物中,並用於多種人類遺傳病動物模型的構建和治療(詳見BioArt報道:異軍突起:單鹼基基因編輯技術)。
單鹼基編輯過程中目標核苷酸的單鹼基編輯依賴於脫氨基酶與底物核苷酸的結合,其中可被有效編輯的核苷酸位置被定義為單鹼基編輯的「活性窗口」。對於以SpCas9為基礎的經典CBEs和ABEs,其活性窗口主要位於前間隔序列的第4-8位(前間隔序列的起始核苷酸定義為1位,PAM定義為21-23位),當然,活性窗口並非完全固定,還會受到DNA狀態如染色體結構的影響。
活性窗口中底物核苷酸的脫氨基化會導致尿嘧啶和次黃嘌呤的形成,為改善單鹼基編輯的效率, CBEs系統中通常會進一步融合尿嘧啶糖基化酶抑制劑(UGIs)蛋白以抑制細胞對基因組中尿嘧啶鹼基的修復。此外,多數單鹼基編輯器均採用Cas單切口酶以切斷未編輯的DNA鏈,從而促進以發生編輯的DNA鏈為模板的修復,最終促進靶位點鹼基對的穩定編輯。研究者還發現,對融合蛋白間的接頭序列加以優化,或增加UGI功能域的數目可進一步提高CBEs的編輯效率。而通過核定位序列的增加和密碼子優化可進一步提高編輯效率。除此之外,研究者還針對單鹼基編輯器的編輯範圍、編輯效率及產物的純度做了更多優化。
單鹼基編輯器編輯範圍的拓展 單鹼基編輯器藉助於Cas蛋白實現DNA定位,進而實現靶位點處特定活性窗口內目標核苷酸的精準編輯。因此,PAM序列對單鹼基編輯器的編輯範圍有重要影響。為此早期研究者致力於使用可識別不同PAM的Cas同源蛋白和突變體以拓展單鹼基編輯器的編輯範圍。
此外,通過將脫氨基酶與不同的Cas同源蛋白融合,研究者可獲得小型化的單鹼基編輯器以用於AAV病毒的包裝和遞送。此外,研究者還利用內含肽對單鹼基編輯系統加以拆分,從而可通過雙AAV系統實現高效的在體單鹼基編輯。
考慮到各類基因編輯工具的靶位點編輯效率因位點、細胞類型和細胞狀態而異,開發更為多樣化的單鹼基編輯工具對單鹼基編輯的未來應用有重要意義。
R-loop與脫氨基酶相互作用的調整 R-loop和單鏈DNA的形成是單鹼基編輯器發揮功能的關鍵。脫氨基酶與R-loop的相互作用對單鹼基編輯器的效率有決定性影響。通常活性窗口位於R-loop中最易接近的核苷酸位點。研究者發現,更換不同類型的Cas蛋白或脫氨基酶對活性窗口也有重要影響。這或許是因為Cas蛋白和脫氨基酶的改變會對R-loop與脫氨基酶的相互作用產生重要影響。
當下關於Cas同源蛋白及其突變體的研究進展迅速,適用於單鹼基編輯的脫氨基酶及其突變體的篩選也取得重要成果,它們之間的不同組合極大的豐富了單鹼基編輯的工具箱,也讓R-loop與脫氨基酶之間的相互作用有了更多變化,由此獲得的單鹼基編輯器也擁有了更為多樣化的活性窗口,這讓單鹼基編輯器更具應用潛力。
單鹼基編輯脫靶風險的改善 單鹼基編輯的脫靶效應較為複雜,除非靶位點的突變外,還包括靶位點處目標鹼基的顛換(C·G—[A·T或G·C]; A·T—[T·A或C·G]),靶位點處非目標鹼基的突變及靶位點處的插入缺失突變。
鹼基顛換突變常見於CBEs中,源自DNA糖基化酶切除DNA中尿嘧啶產生的無鹼基位點的易錯修復。研究者發現,增加UGI的拷貝數或促進其表達有助於降低鹼基顛換的發生頻率。
靶位點處非目標鹼基的突變與單鹼基編輯器的活性窗口關係密切。活性窗口過寬易引入非目標鹼基的突變,研究者已開發出多種活性窗口更窄的CBEs以降低非目標鹼基的突變風險,但針對ABEs的相關研究目前較為匱乏。
目前應用較為廣泛的單鹼基編輯器多依賴於Cas單切口酶,這極大的降低了靶位點插入缺失突變發生的風險。不過脫氨基化的鹼基在修復過程中易導致編輯鏈的斷裂,而Cas單切口酶則多作用於非編輯鏈,因此單鹼基編輯過程中依然存在DNA雙鏈斷裂的可能。為進一步降低靶位點處插入缺失突變發生的風險,研究者嘗試在CBEs系統中融合Mu Gam蛋白以保護DSBs末端。此外,將單切口酶替換為失活型Cas同樣能有效降低插入缺失突變的風險,不過也會降低靶位點的編輯效率。
除靶位點的脫靶風險外,單鹼基編輯器在DNA和RNA的非靶位點處同樣存在脫靶效應。其中DNA水平的脫靶效應可分為Cas依賴型和Cas非依賴型脫靶。Cas依賴型脫靶在ABEs和CBEs均有發生,可通過使用高特異性的Cas蛋白及突變體、截短型sgRNA和RNP複合物遞送而優化,此外,通過蛋白質工程對脫氨基酶進行改造也可以優化Cas依賴型的脫靶效應。Cas非依賴型脫靶源自脫氨基酶與細胞內基因組中瞬時存在的單鏈DNA的相互作用,主要發生在CBEs系統中。目前研究者主要通過構建脫氨基酶突變體和不同類型的脫氨基酶篩選對此加以優化。
由於CBEs和ABEs系統中的脫氨基酶多可作用於RNA的鹼基發揮脫氨基作用,早期開發的單鹼基編輯器多在RNA水平存在明顯的脫靶效應。目前研究者多通過蛋白質工程構建脫氨基酶的突變體以降低其在RNA水平的脫靶風險。
選用單鹼基編輯器的注意事項 現有的單鹼基編輯器種類繁多且各具特色。單鹼基編輯器種類的多樣化讓研究者有更多選擇空間,卻也讓單鹼基編輯器的合理選擇更具挑戰性。總體而言,選用單鹼基編輯器時須考慮多種因素,包括靶位點附近PAM的可用性,位點的鹼基序列特徵,活性窗口,編輯後產物的單一性和DNA特異性,只有將各關鍵因素綜合考量方能選到合適的單鹼基編輯器。當然近年來人工智慧和機器學習的飛速發展也讓基因編輯模型的構建有了諸多進展,這對工具的合理選擇有重要指導意義。
單鹼基編輯器介導的靶位點隨機突變 除精準編輯之外,在特定條件下,單鹼基編輯器還適用於靶位點的隨機突變。策略之一是使用無UGI融合的CBEs系統;另一種策略則是將胞苷脫氨基酶與腺嘌呤脫氨基酶同時融合於單一的Cas蛋白,由此獲得的單鹼基編輯器可同時誘導C-T和A-G突變(詳見BioArt報道:專家點評4篇NBT | 「」雙劍合璧——李大力組開發新型雙鹼基基因編輯器)。此外,多種胞苷脫氨基酶的串聯融合,或是藉助於MS2和Suntag系統構建的多組分單鹼基編輯器亦可實現靶位點的隨機突變。有研究者還嘗試將易錯DNA多聚酶與Cas9單切口酶融合,獲得的鹼基編輯工具EvolvR在大腸桿菌中可成功實現靶位點隨機突變,且編輯窗口可達350bp。
單鹼基編輯器的未來展望 在諸多研究者的努力下,單鹼基編輯研究進展迅速且極具臨床應用潛力。目前而言,單鹼基編輯器在編輯效率、編輯特異性和在體遞送等方面仍有待進一步優化。此外,開發活性可控的單鹼基編輯器亦將拓展其在基礎研究和臨床治療中的應用前景。
考慮到單鹼基編輯的獨特機制,以及現有單鹼基編輯器CBEs和ABEs在多種分裂細胞、非分裂細胞和在體模型中的優良特性,開發可實現鹼基顛換的單鹼基編輯工具依然讓人期待,這對基因編輯的未來發展有非常重要的意義。
轉座酶和重組酶介導的基因編輯
活細胞基因組中的定向整合一直極具挑戰性。雖然核酸酶和單切口酶介導的HDR可實現基因組中的定向整合,但僅侷限於可分裂的細胞。近年來研究者發現自然界中存在CRISPR轉座酶系統可實現細菌基因組中的定向整合;研究者還將Cas蛋白與轉座酶融合,同樣可實現細菌基因組中的定向整合。此外,研究者還將Cas蛋白與重組酶融合,可在人源細胞中實現目標DNA片段的刪除。
CRISPR轉座酶系統 對CRISPR系統多樣性的探索讓研究者發現了可在細菌中適用的CRISPR轉座酶系統(詳見BioArt報道:專家點評Science+Nature長文| 當CRISPR遇上轉座子——實現位點特異性DNA片段的高效、特異插入)。
dCas-轉座酶及重組酶融合系統 將轉座酶或重組酶與dCas9融合或有助於定向轉座和重組。目前而言,dCas-轉座酶融合系統可在大腸桿菌中發揮一定效果;而dCas-重組酶融合系統則能在哺乳動物細胞中實現目標DNA片段的刪除,當然,其編輯效率不盡如人意,且適用範圍相當有限。
CRISPR轉座酶及重組酶系統的未來發展 CRISPR轉座酶及重組酶系統依然處於起步階段,雖然CRISPR轉座酶系統在體外和細菌系統中的效果令人欣喜,但其仍難以在哺乳動物細胞中發揮功能。因此,深入探究CRISPR轉座酶系統的作用機制並開發真核細胞可用的定向轉座系統將是基因編輯領域的重大突破。
引導編輯(Prime editing)
基因編輯的很多應用場景,特別是哺乳動物基因組中致病突變的誘導和修復,依賴於包括點突變、小片段插入和缺失突變在內的精準基因編輯。如上文所述,CRISPR-Cas核酸酶可誘導DSBs,在末端連接修復途徑下可實現DNA序列的刪減和破壞;而在HDR途徑下則可實現精準修復,不過常伴有嚴重的插入缺失脫靶突變。單鹼基編輯可在不誘導DSBs的條件下實現精準的單鹼基編輯,但只能誘導鹼基轉換而無法實現鹼基顛換。當然,單鹼基編輯也無法實現精準的插入缺失編輯。此外,單鹼基編輯器常會導致靶位點非目標鹼基的脫靶突變,且部分位點由於缺乏合適的PAM序列而難以實現目標鹼基的精準編輯。
2019年出現的引導編輯有著廣譜的編輯能力,理論上可精準誘導所有類型的單鹼基突變、小片段插入和缺失突變 (詳見BioArt報道:專家點評Nature | David Liu再出重磅基因編輯新工具,可實現鹼基隨意轉換與增刪)。
雖然引導編輯的效果令人驚喜,但依然有諸多關鍵問題有待解決。這包括細胞狀態及細胞類型對引導編輯效率的影響;引導編輯過程中涉及的DNA修復機制以及如何實現引導編輯系統的在體應用。此外,現有的引導編輯系統中逆轉錄酶體積過大,這並不利於系統的廣泛應用。因此,探尋適用於引導編輯的小型逆轉錄酶對其未來應用相當關鍵。
總結而言,本綜述對以改變基因組DNA序列為目標的CRISPR-Cas相關的基因編輯系統進行了系統且詳實的總結,這可讓我們對CRISPR-Cas相關的基因編輯系統有較全面的認識,也為基因編輯工具的合理選用提供了重要指導。此外,本綜述對領域面臨的困難與挑戰進行了分析,並對基因編輯研究的未來方向給出了很有深度的見解。
原文連結
https://doi.org/10.1038/s41587-020-0561-9
