近年來(lái),人們對生物的認識不再是簡(jiǎn)單依據實(shí)驗觀(guān)測和描述,而是能夠通過(guò)基因組數據系統的深入解析內在規律?;蚪M研究技術(shù)可為動(dòng)植物序列多態(tài)性、物種栽培與馴化、基因定位、基因編輯、精細育種等提供精準信息。
三代基因組組裝是僅利用Pacbio或者Nanopore平臺得到的超長(cháng)三代數據進(jìn)行基因組序列拼接,從而獲得高質(zhì)量的基因組序列圖譜的過(guò)程。HiFi reads是基于PacBio Sequel II平臺推出的CCS(Circular Consensus Sequencing)測序模式產(chǎn)生的兼具長(cháng)讀長(cháng)和高準確度的測序序列。在這種測序模式下,因酶讀長(cháng)(平均90-100 Kb)遠大于插入片段長(cháng)度(10-20 Kb),測序時(shí),聚合酶會(huì )繞著(zhù)DNA模板進(jìn)行環(huán)形比對測序,使得插入片段被多次測序,產(chǎn)生多條subreads,來(lái)源于同一條模板鏈的subreads經(jīng)過(guò)一致性校正,最終得到高準確度的HiFi reads,用于基因組組裝。
2022年5月HiFi模式再次更新,可以在構建基因組的同時(shí)更快捷方便的獲取全基因組甲基化信息,為基因組的調控挖掘提供了更省力省心的研究途徑。
百邁客HiFi測序數據
對于一個(gè)技術(shù)的應用來(lái)說(shuō),數據是房屋搭建的基礎。更高的產(chǎn)能、更長(cháng)的片段是性?xún)r(jià)比的核心。百邁客自2019年開(kāi)啟HiFi測序以來(lái),不斷自主研發(fā)更新實(shí)驗方法以獲得更高質(zhì)量的數據產(chǎn)出,以下是百邁客部分類(lèi)別物種數據產(chǎn)出:

(注:物種類(lèi)型、組織部位、材料狀態(tài)都是影響數據產(chǎn)出與讀長(cháng)的關(guān)鍵因素,最終產(chǎn)出以實(shí)際項目為準)
基因組應用
(1) 基因組組裝
搭建一個(gè)高質(zhì)量的基因組是物種表型功能研究的重要基礎。因此,在獲得高質(zhì)量HiFi數據后,需要進(jìn)一步將數據拼接來(lái)搭建房屋框架。這里就涉及到組裝軟件的部署、參數調整、組裝結果優(yōu)化、組裝結果的評估等多個(gè)步驟。
① 百邁客組裝APP
百邁客云平臺基因組組裝評估分析APP具有上述提及的多種功能部署,并且只需要在windows平臺界面上進(jìn)行簡(jiǎn)單的鼠標點(diǎn)擊,即可完成最為復雜的基因組組裝、優(yōu)化、結果評估等過(guò)程。該app自上線(xiàn)以來(lái)已完成200余項基因組組裝任務(wù),具有高質(zhì)量+高效+極簡(jiǎn)等特點(diǎn)。
組裝APP分析流程與結果查詢(xún):



部分項目組裝APP運行情況:

(運行時(shí)間與物種特異性以及網(wǎng)站同期負載量相關(guān),項目情況以物種實(shí)際分析周期為準)
② 百邁客動(dòng)植物基因組組裝結果展示(部分)

(contigN50與物種特性、測序深度、染色體平均長(cháng)度有關(guān),項目情況以實(shí)際組裝結果為準)
(2)5mC甲基化
DNA甲基化是表觀(guān)遺傳調控的重要組成部分,在調控基因組印記、X染色體失活、轉座子沉默、基因表達、表觀(guān)遺傳記憶、胚胎發(fā)育和腫瘤發(fā)生等方面發(fā)揮著(zhù)重要作用,其廣泛存在于細菌、植物和動(dòng)物中,現在有的DNA甲基化類(lèi)型主要有以下幾種:5-甲基胞嘧啶(5-mC)、少量的N6-甲基腺嘌呤(N6-mA)及7-甲基鳥(niǎo)嘌呤(7-mG)。
其中,胞嘧啶第5位碳原子上的甲基化(5mC)動(dòng)態(tài)修飾研究得較為深入。?在真核生物中,最常見(jiàn)的甲基化修飾是5mC。5mC 是DNA的CG雙核苷酸的胞嘧啶被選擇性的添加甲基,形成5-甲基胞嘧啶的過(guò)程。其作用方式:①抑制轉錄因子的結合, 從而抑制轉錄過(guò)程;②結合抑制因子, 從而抑制轉錄過(guò)程
5mC 特征
? 哺乳動(dòng)物甲基化多發(fā)生于CpG二核苷酸序列上
? 植物甲基化多發(fā)生于CpG、CHG、CHH
? CpG富集區域多位于基因的啟動(dòng)子區域
? 位于啟動(dòng)子區域的甲基化一般會(huì )抑制轉錄

近日,PacBio 已經(jīng)實(shí)現通過(guò)HiFi測序直接檢測 DNA 樣本中 CpG 位點(diǎn)的 5mC甲基化?;贖iFi 的 5mC 檢測能夠在提供既長(cháng)又準的測序結果的同時(shí),給出準確的單倍型甲基化信息。簡(jiǎn)單來(lái)說(shuō),做基因組就能額外獲取甲基化信息,一份數據,雙份收獲!加倍快樂(lè )!
同時(shí),具有甲基化信息的HiFi數據,所占存儲僅增~5%,極大的壓縮了可分析的空間,為表觀(guān)遺傳挖掘保駕護航!
應用上:
① ?除了常規基因組中甲基化的修飾,大多數二倍體基因組組裝都忽略了同源染色體之間的差異,將基因組組裝成一個(gè)假的單倍體序列,但隨著(zhù)研究的深入,發(fā)現僅單套的基因組數據難以完全演示高雜合物種的全面信息。同源染色體之間不同遺傳位點(diǎn)的組合對生物表型有重要影響,如動(dòng)植物中的雜種優(yōu)勢、某些物種雜交不育現象等。單倍型等位基因間差異對基因表達、功能及其表型都有著(zhù)重要影響,大多數雜交品種的優(yōu)勢表型都受等位基因調控。二倍體馬鈴薯(Zhou Q et al., Nature Genetics.2020)、蘋(píng)果(Sun X P et al.,Nature Genetics.2020)、鐵觀(guān)音(Zhang X et al., Nature Genetics.2021)等單體型基因組的案例給我們成功展示了高雜合度的二倍體同源組間有不對稱(chēng)演化的現象,即某套單倍型上保留較高的基因表達水平、維持較低的甲基化水平、經(jīng)歷較強的純化選擇(負選擇)等。
例如,馬鈴薯的20,583對等位基因中,有16.6%和30.8%的等位基因之間存在表達差異和甲基化差異,有害突變和差異表達的等位基因分散在兩種單倍型中。因此,現在可以在構建單倍型基因組之后,直接通過(guò)HiFi數據解析其上甲基化信號,從而深入挖掘等位基因間的差異情況,為解析物種重要性狀形成的遺傳機制奠定重要基礎。

馬鈴薯基因組的單倍型差異(有害變異、甲基化水平、基因數等)
② ?在雜合度極低的物種中,往往會(huì )追求更完美和更準確的組裝,尤其是解析其上高度復雜的著(zhù)絲粒位點(diǎn),植物的著(zhù)絲粒位于染色體的異染色質(zhì)區域,該區域由多種類(lèi)型的DNA重復元件組成,主要包括衛星DNA序列、單一拷貝DNA、反轉錄元件、轉座子和端粒類(lèi)重復序列等。人類(lèi)基因組完成圖(Nurk S et al., Science.2022; Altemose N et al., Science.2022; Gershman A et al., Science.2022)、擬南芥T2T基因組(Naish M et al., Science.2021;Wang B et al., GPB.2021)等研究均說(shuō)明,對著(zhù)絲粒區的甲基化等表觀(guān)調控進(jìn)行解析,具有重要的研究意義。例如,擬南芥T2T基因組研究中,作者發(fā)現著(zhù)絲粒的DNA甲基化高于著(zhù)絲粒周?chē)鷧^域,但在著(zhù)絲粒內部,CENH3信號富集的CEN180高度串聯(lián)重復區域呈現低甲基化狀態(tài)(Wang B et al., GPB.2021)。

擬南芥表觀(guān)調控
小結
- PacBio HiFi中更長(cháng)的讀長(cháng)、更多的數據產(chǎn)出為高質(zhì)量基因組的構建創(chuàng )造了良好的條件
- 百邁客云平臺APP為基因組的高質(zhì)量快速組裝提供了更便捷的平臺(客戶(hù)體驗版即將上線(xiàn),盡請期待?。?/li>
- 5mC甲基化的加持,使得基因組表觀(guān)研究有了新的突破!為物種的深度解析提供了額外輔助!


京公網(wǎng)安備 11011302003368號