背景介紹
DNA在染色體上是高度折疊的,DNA與DNA片段之間不可避免的形成了高強度的交互作用。2002年提出的3C技術(shù),用于測定染色體特定位點(diǎn)與位點(diǎn)之間的交互作用,隨后發(fā)展出4C、5C 技術(shù),分別用于測定染色體上一點(diǎn)到多點(diǎn)和多點(diǎn)與多點(diǎn)之間的交互作用。Job Dekker在2009年開(kāi)發(fā)出Hi-C 技術(shù),實(shí)現了全基因組范圍內染色體片段間相互作用的捕獲。Hi-C 除了用于輔助基因組組裝、對已組裝的基因組進(jìn)行糾錯,還可以揭示基因組的三維結構特征,包括從隔室(A/B Compartments)到拓撲相關(guān)結構域(TAD),最后到染色體環(huán)(loop),目前,已在人、果蠅、酵母、擬南芥、水稻和棉花等物種成功構建基因組三維結構,并完成了對不同樣本基因組三維結構的比較分析。
1、Hi-C三維構象研究?jì)热?/h4>
1)繪制全基因組的Hi-C map、Cis/Trans和IDEs等分析;
2)Compartment A/B 鑒定與分析,包括與ChIP-seq、WGBS和RNAseq等聯(lián)合分析;
3)TAD鑒定與分析,包括與ChIP-seq、WGBS和RNAseq等聯(lián)合分析;
4)繪制全基因組LOOP模型圖,需DNase-seq或ATAC-seq,并與ChIP-seq和RNAseq聯(lián)合分析;
5)多樣本三維結構差異分析,包括Compartment A/B、TAD和Loop差異鑒定與分析;
6)基因/重復序列互作分析,包括與RNAseq聯(lián)合分析。

圖1 染色體不同層級三維構象圖
(Fraser J, et al, 2015)
2、染色體三維結構重點(diǎn)研究?jì)热?/h4>
A/B compartments
高等動(dòng)植物基因組可以人為劃分為兩個(gè)compartments,稱(chēng)作A/B compartments,通過(guò)計算PCA,第一主成分中正值表示A compartment,負值表示B compartment。A/B compartments在基因組中一般呈間隔分布,A compartments呈松散染色質(zhì)狀態(tài),基因密度高,屬于轉錄活躍區域,而B(niǎo) compartments則呈壓縮染色質(zhì)狀態(tài),基因密度低,屬于轉錄抑制區域。通過(guò)對多個(gè)樣本A/B compartments 的分布進(jìn)行對比,在全基因組水平找出A/B compartments保守的區域以及發(fā)生A/B compartments轉換的區域,結合RNA-Seq對發(fā)生A/B compartments轉換區域內的基因的表達量進(jìn)行統計,有助于解釋不同樣本間的差異與染色質(zhì)活性狀態(tài)之間的關(guān)系。如圖2:

圖2 人正常細胞和癌癥細胞A/B compartments
(Wu P, et al, 2017)
例如在人的多發(fā)性骨髓瘤文章中,作者利用正常B細胞(GM12878)和兩種亞型的骨髓瘤細胞(近二倍體U266和近三倍體RPMI-8226)進(jìn)行Hi-C、WGS和RNA-seq測序,結果發(fā)現,相比于GM12878,U266和RPMI-8226癌癥細胞中6%的區域均存在B轉換到A,1%的區域均存在A(yíng)轉換到B,結合RNA-seq數據,發(fā)現B轉換到A區域內的基因變成轉錄活躍狀態(tài),而A轉換到B區域內的基因變成轉錄抑制狀態(tài),KEGG富集通路發(fā)現這些基因與多發(fā)性骨髓瘤相關(guān),主要涉及MAPK信號轉導途徑、TNF信號轉導途徑、細胞因子和細胞因子受體相互作用途徑等,進(jìn)一步在染色體2q11.2-q12.142處發(fā)現一個(gè)細胞因子基因簇,幾種白細胞介素IL1R1,IL1R2,IL18R1和細胞因子MAP4K4下調表達,這些基因在后續研究中重點(diǎn)關(guān)注。
?TAD?
TAD(拓撲關(guān)聯(lián)結構域)是一個(gè)高度自關(guān)聯(lián)的連續區域,通過(guò)明顯的邊界與相鄰區域分離開(kāi)來(lái),形成一個(gè)獨立的調控單元,內部的基因擁有共同的調控元件,存在協(xié)同表達特征。TAD邊界通常具有大量的絕緣子蛋白和黏連蛋白(植物中TAD邊界一般缺少絕緣蛋白,邊界不明顯),對于維持TAD結構及穩定性具有重要作用,不但可以指導染色體折疊成高級結構,還可以正確指導遠距離轉錄調控,該邊界發(fā)生變化會(huì )導致基因調控變得紊亂。TAD邊界還與組蛋白修飾、甲基化修飾等密切相關(guān),通常與轉錄活性相關(guān)的表觀(guān)遺傳標記富集在TAD邊界,而與轉錄失活相關(guān)的表觀(guān)遺傳標記遠離TAD邊界。通過(guò)對多個(gè)樣本TAD進(jìn)行對比,在全基因組水平找出發(fā)生變化的TAD(重點(diǎn)關(guān)注TAD邊界),結合ChIP-seq、WGBS等分析TAD的變化是否與表觀(guān)遺傳修飾相關(guān),進(jìn)一步利用RNA-Seq對相關(guān)基因的表達量進(jìn)行統計,有助于解釋不同樣本間空間結構的差異與表觀(guān)遺傳修飾及轉錄調控之間的關(guān)系。如圖3:

圖3 不同種棉花TAD邊界及表觀(guān)遺傳修飾
(Wang M, et al, 2018)
例如,在棉花的三維基因組進(jìn)化文章中,作者對二倍體雷蒙德氏棉、二倍體亞洲棉、四倍體陸地棉和四倍體海島棉構建了三維基因組圖譜,與雷蒙德氏棉D03染色體相比,陸地棉和海島棉對應的D亞基因組中發(fā)生了染色質(zhì)重排,虛線(xiàn)對應的TAD結構發(fā)生了變化,雷蒙德氏棉中該TAD結構完整,存在明顯的邊界,陸地棉中該邊界發(fā)生了左移,而海島棉中該TAD趨向于消失。因而通過(guò)鑒定TAD發(fā)生變化區域的基因,可以研究多倍化過(guò)程中基因表達調控的改變(研究多倍體的老師們,這可是一個(gè)很好的套路文章哦)。同時(shí)結合ChIP-seq數據對該TAD邊界進(jìn)行分析發(fā)現,雷蒙德氏棉富含豐富的H3K4me3(活性染色質(zhì)標記),而陸地棉和海島棉中H3K4me3顯著(zhù)減少,說(shuō)明在棉花的多倍化與表觀(guān)遺傳修飾存在密切關(guān)聯(lián)。
Loop?
Loop(染色質(zhì)環(huán))將線(xiàn)性距離很遠的位點(diǎn)拉至空間距離很近,在Hi-C圖譜中表現為峰值位點(diǎn)(peak loci),該peak位點(diǎn)通常一端為啟動(dòng)子,另一端為增強子,Loop將啟動(dòng)子和增強子拉至空間很近的距離,從而調控基因的表達,存在這種loop(啟動(dòng)子-增強子環(huán))相關(guān)基因的表達量將幾倍甚至幾十倍的增加。loop通常與DNAase-seq或者ATAC-seq結合使用(特異性識別啟動(dòng)子),從而鑒定啟動(dòng)子-增強子環(huán)。通過(guò)對多個(gè)樣本Loop進(jìn)行對比,在全基因組水平找出發(fā)生變化的Loop,結RNA-Seq對相關(guān)基因的表達量進(jìn)行統計,有助于解釋不同樣本間loop及基因轉錄調控之間的關(guān)系。如圖4:

圖4 人不同細胞loop(Rao S S.P. , et al, 2014)
例如,在人的loop文章中,作者在GM12878細胞系發(fā)現9448個(gè)loop,其中2854個(gè)loop與已知的啟動(dòng)子-增強子作用相關(guān),基因的啟動(dòng)子存在loop比不存在loop時(shí)的表達量顯著(zhù)增加。GM12878細胞系中存在一個(gè)Loop,這個(gè)Loop連接了SELL啟動(dòng)子和一個(gè)遠端增強子SELP,基因開(kāi)啟轉錄,表達量增加,而IMR90細胞系中沒(méi)有這個(gè)Loop,基因不表達。
3、百邁客Hi-C研究?jì)?yōu)勢
百邁客自2016年初以來(lái),利用Hi-C技術(shù)進(jìn)行染色體水平的基因組組裝及染色體三維構象的研究,成功開(kāi)發(fā)出六堿基、四堿基酶切方案,組裝、互作輕松拿下。在植物Hi-C領(lǐng)域,更是邁進(jìn)了一大步,在同行還只能處理植物活體樣本的時(shí)候,我們已經(jīng)可以輕松“駕馭”離體枝條,感覺(jué)一大波離體枝條在向小編招手~
迄今為止,保持著(zhù)近100%的建庫成功率,積累了大量植物、動(dòng)物(哺乳動(dòng)物、昆蟲(chóng)、水生動(dòng)物等)、微生物等的項目經(jīng)驗。植物一次建庫成功率在97%以上,很多物種對應文庫的Valid Interaction Pairs(%)值在80%以上,最高達92.61%;動(dòng)物樣品文庫的Valid Interaction Pairs(%)平均值在60%,最高達86.68%;真菌樣品文庫的Valid Interaction Pairs(%)平均值在72%,最高達84.6%。2018,百邁客Hi-C服務(wù)平臺將繼續為您的科學(xué)研究保駕護航!如果您Hi-C測序技術(shù)感興趣,歡迎點(diǎn)擊下方按鈕聯(lián)系我們,我們將免費為您設計文章思路方案。
參考文獻:
1.Fraser J, Williamson L, Bickmore W A. et al. An Overview of Genome Organization and How We Got There: from FISH to Hi-C. Microbiology and Molecular Biology Reviews, 2015.
2.Wu P, Li T, Li R, et al.3D genome of multiple myeloma reveals spatial genome disorganization associated with copy number variations. Nature communication, 2017.
3.Wang M, Wang P, Lin M, et al.Evolutionary dynamics of 3D genome architecture following polyploidization in cotton. Nature plants, 2018.
4.Rao S S.P. , Huntley M H., Durand N C., et al.A 3D Map of the Human Genome at Kilobase Resolution Reveals Principles of Chromatin Looping. Cell, 2014.5



京公網(wǎng)安備 11011302003368號