英文題目:Whole-genome resequencing of a world-wide collection of rapeseed accessions reveals genetic basis of their ecotype divergence
中文題目:全球油菜種質(zhì)資源全基因組測序揭示了其生態(tài)型差異的遺傳基礎。
研究單位:浙江大學(xué)作物科學(xué)研究所
發(fā)表時(shí)間:2018年11月23日
發(fā)表雜志:Molecular Plant
影響因子:9.326
油菜(Brassica napus?L.)是世界上食用油和富含蛋白質(zhì)的牲畜飼料的重要來(lái)源。甘藍型油菜B.napus (AACC)起源于距今不到7500年的兩個(gè)二倍體祖先白菜(B.rapa(AA)(n=10))和甘藍(B.oleracea(CC)(n=9))之間的種間雜交。盡管油菜的進(jìn)化歷史比親本品種短,但它已經(jīng)適應了不同的氣候區和緯度,并形成了三個(gè)主要的生態(tài)型群,即冬季型、半冬季型和春季型。
為了在相應的環(huán)境中生存,適時(shí)的開(kāi)花至關(guān)重要,并且花期對油菜的生命周期、產(chǎn)量和種子質(zhì)量起著(zhù)至關(guān)重要的作用。在模式植物擬南芥中,多條開(kāi)花途徑響應環(huán)境和發(fā)育信號,并匯聚到FLOWERING LOCUS?T?(FT)的轉錄調控上,其蛋白質(zhì)充當移動(dòng)的花原信號,從葉子移動(dòng)到莖尖分生組織以觸發(fā)開(kāi)花。FT的表達被光周期途徑中的CONSTANS(CO)激活,并且被FLOWERING LOCUS C (FLC)抑制,其mRNA表達被春化和自主途徑同時(shí)抑制。
雖然已經(jīng)報道了油菜的冬季、半冬和春季生態(tài)型的遺傳變異,但不同的生態(tài)類(lèi)型在甘藍型油菜中的差異的關(guān)鍵等位基因變異尚不完全清楚。
材料及來(lái)源:來(lái)自39個(gè)國家的991個(gè)甘藍型油菜種質(zhì)資源,包括658個(gè)冬季類(lèi)型、145個(gè)半冬季類(lèi)型和188個(gè)春季類(lèi)型。
測序平臺: Illumina HiSeq XTen
參考基因:‘Darmor-bzh’; ‘Tapidor’
分析內容:系統發(fā)育與種群結構分析;PCA、LD分析;基因流分析;選擇性清除分析;花期性狀GWAS;花期相關(guān)SNPs進(jìn)行RT-qPCR分析。
991份甘藍型油菜種質(zhì)資源的再鑒定
?與參考基因組(“Darmor-bzh”)相比,在991個(gè)油菜基因組中檢測到556萬(wàn)個(gè)SNP和186萬(wàn)個(gè)InDels。(表1)。并檢測了它們在甘藍型油菜基因組區域的分布。比較A和C亞基因組之間的SNP分布顯示,A亞基因組中的SNP頻率(7.9?SNPs/kb)高于C亞基因組中的SNP頻率(5.9?SNPs/kb)。并將過(guò)濾后鑒定出的2753575個(gè)可信的SNPs(缺失數據<50%,MAF>5%)用于后續分析。

991個(gè)群體的群體結構和基因組變異
991份油菜大致與它們的地理分布相對應,即分別是歐洲、亞洲和歐亞大陸/北美(圖1A)。系統發(fā)育、種群結構和主成分分析(PCA)結果表明,991份油菜品種可分為三組(K=3)(圖1BCD),大致相當于冬季、半冬季和春季生態(tài)類(lèi)型,說(shuō)明冬、半冬和春季生態(tài)型在遺傳上存在差異。與參考基因組“Darmor-bzh”相比,分別在冬、半冬和春季材料尋找SNPs與InDels。冬型的核苷酸多樣性(π=8.42×10-4)低于半冬型(π=10.16×10-4)和春型(π=9.92×10-4),表明在冬季類(lèi)型中低頻SNPs的存在主要是由于“Darmor-bzh”(也是一種冬型種質(zhì)資源)的mapping所致。
進(jìn)一步分析連鎖不平衡在整個(gè)基因組中的表達,發(fā)現冬、半冬和春季生態(tài)型SNPs之間的物理距離(最大值的一半)分別為11.27 kb(r2=0.30)、24.55 kb(r2=0.32)和17.40 kb(r2=0.31)。(圖1E)LD衰變的大小在不同染色體和不同亞基因組之間變化很大。在冬型、半冬型和春型基因組中分別檢測到100、5460和631個(gè)大的LD結構(>10 kb),表明冬型油菜的遺傳重組頻率高于其它類(lèi)型油菜的遺傳重組頻率,從而破壞了基因組LD結構。此外,在A(yíng)亞基因組中,LD衰變速率比在C亞基因組中更快,這表明A亞基因組中的遺傳重組頻率高于C亞基因組中的遺傳重組頻率(圖1F)。

主要種群間的等位基因漂移路徑
進(jìn)一步計算世界地圖上顯著(zhù)的基因流數目之后,在冬型和春型油菜中發(fā)現了四個(gè)主要基因流(圖2C)。冬型油菜的基因流從法國到俄羅斯(weight=0.5)、法國到瑞典(weight==0.3)、波蘭到日本(weight==0.3)和日本到中國(weight==0.3),而春型油菜的基因流從法國到俄羅斯(weight==0.5)、法國到瑞典。經(jīng)德國(weight=0.4),瑞典到加拿大(weight=0.2),加拿大到中國(weight=0.5)。沒(méi)有顯著(zhù)的生態(tài)型漂移事件(inter-ecotype drift events)(圖2 A、B)。

甘藍型油菜自然選擇和人工選擇產(chǎn)生的信號
為了確定自然選擇和人工選擇對歷史上基因的改變,作者對三種生態(tài)型之間進(jìn)行選擇性清除分析。春冬季型、半冬和冬季型、春季和半冬型之間分別有61、56和64個(gè)選擇性清除(表1;圖4)。位于選擇性清除區域上的基因可能發(fā)揮重要作用。在Chr.A10上發(fā)現了最強的信號,該信號是冬春型之間基因組變化的基礎(圖3A)。該區域有56個(gè)帶注釋的基因,包括FLC直系同源基因(BnaA10g22080D)和AIL6直系同源基因(BnaA10g21750D),編碼AP2-like乙烯反應轉錄因子(ERF)。在含有377個(gè)帶注釋基因的Chr.A02上發(fā)現了另一個(gè)強選擇性信號,包括FT?(BnaA02g12130D)、FY?(BnaA02g01670D)、CONSTANS-like?(BnaA02g13920D)、ERF118?(BnaA02g13950D)和ERF118-like(BnaA02g13960D)以及組氨酸transporter-like 2乙烯轉運體(BnaA02g13290D)。編碼幾個(gè)MADS-box基因的Chr.C01、C02、C08和C09上的一些區域顯示出弱清除信號。發(fā)現在有1404個(gè)基因在冬春兩季類(lèi)型之間發(fā)生選擇性清除,這些基因包括花期控制、乙烯生物合成和信號傳導以及植物應激反應的基因。此外,在半冬型和冬型之間以及春季型和半冬型之間的種群分化的清除區域內共鑒定出1228和1370個(gè)基因。鑒定出許多與開(kāi)花時(shí)間調控相關(guān)的基因,如CONSTANS-like和MADS-box基因,或植物激素信號傳導基因,如ERFs以及生長(cháng)素和赤霉素誘導基因。GO分析表明,這些基因涉及多種生物學(xué)過(guò)程、細胞成分和分子功能。


甘藍型油菜開(kāi)花時(shí)間相關(guān)基因的鑒定
開(kāi)花期是油菜品種馴化和育種的重要性狀之一,也是油菜三個(gè)生態(tài)型的重要區別之一。觀(guān)察了不同品種之間的開(kāi)花時(shí)間變化(125-191?d)。曼哈頓試驗表明,在Chr.A02的4-7 Mb區域,許多SNPs與開(kāi)花時(shí)間顯著(zhù)相關(guān)(-log10P>6)(圖3B和圖5)。在6.37~6.38?Mb區域內鑒定了擬南芥FT(BnaA02g12130D)的直系同源序列,其中的SNPs與開(kāi)花時(shí)間密切相關(guān)(圖5)。對100?kb(6.37~6.38Mb)序列進(jìn)一步的LD分析表明,與開(kāi)花時(shí)間相關(guān)的SNPs位于FT直系同源起始密碼子的上游~3?kb(6372995~6375936 kb)(圖5A和5B)。

BnaA10g22080D是擬南芥FLC的一個(gè)假定的同源基因,在Chr.A10的14.99-15.01 Mb之間的區域內被鑒定(圖3B)。GWAS和LD分析表明,BnaA10g22080D的5’調控區的SNPs與品種間開(kāi)花時(shí)間的變化顯著(zhù)相關(guān)(圖6A和6B)。

與“Tapidor”基因組進(jìn)行比對
為了驗證上述結果的可靠性(即種群結構、選擇信號和開(kāi)花時(shí)間的GWAS分析),通過(guò)將reads mapping到另一個(gè)“Tapidor”參考基因組進(jìn)行call SNPs。共獲得553萬(wàn)個(gè)SNPs和192萬(wàn)個(gè)InDels。群體結構分析和PCA分析結果與mapping?“Darmor-bzh”參考基因組(簡(jiǎn)稱(chēng)SNP-Darmor)的結果相同。比較了LD衰變率之間的“SNP-Darmor”和“SNP-Tapidor”,得到一致的結果。對開(kāi)花時(shí)間的選擇性清除分析和GWAS分析證實(shí),A02上的FT同源性(BnaA02g12130D)和A10上的FLC同源性(BnaA10g22080D)與開(kāi)花時(shí)間變化顯著(zhù)相關(guān)。從而得出:利用群體遺傳學(xué)方法,如PCA、LD率、選擇性信號和GWAS,對兩個(gè)SNP集(SNP-sets)進(jìn)行分析得出相同的結論。
生態(tài)型差異對應的SNPs鑒定
FT和FLC直系同源基因編碼區的核苷酸序列在所有三種生態(tài)類(lèi)型中都相當保守。在BnaA02g12130D的5’上游地區32個(gè)SNPs中,10個(gè)SNPs在這三種生態(tài)類(lèi)型之間有特異性差異。95±2%的冬型種質(zhì)在BnaA02g12130D起始密碼子上游上具有與參照(“Darmor-bzh”)相同的核苷酸,而在85±6%的春型種質(zhì)中,相應位點(diǎn)的核苷酸以不同的方式改變,如鳥(niǎo)嘌呤(G)向胞嘧啶(C)轉化以及腺嘌呤(A)向鳥(niǎo)嘌呤(G)的轉化。只有22±3%的半冬型品種與春型品種有相同的變化,其中40%的半冬型品種與春型品種有相似的T到C的變化。半冬型品種表現出與春型品種相似的核苷酸變化(圖5C)。
FLC直系同源基因推測的啟動(dòng)子區(BnaA10g22080D)中各種SNPs的頻率在三種生態(tài)類(lèi)型之間有很大差異(圖6C)。為了研究生態(tài)型特異性SNPs與甘藍型油菜FT或FLC轉錄是否相關(guān),用FT?(BnaA02g12130D)和FLC?(BnaA02g12130D)的特異性引物對各種FT和FLC同源物的表達水平進(jìn)行了比較。結果和已發(fā)表的轉錄組數據一致表明:春季型品種葉片中BnaA02g12130D的表達水平顯著(zhù)高于其他兩種生態(tài)型(圖5D),而BnaA10g22080D在春型品種葉片中的表達在所有三個(gè)生態(tài)型中都最低(圖6D)。與春、冬型品種間FT和FLC同源基因表達顯著(zhù)差異相比,半冬型品種與其它兩種類(lèi)型品種間的表達差異較?。▓D5D和6D)。這些結果表明,生態(tài)型特異性SNPs與FT和FLC同源物的表達水平相關(guān),這有助于三種生態(tài)型間形成不同的開(kāi)花時(shí)間。
在春與冬、春與半冬、半冬與冬的選擇性清除分析下,推測有12~15個(gè)乙烯基因。在Chr.A02上僅推測ERF119直系以及Chr.A10上推測的AP2-like ERF (AIL6)直系顯示與生態(tài)型差異相對應的有區別的SNPs。這些生態(tài)型特異性SNPs與已發(fā)表的轉錄組數據中的ERF119和AP2-like ERF(AIL6)的轉錄水平相關(guān),這使三種生態(tài)型表現出不同的營(yíng)養生長(cháng)期。
該研究對991份油菜天然種質(zhì)資源進(jìn)行了遺傳多樣性的測序和鑒定。通過(guò)對兩個(gè)不同的參考基因組,即“Darmor-bzh”和“Tapidor”基因組的定位讀數產(chǎn)生的兩組SNPs的群體遺傳學(xué)分析,得出了一致的結論。遺傳多樣性和連鎖不平衡參數表明甘藍型油菜兩個(gè)亞基因組的進(jìn)化是不對稱(chēng)的。選擇性?huà)呙璺治鼋沂玖伺c調控植物發(fā)育和應激反應的各個(gè)方面相關(guān)的基因的遺傳變化。并對影響開(kāi)花時(shí)間的SNPs進(jìn)行了探索。
整個(gè)研究科學(xué)而嚴謹,為油菜分子標記的篩選提供了重要依據,為油菜分子標記在油菜育種中的應用奠定了基礎。