
物種中不同品系表型差異示意圖
(Jayakodi M et al., DNA Research; Tian X et al.Sci China Life Sci; Barchi L et al.,Plant J)
因此對于一個(gè)物種來(lái)說(shuō),如果只使用單一的參考基因組進(jìn)行遺傳馴化變異的研究,可能會(huì )丟失掉大量有意義的基因信息。為了解決這些問(wèn)題并充分理解關(guān)鍵物種中重要性狀形成機理,為育種奠定重要的研究基礎,動(dòng)植物泛基因組研究應運而生。

泛基因組近年發(fā)展趨勢(基于NCBI PubMed搜索pan-genome)
泛基因組分析有助于理解物種的特征,同時(shí)泛基因組圖譜提供的復雜基因組變異,有助于解析作物表型和農藝性狀的多樣性。選擇不同亞種材料進(jìn)行泛基因組測序,可以研究物種的起源及演化等重要生物學(xué)問(wèn)題;選擇野生種和栽培種等不同特性的種質(zhì)資源進(jìn)行泛基因組測序,可以發(fā)掘重要性狀相關(guān)的基因資源,為科學(xué)育種提供指導;選擇不同生態(tài)地理類(lèi)型的種質(zhì)資源進(jìn)行泛基因組測序,可以開(kāi)展物種的適應性進(jìn)化、外來(lái)物種入侵性等熱門(mén)科學(xué)問(wèn)題。

泛基因組在遺傳變異發(fā)掘和植物分子育種中應用[1]
其實(shí)說(shuō)了很多泛基因組的概念與意義,那么泛基因組到底能分析哪些內容呢?接下來(lái)容小編一一道來(lái)~

泛基因組構建的開(kāi)放性檢測
廣義的泛基因組是指獲取該物種全部遺傳信息,構建一個(gè)非冗余的集合體。由于個(gè)體間的差異,在構建泛基因組的時(shí)候會(huì )在參考基因組的基礎上,不斷引入新的特異性序列。因此,統計結果可發(fā)現整個(gè)泛基因組的大小隨著(zhù)個(gè)體數量的增加而增加,核心基因組(幾乎存在與全部個(gè)體基因組中)的大小隨著(zhù)個(gè)體數量的增加而減?。ㄈ鐖D1)。
由于物種受到生存環(huán)境與生態(tài)位差異、有效群體規模、多態(tài)性水平差異等因素的影響,泛基因組呈現開(kāi)放型和閉合型兩種模式。對于閉合型的泛基因組,核心基因組和整個(gè)泛基因組含量會(huì )隨著(zhù)個(gè)體增加很快到達平臺期。而開(kāi)放型泛基因組的物種具有更豐富的遺傳資源庫、更強的多態(tài)性與環(huán)境適應性,因此想達到平臺期通常需要更多的個(gè)體加入,才能通過(guò)有限的個(gè)體充分展示物種內全部遺傳信息。從而,通過(guò)泛基因組與核心基因組的比例統計,可以了解所選材料構建的泛基因組是否具有一定的代表性。

圖1開(kāi)放型(左)與閉合型(右)泛基因組[2]
泛基因組核心與非核心基因分析
泛基因組分析通過(guò)對每個(gè)個(gè)體中共有情況進(jìn)行基因集聚類(lèi),通常分為以下三種:
核心基因(core gene):在所有動(dòng)植物品系或者菌株中都存在的基因;非核心基因(dispensable gene):在1個(gè)以及1個(gè)以上的動(dòng)植物品系或者菌株中存在的基因。特有基因(Private):僅在一個(gè)品系中存在的基因。

圖2 核心基因與非核心基因示意圖[3]
隨著(zhù)基因組數量的增加,核心基因的識別將嚴重受到denovo中組裝錯誤的影響。為了糾正這種錯誤,一些科研工作者將泛基因組進(jìn)一步細分:在所有基因組的為核心基因(core),在幾乎所有品系中發(fā)現的為soft-core,在比soft-core少但不止幾個(gè)品系的品系中發(fā)現的shell,以及在只有幾個(gè)品系中發(fā)現的為cloud。具體的分類(lèi)比例與樣品數量間的關(guān)系并不固定,目的均是為了對基因進(jìn)行分組,以便進(jìn)行可靠的比較(圖3)。而這些分組的基因頻率呈現不對稱(chēng)的首尾高中間低的分布形式,充分展示了不同類(lèi)別基因型的占比情況。

圖3 棉花(上左)、雞(上右)與高粱(下)泛基因組成分
(Li J et al.Genome Biol.2021;Wang K et al.,Mol Biol Evol.2021;Tao Y et al.,Nat Plants.2021)
除此之外,根據core、dispensable等各組分聚類(lèi)結果構建基因家族的存在與缺失分布熱圖,進(jìn)一步了解不同材料中的差異情況。同時(shí)可結合不同來(lái)源or不同表型等特征充分挖掘其基因型的多態(tài)性。

圖4 雞泛基因組中每個(gè)個(gè)體基因家族的存在缺失分布圖
(Wang K et al.,Mol Biol Evol.2021)
從進(jìn)化的角度來(lái)講,pan-genome中鑒定出的核心基因(core genes)可能是執行關(guān)鍵功能的基因,其在一個(gè)物種中傾向于一些保守的基因。相反,非核心基因促進(jìn)了物種的多樣性,使其能夠適應各種環(huán)境條件。核心基因通常富集到控制著(zhù)生命體基本生成代謝的基本細胞功能,而非核心基因則富集到與環(huán)境和防御反應,受體和抗氧化劑活性,基因調控以及信號轉導等相關(guān)的功能。通過(guò)功能注釋可了解到核心、可變與特有基因家族的功能情況,從而找尋物種特異的功能與性狀形成相關(guān)通路(圖5)。

圖5 水稻共有和特有基因家族分析
(Choi J Y et al., Genome Biology.2020)
例如,地中海貽貝泛基因組研究中發(fā)現,可變基因顯著(zhù)富集在與環(huán)境適應性相關(guān)的通路中(如細胞凋亡、免疫信號傳導等),增強了地中海貽貝的環(huán)境適應性(圖6)。

圖6 貽貝泛基因組表達情況
(Gerdol M et al., Genome Biology.2020)
眾多研究表明,非核心基因比核心基因的可變性更強;與核心基因集相比,非核心基因集中的非同義突變比同義突變的比率要高。因此通過(guò)同義與非同義突變(ka/ks)可以用來(lái)檢測非核心基因集中基因是否受到選擇作用。

圖7 高粱泛基因組Ka/Ks占比情況
(Tao Y et al.,Nat Plants.2021)
泛基因組變異分析
結構變異是泛基因組的重點(diǎn)研究對象,這些變異信息為物種的人為選擇及自然選擇提供原始的材料。了解變異產(chǎn)生的過(guò)程,探究不同材料的變異程度并利用有利的變異對維持并提高物種生產(chǎn)力至關(guān)重要,有助于解析物種表型和農藝性狀的多樣性。泛基因組研究,為更好地了解SV在動(dòng)植物馴化中的作用提供了基礎。主要研究的變異類(lèi)型為:SNP(Single nucleotide polymorphism),即單核苷酸多態(tài)性變異,主要指在基因組水平上由單個(gè)核苷酸的變異所引起的DNA序列多態(tài)性,這種變異可由單個(gè)堿基的轉換(transition)或顛換(transversion)所引起。InDel(Insertion-Deletion),指的是在基因組的某個(gè)位置上所發(fā)生的小片段序列的插入或者刪除,其長(cháng)度通常在在 2 bp-50 bp 之間。SV(Structure Variantions),即基因組結構性變異,通常指的是基因組上大長(cháng)度的序列變化和位置關(guān)系變化,有豐富的變異類(lèi)型,包括長(cháng)度在50bp以上的長(cháng)片段染色體倒位、染色體易位、重復、存在/缺失(PAV)、拷貝數變異(CNV)。

圖8 SV變異類(lèi)型[4]
例如高粱泛基因組研究發(fā)現,相對于參考基因組,其它高粱個(gè)體基因組中有429~1118個(gè)基因存在拷貝數變異(CNV)。功能注釋顯示這些CNV基因豐富了防御反應、信號轉導和細胞蛋白分解代謝等生物學(xué)過(guò)程。并且不同高粱個(gè)體基因組上存在大量的存在缺失變異(PAV),有2514個(gè)基因受PAV嚴重影響,這些基因富集于與生物和非生物脅迫相關(guān)的生物過(guò)程,而抗病基因在這組基因中顯著(zhù)富集。進(jìn)一步研究發(fā)現Yellow seed1、SbRc的PAV影響到高粱籽粒顏色變化(圖9)

圖9 Yellow seed1 基因和sbRc基因的序列差異
(Tao Y et al.,Nat Plants.2021)
除此之外,在其他物種中同樣也發(fā)現大量結構變異導致性狀差異。在水稻中,主要基因的presence/absence變異賦予其對淹沒(méi)這一環(huán)境的耐受性,如Sub1A基因的PAVs變異(Xu et al., 2006),兩個(gè)乙烯反應因子基因,SNORKEL1和SNORKEL2,進(jìn)一步引發(fā)了深水水稻與非深水水稻對水深的不同反應(Hattori et al., 2009)。水稻泛基因組研究發(fā)現SV熱點(diǎn)區域與稻瘟病抗性QTLs重疊/鄰接,OsGLP2-1的存在可能保證種子的適當休眠,有助于其適應環(huán)境。

圖10 水稻SV熱點(diǎn)區域與種子休眠相關(guān)基因插入
(Qin P et al., Cell.2021)
眾多泛基因組SV分析結果中我們不難發(fā)現,SV在農作物重要農藝性狀的遺傳控制中起著(zhù)關(guān)鍵作用?;蚪M的結構變異可以導致物種個(gè)體間基因結構、表達特性、基因劑量等發(fā)生實(shí)質(zhì)性地變化,并對動(dòng)植物農藝性狀形成了深刻的影響。
圖形泛基因組構建
圖形泛基因組是指以參考基因組為框架,將其他個(gè)體材料基因組序列與之比對,存在差異的地方構成不同的分支,并隨著(zhù)新序列的加入不斷擴展變化,最終構建出一個(gè)包含全部變異信息的復雜圖形結構(圖11)。圖形泛基因組可以更好的展示每部分序列在泛基因組中的位置關(guān)系,使構建一個(gè)包含物種內全部遺傳信息的泛基因組成為可能。圖形泛基因組已經(jīng)在大豆、水稻、牛、高粱等物種有了初步構建與應用,為基因組學(xué)研究提供了一個(gè)重要的推動(dòng)力。
圖11 圖形泛基因組構建過(guò)程[3]
轉座子分析
TEs轉座因子(Transposable element,TE):又稱(chēng)之為“跳躍基因” “可移動(dòng)的遺傳因子”,是基因組中最活躍的部分,TE的活性被認為是不同物種之間基因組大小變化的重要因素。SVs可以通過(guò)TEs轉座子的移動(dòng)而形成(主要位于非核心基因區),在很多物種中已經(jīng)發(fā)現PAVs富集在轉座子TEs區,TE活性可以介導大規模的染色體重排。隨著(zhù)時(shí)間推移,轉座子兩端的LTR由于堿基突變逐漸產(chǎn)生了差異。通過(guò)這種與時(shí)間長(cháng)短有關(guān)的序列差異,利用LTR之間的分化距離計算轉座子插入至基因組的時(shí)間,進(jìn)而可以評估不同品種的遺傳進(jìn)化關(guān)系。
水稻中TEs,尤其是LTRs促進(jìn)非等位同源重組(Qin P et al.,Cell.2021);玉米泛基因組中隨著(zhù)個(gè)體的增加,LTR插入呈現向中心富集,并與插入時(shí)間的增加相關(guān)。

圖12 水稻中TE類(lèi)別比例與玉米LTR插入時(shí)間與分布
(Qin P et al., Cell.2021;Haberer G et al., Nat Genet.2020)
群體變異挖掘
由于泛基因組保留了群體完整的基因組多樣性,可鑒定到單一參考基因組無(wú)法鑒定的基因組變異。泛基因組結合GWAS、QTL等數據,可進(jìn)一步提高變異與性狀關(guān)聯(lián)的精度,捕獲到更加完整的遺傳變異信息,植物遺傳學(xué)家和育種者提供全面的基因組資源,對于物種育種和研究具有重要的意義。例如玉米泛基因組研究發(fā)現,在檢測到的GWAS信號中,關(guān)聯(lián)信號中SV相關(guān)的信號有93.05%與SNPs識別的信號重疊,SV特有信號最顯著(zhù)的是關(guān)聯(lián)到10號染色體上的北葉枯病QTL。該SV位于編碼thylakoid lumenal protein的基因內;這些蛋白質(zhì)可以通過(guò)調節病毒感染期間的細胞死亡與植物免疫關(guān)聯(lián)。

圖13 玉米SV 與SNP GWAS(Hufford MB et al., Science.2021)
前期泛基因組系列文章已舉非常多的案例,這里不再反復闡述~(點(diǎn)擊回顧:泛基因組(Pan-genome)研究思路與應用—作物篇)
泛基因組研究展現了作物多樣性和改良的前景,總的來(lái)說(shuō)其研究?jì)热葜饕性诓煌鷳B(tài)型、表型等品系材料間共同與差異的基因與功能研究。重要的是這些變異能被挖掘并為育種提供重要的理論基礎。
而更重要的是,以上內容百邁客均可進(jìn)行分析,圖片還老好看了;更更重要的是,百邁客可得到的結果還遠不止以上這些
如果您對我們的服務(wù)產(chǎn)品感興趣,歡迎點(diǎn)擊下方按鈕聯(lián)系我們,我們將免費為您設計文章思路方案。
參考文獻:
[1]趙均良,張少紅,劉斌.泛基因組及其在植物功能基因組學(xué)研究中的應用[J].植物遺傳資源學(xué)報,2021.
[2]邊培培,張禹,姜雨.泛基因組:高質(zhì)量參考基因組的新標準[J].遺傳,2021.
[3]Lei L , Goltsman E , Goodstein D ,?et al. Plant Pan-Genomics Comes of Age[J]. Annual Review of Plant Biology, 2021.
[4]Coletta R D, Qiu Y, Ou S, et al. How the pan-genome is changing crop genomics and improvement[J]. Genome Biology, 2021.



京公網(wǎng)安備 11011302003368號