話(huà)接上篇,當前市場(chǎng)上除了火熱的轉錄組+代謝組的聯(lián)合分析來(lái)解析基因表達和表型變化的關(guān)系(多組學(xué)聯(lián)合分析到底分析些什么?–轉錄組+代謝組篇),蛋白組的研究也是進(jìn)展的如火如荼。蛋白質(zhì)是生物體最終的功能執行著(zhù),其含量隨著(zhù)生物體的生長(cháng)、環(huán)境應激反應、疾病發(fā)生發(fā)展的過(guò)程不斷變化,蛋白質(zhì)組學(xué)可以在大規模水平上研究一種細胞或一個(gè)生物體所表達的全部蛋白質(zhì)的特征信息,由此進(jìn)行差異蛋白的挖掘和功能蛋白鑒定等分析內容,獲得蛋白質(zhì)水平上的關(guān)于疾病發(fā)生,細胞代謝等過(guò)程的整體而全面的認識。
轉錄組和蛋白組是關(guān)系非常緊密且處于上下游的兩個(gè)組學(xué),轉錄組代表基因表達的中間狀態(tài),可以反映諸如轉錄調控、轉錄后調控的機理。通過(guò)轉錄組和蛋白組的聯(lián)合分析,可以分別從RNA水平和蛋白水平對基因的表達進(jìn)行衡量,獲得基因表達各個(gè)步驟表達和調控的全景圖,發(fā)掘常規單個(gè)組學(xué)未能發(fā)現的新結果。
分析思路
轉錄組的分析結果可以預測得到當前樣本表達的蛋白序列,并基于此構建蛋白數據庫進(jìn)行蛋白預測,相比使用公共數據庫進(jìn)行蛋白預測可以大幅度的提升預測到的蛋白數目和準確度。通過(guò)差異基因和差異蛋白的表達趨勢分析,可以獲得不同相同或相反表達趨勢的基因和蛋白質(zhì)集,并對不同的基因集合進(jìn)行功能富集分析,進(jìn)一步挖掘調控生物表型的關(guān)鍵基因和蛋白。此外,還可以通過(guò)蛋白質(zhì)的鑒定進(jìn)一步驗證轉錄組發(fā)現的可變剪接信息。當然,如果在此聯(lián)合分析的基礎上再結合上代謝組學(xué)的分析,打通機制與表型的研究,能夠系統描繪蛋白至代謝的調控過(guò)程,挖掘關(guān)鍵蛋白與代謝物上下游調控通路。讓整個(gè)研究?jì)热莞迂S富完整。
分析內容
轉錄組+蛋白組聯(lián)合分析
轉錄組+蛋白組的聯(lián)合分析的從差異基因和差異蛋白入手進(jìn)行關(guān)聯(lián)分析,使用KEGG的注釋信息來(lái)對轉錄組和蛋白組進(jìn)行關(guān)聯(lián),注釋到同一個(gè)KEGG Functional ortholog編號(K 開(kāi)頭的編號)的基因和蛋白被記為一對有關(guān)聯(lián)的基因和蛋白。如果使用轉錄組數據建庫,得到的蛋白ID與轉錄本ID格式相同,通過(guò)人為指定的方式將基因和蛋白一一對應起來(lái),并進(jìn)行表達趨勢分析、不同趨勢下關(guān)聯(lián)基因和蛋白的GO\KEGG功能注釋及富集分析。

一、GO注釋分析
對轉錄水平和蛋白水平都檢測到的蛋白進(jìn)行GO功能注釋分析,將每個(gè)差異分組的差異基因和差異蛋白劃分為4種不同的變化趨勢(蛋白和mRNA表達趨勢相同、蛋白和mRNA表達趨勢相反、蛋白無(wú)變化,mRNA差異表達、mRNA無(wú)變化,蛋白差異表達),并對每種變化趨勢中的基因和蛋白分別做GO功能注釋?zhuān)瑸樘暨x出調控表性變化的關(guān)鍵基因和蛋白提供了候選。

二、 差異蛋白GO富集
對于每個(gè)差異分組的4種(同上)變化趨勢中的基因和蛋白分別進(jìn)行GO功能顯著(zhù)性富集分析,作GO富集氣泡圖。通過(guò)GO富集分析可以得到與關(guān)聯(lián)到的蛋白質(zhì)背景相比,差異蛋白質(zhì)中顯著(zhù)富集的GO功能條目,從而得出差異蛋白質(zhì)與哪些生物學(xué)功能顯著(zhù)相關(guān),確定差異蛋白行使的主要生物學(xué)功能。

三、 KEGG代謝通路注釋
針對轉錄水平和蛋白水平關(guān)聯(lián)的蛋白進(jìn)行KEGG功能注釋分析。在生物體內,不同蛋白相互協(xié)調行使其生物學(xué)行為,基于Pathway的分析有助于更進(jìn)一步了解其生物學(xué)功能,通過(guò)Pathway分析能確定蛋白質(zhì)參與的主要生化代謝途徑和信號轉導途徑。

四、差異蛋白KEGG通路富集
Pathway顯著(zhù)性富集分析方法同GO功能富集分析,應用超幾何檢驗,對于每個(gè)差異分組的4種變化趨勢中的基因和蛋白分別進(jìn)行KEGG富集,找出與所有鑒定到蛋白背景相比,在差異蛋白中顯著(zhù)性富集的Pathway。通過(guò)Pathway顯著(zhù)性富集能進(jìn)一步篩選出差異蛋白最主要參與的生化代謝途徑和信號轉導途徑。

五、九象限圖
九象限圖是對數據進(jìn)行分類(lèi)分析的常見(jiàn)方法。一般是利用水平和垂直分割線(xiàn)將圖表區域分為九個(gè)象限,每個(gè)象限的數據表現有所不同,而圖表主要以散點(diǎn)圖為主。對于每一對關(guān)聯(lián)的基因和蛋白,以其中蛋白的log2FC作為橫坐標,基因的log2FC作為縱坐標,得到所有差異分組的蛋白和轉錄組表達模式九象限圖,進(jìn)一步把基因和蛋白的表達劃分為更詳細變化趨勢,有助于篩選符合研究預期的基因和蛋白集合。

轉錄組+蛋白組+代謝組聯(lián)合分析
轉錄組、蛋白組、代謝組三者的聯(lián)合分析主要是對來(lái)源于相同樣本的差異表達的mRNA、蛋白質(zhì)、代謝物等多個(gè)數據集結合起來(lái)進(jìn)行關(guān)聯(lián)分析,可進(jìn)一步挖掘基因、蛋白、代謝物之間的關(guān)系,以及發(fā)現生物標記,解析生物生理活動(dòng)的內在機理。
一、 多組學(xué)協(xié)慣量分析
多重協(xié)慣量分析(multiple co-inertia analysis)是一種挖掘多個(gè)數據集之間共同關(guān)系的探索性數據分析方法,可將多種組學(xué)數據投影到相同的維度空間,直觀(guān)的展示基因、蛋白、代謝等一種或者多種之間的聯(lián)系,圖中任意2個(gè)數據點(diǎn)與原點(diǎn)的連線(xiàn)反映了兩者之間的相關(guān)性,銳角為正相關(guān),鈍角為負相關(guān),直角則不相關(guān)?;谘芯勘尘翱商崛≈匾奶卣餍畔?。

二、 多組學(xué)相關(guān)性熱圖
為進(jìn)一步展示多組組學(xué)之間的相關(guān)性,對基因、蛋白、代謝物之間進(jìn)行相關(guān)性分析,并繪制相關(guān)性熱圖,直觀(guān)的展示出哪些分子間的相關(guān)性更高。

三、 多組學(xué)相關(guān)性網(wǎng)絡(luò )圖
一般認為較高的相關(guān)性可能是不同組學(xué)數據之間的關(guān)系如調控、互作等導致的,因此基于閾值篩相關(guān)性的結果可挖掘潛在的關(guān)系。并切可以通過(guò)網(wǎng)絡(luò )圖可視化多組學(xué)之間的相關(guān)性,讓結果更直觀(guān)。
以上就是轉錄組和蛋白組以及代謝組三者之間的聯(lián)合分析的主要內容,通過(guò)轉錄組、蛋白組的聯(lián)合分析從不同角度互補結合了解分子調控機制信息,而代謝組的補充則可以進(jìn)一步發(fā)現與代謝物緊密相關(guān)的基因或蛋白質(zhì),實(shí)現差異表型與關(guān)鍵基因/蛋白的信息關(guān)聯(lián),為進(jìn)一步聚焦關(guān)鍵分子機制提供更可靠的信息。
百邁客生物科技致力于多組學(xué)聯(lián)合分析的組學(xué)研究?jì)热?,現已經(jīng)有非常成熟的基因組、轉錄組、代謝組、蛋白組、非編碼RNA之間的聯(lián)合分析方案及分析流程,協(xié)助客戶(hù)發(fā)表幾百篇高分文章,如果您對該分析方案感興趣,歡迎點(diǎn)擊下方按鈕與我們聯(lián)系,我們將免費為您設計文章思路方案。




京公網(wǎng)安備 11011302003368號