本期小編為各位介紹ONT全長(cháng)轉錄組測序應用于聽(tīng)覺(jué)相關(guān)細胞isoform分析案例。

材料方法
單細胞RNA測序是一種強有力的工具,通過(guò)它可以表征低豐度細胞類(lèi)型的轉錄特征,但它在內耳的應用受到了骨迷路、感覺(jué)細胞在組織分布稀疏和難以分離膜性耳蝸超稀少細胞的困難。
1、從p15、p30、p70和p228雄性和雌性C3-Heb/FeJ小鼠(Mus?musculus)收獲耳蝸組織,倒置顯微鏡下鑒定并使用顯微操作吸管法分離目的細胞:IHCs、OHCs和Deiters細胞(Deiters’?cells,DCs)。(內毛細胞(inner?hair?cells,IHCs)和外毛細胞(outlier?hair?cells,OHCs);Deiters細胞是哺乳動(dòng)物耳蝸內的一種支持細胞,與外毛細胞(OHC)的關(guān)系非常密切。)
2、SmartSeq2單細胞擴增,IHC?(n?=?42),?OHC?(n?=?127),?and?DC?(n?=?39)進(jìn)行二代Illumina平臺轉錄組測序;12個(gè)p15小鼠OHCs進(jìn)行ONT全長(cháng)轉錄組測序。

研究結果
1、耳蝸非感覺(jué)細胞豐度估計與單細胞分離
與哺乳動(dòng)物耳蝸中的各種支持細胞類(lèi)型相比,聽(tīng)覺(jué)HC的豐度較低。為了估計小鼠耳蝸膜迷路中可用于單細胞分離的HC數量,據報道在成熟的小鼠耳蝸中約765個(gè)IHCs,通過(guò)對小鼠顳骨中心切片,細胞核計數,估計小鼠膜性迷路中的細胞數為415,395,其中IHC和OHC比例僅為0.19%和0.59%。
為了研究占比極低的目的細胞,作者進(jìn)行了細胞分離,詳細方法見(jiàn)文章。本研究主要關(guān)注具有明顯不同形態(tài)特征的IHC?(n?=?42),?OHC?(n?=?127),?and?DC?(n?=?39),同時(shí)他們來(lái)自于不同發(fā)育時(shí)期:p15(過(guò)濾后n=132)、p30(n=6)、p70(n=54)和p228(n=6)。該設計有利于時(shí)間和tono-topic差異表達分析。(聽(tīng)覺(jué)系統對語(yǔ)音的基本表達方式是“音調拓撲的”(tono-topic),即基底膜及毛細胞都具有頻率選擇及分解作用,可以把進(jìn)入耳蝸的聲波分解為一組不同的頻率成分,或者說(shuō)用這組頻率成分來(lái)表達原聲波信號。)

2、質(zhì)控、無(wú)偏聚類(lèi)及表達譜分析
去除有表達的基因(count值>0的)少于2000個(gè)的細胞,接下來(lái)進(jìn)行主成分分析PCA分析和tSNE聚類(lèi)分析。由于在所有細胞類(lèi)型中Top?100高表達基因表達水平不一致,去除了7個(gè)細胞數據;由于未與形態(tài)學(xué)分組聚類(lèi)到一起,去除3個(gè)細胞數據。剩余的一組高質(zhì)量細胞數據,在每個(gè)細胞轉錄組的總reads中含有低百分比的線(xiàn)粒體轉錄本,這是值得注意的,因為每個(gè)細胞線(xiàn)粒體reads數百分比增加表明細胞死亡增加。
使用Seurat進(jìn)行基于主成分1和2的無(wú)偏差聚類(lèi)(圖1E)。得到的tSNE?clusters顯示IHC、OHC和DC分離明顯,形成與其形態(tài)學(xué)分組一致的無(wú)偏細胞特異性組(圖1F)。為了鑒定每種細胞類(lèi)型的特征性表達模式,在A(yíng)UC分類(lèi)器下為每種細胞類(lèi)型提取了前100個(gè)cluster定義基因(圖1G)。

為了比較細胞類(lèi)型之間表達譜,計算各cluster內所有細胞中每個(gè)基因平均表達水平。通過(guò)維恩圖對平均表達譜比較,每種細胞類(lèi)型約表達700個(gè)特異基因(OHC-753;?IHC-655;?DC-713;歸一化后counts>10)。且發(fā)現IHCs和DC具有高比例重疊(共享750個(gè)基因,與OHC和DC共享564個(gè)基因相比),但是IHC和OHC共享771個(gè)基因表達(圖2A)。為了更嚴格地測試每種細胞類(lèi)型的轉錄相似性,使用所有基因進(jìn)行Pearson相關(guān)和R2回歸分析?;貧w分析,所有3組間比較中發(fā)現了強相關(guān)性,OHCs和IHC之間的相關(guān)性最高,OHCs和DC之間的相關(guān)性最低。OHC和DC表達譜最不相似可能反映了OHC高水平特化(圖2B)。

為了定義每種細胞類(lèi)型的特征性表達譜,通過(guò)cluster內各個(gè)細胞的標準化表達水平對所有基因進(jìn)行排序。每種細胞類(lèi)型的表達譜通過(guò)少量高表達基因(對數平均表達水平在2和7之間)和大量低表達基因(對數平均表達水平<2)來(lái)表征(圖2C,2E和2G)。在按細胞類(lèi)型排名前50的最高表達基因中,一些基因,如Fbxo2和Skpa1,在所有3種細胞類(lèi)型中高度表達;而其他基因,如Ocm和Fgfr3,主要僅在一種細胞類(lèi)型中表達。使用AUC排序,提取每組的cluster定義基因以鑒定特定細胞類(lèi)型特異性marker基因(圖2D,2F和2H)。前10個(gè)cluter定義基因的小提琴圖揭示了眾所周知的marker基因OHC(Ocm和Slc26a5)、IHC(Otof和Atp2a3)和DC(Bace2和Ceacam16)??梢酝ㄟ^(guò)scRNA-Seq瀏覽器工具(Web資源:https://morlscrnaseq.org/)訪(fǎng)問(wèn)小提琴圖對應的完整基因列表。



3、差異表達分析
已知細胞類(lèi)型marker基因高度差異表達,例如prestin(Slc26a5),其在OHCs中穩健且差異表達。與公布的OHC和IHC轉錄組數據進(jìn)行比較,搜索具有不一致排名的基因,假設通過(guò)AUC而不是表達水平對基因進(jìn)行排序將在更廣泛的表達水平上鑒定細胞類(lèi)型定義基因。按AUC分類(lèi)排名時(shí),兩個(gè)鈣相關(guān)基因Ocm和Sri在OHC定義基因列表中排名第一,甚至超過(guò)Slc26a5,排名第三(上圖2F)。先前已在OHC中報道了Ocm的表達。編碼蛋白質(zhì)oncomodulin(癌調蛋白)是鈣結合蛋白家族成員之一,它是耳蝸聽(tīng)力擴增所必需的。Sri編碼sorcin(可溶性耐藥相關(guān)鈣結合蛋白),一種在心肌細胞中表達的蛋白質(zhì),是鈣介導的興奮-收縮偶聯(lián)所必需的,通過(guò)抑制Ryr通道(Ca2+釋放通道/RyR受體)進(jìn)行鈣離子介導的鈣離子釋放?(CICR)。在肌細胞中,Ryr通道介導CICR,能夠從肌質(zhì)網(wǎng)中快速釋放Ca2+離子,從而產(chǎn)生對于肌肉收縮必不可少的時(shí)空限制性鈣火花。


免疫熒光僅將sorcin僅定位于OHC(圖3A,3B),假設類(lèi)似的機制可以調節基于prestin的運動(dòng)(圖3C和3D,動(dòng)力蛋白?Prestin是一種高度專(zhuān)業(yè)化的蛋白質(zhì),可以起到驅動(dòng)耳蝸中外部毛細胞的作用,使耳蝸可以讓人們和動(dòng)物聽(tīng)到聲音)。與此可能性一致,作者確定了在OHCs中表達sorcin介導的興奮-收縮途徑的基本組分,包括(1)電壓門(mén)控鈣釋放通道,(2)促進(jìn)CICR的通道,(3)終止CICR的機制(sorcin),和(4)鈣泵使釋放的Ca2+返回Ca2+儲庫(圖3E)。本數據集和他人數據集中檢測到的第一個(gè)組分是耳聾基因Cacna1d,一種在OHCs中高表達的電壓門(mén)控鈣釋放通道,參與心動(dòng)過(guò)緩有關(guān)的綜合征性耳聾;第二個(gè)組分,即促進(jìn)CICR的通道,包括Ryr1、Ryr2和Ryr3。在通過(guò)Ryr通道誘導CICR后,sorcin的作用可能是通過(guò)在Ca2+存在下阻斷Ryr受體來(lái)快速終止CICR,這是先前在心肌細胞中報道的途徑。已知定位于OHC表面下池的Ca2+?ATP酶泵可從細胞溶質(zhì)中除去Ca2+。附著(zhù)蛋白質(zhì)(Ocm)等結合并緩沖Ca2?+的輔助蛋白質(zhì)可能有助于這一過(guò)程。
4、轉錄本結構分析
大多數耳聾相關(guān)基因在IHC和OHC中表達,但它們在這些細胞中的isoform結構仍未得到很好的解析。SmartSeq2單細胞轉錄組測序,可克服細胞異質(zhì)性和低豐度表達,以定義聽(tīng)覺(jué)HC中的基因產(chǎn)物結構,比如可變剪切。小鼠Myo15中檢測到已報道的3個(gè)事件:(1)可變轉錄起始位點(diǎn)TSS事件:mm10?chr11:60,480,418-60,480,621;(2)位于chr11的6bp外顯子:60,486,893-60,486,898;(3)剪接受體位點(diǎn)導致在位置chr11:60,497,434-60,497,576的提前終止。另外,檢測到3個(gè)新的未報道注釋的features:包括未報道的OHC特異性可變剪接受體位點(diǎn)(chr11:60,483,616-60,483,806),其中包含移碼和提前終止,表明可能的功能作為調控元件,與報道位于chr11位置的剪接受體位點(diǎn):60,497,434-60,497,576類(lèi)似,以及位于chr11的剪接位點(diǎn):3’UTR中的剪切位點(diǎn):60,527,450-60,527,710。
鑒定孟德?tīng)柖@的基因中未注釋的feature,在12個(gè)聽(tīng)力喪失基因中鑒定出20個(gè)高度保守的未注釋外顯子(表1;圖4和5)。鑒定的編碼和非UTR含有外顯子的平均大小為55bp,這些外顯子位于小鼠外顯子的最小十分位數中(33%的小鼠外顯子<100bp;?6.9%<50bp)。

5、全長(cháng)isoform鑒定
為了解決全長(cháng)isoform結構,進(jìn)行了ONT全長(cháng)轉錄組測序,并使用Illumina短reads序列數據作為確認的scaffold,用于nonopore長(cháng)讀長(cháng)數據比對。與150-800bp片段大小的Illumina?reads不同,Nanopore測序不需要片段化文庫,并且可以產(chǎn)生跨越mRNA轉錄本長(cháng)度的單一reads(圖6A和6B)。對p15時(shí)間點(diǎn)的12個(gè)OHC細胞加barcaod以在4個(gè)MinION?R9.4?flow?cell上測序所有樣品,同時(shí)保持單細胞分辨率(圖6A)。因為OHCs是最多和最差異的Illumina數據集,這有助于跨平臺比較以驗證長(cháng)reads和isoform定量。
長(cháng)讀長(cháng)ONT全長(cháng)數據顯示出驚人的isoform異質(zhì)性。例如,檢測到445個(gè)reads比對到耳聾相關(guān)基因Cabp2。通過(guò)Mandalorion?pipeline鑒定了14種不同isoform。但當高度相似的isoform?configurations(構型)組合去冗余時(shí),該數量下降至5(圖6B)。通過(guò)量化每種isoform的豐度,在每個(gè)單獨的細胞和更廣泛的OHC組中鑒定了主要的isoform configurations(構型)(圖6C-6E)。最常檢測到和大量表達的configurations是isoform1。查詢(xún)了公開(kāi)可用的鼠注釋數據庫(RefSeq,GenBank,GENCODE和UCSC基因)和數據集(來(lái)自GenBank和UCSC基因組瀏覽器的mRNA),但未發(fā)現該isoform的注釋。除了它在小鼠中的缺失外,還無(wú)法在RefSeq,GenBank,GENCODE和UCSC人類(lèi)數據庫中鑒定出與isoform1結構上直系同源的轉錄本。



小結
Highlight
-
單細胞RNA-seq可鑒定內毛細胞(inner?hair?cells,IHCs)和外毛細胞(outlier?hair?cells,OHCs)定義基因;
-
Sorcin是心臟興奮-收縮的關(guān)鍵因子,是OHCs的top?marker基因;
-
對耳聾相關(guān)基因的分析鑒定了迄今未被識別的外顯子;
-
Nanopore長(cháng)讀長(cháng)RNA-seq(全長(cháng)轉錄組測序)揭示剪接多樣性和isoform豐度。
參考文獻:Ranum?P?T,?Goodwin?A?T,?Yoshimura?H,? et?al.?Insights?into?the?Biology?of?Hearing?and?Deafness?Revealed?by? Single-Cell?RNA?Sequencing[J].?Cell?reports,?2019,?26(11):?3160-3171.? e3.



京公網(wǎng)安備 11011302003368號