章張, 中國科學(xué)院北京基因組研究所“百人計劃”研究員,2007年獲中國科學(xué)院計算技術(shù)研究所生物信息學(xué)博士學(xué)位,之后在美國耶魯大學(xué)、沙特阿卜杜拉國王科技大 學(xué)繼續從事生物信息學(xué)方面研究工作,2011年全職回國,2016年擔任中國科學(xué)院北京基因組研究所生命與健康大數據中心常務(wù)副主任,擔任中國遺傳學(xué)會(huì )生 物大數據專(zhuān)業(yè)委員會(huì )副主任、基因組學(xué)專(zhuān)業(yè)委員會(huì )委員,是首位入選國際生物審編學(xué)會(huì )(International Society for Biocuration)執行委員會(huì )的中國學(xué)者。

隨著(zhù)高通量測序技術(shù)的飛速發(fā)展以及海量組學(xué)數據的快速激增,生物信息學(xué)成為生命科學(xué)領(lǐng)域發(fā)展最為迅猛的學(xué)科之一。生物信息學(xué) (Bioinformatics)集成數學(xué)、信息學(xué)、統計學(xué)和計算機科學(xué)等多學(xué)科方法揭示海量生物大數據內的規律和奧秘,因此,生物信息學(xué)的核心可以說(shuō)是 如何實(shí)現跨領(lǐng)域、跨學(xué)科的融合并以此解決生物學(xué)問(wèn)題。近幾年,生物信息學(xué)迅猛發(fā)展,研究領(lǐng)域、應用范圍更加廣闊,但在高速發(fā)展中難免會(huì )出現一些弊端和瓶 頸,結合本人研究方向,個(gè)人認為有以下三個(gè)問(wèn)題以供各位專(zhuān)家和同學(xué)共同探討。
第一、生物信息學(xué)難于將不同專(zhuān)業(yè)領(lǐng)域完美融合于一體。對 于單個(gè)個(gè)體來(lái)說(shuō),很難達到所有學(xué)科的精通。生命(或信息)科學(xué)領(lǐng)域的研究工作者在各自領(lǐng)域都是專(zhuān)家,但是在進(jìn)行生物信息研究工作時(shí)仍需要學(xué)習信息(或 生命)科學(xué)領(lǐng)域等專(zhuān)業(yè)知識,且短時(shí)間內難以掌握。較為理想的模式是建立生物信息學(xué)團隊,團隊中分工明確,各司其職,互相協(xié)作。目前,該模式已經(jīng)成為各大型 實(shí)驗室、高校、研究所和生物科技公司的主流。然而,近些年來(lái)隨著(zhù)測序成本的斷崖式下降以及測序產(chǎn)出的數據呈現爆炸式增長(cháng),生物信息分析的要求越來(lái)越高,即 使是團隊作戰也開(kāi)始暴露出弊端:團隊分析日益成熟的標準分析流程與更加精細的個(gè)體化需求難以達成一致,同質(zhì)化日益突出,團隊內溝通日趨困難。
第二、自主搭建的生物信息分析平臺應運而生,但隨著(zhù)生物大數據時(shí)代的到來(lái)越來(lái)越難以支撐運營(yíng)。首 先,計算存儲資源難以跟上數據增長(cháng)的速度,且數據分析需求動(dòng)態(tài)變化,因此資源難以得到合理的應用;再次,因體制約束、人才短缺和培養費用高昂導致的人才隊 伍難以建立和維持,最后就是場(chǎng)地建設和維護、硬件設備軟件設備的更新?lián)Q代等導致運維成本大大提升。隨著(zhù)國家對科研的投入加大,越來(lái)越來(lái)的研究機構有意著(zhù)手 搭建自己的生物信息分析云平臺,然而其弊端隨著(zhù)平臺運行時(shí)間推移逐漸突出。因此,無(wú)論是科研機構,還是企業(yè)公司,中小型規模的私有云平臺面臨一個(gè)困境,運 行則成本負擔不起,不運行則資源浪費。
第三、生物信息領(lǐng)域亟需建立統一的標準體系進(jìn)行質(zhì)控研發(fā)和規范流程。面對同樣的一個(gè)研發(fā)工作,不同的研發(fā)團隊和個(gè)人會(huì )使用或開(kāi)發(fā)出不同的代碼和規則,這樣很難用簡(jiǎn)單的對錯去評估;另外,已經(jīng)完成的流程代碼在如此迅猛的發(fā)展大潮下也很難做到及時(shí)的更新與評估,相同類(lèi)型的軟件質(zhì)量參差不齊且分析過(guò)程不透明,缺乏質(zhì)量控制和過(guò)程管理。
解決以上三個(gè)問(wèn)題可能的途徑之一是搭建一個(gè)公共云平臺讓不同研究方向的專(zhuān)家大展身手,相互支持又相互獨立,構建一套完善的研發(fā)規則與準則,形成生物信息研 發(fā)交流生態(tài)系統,同時(shí)又將分散的資源進(jìn)行整合并合理分配。然而,搭建這樣的公共云平臺需要匯集各學(xué)科專(zhuān)業(yè)的智慧、多年的項目累積和經(jīng)驗總結、龐大的團隊支 撐以及公開(kāi)透明的平臺組織架構?,F今,國內外科研界和企業(yè)界已開(kāi)發(fā)的云平臺有Galaxy、SevenBridges、百邁客云等。其中,百邁客云算 是國內的典型代表,具有可操作化界面、簡(jiǎn)便易上手、分析流程高度集成化等特點(diǎn),內嵌的分析流程經(jīng)歷過(guò)近萬(wàn)項目的使用驗證。在“互聯(lián)網(wǎng)+”時(shí)代,云平臺通過(guò) 網(wǎng)絡(luò )為用戶(hù)提供方便、隨時(shí)可獲取的計算資源,用戶(hù)無(wú)需添置、維護昂貴的用于大數據存儲與計算的高性能硬件資源,采用虛擬化技術(shù)可實(shí)現計算資源的快速擴展, 用戶(hù)可以根據自己的存儲分析需求,快速調整資源配置,經(jīng)濟靈活。百邁客云依據自己多年的生物信息分析優(yōu)勢,開(kāi)發(fā)出完整高效的云平臺系統,及時(shí)迅速的版本更新以及敏捷開(kāi)發(fā)Scrum迭代模式大大提高了生物信息開(kāi)發(fā)的效率和規模,為生物信息發(fā)展提供了一套行業(yè)標準和規范流程。

千里之行,始于足下,緊跟“互聯(lián)網(wǎng)+”大潮流,我國科研機構和科技企業(yè) 正在一步一步腳踏實(shí)地的創(chuàng )新性的變革著(zhù)生命科學(xué)研究模式,在我國綜合國力大幅提升、生 命科學(xué)領(lǐng)域不斷發(fā)展的背景下,相信這場(chǎng)變革會(huì )在不久的將來(lái)發(fā)生在中華大地,譜寫(xiě)出中國科技工作者和企業(yè)家們在生命科學(xué)領(lǐng)域新的篇章。


京公網(wǎng)安備 11011302003368號