尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
10月26日,《核酸研究》(Nucleic Acids Research)在線發表中國科學院科學家團隊——微生物研究所微生物資源與大數據中心、世界微生物數據中心馬俊才團隊題為gcMeta: a Global Catalogueof Metagenomics platform to support the archiving, standardization and analysisof microbiome data 的研究論文。gcMeta平台是一個微生物基因組及微生物組數據的管理、分析和發布平台,為國內外用戶提供一站式的從數據存儲、數據分析到數據發布的服務,目前已經整合了來自中科院微生物組計劃及國內外多個重要項目的數據。該平台的發布將有效支撐大陸微生物組研究並為未來大陸國家微生物組計劃的實施提供重要的支持。
近年來,美國、歐盟都陸續啟動了微生物組相關的研究項目。但微生物組大數據的收集、存儲、功能挖掘和開發利用一直是制約微生物組發展的核心問題。大陸目前在微生物組數據管理中存在著標準不統一、缺乏跨領域的數據整合、高質量的參考數據庫和數據的深度挖掘技術等問題。2017年,中科院啟動了「中國微生物組計劃」項目,項目旨在進一步強化中科院在微生物組研究和開發利用等方面的共性技術和平台優勢,聚焦「人體健康和環境」微生物組,開發相應的微生物組學新方法、新技術;通過研究其結構與功能、群體間的競爭與合作,微生物組與人體等宿主和環境相互作用及與宿主的寄生共生健康發育等關係,發現微生物與人類和環境共同演化的科學規律。同時,也將在微生物組數據標準化的基礎上,建立微生物組大數據計算、存儲和共享平台,開發微生物組大數據挖掘的新方法,做到大陸微生物組數據資源的系統管理和高效利用。
gcMeta建立了一個微生物基因組、元基因組和轉錄組管理、數據在線分析、可視化及數據發布的一站式系統。目前已經整合來自國際相關平台(NCBI、EBI、MG-RAST等)及重要項目(HMP、Tara等)超過12萬樣本數據,來自大陸科學家的超過2000餘個樣本數據,總數據量超過120TB。平台為用戶提供了多級的數據管理和權限控制體系,可用於各研究組管理未發表數據,並在研究組內共享,也可以將內部管理數據進行在線發布與公開。平台為所有公開數據提供基於Persistent Identifier (PID) (http://www.pidconsortium.eu/)系統的唯一PID號,用於在學術期刊的公開發表及後續數據引用及分析。此外,平台還整合了超過90個在線數據分析工具,提供針對擴增子序列、全基因組序列等4套分析工作流,所有的分析工具和工作流都是以web方式使用,方便微生物領域用戶快速掌握及使用。用戶可以通過該平台方便地做到數據管理、數據分析、結果展示和數據發布等一系列服務,平台也將為用戶提供全過程的使用支持,歡迎國內外用戶使用該平台。
微生物資源與大數據中心史文聿、亓合媛為論文共同第一作者,微生物資源與大數據中心及世界微生物數據中心馬俊才及吳林寰為論文共同通訊作者。該研究得到中科院重點部署項目「人體與環境健康的微生物組共性技術研究」、國家重點研發計劃「益生菌健康功能與基於腸道微生物組學的食品營養代謝機理研究」、中科院A類先導專項「地球大數據」、中科院信息化專項微生物領域雲項目等的支持。
圖1:用戶數據管理、數據分析及數據發布流程
圖2:gcMeta數據管理系統及主頁
圖3:gcMeta數據分析及可視化系統
(來源:中國科學院)