數據存儲產業服務平臺

海量存儲新機遇 從MassStor100排行榜看生物醫學大數據的快速發展

1月28日,國內首個海量存儲系統性能榜單——中國海量存儲系統MassStor100排行榜(下簡稱MassStor100榜單)正式發布。MassStor100榜單由中國儀器儀表學會圖像科學與工程分會、天津市電子學會共同成立的“存儲評測聯合工作組”每年定期發布。首屆榜單收錄了包含政府、科研、教育、能源、醫療等十余個應用領域共計35套系統。其中,來自中科曙光的ParaStor和??低暤腄S-A視頻云存儲分別以72.35PB、70.74PB的有效容量位列榜單前兩位。

生物醫學大數據,為海量存儲打開機遇之門

從上榜系統涵蓋的15個應用領域來看,視頻監控、衛星遙感、云計算/云存儲和生物信息、氣象環保作為典型海量數據應用場景,占據上榜系統50%以上的份額。由曙光公司提供存儲設備的天壇醫院、中國科學院上海生命科學研究院和上海瑞金醫院均榜上有名??梢?,隨著生命科學、新藥發現、新冠疫情傳播研究及快速檢測等應用的快速發展,加速了存儲技術與生物科學數據領域的融合。特別是2020年的疫情防控工作中,科技抗疫彰顯創新實力,除了病毒形態研究以外,精準醫療、個性化醫療,也為存儲行業在生物信息、醫療衛生領域的發展帶來了新的機遇。

近年來,隨著基因測序技術的快速發展,生物醫學領域正在快速產生海量數據,以第二代高通量測序技術等為代表的各類組學技術飛速發展,推動了基因組、轉錄組、表觀遺傳組、蛋白質組等生命科學組學數據成指數級增長,把生物醫學數據推進到了PB時代。而當前正在發展的第三代單分子測序技術,速度更快、成本更低,進一步推動生物醫學數據進入EB時代。除了數據規模增速快,生物醫學數據分布零散、難以有效整合分析,數據價值挖掘困難,如何更加有效地利用成為嚴峻挑戰。

曙光ParaStor,挖掘生物醫學大數據價值

在對海量生物醫療數據中的應用規律進行研究時,曙光發現,生物醫學數據種類繁多、內部結構高維復雜、內涵豐富、數據相對分散、難以高維度多層次交匯共享。必須要解決海量生物醫療數據匯集、共享、使用這三大問題,才可以實現數據價值的挖掘。

首先是海量數據的匯集,曙光分布式存儲系統ParaStor可通過性能與容量的線性增長,滿足生物醫學數據以每12-18個月10倍的速度快速增長,實現對來自不同區域、機構、個體,結構化和非結構化數據進行高效存儲;其次是海量數據的共享,ParaStor可在全局單一命名空間為用戶構建EB級容量的虛擬存儲池,所有客戶端均在同一個命名空間下共享訪問所有的數據,有效簡化海量數據管理的復雜性;最后是海量數據的使用,曙光ParaStor擁有100Gb/s EDR Infiniband高速存儲網絡,高效解決平臺對海量醫療數據大文件存儲場景高聚合帶寬、小文件存儲場景高IOPS的存儲需求。

多年來,曙光公司深耕生物醫學領域,為上海瑞金醫院、北京天壇醫院、北京基因組研究所、上海生命科學研究院、上海市疾病預防控制中心等單位提供產品與解決方案,高效支持醫療影像、基因測序、冷凍電鏡、藥品研發等應用的穩定運行。未來,曙光將充分發揮企業優勢,加速技術創新,為生物信息領域用戶提供更先進的產品與服務。

未經允許不得轉載:存儲在線-存儲專業媒體 » 海量存儲新機遇 從MassStor100排行榜看生物醫學大數據的快速發展
精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走