騰訊云存儲高級工程師陳宏亮

什么是新基建?

新基建也就是說新型基礎設施建設,相對于舊基建其主要包括5G計算建設、特高壓、城際高速鐵路、新能源汽車充電樁、大數據中心、人工智能、工業互聯網等領域,涉及諸多的產業鏈,以新發展為引領,以技術創新為驅動,信息網絡為基礎,面向高質量發展需要提供技術轉型、職能升級、容量創新等服務的基礎設施體系。

新基建技術中最核心的資產就是數據,物聯網讓采集的數據種類和數量越來越多,5G讓數據傳輸的速率越來越快,云計算在不斷地對數據進行計算處理,AI在不斷地挖掘數據的價值。這些技術連接的關鍵紐帶便是存儲,在新基建的推動下,存儲可以說是推動產業向高端化發展的一個剛需,為此新基建需要新的存儲。

新存儲有哪幾個重要特征?

第一個是海量存儲的可持續高效存儲。第二是海量數據的高效管理。第三是海量數據的一個價值挖掘。面對如此龐大的信息存儲量和可預見性的數據增長量,新的存儲架構必須要考慮的第一個點就是如何以更高擴展性、更高的吞吐、更低的時延以及更低的性價比來實現容量的管理。

首先要有高擴展性,滿足因為業務量數據精細度提升導致的數據量增加以及隨時擴容的需求。其次要有高吞吐、低延時,可以快速讀取跟調用。當然,用戶也是很看重整體方案的性價比。今天解決了數據存儲的問題,對新基建用戶來說是遠遠不夠的,還要進一步解決數據存儲的管理問題。

數據跟人一樣也是有生命周期,從產生到消亡有很多階段。新基建所需要的存儲系統必須要具備生命周期管理的能力,數據最終的價值呈現一定是為應用服務的。人工智能和大數據驅動的發展,驅動數據產生更多的應用價值,所以在數據的價值挖掘方面,其中終極需求必須更好地利用人工智能,服務人工智能,賦能大數據人工挖掘。

基于海量的價值挖掘分析基本上都要依賴于機器學習、深度學習的人工智能技術。在人工智能的場景中,數據要經歷采集、訓練、推理、歸檔等國家。人工智能各個階段對存儲系統要求差異非常大,采集階段要支持互聯網原始訪問的協議,吞吐量非常大。要求系統有高并發、低時延的歸檔的能力,而在歸檔的階段則需要低成本的存儲系統。

業界關注度頗高的騰訊云文件存儲CFS在關鍵業務應用場景中如何發揮能力?CFS如何以40GB/s高吞吐應對新建下的數據挑戰呢?騰訊云主要有哪幾種存儲產品?

COS、CFS和CBS,騰訊推出這三款產品可以滿足各種不同的需要。其中CFS是一個縮寫,鏈存儲,主要是提供文件存儲服務。CBS即云硬盤,主要提供的是快速的服務。而COS是云對象存儲,主要提供云對象存儲的服務。下面我們通過對比的形式介紹這三種產品,產品的規格、性能以及規模對比,主要是以CBS單刻盤、CBS單文件系統以及COS單存儲統一為單位進行對比。在存儲規模的方面,CFS大文件系統最大支持是20TB存儲上限,COS單盤支持16TB存儲上限,COS則能提供億B級存儲上限。延時方面,CFS是在0.3毫秒到20毫秒之間;CBS是在0.2毫秒至5毫秒之間,COS的延時是根據網絡情況而定的。在吞吐方面,CFS大文件系統最大能夠支持40GB/s的上限,SSD云硬盤目前最大能夠支持260兆B的吞吐上限。而COS吞吐主要與用戶互聯網存儲的帶寬相關,支持海量并發。在IOPS方面,CFS單文件系統目前最大能夠支持60K的IOPS。而CBS在SSD目前最大能夠支持26K的IOPS。COS主要性能指標是QPS,最低目前能支持1.2K的QPS。在訪問量上COS可以達到數億的并發連接,而CFS可以支持數萬的客戶端并發的訪問。而CBS在并發訪問上比較受限,在業務的網絡上CFS和CBS主要用在了內網上,COS在內外網都可以使用。生態方面COS比較豐富,有數據萬象、大數據套件、無服務函數等。在價格方面的話,CFS和CBS差不多,CFS超高一些,而COS則比較低廉。

什么是CFS?

CFS是公有云上的NAS存儲,幫助用戶解決公有云上的高性能共享存儲的需求,支持容量和性能的在線擴展,現有的應用無需修改即可直接掛載使用。CFS提供了可擴展共享的文件存儲服務,可以與騰訊云云服務器容器批量計算等服務搭配使用。CFS提供了標準的NFS及SMB云間訪問系統的訪問協議,為其他的計算服務提供共享的數據源,支持彈性的容量和性能的擴展?,F有的應用就是無需修改就可以掛載使用,是一個高可靠的文件系統。

適用于大數據分析、媒體處理和內容管理等場景。文件存儲接入非常簡單,用戶無須調節自身的結構或者無需進行復雜的配置,需要三步就可以了。第一步創建系統,第二步啟動服務器上的文件系統客戶端,第三掛載文件系統即可。

CFS產品優勢主要是四個:集成管理、自動擴展、安全可靠、成本低。在集中管理方面,CFS可以支持系統數據訪問,例如強數據一致性和文件鎖定,至于云的計算資源可以通過NFSv3.0或者是NFSv4.0的協議來掛載CFS的文件存儲。CFS可以提供控制臺界面,讓用戶可以創建文件系統,可以根據文件容量的大小,自動對文件系統的存儲容量進行拓展,同時不需要中斷請求和應用,確保獨享所需要的存儲資源的同時,降低管理工作的時間成本,減輕工作量。

在安全可靠性方面,CFS具有極高的可用性和可靠性,每一個CFS都有冗余,CFS可以嚴密控制文件系統的訪問權限,通過基礎網絡或者是VPC網絡的安全組,并搭配權限組,實現訪問的權限控制。在成本低廉方面,CFS可以動態調節需求容量,而無需提前調配存儲,用戶只需要按照使用量來付費,不需要進行最低消費或者前期部署、后期運維的費用,動態計算節點可以通過NFS共享一個存儲空間,而無需購買其他的存儲服務,也不需要考慮緩存。

CFS的應用情況?

第一個實例是HPC計算下第三代大規?;驕y序的應用,基因測序項目需要臨時的大量計算和存儲資源執行基因測序,而現行的方案是采用本地的計算節點,加上商用文件存儲形式。本地的資源無法滿足這種彈性的客戶要求,采用騰訊云文件存儲CFS,它的優勢在于可以無縫對接測試程序,用戶無需額外修改這個程序。同時,用戶可以按照實際的使用量來付費,無需額外付費,同時CFS能夠提供超高的一個吞吐性能,也能夠提供彈性拓展的存儲空間。最終的方案是我們提供300臺計算型服務器CVM的節點,配置32核120G的內存,再加上300T文件存儲,總計7個文件系統,每個文件系統提供500MB/s每秒的吞吐量。

第二個案例是廣電行業視頻處理。需求是視頻處理、分發、持久化存儲一站式解決方案。IDC機房計算節點+文件存儲設備。痛點視頻量激增,IDC計算節點不足,存儲容量不足,擴容運維非常復雜,客戶希望長期保留數據。

采用CFS優勢在于它可以提供高吞吐、低延時用于視頻渲染,同時可以將用戶希望長期保存的數據沉淀在COS中進行持久化存儲,降低成本。最終的方案在騰訊云的云總機上部署媒資管理系統,同時使用CFS作為渲染存儲庫,通過COS進行分發。

第三個案例,動畫電影制作。需要執行高吞吐、高并發計算任務,客戶現行的方案是使用IDC機房計算節點加上商用文件存儲形式,痛點是動畫后期渲染IDC計算節點不足、存儲性能不足,導致渲染耗時很長,無法滿足電影按時上線的需求。采用CFS的優勢,騰訊云能夠提供彈性伸縮高吞吐的文件存儲,而且也支持標準的NFS協議,并且可以方便地協同低成本的計算實例。最終的方案,客戶原始素材通過專線上傳到CFS,同時超過1000+云主機進行渲染作業,客戶峰值吞吐達到160Gbps,整體時長降低了28%,保證了電影按時上線。

第四個案例,教育行業AI訓練,教育場景是小文件、低延時??蛻衄F行方案是CVM+自建HDFS+COS?,F行方案的一個痛點是轉碼平臺原對接云上自建HDFS,其延時性能不佳、維護耗時。使用CFS的優勢在于CFS可以提供低延時、高吞吐的云服務,同時可以很大程度上提升轉的碼平臺的效率。加速模型優化,最終的方案也是使用CFS,是無縫替換CFS的集群。

第五個案例,短視頻訓練和推理。該客戶直接采用CFS加COS文案,訓練的流程是COS讀取后,在TKE上訓練分析,并發掛載量是幾十個Node,單文件大小是幾百KB到2MB左右文件,數量百萬到千萬級。為了滿足寫吞吐的需求,采用異步操作的模型,從COS預拉取進行系統。讀吞吐峰值可以打滿10GB/s,因此訓練模型30分鐘,因此訓練過程+模型發布最短要求為30分鐘??蛻舳耸荊PU,而發布的流程則是訓練完成后將最終的模型存儲到CFS上,業務的Pod就需要在最短的時間內完成,并發掛載量是100以內的Pod,文件大小是10GB到30GB之間,讀吞吐的分級是實際運營的,需要10分鐘以內做完,而數據的更新頻率是在最短30分鐘時間內發布模型。

CFS如何在新基建中發揮作用?

首先是客戶業務場景的分析。廣告推薦顧名思義,我們在使用期間會看到各種消費的小彈窗、小視頻等等,結合用戶模型為用戶提供最精準的廣告,從而提高營銷資金的利用率。CFS參與應用廣告推薦的具體業務流程主要分為三步。第一步模型發布,廣告客戶模型在訓練中心完成,訓練完成之后將模型文件發布到騰訊云。第二部分是業務應用獲取模型,客戶在騰訊云上使用了三個T的云系集群,共計超過4000node,或者超過8000個,以分擔業務的壓力。這些Pod將幾十GB的數據模型全部加載后應用才能啟動。

第三步是廣告推薦,系統使用模型文件和用戶數據,為用戶定制廣告推送。這是客戶的一個廣告業務架構圖,左邊是廣告推薦訓練集群,當訓練集群推初模型后會掛載CFS,將模型拷貝到CFS中。上面是客戶在騰訊云線上應用集群,大概是2000到8000個Pod組成不同的多個集群,分布在北京三個核心區,這些Pod通過掛載客戶端,從CFS中讀取虛擬集群,生成推理模型數據。在業務啟動時,運營程序需要讀取廣告推薦模型的文件。在運行的過程中,系統根據用戶使用數據進行廣告推薦。

騰訊云通過對業務流程的摸底,了解業務的存儲場景、存儲留存以及集成規模。關鍵性的含量指標包括業務的性能需求,客戶容量的需求以及具體模型。CFS解決了特定場景下大文件、大吞吐的難題。

“總而言之,新基建為中國的產業升級清晰指明的方向,數字化技術廣泛的應用以及隨之產生的需求,將帶來數據爆發式增長,海量數據蘊含著巨大的價值,存儲作為新基建堅實的支柱。更多樣化的數據模式、日益復雜的數據管理,以及高效的數據利用對存儲提出更高的要求,無論對傳統的吞吐廠商還是創新的吞吐廠商來說,這既是挑戰更是機遇,”陳宏亮表示。

未經允許不得轉載:存儲在線-存儲專業媒體 » 騰訊云文件存儲CFS如何以40GB/s高吞吐應對新基建挑戰?
分享到

zhangnn

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走