快遞已經成為社會不可或缺的行業

如何用更低的成本存儲更多的運單圖片

據國家郵政局數據,目前中國單日的快遞運單量已經超過1億,那么同樣也需要有一樣多的底單圖片被掃描并存儲。即使經過先進的壓縮算法進行圖片壓縮,每天需要存儲的數據也十分驚人。通常來說,大型快遞公司的運單圖片存儲系統每次擴容都需要新增PB級的容量,這需要付出極高的采購和運營成本。

通常,數據中心的分布式存儲系統是基于2U雙路12盤的服務器。計算能力和存儲能力比較均衡,也具有更廣的適用性。但是對于運單圖片這種偏存儲的應用而言,存儲的密度不足和計算部件成本過高問題就會比較明顯。

目前,市場上高密度的存儲服務器有4U36盤或者72盤甚至更高密度,相比之下,72盤甚至更高盤數的服務器會造成運維困難,同時單機功耗過高也將導致機架的供電不足和空間浪費。因此4U36盤位的服務器是目前比較合適的存儲配置。同時,雙路Intel?E5系列CPU的功耗偏高、計算能力過剩的問題也讓溫冷數據存儲成本居高不下。因此我們可以得出一個結論,快遞運單圖片存儲服務器需要一款高存儲密度、低能源消耗的服務器產品。

浪潮SA5224M4溫冷數據存儲服務器

相比市面上的高密存儲服務器,浪潮的一款基于Intel?Xeon-D系列CPU的SA5224M4顯得格外與眾不同。在存儲能力上,SA5224M4可同時支持36塊3.5寸硬盤,相比傳統存儲機型存儲密度提升50%,所需設備數量降低50%,可提高數據中心機柜空間利用率,能夠為海量運單數據提供大容量存儲。

而功耗上,浪潮服務器SA5224M4相比傳統E5存儲服務器降低35W以上。一般服務器的生命周期為三年,這樣算下來,1000臺的存儲服務器集群就能節省下至少1050萬的電費。

由于快遞的運單數據來源可能通過快遞員的掃碼槍、用戶的網絡下單,也可能來自各網點的電腦錄入,這就要求存儲系統有一定的并發數據處理能力。而浪潮SA5224M4在低能耗的基礎上,仍保持較好性能表現。運單圖片存儲應用在傳統E5 CPU存儲服務器上的負載率約為30%,而使用浪潮SA5224M4時CPU的負載率約在40%,滿足應用計算性能需求的同時,保留足夠的性能冗余,防止出現短時數據流量驟增帶來的計算壓力。

即使有一款高效低耗的存儲服務器,運單圖片的存儲成本仍是不低。那么快遞企業為什么需要存儲這些看似無用的數據?如此龐大的訂單數據,成為壓在數據中心身上的一座大山,但是這座大山里卻有著無窮無盡的資源。當有了足夠多的數據積累后,快遞公司能夠挖掘著這部分資源,并以此讓快遞更快。

昨天廢棄的底單數據如何讓今天的快遞更快?

運單圖片中什么樣的資源?有真實的人物信息、購物頻次、發貨和收貨地址等等。當積累足夠的數據時,就可以根據數據,決定網點的設置位置、派送時間、快遞的運輸/轉運路徑等,從而讓快遞的時效性得到更好地保障。

但是由于運單數據量極大,且傳統手寫體的運單圖片不易識別,導致以往積累的運單大部分成為無效數據。傳統的運單數據識別是人工跟單,要去識別各種各樣的字體,識別率在60%左右?,F在完成第一輪的翻譯后,結合AI技術和現有的技術庫歷史數據進行識別,識別率可能能夠達到90%。效率提升的代價是激增的并行計算量。

浪潮NF5288M5 AI計算服務器

圖片識別屬于“計算密集型業務”,因此單機密度和多機集群規模將直接影響人工智能應用的上線和運行效率。目前,單機4GPU卡已經成為標配,8卡正在成為主流。以浪潮NF5288M5為例,在2U空間內就能夠支持部署8塊NVLink或PCI-E 接口的GPU卡,單機即可提供單精度120 TFLOPs的峰值計算能力。并且可以在不依賴CPU的前提下,實現機內點到點通訊,減少了異構通訊的次數。同時,NF5288M5還可以掛接GPU擴展箱,支持在雙路服務器系統中擴展到16片GPU卡, 實現更低的GPU并行通信延遲。

目前,浪潮服務器已經應用于國內主流快遞公司。未來,通過浪潮SA5224M4和NF5288M5的運單圖片存儲和識別分析系統方案,能夠讓數據成為優化快遞配送時效及未來決策的依據。

未經允許不得轉載:存儲在線-存儲專業媒體 » 浪潮服務器加速快遞行業運單圖片存儲分析效率
分享到

songjy

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走