作為峰會重要的環節之一——CIO高峰論壇也于當天舉行。參加對話的四位嘉賓分別是中國石油東方地球物理公司研究院總工程師賴能和先生,大連恒力石化股份有限公司CIO余斌先生,華泰財產保險有限公司信息技術部副總經理楊新剛先生,以及來自深圳國家基因庫生物信息數據庫曾文君主任。

DOIT高級顧問、資深技術專家 董唯元先生

對話主持人由DOIT高級顧問、資深技術專家 董唯元先生擔任。

董唯元:首先感謝各位。按理本來應該請各位嘉賓都先介紹一下各自的行業和單位的情況,但是我想今天聚在這里更多是討論的技術話題,每年都有這樣的話題。結合專業討論干貨之前,先請專家從各自的總體趨勢上對數字化時代這樣一個大的前景做一些分享,如何看待這樣一些大的技術趨勢。

中國石油東方地球物理公司研究院總工程師賴能和先生

賴能和: 大家下午好,數字化轉型是當今新時代發展的必然趨勢。要做數字化轉型,首先要做信息化、流程標準化。數字化轉型是技術和管理創新一個很好的引擎,各單位目前都在抓這一點。數字化、智能化,是將來整個IT基礎設施建設很重要的一塊,對企業技術創新和管理創新來說是很好的驅動力。

余斌:數字化轉型是大勢所趨。對石油石化行業來說,大家更多聽到的是兩化融合,這些事情都不沖突。我們可能從生產、銷售、包括產品的設計等各個層面都在做數字化的轉型,可能大家接受的更多是數字銷售轉化。對于生產型、重資產企業,數字化轉型給我們帶來了更多的發展機會。

智能化,其實有三個階段,首先是數字化,然后是網絡化,第三步才是智能化,從這個層面來講,要實現智能化,首先要做轉型,從生產企業的角度,我們現在數字化的任務就是圍繞工業互聯網的這個基礎設施的建設,通過數據的提取建模方式,實現人機各個方面數字化的建立。

楊新剛:對保險行業來說,數字化轉型有幾個比較明顯的問題。最突出的一個問題就是宏觀管理層面上的問題。在過去,CEO經常關注重點項目,匯報的時候項目已經做完,但是數據沒有保存下來。為什么?這里既有數據思維的緣故,也有體制的原因,這里面我可能思考比較多一點。數字化負責人關注業務的穩定,技術的穩定性、客戶的體驗,一個問題是,數據到底保存下來有多少。我看到行業里面很多公司都存在這樣的問題。數字化項目一個一個上線,到了最后發現很多數據沒有保存下來,這是我個人體會比較深的一個點。

國家基因庫生物信息數據庫曾文君主任

曾文君:大家下午好!我這邊主要分享一下生命科學領域如何進行數字化轉型。非常贊同楊總的分享,數字化并不是CIO、CTO一個人的事情,是企業內部的變革。生命是數字化的,因為每一個人都是有ATCG 4種堿基對,每一個人的基因組有3GB大小,經過測序下來每個人數據量達到100 GB,基因數據,我們叫生命大數據,遠比社交數據或者是金融交易數據更有研究價值和產業價值。因為這些數據里面包含著人類生老病死所有相關的信息,我們致力于這些信息的挖掘。

生命數字化的過程,依賴的一個重要工具就是測序儀;我們也致力于支撐國產測序儀的研發和應用工作。生命數字化之后,可以采用大數據分析+AI的方式探索健康疾病方面一些信息。

今天主要是跟各嘉賓去探討一下我們在生命大數據發展過程中遇到的一些挑戰和機遇。

董唯元:剛才在私下交流的時候,四位專業人士已經從各自的領域談到了各自的感悟,像賴總在石油勘探領域,余總在石油化工領域,楊總在保險領域,曾總在生命科學領域提了很多各自的想法。今天會議的主題跟數據相的,接下來希望各位各自行業角度出發,談一下各自角度對數據的地位和數據價值挖掘的特別的感悟。

曾文君:剛才說到,生命大數據是一個尚待開發的區域,因為大家對健康非常關注。一個人的基因數據是100GB,一個人一生的醫療數據,包括影像生化檢測能產生幾個T的數據,如果一千萬人口城市里面,大家都做這個,整個數據的需求不是小數量。測序通量的增長超過了摩爾定律發展速度,華大智造的測試儀性能通量在過去4年增長了11.5倍,這給IT帶來了巨大的挑戰,這些數據如何保存、分析還有合規安全性。今天參加這個會,和很多專家廠商進行交流,能得到一些解答,因為目前我認為BT+IT方面的性能和一些價格成本沒法滿足整個生命大數據時代需求,我認為還沒有做好準備的。

華泰財產保險有限公司信息技術部副總經理楊新剛先生

楊新剛:我特別贊同曾總的觀點,很多企業都沒有做好數字化來臨的準備。為什么這么說呢,因為有一項基礎性工作,數據資產的盤點,僅有相當一部分企業在做。從一個公司角度,你的數據有多少是用戶的熱數據,有多少是歷史數據,基于什么樣的場景產生的,有什么樣的價值。

我每到一個公司,首先做的第一件事就是數據資產的盤點,對數據資產進行分類,在什么場景下產生的數據,體量多大,有什么樣的價值,未來怎么樣使用,等等,要有這樣一份完整的規劃,用以指導我們未來對數據價值的挖掘方向,這是一個基礎性的工作,也是一個非常重要的工作,要從一個公司整體戰略層面去做推進,才更加有效落地。我自己的體會,數字化轉型根上兩點,一個思維轉型,一個組織架構的轉型。只要有了兩點保證,基礎性工作前瞻性的工作才能有效的推進。

董唯元:這也是很多趨勢里邊的一個很重要的一個主張。

大連恒力石化股份有限公司CIO余斌先生

余斌:關于數據的重要性,從我的角度來說,一陰一陽為之道,數據和業務正好是一陰一陽。從IT基礎技術負責人的角度,關心的是外面的這些展板,還有今天的一些演講,以及這些KP內容,而CIO層面更關心的是業務解決方案,因為有業務解決方案,所以我需要什么樣的數據。這些數據存在哪兒,實際CIO層面并不關心,要的是結果。換一句話。很多內容,如果僅僅從技術層面、存儲層面做介紹還不夠,還要和業務要有一個結合。所以我們在陽面看到的是業務解決方案,背后才是數據怎么存儲。

剛才講了關心這些PPT內容的是技術負責人,但決策權在企業CIO手里,如果不把業務和我們的數據之間打通,不了解什么樣的業務需要什么樣的數據存儲,需要什么樣的分析方式解決它,不把業務場景講清楚,這個事情很難讓CIO下決心說要購買什么樣的獨特技術存儲的方案。

我們對數據非常的重視,今年投資4000多萬元建設了一個小規模的數據中心。我知道EMC存儲,但沒有看過相關技術方案。我更關心的就是技術方案能不能響應現場的業務。如果響應不了,那就更多的考慮邊緣計算,盡量數據在現場能解決一部分,然后回到數據中心進行存儲和進一步處理。這是我作為應用方一點點體會。

董唯元:余總為供應商群體提出了更多的要求,相信供應商認為會有一定的難度有一定的挑戰。

賴能和:關于數據的價值,大家還要結合各自單位的實際情況和數據特點做冷靜分析。其實不是所有數據都是有價值的。從工業生產應用的角度看,工業生產應用有一部分數據是非常有價值的,比如說油田一些設備運行狀態的歷史數據,用大數據分析輔助預測一些設備故障,這些數據還是有用的。還有就是通過非常昂貴的成本采集來的地震數據,這些數據要永久保留的。這些數據價值非常大,受到現有的一些數學方法或者計算能力的制限,可能還不能完全被挖掘出來,這些數據需要永久保留。保存這些海量數據,對我們來說也是一項很不容易的事情。

董唯元:賴總高屋建瓴來談數據價值,當然也是我們必須要面對的挑戰。我知道各位都在各自的領域里,在日常工作當中是結結實實面對很多具體的問題,解決了很多具體的問題。

從各位嘉賓的分享中,大家聽到的是一些要求,其實背后可能暗示著一些對產品解決方案還是有不滿意的地方,作為乙方,實際上已經很努力創新,今天很多的介紹都是蠻新穎蠻有創意的創新,但從甲方的角度還是有更高的要求和更多的希望。代表乙方做產品的人,我們其實更希望聽到來自甲方的跟場景相關的、跟日常工作相關的干貨,如果各位能夠從自己行業應用具體場景出發,講一講技術落地過程中具體有哪些要求,或者說踩過哪些坑,帶來哪些麻煩,可以更完善更打磨好產品。

賴能和:我覺得其實沒什么坑,因為招投標書寫的很清楚,能不能用,或者是產品的性能、質量要求標書都寫的很清楚。所以我覺得還是要真正了解這個產品,以及產品的性能,了解自己的應用到底需要什么樣的性能產品。結合今天的主題,也就是是存儲,我希望解決存儲高性能、高帶寬、低延遲還有就是高并發性的技術要求,以及產品的穩定性。采購的時候只要把握很清楚,不會有太大的問題。

董唯元:我是不是可以這么理解:給您容量更大、性能更好的設備,只要夠便宜就可以買單了?

賴能和:按照招標法的綜合評分法??赡芗夹g不是很好,但價格很低,也一樣不會入選的,這是從設備采購的角度。從企業數字化轉型方面,我個人體會是要做好這幾個方面的工作:第一個是做好企業信息化、流程標準化,做完以后關鍵要把它真正應用起來,信息化是一把手工程,做好落實;第二個是要搞清楚信息化、數字化有什么區別。過去我們都做過很多信息化管理平臺,但做信息化是從管理的思維、從管理的角度想把每一個管理環節管住,而數字化轉型是要強調用戶的體驗、強調數據的共享,兩者的思維和理念不同。

董唯元:數據存儲和安全的關系如何?

賴能和:油氣勘探的數據是國家重要資產,是不允許對外的,我自己平時講報告的時候從來都是不會把數據坐標顯示出來,你看不到是哪里數據,坐標是不能公開的,包括數據所在的地區名字都不能出現。講到數據安全的問題,這是個很重要的議題,企業數據如要上公有云,數據的安全性怎么辦?對我們來說,生產網是生產網,辦公網是辦公網,兩者絕對不可能聯通,這是從網絡上來說。另一方面,從數據存儲的角度,我們對存儲的要求是非常高,要求采用很可靠的存儲,當然重要數據還要做好備份,甚至還有一些要放到磁帶上去永久保存,現在磁帶記錄數據的速度也非???,達到360MB/s。

余斌:結合行業談需求,首先我覺得可能要了解國家的政策,了解當前的主要發展趨勢。其實在前面五年,國家推智能制造,這五年推工業互聯網,最近國家剛推的區塊鏈,未來五年推AI、VR、AR方面的應用,這些不同的技術都有不同的應用場景,對應不同的數據存儲分析各方面的需求,具體到石油石化行業最近正在做的工業互聯網平臺這一塊,之前我們生產的這些數據,對存儲要求很簡單。就是講的夠大夠快就可以了,現在隨著工業互聯網的發展進入到數字孿生的階段,數字孿生的階段要求形成控制這種閉環,就是說通過數字化建模,分析系統返回系統,對數據存儲數據分析就是安全可靠,不能在傳輸的過程中或者說在存儲的過程中發生了修改,或者發生一些變化,反饋回控制系統不是閉環,那就是災難了。結合大的發展趨勢和行業的具體需求應用,我們基本上從又大又快到安全可靠,而且我剛才講的邊緣計算,盡量要少存數據。盡量把無用的數據在邊緣計算階段處理掉,各種各樣傳感器參數拷過來,在前端要做一些臨時性的存儲,這種存儲對性能的要求可能要求快,未必要求大。很多企業已經不關心數據存在哪兒,反正是存在云端,如何應對這些需求提供解決方案,我覺得這個時候解決方案盯著邊緣計算可能更有效一些。

董唯元:剛才余總介紹工業互聯網的平臺,尤其您講到大企業建平臺,小企業使用它的服務化交付的IT服務結果,我覺得這是我們這些做傳統存儲的人很關心的。面臨行業涌現起來的工業4.0,小企業沒有基礎設施的需求,全都集中到一個大平臺上來,這個時候對做存儲的也好,對整體解決方案備份也好,肯定還是會有很多異化。

剛才您講到邊緣計算,數據上行的過程中特殊處理,這些東西和哪些存儲相關,或者不相關,我也想更多知道現在有哪些技術解決不了的細節。

余斌:前一段時間擔任中國工業互聯網大賽的評委,我看到很多杰出解決方案,就是邊緣計算解決方案。小企業上云,我們要了解發展趨勢,在這種發展趨勢下,存儲賣給誰;都賣給云廠商,肯定不現實,所以我們看到很多很好的解決方案,就是在邊緣計算層做了很多集數據分析集存儲把MBS都做進去,把邊緣計算越做越成為一個獨立的整體。我看到,一家國產企業,從芯片一直到操作系統整體都是國產解決方案的廠商,甚至把PLC都虛擬化,大量的計算和存儲功能都在邊緣計算端完成,直接對接云端應用就可以了,這也是一個思路。

董唯元:這種比較新穎的解決方案,邊緣計算業務邏輯跑到了一個封裝好的系統里,作為用戶會不會擔心被一家廠商鎖定,將來只能買他們家東西?

余斌:邊緣計算看用在哪些方面。用在工藝上、用在設備上,聽著好像市場變小,其實市場變大了,前端做了數據分析存儲處理,接著把一些更有用的管理數據提取出來,或者說建模完到云端去,現場需要不是一個兩個問題,需要大批量,包括賴總勘探油井的數據,原來都傳到數據中心分析,一個油井配一個邊緣計算的服務器,有多少個油井,都現場把這個問題解決了。沒有必要說一家通吃,所有的接口數據傳輸有標準的。

楊新剛:我著重分享一下安全和合規。數字化情況下,很多用戶觸點數據都涉及到安全和合規,一個國家政策層面的合規,讓外面很多P2P大數據廠商,基本上銷聲匿跡。

董唯元:在金融保險行業要求比較高。

楊新剛:一個典型案例是大數據風控。在金融行業,保險叫投保風險,銀行叫貸款人的違約,基本的思路是建立一個風控的模型,和外部的一些比較知名的廠商做數據合作。但本來大家合作好好的,突然說對不起,因為種種原因,從明天開始服務要停掉了。這說明,數據合作包括建模,應該建立在安全合規的基礎上。這是外部數據合作。

對于金融企業來講,最大的合規風險是客戶信息的泄露,這類似于制造企業的生產安全事故,從存儲的角度,所有的客戶信息、敏感信息,比如說證件號郵箱號都要進行加密的存儲,從甲方的角度,希望提供一個便捷的方案,很便捷對這個用戶敏感信息進行加密。但是加密之后,外面又有數據合作的需求,總有一方要把數據還原,按照對方加密方式進行數據合作,這里邊有很多細節性包括方案性的問題。我們一直希望有比較好的廠商提供一個完整的交鑰匙的方案。

董唯元:現在是山頭林立的階段,從剛才的角度,將來在整個金融保險領域里面有一個行業互聯網能夠平臺化的統一解決接口數據問題,數據一致性的問題,或者整體資源協調的問題。有這種可能嗎?

楊新剛: 是大概率事件、也是我們期望的,有監管牽頭、行業協會牽頭提供一個叫做安全合規的服務的平臺。比方說買保險的時候,做核保分布識別,提供一個風險的評分。這個基礎是安全合規,從而能夠有效識別客戶的風險。

目前行業里面有一些原型,有一家行業公司叫中保信,全部客戶保單數據整合起來,作為監管上面的行業性的這樣一個平臺。但還沒有完全正式提供這種服務,有一些愿景和平臺,有一些場景上的服務可以提供的。如拿保單要申請貸款,這個時候保單是真的還是假的?通過行業協會平臺能夠驗證保單是真的。

董唯元:曾總其實和我們日常生活最相關了。

曾文君:剛才提到了,我們每個人數據基因數蠻大的,因為單體體積很大,現在是100個TB,隨著基因測序成本不斷下降,隨著大家對整個癌癥診斷的需求(這是很現實的問題),現在測序的話三十層,未來的話測序到一百層,上TB的數據,到醫院做檢測,一個小時拿到結果而不是一個星期拿到結果,對處理數據上性能要求很高,同時對成本的要求也是蠻高的?,F在大部分還是采用硬盤作為介質。

我們給廠家提出要求,能不能盡快把SSD價格降到我們可以普遍接受的合理的水平?這是一個很大的問題,并不是說我們處理的要求性能高,基因數據按照國家法規存儲, 上百個PB, 這么大量的數據面臨很大的問題,壽命大概五年左右,五年要倒一次,數據管理是非常大的風險。另外,系統里面有不同廠家的產品,互相去做生命周期的管理,也是非常大的挑戰。

在數據安全方面,也會遇到不可預測的人為操作,數據的備份尤其異地備份,是最后一道防線,我們的要求是不能丟數據,最最基本核心的要求,這么大的體量怎么樣去傳輸,存到什么地方,目前對我們來說是非常大的挑戰,現在的數據交互備份都通過拷盤的方式,網絡太慢了。

董唯元:據我所知,很多行業初創公司,一臺服務器可以跑起來,只有生命科學行業,一個初創公司是PB存儲起步,蠻受搞存儲的人歡迎。您剛才說的,不同幾十年對存儲性能的要求各種各樣,現在出現了一些云服務商,專門以云化服務的方式提供云端數據存儲,未來5G之后,有可能云端可以解決這些問題嗎?

曾文君:生命科學里分析過程和高性能計算密不可分,整個計算和存儲過程都是數據產生的流程, 計算和存儲設備都在靠近數據產出端(測序儀)這里,所以基本很少放到云端分析。 從目前來說,從帶寬的限制,基本上比較少,基本數據哪里產生,算力和存儲能力都一起解決這個問題,我們嘗試過和云廠商合作,整體來說還是沒那么方便,一方面, 公有云產品的價格還是比自建數據中心要略貴,二是有政策法規的要求,人的基因數據現在國家監管非常嚴,放在公有云上是否合規合法,尚沒有明確的政策指引。此外,基因數據作為國家的戰略資源,我很關注它會不會因為中美貿易戰的制裁或者黑客的情況導致供應鏈或者安全受影響,我們這邊非常樂意看到支持國內的自主可控的存儲的技術,不會被人卡脖子,不會有后顧之憂。

董唯元:以前沒有想到,生命科學對自主可控還有那么明確的要求。

本來我們還希望更多的和各位專家去探討一些干貨,今天時間有限,交流就暫時告一段落。每年都會有這么一個環節,感謝大家,感謝各位專家,來年再見,謝謝!

關于主持人:

董唯元先生,曾任中科院計算所863課題組產品技術顧問,多年來持續專注大型數據中心的建設與運維工作,曾主持規劃并建設了數十個大型數據中心系統。

未經允許不得轉載:存儲在線-存儲專業媒體 » CIO高峰論壇召開:熱議數據價值挖掘與智能應用
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走