王堅:各位來賓,非常感謝有這么一次機會,我算是把過去幾年甚至幾十年有關的一些想法、一些教訓或者一些經驗在這兒跟大家分享一下。

今天我自己找了三個關鍵詞:AI、AI+跟AI基礎設施,這三個關鍵詞都繞不開一個關鍵詞叫AI,剛才Michael I. Jordan也講了,AI可能一千個人有一千個人的理解,一千個人有一千個人的想法。但是今天碰巧,這三個不同的方法,AI、AI+和AI基礎設施,在今天被結合在一起了。

人工智能有很長的過去,卻只有非常短的歷史

第一個是我經常說的一句話,我說人工智能有很長的過去,卻只有非常短的歷史。其實這是一個非常非常糾結的一件事情,最困惑的就是到今天為止,人工智能到底它在說什么事情呢?還是值得非常的探討一下的。

大概在(20世紀)40年代末、50年代初,圖靈寫的一篇文章叫《Intelligent  Machinery》(智能機器),我自己覺得這是一個很長過去的開始,如果你要追關于機器智能的事情,可能可以追到幾百年以前。

圖靈在這篇文章里面,談了一些很有意思的事情,這篇文章發表在心理學一個哲學雜志上,第一次在探討關于機器跟智能之間的關系。大家知道,在那個時候“計算機”這個詞還沒有完全出來,大家習慣叫做“Computing machinary”,這就是為什么美國計算機學會叫ACM的原因。那個時候“計算機”雖然沒有詞,但是圖靈在那篇文章第一次用了“數字計算機”這個詞。所以,這篇文章它的深遠的意義,還是到今天為止看,都是非常值得重新思考的,我們很多最早的概念都是從這邊來的。

當然,大家都會講到達特茅斯這個會,當時Michael I. Jordan特別講了Cybermetics(控制論),我聽完以后我就很感觸,如果當年那個會不在達特茅斯開,可能這十個人的想法就被維納給滅掉了??赡芪覀兘裉爝€是在講的叫Submetics來稱呼今天說的人工智能。但事實上說不定從單詞角度,可能用Submetics會更好一點,但人工智能就這么流行了。為什么在Herbert  Simon這邊我打了一個紅色的框,就是來設想我自己對人工智能的理解,就是從Herbert  Simon開始的。這個人很神奇,他是個心理學家,但是全參與了這個會,得了諾貝爾經濟學獎。他第一次訪問中國是1972年,以美國計算機協會的名義到中國來的,80年代初又以美國心理學會的名義到了中國來,那時候我在大學讀三年級,他到我們系講了關于人工智能。

可一個大學三年級的學生在中國,在80年代初,有一個人告訴你,人工智能在下面十年會有一次天翻地覆的變化,你大概可以設想一下,那時候我有多么的激動。但事實上等了十年,沒有什么發生,所以后來該干什么就去干什么了。但事實上里面的很多最基礎的東西,在那個時候也被提到了,甚至大家今天知道的神經網絡,我印象很深,當時在80年代末的時候,有一本教課書叫PDP(Parallel  Distrbuted Processing),里面通篇講的都是神經網絡理論,那時候講的每一個層兩個節點只有三層,大概你能做到那個程度就結束了,但是今天的規模跟那個時候沒法比。

所以我想說,今天的人工智能跟80年代初大家講的同一個人工智能,是一個完全不同的人工智能。我剛才講了,剛才Michael I. Jordan也講到這了一點。

為什么AI是一個非常短的歷史呢? 2017年,Google提出了Transformer這件事情。今天我們能夠談人工智能,又重新回到了大家的視野,重新在產業上有那么大影響的話,就是從2017年開始的。所以,2017年以前的人工智能跟我們今天說的人工智能還是有一次非常非常不同的差別的。我想這就是我說只有7年歷史的原因。

當然,這段歷史就是從一篇文章開始的,大家都知道。但是我想強調一下的事情是,這篇文章的8個作者現在都不在Google,聽說有一個最近又會回去,但沒關系,盡管他發明了很多東西,但是沒有Google什么事。這里面有一些發明今天大家被忽視掉的,比如說他第一次有了Token這個概念,聽起來好像也沒什么了不起的,但是大家都知道今天一個商業服務都是用Token來計價的,大家可以設想一下如果里面最基本的計價邏輯都不清楚的話,大概是不會有一個好好的產業的。更不用講,待會兒我主題里面講到的關于基礎設施的事情。同樣的,大家都知道在Google那個時候的前后(發表這個文章的前后)有一家公司叫OpenAI,OpenAI的出現站在我的角度來說,就是讓我們重新思考一下創新的機制是什么?所以那就有了在2022年GPT的發布。

這兩件事情結合在一起,我總是覺得是一件很怪的事情,所以我說了一句話,Google很行,Google也很不行。Google很行,中國都在講從0到1的創新,Google是100%完成了從0到1的創新,甚至還要多一點。為什么Google不行呢?大家都可能知道Eric  Schmidt前段時間在斯坦福有一個發言,搞的沸沸揚揚的,說的Google很不行,那確實也不行,為什么呢?他沒有創造出一個東西像Open AI創造出的那么有價值,對社會來說。

所以這是讓我們重新思考這個創新的機制到底是什么?它不是一個簡單的從0到1創新,不是一個簡單的你有一個好的想法,這中間的機制是遠遠超出我覺得在今天學者甚至產業界可以來理解的,我覺得這也是一個對我們最大的挑戰,所以我用了Google很行、Google也很不行。

在ChatGPT后面,它的光芒對大眾而言,不是對業界而言,是被掩蓋了很多事情的。大家都知道AlphaFold,特別是AlphaFold3出來了,但是很少人會談論說,它其實背后還是Transformer+Diffusion,大家今天在講能生成一個圖片,能生成一段視頻,大家會講到Transformer+Diffusion,可是很少人理解,為什么Google那篇文章有那么大的影響?也就是說到最后大家今天聽到的一些最基本的東西,到最后也離不開Transformer,當然從AlphaFold2到Alphafold3,中間用了一個Pairformer,但是最后的東西還是這個Transformer。

從ChatGPT到AlphaFlod、到今天大家在媒體上經常會看到關于天氣預報的時候,這是三個跨度非常大的應用。但是他們的背后有一個最基本的東西是脫離不掉的,就是Transformer。所以,我想AI為什么只有7年歷史,大家再回過頭來看,事實上是你愿意不愿意我們生活在Transformer這樣一個陰影下,也可能以后是一個陽光燦爛的東西。

人工智能+到底是什么

在這樣的背景下再回過頭來,在李強總理的政府工作報告當中多次談到了人工智能,同時提到人工智能+。大家設想一下,在Transformer這個邏輯下,我們要理解的人工智能+到底是什么?大家今天一談到人工智能+的時候就會簡單的,我加一個行業進去,這是我用我自己的話來講,沒有比人工智能+后面簡單加一個行業,把人工智能庸俗化的做法了。所以反復思考人工智能+到底是什么?我們再來扒開來看GPT或者是今天要說的這件事情的話,可能需要有一次重新的思考的。如果ChatGPT如果在人工智能+這個邏輯下,ChatGPT不是一個應用,它是個應用平臺。就像在上一個年代的offce一樣,它不是一個應用,是一個應用平臺。但如果把GPT再拆一拆,變成一個基礎模型的話,事實上Chat就是一個應用,所以ChatGPT就是GPT+Chat,這是我的理解。

我想多說一句,Chat不是一個簡單的應用場景。大家都知道微軟跟OpenAI合作過程當中,不只是做了Chat,其實他們到比爾蓋茨家里討論了GPT這樣的東西可以用到什么場景,最后只有Chat是最革命的,所以變成了產品。他們做了一大堆很有用,但是沒有革命的東西,后來都寫成了書。所以有時候我經常開玩笑,這個書是很危險的,不是革命的東西都寫成了書,可能最革命的東西做成了產品。這是我們今天真正發生的事情。

所以,我想沒有Open AI這個公司的人對Chat本身有更深的了解。今天我還是要講一句話,當你做不出一個比ChatGPT好的這樣一個東西的時候,至少有兩個原因在約束你,第一,當然是你的技術有沒有做好,就是模型;第二,你對這個問題理解的深度,你能不能真正找到這個領域的問題,事實上是你約束的最大的一個前提。我們往往在很多時候對這個問題不理解,以為有了GPT就可以解決很多的問題。

當然,我今天講的重點是,這個+到底是什么?這個+就讓我想到了,當時Chat做這件事情的時候,事實上只是反映了當年比爾蓋茨的一個愿景,就是讓計算機能聽、能說。所以我想,今天因為有了ChatGPT以后,當計算機變成一個手機以后,我們今天就做到了這一點。

那么這背后真正的+的機制就是ChatGPT當我們講那個+的時候,不是+什么東西,而是怎么加,更加重要的是一個機制的創新。這句話聽起來很抽象,再把它回過頭來,ChatGPT是什么意思?這個+就是OpenAI這家公司,沒有Open AI這家公司,GPT和Chat是不會變成這樣一個影響大家的產品的。

Open AI這家公司為什么是一個機制的創新呢?

到今天為止,大家都知道Open AI是一個怪物,也就是說它有Nonprofit(非盈利)的AI,也有OpenAI LP這樣的東西。一個Nonprofit這樣一個機構,跟一個商業機構,跟OpenAI這么一個主體里面,被這樣莫名其妙的存在在一起。所以過去發生的所有事情,都跟OpenAI,大家講的OpenAI都是講的OpenAI LP,但是大家知道它的最早的創辦是一個非盈利機構的話,大家可以想象,它中間的機制是多么復雜的一件事情。我經常跟投資人講,你用傳統的方法是投不出Open AI這樣一家公司來的。

當然,因為這樣的成功,讓我們重新反思了一下,黃仁勛說了一句話,ChatGPT是人工智能的iPhone時刻。這句話被很多人引用,我自己一開始聽的時候也很激動,后來想了想,不知道在說什么?為什么呢?因為Chat GPT是什么?也沒有完全說清楚,人工智能是什么?也沒有完全說清楚。iPhone到底是什么?也沒有說清楚。把這三個說不清楚的東西放在那里變成了一句話,這是讓我困惑了很長時間。大家也不要覺得說清楚iPhone是什么,(其實)是一件很困難的事情,我說一個現象就知道了,大家說起這個iPhone都覺得App Store是它非常重要的事情,今天任何一個人發言都說生態多么的重要,可是很少有人理解。你們去看史蒂夫·喬布斯發布第一代iPhone的時候是沒有App  Store的。如果你要講它的生態系統,當年跟史蒂夫·喬布斯一起發布iPhone第一代的那些公司,今天都不見了。所以它到底是什么?也是值得我們非常深思的。

當然,這句話我自己覺得,它其實抄襲了另外一句話,這是當年我自己看了、看了非常激動的,就是當AlphaFold出來的時候,AlphaFold2出來的時候,有人說了一句話“AlphaFold是生物學的ImageNet時刻”,我自己覺得這是真正反映了技術發展的背后的。當然這個就回到了也是那篇文章,杰夫跟他的兩個學生寫的,大家只要在做機器學習也好,做圖象識別也好,一定知道這篇文章。但是你把這篇文章抽象出來就三個東西,就是今天構成人工智能大家天天講的三個東西,ImageNet就是有組織的數據,然后它有一個模型,那時候叫CNN,然后+GPU。這是第一次一篇文章完美的把三個東西結合在一起。只不過這三個東西在那個時候都談不上是新的,ImageNet也存在了很多,CNN也不是一個新的算法,GPU那個時候在每一個網吧里面都有,但是是這篇文章、這三個學生把它結合在一起,使得GPU模型和數據成為做這個行業的一個最基本的標準,特別是GPU,在那篇文章之后才成為學術界的標準。在他的這篇文章之后,才成為工業界的標準。而當時他們用了兩塊GPU卡,是一個非常非常普通的GPU卡,盡管這兩張GPU卡在當時大概已經超過了上萬個CPU核的算力。但是我剛才講了,這是在中國每一個網吧里面都有的GPU卡,但是因為這樣發生了一次非常大的變化。所以,算力重不重要?算力重要。但是在創新階段,大家知道,沒有比人的創造力再重要的事情。

技術變成基礎設施,就會對人類產生最長遠的影響

到了今天發生的變化,為什么要引出基礎設施呢?就是因為規模。也就是說,當數據、模型、算力的規模都變成了一個巨大的變化的時候,這個時候一定要引入新的東西,不然它沒法解決了。這個也是做IT、做程序設計看到這句話以后很激動的,“一歲孩子爬行速度的千倍就是超音速噴氣機的速度”,E.Dijkstra結構程序設計倡導者(Pascal講的)。也就是說,在世界上任何事情的規模增加了一千倍,它就會發生天翻地覆的變化。

大家都知道,在我剛才講的三個組合的規模上,在每一個單元都超過了一千倍。正是這一千倍,使得今天我們繞不開一個最基本的東西,就是AI的基礎設施。大家知道,一旦有一個事情要談到基礎設施的時候,我覺得這是一個技術滲透的終結的形式。你看人類發展歷史上,任何技術的發展,什么技術會對人類產生最長遠的影響?就是它變成了基礎設施。當然AI基礎設施不是我發明的,今天大家都在談的。所以,為什么從AI到AI+,到今天我們可以講AI基礎設施,是一個非常值得我們深思的。

這是紅杉在一次研討會上用的一個PPT,我拿過來了,拿過來的目的只是為了讓大家看最下面一行,在云時代、移動時代、AI時代,他們覺得的基礎設施就是云計算。他把蘋果是劃到了基礎設施這一類的,同樣的大家可以看到在今天,他把英偉達也劃到了基礎設施那一類。所以,這是一個非常非常有意思的分類方法。這個也不奇怪,為什么英偉達大家都覺得他應該去做云計算。

我看到這張PPT的時候也非常激動,這張圖不是我畫的,但是這個解釋是我解釋的。這是6個在美國做AI的獨角獸,大家看到背后對基礎設施的支持跟有意思,OpenAI大家都知道,它得到了100億美金的投資,背后是Microsoft,第二的背后是AWS。大家看到在這些企業真正背后的排名是什么?全世界排名第一、第二、第三、第五、第六的云計算服務商,都是今天美國獨角獸公司的背后支撐的來源。這里當然大家看到很神奇的一件事情,在這里有第一、第二、第三、第五、第六,就是沒有第四,第四就是阿里云。這種基礎設施對將來這些事情的影響,從計算這個角度,也能看得出來。當然我想從另外一個角度也反映了這個產業之間的差距到底在哪里。

所以,從這個角度讓我想起了一句話,微軟很不行,微軟也很行。也就是說他在人工智能沒有做出Transformer這樣的東西,但是他因為云,因為這個基礎設施,他在跟Open AI創造出這么一個今天我們可以看到的東西出來的話,我自己覺得你從另外一個角度也可以看得出來好像微軟不行,但是微軟還是很行。

所以在AI、AI+、AI基礎設施這個邏輯上,所有人都是可以做他自己可以創造歷史的事情。我前幾天看到一個創業公司,為了證明他創業的重要性畫了一張圖,我相信今天老是講數據、講計算、講算法,但是大家設想一下,這些東西不在一個基礎設施里面,事實上是沒有價值的。所以,我把這個紅框里面畫出來,很有意思的告訴大家,數據是基礎設施核心的組成部分,數據不只是一個模型的附屬品,數據也不只是一個計算的附屬品,只有所有這些東西變成一個完整的基礎設施的時候,我們才會有那一次更加激動人心的創新。如果大家看最前面里面講到的事情,去做了兩個區分,在傳統的IT時代的云計算以及在AI時代的云計算,盡管這兩種計算有差別,但都是云計算。同樣的他數據也做了區分,在傳統意義上的數據,跟在AI這個意義上的數據,他是做了這么一個細微的區分的。時間原因具體不展開講了。

AI、AI+、AI基礎設施,一起創造未來

最后總結一下,當你看AI、AI+、AI基礎設施的時候,你就會發現,這個世界不但技術在革命,機制也在革命,基礎設施也在革命。沒有比這三項革命在同一個時間發生再令人激動了。所以,我想這些革命正在創造未來。謝謝大家。

【根據速記整理,標題為編者所加】

未經允許不得轉載:存儲在線-存儲專業媒體 » 王堅院士:技術一旦變成基礎設施,將對人類產生最長遠影響
分享到

謝世誠

相關推薦

精品国产午夜肉伦伦影院,双性老师灌满浓jing上课h,天天做天天爱夜夜爽,攵女乱h边做边走