大家開始熱烈地討論起來。會議室里的氣氛瞬間被點燃。
有人討論分成比例,有人討論內(nèi)容審核機制,有人討論怎么防范洗稿和抄襲。
夏冬看著這一切,心里十分滿意。
這就是他想要的團隊,一群聰明人在一起碰撞,不需要他事事親力親為。
“快看號的提議,全票通過。”
夏冬壓了壓手,示意大家安靜,“晚晴,散會后你負責(zé)拉一個項目組,和一鳴對接具體的運營和推廣方案。”
蘇晚晴認真地點頭記錄在筆記本上。
“接下來,還有誰有議題?”夏冬靠在椅子上,目光掃過眾人。
陳默舉起了手。
“夏冬,接下來這個議題,本來我打算私下找你說的。”
“但既然今天是務(wù)虛會,我覺得有必要擺到桌面上,讓大家都聽聽。”陳默推開面前的茶杯。
大家都安靜下來,能讓技術(shù)大拿陳默如此嚴肅的事情,絕對不是小事。
“我們的服務(wù)器,快扛不住了。”陳默說出了第一句話。
吳澤明愣了一下:“扛不住?上個月不是剛批了五千萬的預(yù)算采購新服務(wù)器嗎?”
陳默苦笑了一聲,伸手扒拉了一下本來就亂的頭發(fā):“五千萬?五千萬現(xiàn)在連打水漂都聽不到響。”
“核心問題不在數(shù)據(jù)庫讀寫的高并發(fā),而在算法計算。”
他站起身,走到剛才一鳴用過的白板前,擦掉上面的字,畫了一個簡單的架構(gòu)圖。
“大家只看到了快看網(wǎng)在國內(nèi)的八千萬日活。”陳默用記號筆重重地點在白板上,“但你們別忘了,盛夏科技的底層推薦算法API,還同時提供給大洋彼岸的兩家公司。”
“一家是我們自已的馬甲‘字節(jié)跳跳’,另一家,是Facebook。”陳默轉(zhuǎn)過頭看著大家。
會議室里的空氣似乎凝滯了一下。
會議室里的大家,都知道這個商業(yè)機密。
“字節(jié)跳跳在北美的日活已經(jīng)突破1.9億。而Facebook,他們把我們的算法接入了他們的核心動態(tài)消息流,他們現(xiàn)在的全球月活已經(jīng)逼近1.4億。”
“這意味著什么?意味著每天有海量的數(shù)據(jù),源源不斷地匯入我們的服務(wù)器。”
“每一條用戶點贊、每一個停留時長、每一次頁面刷新,都需要輸入到我們的神經(jīng)網(wǎng)絡(luò)模型里進行運算,然后再把推薦結(jié)果實時返回去。”
陳默看著夏冬,眼神里透著一絲無奈:“夏冬,我們的算法確實牛逼,參數(shù)量大,精準度高。但越牛逼的算法,需要的算力就越恐怖。”
吳澤明作為后臺專家,立刻明白了陳默的意思:“你是說,我們的CPU算力見頂了?”
“不是見頂,是被榨干了。”陳默嘆了口氣,“現(xiàn)在的算力根本跟不上數(shù)據(jù)膨脹的速度。”
一鳴停下了吃零食的動作,皺眉問道:“如果加機器呢?”
“加機器?”陳默搖了搖頭,“字節(jié)跳跳、Facebook的體量還在狂飆。”
“如果要靠堆傳統(tǒng)CPU服務(wù)器來滿足他們未來的算力需求,我們就算把整個中關(guān)村大廈18層到1層全租下來改成機房都不夠用。”
“更別提每個月的天價電費和空調(diào)散熱費了。”
吳澤明補充道:“而且機房的物理空間和電力負載是有極限的。光靠橫向擴展,不是長久之計。”
會議室陷入了死一般的沉寂。
這是一個純粹的物理定律和硬件架構(gòu)帶來的瓶頸。
軟件算法再精妙,也無法違背硬件的物理極限。
所有人都看向夏冬。
在這個公司里,每當遇到技術(shù)方面無解的死局,夏冬總是能拿出打破常規(guī)的方案。
其實夏冬早就預(yù)料到了這一天,服務(wù)器算力見頂是遲早的事。
他老早就找豆包,惡補了人工智能的發(fā)展史。
深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)之所以在2010年之后才開始大爆發(fā),并不是因為算法突然取得了什么逆天的理論突破。
純粹是因為算力終于跟上了。
在豆包提供的未來時間線里,拯救人工智能算力危機的,是英偉達的GPU。也就是大家俗稱的顯卡。
GPU這玩意兒,天生就是用來做大規(guī)模并行計算的。
再后來,谷歌為了搞定自家的算法和推薦系統(tǒng),干脆自已下場研發(fā)了TPU,一種專門為AI定制的專用芯片。
夏冬的手指在桌面上輕輕敲擊著,發(fā)出有節(jié)奏的噠噠聲。
“陳默,澤明,你們有沒有想過,”夏冬終于開口了,目光掃過兩位技術(shù)大拿,“為什么我們堆了那么多頂配的CPU,算力依然捉襟見肘?我們的算法,到底在讓這些CPU干什么活?”
陳默皺著眉頭想了想:“主要就是神經(jīng)網(wǎng)絡(luò)的層級計算,里面全是大規(guī)模的矩陣乘法。”
“對,問題就出在這里。”
夏冬停止敲擊桌面,“CPU的架構(gòu)設(shè)計初衷是什么?是處理復(fù)雜的控制邏輯,它里面有大量的分支預(yù)測、指令調(diào)度單元。”
“打個比方,CPU就像是一個精通微積分的大學(xué)老教授。你讓他解多復(fù)雜的數(shù)學(xué)題他都會。”
為了讓非純技術(shù)的蘇晚晴也能聽懂,夏冬頓了頓,攤開雙手繼續(xù)說道:“但是,我們推薦算法需要的,是極其海量、極其枯燥的簡單矩陣乘法。”
“這等于你雇了一萬個大學(xué)老教授,每天讓他們坐在辦公室里算一加一等于幾。”
陳默和吳澤明愣了一下。
“他們能算,”夏冬一針見血地指出,“但是效率極低,而且成本高得離譜。大炮打蚊子,從根源上就錯了。”
兩位頂尖的技術(shù)大拿對視了一眼,腦子里仿佛劈過一道閃電。
陳默喃喃自語:“所以……通用的CPU,從硬件物理架構(gòu)上就不適合跑我們的算法?”
“沒錯。”夏冬順勢拋出一個引導(dǎo)性的問題,“既然一個精通微積分的老教授算得慢,那我們找一萬個只會算乘法的小學(xué)生來并行計算呢?”
“我們需要的是高并發(fā)、低邏輯復(fù)雜度、海量的浮點運算單元……”
吳澤明推了推眼鏡,眉頭微皺,大腦在瘋狂檢索現(xiàn)有的硬件架構(gòu):“夏冬,你說的這種硬件特征,聽起來怎么那么像電腦里的顯卡?”
“確切地說,是GPU。”夏冬打了個響指,“澤明抓住了盲點。”
夏冬表情淡定,內(nèi)心其實正在快速梳理之前用豆包查閱的資料。
早在2007年,英偉達就推出了CUDA架構(gòu),讓GPU不僅僅能打游戲渲染圖像,還能進行通用計算。
現(xiàn)在這個時間節(jié)點,多倫多大學(xué)的Hinton團隊、斯坦福大學(xué)的吳恩達,其實已經(jīng)開始嘗試用GPU加速神經(jīng)網(wǎng)絡(luò)訓(xùn)練了。
效率足足比CPU高出了幾十倍。
到了2011年,吳恩達更是用12塊GPU,生生跑出了相當于2000個CPU的深度學(xué)習(xí)算力。
這就是降維打擊。