每日經(jīng)濟新聞 2024-08-13 21:56:32
每經(jīng)記者 可 楊 每經(jīng)編輯 張海妮
由史蒂文·斯皮爾伯格(Steven Spielberg)執(zhí)導的電影《人工智能》,講述的是一個小男孩最終發(fā)現(xiàn)自己是人工智能的故事。
人工智能什么時候才能達到這樣的水平?難道人工智能的作用就是制造一個類人智能體嗎?這是第四范式創(chuàng)始人、董事長戴文淵投身人工智能產(chǎn)業(yè)早期最令他迷惑的兩個問題。
最終,他在圖靈獎獲得者詹姆斯·尼古拉·格雷(James Nicholas Gray,昵 稱 Jim Gray)2007年《科學發(fā)展的四個范式》的演講中找到答案。其中,第四范式階段是指數(shù)據(jù)科學——隨著數(shù)據(jù)爆發(fā)式增長以及技術演進,科學理論由計算機從海量數(shù)據(jù)中發(fā)現(xiàn)。
視覺中國
戴文淵所創(chuàng)立的人工智能公司“第四范式”的名字也由此而來。這家成立于2014年的企業(yè)級人工智能平臺企業(yè),迎著人工智能的潮起與潮落成長至今,作為掌舵者,戴文淵向《每日經(jīng)濟新聞》記者分享的心得是,不要太在乎AI(人工智能)是不是能做所有事,或者不能做所有事,因為這對于市場來說也不重要,客戶關心的問題是:“我是賣雞翅的,AI能做的所有的事情,跟我有什么關系?重要的是我的雞翅能不能(通過AI)賣得更好。”
大模型時代,第四范式主張對模型進行“剪裁”,以求用最“經(jīng)濟”的方式做領先的AI。在戴文淵眼中,通用大模型和行業(yè)大模型是實現(xiàn)AGI(通用人工智能)的不同路徑,區(qū)別在于是用一個模型去實現(xiàn)AGI,還是用很多模型去實現(xiàn)AGI。而兩相比較之下,行業(yè)大模型是他認為最經(jīng)濟的方式。
熱潮與誤解一同翻涌,市場期望AI解決所有問題
新的熱浪翻涌在第四范式成立的第十年,這也促使戴文淵作出了一些改變。
2023年,很多人找到戴文淵,問他:“ChatGPT會怎么幫助到我的企業(yè)?”上一次他被問及類似的問題是在2016年,那時,問句的主語是AlphaGO。
更有趣的是,這一次,幾乎所有的客戶、投資人、媒體記者都在使用“技術的語言”來提問,“參數(shù)”成為高頻詞,與之前的狀況大不相同。
戴文淵說:“要把AI做好,就先不要談AI的問題,先談談公司是做什么的,把這些問題談清楚,咱們再回頭看看AI是不是可以(對公司)有幫助。”
市場和客戶都對新技術感到興奮時,戴文淵希望能借此機會引導一個正確的“AI價值觀”:“不能先把參數(shù)做到一千億,再想這千億的參數(shù)到底能干什么?”
市場期望AI解決所有的問題,這反映了一種恐慌心理:萬一 AI能做但是自己沒有用到,那可能會失去一些機會。戴文淵將此視為一個機遇,“擔憂”打開了世人想要了解AI的窗子,但誤解也同熱潮一同翻涌,第四范式要做的,是把AI的價值帶到眾人面前。
ChatGPT,這個目前最火爆的大模型應用,將大模型帶到了人工智能圈層以外的世界。熱浪之下,一些人對于大模型的理解或許是:和ChatGPT一樣的技術。
直至今天,市場中最受關注的大模型依舊是以大語言模型為主,即“預測下一個字”的模型,年初爆火的Sora則是“預測下一幀畫面”的模型。
但應用是更加實際的事,對于絕大多數(shù)企業(yè)而言,“預測下一個字”解決不了核心問題。例如,金融機構(gòu)需要解決風控問題,但這不是語言問題;大語言模型可能會輔助金融機構(gòu)解決客服事宜,但這可能不是它的核心問題。真正的行業(yè)大模型應當是針對不同場景,構(gòu)建不同模態(tài),去預測下一個“事情”。
這背后有一個更大的誤解——很多人問,能不能基于開源大模型底座或GPT,訓練行業(yè)需要的新模態(tài)模型。但即使同樣出自OpenAI之手,要在GPT模型上直接精調(diào)出Sora,也是不可能的事情。
戴文淵介紹,大多數(shù)行業(yè)大模型是要基于特定業(yè)務所積累的特定模態(tài)的數(shù)據(jù),訓練出一個基座大模型,就像目前訓練底座的大語言模型、視頻模型一樣。
行業(yè)大模型這件事,其實已經(jīng)發(fā)生了十年之久。2014年,第四范式推出人工智能平臺——先知1.0,用建模型的方式,挖掘業(yè)務數(shù)據(jù)價值,提升業(yè)務效果。如今“先知”已經(jīng)迭代到了5.0版本,定位于降門檻,讓企業(yè)自行構(gòu)建高價值場景所需的行業(yè)大模型,例如預測疾病風險、欺詐行為、災害險情、設備故障等,打破大語言模型只能生成文字、圖像、視頻的局限。
信心不再是問題,但市場的耐心有限
1956年夏天,在達特茅斯學院舉辦了一場人工智能研討會,主題是研究“讓機器能像人那樣認知、思考和學習,即用計算機模擬人的智能”。這次會議被普遍視為人工智能技術的起點。由此出發(fā),人工智能開始沿著一條波浪式的曲線前進,經(jīng)歷著巨大的潮起與潮落,穿梭在失望與希望之間。
兩到三年,戴文淵認為這是市場能給一場技術熱潮的最大耐心。
距離我們最近的一次潮起被認為來自2016年,基于強化學習算法的AlphaGo戰(zhàn)勝人類圍棋選手李世石,“機器是否會代替人類”在彼時引發(fā)市場關注,商湯科技、曠視科技等一批人工智能“獨角獸”站到臺前。
第四范式是一家幸運的公司,這家公司誕生于2014年,從誕生的第一天就開始做企業(yè)端的生意。不過那時候,很多企業(yè)告訴戴文淵,他們沒有人工智能預算。隨著AlphaGO成為那枚投向平靜水面的石子,突然之間,所有客戶都來問他:“你們是人工智能企業(yè),你來給我講一講AlphaGO可以幫我做什么?”“我們有預算,我們要AlphaGO。”
兩三年的時間,人們理想中的人工智能工具沒有誕生,市場信心在2019年崩盤。據(jù)獵豹全球智庫數(shù)據(jù),與2018年相比,2019年中國人工智能企業(yè)的融資金額由1484.53億元下降至967.27億元,下降幅度達到34.8%,融資數(shù)量也由737個下降至431個,下降幅度達四成。
直到ChatGPT成為下一顆石子,這場“寒冬”結(jié)束,AI市場再度迎來熱潮。
戴文淵認為,在2023年以前,市場對AI是信心問題。從2023年開始,不再是信心問題,而是要找到正確路徑的問題。“不用擔心客戶認為AI沒有用,需要解決的是,引導客戶反過來想業(yè)務的問題。”戴文淵說。
潮起潮落,似乎已經(jīng)成為人工智能行業(yè)的常態(tài)。潮為什么落,戴文淵認為和價值相關。2016年,每家企業(yè)都陷入“怎么去用AlphaGO幫助到我”的問題中,這個潮落了。今天也一樣,如果每家企業(yè)想的都是“怎么用ChatGPT幫助到我”,可能這個潮也會落。
戴文淵判斷,兩三年內(nèi),如果大模型不能創(chuàng)造出巨大的價值,可能就會再度潮落,等待下一顆“石子”——或許是一個新的能夠吸引眼球的東西,或許是能夠在合理的投入產(chǎn)出中創(chuàng)造出足夠價值的技術。
當下的機遇是市場的目光重新被吸引,但挑戰(zhàn)在于,兩到三年內(nèi)能否兌現(xiàn)大模型的價值?
市場關注到人工智能“+”,戴文淵認為這個加號非常重要,這意味著,未來兩到三年,人工智能有可能創(chuàng)造出很大的價值,如果大家想的都是ChatGPT能不能幫到企業(yè),不見得能創(chuàng)造市場預期的價值。
“以語言模型為例,去年主要的落地場景都與客服相關,如果在這么大的關注度之下,落地的應用全是問答類場景,可能兩三年以后大家就失望了。”他說。
AI是一個實驗的過程,目標是提升“北極星指標”
目前來看,大模型賦能行業(yè),依舊是一個充滿前景的故事,因為理論上不存在大模型無法賦能的行業(yè),人效上可以充分發(fā)揮想象力。
目前,絕大多數(shù)企業(yè)的核心業(yè)務都由人來作決策,但人作決策時往往面臨兩個困境:水平參差不齊、精力有限。當AI能力提升,哪怕其能力尚未全面超越人類,即便僅達到人類的平均水平,但如果能復制很多“人”,就很有可能提供更好的業(yè)務價值。
企業(yè)招聘員工時,并非需要每個員工都達到頂尖水平,而是注重每個員工是否能為企業(yè)帶來積極的貢獻。因此,戴文淵認為,盡管第四范式的目標是使AI的表現(xiàn)超越絕大多數(shù)業(yè)務專家,但從實踐角度來看,AI即使僅僅達到專家平均的能力水平,也有可能為企業(yè)帶來顯著的價值提升。
從數(shù)字化時代開啟到數(shù)智化時代來臨,賦能傳統(tǒng)企業(yè)與實體經(jīng)濟始終是市場對技術的期待。隨著大模型來臨,數(shù)字技術從傳統(tǒng)的信息搜集、傳輸、整理、儲存,逐漸走到輔助決策甚至替代決策階段。
戴文淵指出,一些企業(yè)當前在使用AI時,依舊存在數(shù)字化時代的慣性思維,即過于依賴同行業(yè)的成功案例,試圖直接移植成熟方案落地到本企業(yè)。但實際上AI和企業(yè)核心競爭力相關以后,不同企業(yè)的目標是不一樣的。
理想狀態(tài)下,大模型應該能夠幫助企業(yè)完成核心決策。為此,第四范式將企業(yè)的戰(zhàn)略目標轉(zhuǎn)化為計算機可以記錄和跟蹤的語言,即企業(yè)的“北極星指標”,以此作為企業(yè)最核心的關鍵指標。
戴文淵認為,對于企業(yè)而言,在使用AI前,需要先想明白一點:對于提升“北極星指標”,什么叫好,什么叫不好。以實體零售企業(yè)為例,其核心效率體現(xiàn)在每平方米所貢獻的效益上,這可能就是一家零售企業(yè)的“北極星指標”。所有圍繞這一指標的改進,都需要量化其對“北極星指標”的實際影響,無論是提升還是下降。
在實踐中,AI的應用并不意味著每一步都能帶來提升。
“AI其實是一個實驗的過程。”戴文淵舉例,假設有一百萬的客戶基礎,可能將九十萬作為基線,剩余的十萬,每一萬作為一個實驗組,持續(xù)嘗試模型的優(yōu)化與迭代。“早期的實驗基本上是成功的,每次實驗都會比‘九十萬’更好。但是到了一定階段絕大多數(shù)的實驗都是失敗的,也沒有關系,往往到了一定的規(guī)模體量以后,一百次體驗如果能成功一次,就能賺回前面九十九次失敗的所有成本。”戴文淵說。
AI是一個實驗的過程,這是戴文淵的認知,但尚未在客戶中達成共識。
客戶的認知提升是AI產(chǎn)業(yè)發(fā)展至關重要的一環(huán)。如果認知遲遲沒有發(fā)生變化,AI會重新變成“需要有一個大模型、交付一個大模型,這個大模型的參數(shù)是不是1000億,是1000億就驗收通過付款、結(jié)束”的過程,也許再經(jīng)過一年半載,客戶會覺得,大模型好像沒什么用。
這時,熱潮可能將會再度遺憾告終。
AI是科學問題,AI應用是經(jīng)濟問題
在通往AGI的路上,通用大模型和行業(yè)大模型是兩條不同的技術路線。戴文淵認為,大家都是朝著AGI的方向前進,區(qū)別在于是用一個模型去實現(xiàn)AGI,還是用很多模型去實現(xiàn)AGI。
在他看來,用一個模型去解決所有的問題,不是最經(jīng)濟的。
戴文淵還提出了一個更為少見的觀點:并不存在真正的通用大模型,所謂的通用大模型,本質(zhì)是將多種場景融入一個模型中。
第四范式的做法是,進行剪裁,先做垂直的行業(yè)模型。如果模型僅針對某一特定場景進行應用,就先通過該場景的數(shù)據(jù)模態(tài)構(gòu)建專用模型,同樣參數(shù)量往往能實現(xiàn)更好的效果。相反,若模型被設計為一個通用大型模型,最后通用大模型應用到某一具體場景,往往很可能是不經(jīng)濟的。
“經(jīng)濟”,在一個小時的采訪里,戴文淵至少5次提到這個詞。“我們致力于把這個問題(解決),或者把這個技術做出來,如果我選擇了不經(jīng)濟的一條路,可能最后我會做不出來,我們要綜合考慮每一種方向,每一個路線所面臨的問題,最后找到一個最有可能的解決方法。”戴文淵說。
“做最領先的AI是特別貴的事,需要花很多錢。”或許正因為如此,在技術信仰派和商業(yè)信仰派之爭中,戴文淵認為自己處于兩者之間。
AI顯然是個科學問題,但做出最領先的AI技術,是個需要計算的經(jīng)濟問題。
戴文淵認為,經(jīng)營一家AI技術公司,需要站在商業(yè)的角度思考問題:最領先的AI技術需要海量的算力和數(shù)據(jù),如果不能和商業(yè)更好(地)結(jié)合,那么長期持續(xù)的資金投入將變得難以為繼,既需要技術又需要商業(yè),如果你要做最好的東西,就必須要都有。
此外,對于AI從業(yè)者的自我修養(yǎng),戴文淵認為,還需要具備韌勁與恒心,“人工智能就是一個起起伏伏的賽道,可能這兩年又被大家關注到了,甚至被吹上天,被吹上天的時候你不要覺得自己是神仙。同時,被踩到地下的時候,也不要覺得自己沒有價值”。
波浪式前進的過程中,可以肯定的是,通往AGI的道路并沒有一個標準的指路牌。
“AGI是我們所有人的理想,AGI就是我自己心目當中的一個無窮大。”戴文淵從來不認為AGI是一件三年、五年甚至十年就能實現(xiàn)的事,相反,他覺得,AGI是一件永遠做不到,但永遠都在做的事。
封面圖片來源:視覺中國
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP