每日經濟新聞 2023-03-09 22:57:55
◎劉天杰認為,(ChatGPT)這一波興起的AI浪潮與元宇宙、Web3有本質上的區(qū)別,互聯(lián)網的生態(tài)得以重建了。
每經記者 文巧 每經編輯 高涵
圖片來源:視覺中國
ChatGPT依然在攪動人工智能(AI)風云。盡管谷歌在過去的兩年中由于謹慎的態(tài)度未能發(fā)布Bard,讓OpenAI搶占先機。但作為硅谷巨頭,谷歌從來不缺乏“后來居上”的決心和實力。
當?shù)貢r間3月6日,來自谷歌和德國柏林工業(yè)大學的一組AI研究人員公布了史上最大的視覺語言模型:PaLM-E。作為一種多模態(tài)具身視覺語言模型,PaLM-E能將視覺和語言集成到機器人控制中。
這個消息,讓已經在AI投資圈深耕多年的劉天杰興奮起來。劉天杰是華映資本董事,也是AIGC領域的一線投資人。早在去年下半年,由ChatGPT模型前身GPT3驅動的戀愛應用——AI聊天軟件Replika就走入了他的視線,他意識到基于NLP(自然語言處理)的AI模型已經較以前有了變化。
在接受《每日經濟新聞》記者采訪時,他表示,“我們理解,它(PaLM-E)已經跟真實世界有一些交互能力。”巧合的是,在他的預想中,ChatGPT引領的這條路子是很清楚的,他看重的就是未來更多各行各業(yè)能夠去做AI賦能的應用,比如SaaS、RPA(機器人流程自動化),甚至是機器人。
隨著ChatGPT及其API的發(fā)布,這一大模型身后的藍海讓許多創(chuàng)業(yè)公司蜂擁而至。劉天杰認為,這一波興起的AI浪潮與元宇宙、Web3有本質上的區(qū)別,互聯(lián)網的生態(tài)得以重建了。但在泥沙俱下的市場中,第一波有很多“蹭熱度的”,只有擁有真實用戶和了解用戶需求的項目才能生存下來。
2022年下半年,一款AI聊天軟件Replika突然火爆全球。人們驚喜地發(fā)現(xiàn),與AI聊得越多,AI就越“懂”你,甚至還會提煉出用戶的語氣。更有意思的是,該軟件的創(chuàng)始人在采訪中表示,約有40%的用戶描述自己與AI為戀人關系。
Replika這款聊天軟件正是基于OpenAI的GPT-3大模型,它也是ChatGPT基于的GPT-3.5模型的前身。很快,Replika就走入了劉天杰的視線。他意識到,基于NLP(自然語言處理)的AI模型已經較以前有了很大變化,他開始關注相關領域的投資機會。
隨著ChatGPT的公布,以及GPT-3.5 Turbo的API開放,AI的浪潮蔓延到各行各業(yè),市場對此的反應可以用“狂歡”二字來概括。在劉天杰看來,實際上,開放API是符合預期的,這個項目原本就是開源的,此前也已經有很多人在用GPT3或者GPT-3.5的開源代碼來做應用。
不過,ChatGPT如此“出圈”,還是超出了他的意料。放眼整個AIGC領域,“國內現(xiàn)在肯定是風起云涌。硅谷這股風比國內要更大,因為(國外)幾個大模型都已經成熟了,美國那邊至少已經有幾百上千的項目涌現(xiàn)出來。”
“(ChatGPT)確實加快了公眾對于AIGC或者AI領域的關注。但是,這條路進化到今天并非一蹴而就。包括ChatGPT的基礎模型Transformer,實際上也是2017年就提出來了。”劉天杰告訴《每日經濟新聞》記者,“從2017年到今天,大家一直在做大量的工程化工作。到今天ChatGPT有這個成績,跟之前多年的積累是息息相關的。”
他向每經記者透露,目前看到的創(chuàng)業(yè)者其實不僅僅是AI領域的,其他很多領域也在開始擁抱新的大模型以及新的AI能力。
“我們更多地會把這個領域定義成AI+,而不是AIGC。意思就是,利用AI賦能給各行各業(yè)。我覺得未來這將是(所有公司的)一個基礎能力。”劉天杰說道。
OpenAI在ChatGPT上的腳步顯得非常主動和激動。大熱剛剛3個月,ChatGPT API就高調上線了。這個API由GPT-3.5 Turbo模型支持。HerAI App的開發(fā)者王紹此前告訴《每日經濟新聞》記者,接口服務定價大約是3分/1000個漢字。這一定價較GPT-3.5模型便宜90%。
“Turbo就是加速的意思,它的反應速度是要比ChatGPT要快很多的。從底層算力上看,其實沒有發(fā)生太大的變化。但成本降低、反應速度提高,這只能說明一件事,就是GPT-3.5 Turbo模型實際使用的參數(shù)相比ChatGPT下降了。”劉天杰說道。
他隨即向每經記者解釋,“比如說,你有1750億個參數(shù),但是你喂給它的訓練集很小,也訓練不出效果,會導致大量的問題,我們稱其為過擬合。所以,參數(shù)大意味著訓練集要足夠大。但是,參數(shù)越大并不意味著模型的表現(xiàn)越好,越能理解人的語義。恰恰相反的是,現(xiàn)在大家都想用更少的參數(shù)訓練出一個更好的大模型。”
為什么GPT-3.5 Turbo能在更小的參數(shù)上實現(xiàn)更好的效果呢?“實際上,ChatGPT已經積累了大量用戶使用的實際對話集,這些對話集相比OpenAI使用無監(jiān)督訓練的語義集,要更準確、更高質量。”劉天杰說道,“因為,用戶實際使用的對話中有上下文、有反饋,收集這些數(shù)據后再去訓練模型,新的模型就會比之前更精確,就達到了用更小的參數(shù)量實現(xiàn)更準確的效果。
在劉天杰看來,GPT-3.5 Turbo成本的下降,核心的一點就是實際計算的成本確實比之前要低,因為它的模型更準了。
“當然,一方面也因為OpenAI本身不是一個盈利機構,并且它也需要更多的用戶參與進來,去形成這種實際的對話集,再輸入模型中做進一步的訓練,而低價也會導致用戶量進一步的增長。”他說道。
劉天杰表示,這就是所謂的“AI飛輪”。“用戶提高了,數(shù)據變多了,模型更準了,用戶自然更多了。飛輪一旦跑起來,OpenAI就能甩掉其他對手,這也是它低價策略的一個原因。”
隨著ChatGPT API的開放,調用這個接口來實現(xiàn)AI賦能成為許多創(chuàng)業(yè)公司的追求,這種熱潮不免讓人想起元宇宙、Web3等新概念引領的風潮。許多人會問,看看兩年前扎克伯格看好的元宇宙如今在哪兒,未來ChatGPT又會在哪兒?不過,在劉天杰看來,這一波興起的AI浪潮與前一段時間的元宇宙、Web3有本質上的區(qū)別。
“元宇宙、Web3是一個分布式的東西。在這里,大家希望互聯(lián)網信息或者經濟系統(tǒng),都用一個分布式、加密式的方式去重構。”他向《每日經濟新聞》記者說道,“但當前這一波AI浪潮恰恰相反,它會變成一個非常集中的東西,未來AI的底層能力將由有基礎預訓練大模型能力的幾個大廠提供,其他人就在這些底層大模型上去開發(fā)應用。”
“所以說,整個互聯(lián)網的生態(tài)我認為是重構了。這有點類似于當年的云服務,由幾個大廠來做云服務廠商,在云之上,你們去開發(fā)各種各樣的應用。”劉天杰進一步說道。
在ChatGPT引領的這一波AI浪潮中,劉天杰看到了三大層次的創(chuàng)業(yè)機會。第一類是做中文的底層大模型。“這類創(chuàng)業(yè)者往往都是高校出來的,比如說清華系有一大堆人在做底層大模型。但任重而道遠,訓練底層大模型,一是非常燒錢,二是要有足夠強的算力。”他告訴每經記者。
圖片來源:視覺中國
“另外,小公司收集訓練集的能力不夠,而大模型的‘大’,大在它的訓練集。小公司并沒有積累大量的數(shù)據。”他說道。
第二類是中間層,比如做模型的微調、預訓練;或者在底層大模型的基礎上訓練新模型,比如虛擬人模型。“這些模型是基于底層大模型的語義能力,然后在這個能力之上加了各種限制條件。”他說道,這里有一些創(chuàng)業(yè)機會,但并不算多。
第三類是應用層,這也是大多數(shù)創(chuàng)業(yè)公司正在探究的道路。“目前最直接的是生成圖片、文字、視頻甚至3D內容。但是這些相對來說壁壘不夠,因為模型也不是你的,訓練集也不是你的,無非就是做一點優(yōu)化的工作。”劉天杰說道。
“當然還有更前沿的,就是科學家團隊在探索真正的終局——通用智能,但這一塊現(xiàn)在還在一個非常早期的階段。”他向每經記者介紹道。
在劉天杰的預想中,ChatGPT引領的這條路子是很清楚的,他看重的就是未來更多各行各業(yè)能夠去做AI賦能的應用,比如SaaS、RPA(機器人流程自動化),甚至是機器人。
他現(xiàn)在主要關注兩大板塊,一是AI生成3D資產。“因為這一塊有真正會掏錢的客戶——游戲公司。這一塊是他們的痛點,因為制作3D內容非常昂貴,如果能用AI制作3D內容,是他們求之不得的。但目前大模型的能力還解決不了3D的生成,這是一個我們會重點關注的領域。”
二是文字轉換動作的應用。“也就是說,我用AI指揮實體的東西去執(zhí)行操作,比如說機器人、RPA(機器人流程自動化)、全局的智能助手等。這一塊涉及到大模型的多模態(tài)輸出和輸入,是一個相對來說比較前沿的領域,也是大模型沒有完全解決的領域。”劉天杰解釋道。
市場太熱,到底哪些才是靠譜的項目?對此,一些投資人直言“又興奮又焦慮”。
不過,劉天杰還沒到焦慮的地步,他直言,“我們看了太多這種新技術、新概念的例子,第一波(沖在前面的)有很多蹭熱度的。從經典的蓋特納創(chuàng)業(yè)模型來看,新技術都會先經歷這樣的事情,后面真正能使用這個技術的人才會崛起。”
他向《每日經濟新聞》記者透露,很多很強的創(chuàng)業(yè)者,例如傳統(tǒng)大廠里面職位非常高的人,或者在科學界有頭有臉的人,也都被吸引入場。“國內比如說美團的王慧文、快手CTO以及某電商大廠技術負責人。”
據劉天杰介紹,某電商大廠技術負責人提出了Transformer大模型中一個關鍵的技術路線,叫做多頭注意力機制。“泥沙俱下,當然有大量蹭熱度的,但是也有很多很強的創(chuàng)業(yè)者在開始干這件事。”他說道。
ChatGPT身后的藍海讓許多創(chuàng)業(yè)公司蜂擁而至。在劉天杰看來,“現(xiàn)在許多所謂的AIGC項目,并非這一波預訓練大模型(ChatGPT)之后產生的,它的技術路線上其實跟大模型沒有任何關系,相當于之前傳統(tǒng)范式的AI上,包了一層AIGC的殼,就非說自己是大模型,但實際上跟大模型沒什么關系。”
他認為,能夠落地的應用需要創(chuàng)業(yè)者在對應的細分產業(yè)中做實。“你要理解產業(yè)本身的經濟機制和運行規(guī)則,以及用戶需求,尤其用戶需求永遠是最重要的。因為在這里,AI只是提供效率的工具,它類似一個乘數(shù)。你必須得有前面的‘1’,也就是真實的客戶和客戶需求。”
封面圖片來源:視覺中國
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP