每日經(jīng)濟(jì)新聞 2023-05-19 17:13:44
◎行業(yè)大模型的價(jià)值其實(shí)不在于做這個(gè)模型,而在于怎么做數(shù)據(jù)。
每經(jīng)記者 蘭素英 每經(jīng)編輯 高涵
圖片來(lái)源:主辦方供圖
隨著ChatGPT的問(wèn)世,人工智能(AI)行業(yè)進(jìn)入了全新的發(fā)展階段。大模型作為一種顛覆性技術(shù),正在吸引越來(lái)越多的頭部廠商和創(chuàng)業(yè)者投入其中。
據(jù)花旗最新報(bào)告,保守估計(jì)生成式AI未來(lái)發(fā)展規(guī)??臻g至少達(dá)100億美元,算上對(duì)云計(jì)算的加成和推動(dòng),市場(chǎng)增長(zhǎng)潛力將進(jìn)一步打開(kāi)。
有數(shù)據(jù)顯示,今年只有1%的內(nèi)容由AI生成,到2025年,這一數(shù)據(jù)將達(dá)到10%。這場(chǎng)狂歡背后,實(shí)際上是AI發(fā)展的一次重大飛躍,將帶來(lái)一場(chǎng)生產(chǎn)力的革命。
為何ChatGPT能成為AI發(fā)展的拐點(diǎn)?大模型后續(xù)的發(fā)展將呈現(xiàn)什么樣的趨勢(shì)?在大模型時(shí)代,中小模型將如何?
在5月17日由NVIDIA初創(chuàng)加速計(jì)劃和TGO鯤鵬會(huì)在成都主辦的“‘科技+資本’雙輪驅(qū)動(dòng)的ChatGPT&LLM”閉門大咖會(huì)上,稀奇資本合伙人雷強(qiáng)生告訴《每日經(jīng)濟(jì)新聞》記者,從目前來(lái)看,大模型的賽道已經(jīng)擁擠不堪,機(jī)遇更傾向于頭部廠商以及有號(hào)召力的互聯(lián)網(wǎng)大佬,而對(duì)于更多的新入局者來(lái)說(shuō),應(yīng)該在小模型和子模型層面尋找機(jī)會(huì)。
以ChatGPT為代表的AI技術(shù)被視為未來(lái)十年最具顛覆性的技術(shù)。隨著ChatGPT的現(xiàn)象級(jí)爆紅,科技領(lǐng)域的創(chuàng)業(yè)DNA都動(dòng)了。一時(shí)間,打造大模型和類ChatGPT產(chǎn)品成為最熱門的話題和趨勢(shì)。據(jù)統(tǒng)計(jì),目前國(guó)內(nèi)已有百度、阿里巴巴、華為等超過(guò)40家企業(yè)和機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計(jì)劃。
為什么ChatGPT會(huì)觸發(fā)AI的拐點(diǎn)?
亞馬遜云科技資深解決方案架構(gòu)師賀楊在會(huì)議上表示,計(jì)算能力增長(zhǎng)、數(shù)據(jù)增長(zhǎng)、模型復(fù)雜性是AI處于拐點(diǎn)的關(guān)鍵驅(qū)動(dòng)因素。他解釋稱,“我們可以將ChatGPT理解為AI 2.0,與AI 1.0最本質(zhì)的區(qū)別是用模型驅(qū)動(dòng)任務(wù),將海量的數(shù)據(jù)壓縮存儲(chǔ)到模型里面,用非監(jiān)督的數(shù)據(jù)進(jìn)行訓(xùn)練。這樣的大模型可以支持很多重要任務(wù),包括文本生成、歸納、提取、問(wèn)答。”
毫無(wú)疑問(wèn),從GPT-3所需的參數(shù)量來(lái)看,訓(xùn)練大模型需要極大的代價(jià)。單是計(jì)算和資本的投入對(duì)大多數(shù)企業(yè)來(lái)說(shuō)都是難以承受之重。以O(shè)penAI舉例來(lái)說(shuō),訓(xùn)練ChatGPT除了上萬(wàn)張GPU芯片的投入以外,一個(gè)月的用電量也相當(dāng)于17萬(wàn)家庭一年的用電量。此外,模型的性能調(diào)優(yōu)也極其耗時(shí),大概花了半年時(shí)間。
在這樣的背景下,是不是所有企業(yè)或者每個(gè)細(xì)分領(lǐng)域都需要大模型呢?
昆侖萬(wàn)維CEO方漢認(rèn)為,“所有行業(yè)現(xiàn)在都要干這個(gè)事兒,這是不得不干的,行業(yè)大模型的價(jià)值其實(shí)不在于做這個(gè)模型,而在于怎么做數(shù)據(jù),這是特別苦的事情,但所有人、所有行業(yè)都應(yīng)該重復(fù)這個(gè)過(guò)程。”
昆侖萬(wàn)維CEO方漢 圖片來(lái)源:主辦方供圖
目前,AI正在從文本、語(yǔ)音、視覺(jué)等單模態(tài)智能,向著多種模態(tài)融合的通用人工智能方向發(fā)展。“基于多模態(tài)的預(yù)訓(xùn)練大模型將成為人工智能基礎(chǔ)設(shè)施”,這一觀點(diǎn)已成為業(yè)內(nèi)共識(shí)。建立統(tǒng)一的、跨場(chǎng)景、多任務(wù)的多模態(tài)基礎(chǔ)模型正在成為人工智能研究的一個(gè)關(guān)鍵課題。
總部位于硅谷的向量數(shù)據(jù)庫(kù)公司Zilliz的創(chuàng)始人兼CEO星爵解釋道,大模型作為一個(gè)語(yǔ)言模型,第一次把所有多模態(tài)、跨模態(tài)統(tǒng)一到一個(gè)框架,它精確描述所有意圖、所有知識(shí),把所有模態(tài)跨模態(tài)串聯(lián)起來(lái)。他估計(jì)未來(lái)兩到三年所有的模塊都會(huì)打通。
阿里巴巴達(dá)摩院的一份報(bào)告提到,多模態(tài)預(yù)訓(xùn)練模型的發(fā)展將重塑人工智能商業(yè)模式,并為人們的生產(chǎn)生活方式帶來(lái)積極影響。對(duì)個(gè)人而言,類似CLIP(對(duì)比語(yǔ)言-圖像預(yù)訓(xùn)練)的多模態(tài)模型,將使更多非技術(shù)出身的人能夠表達(dá)自己的創(chuàng)造力,無(wú)需再借助工具和編程專業(yè)能力。
對(duì)于這點(diǎn),成都普朗克科技創(chuàng)始人于芳表示無(wú)比贊同。她指出,對(duì)于喜歡畫畫和創(chuàng)造,而同時(shí)又屬于“手殘星人”的使用者來(lái)說(shuō),“多模態(tài)會(huì)賦予有創(chuàng)意、有想法的人‘手’和‘眼’,為其帶來(lái)無(wú)限的創(chuàng)作體驗(yàn),讓以前的不可能變?yōu)榭赡?,這將是多模態(tài)給予這個(gè)時(shí)代的可能性。”
而對(duì)于企業(yè)來(lái)說(shuō),多模態(tài)預(yù)訓(xùn)練模型將成為企業(yè)生產(chǎn)效率提升的關(guān)鍵。商業(yè)模式上,具備大數(shù)據(jù)、算力資源和模型開(kāi)發(fā)能力的科技企業(yè),將會(huì)成為模型服務(wù)的提供方,幫助企業(yè)將基礎(chǔ)模型的能力與生產(chǎn)流程融合起來(lái),實(shí)現(xiàn)效率和成本最優(yōu)。
雖然大模型能夠?qū)崿F(xiàn)的很多,但昆侖萬(wàn)維CEO方漢在會(huì)上提到一個(gè)有趣的觀點(diǎn),即大模型并不會(huì)帶來(lái)人類智慧的提升。他表示,“人類所有的智慧都用文字記錄下來(lái)了,而現(xiàn)在所有的多模態(tài)圖像跟視頻的人類智慧含量特別少,高質(zhì)量語(yǔ)料幾乎用完了。”不過(guò),從工程角度來(lái)說(shuō),他認(rèn)為,圖片跟視頻這種多模態(tài)大模型應(yīng)用上就特別有價(jià)值。
實(shí)際上,在2015年之前,小模型被認(rèn)為是理解語(yǔ)言的“最先進(jìn)的技術(shù)”。這些小模型擅長(zhǎng)分析型任務(wù),被用于從“預(yù)測(cè)送達(dá)時(shí)間”到“欺詐信息分類”等各類任務(wù)中。
在大模型攪動(dòng)全球之后,小模型是不是就走到“末路”了?
圖片來(lái)源:主辦方供圖
星爵認(rèn)為,大模型跟中小模型在未來(lái)幾年會(huì)并存。從技術(shù)層面來(lái)看,他以計(jì)算機(jī)為例來(lái)解釋,ChatGPT的通用大模型是超級(jí)計(jì)算機(jī),而我們每個(gè)人攜帶的筆記本、手機(jī)等智能模型,是更小的模型,不需要很強(qiáng)的算力就能獲得很好的效果。而從業(yè)務(wù)層面分析,一定會(huì)出現(xiàn)資源配置更加高效的小模型,尤其細(xì)分領(lǐng)域的專用模型。
谷歌近日在一年一度的開(kāi)發(fā)者大會(huì)上推出最新大模型PaLM 2。這款大模型有四種參數(shù),從小到大分別為“壁虎” (Gecko),“水獺”(Otter)、“野牛”(Bison)、“獨(dú)角獸”(Unicorn)。AI產(chǎn)品經(jīng)理、技術(shù)博客Orange's AI主理人Leo此前也對(duì)《每日經(jīng)濟(jì)新聞》記者表示,這種模式非常靈活,最小模型的速度非??欤梢栽谑謾C(jī)本地運(yùn)行,而GPT-4則是單一大模型,速度較慢。
站在投資人的角度,稀奇資本合伙人雷強(qiáng)生認(rèn)為,更多的機(jī)會(huì)集中在小模型和子模型方面。
他在論壇后接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,“大模型賽道的主要玩家就是頭部廠商以及有號(hào)召力的互聯(lián)網(wǎng)大佬,例如前美團(tuán)聯(lián)合創(chuàng)始人王慧文和創(chuàng)新工場(chǎng)董事長(zhǎng)兼首席執(zhí)行官李開(kāi)復(fù)。”
在他看來(lái),生成式AI的定位更多是一個(gè)工具,賦能其他行業(yè)降本增效,這正是小模型的機(jī)會(huì)。大模型就像是高速公路這類基礎(chǔ)設(shè)施,其修建需要資金實(shí)力更強(qiáng)的企業(yè),但除了高速公路,社會(huì)還需要國(guó)道、省道等。
對(duì)于小模型領(lǐng)域的發(fā)展,他指出,“這主要集中在兩個(gè)方面:一是針對(duì)垂直類行業(yè)的小模型,二是重在提升效率等的偏工具類的小模型。”
當(dāng)被問(wèn)及如何選擇投資標(biāo)的時(shí),他告訴每經(jīng)記者,主要分為兩類:聚焦場(chǎng)景化應(yīng)用的老玩家以及初創(chuàng)企業(yè)。“老玩家擁有大量高質(zhì)量的行業(yè)數(shù)據(jù),加上新的技術(shù)方式,就會(huì)創(chuàng)造更豐富的應(yīng)用場(chǎng)景以及更完善的客戶體驗(yàn),市場(chǎng)空間更大。”他同時(shí)強(qiáng)調(diào)了選擇優(yōu)勢(shì)產(chǎn)業(yè)的重要性,“只有優(yōu)勢(shì)的產(chǎn)業(yè)才能長(zhǎng)出創(chuàng)新的機(jī)會(huì)。”
封面圖片來(lái)源:視覺(jué)中國(guó)-VCG41N1303990459
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP