每日經(jīng)濟(jì)新聞 2023-06-05 23:52:26
“現(xiàn)在大語(yǔ)言模型出現(xiàn)以后,云端就開(kāi)始被開(kāi)發(fā)出來(lái),云端的競(jìng)爭(zhēng)將成為下一場(chǎng)互聯(lián)網(wǎng)競(jìng)爭(zhēng)的窗戶(hù)?!?/p>
每經(jīng)記者 石普寧 每經(jīng)編輯 唐元
“國(guó)內(nèi)現(xiàn)在是‘百模大戰(zhàn)’,這是通向通用人工智能最近的一條路。”在6月2日舉行的“未來(lái)城與智媒體”首屆成都東部新區(qū)·成渝地區(qū)雙城經(jīng)濟(jì)圈城市媒體發(fā)展大會(huì)暨城市機(jī)會(huì)清單發(fā)布活動(dòng)上,北京師范大學(xué)新聞傳播學(xué)院院長(zhǎng)張洪忠表示,大模型讓所有的互聯(lián)網(wǎng)公司都有一個(gè)新的機(jī)會(huì)重新開(kāi)始。
如何理解“大模型”?或許可以從架構(gòu)上出發(fā)。簡(jiǎn)單來(lái)說(shuō),如今的IT技術(shù)棧分為四層,芯片層、框架層、模型層和應(yīng)用層。
“今天的ChatGPT、文心一言等屬于模型層,AI時(shí)代的原生應(yīng)用都會(huì)基于大模型來(lái)開(kāi)發(fā)。”百度CEO李彥宏在第七屆世界智能大會(huì)上曾如此說(shuō)道。
自開(kāi)春以來(lái),隨著以大模型的應(yīng)用為標(biāo)志的AI2.0時(shí)代加速到來(lái),人工智能概念大火。
在國(guó)內(nèi),以大廠領(lǐng)頭的各大企業(yè)紛紛宣布各自的大模型與產(chǎn)品,通用大模型也迎來(lái)一波創(chuàng)業(yè)潮,一時(shí)間市場(chǎng)上熱鬧紛呈,任何人都不愿錯(cuò)失良機(jī)。
縱觀各類(lèi)大模型產(chǎn)品的“出生”,其中既有來(lái)自熟悉的大廠如百度、阿里,也有來(lái)自專(zhuān)注人工智能領(lǐng)域的企業(yè)如商湯,更有創(chuàng)業(yè)者“另起爐灶”,典型如美團(tuán)聯(lián)合創(chuàng)始人王慧文,稱(chēng)要打造“中國(guó)的OpenAI”。
在“百?;鞈?zhàn)”的背景下,如今各家的“戰(zhàn)況”如何,在大模型“一窩蜂”闖入視野的同時(shí),我們正在迎接怎樣的科技變革?
“ChatGPT從去年11月份進(jìn)入社會(huì)視野,有兩個(gè)最大的突破點(diǎn):第一個(gè)是開(kāi)放域的多輪對(duì)話(huà),第二個(gè)是生成性的文本。”張洪忠表示,兩個(gè)技術(shù)的突破意味著人機(jī)交往的新時(shí)代到來(lái),“這是一個(gè)巨大的革命性突破。”
視線投向國(guó)內(nèi)互聯(lián)網(wǎng)巨頭,在大模型技術(shù)上積累較為深厚的百度和阿里率先出手,分別于3月16日與4月7日推出“文心一言”以及“通義千問(wèn)”。
圖片來(lái)源:“百度文心一言”公眾號(hào)
自?xún)?nèi)測(cè)以來(lái),文心一言完成了4次技術(shù)版本升級(jí):如今的推理成本降到了原來(lái)的十分之一,推理性能提升近10倍。
“當(dāng)別人剛剛思考如何進(jìn)行訓(xùn)練的時(shí)候,我們已經(jīng)在推理上沖出了很遠(yuǎn)。”5月,李彥宏在百度內(nèi)部大會(huì)上說(shuō)。
此外,文心一言還將逐步融入百度所有業(yè)務(wù)。
5月16日,百度發(fā)布了第一季度未經(jīng)審計(jì)的財(cái)務(wù)報(bào)告,李彥宏表示,“我們計(jì)劃逐步將文心一言融入我們的所有業(yè)務(wù),為我們的產(chǎn)品及服務(wù)賦能,吸引更廣泛的用戶(hù)及客戶(hù)。圍繞文心一言在新的時(shí)代中建立新生態(tài)。這也將助力我們實(shí)現(xiàn)長(zhǎng)期、可持續(xù)的增長(zhǎng)。”
無(wú)獨(dú)有偶,一個(gè)多月前,在阿里云峰會(huì)正式推出“通義千問(wèn)”之際,阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇亦表示,阿里巴巴所有產(chǎn)品未來(lái)將接入通義千問(wèn)大模型并進(jìn)行全面改造。“面向AI時(shí)代,所有產(chǎn)品都值得用大模型重新升級(jí)。”
6月1日,阿里云對(duì)外披露通義大模型最新進(jìn)展,瞄向AI音視頻賽道推出“通義聽(tīng)悟”,并且正式開(kāi)啟公測(cè)。
據(jù)阿里云CTO周靖人介紹,通義聽(tīng)悟作為一款工作學(xué)習(xí)AI助手,不僅“聽(tīng)力好”,能夠高準(zhǔn)確度生成會(huì)議記錄、區(qū)分不同發(fā)言人,而且“悟性極高”,可以一秒給音視頻劃分章節(jié)并形成摘要、總結(jié)全文及每個(gè)發(fā)言人觀點(diǎn)、整理關(guān)注重點(diǎn)和待辦事項(xiàng)。
圖片來(lái)源:“阿里云”公眾號(hào)
除了大廠動(dòng)作頻頻之外,AI科技企業(yè)也對(duì)這塊“蛋糕”虎視眈眈。
4月,計(jì)算機(jī)視覺(jué)公司商湯科技于推出“日日新”(SenseNova),其中包括自然語(yǔ)言處理模型“商量”(SenseChat)、文生圖模型“秒畫(huà)”和數(shù)字人視頻生成平臺(tái)“如影”(SenseAvatar)等。
同月,決策類(lèi)AI公司第四范式首次向公眾展示 “式說(shuō)3.0”,瞄準(zhǔn)生成式AI對(duì)企業(yè)級(jí)軟件重構(gòu)和改變的增長(zhǎng)空間和市場(chǎng)機(jī)會(huì)。
值得一提的是,就大模型產(chǎn)品而言,騰訊則“低調(diào)”不少,并不打算“拼速度”。
在3月騰訊發(fā)布2022年四季度財(cái)報(bào)后,騰訊總裁劉熾平透露了包括聊天機(jī)器人在內(nèi)的即將發(fā)布的眾多產(chǎn)品的計(jì)劃。他表示,騰訊不會(huì)匆忙推出產(chǎn)品,而將花費(fèi)時(shí)間打造一個(gè)經(jīng)過(guò)多次迭代后的長(zhǎng)期發(fā)展機(jī)會(huì)。
此外,大廠如字節(jié)跳動(dòng)則選擇扮演類(lèi)似微軟的角色,旗下的火山引擎推出大模型訓(xùn)練云平臺(tái),為大模型公司提供算力等技術(shù)服務(wù)。火山引擎總裁譚待表示,火山引擎不做大模型,將化身賦能者,為大模型客戶(hù)提供算力等AI基礎(chǔ)設(shè)施,幫助其做好大模型開(kāi)發(fā)。
圖片來(lái)源:“火山引擎”公眾號(hào)
除了科技企業(yè),記者從作業(yè)幫獲悉,目前作業(yè)幫正在內(nèi)測(cè)基于中國(guó)市場(chǎng)的教育大模型,包含多學(xué)科解題、中英文作文批改、多語(yǔ)言對(duì)話(huà)方向等多個(gè)教育應(yīng)用場(chǎng)景,涉及工具類(lèi)App、智能硬件、圖書(shū)等業(yè)務(wù)。據(jù)內(nèi)部人士透露,教育場(chǎng)景中綜合能力表現(xiàn)超出預(yù)期水平。
針對(duì)此事,財(cái)經(jīng)網(wǎng)科技向作業(yè)幫方面進(jìn)行求證,作業(yè)幫相關(guān)工作人員回復(fù),作業(yè)幫教育大模型目前在內(nèi)測(cè)階段,相關(guān)評(píng)估及備案等工作正在進(jìn)行中。
一位接近作業(yè)幫人士表示,作業(yè)幫在今年年初就啟動(dòng)了自研教育GPT項(xiàng)目,從各個(gè)業(yè)務(wù)模塊調(diào)集技術(shù)精英組成原始團(tuán)隊(duì)。今年3月份,作業(yè)幫內(nèi)部郵件宣布,再次加大投入,并進(jìn)行組織架構(gòu)調(diào)整。目前該項(xiàng)目由CTO羅亮牽頭進(jìn)行底層研發(fā)支持及AIGC大方向建設(shè),研發(fā)經(jīng)費(fèi)優(yōu)先調(diào)撥。
該人士進(jìn)一步表示,除了組織架構(gòu)調(diào)整,作業(yè)幫產(chǎn)研團(tuán)隊(duì)中近百人也已并入GPT相關(guān)項(xiàng)目,“從技術(shù)到產(chǎn)品側(cè),分不同落地場(chǎng)景在‘跑’項(xiàng)目,估計(jì)有兩百人以上的團(tuán)隊(duì)規(guī)模”。
另一位作業(yè)幫內(nèi)部人士透露, “從過(guò)往技術(shù)能力積累來(lái)看,作業(yè)幫優(yōu)勢(shì)明顯,不做這件事才奇怪。”該人士稱(chēng),經(jīng)過(guò)半年的技術(shù)研發(fā),作業(yè)幫內(nèi)部對(duì)自研GPT比較有信心,已經(jīng)優(yōu)先“解鎖”解題能力、中英文作文批改、知識(shí)問(wèn)答等產(chǎn)品級(jí)應(yīng)用,進(jìn)展比想象中順利,已經(jīng)在一些教育場(chǎng)景中達(dá)到了行業(yè)top水平。
圖片來(lái)源:“作業(yè)幫”公眾號(hào)
“現(xiàn)在大語(yǔ)言模型出現(xiàn)以后,云端就開(kāi)始被開(kāi)發(fā)出來(lái),云端的競(jìng)爭(zhēng)將成為下一場(chǎng)互聯(lián)網(wǎng)競(jìng)爭(zhēng)的窗戶(hù)。”張洪忠稱(chēng)。
據(jù)Canalys數(shù)據(jù)顯示,去年中國(guó)云計(jì)算市場(chǎng)同比增長(zhǎng)10%,前四大云計(jì)算廠商阿里云、華為云、騰訊云和百度智能云,合計(jì)增長(zhǎng)9%,占云服務(wù)客戶(hù)支出總額的79%。
張洪忠認(rèn)為,對(duì)于應(yīng)用而言,“對(duì)話(huà)即平臺(tái)”成為現(xiàn)實(shí),對(duì)話(huà)可以解決多模態(tài)的問(wèn)題。例如,把ChatGPT的API接上以后,大模型就可以畫(huà)圖、做平面設(shè)計(jì)、寫(xiě)文案等等。
而要更深層次理解大模型,“涌現(xiàn)”是一個(gè)關(guān)鍵的概念。
簡(jiǎn)單來(lái)說(shuō),涌現(xiàn)指的是當(dāng)大模型的數(shù)據(jù)量達(dá)到一定量的時(shí)候,一種產(chǎn)生質(zhì)變的能力。這種能力在小型模型中并不存在。主攻預(yù)訓(xùn)練大模型的智譜AI創(chuàng)始人、CEO張鵬在接受媒體采訪時(shí)指出,業(yè)界普遍的共識(shí)在于,500-600億機(jī)器訓(xùn)練參數(shù)是大模型智能涌現(xiàn)的門(mén)檻。
這也是ChatGPT“大力出奇跡”的基礎(chǔ),早前“掀起蝴蝶翅膀”的GPT-3模型,就已經(jīng)有1750億個(gè)參數(shù)。OpenAI沒(méi)有進(jìn)一步公布GPT-4的參數(shù)數(shù)量。作為對(duì)比,谷歌新推出的PaLM2訓(xùn)練參數(shù)已經(jīng)達(dá)到3400億個(gè)。
“算力是競(jìng)爭(zhēng)的基礎(chǔ),”張洪忠提到,目前很多想要從事相關(guān)研究的老師從大學(xué)轉(zhuǎn)到企業(yè),就是因?yàn)榇髮W(xué)無(wú)法承載如此龐大的算力需求以及巨額費(fèi)用。
一個(gè)典型的例子是,作為算力基礎(chǔ)GPU的供應(yīng)商英偉達(dá),近日市值一度突破萬(wàn)億美元,其A100芯片、H100芯片在全球具有絕對(duì)優(yōu)勢(shì)。就國(guó)內(nèi)的A100芯片而言,主要被百度、阿里等大廠掌握在手中。
英偉達(dá)CEO黃仁勛 圖片來(lái)源:英偉達(dá)官網(wǎng)截圖
換句話(huà)說(shuō),大模型產(chǎn)品競(jìng)爭(zhēng)費(fèi)用不菲,這也是一些國(guó)內(nèi)大模型產(chǎn)品采用邀請(qǐng)測(cè)試或是不面向C端的主要考慮。
據(jù)國(guó)盛證券估算,GPT-3的單次訓(xùn)練成本就高達(dá)140萬(wàn)美元,對(duì)于一些更大的LLM(大型語(yǔ)言模型),訓(xùn)練成本介于200萬(wàn)美元至1200萬(wàn)美元之間。
在這其中,大部分費(fèi)用是電費(fèi),計(jì)算機(jī)專(zhuān)家吳軍曾提到,“大概可能是3000輛特斯拉的電動(dòng)汽車(chē),每輛跑到20萬(wàn)英里(約32.19萬(wàn)公里),把它跑‘死’,這么大的耗電量,才夠ChatGPT訓(xùn)練一次。”
在如此高昂成本之下,各互聯(lián)網(wǎng)大廠也爭(zhēng)相入場(chǎng),或許都是因?yàn)榭粗卮竽P彤a(chǎn)品背后掙到“真金白銀”的可能。
李彥宏就提道,初創(chuàng)企業(yè)“沒(méi)有必要再重新發(fā)明一遍輪子(基礎(chǔ)大模型)”,它們的機(jī)會(huì)是在應(yīng)用層,將出現(xiàn)“全新的、十倍于現(xiàn)在微信和抖音的創(chuàng)業(yè)機(jī)遇”。當(dāng)然,百度自己想要做“輪子”。
在張洪忠看來(lái),互聯(lián)網(wǎng)經(jīng)歷了三大時(shí)代:PC互聯(lián)網(wǎng)時(shí)代,2010年之后的移動(dòng)互聯(lián)網(wǎng)時(shí)代,以及可能進(jìn)入的下一個(gè)時(shí)代——大模型時(shí)代。他表示,“我們未來(lái)的互聯(lián)網(wǎng)競(jìng)爭(zhēng),幾乎都要建立在大模型基礎(chǔ)上。”
他進(jìn)一步提到,移動(dòng)互聯(lián)網(wǎng)時(shí)代,誰(shuí)都想不到當(dāng)時(shí)如日中天的四大門(mén)戶(hù)——新浪、騰訊、網(wǎng)易、搜狐會(huì)在這一波浪潮之中被抖音、快手、微信等應(yīng)用所取代和趕超。
“同樣的,今天我們到了大模型時(shí)代,在大模型基礎(chǔ)之上的應(yīng)用就可能會(huì)產(chǎn)生新的技術(shù),這就是人工智能技術(shù)帶給我們的希望和變數(shù),包括一些新的產(chǎn)業(yè)發(fā)展契機(jī)。”
本文作者系天府文創(chuàng)云記者石普寧,轉(zhuǎn)載合作相關(guān)可搜索“天府文創(chuàng)云”公眾號(hào)。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP