要聞

大模型“混戰(zhàn)”，云端競(jìng)爭(zhēng)時(shí)代到來(lái)

每日經(jīng)濟(jì)新聞 2023-06-05 23:52:26

“現(xiàn)在大語(yǔ)言模型出現(xiàn)以后，云端就開(kāi)始被開(kāi)發(fā)出來(lái)，云端的競(jìng)爭(zhēng)將成為下一場(chǎng)互聯(lián)網(wǎng)競(jìng)爭(zhēng)的窗戶(hù)?！?/p>

每經(jīng)記者石普寧每經(jīng)編輯唐元

“國(guó)內(nèi)現(xiàn)在是‘百模大戰(zhàn)’，這是通向通用人工智能最近的一條路。”在6月2日舉行的“未來(lái)城與智媒體”首屆成都東部新區(qū)·成渝地區(qū)雙城經(jīng)濟(jì)圈城市媒體發(fā)展大會(huì)暨城市機(jī)會(huì)清單發(fā)布活動(dòng)上，北京師范大學(xué)新聞傳播學(xué)院院長(zhǎng)張洪忠表示，大模型讓所有的互聯(lián)網(wǎng)公司都有一個(gè)新的機(jī)會(huì)重新開(kāi)始。

如何理解“大模型”？或許可以從架構(gòu)上出發(fā)。簡(jiǎn)單來(lái)說(shuō)，如今的IT技術(shù)棧分為四層，芯片層、框架層、模型層和應(yīng)用層。

“今天的ChatGPT、文心一言等屬于模型層，AI時(shí)代的原生應(yīng)用都會(huì)基于大模型來(lái)開(kāi)發(fā)。”百度CEO李彥宏在第七屆世界智能大會(huì)上曾如此說(shuō)道。

自開(kāi)春以來(lái)，隨著以大模型的應(yīng)用為標(biāo)志的AI2.0時(shí)代加速到來(lái)，人工智能概念大火。

在國(guó)內(nèi)，以大廠領(lǐng)頭的各大企業(yè)紛紛宣布各自的大模型與產(chǎn)品，通用大模型也迎來(lái)一波創(chuàng)業(yè)潮，一時(shí)間市場(chǎng)上熱鬧紛呈，任何人都不愿錯(cuò)失良機(jī)。

縱觀各類(lèi)大模型產(chǎn)品的“出生”，其中既有來(lái)自熟悉的大廠如百度、阿里，也有來(lái)自專(zhuān)注人工智能領(lǐng)域的企業(yè)如商湯，更有創(chuàng)業(yè)者“另起爐灶”，典型如美團(tuán)聯(lián)合創(chuàng)始人王慧文，稱(chēng)要打造“中國(guó)的OpenAI”。

在“百?；鞈?zhàn)”的背景下，如今各家的“戰(zhàn)況”如何，在大模型“一窩蜂”闖入視野的同時(shí)，我們正在迎接怎樣的科技變革？

各路產(chǎn)品業(yè)已上馬

“ChatGPT從去年11月份進(jìn)入社會(huì)視野，有兩個(gè)最大的突破點(diǎn)：第一個(gè)是開(kāi)放域的多輪對(duì)話(huà)，第二個(gè)是生成性的文本。”張洪忠表示，兩個(gè)技術(shù)的突破意味著人機(jī)交往的新時(shí)代到來(lái)，“這是一個(gè)巨大的革命性突破。”

視線投向國(guó)內(nèi)互聯(lián)網(wǎng)巨頭，在大模型技術(shù)上積累較為深厚的百度和阿里率先出手，分別于3月16日與4月7日推出“文心一言”以及“通義千問(wèn)”。

圖片來(lái)源：“百度文心一言”公眾號(hào)

自?xún)?nèi)測(cè)以來(lái)，文心一言完成了4次技術(shù)版本升級(jí)：如今的推理成本降到了原來(lái)的十分之一，推理性能提升近10倍。

“當(dāng)別人剛剛思考如何進(jìn)行訓(xùn)練的時(shí)候，我們已經(jīng)在推理上沖出了很遠(yuǎn)。”5月，李彥宏在百度內(nèi)部大會(huì)上說(shuō)。

此外，文心一言還將逐步融入百度所有業(yè)務(wù)。

5月16日，百度發(fā)布了第一季度未經(jīng)審計(jì)的財(cái)務(wù)報(bào)告，李彥宏表示，“我們計(jì)劃逐步將文心一言融入我們的所有業(yè)務(wù)，為我們的產(chǎn)品及服務(wù)賦能，吸引更廣泛的用戶(hù)及客戶(hù)。圍繞文心一言在新的時(shí)代中建立新生態(tài)。這也將助力我們實(shí)現(xiàn)長(zhǎng)期、可持續(xù)的增長(zhǎng)。”

無(wú)獨(dú)有偶，一個(gè)多月前，在阿里云峰會(huì)正式推出“通義千問(wèn)”之際，阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇亦表示，阿里巴巴所有產(chǎn)品未來(lái)將接入通義千問(wèn)大模型并進(jìn)行全面改造。“面向AI時(shí)代，所有產(chǎn)品都值得用大模型重新升級(jí)。”

6月1日，阿里云對(duì)外披露通義大模型最新進(jìn)展，瞄向AI音視頻賽道推出“通義聽(tīng)悟”，并且正式開(kāi)啟公測(cè)。

據(jù)阿里云CTO周靖人介紹，通義聽(tīng)悟作為一款工作學(xué)習(xí)AI助手，不僅“聽(tīng)力好”，能夠高準(zhǔn)確度生成會(huì)議記錄、區(qū)分不同發(fā)言人，而且“悟性極高”，可以一秒給音視頻劃分章節(jié)并形成摘要、總結(jié)全文及每個(gè)發(fā)言人觀點(diǎn)、整理關(guān)注重點(diǎn)和待辦事項(xiàng)。

圖片來(lái)源：“阿里云”公眾號(hào)

除了大廠動(dòng)作頻頻之外，AI科技企業(yè)也對(duì)這塊“蛋糕”虎視眈眈。

4月，計(jì)算機(jī)視覺(jué)公司商湯科技于推出“日日新”（SenseNova），其中包括自然語(yǔ)言處理模型“商量”（SenseChat）、文生圖模型“秒畫(huà)”和數(shù)字人視頻生成平臺(tái)“如影”（SenseAvatar）等。

同月，決策類(lèi)AI公司第四范式首次向公眾展示 “式說(shuō)3.0”，瞄準(zhǔn)生成式AI對(duì)企業(yè)級(jí)軟件重構(gòu)和改變的增長(zhǎng)空間和市場(chǎng)機(jī)會(huì)。

值得一提的是，就大模型產(chǎn)品而言，騰訊則“低調(diào)”不少，并不打算“拼速度”。

在3月騰訊發(fā)布2022年四季度財(cái)報(bào)后，騰訊總裁劉熾平透露了包括聊天機(jī)器人在內(nèi)的即將發(fā)布的眾多產(chǎn)品的計(jì)劃。他表示，騰訊不會(huì)匆忙推出產(chǎn)品，而將花費(fèi)時(shí)間打造一個(gè)經(jīng)過(guò)多次迭代后的長(zhǎng)期發(fā)展機(jī)會(huì)。

此外，大廠如字節(jié)跳動(dòng)則選擇扮演類(lèi)似微軟的角色，旗下的火山引擎推出大模型訓(xùn)練云平臺(tái)，為大模型公司提供算力等技術(shù)服務(wù)。火山引擎總裁譚待表示，火山引擎不做大模型，將化身賦能者，為大模型客戶(hù)提供算力等AI基礎(chǔ)設(shè)施，幫助其做好大模型開(kāi)發(fā)。

圖片來(lái)源：“火山引擎”公眾號(hào)

作業(yè)幫教育大模型正在內(nèi)測(cè)

除了科技企業(yè)，記者從作業(yè)幫獲悉，目前作業(yè)幫正在內(nèi)測(cè)基于中國(guó)市場(chǎng)的教育大模型，包含多學(xué)科解題、中英文作文批改、多語(yǔ)言對(duì)話(huà)方向等多個(gè)教育應(yīng)用場(chǎng)景，涉及工具類(lèi)App、智能硬件、圖書(shū)等業(yè)務(wù)。據(jù)內(nèi)部人士透露，教育場(chǎng)景中綜合能力表現(xiàn)超出預(yù)期水平。

針對(duì)此事，財(cái)經(jīng)網(wǎng)科技向作業(yè)幫方面進(jìn)行求證，作業(yè)幫相關(guān)工作人員回復(fù)，作業(yè)幫教育大模型目前在內(nèi)測(cè)階段，相關(guān)評(píng)估及備案等工作正在進(jìn)行中。

一位接近作業(yè)幫人士表示，作業(yè)幫在今年年初就啟動(dòng)了自研教育GPT項(xiàng)目，從各個(gè)業(yè)務(wù)模塊調(diào)集技術(shù)精英組成原始團(tuán)隊(duì)。今年3月份，作業(yè)幫內(nèi)部郵件宣布，再次加大投入，并進(jìn)行組織架構(gòu)調(diào)整。目前該項(xiàng)目由CTO羅亮牽頭進(jìn)行底層研發(fā)支持及AIGC大方向建設(shè)，研發(fā)經(jīng)費(fèi)優(yōu)先調(diào)撥。

該人士進(jìn)一步表示，除了組織架構(gòu)調(diào)整，作業(yè)幫產(chǎn)研團(tuán)隊(duì)中近百人也已并入GPT相關(guān)項(xiàng)目，“從技術(shù)到產(chǎn)品側(cè)，分不同落地場(chǎng)景在‘跑’項(xiàng)目，估計(jì)有兩百人以上的團(tuán)隊(duì)規(guī)模”。

另一位作業(yè)幫內(nèi)部人士透露， “從過(guò)往技術(shù)能力積累來(lái)看，作業(yè)幫優(yōu)勢(shì)明顯，不做這件事才奇怪。”該人士稱(chēng)，經(jīng)過(guò)半年的技術(shù)研發(fā)，作業(yè)幫內(nèi)部對(duì)自研GPT比較有信心，已經(jīng)優(yōu)先“解鎖”解題能力、中英文作文批改、知識(shí)問(wèn)答等產(chǎn)品級(jí)應(yīng)用，進(jìn)展比想象中順利，已經(jīng)在一些教育場(chǎng)景中達(dá)到了行業(yè)top水平。

圖片來(lái)源：“作業(yè)幫”公眾號(hào)

云端競(jìng)爭(zhēng)時(shí)代已經(jīng)到來(lái)

“現(xiàn)在大語(yǔ)言模型出現(xiàn)以后，云端就開(kāi)始被開(kāi)發(fā)出來(lái)，云端的競(jìng)爭(zhēng)將成為下一場(chǎng)互聯(lián)網(wǎng)競(jìng)爭(zhēng)的窗戶(hù)。”張洪忠稱(chēng)。

據(jù)Canalys數(shù)據(jù)顯示，去年中國(guó)云計(jì)算市場(chǎng)同比增長(zhǎng)10%，前四大云計(jì)算廠商阿里云、華為云、騰訊云和百度智能云，合計(jì)增長(zhǎng)9%，占云服務(wù)客戶(hù)支出總額的79%。

張洪忠認(rèn)為，對(duì)于應(yīng)用而言，“對(duì)話(huà)即平臺(tái)”成為現(xiàn)實(shí)，對(duì)話(huà)可以解決多模態(tài)的問(wèn)題。例如，把ChatGPT的API接上以后，大模型就可以畫(huà)圖、做平面設(shè)計(jì)、寫(xiě)文案等等。

而要更深層次理解大模型，“涌現(xiàn)”是一個(gè)關(guān)鍵的概念。

簡(jiǎn)單來(lái)說(shuō)，涌現(xiàn)指的是當(dāng)大模型的數(shù)據(jù)量達(dá)到一定量的時(shí)候，一種產(chǎn)生質(zhì)變的能力。這種能力在小型模型中并不存在。主攻預(yù)訓(xùn)練大模型的智譜AI創(chuàng)始人、CEO張鵬在接受媒體采訪時(shí)指出，業(yè)界普遍的共識(shí)在于，500-600億機(jī)器訓(xùn)練參數(shù)是大模型智能涌現(xiàn)的門(mén)檻。

這也是ChatGPT“大力出奇跡”的基礎(chǔ)，早前“掀起蝴蝶翅膀”的GPT-3模型，就已經(jīng)有1750億個(gè)參數(shù)。OpenAI沒(méi)有進(jìn)一步公布GPT-4的參數(shù)數(shù)量。作為對(duì)比，谷歌新推出的PaLM2訓(xùn)練參數(shù)已經(jīng)達(dá)到3400億個(gè)。

“算力是競(jìng)爭(zhēng)的基礎(chǔ)，”張洪忠提到，目前很多想要從事相關(guān)研究的老師從大學(xué)轉(zhuǎn)到企業(yè)，就是因?yàn)榇髮W(xué)無(wú)法承載如此龐大的算力需求以及巨額費(fèi)用。

一個(gè)典型的例子是，作為算力基礎(chǔ)GPU的供應(yīng)商英偉達(dá)，近日市值一度突破萬(wàn)億美元，其A100芯片、H100芯片在全球具有絕對(duì)優(yōu)勢(shì)。就國(guó)內(nèi)的A100芯片而言，主要被百度、阿里等大廠掌握在手中。

英偉達(dá)CEO黃仁勛圖片來(lái)源：英偉達(dá)官網(wǎng)截圖

換句話(huà)說(shuō)，大模型產(chǎn)品競(jìng)爭(zhēng)費(fèi)用不菲，這也是一些國(guó)內(nèi)大模型產(chǎn)品采用邀請(qǐng)測(cè)試或是不面向C端的主要考慮。

據(jù)國(guó)盛證券估算，GPT-3的單次訓(xùn)練成本就高達(dá)140萬(wàn)美元，對(duì)于一些更大的LLM（大型語(yǔ)言模型），訓(xùn)練成本介于200萬(wàn)美元至1200萬(wàn)美元之間。

在這其中，大部分費(fèi)用是電費(fèi)，計(jì)算機(jī)專(zhuān)家吳軍曾提到，“大概可能是3000輛特斯拉的電動(dòng)汽車(chē)，每輛跑到20萬(wàn)英里（約32.19萬(wàn)公里），把它跑‘死’，這么大的耗電量，才夠ChatGPT訓(xùn)練一次。”

在如此高昂成本之下，各互聯(lián)網(wǎng)大廠也爭(zhēng)相入場(chǎng)，或許都是因?yàn)榭粗卮竽Ｐ彤a(chǎn)品背后掙到“真金白銀”的可能。

李彥宏就提道，初創(chuàng)企業(yè)“沒(méi)有必要再重新發(fā)明一遍輪子（基礎(chǔ)大模型）”，它們的機(jī)會(huì)是在應(yīng)用層，將出現(xiàn)“全新的、十倍于現(xiàn)在微信和抖音的創(chuàng)業(yè)機(jī)遇”。當(dāng)然，百度自己想要做“輪子”。

在張洪忠看來(lái)，互聯(lián)網(wǎng)經(jīng)歷了三大時(shí)代：PC互聯(lián)網(wǎng)時(shí)代，2010年之后的移動(dòng)互聯(lián)網(wǎng)時(shí)代，以及可能進(jìn)入的下一個(gè)時(shí)代——大模型時(shí)代。他表示，“我們未來(lái)的互聯(lián)網(wǎng)競(jìng)爭(zhēng)，幾乎都要建立在大模型基礎(chǔ)上。”

他進(jìn)一步提到，移動(dòng)互聯(lián)網(wǎng)時(shí)代，誰(shuí)都想不到當(dāng)時(shí)如日中天的四大門(mén)戶(hù)——新浪、騰訊、網(wǎng)易、搜狐會(huì)在這一波浪潮之中被抖音、快手、微信等應(yīng)用所取代和趕超。

“同樣的，今天我們到了大模型時(shí)代，在大模型基礎(chǔ)之上的應(yīng)用就可能會(huì)產(chǎn)生新的技術(shù)，這就是人工智能技術(shù)帶給我們的希望和變數(shù)，包括一些新的產(chǎn)業(yè)發(fā)展契機(jī)。”

本文作者系天府文創(chuàng)云記者石普寧，轉(zhuǎn)載合作相關(guān)可搜索“天府文創(chuàng)云”公眾號(hào)。

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

“國(guó)內(nèi)現(xiàn)在是‘百模大戰(zhàn)’，這是通向通用人工智能最近的一條路?！痹?月2日舉行的“未來(lái)城與智媒體”首屆成都東部新區(qū)·成渝地區(qū)雙城經(jīng)濟(jì)圈城市媒體發(fā)展大會(huì)暨城市機(jī)會(huì)清單發(fā)布活動(dòng)上，北京師范大學(xué)新聞傳播學(xué)院院長(zhǎng)張洪忠表示，大模型讓所有的互聯(lián)網(wǎng)公司都有一個(gè)新的機(jī)會(huì)重新開(kāi)始。如何理解“大模型”？或許可以從架構(gòu)上出發(fā)。簡(jiǎn)單來(lái)說(shuō)，如今的IT技術(shù)棧分為四層，芯片層、框架層、模型層和應(yīng)用層。 “今天的ChatGPT、文心一言等屬于模型層，AI時(shí)代的原生應(yīng)用都會(huì)基于大模型來(lái)開(kāi)發(fā)。”百度CEO李彥宏在第七屆世界智能大會(huì)上曾如此說(shuō)道。自開(kāi)春以來(lái)，隨著以大模型的應(yīng)用為標(biāo)志的AI2.0時(shí)代加速到來(lái)，人工智能概念大火。在國(guó)內(nèi)，以大廠領(lǐng)頭的各大企業(yè)紛紛宣布各自的大模型與產(chǎn)品，通用大模型也迎來(lái)一波創(chuàng)業(yè)潮，一時(shí)間市場(chǎng)上熱鬧紛呈，任何人都不愿錯(cuò)失良機(jī)。縱觀各類(lèi)大模型產(chǎn)品的“出生”，其中既有來(lái)自熟悉的大廠如百度、阿里，也有來(lái)自專(zhuān)注人工智能領(lǐng)域的企業(yè)如商湯，更有創(chuàng)業(yè)者“另起爐灶”，典型如美團(tuán)聯(lián)合創(chuàng)始人王慧文，稱(chēng)要打造“中國(guó)的OpenAI”。在“百?；鞈?zhàn)”的背景下，如今各家的“戰(zhàn)況”如何，在大模型“一窩蜂”闖入視野的同時(shí)，我們正在迎接怎樣的科技變革？各路產(chǎn)品業(yè)已上馬 “ChatGPT從去年11月份進(jìn)入社會(huì)視野，有兩個(gè)最大的突破點(diǎn)：第一個(gè)是開(kāi)放域的多輪對(duì)話(huà)，第二個(gè)是生成性的文本?！睆埡橹冶硎荆瑑蓚€(gè)技術(shù)的突破意味著人機(jī)交往的新時(shí)代到來(lái)，“這是一個(gè)巨大的革命性突破?！? 視線投向國(guó)內(nèi)互聯(lián)網(wǎng)巨頭，在大模型技術(shù)上積累較為深厚的百度和阿里率先出手，分別于3月16日與4月7日推出“文心一言”以及“通義千問(wèn)”。圖片來(lái)源：“百度文心一言”公眾號(hào) 自?xún)?nèi)測(cè)以來(lái)，文心一言完成了4次技術(shù)版本升級(jí)：如今的推理成本降到了原來(lái)的十分之一，推理性能提升近10倍。 “當(dāng)別人剛剛思考如何進(jìn)行訓(xùn)練的時(shí)候，我們已經(jīng)在推理上沖出了很遠(yuǎn)?！?月，李彥宏在百度內(nèi)部大會(huì)上說(shuō)。此外，文心一言還將逐步融入百度所有業(yè)務(wù)。 5月16日，百度發(fā)布了第一季度未經(jīng)審計(jì)的財(cái)務(wù)報(bào)告，李彥宏表示，“我們計(jì)劃逐步將文心一言融入我們的所有業(yè)務(wù)，為我們的產(chǎn)品及服務(wù)賦能，吸引更廣泛的用戶(hù)及客戶(hù)。圍繞文心一言在新的時(shí)代中建立新生態(tài)。這也將助力我們實(shí)現(xiàn)長(zhǎng)期、可持續(xù)的增長(zhǎng)?！? 無(wú)獨(dú)有偶，一個(gè)多月前，在阿里云峰會(huì)正式推出“通義千問(wèn)”之際，阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇亦表示，阿里巴巴所有產(chǎn)品未來(lái)將接入通義千問(wèn)大模型并進(jìn)行全面改造?！懊嫦駻I時(shí)代，所有產(chǎn)品都值得用大模型重新升級(jí)?！? 6月1日，阿里云對(duì)外披露通義大模型最新進(jìn)展，瞄向AI音視頻賽道推出“通義聽(tīng)悟”，并且正式開(kāi)啟公測(cè)。據(jù)阿里云CTO周靖人介紹，通義聽(tīng)悟作為一款工作學(xué)習(xí)AI助手，不僅“聽(tīng)力好”，能夠高準(zhǔn)確度生成會(huì)議記錄、區(qū)分不同發(fā)言人，而且“悟性極高”，可以一秒給音視頻劃分章節(jié)并形成摘要、總結(jié)全文及每個(gè)發(fā)言人觀點(diǎn)、整理關(guān)注重點(diǎn)和待辦事項(xiàng)。圖片來(lái)源：“阿里云”公眾號(hào) 除了大廠動(dòng)作頻頻之外，AI科技企業(yè)也對(duì)這塊“蛋糕”虎視眈眈。 4月，計(jì)算機(jī)視覺(jué)公司商湯科技于推出“日日新”（SenseNova），其中包括自然語(yǔ)言處理模型“商量”（SenseChat）、文生圖模型“秒畫(huà)”和數(shù)字人視頻生成平臺(tái)“如影”（SenseAvatar）等。同月，決策類(lèi)AI公司第四范式首次向公眾展示“式說(shuō)3.0”，瞄準(zhǔn)生成式AI對(duì)企業(yè)級(jí)軟件重構(gòu)和改變的增長(zhǎng)空間和市場(chǎng)機(jī)會(huì)。值得一提的是，就大模型產(chǎn)品而言，騰訊則“低調(diào)”不少，并不打算“拼速度”。在3月騰訊發(fā)布2022年四季度財(cái)報(bào)后，騰訊總裁劉熾平透露了包括聊天機(jī)器人在內(nèi)的即將發(fā)布的眾多產(chǎn)品的計(jì)劃。他表示，騰訊不會(huì)匆忙推出產(chǎn)品，而將花費(fèi)時(shí)間打造一個(gè)經(jīng)過(guò)多次迭代后的長(zhǎng)期發(fā)展機(jī)會(huì)。此外，大廠如字節(jié)跳動(dòng)則選擇扮演類(lèi)似微軟的角色，旗下的火山引擎推出大模型訓(xùn)練云平臺(tái)，為大模型公司提供算力等技術(shù)服務(wù)?；鹕揭婵偛米T待表示，火山引擎不做大模型，將化身賦能者，為大模型客戶(hù)提供算力等AI基礎(chǔ)設(shè)施，幫助其做好大模型開(kāi)發(fā)。圖片來(lái)源：“火山引擎”公眾號(hào) 作業(yè)幫教育大模型正在內(nèi)測(cè) 除了科技企業(yè)，記者從作業(yè)幫獲悉，目前作業(yè)幫正在內(nèi)測(cè)基于中國(guó)市場(chǎng)的教育大模型，包含多學(xué)科解題、中英文作文批改、多語(yǔ)言對(duì)話(huà)方向等多個(gè)教育應(yīng)用場(chǎng)景，涉及工具類(lèi)App、智能硬件、圖書(shū)等業(yè)務(wù)。據(jù)內(nèi)部人士透露，教育場(chǎng)景中綜合能力表現(xiàn)超出預(yù)期水平。針對(duì)此事，財(cái)經(jīng)網(wǎng)科技向作業(yè)幫方面進(jìn)行求證，作業(yè)幫相關(guān)工作人員回復(fù)，作業(yè)幫教育大模型目前在內(nèi)測(cè)階段，相關(guān)評(píng)估及備案等工作正在進(jìn)行中。一位接近作業(yè)幫人士表示，作業(yè)幫在今年年初就啟動(dòng)了自研教育GPT項(xiàng)目，從各個(gè)業(yè)務(wù)模塊調(diào)集技術(shù)精英組成原始團(tuán)隊(duì)。今年3月份，作業(yè)幫內(nèi)部郵件宣布，再次加大投入，并進(jìn)行組織架構(gòu)調(diào)整。目前該項(xiàng)目由CTO羅亮牽頭進(jìn)行底層研發(fā)支持及AIGC大方向建設(shè)，研發(fā)經(jīng)費(fèi)優(yōu)先調(diào)撥。該人士進(jìn)一步表示，除了組織架構(gòu)調(diào)整，作業(yè)幫產(chǎn)研團(tuán)隊(duì)中近百人也已并入GPT相關(guān)項(xiàng)目，“從技術(shù)到產(chǎn)品側(cè)，分不同落地場(chǎng)景在‘跑’項(xiàng)目，估計(jì)有兩百人以上的團(tuán)隊(duì)規(guī)?！?。另一位作業(yè)幫內(nèi)部人士透露，“從過(guò)往技術(shù)能力積累來(lái)看，作業(yè)幫優(yōu)勢(shì)明顯，不做這件事才奇怪?！痹撊耸糠Q(chēng)，經(jīng)過(guò)半年的技術(shù)研發(fā)，作業(yè)幫內(nèi)部對(duì)自研GPT比較有信心，已經(jīng)優(yōu)先“解鎖”解題能力、中英文作文批改、知識(shí)問(wèn)答等產(chǎn)品級(jí)應(yīng)用，進(jìn)展比想象中順利，已經(jīng)在一些教育場(chǎng)景中達(dá)到了行業(yè)top水平。圖片來(lái)源：“作業(yè)幫”公眾號(hào) 云端競(jìng)爭(zhēng)時(shí)代已經(jīng)到來(lái) “現(xiàn)在大語(yǔ)言模型出現(xiàn)以后，云端就開(kāi)始被開(kāi)發(fā)出來(lái)，云端的競(jìng)爭(zhēng)將成為下一場(chǎng)互聯(lián)網(wǎng)競(jìng)爭(zhēng)的窗戶(hù)?！睆埡橹曳Q(chēng)。據(jù)Canalys數(shù)據(jù)顯示，去年中國(guó)云計(jì)算市場(chǎng)同比增長(zhǎng)10%，前四大云計(jì)算廠商阿里云、華為云、騰訊云和百度智能云，合計(jì)增長(zhǎng)9%，占云服務(wù)客戶(hù)支出總額的79%。張洪忠認(rèn)為，對(duì)于應(yīng)用而言，“對(duì)話(huà)即平臺(tái)”成為現(xiàn)實(shí)，對(duì)話(huà)可以解決多模態(tài)的問(wèn)題。例如，把ChatGPT的API接上以后，大模型就可以畫(huà)圖、做平面設(shè)計(jì)、寫(xiě)文案等等。而要更深層次理解大模型，“涌現(xiàn)”是一個(gè)關(guān)鍵的概念。簡(jiǎn)單來(lái)說(shuō)，涌現(xiàn)指的是當(dāng)大模型的數(shù)據(jù)量達(dá)到一定量的時(shí)候，一種產(chǎn)生質(zhì)變的能力。這種能力在小型模型中并不存在。主攻預(yù)訓(xùn)練大模型的智譜AI創(chuàng)始人、CEO張鵬在接受媒體采訪時(shí)指出，業(yè)界普遍的共識(shí)在于，500-600億機(jī)器訓(xùn)練參數(shù)是大模型智能涌現(xiàn)的門(mén)檻。這也是ChatGPT“大力出奇跡”的基礎(chǔ)，早前“掀起蝴蝶翅膀”的GPT-3模型，就已經(jīng)有1750億個(gè)參數(shù)。OpenAI沒(méi)有進(jìn)一步公布GPT-4的參數(shù)數(shù)量。作為對(duì)比，谷歌新推出的PaLM2訓(xùn)練參數(shù)已經(jīng)達(dá)到3400億個(gè)。 “算力是競(jìng)爭(zhēng)的基礎(chǔ)，”張洪忠提到，目前很多想要從事相關(guān)研究的老師從大學(xué)轉(zhuǎn)到企業(yè)，就是因?yàn)榇髮W(xué)無(wú)法承載如此龐大的算力需求以及巨額費(fèi)用。一個(gè)典型的例子是，作為算力基礎(chǔ)GPU的供應(yīng)商英偉達(dá)，近日市值一度突破萬(wàn)億美元，其A100芯片、H100芯片在全球具有絕對(duì)優(yōu)勢(shì)。就國(guó)內(nèi)的A100芯片而言，主要被百度、阿里等大廠掌握在手中。英偉達(dá)CEO黃仁勛圖片來(lái)源：英偉達(dá)官網(wǎng)截圖換句話(huà)說(shuō)，大模型產(chǎn)品競(jìng)爭(zhēng)費(fèi)用不菲，這也是一些國(guó)內(nèi)大模型產(chǎn)品采用邀請(qǐng)測(cè)試或是不面向C端的主要考慮。據(jù)國(guó)盛證券估算，GPT-3的單次訓(xùn)練成本就高達(dá)140萬(wàn)美元，對(duì)于一些更大的LLM（大型語(yǔ)言模型），訓(xùn)練成本介于200萬(wàn)美元至1200萬(wàn)美元之間。在這其中，大部分費(fèi)用是電費(fèi)，計(jì)算機(jī)專(zhuān)家吳軍曾提到，“大概可能是3000輛特斯拉的電動(dòng)汽車(chē)，每輛跑到20萬(wàn)英里（約32.19萬(wàn)公里），把它跑‘死’，這么大的耗電量，才夠ChatGPT訓(xùn)練一次?！? 在如此高昂成本之下，各互聯(lián)網(wǎng)大廠也爭(zhēng)相入場(chǎng)，或許都是因?yàn)榭粗卮竽Ｐ彤a(chǎn)品背后掙到“真金白銀”的可能。李彥宏就提道，初創(chuàng)企業(yè)“沒(méi)有必要再重新發(fā)明一遍輪子（基礎(chǔ)大模型）”，它們的機(jī)會(huì)是在應(yīng)用層，將出現(xiàn)“全新的、十倍于現(xiàn)在微信和抖音的創(chuàng)業(yè)機(jī)遇”。當(dāng)然，百度自己想要做“輪子”。在張洪忠看來(lái)，互聯(lián)網(wǎng)經(jīng)歷了三大時(shí)代：PC互聯(lián)網(wǎng)時(shí)代，2010年之后的移動(dòng)互聯(lián)網(wǎng)時(shí)代，以及可能進(jìn)入的下一個(gè)時(shí)代——大模型時(shí)代。他表示，“我們未來(lái)的互聯(lián)網(wǎng)競(jìng)爭(zhēng)，幾乎都要建立在大模型基礎(chǔ)上?！? 他進(jìn)一步提到，移動(dòng)互聯(lián)網(wǎng)時(shí)代，誰(shuí)都想不到當(dāng)時(shí)如日中天的四大門(mén)戶(hù)——新浪、騰訊、網(wǎng)易、搜狐會(huì)在這一波浪潮之中被抖音、快手、微信等應(yīng)用所取代和趕超。 “同樣的，今天我們到了大模型時(shí)代，在大模型基礎(chǔ)之上的應(yīng)用就可能會(huì)產(chǎn)生新的技術(shù)，這就是人工智能技術(shù)帶給我們的希望和變數(shù)，包括一些新的產(chǎn)業(yè)發(fā)展契機(jī)?！? 本文作者系天府文創(chuàng)云記者石普寧，轉(zhuǎn)載合作相關(guān)可搜索“天府文創(chuàng)云”公眾號(hào)。

大模型

上一篇文章

幣安CEO趙長(zhǎng)鵬：團(tuán)隊(duì)將確保系統(tǒng)穩(wěn)定，包括提款和存款

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

西南水電大省，何時(shí)才能“解渴”？

相關(guān)文章