每日經(jīng)濟(jì)新聞 2024-06-18 16:26:36
◎端側(cè)模型的價(jià)值在哪里?比如,一家機(jī)器人公司生產(chǎn)的情感陪伴機(jī)器人,結(jié)合終端側(cè)模型,能夠使機(jī)器人更加理解用戶,實(shí)現(xiàn)情感交流,為用戶帶來巨大的情感價(jià)值。
◎李大海表示,預(yù)計(jì)到2026年底,達(dá)到GPT-4水平的端側(cè)模型將誕生,這將極大地推動(dòng)端側(cè)產(chǎn)品快速落地和廣泛應(yīng)用。
每經(jīng)記者 可楊 每經(jīng)編輯 文多
在斯坦福大學(xué)學(xué)生組成的AI團(tuán)隊(duì)被指涉嫌抄襲面壁智能的端側(cè)模型MiniCPM-Llama3-V 2.5之后,這家發(fā)源于本土的大語言模型公司受到了更多的關(guān)注。
“其實(shí)通過這次的事件,我們也對(duì)開源更有信心。”再次談起不久前的被抄襲風(fēng)波,面壁智能CEO李大海說道。
抄襲事件最終以斯坦福大學(xué)學(xué)生道歉并刪除相關(guān)模型作為句點(diǎn),但關(guān)于端側(cè)模型的討論卻愈加熱鬧。
6月15日,在接受包括《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體采訪時(shí),李大海表示,端側(cè)模型的優(yōu)勢(shì)在于其成本效益和可靠性。
他表示,隨著技術(shù)的進(jìn)步,同等智能水平模型的參數(shù)規(guī)模正在以每8個(gè)月減半的速度縮減,預(yù)示著其知識(shí)密度的顯著提升。預(yù)計(jì)到2026年底,達(dá)到GPT-4水平的端側(cè)模型將誕生,這將極大地推動(dòng)端側(cè)產(chǎn)品快速落地和廣泛應(yīng)用。
圖片來源:北京智源大會(huì)主辦方提供
2019年發(fā)布全球首個(gè)知識(shí)增強(qiáng)大模型ERNIE后,面壁智能還發(fā)布了中國首個(gè)中文大模型CPM-1?,F(xiàn)在,端側(cè)模型(Edge Model)——即在設(shè)備端上運(yùn)行的人工智能模型,是面壁智能發(fā)力的重點(diǎn)方向。目前,端側(cè)模型通常面向需要快速響應(yīng)、對(duì)隱私保護(hù)有較高要求或網(wǎng)絡(luò)環(huán)境不穩(wěn)定的場景,例如智能家居控制、移動(dòng)設(shè)備上的語音助手、自動(dòng)駕駛汽車等。
對(duì)終端應(yīng)用領(lǐng)域,李大海表示,無論是PC(個(gè)人電腦)、手機(jī)、智能汽車,還是前沿智能終端,都有眾多實(shí)際應(yīng)用場景與硬件相結(jié)合。
舉例來說,一家機(jī)器人公司生產(chǎn)的情感陪伴機(jī)器人,其形態(tài)酷似貓咪,旨在滿足那些熱愛貓咪但卻因過敏或行動(dòng)不便等原因無法養(yǎng)貓的用戶的需求。此類產(chǎn)品結(jié)合終端側(cè)模型,能夠使機(jī)器人更加理解用戶,實(shí)現(xiàn)情感交流,為用戶帶來巨大的情感價(jià)值。
李大海認(rèn)為,盡管現(xiàn)在很多方案依舊采用云上模型,但當(dāng)端側(cè)模型可以應(yīng)用后,設(shè)備成本會(huì)更低,且可靠性更高,不需要依賴網(wǎng)絡(luò),在用戶需求交流時(shí),基于端側(cè)模型的陪伴機(jī)器人能夠迅速作出反應(yīng)?;谶@種比較優(yōu)勢(shì),在適用端側(cè)模型的場景中,大家會(huì)更傾向于選擇端側(cè)解決方案。
目前,端側(cè)模型在特定場景下,已經(jīng)完全可控,但何時(shí)能夠大規(guī)模應(yīng)用?
李大海介紹,相同智能水平的模型,每8個(gè)月其參數(shù)規(guī)模將減少一半,這與摩爾定律具有一定的相似性。在同等性能下,參數(shù)規(guī)??s小,說明大模型的知識(shí)密度在不斷提高。
他表示,大模型知識(shí)密度提升、端側(cè)算力增強(qiáng)這兩個(gè)因素疊加,面壁智能有信心在2026年底前研發(fā)出達(dá)到GPT-4水平的端側(cè)模型,當(dāng)端側(cè)模型能夠?qū)崿F(xiàn)GPT-4水平時(shí),很多端側(cè)的產(chǎn)品會(huì)更快落地。
對(duì)于全球已問世大模型各自的優(yōu)勢(shì),李大海認(rèn)為,當(dāng)前大模型已經(jīng)成為主流技術(shù)共識(shí),在這一大方向下,有更多細(xì)分的方向在探索。從構(gòu)建最大、最智能模型的維度而言,我國整體相較于最先進(jìn)水平還存在一定的差距,這主要由資金投入、算力供應(yīng)、基礎(chǔ)設(shè)施建設(shè)的重視程度等因素共同決定。
與此同時(shí),我國在很多領(lǐng)域也有自己的創(chuàng)新與探索,大家各有特點(diǎn)。長期來看,中國擁有豐富的數(shù)據(jù)資源,而數(shù)據(jù)是第一性質(zhì)的能力,優(yōu)質(zhì)的數(shù)據(jù)是構(gòu)建優(yōu)質(zhì)大模型的重要因素。
李大海表示,中國在很多方向上都有自己的創(chuàng)新跟突破。“在大模型這個(gè)領(lǐng)域,現(xiàn)在它不是獨(dú)木橋,需要大家協(xié)同創(chuàng)新,創(chuàng)造更新更大的價(jià)值。”
圖片來源:視覺中國
在開源與閉源之爭中,面壁智能是堅(jiān)定的開源派。
李大海在采訪中也表示,會(huì)堅(jiān)定地堅(jiān)持開源。他認(rèn)為:“開源跟商業(yè)模式有相關(guān)性,在我們看來,開源閉源其實(shí)只是商業(yè)模式其中的一部分。”
李大海表示,端側(cè)模型本身參數(shù)相對(duì)受限,因此目前它的技能點(diǎn)是有限的,尚不能與GPT-4相提并論,這是一個(gè)過程。在當(dāng)前任何一個(gè)場景下,廠商如果需要提供足夠優(yōu)質(zhì)的解決方案,就需要針對(duì)該場景進(jìn)行定制化的訓(xùn)練,開源一個(gè)通用的模型后,仍需通過訓(xùn)練使其適應(yīng)各種場景,所以開源并不會(huì)影響其商業(yè)模式;從另一個(gè)方面來說,開源能夠讓更多人去嘗試,這能讓行業(yè)里更多的資源和注意力關(guān)注到端側(cè),這對(duì)行業(yè)發(fā)展是非常好的事情。
“我覺得這個(gè)世界的魅力就在于它的多樣性。”李大海并不排斥關(guān)于開源閉源的討論。
他解釋道:“就像遺傳算法,我們不同的人有不同的想法。(抱著)不同的想法去做驗(yàn)證,可能對(duì)于某個(gè)個(gè)體來說,驗(yàn)證是失敗,但這個(gè)失敗對(duì)于人類整體來說是有價(jià)值的。最后當(dāng)有人成功時(shí),技術(shù)就會(huì)沿著最短路徑一起往前走。”
以O(shè)penAI最早提到“暴力美學(xué)”為例,李大海表示:最初行業(yè)里很多人其實(shí)并不認(rèn)同,但是當(dāng)它得到了突破,大家就放下自己的偏見。“開源閉源的爭論,我覺得并不是很重要,重要的是不同團(tuán)隊(duì)朝著不同方向,大家各自付出最大的努力,獲得成功以后,其實(shí)也在為人類的邊界做貢獻(xiàn)。”
李大海覺得,開源更像是“螞蟻雄兵”。
閉源模式的優(yōu)勢(shì)在于,如果商業(yè)模式和數(shù)據(jù)飛輪的判斷能夠跑通,其效率可能更高。而開源的優(yōu)勢(shì),是在當(dāng)前技術(shù)及應(yīng)用場景尚不明朗的背景下,“螞蟻雄兵”的開源模式能有更廣泛的創(chuàng)新探索。
剛剛經(jīng)歷的被抄襲事件增加了李大海對(duì)于開源模式的信心,因?yàn)榘l(fā)現(xiàn)這件事的是面壁開源社區(qū)的用戶,隨著事件逐步受到關(guān)注,更多用戶參與進(jìn)來,幫助面壁發(fā)現(xiàn)了更多實(shí)質(zhì)性問題。“如果沒有開源,其實(shí)我們很難干一件事情,所以開源其實(shí)有很強(qiáng)的自凈能力。”
圖片來源:北京智源大會(huì)主辦方提供
李大海認(rèn)為,技術(shù)的發(fā)展,長期里容易被低估,短期里容易被高估。
他解釋說:“大家容易在短期過高地期待它的變化,覺得好像就是‘一日看盡長安花’這種狀態(tài),但其實(shí)它會(huì)有它的規(guī)律,要跟場景結(jié)合。大家要知道這個(gè)技術(shù)的邊界、怎么能夠跟需求的邊界更好地匹配,這個(gè)是需要時(shí)間的。”
李大海認(rèn)同2024年已經(jīng)步入AI應(yīng)用落地元年的觀點(diǎn),在很多場景,AI已經(jīng)在逐步落地;另一方面,從技術(shù)水平的角度看,他認(rèn)為如果三年以后再回顧,會(huì)發(fā)現(xiàn)其實(shí)大模型已經(jīng)改變了千行百業(yè),方方面面其實(shí)都受到了影響,這就是今天正在發(fā)生的事情。
面對(duì)未來可能到來的大模型的洗牌期,李大海主張:“天下武功,唯快不破。”在這樣一個(gè)快速變化的環(huán)境中,公司必須具備足夠迅速的自我迭代能力,不斷審視實(shí)際環(huán)境的變化,并動(dòng)態(tài)調(diào)整自身策略。雖然戰(zhàn)略大方向需要保持穩(wěn)定與定力,但具體的執(zhí)行策略要不斷升級(jí)認(rèn)知,持續(xù)提升方法論。
技術(shù)迭代以及創(chuàng)新商業(yè)可能需要時(shí)日,但市場期待卻往往有其期限。這一輪的人工智能浪潮,是否還會(huì)像過往一樣面臨潮起潮落?
李大海認(rèn)為,答案是否定的。因?yàn)楹芏郃I在現(xiàn)有場景下的落地都已經(jīng)發(fā)生或正在發(fā)生,因此他持樂觀態(tài)度。過去,AI的發(fā)展主要依賴于相關(guān)從業(yè)者的熱情推動(dòng),而這一次,整個(gè)行業(yè)所有的聰明人都會(huì)投入到AI應(yīng)用之中,這是一個(gè)本質(zhì)的變化。“我們相信它是產(chǎn)業(yè)級(jí)別,是一個(gè)所謂的第四次科技革命級(jí)別的變化。”
“最重要的是它讓人們看到了AGI到來的可能性。或者說按當(dāng)前的技術(shù)路線,我們確實(shí)能夠往AGI這個(gè)方向走到最遠(yuǎn),以目前能看到技術(shù)方向,它是能走得最遠(yuǎn)的技術(shù)方向。”李大海表示。
談及面壁智能未來的商業(yè)模式創(chuàng)新問題,李大海表示,從技術(shù)發(fā)展的規(guī)律來講,一般先是技術(shù)創(chuàng)新,然后應(yīng)用創(chuàng)新,再然后才是商業(yè)創(chuàng)新,所以商業(yè)模式創(chuàng)新往往會(huì)落后于技術(shù)和應(yīng)用落地的速度。
具體到面壁智能而言,李大海表示,商業(yè)創(chuàng)新還是要看商業(yè)模式是讓誰受益、誰來交付?,F(xiàn)階段,人工智能技術(shù)的主要作用在于賦能傳統(tǒng)和現(xiàn)有場景,其另一價(jià)值在于創(chuàng)造新場景,這種創(chuàng)新具有顛覆性,同時(shí)需要系統(tǒng)承擔(dān)失敗的可能性。他認(rèn)為,面壁智能不僅在嘗試顛覆性創(chuàng)新,同時(shí)也會(huì)與傳統(tǒng)場景相結(jié)合,為傳統(tǒng)領(lǐng)域賦能,這一發(fā)展方向具有較高的確定性,因此也會(huì)繼續(xù)與合作伙伴共同探討在此方向上的商業(yè)模式探索。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP