每日經(jīng)濟(jì)新聞 2024-07-09 23:22:16
每經(jīng)記者 陳婷 每經(jīng)編輯 董興生
作為全球人工智能領(lǐng)域最具影響力的行業(yè)盛會(huì)之一,世界人工智能大會(huì)(以下簡(jiǎn)稱WAIC)可以被視為觀察人工智能發(fā)展的一個(gè)窗口。WAIC 2024剛剛落幕,據(jù)《每日經(jīng)濟(jì)新聞》記者持續(xù)幾日在大會(huì)現(xiàn)場(chǎng)觀察,多模態(tài)已經(jīng)是當(dāng)之無愧的行業(yè)關(guān)鍵詞之一。
巖芯數(shù)智CEO劉凡平在接受《每日經(jīng)濟(jì)新聞》記者專訪時(shí)表示,就今年而言,大模型的多模態(tài)能力肯定比去年有所進(jìn)步。“但我認(rèn)為,整個(gè)行業(yè)肯定還要再進(jìn)步,目前我們已經(jīng)做到了多模態(tài)的輸入和輸出,距離完全像人一樣地實(shí)時(shí)人機(jī)交互,還要一點(diǎn)時(shí)間。”劉凡平表示,他有一個(gè)更高的目標(biāo):在實(shí)現(xiàn)通用人工智能的同時(shí),將AI與每個(gè)人獨(dú)特的地方結(jié)合在一起,模型具備自主學(xué)習(xí)能力,讓每個(gè)設(shè)備都擁有個(gè)性化的智能。
作為一家以認(rèn)知智能為基礎(chǔ)的創(chuàng)新企業(yè),巖芯數(shù)智Rock AI在今年1月份發(fā)布了全國(guó)首個(gè)非Attention機(jī)制的Yan架構(gòu)通用大模型,開辟了非Transformer架構(gòu)的一條新路徑。這次WAIC,巖芯數(shù)智展示了Yan1.2版本的階段性成果,主要展示Yan架構(gòu)在更廣泛、更低算力設(shè)備上的離線部署及多模態(tài)應(yīng)用能力。
巖芯數(shù)智之外,據(jù)記者了解,今年WAIC期間,不少?gòu)臉I(yè)者強(qiáng)調(diào)了多模態(tài)的重要性。階躍星辰創(chuàng)始人、CEO姜大昕博士表示:“攀登AGI山峰,‘萬億參數(shù)’和‘多模融合’缺一不可。”MiniMax副總裁劉華認(rèn)為,多模態(tài)大模型有望引領(lǐng)新一輪科技革命。
除了熱度居高不下的多模態(tài),今年WAIC,對(duì)于大模型應(yīng)用落地的討論更多元了,對(duì)于安全治理的見解也更深入了。
大模型“百花齊放”
官方資料顯示,今年WAIC大會(huì)展覽面積超5.2萬平方米,500余家知名企業(yè)、超1500項(xiàng)展品參展,50余款新品首發(fā)首秀,均達(dá)歷史最高。此外,近百個(gè)大模型集中展現(xiàn),18臺(tái)人形機(jī)器人矩陣亮相,國(guó)內(nèi)首款全尺寸通用人形機(jī)器人開源公版機(jī)發(fā)布。
“目前來看,具身智能是挺多的。”劉凡平表示,就當(dāng)前來看,具身智能的大腦可能還不夠成熟,“未來,具身智能大腦仍需持續(xù)突破”。
大會(huì)現(xiàn)場(chǎng),巖芯數(shù)智的研發(fā)團(tuán)隊(duì)展示了一款部署Yan1.2多模態(tài)大模型的智能機(jī)器人小智,它基于Yan1.2的語音和視覺處理能力,能實(shí)時(shí)識(shí)別環(huán)境、準(zhǔn)確理解用戶的模糊指令和意圖,并據(jù)此控制其機(jī)械軀體高效完成各類復(fù)雜任務(wù)。
據(jù)記者了解,小智機(jī)器人搭載的核心硬件是以低算力著稱的樹莓派第五代芯片,可在極低算力的設(shè)備上實(shí)現(xiàn)多模態(tài)能力。
現(xiàn)場(chǎng),巖芯數(shù)智的工作人員向記者介紹了小智的能力。面對(duì)記者,它不但能依據(jù)指令向記者鞠躬,還能描述出記者身上穿的衣物特征。此外,小智還有文字類圖像的理解能力?,F(xiàn)場(chǎng),工作人員在小智面前展示了書本的一頁內(nèi)容,很快,小智就能總結(jié)、復(fù)述出書本文字的大致意思。
劉凡平用“百花齊放”形容今年的WAIC。他表示:“當(dāng)大模型真正發(fā)展落地的時(shí)候,其實(shí)不能再用以前的思維和大眾思維思考這個(gè)問題,還是要以未來的視角去思考現(xiàn)在如何演進(jìn)。”
據(jù)記者了解,今年WAIC,創(chuàng)業(yè)公司和大廠各有千秋。
阿里巴巴推出“通義十二時(shí)辰”,展示了對(duì)話、效率、智能體、視覺四個(gè)核心場(chǎng)景中的AI助手能力。此外,快手再次升級(jí)視頻生成大模型“可靈”,騰訊則攜混元大模型及多款A(yù)I應(yīng)用亮相。
與此同時(shí),記者了解到,大會(huì)期間,創(chuàng)業(yè)公司階躍星辰首發(fā)了三款Step系列通用大模型新品:Step-2萬億參數(shù)語言大模型正式版、Step-1.5V多模態(tài)大模型、Step-1X圖像生成大模型。
此外,據(jù)MiniMax副總裁劉華介紹,MiniMax將海螺AI、星野和MiniMax開放平臺(tái)帶到了本次世界人工智能大會(huì)。海螺AI可為用戶分析財(cái)報(bào)、速讀長(zhǎng)文、創(chuàng)作文案,聆聽用戶的想法和煩惱,捕捉、理解用戶情緒。
據(jù)悉,海螺AI背后接入了MiniMax自研的多模態(tài)大模型,包括萬億參數(shù)MoE大語言模型abab6.5、語音大模型和圖像大模型。
關(guān)鍵在自主學(xué)習(xí)能力
在本屆WAIC期間,還出現(xiàn)了不少探討AI未來發(fā)展方向的聲音。劉凡平便有一個(gè)更高的目標(biāo):就是在實(shí)現(xiàn)通用人工智能的同時(shí),將AI與每個(gè)人獨(dú)特的地方結(jié)合在一起,模型具備自主學(xué)習(xí)能力,讓每個(gè)設(shè)備都擁有個(gè)性化的智能。
“我覺得驚艷的突破,不在于模型本身已有的知識(shí)能力。”劉凡平表示。雖說大家現(xiàn)在都在比參數(shù)量,但在他看來,更需要比較的是大模型自主學(xué)習(xí)的能力有多強(qiáng)。
“舉個(gè)例子,小蒼蠅、小壁虎、小兔子,它們的腦容量是不一樣的,但它們都具備智能。”劉凡平認(rèn)為,智能和參數(shù)量沒有直接相關(guān)的關(guān)系,“我認(rèn)為大模型之后的比較方向應(yīng)該是自主學(xué)習(xí)能力”。
劉凡平表示,當(dāng)大模型具備了自主學(xué)習(xí)的智能,才是通用人工智能真正的開始,“現(xiàn)有的并不是(自主學(xué)習(xí)),現(xiàn)有的是一種壓縮算法”。
對(duì)于大模型的未來,MiniMax副總裁劉華也表達(dá)了看法。他認(rèn)為,隨著多模態(tài)大模型技術(shù)的持續(xù)演進(jìn),文本、語音、視覺這三種模態(tài)的融合模型正逐步邁向成熟。一旦此類大模型技術(shù)達(dá)到成熟階段,其應(yīng)用場(chǎng)景將會(huì)進(jìn)一步拓展,實(shí)現(xiàn)更多的實(shí)際應(yīng)用。
劉華認(rèn)為,在短期內(nèi),對(duì)多模態(tài)大模型的大規(guī)模落地應(yīng)用預(yù)期應(yīng)保持審慎態(tài)度,不過從中長(zhǎng)期來看,堅(jiān)決不應(yīng)低估多模態(tài)大模型的重要性,它有望引領(lǐng)新一輪的科技革命。
另據(jù)媒體報(bào)道,曠視科技聯(lián)合創(chuàng)始人、CTO唐文斌接受采訪時(shí)表示,相比語言模型,增加訓(xùn)練數(shù)據(jù)量和參數(shù)量對(duì)于計(jì)算機(jī)視覺模型的提升和收益,目前看并沒有那么大,而多模態(tài)會(huì)是大模型的未來。騰訊集團(tuán)副總裁蔣杰也表示,大模型行業(yè)正經(jīng)歷從單模態(tài)到多模態(tài),再到全模態(tài)的演進(jìn)。
劉凡平也注意到了大模型在多模態(tài)能力上的進(jìn)步,他表示,與去年相比,今年WAIC在智能化也有所提升,但基礎(chǔ)變化還不是很大,硬件層次則更難。他推斷,未來人工智能一定會(huì)走向硬件化,“當(dāng)已經(jīng)完全硬件化的時(shí)候,就是完全可商用的時(shí)候,任何人都可以用得起”。
他認(rèn)為,今后大家可能會(huì)選用一種全新的算法替代現(xiàn)有的Transformer架構(gòu)。Transformer架構(gòu)依賴的算力非常大,同時(shí)數(shù)據(jù)量要求非常高,這兩個(gè)條件限制了它的發(fā)展。
記者發(fā)現(xiàn),雖然大多選擇從B端出發(fā),但很多大模型公司已有面向C端的動(dòng)作。
以階躍星辰為例,其在WAIC現(xiàn)場(chǎng)展示了面向C端用戶的自研產(chǎn)品。據(jù)報(bào)道,階躍星辰副總裁李璟在接受媒體采訪時(shí)表示,目前,C端仍在早期階段,還在進(jìn)行用戶體驗(yàn)的收集和打磨,隨著C端模型能力提升,將產(chǎn)生很強(qiáng)的爆發(fā)力。而B端需求相對(duì)明確和穩(wěn)定,已經(jīng)涌現(xiàn)出非常多的確定性應(yīng)用機(jī)會(huì)。劉華也表示,MiniMax堅(jiān)持To B與To C業(yè)務(wù)并重的發(fā)展策略。
此外,記者從巖芯數(shù)智了解到,公司當(dāng)前商業(yè)化的重心正逐漸從B端部署到C端,以軟硬件結(jié)合的方式搶占C端市場(chǎng)先機(jī)。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP