每日經(jīng)濟新聞 2024-07-07 22:54:46
每經(jīng)記者 朱成祥 每經(jīng)編輯 楊夏
7月4日至6日,2024世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2024)在上海召開。期間,大模型、算力等多個領(lǐng)域?qū)<野l(fā)表了前瞻性思考。
商湯科技CEO徐立認為,大模型本質(zhì)意義上是在做一個記憶的事情,記住世界的知識。而它僅有的一點點智力,完全是來自于對于知識背后高階的思維邏輯的記憶。所以說,在垂直行業(yè)里,如何構(gòu)造高階思維邏輯的合成數(shù)據(jù),往往是制勝的關(guān)鍵,并且是差異化的關(guān)鍵。這也是中國人工智能之路的關(guān)鍵。
愛芯元智創(chuàng)始人、董事長仇肖莘則認為,大模型真正大規(guī)模落地需要云、邊、端三級緊密結(jié)合,而邊緣側(cè)和端側(cè)結(jié)合的關(guān)鍵在于AI計算與感知。
2024世界人工智能大會現(xiàn)場人潮涌動。
突破大模型應用障礙
關(guān)于大模型應用落地,徐立表示,行業(yè)要進行變化,交互模式一定是先行的。實時的交互性能夠帶來一個流暢的體驗,也是推動超級時刻以及應用變化的核心。對于GPT-4o的發(fā)布,外界感觸最深的是它可以實時地跟人進行交互,從而重新定義了人機交互界面。
另外,阻礙大模型落地的一大因素是“大模型幻覺”。
MiniMax創(chuàng)始人、首席執(zhí)行官閆俊杰強調(diào)要降低錯誤率。其表示,ChatGPT出來之后,國內(nèi)很多公司也在迎頭趕上,推出了很多模型。最核心的問題是,目前模型的錯誤率還是比較高的。比如GPT-4,它在很多測試指標上正確率可能只有60%、70%,即有30%到40%的錯誤率。國內(nèi)的模型,錯誤率整體上在60%到70%之間。
閆俊杰補充表示,為什么大模型的產(chǎn)品是對話形式?因為對話的容錯率比較高。為什么不能成為一個獨立的Agent(代理人)?因為每一步都有30%到40%的錯誤率。因此,最核心的問題是怎么把大模型的錯誤率從30%、40%,降低到3%、4%、2%,降低一個數(shù)量級。這將是AI從一個輔助人類的工具到能獨立完成工作最核心的標志。
智譜AI首席執(zhí)行官張鵬則認為,準確率是一個方面,一般說準確率的時候,大多數(shù)是限定在一些評測或者任務上,就看數(shù)值性的量化評測,但有些東西其實很難量化,比如說邏輯性,抽象思考的能力。張鵬強調(diào),這些恰恰是現(xiàn)在的模型,比人或者是比傳統(tǒng)的方法更強的地方。
張鵬認為,現(xiàn)在很重要的點是突破大模型的多模態(tài)。因為真正的人在現(xiàn)實世界解決問題的時候,他需要輸入的信息本身就是多模態(tài)的,除了自然語言以外還有視覺、聽覺、觸覺,所有這些是需要綜合起來才能解決現(xiàn)實世界當中很多常見的問題,甚至不是復雜問題,都是常見問題。比如說掃地、做飯、洗衣服這些任務,它所需要輸入的信息是多模態(tài)的,這些方面能力的突破會帶來AI的普惠。
關(guān)于工業(yè)大模型的應用,香港工業(yè)人工智能及機械人研發(fā)中心(FLAIR)總裁黎少斌對《每日經(jīng)濟新聞》記者表示:“當我們有更多的數(shù)據(jù),可以訓練工業(yè)用的大模型。彼時,我們可以直接去問設(shè)備,你的狀態(tài)怎么樣?有沒有什么不妥當?設(shè)備就可以回一個答案,比如‘我發(fā)現(xiàn)可能某個設(shè)備有一點點問題,我應該還能堅持一個星期,你想想如何安排更換,做一個預維護’。”
其補充表示:“我們想把大模型技術(shù)與我們的一些解決方案結(jié)合起來,讓以后車間設(shè)備與人之間的溝通,會更像人與人之間的溝通。”
云側(cè)+端側(cè)算力配合
目前在大模型應用方面,也開始更加強調(diào)云側(cè)與端側(cè)算力的配合。
徐立認為,如果所有的資源都聚焦在云端,會帶來推理成本的大幅度增長,以及推理效率的下降,因為網(wǎng)絡的擁擠,勢必會帶來服務的不流暢。商湯科技在端側(cè)上加大了模型的優(yōu)化,提升了10%的性能精度,除此之外,速度有大規(guī)模提升,成本有大幅度下降。首包延遲下降40%,推理效率提升了15%。
愛芯元智創(chuàng)始人、董事長仇肖莘認為,智能芯片和多模態(tài)大模型已經(jīng)成為人工智能時代的“黃金組合”,當大模型的應用日益廣泛,更經(jīng)濟、更高效、更環(huán)保將會成為智能芯片的關(guān)鍵詞,而搭載AI處理器的高效推理芯片將是大模型落地更合理的選擇,這也是推進普惠AI的關(guān)鍵所在。
面壁智能副總裁賈超認為,憑借在成本、隱私、延時性、可靠性等方面的優(yōu)勢,端側(cè)AI發(fā)展會成為全球趨勢,這也意味著大模型正式進入輕量化時代。這一背景下,“模型知識密度,平均每8個月提升1倍”將會成為大模型時代的新摩爾定律。賈超強調(diào),企業(yè)開發(fā)端側(cè)大模型需要從算法側(cè)和芯片側(cè)雙向奔赴,讓端側(cè)模型用端側(cè)芯片,在用戶場景上高效落地,這樣才能給用戶帶來最極致的體驗。
封面圖片來源:主辦方供圖
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP