每日經(jīng)濟(jì)新聞 2024-12-14 14:03:13
◎ 本周,AI界展開(kāi)“軍備賽”,OpenAI、谷歌和馬斯克旗下xAI等科技巨頭相繼發(fā)布重磅AI產(chǎn)品,引發(fā)業(yè)界關(guān)注。這些創(chuàng)新涵蓋了AI視頻生成、多模態(tài)輸出和屏幕共享等多個(gè)領(lǐng)域。在第七天的活動(dòng)上,OpenAI還故意放了個(gè)AGI(通用人工智能)的“彩蛋”。隨著AI大廠之間的競(jìng)爭(zhēng)日趨白熱化,2025年AI的發(fā)展將呈現(xiàn)什么新的趨勢(shì)呢?《每日經(jīng)濟(jì)新聞》記者采訪復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院副教授鄭驍慶進(jìn)行解讀。
每經(jīng)記者 鄭雨航 每經(jīng)實(shí)習(xí)記者 宋欣悅 岳楚鵬 每經(jīng)編輯 蘭素英
本周,一場(chǎng)激烈的“軍備競(jìng)賽”在AI界上演。
OpenAI自12月5日開(kāi)啟的12天特別活動(dòng)已經(jīng)過(guò)去了一半,期間發(fā)布了不少驚喜,包括期待已久的AI視頻生成模型Sora、解鎖高級(jí)視頻對(duì)話和屏幕共享的ChatGPT,以及ChatGPT接入蘋(píng)果“全家桶”,賺足了外界的眼球。在第七天的活動(dòng)上,OpenAI還故意放了個(gè)“彩蛋”:一個(gè)項(xiàng)目標(biāo)注著“AGI(即通用人工智能,請(qǐng)勿現(xiàn)場(chǎng)演示)”,吸引了大量關(guān)注。
科技巨頭谷歌、馬斯克旗下xAI自然不會(huì)坐以待斃,也競(jìng)相發(fā)布新產(chǎn)品。尤其是谷歌新推出的人工智能大模型Gemini 2.0 Flash,除了能生成文字外,還能直接生成圖片和語(yǔ)音,而且延遲還特別低。
在一系列新品的“轟炸”之下,用戶也是激動(dòng)不已,紛紛涌入各大平臺(tái),希望搶得一手體驗(yàn)。哪知道,ChatGPT、Sora,以及Meta的一系列產(chǎn)品卻在本周出現(xiàn)了全球范圍的宕機(jī),持續(xù)了數(shù)小時(shí),讓用戶叫苦不迭。但OpenAI和Meta都沒(méi)有詳細(xì)說(shuō)明服務(wù)中斷的原因,但據(jù)猜測(cè),這與算力和服務(wù)器的需求激增有關(guān)。有行業(yè)人士介紹,在大模型時(shí)代,算力需求每2個(gè)月就要翻倍。
隨著AI大廠之間的競(jìng)爭(zhēng)日趨白熱化,2025年AI的發(fā)展將呈現(xiàn)什么新的趨勢(shì)呢?復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院副教授鄭驍慶在接受《每日經(jīng)濟(jì)新聞》采訪時(shí)表示,“個(gè)性化”將是關(guān)鍵詞之一。
借著12天12場(chǎng)的新品活動(dòng),OpenAI在科技界掀起了一場(chǎng)前所未有的波瀾。xAI和谷歌自然也不會(huì)缺席這場(chǎng)盛宴,也相繼發(fā)布新產(chǎn)品,在這場(chǎng)年末狂歡中刷了一波存在感。
圖片來(lái)源:每經(jīng)制圖
截至目前,OpenAI的這場(chǎng)圣誕特別活動(dòng)已經(jīng)過(guò)去一半,期間發(fā)布的產(chǎn)品不乏重磅之作,例如被OpenAI稱為“今年最重要的AI功能之一”的Projects In ChatGPT、等了300天才上線的視頻生成模型Sora 和“裝上眼睛”的ChatGPT。
Sora與今年2月發(fā)布的預(yù)覽版相比,則增加了文本生成視頻、動(dòng)畫(huà)圖像和混合視頻等功能。用戶可生成分辨率高達(dá)1080p、時(shí)長(zhǎng)最長(zhǎng)為20秒的視頻。此外,用戶還可以導(dǎo)入自己的素材,用于擴(kuò)展、重新混合或融合內(nèi)容,甚至直接從文本生成全新的視頻。
知名數(shù)碼科技博主馬克·布朗利(Marques Brownlee)表示,Sora在風(fēng)景鏡頭處理方面表現(xiàn)出色,能生成媲美專業(yè)素材的無(wú)人機(jī)航拍鏡頭。然而,這款產(chǎn)品仍存在一些局限性。比如,在物理模擬方面,模型對(duì)物體運(yùn)動(dòng)的理解還不夠深入,常常出現(xiàn)動(dòng)作不自然、物體突然消失等問(wèn)題。
ChatGPT的高級(jí)語(yǔ)音(Advanced Voice)模式也無(wú)疑是一大“王炸”,不僅支持實(shí)時(shí)視頻通話,還能實(shí)時(shí)共享屏幕和上傳圖像。這一技術(shù)迭代使得ChatGPT不僅能聽(tīng)會(huì)說(shuō),還解鎖了視覺(jué)能力,通過(guò)攝像頭睜眼“看”世界,可以說(shuō)“人味”十足。
在強(qiáng)化AI視覺(jué)理解能力方面取得進(jìn)展的還有谷歌。在ChatGPT高級(jí)語(yǔ)音模式發(fā)布的前一天,多次在新品發(fā)布上遭遇OpenAI狙擊的谷歌也“放了大招”,官宣了新模型Gemini 2.0系列的“先頭兵”——Gemini 2.0 Flash。憑借強(qiáng)大的多模態(tài)輸出功能和良好的用戶體驗(yàn),Gemini 2.0總算是給谷歌扳回了一局。
有科技博主體驗(yàn)后直接驚呼:這絕對(duì)是世界上首個(gè)真正把語(yǔ)音 + 視覺(jué)全模態(tài)能力做到實(shí)時(shí)、無(wú)卡頓感交互的AI模型。
面對(duì)競(jìng)爭(zhēng)對(duì)手的強(qiáng)勁勢(shì)頭,OpenAI在接下來(lái)的活動(dòng)中還將釋放什么驚喜呢?
在第七天(12月14日)的發(fā)布會(huì)上,OpenAI埋了個(gè)“彩蛋”:一個(gè)項(xiàng)目標(biāo)注著“AGI(請(qǐng)勿現(xiàn)場(chǎng)演示)”,吸引了大量關(guān)注。此外,在用于演示的iPhone上,還似乎設(shè)置了一個(gè)名為“超級(jí)秘密AGI”的日歷活動(dòng),進(jìn)一步增添了神秘色彩。
而在11日,OpenAI研究人員卡琳娜·阮(Karina Nguyen)在社交平臺(tái)上發(fā)布帖子時(shí)附上了一張新功能展示界面截圖,界面上出現(xiàn)了一個(gè)陌生的名字——ChatGPT ε。網(wǎng)友猜測(cè),這極可能就是之前被傳出的下一代模型“獵戶座”(Orion)。網(wǎng)友還給出了“充分”的理由:天文學(xué)中,獵戶座腰帶上的中心恒星Anilam,用巴耶命名法表示正是獵戶座ε。
圖片來(lái)源:Reddit
新產(chǎn)品發(fā)布如火如荼,渴望搶先體驗(yàn)的用戶也躍躍欲試。然而,讓人意想不到的是,OpenAI和Meta旗下產(chǎn)品卻出現(xiàn)了全球范圍的服務(wù)中斷。
當(dāng)?shù)貢r(shí)間12月11日下午3點(diǎn)左右,ChatGPT、Sora及API開(kāi)始出現(xiàn)中斷。15分鐘后,OpenAI在X平臺(tái)上致歉。直到晚上9點(diǎn),OpenAI才宣布基本恢復(fù)了服務(wù)。
圖片來(lái)源:X平臺(tái)截圖
中斷期間,一些用戶不停發(fā)出抱怨之聲,稱OpenAI嚴(yán)重耽誤了他們的工作了。有用戶不無(wú)調(diào)侃地表示:“ChatGPT宕機(jī)了,我現(xiàn)在不得不像個(gè)山頂洞人一樣備戰(zhàn)期末考試。”
而在ChatGPT和Sora宕機(jī)前約6小時(shí),Meta旗下多個(gè)產(chǎn)品也出現(xiàn)“宕機(jī)”。上午10點(diǎn),中斷數(shù)據(jù)追蹤網(wǎng)站Downdector報(bào)告的Facebook中斷數(shù)量激增至超過(guò)九萬(wàn)七千份,Instagram的中斷報(bào)告數(shù)量激增至六萬(wàn)七千份以上,其他Meta產(chǎn)品也出現(xiàn)了不同程度上的中斷。數(shù)小時(shí)后,問(wèn)題得以解決。
圖片來(lái)源:X平臺(tái)截圖
OpenAI和Meta都沒(méi)有詳細(xì)說(shuō)明服務(wù)中斷的原因,但有人猜測(cè)與算力和服務(wù)器的需求激增有關(guān)。
本周早些時(shí)候,Sora 一經(jīng)開(kāi)放便吸引了大量用戶,導(dǎo)致服務(wù)器一度被“擠爆”。許多注冊(cè)用戶無(wú)法生成視頻,并收到一條消息,稱“OpenAI的服務(wù)器已滿負(fù)荷”。
算力資源的不足在AI領(lǐng)域已經(jīng)不是什么新鮮話題。有行業(yè)人士介紹,在“深度學(xué)習(xí)”時(shí)代之前,算力需求每24個(gè)月翻倍;在“深度學(xué)習(xí)”時(shí)代,算力需求每3至4個(gè)月翻倍;在大模型時(shí)代,算力需求每2個(gè)月就要翻倍。
目前,算力需求和算力基礎(chǔ)設(shè)施存在供需缺口。上個(gè)月,阿爾特曼就曾透露,由于計(jì)算能力的明顯短缺,GPT-5的發(fā)布將被推遲至明年。
隨著AI大廠之間的競(jìng)爭(zhēng)日趨白熱化,2025年AI的發(fā)展將呈現(xiàn)什么新的趨勢(shì)呢?
復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院副教授鄭驍慶在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,“個(gè)性化”將是2025年AI發(fā)展的關(guān)鍵詞之一。
他對(duì)記者補(bǔ)充稱,要實(shí)現(xiàn)個(gè)性化和數(shù)據(jù)隱私之間的平衡,云+端的協(xié)作模式將成AI發(fā)展的趨勢(shì)。如果所有數(shù)據(jù)都在云端,會(huì)消耗大量算力。未來(lái),需要快速響應(yīng)的、涉及個(gè)人隱私的數(shù)據(jù)可能會(huì)在端側(cè)(如PC、智能手機(jī)),而需要更強(qiáng)計(jì)算能力才能解決的復(fù)雜問(wèn)題,會(huì)上傳至云端進(jìn)行計(jì)算。
美國(guó)硅谷風(fēng)險(xiǎn)投資公司a16z近期綜合公司50位合伙人洞察而發(fā)布的“Big Ideas in Tech for 2025”報(bào)告也對(duì)明年AI領(lǐng)域的發(fā)展進(jìn)行了展望。
Justine Moore表示,AI將成為你的“第二大腦”。借助大語(yǔ)言模型(LLMs),每天產(chǎn)生的大量數(shù)字信息可以被整合為一個(gè)“數(shù)字大腦”。在未來(lái),AI將成為一個(gè)無(wú)限記憶庫(kù),記錄我們的想法,提供建議,指導(dǎo)個(gè)人成長(zhǎng)。AI可以整理總結(jié)信息,生成數(shù)字日記,幫助我們進(jìn)行更明智的決策。
而James da Costa提到,2025年,每個(gè)白領(lǐng)都將有一個(gè)AI助手幫助處理繁瑣任務(wù),讓人們專注于更具創(chuàng)造性或戰(zhàn)略性的工作。未來(lái),某些角色可能幾乎完全由AI agents(智能體)自動(dòng)化完成。
Sarah Wang認(rèn)為,2025年將是AI原生應(yīng)用層崛起的一年。在大多領(lǐng)域內(nèi),最佳的創(chuàng)始團(tuán)隊(duì)本質(zhì)是應(yīng)用AI的工程團(tuán)隊(duì)。他們探索與模型互動(dòng)的最佳方法,以解決客戶“最后一公里”難題。成功的AI應(yīng)用可能會(huì)結(jié)合多個(gè)大模型+自訓(xùn)練的小模型,提供從通用到有價(jià)值的AI體驗(yàn)。未來(lái)成功的AI應(yīng)用公司,絕不會(huì)被簡(jiǎn)單視為“GPT套殼”。
Guido Appenzeller則表示,生成式AI將無(wú)處不在,AI不再僅運(yùn)行在云端大服務(wù)器,也會(huì)運(yùn)行在小型設(shè)備和應(yīng)用上。
封面圖片來(lái)源:視覺(jué)中國(guó)-VCG31N2008742366
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP