每日經(jīng)濟(jì)新聞 2024-02-22 13:27:58
Sora的橫空出世將為人工智能產(chǎn)業(yè)鏈帶來怎樣的機(jī)遇和發(fā)展?
每經(jīng)記者 謝陶 每經(jīng)編輯 唐元
如果說,去年是語言大模型ChatGPT的“時代”,那么今年開年的首個“王炸”必定是文生視頻模型Sora,其憑借出色的視頻制作能力瞬間“點燃”科技圈與投資圈。
據(jù)OpenAI官網(wǎng)介紹,Sora能夠生成具有多個角色、特定類型的運(yùn)動以及主體和背景的、細(xì)節(jié)準(zhǔn)確的復(fù)雜場景,該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的“存在方式”。業(yè)界普遍認(rèn)為,Sora的面世將對AI產(chǎn)業(yè)鏈帶來歷史性的變革機(jī)遇。
機(jī)構(gòu)人士指出,以Sora為代表的文生視頻模型極大縮短了AGI(通用人工智能)時代到來的時間。隨著多模態(tài)大模型逐步升級,算力需求將呈現(xiàn)指數(shù)級增長,下游應(yīng)用有望百花齊放,推動應(yīng)用領(lǐng)域生產(chǎn)力價值釋放。
那么,Sora的橫空出世將為人工智能產(chǎn)業(yè)鏈帶來怎樣的機(jī)遇和發(fā)展?如何看待中美之間在人工智能領(lǐng)域的發(fā)展差異?為此,《圍爐談文創(chuàng)》欄目本期邀請到三位來自不同細(xì)分領(lǐng)域、分別活躍于成都、深圳、北京的技術(shù)大咖分享他們最新的感受與觀察。
作為中國最大運(yùn)動社交和賽事服務(wù)平臺——咕咚的創(chuàng)始人,申波是一名不折不扣的“技術(shù)狂人”,崇拜“MySQL之父”Monty和馬斯克,關(guān)注全球最新的技術(shù)及產(chǎn)品趨勢。
他的辦公桌上總是堆滿了各種技術(shù)類書籍,從Stable Diffusion,到DeepMind,再到ChatGPT,他都能信手拈來。他在朋友圈笑言,“以后退休了,得找個面朝大海春暖花開的大院子coding(編程)。”
談及Sora對行業(yè)的影響,申波表示,“OpenAI開發(fā)的文本到視頻生成器Sora,有潛力顯著影響依賴視覺內(nèi)容的多個行業(yè),特別是影視娛樂、教育和營銷行業(yè)。”
就運(yùn)動健康應(yīng)用領(lǐng)域而言,申波告訴《每日經(jīng)濟(jì)新聞》記者,“Sora能夠以新穎的方式吸引用戶,將鍛煉描述或健康提示轉(zhuǎn)化為引人入勝、易于跟隨的視頻。這將通過提供動態(tài)的互動內(nèi)容來增強(qiáng)用戶體驗,比單純的文本或靜態(tài)圖像更有效地激勵和指導(dǎo)用戶。”
相比較Runway和Pika等類似產(chǎn)品,申波指出,“與早期主要關(guān)注生成短片的模型不同,Sora旨在生產(chǎn)長達(dá)一分鐘的高細(xì)節(jié)視頻,并致力于在視頻長度上保持連貫性。此外,由于Sora能創(chuàng)造更引人入勝、更全面的內(nèi)容,這可能使其在提供更豐富用戶內(nèi)容方面具有區(qū)別于其他工具的優(yōu)勢。本質(zhì)上說Sora是一個‘世界模擬器’ 而不僅僅是文本生成視頻工具。”
談及近年中美在人工智能領(lǐng)域不同的發(fā)展特點和重點,申波向每經(jīng)記者分析道,“美國公司如OpenAI和Google DeepMind在生成式AI技術(shù)方面取得了重大進(jìn)展,例如ChatGPT和DALL-E,這些技術(shù)引領(lǐng)了市場和技術(shù)趨勢。中國則在應(yīng)用研發(fā)和商業(yè)化方面顯示出新的進(jìn)展,特別是AI在教育、健康、零售和安全等領(lǐng)域的應(yīng)用。中美之間的主要差異可能在于創(chuàng)新的焦點、市場應(yīng)用的速度和政策環(huán)境。”
目前,中國在生成式AI領(lǐng)域有哪些走在比較前面的應(yīng)用場景和玩家?申波表示,“國內(nèi)無論是大模型還是應(yīng)用方面,都快速涌現(xiàn)出了一系列的創(chuàng)業(yè)公司,如百川智能,當(dāng)然巨頭也參與其中了,包括百度、阿里、騰訊等等。而且近日OPPO和魅族都發(fā)布了ALL IN AI的戰(zhàn)略,全力開發(fā)推廣AI手機(jī)。所以我覺得中國公司會在AI硬件和應(yīng)用方面快速發(fā)展并引領(lǐng)行業(yè),在大模型基座以及中文大模型上面縮小并趕上美國的水平。”
長期活躍于粵港澳大灣區(qū)的龔銀(Neil),曾任OnePlus平臺中心副總裁、創(chuàng)始團(tuán)隊高管,現(xiàn)任安克創(chuàng)新CIO,他對分布式系統(tǒng)、高性能高可靠系統(tǒng)、云計算等領(lǐng)域保持著持續(xù)關(guān)注和實踐。
談及Sora的橫空出世,龔銀表示,“這將給游戲、短視頻、影視、廣告和元宇宙等高品質(zhì)視頻內(nèi)容制作的行業(yè)帶來直接沖擊。”
在龔銀看來,Sora與此前市面上的同類產(chǎn)品相比擁有諸多優(yōu)勢。“Sora生成內(nèi)容的質(zhì)量更好,(尤其是在)復(fù)雜場景、角色表情、復(fù)雜的鏡頭運(yùn)動等方面穩(wěn)定性、一致性更好,三維空間的連貫性比較好,沒有斷層或抽離感。視頻長度進(jìn)一步擴(kuò)展,支持60S逼真視頻,基本可商用,可以生成類似游戲等互動類數(shù)字內(nèi)容,想象空間更廣泛。”
從技術(shù)架構(gòu)上看,龔銀分析道,“Transformer架構(gòu)具備更好的學(xué)習(xí)性和擴(kuò)展性,涌現(xiàn)能力更強(qiáng)。而runway和pika更多還是依靠圖像轉(zhuǎn)幀方式,連續(xù)性還未得到驗證。我們在2023年就一直嘗試runnway來制作和生成視頻,但其穩(wěn)定、一致性和可商用能力其實還是很弱,Sora的出現(xiàn)一下子解決了這些問題。”
就消費(fèi)電子行業(yè)來說,龔銀直言,“特別是我們涉及全球各區(qū)域電商平臺或線上平臺,依靠大量廣告和內(nèi)容來獲取流量和打造品牌,Sora的出現(xiàn)對我們行業(yè)的影響利弊各半,一方面,內(nèi)容的制作成本大幅下降,效率得到了質(zhì)的提升,同時也有希望實現(xiàn)千人千面的內(nèi)容;另一方面,大量內(nèi)容的出現(xiàn)會稀釋掉用戶的注意力,品牌想通過內(nèi)容獲取用戶心智的難度更大了。”
事實上,從ChatGPT開啟生成式AI時代,到國內(nèi)一眾玩家開啟“百模大戰(zhàn)”,再到今天Sora的橫空出世,中美在人工智能領(lǐng)域呈現(xiàn)出較大的發(fā)展差異。
“從已有的結(jié)果上看,美國在創(chuàng)新能力、創(chuàng)新環(huán)境、創(chuàng)新能力工程化和市場化等各方面能力目前還是全球最強(qiáng)的,”龔銀表示。
龔銀還指出,“國內(nèi)模仿能力強(qiáng),業(yè)務(wù)應(yīng)用層場景豐富。在具備基礎(chǔ)設(shè)施和能力的前提下,在AI應(yīng)用層面會有一些創(chuàng)新和突破。另外,國內(nèi)擅長在已有創(chuàng)新的基礎(chǔ)上集中資源辦大事,需要的是一些時間。”
談及國內(nèi)比較成熟的生成式AI應(yīng)用場景和玩家時,龔銀認(rèn)為,“(目前)還沒有看到特別成功的,一些品牌和電商其實都在摸索。在營銷領(lǐng)域,大部分還是在文生圖、文生文等方面做一些場景的嘗試,比如運(yùn)營活動的文案和圖片、產(chǎn)品場景圖、多語言翻譯、多語言自動生成等;在研發(fā)領(lǐng)域,大部分是在嘗試代碼輔助編寫,類似github和copilot。應(yīng)用最多的還是在客服領(lǐng)域,自動服務(wù)機(jī)器人,大部分公司都有在嘗試,還有一些類似AI Agent之類的應(yīng)用場景。”
史海峰曾任貝殼金服小微企業(yè)生態(tài)CTO、餓了么北京研發(fā)中心總經(jīng)理,也曾在神州數(shù)碼、亞信聯(lián)創(chuàng)長期從事電信行業(yè)業(yè)務(wù)支撐系統(tǒng)集成工作,參與中國移動、中國聯(lián)通多個項目,具有豐富的大型業(yè)務(wù)系統(tǒng)研發(fā)實施經(jīng)驗。
在20余年的工作歷程中,史海峰以架構(gòu)師的身份活躍于IT圈,曾獲騰訊云最具價值專家(TVP),開設(shè)了《IT民工閑話》公眾號,常自侃“大叔級 IT 民工”。
史海峰指出,最新發(fā)布的Sora其驚艷之處不僅僅在于時間,還包括空間的延伸、視角的變換,需要“腦補(bǔ)”更多細(xì)節(jié),體現(xiàn)了對場景時空更強(qiáng)的理解和推測能力。
“從文字生成文字,再到文字生成圖片是一個飛躍,從圖片到生成目前的無聲視頻(或者從單幀視頻到多幀),似乎還挺順理成章。什么時候通過音頻能夠把空間進(jìn)一步體現(xiàn),那會比現(xiàn)在更加驚艷,另一個維度則是實時交互。再往后大概又是AR、VR、元宇宙了。”
“作為提升生產(chǎn)力、降低成本門檻的工具,從C端和B端分別看的話,對UGC和PGC都會產(chǎn)生影響,到底有多大沖擊還很難判斷。在純CG動畫方面,可能大幅降低制作成本。如果支持對視頻的加工再創(chuàng)作,在短視頻、影視制作方面也可能帶來新的模式,會涉及到影視、廣告、社交、教育、游戲等行業(yè)。(同時)也會給反詐、維護(hù)知識產(chǎn)權(quán)帶來更高要求,”史海峰告訴記者。
談及中美在人工智能領(lǐng)域的發(fā)展差異,史海峰表示,“在AI時代,芯片是基座,數(shù)據(jù)是生產(chǎn)要素,是訓(xùn)練AI的養(yǎng)料,而最重要的是人才。(人工智能)競爭門檻高、迭代快,在達(dá)到技術(shù)上限前,不適合彎道超車或者體現(xiàn)后發(fā)優(yōu)勢,我們必須要追趕,并腳踏實地。”
本文作者系天府文創(chuàng)云記者謝陶,轉(zhuǎn)載合作相關(guān)可搜索“天府文創(chuàng)云”公眾號。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP