每日經(jīng)濟(jì)新聞 2024-02-19 23:06:41
每經(jīng)記者 蔡鼎 每經(jīng)編輯 蘭素英
剛剛躋身全球第三大初創(chuàng)公司的OpenAI在中國春節(jié)期間又甩出“王炸”。繼文本模型ChatGPT、圖像模型Dall-E大放異彩后,其最新推出的“文生視頻”技術(shù)Sora又以其“逼真”和“富有想象力”的生成內(nèi)容吸引了廣泛的關(guān)注和討論。
Sora的誕生讓許多行業(yè)既興奮期待又惶恐不安。當(dāng)被問及哪些行業(yè)將面臨顛覆時,一位從事AI大模型研究多年的匿名人士對《每日經(jīng)濟(jì)新聞》記者表示,“首當(dāng)其沖的將是AI視頻、AI圖片賽道上的玩家。Sora的出現(xiàn),意味著視頻生成門檻大幅降低。廣告、影視、短視頻等行業(yè)也會有較大改變。”
然而,出人意料的是,Sora的行業(yè)沖擊尚未顯現(xiàn),美股二級市場卻掀起了一股“腥風(fēng)血雨”。
Sora發(fā)布的次日,美國電腦軟件公司Adobe股價暴跌超7%;美國圖片庫、圖片素材、圖片音樂和編輯工具供應(yīng)商Shutterstock跌超5%;幾周前發(fā)布了“文生視頻”工具Lumiere的谷歌母公司股價下挫1.58%。3家公司一天內(nèi)就合計蒸發(fā)近480億美元(折合人民幣近3500億元)的市值。
OpenAI首個視頻生成模型Sora問世,“引爆”世界科技圈 視覺中國圖
Sora具有碾壓優(yōu)勢
OpenAI官網(wǎng)介紹,Sora是一種擴(kuò)散模型,它從看起來像靜態(tài)噪聲的視頻開始生成視頻,然后通過多個步驟消除噪聲來逐漸對其進(jìn)行轉(zhuǎn)換生成視頻。Sora能夠一次生成整個視頻,或擴(kuò)展生成的視頻。通過一次性為模型提供多個幀的預(yù)見,OpenAI解決了一個具有挑戰(zhàn)性的問題,即確保主題即使暫時離開視野也保持不變。
與GPT模型類似,Sora使用Transformer架構(gòu),建立在過去對DALL-E和GPT模型的研究之上。它使用DALL·E 3的重述技術(shù),該技術(shù)涉及為視覺訓(xùn)練數(shù)據(jù)生成高度描述性的標(biāo)題。因此,該模型能夠更精準(zhǔn)遵循生成用戶的文本指令。
《每日經(jīng)濟(jì)新聞》記者注意到,大多數(shù)主要的AI公司多年來一直在研究“文生視頻”工具,一些公司已經(jīng)發(fā)布用戶可以使用的軟件。在Sora發(fā)布之前,最新版本的Runway就是最先進(jìn)的“文生視頻”技術(shù),可以根據(jù)文本提示制作短視頻。
從OpenAI發(fā)布的演示視頻看,Sora生成的視頻有絲滑的移動運鏡、場景轉(zhuǎn)換,還可以自行分鏡、切換景別,這意味著Sora可能讓普通人以極低的門檻制作自己的電影。更值得一提的是,此前的文生視頻模型,由于是生成單鏡頭,一旦輸入新提示詞,就會生成新鏡頭,主角就會變換,而Sora生成的視頻,在視角轉(zhuǎn)換、鏡頭景別切換后,仍保持主體的一致性。
中信建投認(rèn)為,Sora采用擴(kuò)散模型+Transformer模型,通過一定的數(shù)據(jù)處理實現(xiàn)了更為廣泛的數(shù)據(jù)集,Sora模型帶來的震撼背后是一次數(shù)據(jù)驅(qū)動下的能力突破?;诤A繑?shù)據(jù)訓(xùn)練的Sora模型同樣觀察到了大語言模型中的涌現(xiàn)現(xiàn)象,Sora能夠深度模擬現(xiàn)實世界中人類、動物和環(huán)境的物理規(guī)律,標(biāo)志著人工智能在理解真實世界場景并與之互動方面邁出了重大的一步,Sora或成為實現(xiàn)通用人工智能的重要里程碑。
談到Sora相較于市面上已有的“文生視頻”類技術(shù)的優(yōu)勢時,一位從事AI大模型研究多年的匿名人士在接受《每日經(jīng)濟(jì)新聞》記者采訪時指出,首先是生成視頻的時長,之前“文生視頻”技術(shù)普遍水平在4秒,Sora現(xiàn)在可以直接1分鐘,時間越長,一致性、連貫性的難度也陡增;其次,Sora可以基于一個提示詞,生成不同角度的視頻,類似現(xiàn)實中的多機(jī)位拍攝,表明它已經(jīng)可以構(gòu)建一個三維的空間;另外,Sora還可以“文生視頻”“圖生視頻”,甚至“視頻生視頻”,可用性明顯增加;最后,Sora似乎展現(xiàn)了模擬真實世界物理規(guī)律的能力,但這一點還有爭議,如果成真,那也就意味著世界向通用人工智能邁出了一大步。
而針對Sora對行業(yè)的沖擊,上述人士對《每日經(jīng)濟(jì)新聞》記者說道:“首當(dāng)其沖的將是AI視頻、AI圖片賽道的玩家,OpenAI在這方面展示了碾壓性實力,算法、算力、數(shù)據(jù)的難度比文本大模型更高,成為同行追趕的硬門檻。Sora的出現(xiàn),意味著視頻生成門檻大幅降低。廣告、影視、短視頻等行業(yè)也會有較大改變,但Sora只是降本增效的工具,核心依然是內(nèi)容創(chuàng)意。”
多家美股公司受沖擊
然而,讓人始料不及的是,Sora的第一波沖擊,卻是在美股二級市場上。
美國電腦軟件公司Adobe在Sora發(fā)布的次日(2月16日)股價暴跌7.41%,創(chuàng)去年11月1日以來新低,市值在短短一個交易日蒸發(fā)近198億美元。
Adobe主要從事多媒體制作類軟件的開發(fā),近年亦開始涉足互聯(lián)網(wǎng)應(yīng)用程序、市場營銷應(yīng)用程序、金融分析應(yīng)用程序等開發(fā)。Adobe開發(fā)的非線性編輯之視頻剪輯軟件,被廣泛用于視頻剪輯等領(lǐng)域。
同日,美國圖片庫、圖片素材、圖片音樂和編輯工具供應(yīng)商Shutterstock跌5.44%,市值一個交易日蒸發(fā)9360萬美元。
公開資料顯示,Shutterstock總部位于紐約,由程序員和攝影師強(qiáng)·歐寧杰于2003年創(chuàng)立,該公司擁有約2億張免版稅的圖片、矢量圖和插圖庫,還有約1000萬個影片剪輯和音樂曲目可授權(quán)給用戶使用。
X(原推特)上有用戶發(fā)帖稱,Shutterstock每年銷售價值約10億美元的庫存照片和視頻,(但現(xiàn)在)人們意識到人工智能生成的視頻和圖像可能會摧毀這個行業(yè)。在這條帖子的下方,特斯拉CEO馬斯克評論表示,“是的”。
此外,美國搜索引擎巨頭谷歌母公司Alphabet當(dāng)日也下跌1.58%,市值一天蒸發(fā)279億美元,且表現(xiàn)落后于微軟(下跌0.72%)、亞馬遜(下跌0.69%)和Meta(上漲2.27%)等美股藍(lán)籌股。
就在OpenAI發(fā)布Sora的幾周前,谷歌才剛發(fā)布視頻生成模型Lumiere。有分析認(rèn)為,強(qiáng)大的Sora讓谷歌的Lumiere顯得相形見絀。股價的下跌凸顯了市場對OpenAI人工智能服務(wù)可能影響谷歌在搜索行業(yè)主導(dǎo)地位的擔(dān)憂,但分析師認(rèn)為,OpenAI正在開發(fā)的搜索產(chǎn)品給Alphabet帶來的風(fēng)險相對較小。
封面圖片來源:視覺中國
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP