每日經(jīng)濟新聞 2024-09-02 21:02:50
◎MiniMax音樂生成模型與視頻生成模型已經(jīng)在開放平臺和“海螺AI”網(wǎng)頁版上線。作為創(chuàng)業(yè)公司,MiniMax會不可避免地與大廠進行正面競爭。對此,閆俊杰表示:“當(dāng)開始意識到那些比你大好多倍的公司都開始跟你競爭的時候,就意識到有些東西是沒用的,因為在那些東西上,大廠比你強百倍千倍,我們能做的就是(把)有可能變強的事無限地放大?!?/p>
每經(jīng)記者 陳婷 每經(jīng)編輯 文多
向來低調(diào)的AI獨角獸企業(yè)“MiniMax”公布了最新的業(yè)務(wù)進展。
在周末(8月31日)舉行的“2024 MiniMax Link伙伴日”活動上,MiniMax創(chuàng)始人閆俊杰宣布推出音樂生成模型與視頻生成模型。
圖片來源:每經(jīng)記者 陳婷 攝
在接受包括《每日經(jīng)濟新聞》等媒體的記者采訪時,閆俊杰表示,在視頻方面,這次MiniMax取得了很大的進展。“這個東西只是我們的第一版,很快還會有更新的版本,我們的策略是再等一兩周,等新的東西出來,到了一個更加滿意的狀態(tài)之后,可能會考慮一些商業(yè)化,把好的技術(shù)開放給廣大的開發(fā)者和B端客戶使用。” 閆俊杰介紹說。
MiniMax音樂生成模型與視頻生成模型已經(jīng)在開放平臺和“海螺AI”網(wǎng)頁版上線。此外,記者從MiniMax處了解到,采用新一代技術(shù)的“abab7”系列文本模型也將于未來數(shù)周內(nèi)正式發(fā)布。
在海螺AI網(wǎng)頁版,記者體驗了視頻生成模型。輸入一段簡單的創(chuàng)意描述內(nèi)容之后,該模型可在1到2分鐘內(nèi)輸出一個包含描述內(nèi)容的視頻。
今年5月,MiniMax宣布上架了C端產(chǎn)品“海螺AI”,其1秒內(nèi)可處理近3萬字的文本,進行書籍、長篇報告、學(xué)術(shù)論文等長篇內(nèi)容的閱讀、分析和文本寫作。此外,MiniMax在AI內(nèi)容社區(qū)上已經(jīng)有所建樹。針對國外和國內(nèi)市場,分別推出了“Talkie”和“星野”。
“為什么我們推出比‘可靈’(快手推出的AI創(chuàng)意生產(chǎn)力平臺)要晚一兩個月?”閆俊杰表示,核心在于MiniMax在解決一個更難的技術(shù)問題,即如何“原生訓(xùn)練”算力比較高的東西。
知名風(fēng)投機構(gòu)“a16z”最新發(fā)布的《Top100消費級生成式AI應(yīng)用》移動應(yīng)用榜單中,Talkie位列22位。另據(jù)MiniMax提供的數(shù)據(jù),MiniMax每日與全球用戶進行超30億次交互,處理超3萬億文本token(詞元)、2000萬張圖片和7萬小時語音。
在本次公開發(fā)布之前,MiniMax對外交流并不多,此前受到的普遍關(guān)注也與融資進展有關(guān)。
天眼查顯示,2024年3月,MiniMax背后的上海稀宇極智科技有限公司完成了B輪的6億美元融資,投資方為阿里巴巴,其估值達到25億美元。此前的2023年6月,MiniMax完成了超2.5億美元的A輪融資,投資方為騰訊投資。
作為一家大廠連續(xù)加碼的AI獨角獸,MiniMax已經(jīng)推出了多款產(chǎn)品。
以星野為例,資料顯示,作為MiniMax旗下的AI原生應(yīng)用,其致力于為用戶打造沉浸式AI內(nèi)容社區(qū),于2023年9月上線。
閆俊杰透露,星野這樣的產(chǎn)品,其底層設(shè)計并不是陪伴用戶聊天,底層設(shè)計實際上是一個內(nèi)容社區(qū)。在其中,可以有一些用戶創(chuàng)建一些角色,此外,現(xiàn)在也提供了更復(fù)雜的工具,用戶可以在里面創(chuàng)建故事、創(chuàng)作世界觀。同時另外一些用戶可以根據(jù)創(chuàng)造的世界觀進行互動。
在發(fā)布星野之前,MiniMax已經(jīng)于去年6月發(fā)布出海產(chǎn)品Talkie。根據(jù)數(shù)據(jù)分析公司Sensor Tower的數(shù)據(jù),Talkie在美國免費娛樂類應(yīng)用榜上排名第五,全球月活躍用戶數(shù)已達1100萬。此外,根據(jù) 智能服務(wù)商QuestMobile 數(shù)據(jù),星野活躍率達到25.7%,月人均使用天數(shù)為7.7天。
值得一提的是,據(jù)媒體報道,谷歌花費了數(shù)十億美元,吸納了聊天機器人初創(chuàng)公司“Character.AI” 的聯(lián)合創(chuàng)始人諾姆·沙澤爾、丹尼爾·德弗雷塔斯,以及研發(fā)人員約30名,并與Character.AI達成了許可協(xié)議。同時,谷歌將以25億美元的估值收購Character.AI投資者的股票。
關(guān)于海外業(yè)務(wù)的進展,MiniMax國際業(yè)務(wù)總經(jīng)理盛靜遠(yuǎn)對記者表示,很早之前Character.AI是比較有名的。“現(xiàn)在他的核心團隊被谷歌收走之后,我們成了賽道的扛大旗者,我們在做的事情是不斷地破圈。我們做的不是陪聊,也不是AI的情感陪伴,就是新一代的內(nèi)容生成平臺。”盛靜遠(yuǎn)說道。
此外,今年5月,“海螺AI”也已經(jīng)上線。據(jù)MiniMax官方公眾號披露,海螺AI背后接入了 MiniMax自研的多模態(tài)大模型,包括萬億參數(shù)MoE(混合專家)大語言模型 “abab6.5”,語音大模型和圖像大模型。這些技術(shù)讓海螺AI可以在1秒內(nèi)處理近3萬字的文本。
閆俊杰表示,星野的用戶畫像以二三線城市居民為主,年齡在17歲到25歲之間。據(jù)他透露,海螺用戶畫像更泛一些,因為海螺本來就是工具型的產(chǎn)品。
就商業(yè)化進展等問題,閆俊杰回復(fù)稱,整個公司的商業(yè)化基本上分成兩個形式,其中的一個形式就是MiniMax開放平臺,它目前擁有超過3萬名企業(yè)客戶和開發(fā)者。此外,閆俊杰表示,MiniMax的產(chǎn)品里面也有廣告的機制,廣告本身也可以進行商業(yè)化的變現(xiàn)。
他認(rèn)為,在目前的階段,最重要的東西還不是商業(yè)化,是技術(shù)能達到廣泛“可用”的程度。
2024 年以來,AI 視頻生成模型正在加速涌現(xiàn)。
2024年2月,OpenAI 的視頻生成大模型 Sora 橫空出世,可輸出長達60秒的視頻,不僅能準(zhǔn)確呈現(xiàn)細(xì)節(jié),還能理解物體在物理世界中的存在,被視為視頻創(chuàng)作領(lǐng)域里程碑式的產(chǎn)品。
根據(jù)興業(yè)證券相關(guān)研報統(tǒng)計,年中以來,中國自研視頻生成大模型也在加速涌現(xiàn)。
當(dāng)前,“即夢”(抖音旗下)、“可靈”(快手旗下)、“清影”(智譜旗下)等產(chǎn)品已對公眾開放,在幀率、視頻時長、清晰度等層面接近或超過了海外已開放的主流視頻大模型,并且實現(xiàn)了背景音樂、首尾幀、視頻延長、口型驅(qū)動等技術(shù)集成。
對于切入視頻生成模型混戰(zhàn)的原因,閆俊杰表示,MiniMax一直以來的目標(biāo)是要做動態(tài)的輸出。
“我們每天看的大部分內(nèi)容,都不是文字,而是一些動態(tài)的東西。打開小紅書都是圖文,打開抖音都是視頻,甚至打開拼多多買東西,大部分時候也是圖片。”閆俊杰表示,為了能夠有非常高的用戶覆蓋度,有非常高的使用深度,唯一的辦法是能夠輸出動態(tài)的內(nèi)容,而不是輸出單純基于文字的內(nèi)容。
閆俊杰透露,其實(MiniMax)很早就做出來了圖片,只是現(xiàn)在技術(shù)變得更強,把視頻也做了出來。“這個路線是一以貫之的,一定要能夠做多模態(tài)。”
閆俊杰也提到,做視頻生成模型的工作復(fù)雜度比文本更難,因為視頻的Context(上下文的文本)天然很長。其次,視頻量很大,比如一個5秒的視頻,大小可能有幾兆,但是5秒的文字,大小可能都不到1K,這是幾千倍的存儲差距。
“這里面的挑戰(zhàn)在于,之前基于文本而構(gòu)建的這套底層基礎(chǔ)設(shè)施怎么處理數(shù)據(jù)、怎么清洗數(shù)據(jù)、怎么來標(biāo)注。(但這些)對視頻都不太適用,意味著基礎(chǔ)設(shè)施也需要升級。”閆俊杰說。
興業(yè)證券的相關(guān)研報提及,AI生成視頻模型已在短劇領(lǐng)域取得顯著成果,未來有望賦能對畫面的精度和時長要求更高的長視頻和電影。
北京社科院副研究員王鵬對《每日經(jīng)濟新聞》記者表示,隨著短視頻、直播等新型媒體形式的興起,視頻內(nèi)容的需求量急劇增加。視頻生成模型能夠滿足這一需求,為內(nèi)容創(chuàng)作者提供高效、低成本的視頻制作工具。
值得一提的是,作為創(chuàng)業(yè)公司,MiniMax會不可避免地與大廠進行正面競爭。
對此,閆俊杰表示:“當(dāng)開始意識到那些比你大好多倍的公司都開始跟你競爭的時候,就意識到有些東西是沒用的,因為在那些東西上,大廠比你強百倍千倍,我們能做的就是(把)有可能變強的事無限地放大。”
對于這“可能變強的事”,他提到了兩點,一是技術(shù)如何提升,二是如何跟用戶做更好的共創(chuàng),“這兩點都需要一些非常關(guān)鍵的判斷,需要非常長期的積累”。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP