每日經(jīng)濟新聞 2024-04-11 11:56:47
“大模界”是每日經(jīng)濟新聞推出一檔專注生成式AI與大模型技術的前沿科技報道欄目。
在這里,我們將聚焦生成式AI技術浪潮,展現(xiàn)從文字、圖像、音頻、視頻的大模型如何編織數(shù)字化世界。
在這里,我們將解碼、評測國內(nèi)外各類大模型,探究它們?nèi)绾纬蔀樽兏锔餍懈鳂I(yè)的重要力量。
在這里,我們將關注AIGC行業(yè)發(fā)展,聯(lián)手行業(yè)領軍人物和頂尖專家,共同揭示最新產(chǎn)品創(chuàng)新和技術突破,前瞻未來發(fā)展趨勢。
歡迎關注“大模界”,您將見證AIGC如何重塑內(nèi)容生態(tài),如何以前沿之力推動社會進步。讓我們共同開啟一場關于AI新紀元的無限旅程!
每經(jīng)記者 畢媛媛 宋美璐 每經(jīng)編輯 梁梟
“改變是潛移默化的,可能就在某個平凡的日子,一首觸動心靈的歌曲闖入你的生活,當你深入了解其源頭時,發(fā)現(xiàn)那是AI寫的,那時候浪潮就悄悄來臨了。”伯雅文娛創(chuàng)始人、唱作人范志昊說道。這位音樂制作行業(yè)的資深人士正致力于探索AI在音樂創(chuàng)作中的輔助作用。“總有人會做這些事,你永遠無法阻擋歷史車輪的腳步。”
Suno上生成的關于貓的音樂 很熱門 圖片來源:Suno截圖
近來,SunoV3等音樂AI技術的誕生,如同一股強勁的暗流,沖擊著傳統(tǒng)音樂行業(yè)的壁壘,引發(fā)了眾多音樂從業(yè)者對未來職業(yè)前景的憂慮,他們同時也在思考如何在AI時代中找到自己的位置。
六間房視頻集團創(chuàng)始人、Bit Computing Pte.Ltd.創(chuàng)始人/CEO劉巖如今正在開發(fā)一款音樂大模型,他在接受《每日經(jīng)濟新聞》記者電話采訪時表示:“當前市面上部分被冠以‘音樂大模型’之名的產(chǎn)品,其實并未達到嚴格意義上大模型的標準。音樂大模型因其更高的技術門檻、更窄的應用場景,或不會出現(xiàn)大規(guī)模爆發(fā)的情況,但有可能超越國外成為全球領先。”
自今年3月以來,國內(nèi)外涌現(xiàn)出大量AI生成式音樂工具,行業(yè)格局在一夜之間發(fā)生了翻天覆地的變化。
此前,OpenAI的MuseNet、谷歌的MusicLM以及Meta的MusicGen等AI音樂項目已經(jīng)引起了業(yè)界廣泛關注。而如今,一款名為Suno的“音樂版ChatGPT”音樂大模型點燃了全球音樂界的熱情。因為這款模型能夠一次性完成歌詞、演唱、編曲、配樂等音樂創(chuàng)作的全過程,因此被譽為“消滅”了音樂創(chuàng)作門檻。
音樂制作人閆東煒在第一時間試用了Suno,他興奮地表示:“輸入幾個關鍵詞,不到一分鐘就能生成了。”然而,他也指出了Suno的局限性:雖然借助AI可以找音樂靈感,但聽多了感覺出來的基本都是流行歌。未來抖音上的歌可能會越來越相似,像流水線一樣生產(chǎn)。如果要不斷地坐在電腦前輸入關鍵詞來生成歌曲,這個過程可能會顯得有些無聊。
盡管如此,Suno仍然獲得了不少業(yè)內(nèi)人士的高度評價。范志昊評價:Suno生成的音樂是有下限的,它的創(chuàng)作至少聽著順耳。
Suno上生成的另一首關于貓的音樂 收聽量超過1萬+ 圖片來源:Suno截圖
范志昊表示,可以借助AI預測音樂內(nèi)容,并幫助公司找到合適的歌手。此外,AI還降低了音樂創(chuàng)作的門檻,讓更多人能夠享受到創(chuàng)作的樂趣。“本來聽到好的作品會有共鳴,但如果變成自己去寫,快樂是不一樣的。這個市場的潛在需求非常大。”范志昊坦言。
AI音樂引發(fā)熱潮的另一個重要原因在于使用門檻和價格的降低。以閆東煒使用過的一款AI音樂工具為例,基礎版免費,PRO版價格大約是10美元一個月,能生成500首歌;更高級的版本只需30美元一個月,就能生成約2000首歌。這意味著,一首AI歌曲的成本僅需0.1元左右。
范志昊表示:“原先找專業(yè)作曲人創(chuàng)作歌曲的成本很高,即使是友情價也得是千元以上。但現(xiàn)在有了AI,幾十塊錢就能生成上百條音樂作品,價格差距非常大。”他還提到,如果機器不排隊的話,幾乎可以即刻生成一個詞曲的demo(樣片)。
AI音樂并非完美無缺。閆東煒認為,AI可以創(chuàng)作,但不善于修改。每次修改完都完全不一樣,因此較為復雜的歌曲客戶還是會找人工來做。盡管如此,他認為AI音樂在技術上已經(jīng)高過很多網(wǎng)絡上的口水歌。
范志昊也坦言,國內(nèi)的AI工具和Suno相比仍有一定差距。雖然音樂AI能夠生成各種風格的歌曲,但水平卻參差不齊。其中,pop和爵士風格相對較為出色。pop風格之所以讓人驚喜,是因為其訓練數(shù)據(jù)豐富,結構相對可復制;而爵士風格則因為能寫出好風格的人本身就比較少,所以顯得尤為亮眼。
據(jù)媒體報道,當?shù)貢r間4月2日,200多名國際樂壇知名音樂人聯(lián)署公開信,呼吁AI開發(fā)者、科技公司、平臺和數(shù)字音樂服務商停止使用AI侵犯及貶低人類藝術家的權利,要求他們承諾不開發(fā)與之相關的AI音樂生成技術等,也不能拒絕向藝術家提供合理報酬。參與聯(lián)署的藝人共有246名,大多來自歐美樂壇,其中包括比莉·艾利什(Billie Eilish)、凱蒂·佩里(Katy Perry)、妮琪·米娜(Nick Minaj)等。
妮琪·米娜 圖片來源:環(huán)球音樂官網(wǎng)
近年來,AI音樂生成技術迅速發(fā)展,一系列以“AI歌手”為名的翻唱作品在網(wǎng)絡上走紅。例如,“AI孫燕姿”翻唱的《發(fā)如雪》、“AI王心凌”翻唱的《套馬桿》等視頻,播放量均超過百萬。隨后,“AI周杰倫”“AI林俊杰”“AI許嵩”等“歌手”也如雨后春筍般涌現(xiàn)。
相關技術的普及也引發(fā)了社會各界的擔憂。許多行業(yè)人士擔心,AI的廣泛應用可能會危及他們的生計和職業(yè)發(fā)展。對此,閆東煒表示,雖然AI對音樂創(chuàng)作者的影響有限,但確實降低了普通人進入音樂創(chuàng)作的門檻,這可能會對整個音樂行業(yè)產(chǎn)生一定的沖擊。“流行歌手不會失業(yè),粉絲喜歡的是這個人,他唱得好,有作品更好。”
閆東煒進一步解釋說,現(xiàn)在客戶只需將需求發(fā)送給AI,便能快速生成音樂作品,這在一定程度上減少了對傳統(tǒng)音樂制作公司的需求。然而,他也強調,AI生成的音樂往往結構單一,對于專業(yè)領域的需求幫助有限。音樂制作人仍需要根據(jù)客戶需求進行后期的修改和調整,以確保作品的質量和獨特性。
“AI最先替代的就是藝術家,人工智能可以體驗無數(shù)次戀愛、失戀、死亡,因此他會比人更有情感,AI在其他領域最大的問題是‘幻覺’,可能會造成誤判,但這種‘幻覺’在藝術上就可能是突破和創(chuàng)新。”劉巖說。
范志昊表示,AI對音樂行業(yè)的影響是雙面的。它既可以降低創(chuàng)作門檻,讓更多人能夠嘗試音樂創(chuàng)作;也可能導致一部分人的工作被AI替代,尤其依賴簡單創(chuàng)作和翻唱的藝人可能失去工作機會,例如有些唱demo的歌手已經(jīng)被替代了。
“AI對音樂人的沖擊并不是直接的競爭,而是潛移默化的競爭。AI音樂的普及可能會改變音樂人的職業(yè)發(fā)展方向。”在范志昊看來,未來,音樂人可能更需要注重個人IP的經(jīng)營和發(fā)展,而非僅僅依賴于網(wǎng)絡歌曲的翻唱和創(chuàng)作。
此外,范志昊還提到了未來音樂產(chǎn)業(yè)的發(fā)展趨勢。他表示,隨著音樂產(chǎn)量的不斷增加,每年人們能夠聽到的歌曲數(shù)量已經(jīng)遠遠超過了他們的消化能力。AI的出現(xiàn)進一步加劇了音樂市場的競爭,搶占了原有的音樂空間。這導致一些認真做曲庫、做內(nèi)容的音樂人可能會受到影響,他們的作品可能會因為AI的普及而被淹沒在海量的音樂中。
對于AI音樂對傳統(tǒng)市場的沖擊問題,劉巖也表達了自己的看法。他認為,AI音樂生成技術能夠在短時間內(nèi)產(chǎn)生大量歌曲,以目前能力和需求看,一年后,市場上90%的歌曲可能都是AI生成的了,傳統(tǒng)意義上的“新歌”可能連1%的比例都占不到了,僅從數(shù)據(jù)上看,行業(yè)的格局一定會被打破。
音樂大模型的發(fā)展正處于一個關鍵時期。繼Suno之后,國內(nèi)的科技公司也不甘落后,昆侖萬維推出了“天工SkyMusic”,發(fā)布的9首由“天工SkyMusic”生成的音樂作品,展示了從說唱到古風等多種風格的音樂創(chuàng)作能力,這些作品的時長從10秒到51秒不等。
一年前,劉巖和他的團隊就敲下音樂大模型開發(fā)的第一行代碼,決心布局該行業(yè)。在他看來,音樂大模型相較于文字和視頻大模型,面臨著更高的技術門檻。“音樂和視頻一樣是一種長時序的技術形式,如果說視頻可以分成每一秒鐘24幀圖像的話,音樂則每一秒鐘包含上萬個采樣點,且每個采樣點之間的相關性強,這使得音樂成為最復雜的模態(tài)之一。”
劉巖進一步闡述道,當前市面上部分被冠以“音樂大模型”之名的產(chǎn)品,其實并未達到嚴格意義上大模型的標準。一些作品的生成依賴于音樂結構和規(guī)則的技術,或是通過將音樂轉化為MIDI等符號語言再進入模型來實現(xiàn),這種方式雖然能夠產(chǎn)生近人類水平的音樂,但不能觸及音樂的本質——對音樂情感、內(nèi)涵及整體結構的理解與創(chuàng)造性表達,永遠不會超越現(xiàn)有音樂的水平。
“真正意義上的音樂大模型應當具備端到端的學習能力,訓練數(shù)據(jù)直接來源于日常聆聽的完整音樂作品而非翻譯后的MIDI,并能夠從構思歌詞、設計旋律、編排伴奏直至模擬人聲演繹等全過程進行一體化的創(chuàng)作。遺憾的是,當前大多數(shù)模型僅在音樂創(chuàng)作的旋律和伴奏等某一個環(huán)節(jié)上取得進展,尚未實現(xiàn)全方位的音樂生成。”劉巖說。
目前用戶無法透視模型的內(nèi)部邏輯,只能看到其外在表現(xiàn)。劉巖認為,AI這一天然的“黑盒”效應,讓音樂大模型出現(xiàn)了不少魚目混珠的情況。然而,“黑盒”效應也為中小企業(yè)和創(chuàng)業(yè)團隊帶來了獨特的發(fā)展機遇。
Suno生成了大量各類音樂 圖片來源:Suno截圖
范志昊早在半年前就開始集結團隊,專注于研究音樂AIGC輔助生態(tài)。他認為,“黑盒”是小公司跟大廠競爭的唯一的壁壘,因為互聯(lián)網(wǎng)產(chǎn)品的運作邏輯可以輕易被剖析和模仿,而AI則不然,這就要求開發(fā)者投入更多的心血與專注。在他看來,這不是大廠有錢就可以做好的。“除非他一下子砸很多錢進去,但這又不是一個潛力特別大的市場。”
與語言大模型廣泛應用于多元場景不同,音樂大模型從誕生之初便瞄準了特定的應用場景——降低音樂創(chuàng)作門檻,使以往專業(yè)音樂人才方能完成的工作,如今普通人借助大模型只需通過自然語言描述就能得到高質量的歌曲作品。
這一點使音樂大模型在特定領域具有一定的市場潛力。劉巖認為:“語言大模型我們很難超越,但音樂大模型我們可以把它做成全世界最好的模型。”
如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP