每日經(jīng)濟(jì)新聞 2024-04-29 14:01:26
每經(jīng)記者 李少婷 每經(jīng)編輯 文多
丨 2024年4月29日 星期一 丨
NO.1 國(guó)內(nèi)首個(gè)純自研視頻大模型推出
4月27日,在中關(guān)村論壇未來(lái)人工智能先鋒論壇上,生數(shù)科技聯(lián)合清華大學(xué)正式發(fā)布中國(guó)首個(gè)長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)性視頻大模型Vidu。據(jù)悉,該模型采用Diffusion(擴(kuò)散概率模型)與Transformer融合的架構(gòu)U-ViT,支持一鍵生成長(zhǎng)達(dá)16秒、分辨率高達(dá)1080P的高清視頻內(nèi)容。生數(shù)科技方面介紹,與Sora一致,Vidu能夠根據(jù)提供的文本描述直接生成長(zhǎng)達(dá)16秒的高質(zhì)量視頻。
點(diǎn)評(píng):Vidu的推出是中國(guó)在人工智能視頻生成領(lǐng)域的重要里程碑,提升了中國(guó)在全球人工智能領(lǐng)域的競(jìng)爭(zhēng)力和影響力,展現(xiàn)了中國(guó)科研實(shí)力和創(chuàng)新能力。就技術(shù)細(xì)節(jié)而言,Vidu在時(shí)長(zhǎng)上取得了突破,但與Sora相比,Sora的最長(zhǎng)視頻生成時(shí)長(zhǎng)可達(dá)60秒,Vidu目前的16秒,仍有提升空間。在人物動(dòng)作的協(xié)調(diào)性方面,盡管整體效果已經(jīng)非常接近,但Vidu與Sora相比還是稍弱一些。
NO.2 純電驅(qū)擬人奔跑機(jī)器人“天工”發(fā)布
4月27日,北京人形機(jī)器人創(chuàng)新中心在北京經(jīng)開區(qū)發(fā)布全球首個(gè)純電驅(qū)擬人奔跑的全尺寸人形機(jī)器人“天工”,它能以6公里/小時(shí)的速度穩(wěn)定奔跑。“天工”高163厘米,輕量化體重43公斤。“天工”配備多個(gè)視覺(jué)感知傳感器,具有每秒550萬(wàn)億次操作算力,并配備高精度的慣性測(cè)量單元和3D視覺(jué)傳感器。它已解決基本運(yùn)動(dòng)控制問(wèn)題,是具身智能場(chǎng)景應(yīng)用和研究的最佳平臺(tái)。此外,“天工”還配備了高精度的六維力傳感器,以提供精確的力量反饋。
點(diǎn)評(píng):“天工”能夠以6公里/小時(shí)的速度穩(wěn)定奔跑,顯示了運(yùn)動(dòng)控制和平衡技術(shù)的進(jìn)步,這也表明機(jī)器人技術(shù)正在向更高級(jí)別的自主性和動(dòng)態(tài)穩(wěn)定性發(fā)展。“天工”具備開源開放性和兼容擴(kuò)展性,提供開放調(diào)用通信接口,允許靈活擴(kuò)展軟件和硬件功能模塊,這為廣泛的應(yīng)用場(chǎng)景提供了可能。人形機(jī)器人產(chǎn)業(yè)鏈較長(zhǎng),涉及傳感器、電機(jī)、減速器等多個(gè)環(huán)節(jié),“天工”的成功研發(fā)和應(yīng)用,可能會(huì)帶動(dòng)相關(guān)產(chǎn)業(yè)鏈的技術(shù)進(jìn)步和市場(chǎng)擴(kuò)大。
NO.3 科大訊飛發(fā)布首個(gè)長(zhǎng)文本、長(zhǎng)圖文、長(zhǎng)語(yǔ)音大模型
科大訊飛于近日發(fā)布首個(gè)長(zhǎng)文本、長(zhǎng)圖文、長(zhǎng)語(yǔ)音大模型,它不僅能夠?qū)Ω鞣N信息來(lái)源的海量文本、圖文資料、會(huì)議錄音等進(jìn)行快速學(xué)習(xí),還能夠在各種行業(yè)場(chǎng)景給出專業(yè)、準(zhǔn)確回答。此外,科大訊飛還進(jìn)一步升級(jí)星火語(yǔ)音大模型,首發(fā)多情感超擬人合成,具備情緒表達(dá)能力,并推出一句話聲音復(fù)刻功能。同時(shí),面向企業(yè)應(yīng)用場(chǎng)景,科大訊飛推出星火智能體平臺(tái),幫助企業(yè)解決大模型落地的“最后一公里”難題。
點(diǎn)評(píng):科大訊飛在語(yǔ)音識(shí)別和自然語(yǔ)言處理領(lǐng)域具有較強(qiáng)的技術(shù)積累,這使得其大模型產(chǎn)品在處理復(fù)雜語(yǔ)言和語(yǔ)音任務(wù)時(shí)更為精準(zhǔn)和高效。能夠同時(shí)處理文本、圖像和語(yǔ)音的多模態(tài)大模型,為用戶帶來(lái)更為豐富和直觀的交互體驗(yàn)。具備情緒表達(dá)能力的語(yǔ)音合成技術(shù),使得機(jī)器合成的聲音更加自然,更能滿足用戶對(duì)情感交互的需求。不過(guò),在實(shí)際應(yīng)用中,大模型需要展現(xiàn)出高穩(wěn)定性和可靠性,以贏得用戶的信任。
NO.4 中國(guó)移動(dòng)已初步建成算力網(wǎng)絡(luò)
4月28日的2024中國(guó)移動(dòng)算力網(wǎng)絡(luò)大會(huì)上,中國(guó)移動(dòng)董事長(zhǎng)楊杰在演講中表示:中國(guó)移動(dòng)已初步建成了基礎(chǔ)設(shè)施、技術(shù)能力、產(chǎn)品服務(wù)業(yè)界領(lǐng)先的算力網(wǎng)絡(luò),其中,算力并網(wǎng)平臺(tái)接入蘇州昆山超算中心、玻色量子等數(shù)十家合作伙伴的多樣化算力。算網(wǎng)大腦研發(fā)于去年10月正式啟動(dòng)全網(wǎng)試商用,實(shí)現(xiàn)日均調(diào)度次數(shù)達(dá)億級(jí)。
點(diǎn)評(píng):數(shù)字化、云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的發(fā)展對(duì)算力提出了更高的需求,算力網(wǎng)絡(luò)成為支撐未來(lái)數(shù)字經(jīng)濟(jì)發(fā)展的關(guān)鍵基礎(chǔ)設(shè)施,中國(guó)移動(dòng)通過(guò)建立算力網(wǎng)絡(luò),能夠更好地滿足市場(chǎng)和用戶的需求。作為運(yùn)營(yíng)商,中國(guó)移動(dòng)在網(wǎng)絡(luò)基礎(chǔ)設(shè)施、用戶規(guī)模、數(shù)據(jù)資源、服務(wù)能力等方面具有天然優(yōu)勢(shì),這些優(yōu)勢(shì)有助于其在算力網(wǎng)絡(luò)的建設(shè)和運(yùn)營(yíng)上取得領(lǐng)先地位。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP