每日經(jīng)濟(jì)新聞 2025-01-28 09:24:13
DeepSeek發(fā)布了開(kāi)源多模態(tài)AI模型Janus-Pro,在部分文生圖基準(zhǔn)測(cè)試中表現(xiàn)好于OpenAI的競(jìng)品。此外,DeepSeek線上服務(wù)近期遭大規(guī)模惡意攻擊,已注冊(cè)用戶可正常登錄。1月28日,美股三大指數(shù)漲跌不一,芯片股全線暴跌。英偉達(dá)重挫,市值蒸發(fā)約4.27萬(wàn)億元人民幣。消息面上,DeepSeek推出新模型,性能與OpenAI o1相當(dāng),但成本極低,引發(fā)市場(chǎng)對(duì)科技AI巨頭估值的擔(dān)憂。
每經(jīng)編輯 張錦河
近日,國(guó)產(chǎn)大模型DeepSeek引發(fā)廣泛關(guān)注。
據(jù)人工智能社區(qū)Hugging Face1月28日信息顯示,DeepSeek發(fā)布了開(kāi)源多模態(tài)人工智能(AI)模型Janus-Pro。其中Janus-Pro-7B在GenEval和DPG-Bench基準(zhǔn)測(cè)試中擊敗了OpenAI的DALL-E 3和Stable Diffusion。
此外,昨晚至今日凌晨,DeepSeek 通過(guò)官方服務(wù)狀態(tài)發(fā)布聲明稱:近期 DeepSeek 線上服務(wù)受到大規(guī)模惡意攻擊,注冊(cè)可能繁忙,請(qǐng)稍等重試。已注冊(cè)用戶可以正常登錄,感謝理解和支持。
DeepSeek的展示圖顯示,在文生圖GenEval和DPG-Bench基準(zhǔn)測(cè)試中,Janus-Pro-7B的準(zhǔn)確率較前代Janus大幅提高,準(zhǔn)確率測(cè)試結(jié)果分別為80%和84.2%,高于包括OpenAI DALL-E 3在內(nèi)的其他對(duì)比模型,Janus的準(zhǔn)確率分別為61%和79.7%。
從報(bào)告給出的“跑分”數(shù)據(jù)來(lái)看,在部分文生圖基準(zhǔn)測(cè)試中,Janus-Pro 70億參數(shù)模型表現(xiàn)好于OpenAI的DALL-E 3、Stability AI的Stable Diffusion 3-Meduim等。
據(jù)DeepSeek介紹,Janus-Pro是一個(gè)新穎的自回歸框架,統(tǒng)一了多模態(tài)理解和生成。通過(guò)將視覺(jué)編碼分離為“理解”和“生成”兩條路徑,同時(shí)仍采用單一的Transformer架構(gòu)進(jìn)行處理,解決了以往方法的局限性。這種分離不僅緩解了視覺(jué)編碼器在理解和生成中的角色沖突,還提升了框架的靈活性。
Janus-Pro是一款統(tǒng)一理解與生成的多模態(tài)大語(yǔ)言模型(MLLM),通過(guò)對(duì)多模態(tài)理解與生成的視覺(jué)編碼進(jìn)行解耦來(lái)實(shí)現(xiàn)功能。Janus-Pro構(gòu)建于 DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base的基礎(chǔ)之上。
在多模態(tài)理解方面,它使用SigLIP-L作為視覺(jué)編碼器,支持384x384的圖像輸入。在圖像生成方面,Janus-Pro使用了來(lái)源于此的分詞器(tokenizer),其下采樣率為16。
北京時(shí)間1月28日,美股三大指數(shù)收盤漲跌不一,道指漲0.65%,標(biāo)普500指數(shù)跌1.46%,納指重挫超600點(diǎn),跌幅3.07%。
大型科技股漲跌不一,英偉達(dá)下跌16.86%,創(chuàng)歷史上最大單日個(gè)股蒸發(fā)規(guī)模,市值蒸發(fā)5888.62億美元(約合人民幣4.27萬(wàn)億元);谷歌下跌4.03%;特斯拉下跌2.32%;微軟下跌2,14%;亞馬遜上漲0.30%;Meta上漲1.91%;蘋果上漲3.25%,截至收盤市值為3.5萬(wàn)億美元,再度成為全球市值最高上市公司。
美股半導(dǎo)體芯片板塊全線暴跌,博通跌超17%,臺(tái)積電跌超13%,美國(guó)科技跌超11%,Arm Holdings跌超10%,AMD跌超6%,阿斯麥跌超5%。
消息面上,近期火遍全球的DeepSeek推出新模型,該模型以極低的成本實(shí)現(xiàn)了與OpenAI o1相當(dāng)?shù)男阅埽?/span>引發(fā)市場(chǎng)對(duì)科技AI巨頭估值的擔(dān)憂。簡(jiǎn)而言之,DeepSeek新模型性能與OpenAI o1旗鼓相當(dāng),但成本連后者的零頭都不到。有分析人士認(rèn)為,DeepSeek在有限的硬件資源下實(shí)現(xiàn)頂尖的模型性能,減少了對(duì)高端GPU的依賴,低廉的訓(xùn)練成本預(yù)示著AI大模型對(duì)算力投入的需求將大幅下降。正因?yàn)榇?,美股芯片股首?dāng)其沖。1月27日,DeepSeek在蘋果App Store美國(guó)區(qū)免費(fèi)應(yīng)用下載榜上超越ChatGPT,排名第一,在中國(guó)區(qū)排行榜上同樣登頂。
每日經(jīng)濟(jì)新聞綜合自界面新聞、公開(kāi)信息
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP