每日經(jīng)濟(jì)新聞 2025-01-29 16:14:53
每經(jīng)AI快訊,華泰證券研報(bào)稱,DeepSeek發(fā)布R1模型及相關(guān)應(yīng)用,以較低的訓(xùn)練成本達(dá)到與現(xiàn)有前沿模型相當(dāng)?shù)男Чl(fā)市場對算力投資的擔(dān)憂。華泰證券認(rèn)為:1)DeepSeek主要創(chuàng)新是通過在預(yù)訓(xùn)練階段加入強(qiáng)化學(xué)習(xí),DeepSeek V3訓(xùn)練成本相當(dāng)于Llama3系列的7%,對當(dāng)前世代AI大模型的降本做出了重要貢獻(xiàn),有望降低現(xiàn)有模型的訓(xùn)練和推理成本;2)目前北美四大AI公司主要通過擴(kuò)大GPU集群規(guī)模的方式探索下一代大模型,DeepSeek的方式是否在下一代模型研發(fā)中有效還有待觀察。3)DeepSeek這次的成功顯示,在Scaling Law放緩的大背景下,中美在大模型技術(shù)上的差距有望縮小。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP