每日經(jīng)濟新聞 2024-05-31 18:24:53
每經(jīng)編輯 張錦河
開欄語:《AIGC行業(yè)周報》梳理AIGC行業(yè)一周內(nèi)發(fā)生的重要動態(tài),產(chǎn)品發(fā)布和業(yè)內(nèi)大咖的最新觀點。
圖片來源:每經(jīng)制圖
(一)AI獨角獸集體求賣身,大模型領域新一輪洗牌期到來
近期,多家AI領域的明星初創(chuàng)公司如Adept、Humane AI、Reka AI和Stability AI等紛紛尋求收購或合并,顯示出AI大模型行業(yè)正在進入一個新的洗牌期。這些公司面臨成本壓力、商業(yè)模式不明確和市場競爭等問題,部分公司因產(chǎn)品市場反響不佳、資金短缺或?qū)ξ磥砩虡I(yè)模式的不確定性而急于尋找買家。同時,科技巨頭也在積極收購AI技術、人才和資源,以加強自身在AI領域的競爭力。這一現(xiàn)象反映出AI行業(yè)正在經(jīng)歷從快速增長到整合資源、聚焦商業(yè)模式的轉(zhuǎn)變,同時也暗示了AI初創(chuàng)企業(yè)在實現(xiàn)商業(yè)成功方面需要探索更多可能性。
(二)普華永道與OpenAI合作,為其10萬員工部署ChatGPT企業(yè)版
5月30日,全球四大會計事務所之一的普華永道(PwC)在官網(wǎng)宣布,與OpenAI達成技術、市場雙向合作,成為其最大客戶和首家產(chǎn)品經(jīng)銷商。根據(jù)合作協(xié)議,普華永道將為美國75,000名員工和英國26,000名員工提供ChatGPT Enterprise服務。此舉標志著生成式AI在普華永道的實際業(yè)務用例中從試驗階段轉(zhuǎn)向具體場景落地,普華永道已確定3,000多個業(yè)務用例,旨在通過AI技術提高效率和降低成本。此外,普華永道還將利用OpenAI最新發(fā)布的多模態(tài)模型GPT-4o,并結(jié)合自身內(nèi)部數(shù)據(jù)對GPT系列模型進行微調(diào),創(chuàng)建定制化的AI助手,以支持員工在財務審計、稅務審查、代碼開發(fā)和報告生成等方面的工作。普華永道的全球業(yè)務網(wǎng)絡也使其成為OpenAI產(chǎn)品的重要銷售渠道,目前已與美國950家企業(yè)客戶就加速部署生成式AI展開溝通。此合作同時也兌現(xiàn)了普華永道在生成式AI領域投資10億美元的承諾,并預期將提升公司在行業(yè)中的競爭力和業(yè)務執(zhí)行效率。
(三)英偉達進軍云服務市場,DGX Cloud成戰(zhàn)略重點
上周,英偉達(Nvidia)宣布了未來幾年內(nèi)向云計算領域投入近90億美元的計劃,這一數(shù)字較1月份的承諾增長了近兩倍。英偉達的DGX Cloud服務旨在為用戶提供易于訪問的高性能計算資源,特別是為深度學習和AI應用設計。這項服務基于Nvidia的DGX系列超級計算機,用戶可以在云端租用這些資源而無需自行購買和維護昂貴的硬件。DGX Cloud還使Nvidia能夠租用亞馬遜、微軟、谷歌和甲骨文等云提供商的GPU服務器,再轉(zhuǎn)租給客戶,這可能改變Nvidia與其最大客戶間的關系。英偉達此舉意在減少客戶對AWS、Google Cloud或Microsoft Azure等云服務提供商的依賴,同時也為其自身在云服務市場中建立起直接的競爭地位。
(一)百度推動智能體普及,開拓AI應用新場景
5月30日,百度在移動生態(tài)萬象大會上展示了其在大模型競賽中的新動向,重點發(fā)布和升級了包括百度搜索、文心一言App、百度文庫、文心智能體平臺等產(chǎn)品。百度致力于降低大模型使用門檻,推動智能體技術的普及,使其成為提高生產(chǎn)力的工具。百度智能體平臺支持簡易開發(fā),提供流量優(yōu)勢,并已經(jīng)吸引了眾多開發(fā)者和企業(yè)入駐,覆蓋了廣泛的應用場景。百度的策略不僅著眼于打造自己的AI應用生態(tài),同時也為行業(yè)提供基礎設施和標準化路徑,旨在通過AI技術解決用戶的實際需求,并創(chuàng)造AI時代的超級應用,推動公司核心搜索業(yè)務和云服務的發(fā)展。
(二)速度秒殺GPT-4o!Mistral AI開源首個22B代碼模型破記錄
近日,歐洲的Mistral公司推出了名為Codestral的開源編程大模型,它以22B參數(shù)量在性能上超越了70B參數(shù)的Code Llama。Codestral支持80多種編程語言,并實現(xiàn)了32k的上下文窗口長度,大幅提高了處理能力。它在多項編程語言測試中取得了優(yōu)異成績,特別是在Python代碼生成和SQL的Spider測試中表現(xiàn)突出。此外,Codestral還支持代碼填充補全功能,并已集成到多個大模型框架和開發(fā)者平臺中。盡管模型性能卓越,但Mistral發(fā)布的Codestral僅可用于非商業(yè)用途,遵循嚴格的“非生產(chǎn)”許可協(xié)議(MNPL),這一限制引發(fā)了一些開源社區(qū)成員的不滿。
(三)騰訊元寶AI助手上線,開啟公眾號內(nèi)容新生態(tài)
5月30日,備受期待的騰訊元寶于正式上線,并以其出色的AI搜索功能受到關注。該產(chǎn)品能夠訪問高質(zhì)量的微信公眾號內(nèi)容作為信息源,顯著提升了AI搜索的回答質(zhì)量。作者通過親身體驗發(fā)現(xiàn),騰訊元寶在處理最新問題時,能夠綜合多個來源,尤其是公眾號文章,給出全面且高質(zhì)量的回答。此外,元寶還具備文檔總結(jié)、翻譯、圖片識別等多種功能,并支持多文檔和鏈接閱讀,顯示出騰訊在AI領域的野心和實力。作者對元寶的未來及其對公眾號生態(tài)的潛在正面影響抱有極大期待。
(四)SEAL大模型排行榜發(fā)布,Claude 3 Opus數(shù)學領域奪冠
5月30日,由27歲華裔創(chuàng)始人Alexandr Wang領導的Scale AI推出了全新的大型語言模型(LLM)排行榜——SEAL。這個排行榜以其私有數(shù)據(jù)、專家評估和持續(xù)更新的特點迅速獲得AI界的認可。SEAL排行榜強調(diào)公正性、高質(zhì)量和可信度,定期引入新的數(shù)據(jù)集和模型以保持動態(tài)競爭環(huán)境。在最新發(fā)布的排行榜中,Claude 3 Opus在數(shù)學分類榜中超越了GPT-4 Turbo Preview,奪得第一名,顯示了其在數(shù)學和推理領域的卓越能力。此外,Scale AI還設計了新的數(shù)學和推理數(shù)據(jù)集GSM1k,旨在全面評估模型的各方面能力,避免過擬合問題。業(yè)界專家如Jim Fan和Andrej Karpathy對SEAL排行榜的發(fā)布表示肯定,認為它是對現(xiàn)有評估體系的重要補充。
(五)浪潮信息發(fā)布源2.0-M32大模型,性能對標Llama 3,算力消耗大幅降低
5月28日,浪潮信息最近發(fā)布了一款全新的基于MoE(Mixture of Experts)的源2.0-M32開源大模型,該模型不僅全面開源且支持免費商用,而且在模型性能上能夠與700億參數(shù)規(guī)模的Llama 3相媲美。源2.0-M32擁有400億參數(shù)量和37億激活參數(shù),其在訓練、微調(diào)和推理過程中的算力開銷顯著低于Llama3-70B,具體來說,源2.0-M32單Token下訓練和推理所需的算力資源僅為Llama3-70B的1/19。這一技術進步得益于浪潮信息在算法結(jié)構(gòu)、數(shù)據(jù)獲取和算力方面的創(chuàng)新,包括引入基于注意力機制的門控網(wǎng)絡技術和局部注意力過濾增強機制(LFA),以及在數(shù)據(jù)層面的訓練Token數(shù)量的顯著提升和流水并行的方法。浪潮信息的這一創(chuàng)新為企業(yè)提供了一個更為經(jīng)濟、高效的大模型落地方案,進一步推動了大模型在各行各業(yè)的應用普及。
(一)OpenAI研究員解析語言模型評估的重要性與挑戰(zhàn)
近日,OpenAI研究員Jason Wei在其最新博客文章中強調(diào)了語言模型(LLM)評估的重要性,并探討了成功評估應具備的因素。他指出評估基準是研究社區(qū)的直接激勵,與模型性能的重大突破密切相關。文章總結(jié)了評估在NLP社區(qū)獲得關注所面臨的“七宗罪”,并討論了如何創(chuàng)建和推廣有效的評估測試。Wei還分享了他對評估基準的個人見解,包括成功評估的特質(zhì)、推廣新評估的策略,以及評估基準在LLM領域中如何流行起來的原因。
(二)中國AI創(chuàng)業(yè)者對行業(yè)前景的看法:差距、挑戰(zhàn)與新機遇
在第四屆BEYOND國際科技創(chuàng)新博覽會的“AI Panel”圓桌對話中,澳門科技總會會長賀建東、商湯科技聯(lián)合創(chuàng)始人徐冰、科大訊飛董事長劉慶峰和壁仞科技創(chuàng)始人張文就中美AI領域的優(yōu)勢、AI發(fā)展的合理邊界及創(chuàng)業(yè)機遇進行了深入討論。徐冰認為中美之間在算力上存在約10倍的差距,但這一差距可通過資金投入彌補。張文則表示,未來創(chuàng)業(yè)可能不再選擇AI領域,而是轉(zhuǎn)向餐飲業(yè),以避免潛在的美國制裁。劉慶峰指出,中國的大公司在市場中的主導地位對中小企業(yè)創(chuàng)新不利,呼吁建立更良性的生態(tài)。三位企業(yè)家還就AI發(fā)展階段、未來影響以及創(chuàng)業(yè)時機等問題分享了各自的看法,普遍認為AI發(fā)展是一個長期過程,需要法律、倫理和人文的協(xié)同推動,并強調(diào)了跨學科結(jié)合AI的創(chuàng)新潛力。
(三)國內(nèi)大模型價格戰(zhàn):創(chuàng)新與市場競爭的較量
近期,國內(nèi)大模型領域爆發(fā)價格戰(zhàn),以字節(jié)跳動、阿里云、百度、騰訊云和科大訊飛為代表的科技巨頭紛紛大幅降低大模型服務價格,甚至推出免費版本,以吸引開發(fā)者和市場關注。這場價格戰(zhàn)背后,實際上是中美科技企業(yè)在AI大模型競賽中選擇了不同的發(fā)展路徑:美國企業(yè)更注重技術創(chuàng)新,而中國企業(yè)則更傾向于通過價格競爭來快速占領市場。盡管降價策略短期內(nèi)對開發(fā)者有利,但業(yè)內(nèi)人士提醒,開發(fā)者在選擇大模型時應關注模型能力與應用場景的匹配,避免因貪圖便宜而增加創(chuàng)業(yè)成本。同時,降價更多被視為一種營銷手段,旨在吸引開發(fā)者加入,為大模型生態(tài)注入數(shù)據(jù)和用云量,推動整個AI應用生態(tài)的繁榮。
(四)孫茂松教授展望大模型技術未來:競爭、創(chuàng)新與挑戰(zhàn)
近期,在北大光華和度小滿聯(lián)合推出的大模型公開課上,清華大學人工智能研究院常務副院長孫茂松教授發(fā)表了題為“生成式人工智能及大模型對科技、文化和教育的影響”的演講。孫教授認為,AI將推動技術創(chuàng)新的變革,但信任風險和安全管理也將成為重要議題。他預測,到2026年,超過80%的企業(yè)將使用生成式AI,而目前這一比例不足5%。孫教授強調(diào),大模型技術將深刻影響教育模式,但也可能帶來“幻覺現(xiàn)象”,需要認真對待和防范。他還提到,盡管中國在大模型的數(shù)量上位列第二,與美國相比仍有較大差距,中國需提升大模型的能力,并在未來三年內(nèi)在垂直領域開發(fā)出有影響力的技術和產(chǎn)品。最后,孫教授鼓勵企業(yè)和研究者探索大模型在垂直領域的應用,形成獨特競爭優(yōu)勢,并提醒終身學習的重要性,以應對AI帶來的挑戰(zhàn)。
來源:每經(jīng)科技提供
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP