国产成人精品免费视,91天堂嫩模在线播放,国产免费小视频在线观看,久久免费公开视频,国产成人精品免费视频网页大全,日韩不卡在线视频,视频一区二区精品的福利

<i id="cj4o4"></i>

每日經(jīng)濟新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

Kimi、豆包領跑，國產(chǎn)AI迎來新格局

每日經(jīng)濟新聞 2024-11-25 21:05:11

每經(jīng)記者楊昕怡每經(jīng)編輯蒙錦濤

一道步驟難懂的數(shù)學奧賽試題、一場組會中的“頭腦風暴”、一個需要做大量“功課”才能做出的生活決策——當大模型能像人類一樣思考時，你會發(fā)現(xiàn)，這一切都將在一次回車的敲下后迎刃而解。

“什么樣的場景最適合讓AI鍛煉思考能力？我們認為是數(shù)學場景?！?strong>11月16日，月之暗面創(chuàng)始人楊植麟發(fā)布了新一代數(shù)學能力可對標OpenAI o1系列的數(shù)學推理模型k0-math，在中考、高考、考研以及包含競賽題的MATH等數(shù)學基準測試中，k0-math初代模型成績已經(jīng)超過o1-mini和o1-preview模型。

“這可以說是，在OpenAI o1發(fā)布后，國內(nèi)首個摸索出并實現(xiàn)o1思路的公司?！睂τ趉0-math的推出，一位國內(nèi)頭部互聯(lián)網(wǎng)公司的大模型技術人員表示，k0-math模型采用的全新強化學習和思維鏈（CoT）推理技術，正是業(yè)內(nèi)普遍認為OpenAI o1系列的技術關鍵所在，國內(nèi)多家互聯(lián)網(wǎng)巨頭均在破解這一“新思路”，但在k0-math發(fā)布時，尚未有其他類似模型問世。

在“百模大戰(zhàn)”開戰(zhàn)的一年多里，新技術、新團隊、新應用不斷涌現(xiàn)，戰(zhàn)況也隨之頻繁變動。從月之暗面、零一萬物等“新AI六小龍”和字節(jié)跳動、阿里等互聯(lián)網(wǎng)大廠團隊在混戰(zhàn)中脫穎而出，到如今應用最廣的AI智能助手陸續(xù)上線，可以觀察到的是，豆包和Kimi的領先讓AI智能助手領域逐漸呈現(xiàn)出了“兩超多強”的新格局。

新模型登場

Kimi對標o1

“如果你有100枚硬幣，每枚硬幣正面朝上。每次翻轉包含當前正面朝上的硬幣和它相鄰的兩枚硬幣。最少需要翻轉多少次才能使所有硬幣反面朝上？”

仿佛一個數(shù)學天才型選手，Kimi數(shù)學版在40秒鐘里完成了對該題的問題分解、3種思路嘗試、解法驗證并正確作答的全套解題流程。

值得注意的是，其中，“意識到逐個翻轉硬幣不可行，我開始思考如何最大化每次翻轉的效果”“意識到翻轉之間隔兩枚硬幣會導致重疊，我考慮增加間隔”等對思維鏈推理的展示，均是模型自我思考能力的體現(xiàn)。

今年9月，被Open AI創(chuàng)始人Sam Altman喻為“新范式開始”的o1誕生，以模仿人類思維過程進行的強化學習和思維鏈技術，突破了AI推理瓶頸。自此，行業(yè)的技術焦點也從預訓練轉向了推理和強化學習。

11月16日，Kimi率先交出國內(nèi)首份答卷。據(jù)介紹，相較于以盡快提供答案為關鍵目標的常規(guī)模型，新推出的k0-math模型在做題過程中會花更長的時間來推理，包括思考和規(guī)劃思路，并且在必要時自行反思改進解題思路，提升答題的成功率。

發(fā)布會上，月之暗面公布了k0-math的目前測評得分：在業(yè)界最常使用的數(shù)學能力基準測試MATH中，k0-math模型得分93.8分，超過o1-mini的90分和o1-preview的85.5分，且k0-math這一成績僅次于o1完全版的94.8分。

在兩個難度更大的競賽級別的數(shù)學題庫OMNI-MATH和AIME基準測試中，k0-math初代模型的表現(xiàn)分別達到了o1-mini最高成績的90%和83%。

從線上AI社區(qū)的討論中選取一道數(shù)學題進行實測，Kimi數(shù)學版用時2分10秒完成了對該題的正確解答。從線上該帖的評論區(qū)反饋來看，在求解該題時，o1-mini和o1-preview在用時上有約30秒的優(yōu)勢，但多次測試均未得出正確答案。

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E072z5v5GbILvo2wQB5wNHqgJibaF7vBBOkiaAom1l6icFn1WObLCKlpbyg.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0PadMrTpKYqhEuicZLT0wEsodKW3Imv43NSctyFXfsnGAxNmkV76S2oQ.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0DccmMkkXNCHgicTjLVIx1kjHGyJBg8yYTyMRibQNnDV9bm9ibBktViaNlQ.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0lZoP0ibO0iadqX56p6WncSCfiax853KJAiarQEjFnP988Acgictbx5XVqeA.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0tnu6A6YUklHjRjv5PnT7ibXREnibHUsYJiaWhRTgcaUyfu08mecCXmfkg.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0tt7nLK5HqJWnHAX224Yk0ErUvgevDiapw5icN1pre5ibFllNqengaczibw.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0fVvpTPkkrHTrZxI2NmGCvPT65iaLIZ1rNdevEyt2cn1iaSspibG1otLyg.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E01mC9694YgOYLueIssNIb2CpBX64kg4e9vsaaltjGY4dibPEpZcK3WZA.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0icPRJXyeAcEbDMAibtIsne7J8TBrLicETHZP9zNzZSTZBmGeV4L1uBXug.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0awodA17oXmwkP4LJSIB38D9RBLqBPVukrCOs2iccHOaMvroKdDuspNw.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E05kiaoQj6PHRDfMJeNTPibDa4bb6kREZzicDLXA9DgwiaEtAJKJ8vyga4bQ.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E04CT1lYLOV1QmfbhGdicMISu6pUUW4O2AKKLKib5ficszeKwXgjwcOqibTw.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0jWSIk85g6Bgvr8Nibb6uh2koqcibBhRvSrry0mwJoM8O6t7C5lVvtUnQ.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0C3ZYcEabJFwKOM0fv0rakAJfFPyMJy9HjKXPl324Z3qKATjRrSuB8A.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E0zA1PMdiaSNtzfEX1zNTQqicvBNTk7aTE7WCeELkaIjmDtmPymMBPFBEA.jpg

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E00vSAX24YKLH7N5YJuOHG3SpY7QiciavI7njzkmibx7T0jJAth2Athg0Jg.jpg

左右滑動查看更多

“該數(shù)學推理模型上的技術也可以被放進更多的場景里，例如讓Kimi探索版去做更多的探索。”正如楊植麟在發(fā)布會上所言，全新技術范式帶來的推理能力提升，也能泛化到更多日常任務上。

編輯就“找到北上廣深的各個市轄區(qū)內(nèi)，有重點初中，還有直升高中并且每年至少20個清北，告訴我這個區(qū)最適合的學區(qū)房”這一較為復雜的指令，對Kimi探索版、Kimi普通版和另兩款知名AI產(chǎn)品進行測試。

CFF20LXzkOx16PXLKczRGiaNdpR1AF3E01AwT2XH0Z1813YNxOibxNZvwk8UsNEncmmiciaMpCCuGQlvJtff1ZzEMg.png

測試結果顯示，Kimi探索版在搜索量、搜索內(nèi)容和生成內(nèi)容上優(yōu)勢明顯，甚至出現(xiàn)了對1311個網(wǎng)頁的分析，直觀感受到Kimi探索版在意圖增強、信源分析和鏈式思考上的能力提升。

豆包、Kimi的領先

分水嶺明顯

Kimi領先的每一步，都在一次次搜索中被用戶清晰地感知著。“以前2、3個小時才能看懂的文章，用Kimi幾分鐘就能得到所有關鍵信息，現(xiàn)在也會在實驗中讓探索版給出研究設計、方法論選擇上的建議?！币晃唤洗髮W的在讀工科博士表示。

基于Kimi對學術研究、市場分析等專業(yè)應用場景的不斷深耕和所體現(xiàn)出的明顯優(yōu)勢，其用戶群體涵蓋了學生、科研人員、職場人士和內(nèi)容創(chuàng)作者等知識需求型人群。月之暗面也表示，Kimi探索版發(fā)布后，受到了程序員、科學家、咨詢顧問、投資人、律師等專業(yè)人群的喜愛。

從用戶體量來看，根據(jù)量子位智庫統(tǒng)計的數(shù)據(jù)，截至今年10月，在國內(nèi)現(xiàn)有的68款AI智能助手產(chǎn)品中，只有豆包和Kimi邁過“5000萬大關”，其中豆包歷史累計下載量破億，Kimi智能助手下載總量超過5700萬。

榜單中，排名第3、4位的產(chǎn)品下載總量各超過2000萬。同時，10月新增用戶超1400萬的Kimi還在將身后的差距逐漸拉大，有望成為“破億俱樂部”的下一位成員。

第三方平臺點點數(shù)據(jù)也顯示，今年10月，ChatGPT、豆包和Kimi智能助手位列全球AI APP蘋果端下載量前三，占據(jù)了全球蘋果端AI APP下載量的51%。

在用戶黏性方面，量子位智庫指出，我國AI智能助手產(chǎn)品今年10月的留存率基本與上月持平，豆包和Kimi仍穩(wěn)居前二，兩者平均三日留存率超27%，平均七日新增留存率約18%。而其他AI助手產(chǎn)品的平均三日留存率均在25%以下。

此外，從用戶活躍度來看，Kimi的10月日活用戶量也僅次于豆包。月之暗面公布的數(shù)據(jù)顯示，截至今年10月，Kimi的月活已超3600萬人，而且數(shù)據(jù)仍在持續(xù)增長。

從用戶體量、活躍度和黏性等多個重要維度來觀察，豆包和Kimi已處于第一領跑集團，并與隨后各梯隊間出現(xiàn)鮮明的分水嶺。

“競爭本身并不產(chǎn)生價值，我們做好模型思考推理能力，給用戶帶來價值，做正確的事情，而不是專門做不一樣的事情?！痹趉0-math的發(fā)布會上，楊植麟談及和以交互能力見長的豆包的競爭時，再度以“聚焦”作為回應。

學會“聚焦”，這是楊植麟過去一年中的一個大課題。如今，這個“創(chuàng)業(yè)明星”和他的團隊決定眼看前方，繼續(xù)以加速度向月之暗面邁步前去。

記者|楊昕怡

編輯|蒙錦濤

CFF20LXzkOyuoQNVLRGWjVfciaeNyib50W3Y9TDLicWBibJKOzIkD8GjeQ1UXS4mD9ONYY5AAMMOvRlWic9Oh3K3Lrw.jpg

如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

亞泰集團：11月25日召開董事會會議

返回每經(jīng)網(wǎng)首頁

下一篇文章

百萬年薪女董秘，被前員工實名舉報！在公司任職已達17年，公司最新回應

相關文章

熱文精選

點擊排行

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

相關信息
關于我們
版權聲明

關注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2024 每日經(jīng)濟新聞報社版權所有，未經(jīng)許可不得轉載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

<style id="zksma"><tbody id="zksma"><noframes id="zksma"></noframes></tbody></style>

<td id="zksma"><tr id="zksma"></tr></td>