国产成人精品免费视,91天堂嫩模在线播放,国产免费小视频在线观看,久久免费公开视频,国产成人精品免费视频网页大全,日韩不卡在线视频,视频一区二区精品的福利

每日經(jīng)濟(jì)新聞

要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

OpenAI終止對(duì)中國(guó)提供API服務(wù)，周鴻祎發(fā)聲：壓制不住國(guó)內(nèi)大模型發(fā)展

每日經(jīng)濟(jì)新聞 2024-06-26 13:20:25

每經(jīng)編輯畢陸名

26日，360集團(tuán)創(chuàng)始人、董事長(zhǎng)@周鴻祎在微博發(fā)布視頻稱，他認(rèn)為“OpenAI對(duì)中國(guó)地區(qū)停止服務(wù)只能加速中國(guó)自己大模型產(chǎn)業(yè)的發(fā)展，未必是一個(gè)壞事。”他解釋道：“OpenAI的API無法調(diào)用，這逼著國(guó)內(nèi)應(yīng)用只能選擇國(guó)產(chǎn)大模型，而國(guó)產(chǎn)大模型與GPT的差距已經(jīng)逐漸縮小了。”

消息面上，6月25日，OpenAI向中國(guó)用戶發(fā)布郵件稱，自7月9日起阻止來自非支持國(guó)家和地區(qū)的API流量。受影響組織若希望繼續(xù)使用OpenAI的服務(wù)，必須在其支持的國(guó)家或地區(qū)內(nèi)訪問。目前，OpenAI的API向161個(gè)國(guó)家和地區(qū)開放，由于中國(guó)未在其中，這意味著OpenAI將終止對(duì)中國(guó)提供API服務(wù)。

值得一提的是，25日，每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告（第1期）發(fā)布?！睹咳战?jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告》（第一期）顯示，國(guó)產(chǎn)大模型正在全面趕超海外大模型，零一萬物Yi-Large成為最大“黑馬”，在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”“微博新聞寫作”“文章差錯(cuò)校對(duì)”“財(cái)務(wù)數(shù)據(jù)計(jì)算與分析”四大應(yīng)用場(chǎng)景的總分排名第一。幻方求索DeepSeek-V2、百川智能Baichuan4則在“財(cái)務(wù)數(shù)據(jù)計(jì)算與分析”場(chǎng)景顯示出強(qiáng)大的數(shù)據(jù)計(jì)算和分析能力。而一直備受各界推崇的GPT 4.0在本次評(píng)測(cè)中表現(xiàn)不佳，甚至在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”場(chǎng)景中排名墊底。

OpenAI對(duì)中國(guó)API“停服”！

據(jù)媒體報(bào)道，25日，OpenAI宣布終止對(duì)包括中國(guó)大陸在內(nèi)的地區(qū)提供API服務(wù)。25日凌晨，部分開發(fā)者收到了來自O(shè)penAI官方的郵件。

郵件顯示：“我們的數(shù)據(jù)顯示，貴組織的APl流量來自O(shè)penAl目前不支持的地區(qū)。您可以在此處找到受支持的國(guó)家和地區(qū)。我們將從7月9日開始采取額外措施，阻止來自不在我們支持的國(guó)家和地區(qū)列表中的地區(qū)的APl流量。要繼續(xù)使用OpenAl的服務(wù)，您需要在受支持的地區(qū)訪問服務(wù)。”

據(jù)悉，目前OpenAI的API向161個(gè)國(guó)家和地區(qū)開放，但中國(guó)大陸未包含在其中。這也意味著，OpenAI宣布終止對(duì)中國(guó)大陸提供API服務(wù)。

阿里云百煉第一時(shí)間宣布，將為OpenAI API用戶提供最具性價(jià)比的中國(guó)大模型替代方案，并為中國(guó)開發(fā)者提供2200萬免費(fèi)tokens和專屬遷移服務(wù)。根據(jù)斯坦福最新公布的大模型測(cè)評(píng)榜單HELM MMLU，Qwen2-72B得分為0.824，與GPT-4并列全球第四。通義千問GPT4級(jí)主力模型Qwen-plus在阿里云百煉上的調(diào)用價(jià)格為0.004元/千tokens，僅為GPT-4的50分之一。

6月25日，智譜推出OpenAI API用戶特別搬家計(jì)劃，幫助用戶切換至國(guó)產(chǎn)大模型。具體來看，智譜為開發(fā)者提供：1.5億Token（5000萬GLM-4+1億GLM-4-Air）；從OpenAI到GLM的系列遷移培訓(xùn)。對(duì)于高用量客戶，智譜提供與OpenAI使用規(guī)模對(duì)等的Token贈(zèng)送計(jì)劃(不設(shè)上限)，以及與OpenAI對(duì)等的并發(fā)規(guī)模等。

6月25日，百度智能云千帆推出大模型普惠計(jì)劃，即日起為新注冊(cè)企業(yè)用戶提供0元調(diào)用、0元訓(xùn)練、0元遷移等服務(wù)。

其中，文心旗艦?zāi)Ｐ褪状蚊赓M(fèi)，贈(zèng)送ERNIE3.5旗艦?zāi)Ｐ?000萬Tokens包，主力模型ERNIE Speed/ERNIE Lite和輕量模型ERNIE Tiny持續(xù)免費(fèi)；針對(duì)OpenAI遷移用戶額外贈(zèng)送與OpenAI使用規(guī)模對(duì)等的ERNIE3.5旗艦?zāi)Ｐ蚑okens包。以上優(yōu)惠活動(dòng)均在2024年7月25日24點(diǎn)前適用。

國(guó)產(chǎn)大模型正全面趕超

近期，由30余位每日經(jīng)濟(jì)新聞優(yōu)秀記者、編輯和子公司每經(jīng)科技工程師組建的“每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)小組”，對(duì)市場(chǎng)上主流大模型在財(cái)經(jīng)新聞工作場(chǎng)景中的表現(xiàn)與能力進(jìn)行了歷時(shí)2個(gè)月深入評(píng)測(cè)，并于6月25日發(fā)布了《每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告》（第一期）。

《每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告》（第一期）顯示，國(guó)產(chǎn)大模型正在全面趕超海外大模型，零一萬物Yi-Large成為最大“黑馬”，在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”“微博新聞寫作”“文章差錯(cuò)校對(duì)”“財(cái)務(wù)數(shù)據(jù)計(jì)算與分析”四大應(yīng)用場(chǎng)景的總分排名第一。幻方求索DeepSeek-V2、百川智能Baichuan4則在“財(cái)務(wù)數(shù)據(jù)計(jì)算與分析”場(chǎng)景顯示出強(qiáng)大的數(shù)據(jù)計(jì)算和分析能力。而一直備受各界推崇的GPT 4.0在本次評(píng)測(cè)中表現(xiàn)不佳，甚至在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”場(chǎng)景中排名墊底。

經(jīng)過評(píng)測(cè)，《每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告》（第一期）得出以下結(jié)論。

結(jié)論一：國(guó)產(chǎn)大模型正全面趕超

國(guó)產(chǎn)大模型正逐漸展現(xiàn)出其競(jìng)爭(zhēng)力。與國(guó)外大模型相比，它們?cè)诙鄠€(gè)任務(wù)上的表現(xiàn)已經(jīng)顯示出趕超之勢(shì)。

國(guó)產(chǎn)大模型在多個(gè)測(cè)試場(chǎng)景中排名靠前。商湯商量SenseChat-5三次占據(jù)前五席位，兩次擊敗谷歌Gemini 1.5 Pro。在國(guó)外模型中，Anthropic Claude 3 Opus同樣在三個(gè)測(cè)評(píng)場(chǎng)景中排名前五，谷歌Gemini 1.5 Pro在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”和“文章差錯(cuò)校對(duì)”兩個(gè)場(chǎng)景中排名第一。令人意外的是，一直備受各界推崇的GPT 4.0卻在本次評(píng)測(cè)中整體表現(xiàn)不佳，在每個(gè)場(chǎng)景中都未能斬獲前五名，甚至在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”中排名墊底。

“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”場(chǎng)景中，商湯商量SenseChat-5、字節(jié)豆包Doubao-pro-32k和百度ERNIE 4.0等，在信息提煉準(zhǔn)確和重要新聞點(diǎn)突出方面與谷歌的Gemini 1.5 Pro不相上下。

“微博新聞寫作”場(chǎng)景中，百度文心ERNIE 4.0、商湯SenseChat-5等模型的總分與國(guó)外模型Anthropic Claude 3 Opus并列第一。

“文章差錯(cuò)校對(duì)”場(chǎng)景中，零一萬物Yi-Large是唯一一款得分超過100分的國(guó)產(chǎn)大模型。國(guó)產(chǎn)大模型比國(guó)外大模型更能理解漢語(yǔ)句式和表達(dá)規(guī)范。但在查找并修改錯(cuò)別字、標(biāo)點(diǎn)使用不當(dāng)、數(shù)字和量詞錯(cuò)誤、事實(shí)和信息錯(cuò)誤等要求更精準(zhǔn)的任務(wù)方面，還有提升空間。

“財(cái)務(wù)數(shù)據(jù)計(jì)算和分析”場(chǎng)景中，Anthropic Claude 3 Opus總分雖領(lǐng)先，但對(duì)幻方求索DeepSeek-V2和零一萬物Yi-Large的優(yōu)勢(shì)并不大。尤其是幻方求索DeepSeek-V2成為此場(chǎng)景評(píng)測(cè)中一匹“黑馬”，其“財(cái)務(wù)數(shù)據(jù)分析”能力突出。

結(jié)論二：大模型各有專長(zhǎng)

不同模型在特定場(chǎng)景、特定維度、特定指標(biāo)上的表現(xiàn)差異顯著。體現(xiàn)了它們?cè)诟髯灶I(lǐng)域的專長(zhǎng)。

例如，谷歌Gemini 1.5 Pro在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”和“文章差錯(cuò)校對(duì)”兩大場(chǎng)景中排名第一。在“微博新聞寫作”場(chǎng)景中，該模型整體排名靠后。

Anthropic Claude 3 Opus、幻方求索DeepSeek-V2、百川智能Baichuan4則顯示出了強(qiáng)大的數(shù)據(jù)計(jì)算能力。

結(jié)論三：在跨語(yǔ)言環(huán)境下差異明顯

以“微博新聞寫作”場(chǎng)景為例，百度文心ERNIE 4.0、商湯商量SenseChat-5與Anthropic Claude 3 Opus并列第一。這反映了國(guó)產(chǎn)大模型在微博這一國(guó)內(nèi)社交媒體場(chǎng)景下的卓越表現(xiàn)。國(guó)產(chǎn)大模型更能夠準(zhǔn)確把握微博用戶的內(nèi)容偏好和交流方式，生成符合平臺(tái)特性和用戶期待的微博文案。

相比之下，谷歌Gemini 1.5 Pro在微博寫作的運(yùn)營(yíng)維度上得分為0，可能源于其對(duì)微博平臺(tái)特性和用戶行為的不熟悉。

在中文語(yǔ)境之下，GPT 4.0在全部4個(gè)場(chǎng)景中的排名均不理想。這一現(xiàn)象突顯了大模型在跨語(yǔ)言和文化環(huán)境中的適應(yīng)性問題，也表明了國(guó)產(chǎn)大模型在本土化應(yīng)用上具有天然優(yōu)勢(shì)。

結(jié)論四：信息提取能力參差不齊

從文章中準(zhǔn)確提取關(guān)鍵信息，是對(duì)大模型能力的一項(xiàng)關(guān)鍵挑戰(zhàn)。本期評(píng)測(cè)中“文章差錯(cuò)校對(duì)”場(chǎng)景正包含了對(duì)這一能力的測(cè)試。

谷歌Gemini 1.5 Pro憑借其在錯(cuò)別字、標(biāo)點(diǎn)使用不當(dāng)、數(shù)字和量詞錯(cuò)誤、事實(shí)和信息錯(cuò)誤的查找和糾錯(cuò)方面與其他大模型拉開了差距。

相比之下，零一萬物Yi-Large在病句查找和糾錯(cuò)方面則位居首位，本可以挑戰(zhàn)谷歌Gemini 1.5 Pro，但在錯(cuò)誤查找方面的表現(xiàn)拖了后腿。

大模型信息提取能力的差異可能與模型的訓(xùn)練數(shù)據(jù)、算法設(shè)計(jì)以及對(duì)語(yǔ)言細(xì)微差別的捕捉能力有關(guān)。增強(qiáng)大模型的信息提取能力，可以提高其生成結(jié)果的準(zhǔn)確度，更能讓大模型適用于對(duì)準(zhǔn)確性要求極高的新聞工作。

每日經(jīng)濟(jì)新聞綜合@周鴻祎

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

26日，360集團(tuán)創(chuàng)始人、董事長(zhǎng)@周鴻祎在微博發(fā)布視頻稱，他認(rèn)為“OpenAI對(duì)中國(guó)地區(qū)停止服務(wù)只能加速中國(guó)自己大模型產(chǎn)業(yè)的發(fā)展，未必是一個(gè)壞事?！彼忉尩溃骸癘penAI的API無法調(diào)用，這逼著國(guó)內(nèi)應(yīng)用只能選擇國(guó)產(chǎn)大模型，而國(guó)產(chǎn)大模型與GPT的差距已經(jīng)逐漸縮小了?！? 消息面上，6月25日，OpenAI向中國(guó)用戶發(fā)布郵件稱，自7月9日起阻止來自非支持國(guó)家和地區(qū)的API流量。受影響組織若希望繼續(xù)使用OpenAI的服務(wù)，必須在其支持的國(guó)家或地區(qū)內(nèi)訪問。目前，OpenAI的API向161個(gè)國(guó)家和地區(qū)開放，由于中國(guó)未在其中，這意味著OpenAI將終止對(duì)中國(guó)提供API服務(wù)。值得一提的是，25日，每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告（第1期）發(fā)布?！睹咳战?jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告》（第一期）顯示，國(guó)產(chǎn)大模型正在全面趕超海外大模型，零一萬物Yi-Large成為最大“黑馬”，在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”“微博新聞寫作”“文章差錯(cuò)校對(duì)”“財(cái)務(wù)數(shù)據(jù)計(jì)算與分析”四大應(yīng)用場(chǎng)景的總分排名第一。幻方求索DeepSeek-V2、百川智能Baichuan4則在“財(cái)務(wù)數(shù)據(jù)計(jì)算與分析”場(chǎng)景顯示出強(qiáng)大的數(shù)據(jù)計(jì)算和分析能力。而一直備受各界推崇的GPT 4.0在本次評(píng)測(cè)中表現(xiàn)不佳，甚至在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”場(chǎng)景中排名墊底。 OpenAI對(duì)中國(guó)API“停服”！據(jù)媒體報(bào)道，25日，OpenAI宣布終止對(duì)包括中國(guó)大陸在內(nèi)的地區(qū)提供API服務(wù)。25日凌晨，部分開發(fā)者收到了來自O(shè)penAI官方的郵件。郵件顯示：“我們的數(shù)據(jù)顯示，貴組織的APl流量來自O(shè)penAl目前不支持的地區(qū)。您可以在此處找到受支持的國(guó)家和地區(qū)。我們將從7月9日開始采取額外措施，阻止來自不在我們支持的國(guó)家和地區(qū)列表中的地區(qū)的APl流量。要繼續(xù)使用OpenAl的服務(wù)，您需要在受支持的地區(qū)訪問服務(wù)?！? 據(jù)悉，目前OpenAI的API向161個(gè)國(guó)家和地區(qū)開放，但中國(guó)大陸未包含在其中。這也意味著，OpenAI宣布終止對(duì)中國(guó)大陸提供API服務(wù)。阿里云百煉第一時(shí)間宣布，將為OpenAI API用戶提供最具性價(jià)比的中國(guó)大模型替代方案，并為中國(guó)開發(fā)者提供2200萬免費(fèi)tokens和專屬遷移服務(wù)。根據(jù)斯坦福最新公布的大模型測(cè)評(píng)榜單HELM MMLU，Qwen2-72B得分為0.824，與GPT-4并列全球第四。通義千問GPT4級(jí)主力模型Qwen-plus在阿里云百煉上的調(diào)用價(jià)格為0.004元/千tokens，僅為GPT-4的50分之一。 6月25日，智譜推出OpenAI API用戶特別搬家計(jì)劃，幫助用戶切換至國(guó)產(chǎn)大模型。具體來看，智譜為開發(fā)者提供：1.5億Token（5000萬GLM-4+1億GLM-4-Air）；從OpenAI到GLM的系列遷移培訓(xùn)。對(duì)于高用量客戶，智譜提供與OpenAI使用規(guī)模對(duì)等的Token贈(zèng)送計(jì)劃(不設(shè)上限)，以及與OpenAI對(duì)等的并發(fā)規(guī)模等。 6月25日，百度智能云千帆推出大模型普惠計(jì)劃，即日起為新注冊(cè)企業(yè)用戶提供0元調(diào)用、0元訓(xùn)練、0元遷移等服務(wù)。其中，文心旗艦?zāi)Ｐ褪状蚊赓M(fèi)，贈(zèng)送ERNIE3.5旗艦?zāi)Ｐ?000萬Tokens包，主力模型ERNIE Speed/ERNIE Lite和輕量模型ERNIE Tiny持續(xù)免費(fèi)；針對(duì)OpenAI遷移用戶額外贈(zèng)送與OpenAI使用規(guī)模對(duì)等的ERNIE3.5旗艦?zāi)Ｐ蚑okens包。以上優(yōu)惠活動(dòng)均在2024年7月25日24點(diǎn)前適用。國(guó)產(chǎn)大模型正全面趕超近期，由30余位每日經(jīng)濟(jì)新聞優(yōu)秀記者、編輯和子公司每經(jīng)科技工程師組建的“每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)小組”，對(duì)市場(chǎng)上主流大模型在財(cái)經(jīng)新聞工作場(chǎng)景中的表現(xiàn)與能力進(jìn)行了歷時(shí)2個(gè)月深入評(píng)測(cè)，并于6月25日發(fā)布了《每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告》（第一期）。《每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告》（第一期）顯示，國(guó)產(chǎn)大模型正在全面趕超海外大模型，零一萬物Yi-Large成為最大“黑馬”，在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”“微博新聞寫作”“文章差錯(cuò)校對(duì)”“財(cái)務(wù)數(shù)據(jù)計(jì)算與分析”四大應(yīng)用場(chǎng)景的總分排名第一?；梅角笏鱀eepSeek-V2、百川智能Baichuan4則在“財(cái)務(wù)數(shù)據(jù)計(jì)算與分析”場(chǎng)景顯示出強(qiáng)大的數(shù)據(jù)計(jì)算和分析能力。而一直備受各界推崇的GPT 4.0在本次評(píng)測(cè)中表現(xiàn)不佳，甚至在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”場(chǎng)景中排名墊底。經(jīng)過評(píng)測(cè)，《每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告》（第一期）得出以下結(jié)論。結(jié)論一：國(guó)產(chǎn)大模型正全面趕超國(guó)產(chǎn)大模型正逐漸展現(xiàn)出其競(jìng)爭(zhēng)力。與國(guó)外大模型相比，它們?cè)诙鄠€(gè)任務(wù)上的表現(xiàn)已經(jīng)顯示出趕超之勢(shì)。國(guó)產(chǎn)大模型在多個(gè)測(cè)試場(chǎng)景中排名靠前。商湯商量SenseChat-5三次占據(jù)前五席位，兩次擊敗谷歌Gemini 1.5 Pro。在國(guó)外模型中，Anthropic Claude 3 Opus同樣在三個(gè)測(cè)評(píng)場(chǎng)景中排名前五，谷歌Gemini 1.5 Pro在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”和“文章差錯(cuò)校對(duì)”兩個(gè)場(chǎng)景中排名第一。令人意外的是，一直備受各界推崇的GPT 4.0卻在本次評(píng)測(cè)中整體表現(xiàn)不佳，在每個(gè)場(chǎng)景中都未能斬獲前五名，甚至在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”中排名墊底。 “財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”場(chǎng)景中，商湯商量SenseChat-5、字節(jié)豆包Doubao-pro-32k和百度ERNIE 4.0等，在信息提煉準(zhǔn)確和重要新聞點(diǎn)突出方面與谷歌的Gemini 1.5 Pro不相上下。 “微博新聞寫作”場(chǎng)景中，百度文心ERNIE 4.0、商湯SenseChat-5等模型的總分與國(guó)外模型Anthropic Claude 3 Opus并列第一。 “文章差錯(cuò)校對(duì)”場(chǎng)景中，零一萬物Yi-Large是唯一一款得分超過100分的國(guó)產(chǎn)大模型。國(guó)產(chǎn)大模型比國(guó)外大模型更能理解漢語(yǔ)句式和表達(dá)規(guī)范。但在查找并修改錯(cuò)別字、標(biāo)點(diǎn)使用不當(dāng)、數(shù)字和量詞錯(cuò)誤、事實(shí)和信息錯(cuò)誤等要求更精準(zhǔn)的任務(wù)方面，還有提升空間。 “財(cái)務(wù)數(shù)據(jù)計(jì)算和分析”場(chǎng)景中，Anthropic Claude 3 Opus總分雖領(lǐng)先，但對(duì)幻方求索DeepSeek-V2和零一萬物Yi-Large的優(yōu)勢(shì)并不大。尤其是幻方求索DeepSeek-V2成為此場(chǎng)景評(píng)測(cè)中一匹“黑馬”，其“財(cái)務(wù)數(shù)據(jù)分析”能力突出。結(jié)論二：大模型各有專長(zhǎng) 不同模型在特定場(chǎng)景、特定維度、特定指標(biāo)上的表現(xiàn)差異顯著。體現(xiàn)了它們?cè)诟髯灶I(lǐng)域的專長(zhǎng)。例如，谷歌Gemini 1.5 Pro在“財(cái)經(jīng)新聞標(biāo)題創(chuàng)作”和“文章差錯(cuò)校對(duì)”兩大場(chǎng)景中排名第一。在“微博新聞寫作”場(chǎng)景中，該模型整體排名靠后。 Anthropic Claude 3 Opus、幻方求索DeepSeek-V2、百川智能Baichuan4則顯示出了強(qiáng)大的數(shù)據(jù)計(jì)算能力。結(jié)論三：在跨語(yǔ)言環(huán)境下差異明顯以“微博新聞寫作”場(chǎng)景為例，百度文心ERNIE 4.0、商湯商量SenseChat-5與Anthropic Claude 3 Opus并列第一。這反映了國(guó)產(chǎn)大模型在微博這一國(guó)內(nèi)社交媒體場(chǎng)景下的卓越表現(xiàn)。國(guó)產(chǎn)大模型更能夠準(zhǔn)確把握微博用戶的內(nèi)容偏好和交流方式，生成符合平臺(tái)特性和用戶期待的微博文案。相比之下，谷歌Gemini 1.5 Pro在微博寫作的運(yùn)營(yíng)維度上得分為0，可能源于其對(duì)微博平臺(tái)特性和用戶行為的不熟悉。在中文語(yǔ)境之下，GPT 4.0在全部4個(gè)場(chǎng)景中的排名均不理想。這一現(xiàn)象突顯了大模型在跨語(yǔ)言和文化環(huán)境中的適應(yīng)性問題，也表明了國(guó)產(chǎn)大模型在本土化應(yīng)用上具有天然優(yōu)勢(shì)。結(jié)論四：信息提取能力參差不齊從文章中準(zhǔn)確提取關(guān)鍵信息，是對(duì)大模型能力的一項(xiàng)關(guān)鍵挑戰(zhàn)。本期評(píng)測(cè)中“文章差錯(cuò)校對(duì)”場(chǎng)景正包含了對(duì)這一能力的測(cè)試。谷歌Gemini 1.5 Pro憑借其在錯(cuò)別字、標(biāo)點(diǎn)使用不當(dāng)、數(shù)字和量詞錯(cuò)誤、事實(shí)和信息錯(cuò)誤的查找和糾錯(cuò)方面與其他大模型拉開了差距。相比之下，零一萬物Yi-Large在病句查找和糾錯(cuò)方面則位居首位，本可以挑戰(zhàn)谷歌Gemini 1.5 Pro，但在錯(cuò)誤查找方面的表現(xiàn)拖了后腿。大模型信息提取能力的差異可能與模型的訓(xùn)練數(shù)據(jù)、算法設(shè)計(jì)以及對(duì)語(yǔ)言細(xì)微差別的捕捉能力有關(guān)。增強(qiáng)大模型的信息提取能力，可以提高其生成結(jié)果的準(zhǔn)確度，更能讓大模型適用于對(duì)準(zhǔn)確性要求極高的新聞工作。每日經(jīng)濟(jì)新聞綜合@周鴻祎

模型大模型 Ai OpenAI

上一篇文章

三大指數(shù)先后翻紅，新能源車ETF（515030）拉升漲超1.7%，融捷股份漲停

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

品牌讀榜·行業(yè)篇②丨金融行業(yè)：工商銀行蟬聯(lián)榜首，品牌價(jià)值超4000億元

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁(yè)

Copyright ? 2024 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國(guó)互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn