每日經濟新聞 2024-07-19 13:14:01
每經記者 蔡鼎 每經編輯 程鵬 蘭素英
美東時間7月18日(周四),OpenAI正式推出新一代入門級別人工智能模型“GPT-4o mini”,稱這款新模型是“功能最強、性價比最高的小參數(shù)模型”,旨在服務更廣泛的客戶群體。這也意味著開發(fā)人員如今有了一種輕量級且廉價的工具,讓他們能夠以更低的成本構建AI應用程序。
外媒報道中稱,目前,GPT-4o mini模型的應用程序編程接口支持文本和視覺,未來將支持文本、圖像、視頻和音頻的輸入和輸出。
更重要的是,最新的“GPT-4o mini”比GPT-4o便宜了96%~97%,比起GPT-3.5 Turbo也要便宜60%~70%。正因如此,隨著GPT-4o mini上架,GPT-3.5 Turbo的歷史使命到此結束。OpenAI還表示,GPT-4o mini是首個使用其全新安全策略“指令層級”的AI模型。
對于為何未能更早推出“小而精”的AI模型,OpenAI的API產品負責人Olivier Godement表示,這純粹是“優(yōu)先級”的問題,而隨著時間的推移,OpenAI注意到開發(fā)人員越來越渴望使用較小的模型,這也讓公司決定投入資源開發(fā)GPT-4o mini。
GPT-4o mini:比GPT-4o便宜96% 將取代GPT-3.5 Turbo
據(jù)OpenAI,GPT-4o mini的API價格將會是15美分/100萬Tokens輸入,以及60美分/100萬Tokens輸出。上下文窗口依然是12.8萬個Tokens,知識截止日期為2023年10月。公司拒絕透露新模型的參數(shù)量大小,僅表示與市面上類似的AI小模型(Claude Haiku、 Gemini 1.5 Flash等)處于同一個級別。
作為對比,GPT-4o的百萬Tokens輸入和輸出價格分別是5美元和15美元,之前的入門款模型GPT-3.5 Turbo定價分別是0.5美元和1.5美元。這就是說,最新的“迷你模型”的價格比GPT-4o便宜了96%~97%,比起GPT-3.5 Turbo也要便宜60%~70%。正因如此,隨著GPT-4o mini上架,GPT-3.5 Turbo的歷史使命到此結束。
根據(jù)Artificial Analysis的統(tǒng)計,GPT-4o mini已經達到美國AI公司主流“小模型”里面價格最低的位置,比起Anthropic、谷歌的同類型競品都要便宜一截。
OpenAI稱,最新的GPT-4o mini從周四起向ChatGPT的免費用戶以及ChatGPT Plus和ChatGPT Team的訂閱用戶開放,并將在下周向ChatGPT Enterprise用戶開放。GPT-4o mini將取代ChatGPT中的舊模型GPT-3.5 Turbo。
OpenAI表示,GPT-4o mini目前在聊天偏好上表現(xiàn)優(yōu)于GPT-4,在大規(guī)模多任務語言理解測試(MMLU)中的得分為82%。(注:MMLU是一個文本智能和推理基準,用于評估語言模型的能力。MMLU分數(shù)越高,表明該模型可以更好地理解和使用各種領域的語言,從而增強現(xiàn)實世界的應用。)
圖片來源:OpenAI官網(wǎng)截圖
而在這項測試中,同為小參數(shù)模型的谷歌Gemini Flash得分為77.9%,Claude Haiku得分為73.8%。在更大參數(shù)的模型中,GPT-3.5在這項測試中的得分為70%,GPT-4o得分為88.7%,谷歌Gemini Ultra據(jù)稱取得了有史以來最高分(90%)。
值得注意的是,研究人員對像MMLU這樣的基準測試持謹慎態(tài)度,因為不同公司的管理方式略有不同,因此不同模型的得分難以比較。還有一個問題是,模型的數(shù)據(jù)庫中可能有這些答案,也就是說其可以作弊,而且通常沒有第三方評估人員參與這個過程。
入局小模型的背后
外媒報道中稱,GPT-4o mini的推出也是OpenAI推動“多模態(tài)”(multimodality)技術發(fā)展努力的一部分,多模態(tài)指的是在一個大模型中提供多種類型的AI生成媒體,如文本、圖像、音頻和視頻。
不僅如此,這一全新小模型也承載著幫助OpenAI走入更廣泛的客戶群體的希望。OpenAI在今年早些時候的最新一輪融資過后,估值已經超過800以美元。雖然是全球生成式AI估值最高的獨角獸,但OpenAI仍面臨著壓力:一方面要保持其在生成式AI市場的領先地位,另一方面,由于其在AI基礎設施上投入了大量資金以構建和訓練模型,因此還要想方設法盈利。
圖片來源:OpenAI官網(wǎng)截圖
GPT-4o mini為開發(fā)人員提供一種輕量級且廉價的工具,讓他們能夠開發(fā)出所有的應用程序和工具,相對而言,GPT-4這種更大、更昂貴的模型是他們無法負擔得起的。此前,許多開發(fā)人員會轉向Claude 3 Haiku或Gemini 1.5 Flash,而不是支付運行最強大的模型所需的高昂計算成本。
而且,GPT-4o mini是首個使用OpenAI全新安全策略“指令層級”的AI模型。這種方法的目的是使AI系統(tǒng)優(yōu)先處理某些指令——例如來自公司的指令——以使人們更難讓工具做不該做的事情。
OpenAI的API產品負責人Olivier Godement在接受媒體采訪時解釋了為何該公司未能更早推出“小而精”的AI模型,他說,這純粹是“優(yōu)先級”的問題,因為OpenAI專注于創(chuàng)建更大、更好的模型,如GPT-4,這需要大量的人力和計算資源。隨著時間的推移,OpenAI注意到開發(fā)人員越來越渴望使用較小的模型,因此公司決定現(xiàn)在是投入資源開發(fā)GPT-4o mini的時機。
“我們的使命是使最前沿技術、構建最強大、最有用的應用程序,我們當然希望繼續(xù)做前沿模型,推動技術進步,”OpenAI的API產品負責人Olivier Godement在接受媒體采訪時說。“但我們也希望擁有最好的小模型,我認為它會非常受歡迎。”
“我認為GPT-4o mini真正體現(xiàn)了OpenAI讓AI更加普及的使命。如果我們希望AI惠及世界的每一個角落,每一個行業(yè),每一個應用,我們必須讓AI更加實惠。”Godement說道。
目前,金融科技初創(chuàng)公司Ramp已經使用GPT-4o mini構建了一個工具,可以提取收據(jù)上的費用數(shù)據(jù)。用戶無須費力地瀏覽文本框,只需上傳一張收據(jù)的圖片,該模型就會進行分類。
電子郵件客戶端Superhuman也對GPT-4o mini進行了測試,并用它創(chuàng)建了一個自動建議郵件回復的功能。
記者|蔡鼎
編輯|程鵬 蘭素英 杜恒峰
校對|何小桃
|每日經濟新聞 nbdnews 原創(chuàng)文章|
未經許可禁止轉載、摘編、復制及鏡像等使用
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP