每日經(jīng)濟新聞 2024-07-13 07:20:27
每經(jīng)編輯 杜宇
新近消息顯示,OpenAI正在讓人工智能(AI)大模型的能力更加接近類人的推理水平。
據(jù)知情人士和媒體查閱的內部文件,ChatGPT開發(fā)商OpenAI正在一個代號為“草莓”的項目中開發(fā)一種新的人工智能模型。該項目的細節(jié)此前從未被報道過,目前該公司正在努力展示其提供的模型類型能夠提供高級推理能力。這位知情人士說,即使在OpenAI內部,“草莓”的工作原理也是一個嚴格保密的秘密。
知情人士還透露,該內部文件描述了一個使用Strawberry模型的項目,目的是使該公司的人工智能不僅能夠生成查詢的答案,而且能夠提前做好足夠的計劃,自主、可靠地在互聯(lián)網(wǎng)上導航,以執(zhí)行OpenAI所說的“深度研究”。
圖片來源:視覺中國-VCG31N2008743681
OpenAI被問及上述所說的草莓技術時,OpenAI的發(fā)言人在一份聲明中表示:“我們希望自身AI 模型能夠像我們(人類)一樣看待和理解世界。持續(xù)研究新的AI能力是業(yè)界的常見做法,大家都相信這些系統(tǒng)的推理能力會隨著時間的推移而提高。”
雖然該發(fā)言人未直接回答有關草莓的問題,但媒體稱,草莓項目此前名為Q*。而Q*正是去年被爆出OpenAI CEO突然被解雇宮斗大戲的導火索。
去年11月媒體稱,OpenAI代號Q*的項目實現(xiàn)重大突破,讓人類實現(xiàn)通用人工智能(AGI)的步伐大大提速,但OpenAI CEO 奧特曼可能沒有和董事會詳細披露Q*的進展,這是董事會突然解雇奧特曼的一個原因。OpenAI的內部人士向董事會致信警告,Q*的重大發(fā)現(xiàn)可能威脅全人類。
媒體稱,Q*可能具備GPT-4所不具備的基礎數(shù)學能力,或許意味著與人類智能相媲美的推理能力,網(wǎng)友推測,這可能代表OpenAI朝著其設定的AGI目標邁出了一大步。
今年3月曝光的一份文件顯示,OpenAI計劃,在2027年以前,開發(fā)出人類水平的AGI。OpenAI 2022年就開始訓練一個125萬億參數(shù)的多模態(tài)模型,該模型名為Arrakis或Q*,原本計劃在2025年作為GPT-5發(fā)布,但因推理成本高而取消。OpenAI此后計劃,2027年發(fā)布的Q 2025(GPT-8)將實現(xiàn)完全的AGI。
人工智能(AI)研究者早就在爭論用什么標準判斷人類實現(xiàn)了通用人工智能(AGI)。OpenAI最近開發(fā)了一套系統(tǒng),“自定義”AI進化等級,以此追蹤開發(fā)人類級別AI的進展。
美東時間7月11日周四,OpenAI的發(fā)言人稱,OpenAI在本周二的公司全體會議上與員工分享了新的分類系統(tǒng),計劃與投資者和公司外部人士分享這些等級的信息。
OpenAI的系統(tǒng)劃分了五個AI水平,按一到五的數(shù)字由低到高排列等級。OpenAI的高管告訴員工,公司認為目前自身產(chǎn)品處于第一級,但即將達到第二級,也就是,可以完成基本問題解決任務的系統(tǒng),類似于擁有博士學位但無法使用任何工具的人。
7月11日OpenAI的發(fā)言人表示,OpenAI一直在內部測試新功能,這是業(yè)內的常見做法。
對于OpenAI開發(fā)AI分級系統(tǒng)的消息,有網(wǎng)友表示,擔心AI超越人類可能帶來的風險,不知道那對經(jīng)濟和就業(yè)有何影響。
今年5月,OpenAI發(fā)布新旗艦AI模型GPT-4o。它面向所有用戶、包括免費用戶,最快232毫秒響應音頻輸入,平均響應時間和人類相似;相比GPT-4 Turbo速度快兩倍,成本降低50%,API速率限制提高五倍。
上月傳出GPT-5可能大幅推遲上線的消息。OpenAI首席技術官Mira Murati稱,GPT-5有望在2025年底或2026年初推出。這一發(fā)布時間與早期傳聞有較大出入,市場曾預測GPT-5可能在2023年底或2024年夏季發(fā)布,
不過,Murati透露GPT-5的性能將迎來重大飛躍,在特定任務中達到博士級智能水平。據(jù)悉,GPT-5內部代號為“Gobi”和“Arrakis”,是一個具有52萬億參數(shù)的多模態(tài)模型,上一代GPT-4參數(shù)約為2萬億。這一龐大的參數(shù)規(guī)模暗示了其潛在的強大能力。
Murati將GPT-4到GPT-5的進步比作從高中水平到大學水平的跨越,表明新模型在復雜性和能力上將有顯著提升。
美東時間6月27日,OpenAI公布,其研究人員訓練了一個基于GPT-4的模型,它被稱為CriticGPT,用于捕捉ChatGPT代碼輸出中的錯誤。簡單來說就是,CriticGPT讓人能用GPT-4查找GPT-4的錯誤。它可以寫出使用者對ChatGPT響應結果的批評評論,從而幫助人類訓練者在RLHF期間發(fā)現(xiàn)錯誤。
OpenAI發(fā)現(xiàn),如果通過CriticGPT獲得幫助審查ChatGPT編寫的代碼,人類訓練師的審查效果比沒有獲得幫助的人強60%。OpenAI稱,正著手將類似CriticGPT的模型集成到旗下RLHF標記管道中,為自己的訓練師提供明確的AI幫助。
OpenAI稱,因為沒有更好的工具,所以人們目前難以評估高級的AI系統(tǒng)的表現(xiàn)。而CriticGPT意味著,OpenAI向能夠評估高級AI系統(tǒng)輸出的目標邁進了一步。
每日經(jīng)濟新聞綜合公開資料
如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP