每日經(jīng)濟(jì)新聞 2024-08-29 13:20:31
每經(jīng)記者 文巧 每經(jīng)編輯 孫志成 高涵
此前,一道低難度的數(shù)學(xué)題——9.11和9.9哪個(gè)更大,難倒了一眾海內(nèi)外AI大模型,也讓外界了解到了大模型在推理方面的局限性。
不過,情況正在迅速發(fā)生改變。當(dāng)?shù)貢r(shí)間8月27日,據(jù)The Information報(bào)道,OpenAI神秘“草莓”(Strawberry,前身為Q*)項(xiàng)目,計(jì)劃最早于今年秋季推出。同時(shí),用“草莓”合成數(shù)據(jù)來開發(fā)的最新大模型——“獵戶座”(Orion),或于明年年初推出。
據(jù)悉,“草莓”是一個(gè)推理模型,有著強(qiáng)大的推理能力,可處理復(fù)雜的問題;“獵戶座”則是超越GPT-4的下一代大模型,可幫助OpenAI減少其模型產(chǎn)生的錯(cuò)誤數(shù)量,即所謂的幻覺。
據(jù)The Information援引知情人士稱,今年夏天,在秘密會(huì)議上,OpenAI向美國(guó)國(guó)家安全官員展示了“草莓”模型。報(bào)道指出,OpenAI向政府展示一項(xiàng)尚未發(fā)布的技術(shù),可能為人工智能開發(fā)者樹立新標(biāo)準(zhǔn),也是OpenAI努力向政策制定者提高透明度的一部分。此前,以伊麗莎白·沃倫為首的美國(guó)參議員們?cè)啻闻険鬙penAI項(xiàng)目透明度和安全性問題。
圖片來源:每日經(jīng)濟(jì)新聞 資料圖
推理能力出眾 “草莓”能為OpenAI創(chuàng)收嗎?
據(jù)The Information報(bào)道,參與OpenAI該項(xiàng)目的兩名人員透露,研究人員計(jì)劃在今年秋季推出代號(hào)為“草莓”的新型 AI,并有可能將其作為ChatGPT的一部分。
據(jù)悉,OpenAI希望通過推出“草莓”為公司籌集更多資金,并尋找減少虧損的方法。此前,據(jù)媒體報(bào)道OpenAI今年的虧損可能高達(dá)50億美元。
《每日經(jīng)濟(jì)新聞》記者注意到,自2019年以來,OpenAI已從微軟籌集了約130億美元資金。作為與這家企業(yè)軟件巨頭合作的一部分,該合作協(xié)議將持續(xù)到2030年。據(jù)知情人士透露,合作協(xié)議的條款可能會(huì)發(fā)生變化,包括OpenAI向微軟支付租用云服務(wù)器開發(fā)AI的費(fèi)用,其中,云服務(wù)器是OpenAI最大的成本。
據(jù)前述外媒援引內(nèi)部人士說法,“草莓”目前的功能極其強(qiáng)大——它可以解決此前從未見過的數(shù)學(xué)問題,這是當(dāng)前的聊天機(jī)器人無法可靠完成的任務(wù)。它還可以解決涉及編程的問題,且不局限于回答技術(shù)性問題。如果給予更多時(shí)間“思考”,“草莓”模型還可以回答用戶更“主觀”的問題,例如產(chǎn)品營(yíng)銷策略。
為了展示“草莓”在語言方面的實(shí)力,研究人員向OpenAI內(nèi)部同事展示了“草莓”如何解決《紐約時(shí)報(bào)》上刊登的復(fù)雜字謎游戲。
事實(shí)上,現(xiàn)有的人工智能在航空航天和結(jié)構(gòu)工程等數(shù)學(xué)密集型領(lǐng)域并不擅長(zhǎng),那么,解決棘手?jǐn)?shù)學(xué)問題的AI可能是一個(gè)潛在有利可圖的應(yīng)用。為了提高模型的推理能力,一些初創(chuàng)公司嘗試使用一種別扭的解決辦法——將問題分解為更小的步驟,但這些辦法既慢又貴。
數(shù)學(xué)推理的改進(jìn)也有助于AI模型更好地處理對(duì)話查詢,例如客戶服務(wù)請(qǐng)求。這或許對(duì)OpenAI即將推出的AI代理服務(wù)起到幫助。
不僅是OpenAI,人工智能領(lǐng)域的其他主要參與者也在數(shù)學(xué)推理方面取得了長(zhǎng)足進(jìn)步。例如,谷歌DeepMind 最近開發(fā)了AlphaProof和AlphaGeometry 2,這是兩個(gè)用于高級(jí)數(shù)學(xué)推理的AI系統(tǒng)。兩個(gè)系統(tǒng)協(xié)同工作,在2024年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽中獲得銀牌,解決了六道題中的四道。
“草莓”正在為下一代旗艦?zāi)P瞳C戶座提供訓(xùn)練數(shù)據(jù)
在OpenAI內(nèi)部,“草莓”不僅是一個(gè)即將要向外界推出的商業(yè)模型,它還被賦予了更重要的使命。
一位知情人士向The Information表示,OpenAI在使用更大版本的“草莓”來生成訓(xùn)練下一代旗艦?zāi)P?ldquo;獵戶座”(Orion)的數(shù)據(jù)。該模型旨在改進(jìn)其現(xiàn)有的旗艦?zāi)P虶PT-4并幫助OpenAI領(lǐng)先其他資金雄厚的競(jìng)爭(zhēng)對(duì)手,爭(zhēng)奪對(duì)話式AI或大型語言模型的霸主地位。
GPT-4自2023年3月推出后,就成為了一個(gè)改變游戲規(guī)則的大型語言模型。然而,在過去18個(gè)月中,競(jìng)爭(zhēng)對(duì)手已基本追趕上來。在某些情況下,甚至超越了OpenAI的最新模型。
基于聊天機(jī)器人競(jìng)技場(chǎng)的數(shù)學(xué)表現(xiàn) 圖片來源:
lmarena.ai
據(jù)知情人士表示,這種由人工智能生成的數(shù)據(jù)被稱為“合成數(shù)據(jù)”。這意味著“草莓”可以幫助OpenAI克服獲取足夠高質(zhì)量數(shù)據(jù)的限制,從而利用從互聯(lián)網(wǎng)上提取的文本或圖像等現(xiàn)實(shí)世界數(shù)據(jù)來訓(xùn)練新模型。
代理初創(chuàng)公司Minion AI CEO、GitHub Copilot前首席架構(gòu)師亞歷克斯·格雷夫利表示,使用“草莓”生成更高質(zhì)量的訓(xùn)練數(shù)據(jù)可以幫助OpenAI減少其模型產(chǎn)生的錯(cuò)誤數(shù)量,即所謂的幻覺?;糜X是當(dāng)前生成式AI的一個(gè)重大限制,這會(huì)導(dǎo)致AI經(jīng)常生成看似合理但實(shí)際上不正確的數(shù)據(jù)。
“想象一下,一個(gè)沒有幻覺的模型,你問它一個(gè)邏輯難題,它第一次嘗試就能答對(duì),”格雷夫利說道。該模型之所以能夠做到這一點(diǎn),是因?yàn)?ldquo;訓(xùn)練數(shù)據(jù)中的歧義較少,所以它猜測(cè)的次數(shù)較少。”
據(jù)The Information報(bào)道,奧特曼在5月份的一次活動(dòng)中表示:“我們覺得我們擁有足夠的數(shù)據(jù)來開發(fā)下一個(gè)模型。我們已經(jīng)進(jìn)行了各種實(shí)驗(yàn),包括生成合成數(shù)據(jù)。”據(jù)報(bào)道,他可能指的就是用“草莓”訓(xùn)練的Orion(獵戶座)。
安全隱患烏云未散
不過,就在OpenAI高歌猛進(jìn)的同時(shí),安全隱患的烏云從未散去。
“草莓”項(xiàng)目源于前OpenAI首席科學(xué)家Ilya Sutskever的早期研究,OpenAI研究人員Jakub Pachocki和Szymon Sidor在Sutskever的工作基礎(chǔ)上開發(fā)了一種新的數(shù)學(xué)求解模型Q*。
而2023年底,有關(guān)OpenAI的Q*項(xiàng)目的消息泄露時(shí),一些專家將該技術(shù)定性為人工智能(AGI)的突破,但人們對(duì)它知之甚少。這也讓一些專注于人工智能安全的研究人員感到震驚。
這件事情發(fā)生在OpenAI罷免奧特曼之前,據(jù)知情人士爆料,此前員工之間就公司是否以足夠安全的方式開發(fā)人工智能展開了爭(zhēng)論。安全也是罷免奧特曼后公司內(nèi)部損害控制的一個(gè)重要主題,當(dāng)時(shí)罷免的發(fā)起人正是Sutskever。
此后,安全問題就一直困擾著OpenAI。而在奧特曼重返OpenAI后,負(fù)責(zé)OpenAI安全團(tuán)隊(duì)的成員也相繼離開了公司。
今年5月離職的OpenAI“超級(jí)對(duì)齊”團(tuán)隊(duì)領(lǐng)導(dǎo)人Jan Leike在社媒平臺(tái)X上寫道:“過去幾年,安全文化和流程已經(jīng)退居次要地位,而閃亮的產(chǎn)品則成為重中之重。”
鑒于今年早些時(shí)候幾位安全領(lǐng)導(dǎo)人離職,以及參議員伊麗莎白·沃倫等美國(guó)政府高官對(duì)于技術(shù)安全的批評(píng),OpenAI決定提升對(duì)政府官員的透明度。
據(jù)The Information援引一位了解相關(guān)會(huì)議情況的人士透露,今年夏天,在一些并未公開的會(huì)議上,奧特曼的團(tuán)隊(duì)向美國(guó)國(guó)家安全官員展示了“草莓”模型。
報(bào)道指出,通過向政府官員展示一項(xiàng)尚未發(fā)布的技術(shù),OpenAI可能為人工智能開發(fā)者樹立了新標(biāo)準(zhǔn),尤其是在先進(jìn)人工智能日益成為潛在安全隱患的今天。此次演示可能是OpenAI努力向政策制定者提高透明度的一部分,但如果政策制定者認(rèn)為該項(xiàng)技術(shù)形成威脅,那么他們可能給公司帶來麻煩。
不過一些業(yè)界人士對(duì)此并不買賬,因?yàn)镺penAI并未向公眾提升透明度。AI初創(chuàng)公司Abacus.AI CEO Bindu Reddy表示,封閉的OpenAI將他們最好的大模型藏在背后,以此來取得領(lǐng)先優(yōu)勢(shì)。“如果沒有開源AI,我們都會(huì)完蛋,我們可能會(huì)把文明的控制權(quán)交給1到2家公司。”
記者|文巧 實(shí)習(xí)記者|岳楚鵬
編輯|孫志成 高涵 杜恒峰
校對(duì)|王月龍
|每日經(jīng)濟(jì)新聞 nbdnews 原創(chuàng)文章|
未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用
封面圖片來源:每日經(jīng)濟(jì)新聞 資料圖
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP