要聞

AI研究領(lǐng)域又一個(gè)里程碑！19秒解奧數(shù)幾何題，僅差1分即可摘金牌

每日經(jīng)濟(jì)新聞 2024-07-26 09:14:59

每經(jīng)編輯杜宇

高級(jí)數(shù)學(xué)推理是現(xiàn)代人工智能的關(guān)鍵能力，谷歌DeepMind再一次展示了它在這一領(lǐng)域的卓越實(shí)力。

圖片來(lái)源：每經(jīng)記者鄭雨航攝

近日，谷歌宣布其混合人工智能系統(tǒng)在2024年的國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽（IMO）中表現(xiàn)優(yōu)異，獲得了相當(dāng)于銀牌的成績(jī)，且僅僅差1分就能摘得金牌。這一突破被認(rèn)為是AI研究領(lǐng)域的又一個(gè)里程碑，被許多人稱為“數(shù)學(xué)界的AlphaGo時(shí)刻”。

在IMO中，AlphaGeometry 2在接收到形式化的第4題后，僅用19秒就解決了這個(gè)問(wèn)題。

具體來(lái)說(shuō)google展示了第一個(gè)以銀牌級(jí)別解決國(guó)際數(shù)學(xué)奧林匹克問(wèn)題的人工智能。

它結(jié)合了 AlphaProof（一種新的突破性形式推理模型）和 AlphaGeometry 2（之前系統(tǒng)的改進(jìn)版本）。

國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽是全球最悠久、規(guī)模最大、最具聲望的青年數(shù)學(xué)家比賽，自1959年起每年舉辦一次。參賽者需要解決六道涉及代數(shù)、組合學(xué)、幾何和數(shù)論的極其困難的問(wèn)題。許多菲爾茲獎(jiǎng)得主曾在青年時(shí)期代表國(guó)家參加過(guò)IMO。近年來(lái)，IMO也成為了機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)重要挑戰(zhàn)，被視為衡量人工智能系統(tǒng)高級(jí)數(shù)學(xué)推理能力的標(biāo)桿‍

在今年的比賽中，DeepMind的AI系統(tǒng)獲得了28分（滿分42分），相當(dāng)于銀牌獲得者的水平。這一成績(jī)僅差1分就能達(dá)到金牌標(biāo)準(zhǔn)，而在今年的609名參賽者中，只有58人獲得了金牌。

AlphaProof：形式化數(shù)學(xué)推理的突破

AlphaProof系統(tǒng)采用強(qiáng)化學(xué)習(xí)方法，將預(yù)訓(xùn)練的語(yǔ)言模型與AlphaZero算法相結(jié)合。這種方法的優(yōu)勢(shì)在于可以正式驗(yàn)證涉及數(shù)學(xué)推理的證明的正確性。為了克服形式化語(yǔ)言訓(xùn)練數(shù)據(jù)不足的問(wèn)題，研究團(tuán)隊(duì)通過(guò)微調(diào)Gemini模型，創(chuàng)建了一個(gè)包含各種難度的形式化問(wèn)題庫(kù)

AlphaProof是一個(gè)自學(xué)習(xí)系統(tǒng)，專門用于在形式化數(shù)學(xué)語(yǔ)言Lean中證明數(shù)學(xué)陳述。它的核心創(chuàng)新在于結(jié)合了預(yù)訓(xùn)練語(yǔ)言模型和AlphaZero強(qiáng)化學(xué)習(xí)算法‍

工作流程如下：

問(wèn)題轉(zhuǎn)化：首先，使用經(jīng)過(guò)微調(diào)的Gemini模型將自然語(yǔ)言的數(shù)學(xué)問(wèn)題自動(dòng)轉(zhuǎn)換為L(zhǎng)ean的形式化語(yǔ)言。這一步驟創(chuàng)建了一個(gè)大型的形式化問(wèn)題庫(kù)，涵蓋不同難度級(jí)別。

解決方案生成：面對(duì)一個(gè)新問(wèn)題時(shí)，AlphaProof會(huì)生成可能的解決方案

證明搜索：系統(tǒng)在Lean中搜索可能的證明步驟，試圖證明或反駁這些解決方案

強(qiáng)化學(xué)習(xí)：每找到并驗(yàn)證一個(gè)證明，就用它來(lái)強(qiáng)化AlphaProof的語(yǔ)言模型，提高系統(tǒng)解決后續(xù)更具挑戰(zhàn)性問(wèn)題的能力

持續(xù)訓(xùn)練：在準(zhǔn)備IMO比賽期間，AlphaProof在數(shù)周內(nèi)證明或反駁了數(shù)百萬(wàn)個(gè)問(wèn)題，覆蓋各種難度和數(shù)學(xué)主題。在比賽過(guò)程中，它還繼續(xù)應(yīng)用這個(gè)訓(xùn)練循環(huán)，通過(guò)證明自己生成的比賽問(wèn)題變體來(lái)增強(qiáng)能力，直到找到完整解決方案

AlphaGeometry 2

AlphaGeometry 2是AlphaGeometry的改進(jìn)版本，它的語(yǔ)言模型基于Gemini，并在比前代多一個(gè)數(shù)量級(jí)的合成數(shù)據(jù)上進(jìn)行了訓(xùn)練‍。

AlphaGeometry 2是一個(gè)神經(jīng)符號(hào)混合系統(tǒng)。主要改進(jìn)包括：

增強(qiáng)的語(yǔ)言模型：基于Gemini，從頭開(kāi)始訓(xùn)練，使用了比前代多一個(gè)數(shù)量級(jí)的合成數(shù)據(jù)。這大大提高了模型處理復(fù)雜幾何問(wèn)題的能力，包括物體運(yùn)動(dòng)、角度方程、比例或距離等問(wèn)題。

更快的符號(hào)引擎：新版本的符號(hào)處理引擎速度提高了兩個(gè)數(shù)量級(jí)，大大加快了問(wèn)題解決速度。

知識(shí)共享機(jī)制：引入了新的知識(shí)共享機(jī)制，能夠高級(jí)組合不同的搜索樹(shù)，以解決更復(fù)雜的問(wèn)題。

性能提升：在接受今年IMO比賽前，AlphaGeometry 2能夠解決過(guò)去25年IMO幾何問(wèn)題的83%，遠(yuǎn)超前代系統(tǒng)53%的解決率

實(shí)時(shí)表現(xiàn)：在今年的IMO中，AlphaGeometry 2在接收到形式化的第4題后，僅用19秒就解決了這個(gè)問(wèn)題。

DeepMind的研究團(tuán)隊(duì)還在探索基于自然語(yǔ)言推理的系統(tǒng)，這種系統(tǒng)不需要將問(wèn)題轉(zhuǎn)換為形式化語(yǔ)言，可能與其他AI系統(tǒng)結(jié)合使用。這種方法在今年的IMO問(wèn)題上也顯示出了巨大的潛力。

采用神經(jīng)符號(hào)方法

AlphaGeometry是一套神經(jīng)符號(hào)系統(tǒng)，由神經(jīng)語(yǔ)言模型加符號(hào)推導(dǎo)引擎組成，希望兩相結(jié)合以尋求對(duì)復(fù)雜幾何定理的證明。這類似于“快、慢思考相結(jié)合”的理念，一個(gè)系統(tǒng)提供快速、“直觀”的想法，另一系統(tǒng)則做出更加深思熟慮的理性決策。

由于語(yǔ)言模型更擅長(zhǎng)發(fā)現(xiàn)數(shù)據(jù)中的一般模式和關(guān)系，所以能夠快速預(yù)測(cè)可能有用的潛在構(gòu)造，但卻往往缺乏嚴(yán)格推理并解釋其決策的能力。另一方面，符號(hào)推導(dǎo)引擎則基于形式邏輯，依靠明確的規(guī)則來(lái)得出結(jié)論。后者更理性、可解釋性更強(qiáng)，但往往比較“緩慢”且不夠靈活——這一點(diǎn)在單獨(dú)處理大型復(fù)雜問(wèn)題時(shí)體現(xiàn)得尤其明顯。

AlphaGeometry的語(yǔ)言模型會(huì)引導(dǎo)其符號(hào)推導(dǎo)引擎為幾何問(wèn)題尋求可能的解。

奧數(shù)幾何問(wèn)題的題干大多基于圖表，需要添加新的幾何構(gòu)造才能解決，例如點(diǎn)、線或圓。AlphaGeometry的語(yǔ)言模型可以從無(wú)數(shù)種可能性中預(yù)測(cè)添加哪些新構(gòu)造更有助于解題。這些線索能夠填補(bǔ)空白，引導(dǎo)符號(hào)引擎對(duì)圖表做進(jìn)一步推論并逐步趨近正確答案。

AlphaGeometry解決的一個(gè)簡(jiǎn)單問(wèn)題：給定問(wèn)題圖及其定理前提（左），AlphaGeometry（中）首先使用符號(hào)引擎來(lái)推導(dǎo)關(guān)于圖的新表述，直到找出正確解或用盡新表述。

如果找不到可行的解，AlphaGeometry語(yǔ)言模型會(huì)添加一種可能有用的構(gòu)造（藍(lán)色部分，即輔助線）為符號(hào)引擎開(kāi)辟新的推導(dǎo)路徑。整個(gè)循環(huán)不斷重復(fù)，直到找到正確解為止（右）。在此示例中，只需要一種新構(gòu)造（一條輔助線）。

AlphaGeometry提出的每一道奧數(shù)題解法，都經(jīng)過(guò)計(jì)算機(jī)檢查和驗(yàn)證。DeepMind還將結(jié)果與之前的AI方法以及人類選手在奧賽中的表現(xiàn)做出比較。此外，數(shù)學(xué)教練、前奧數(shù)競(jìng)賽金牌得主Evan Chen也幫助對(duì)AlphaGeometry的解題思路進(jìn)行評(píng)估。

每日經(jīng)濟(jì)新聞綜合公開(kāi)資料

免責(zé)聲明：本文內(nèi)容與數(shù)據(jù)僅供參考，不構(gòu)成投資建議，使用前請(qǐng)核實(shí)。據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。

封面圖片來(lái)源：每經(jīng)記者鄭雨航攝

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

數(shù)學(xué) 模型幾何 Ai

上一篇文章

政策再加碼，以舊換新帶動(dòng)需求向上

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

資金逆市布局TMT高景氣方向，5G通信ETF（515050）近4日吸金8273萬(wàn)元