接近金牌水平,AI向人類奧數“下手”

從下棋到解析蛋白質結構,人工智能(AI)變得越來越無所不能。美國谷歌公司的DeepMind這次將目標瞄準數學領域,開發的一款AI幾何推理模型——AlphaGeometry能夠以接近國際數學奧林匹克(奧數)競賽金牌得主的水平,解決復雜的幾何問題。相關研究1月17日發表于《自然》。
奧數面向中學生每年7月舉辦,是全球最難的數學競賽之一。解決奧數幾何問題需要一定的數學創造力,而這正是AI一直在試圖攻克的。即使在其他領域展現出非凡推理能力的OpenAI的GPT-4,在奧數幾何問題上也只能得0分。
AI之所以對奧數幾何問題久攻不下,除了問題的難度外,缺乏訓練數據也是一個很重要的原因。奧數自1959年以來每年舉辦一次,且每次比賽只有6道題。然而,AI系統解決幾何問題需要數百萬甚至數十億個數據點,現有數據遠不能滿足訓練的需要。
為此,DeepMind的Thang Luong和同事創建了一種工具,可生成數以億計的機器可讀的幾何證明,從而繞過了現有數據不足的難點。
研究人員使用這些數據對AlphaGeometry進行訓練,并用30道奧數幾何題對它進行基準測試。結果,AlphaGeometry在標準時限內正確解出了25道題。相比之下,之前最先進的系統解決了其中10道題,而根據預測,人類奧數金牌得主平均解決25.9道題。
Luong介紹,AlphaGeometry由兩部分組成,一個是快速、直觀的語言模型系統——GPT-f,另一個是較慢、更具分析性的“符號引擎”系統。
面對一道奧數幾何題,AlphaGeometry首先利用GPT-f提出要嘗試的定理和論點,接著“符號引擎”就會通過邏輯推理,按照數學規則構建GPT-f提出的論點。兩個系統協同工作、不斷切換,直到問題解決。
Luong表示,雖然AlphaGeometry在解決奧數幾何題方面非常成功,但它的答案往往比人類的證明更長。不過,它可以發現一些人類遺漏的東西。比如,它對一道2004年奧數競賽題的解法,比官方給出的答案更好、更通用。
英國倫敦數學科學研究所的何楊輝指出,該系統在可用的數學運算方面存在固有的局限性,因為奧數問題應該用大學本科階段以下教授的定理來解決。因此,增加AlphaGeometry可以獲得的數學知識能夠改善系統,甚至有助于它取得新的數學發現。
目前,DeepMind拒絕透露是否計劃讓AlphaGeometry參加奧數現場比賽,以及是否再擴展該系統以解決其他非幾何奧數問題。
(徐銳)
相關論文信息:
https://doi.org/10.1038/s41586-023-06747-5
本文鏈接:http://www.albanygandhi.com/news-7-141.html接近金牌水平,AI向人類奧數“下手”
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
【申報】關于公開征集2024年朝陽區科技計劃儲備項目入庫的通知
關于發展銀發經濟增進老年人福祉的意見
關于豐臺區舉辦“豐帆行動”計劃——孵化機構推介專場的通知
2023“北京·景賢杯”創新創業大賽延長報名的通知
【解讀】關于《進一步促進北京老字號創新發展的行動方案(2023-2025年)》的政策解讀
【解讀】關于《海淀區積極應對疫情影響助企紓困的若干措施》的問答解讀
我國昆蟲學科技論文數量世界第一
白銀高新區入選全國首批減污降碳協同創新試點園區
北京經濟技術開發區支持高精尖產業人才創新創業實施辦法(2.0版)
圖說外觀設計|局部外觀設計專利申請概覽
確切:花唄去哪里可以套(詳情下文)
大吉大利:東莞東城區墊還信用卡,放心的選擇,大家都找他操作
如登春臺:鄭州鞏義市上門代還信用卡,最便宜的地方,價格最低的地方
大吉大利:深圳福田上門代還信用卡,真實商戶積分,需要的請聯系
銀川套visa信用卡怎么取現秒收藏!
勤學不輟:花唄額度怎么提現出來現金(分享最新的十個操作方法)
篤學好古:拼多多先用后付套出來(安全方法分享給大家)
南昌套京東白條加油額度這么簡單支持當面!
喜從天降:上海嘉定區上門代還信用卡,的6種刷法 (無視風控秒回款)
牛角掛書:那個蘋果id貸靠譜,抵押蘋果id貸款