欧美日韩国产精品-欧美日韩国产精品综合-欧美日韩国产伦理-欧美日韩国产码高清综合人成-黄色网页在线观看-黄色网页在线播放

首頁 > 活動線報 > 每日福利 > 谷歌推出兩大數(shù)學(xué)模型,19秒解開IMO2024幾何問題

谷歌推出兩大數(shù)學(xué)模型,19秒解開IMO2024幾何問題

發(fā)布時間:2024-07-26 22:54:23來源: 15210273549

六道題每題可得7分,總分最高42分。谷歌DeepMind的人工智能系統(tǒng)在今年國際數(shù)學(xué)奧林匹克競賽中最終得分28分。今年金牌的門檻是29分,在正式比賽的609名選手中,58名達(dá)到了這一門檻。

DeepMind人工智能系統(tǒng)在IMO 2024上相對于人類競爭者的表現(xiàn)。在42分的總分中,人工智能系統(tǒng)獲得了28分。

谷歌DeepMind的AI模型解決了今年國際數(shù)學(xué)奧林匹克競賽(IMO)六個問題中的四個問題,人工智能首次達(dá)到了銀牌標(biāo)準(zhǔn)。

當(dāng)?shù)貢r間7月25日,谷歌DeepMind公布專用于數(shù)學(xué)推理的模型AlphaProof,以及專注于幾何的模型更新版本AlphaGeometry 2。DeepMind表示,AlphaProof和AlphaGeometry 2解決了數(shù)學(xué)中的高級推理問題,具有先進數(shù)學(xué)推理能力的通用人工智能或開啟科學(xué)和技術(shù)的新領(lǐng)域。

IMO是歷史最悠久、規(guī)模最大、最負(fù)盛名的青年數(shù)學(xué)家競賽,自1959年以來每年舉辦一次。選手要解決代數(shù)、組合學(xué)、幾何和數(shù)論方面六個異常困難的問題。菲爾茲獎是數(shù)學(xué)家的最高榮譽之一,菲爾茲獎獲得者也會代表他們的國家參加IMO。

近年來,IMO競賽被認(rèn)為是機器學(xué)習(xí)領(lǐng)域的重大挑戰(zhàn),也是衡量人工智能系統(tǒng)高級數(shù)學(xué)推理能力的理想基準(zhǔn)。

谷歌DeepMind表示,IMO的數(shù)學(xué)問題被人工翻譯成數(shù)學(xué)語言,供系統(tǒng)理解。在正式比賽中,學(xué)生們分兩次提交答案,每次4.5小時。而人工智能系統(tǒng)在幾分鐘內(nèi)解決了一個問題,花了三天時間來解決其他問題。基于強化學(xué)習(xí)的推理系統(tǒng)AlphaProof解決了兩個代數(shù)問題和一個數(shù)論問題并被證明答案正確,這些問題包括今年IMO比賽中只有5名選手解決的最難的問題。AlphaGeometry 2證明了幾何問題,但兩個組合問題仍未解決。

六道題每題可得7分,總分最高可達(dá)42分。DeepMind的人工智能系統(tǒng)最終得分28分。DeepMind表示,今年金牌的門檻從29分開始,在正式比賽的609名選手中,有58名達(dá)到了這個門檻。

“事實上,這個程序能想出這樣一個不明顯的結(jié)構(gòu)是非常令人印象深刻的,遠(yuǎn)遠(yuǎn)超出了我認(rèn)為的最先進的水平。”IMO金牌得主和菲爾茲獎牌得主蒂莫西·高爾斯(Timothy Gowers)表示。

在大量書面文本上訓(xùn)練的人工智能模型歷來在數(shù)學(xué)推理方面很困難,往往傾向于語言智能而非數(shù)學(xué)智能,解決數(shù)學(xué)問題需要更復(fù)雜的推理技能。AlphaProof將預(yù)先訓(xùn)練好的語言模型與AlphaZero強化學(xué)習(xí)算法結(jié)合在一起,AlphaZero此前自學(xué)了如何掌握國際象棋、將棋和圍棋。

大語言模型容易產(chǎn)生幻覺,或以令人信服的方式傳遞錯誤信息。DeepMind表示,盡管基于自然語言的方法可以訪問更多數(shù)據(jù),但會產(chǎn)生看似合理但不正確的中間推理步驟和解決方案。而形式語言提供了一個重要優(yōu)勢,即涉及數(shù)學(xué)推理的證明可以被形式化地驗證其正確性。“我們通過微調(diào)Gemini模型,在這兩個互補的領(lǐng)域之間建立了一座橋梁,自動將自然語言問題語句轉(zhuǎn)換為形式語句,創(chuàng)建了一個不同難度的龐大形式問題庫。”

當(dāng)遇到一個數(shù)學(xué)問題時,AlphaProof會生成候選解決方案,然后搜索可能的證明步驟來證明或反駁它們。每一個被發(fā)現(xiàn)和驗證的證明都被用來強化AlphaProof的語言模型,增強其解決后續(xù)更具挑戰(zhàn)性問題的能力。

每日福利更多>>

廣汽豐田開年王炸!威蘭達(dá)直降4.4萬+終身質(zhì)保,現(xiàn)在抄底有多賺? iOS 18.3正式版,近期表現(xiàn)最差的版本,不要升級。 三星電機發(fā)布全球首款用于激光雷達(dá)的超小型高容量MLCC 邁克爾·戴爾:從宿舍到科技巨頭的商業(yè)傳奇 華為、聯(lián)想搶先接入DeepSeek!AI手機終于要爆發(fā)了? 國產(chǎn)SUV的那些事兒:北汽昌河Q7,它到底咋了?銷量為零的真相! 預(yù)算18萬元,選小鵬P7+還是領(lǐng)克Z10,一文了解透 理想汽車:3個核心的競爭力! 新一輪價格戰(zhàn)“開打”!特斯拉、小鵬等品牌“加碼”,專家:今年市場競爭將兩極分化 ROG日本官方調(diào)侃主板插顯卡上,旗艦顯卡投影面積接近ITX主板 業(yè)主買下126㎡“老破舊”的二手房,改造完工后,原業(yè)主:我不賣 深圳樓市迎來“開門紅”;全國人均存款首超10萬;英歌舞這次又“火”出國門!| 灣區(qū)福財訊 性能黨必看!4款銷量‘最佳’的超強性能手機大盤點 2024直屏旗艦:魅族21、三星S24 、紅魔10 誰才是你的最愛? 魅族 22 仍在路上,星際魅族高管回應(yīng)新機計劃有序推進中 雷軍“進廠上班”!小米新車將至,“正討論進一步提產(chǎn)”! 2024年全球智能手機市場回暖,華為增長37%最為迅猛 華為、蘋果等折疊新品將陸續(xù)面世,折疊機市場有望高增 OPPO Find N5邀請函來了,999純金打造,開工沾喜氣 凱迪拉克拿出硬實力!降幅超13萬,標(biāo)配2.0T動力,家用真香 15萬級的SUV,配置豐富,解析零跑C11和特斯拉Model Y 小鵬MONA SUV渲染圖曝光 代替G3 15萬以內(nèi)最強? 東風(fēng)汽車一、二把手親自主抓自主品牌業(yè)務(wù):鋪就未來騰飛之路 人生第一臺車的“質(zhì)價比”之選:2025款別克君越深度解析 全新福特探險者攜三重犒賞禮遇重磅上市,全面煥新,再上昆侖! 造型更年輕運動!新一代奧迪A6諜照曝光,搭燃油動力,能火嗎? 2024年全球大尺寸交互平板顯示面板出貨量下降2.8% 零跑“逆襲”:憑什么成為第二家盈利新勢力? 市場觀察丨 多家車企推出補貼政策 特斯拉打出優(yōu)惠“組合拳” 上半年樓市預(yù)計止跌,杭州上海成都等八城將率先回穩(wěn)
主站蜘蛛池模板: 色综合一区二区三区 | 国产精品手机在线 | 欧美国产日韩一区二区三区 | 福利在线看 | 日韩专区视频 | 中文字幕久热精品视频免费 | 悠悠在线 | 在线成人 | 亚洲国产欧美在线人网站 | 午夜色综合 | 亚洲视频欧洲视频 | 免费 黄 色 人成 视频 | 亚洲六月婷婷 | 色综合精品 | 全部孕妇毛片丰满孕妇孕交99 | 视频一区中文字幕 | 男人精品网站一区二区三区 | xxxx毛片| 天天精品在线 | 91热国内精品永久免费观看 | 国产成人精品一区二三区 | 欧美一二三区视频 | 国产精品无打码在线播放9久 | 欧美黑人xxxx猛牲大交 | 九九在线视频 | 一级毛片在线观看免费 | 你懂得视频在线观看 | 99热这里有精品 | 久久ww | 亚洲欧美日韩精品久久亚洲区色播 | 伊人网综合 | 欧美日韩黑人 | 香蕉国产在线观看免费 | 亚洲一区欧美日韩 | 视频一区在线观看 | 一区二区三区网站 | 国内第一永久免费福利视频 | 午夜福利123 | 污视频在线观看免费 | 4虎永免费最新永久免费地址 | 亚洲欧美一区二区三区久久 |