幾百年來,數學家使用的工具依然簡樸:一張紙、一支筆。他們憑借邏輯與靈感,在">
      <td id="hq3hh"></td>

    1. <span id="hq3hh"><optgroup id="hq3hh"></optgroup></span>
        <rt id="hq3hh"><optgroup id="hq3hh"><strike id="hq3hh"></strike></optgroup></rt>
        <span id="hq3hh"><optgroup id="hq3hh"><center id="hq3hh"></center></optgroup></span>

          <label id="hq3hh"><meter id="hq3hh"></meter></label>
          首頁  ?  財經  ?  經濟觀察

          AI成為數學家得力助手還要多久

          2025-06-17 09:11:00

          來源:科技日報

          原標題:AI成為數學家得力助手還要多久

          從計算機科學到醫學再到國家安全,數學是眾多關鍵應用的基石,但數學領域的進步可能需要數年時間才能實現。

          幾百年來,數學家使用的工具依然簡樸:一張紙、一支筆。他們憑借邏輯與靈感,在符號的迷宮中尋找通往真理的路徑。

          為了打破這一局面,美國國防高級研究計劃局今年4月啟動了“指數性數學”計劃,旨在開發一種能極大提升數學研究效率的人工智能(AI)“合著者”系統。

          幾十年來,數學家借助計算機進行輔助計算或驗證命題,如今的AI或許能更上層樓,挑戰那些人類長年未解的難題。不過,從能解高中題的AI,到能協助攻克前沿數學難關的AI,中間仍隔著一道鴻溝。

          解決重大難題仍力不從心

          大型語言模型(LLM)并不擅長數學。它們常常出現“幻覺”,甚至可能被誤導相信2+2=5。但新一代大型推理模型,如OpenAI的o3、Anthropic的Claude 4 Thinking等,展現出的進步令數學家眼前一亮。

          今年,這些模型在美國數學邀請賽中的表現接近優秀高中生水平。不同于過去“一錘定音”式的輸出,這些模型開始嘗試模擬數學家逐步推理的思考過程。

          同時,一些將LLM與某種事實核查系統相結合的新型混合模型也取得了突破。例如,谷歌“深度思維”的AlphaProof系統將語言模型與棋類AI——AlphaZero結合,成為首個取得與國際數學奧林匹克競賽銀牌得主成績相當的系統。今年5月,谷歌的AlphaEvolve模型更進一步,在多個長期未解的數學與計算難題上找到優于人類現有方案的解法。

          美國《麻省理工科技評論》指出,盡管這些AI成績亮眼,但專家們普遍認為,它們仍不具備真正的協助科研的能力。競賽題雖難,卻更像是智力游戲,有一定“套路”。真正的數學研究則更開放、更復雜。面對“P vs NP”“黎曼猜想”等重大難題時,AI仍力不從心。

          為了更準確地評估AI的能力,初創公司Epoch AI去年推出了FrontierMath測試,聯合60多位數學家設計出全新高難度題目,避開模型已見過的訓練數據,結果LLM幾乎集體“交白卷”。

          這些測試表明,AI在數學道路上雖已邁步,但離“合著者”角色仍有很長一段路要走。

          需攻克“超長推理鏈”

          仔細觀察數學問題會發現,它們在某些方面類似:解決問題需完成一系列連續步驟,關鍵在于找到這些步驟。

          美國加州理工學院謝爾蓋·古科夫指出,困難的差異往往體現在路徑的長度上。高中數學可能只需10到40步,而像黎曼猜想這樣的難題,路徑可能長達百萬步。

          這類“超長路徑”極難處理。就像下圍棋時尋找一條制勝序列,AI必須在指數級增長的可能路徑中找到正確解法。而在數學中,這個復雜度要遠超棋類游戲。

          據物理學家組織網今年2月報道,為應對這一挑戰,古科夫團隊開發了一種方法,將多個步驟打包成“超級步驟”,相當于穿上“巨人靴”跨越大段路程。他們設計了一個系統,其中強化學習模型負責提出超級步驟,另一個模型負責驗證其合理性。

          該策略在經典未解難題——安德魯斯-柯蒂斯猜想上取得了突破。雖然尚未證明或推翻該猜想,但借助AI,科學家推翻了一個40年來被廣泛引用的“反例”。這曾被視為證明該猜想錯誤的關鍵依據。

          牛津大學數學家馬丁·布里森對此表示肯定:“排除錯誤路徑,是科研中非常有價值的一步。”

          古科夫相信,這種“壓縮路徑”的思路適用于所有需要推理鏈條的領域。他希望,這種方法不僅能推動AI跳出固有模式,也為數學研究帶來新突破。

          真正的創新和突破仍屬人類

          跳出思維定式,正是數學家攻克難題的關鍵。數學常被看作機械推理,而高等數學則更像是一場實驗,充滿一波三折的試錯與靈光乍現的頓悟。

          這正是AlphaEvolve等AI工具的優勢所在。它通過LLM不斷生成并改進解題代碼,配合第二個模型評估每一輪結果,最終提出比人類更優的解法。這種方法不僅能獨立探索,也支持人類隨時介入,提供靈感和指令。

          澳大利亞悉尼大學數學家喬迪·威廉姆森強調,探索性思維是數學的核心。據英國《新科學家》網站報道,他與Meta合作開發了PatternBoost AI系統,可根據一個數學想法生成相似概念,幫助激發靈感。他說:“這就像是這里有一堆有趣的東西,我不知道是怎么回事,但你能再生成一些類似的東西嗎?”

          這種頭腦風暴在數學中至關重要,它是新想法產生的源泉。以二十面體為例——古希臘人通過純粹推理發現了它,其形狀并不存在于自然界中,卻深刻影響了數學的發展。威廉姆森希望,AI未來也能協助發現類似的“新數學對象”。

          不過,目前AI仍缺乏真正的創造力。讓AI贏棋是一回事,讓它發明圍棋游戲則是另一回事。像AlphaEvolve和PatternBoost這樣的工具或許能作為人類直覺的“偵察兵”,幫助人們發現路徑、避開死路,但專家普遍認為,真正的創新與突破,仍然屬于人類。

          • 相關閱讀
          • 科學家探測到穿透人腦的光信號

            原標題:科學家探測到穿透人腦的光信號科技日報北京6月16日電 (記者劉霞)英國格拉斯哥大學研究團隊首次成功探測到穿越成年人完整頭骨的光信號。這項發表于最新一期《神經光子學》雜志的研究成果,突破了現有技術探測深度的...

            時間:06-17
          免責聲明:本網對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網站轉載圖片、文字之類版權申明,本網站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網站將在第一時間及時刪除。
          国产精品亚洲片夜色在线| 国产丝袜一区二区三区在线观看| 182tv午夜精品视频在线播放 | 久久只这里是精品66| 欧美老熟妇乱大交xxxxx| 免费播放美女一级毛片| 激情综合色综合啪啪开心| 交换配乱吟粗大SNS84O| 欧美日韩精品一区二区在线观看| 亚洲熟妇AV乱码在线观看| 欧美人与性动交α欧美精品| 亚洲日本一区二区一本一道 | 半甜欲水兄妹np| 男女交性特一级| 你懂的国产精品| 欧美成人精品第一区二区三区| 亚洲国产香蕉视频欧美| 日韩高清欧美精品亚洲| 亚洲日韩精品国产一区二区三区| 杨钰莹欲乱小说| 久久这里只精品| 成年人在线看片| 久久国产精品-国产精品| 成人品视频观看在线| 久久久久久久性| 无码国产精品一区二区高潮| 丰满少妇人妻无码| 妞干网免费视频| av无码a在线观看| 国产精品三级在线观看无码| 404款禁用软件onlyyou| 国产妇乱子伦视频免费| 红杏出墙电影在线观看| 免费看片在线观看| 欧美成人综合在线| 亚洲av一本岛在线播放| 成年黄网站色大免费全看| 久久丫精品国产亚洲AV| 太大了阿受不了好爽小说| 99在线观看免费视频| 国产精品视频白浆免费视频|