<td id="hq3hh"></td>

    1. <span id="hq3hh"><optgroup id="hq3hh"></optgroup></span>
        <rt id="hq3hh"><optgroup id="hq3hh"><strike id="hq3hh"></strike></optgroup></rt>
        <span id="hq3hh"><optgroup id="hq3hh"><center id="hq3hh"></center></optgroup></span>

          <label id="hq3hh"><meter id="hq3hh"></meter></label>
          首頁  ?  新聞頻道  ?  國際新聞

          新聞分析|全球科研團隊競逐低成本AI模型研發新范式

          2025-02-23 15:56:42

          來源:新華網

            新華社北京2月23日電 新聞分析|全球科研團隊競逐低成本AI模型研發新范式

            新華社記者彭茜

            美國斯坦福大學等機構研究團隊近日宣布,在基座大模型基礎上,僅耗費數十美元就開發出相對成熟的推理模型。盡管其整體性能尚無法比肩美國開放人工智能研究中心(OpenAI)開發的o1、中國深度求索公司的DeepSeek-R1等,但此類嘗試意味著企業可以較低成本研發出適合自身的AI應用,AI普惠性有望增強。同時,其所應用的“測試時擴展”技術或代表一條更可持續的AI研發路徑。

            低成本玩轉高級推理

            美國斯坦福大學和華盛頓大學研究團隊近日宣布研發出名為s1的模型,在衡量數學和編碼能力的測試中,可媲美o1和DeepSeek-R1等。研究團隊稱,訓練租用所需的計算資源等成本只需約幾十美元。

            s1的核心創新在于采用了“知識蒸餾”技術和“預算強制”方法。“知識蒸餾”好比把別人釀好的酒進一步提純。該模型訓練數據是基于谷歌Gemini Thinking Experimental模型“蒸餾”出的僅有1000個樣本的小型數據集。

            “預算強制”則使用了AI模型訓練新方法——“測試時擴展”的實現方式。“測試時擴展”又稱“深度思考”,核心是在模型測試階段,通過調整計算資源分配,使模型更深入思考問題,提高推理能力和準確性。

            “預算強制”通過強制提前結束或延長模型的思考過程,來影響模型的推理深度和最終答案。s1對阿里云的通義千問開源模型進行微調,通過“預算強制”控制訓練后的模型計算量,使用16個英偉達H100 GPU僅進行26分鐘訓練便達成目標。

            美國加利福尼亞大學伯克利分校研究團隊最近也開發出一款名為TinyZero的精簡AI模型,稱復刻了DeepSeek-R1 Zero在倒計時和乘法任務中的表現。該模型通過強化學習,實現了部分相當于30億模型參數的大語言模型的自我思維驗證和搜索能力。團隊稱項目訓練成本不到30美元。

            “二次創造”增強AI普惠性

            清華大學計算機系長聘副教授劉知遠接受記者采訪時說,部分海外研究團隊使用DeepSeek-R1、o1等高性能推理大模型來構建、篩選高質量長思維鏈數據集,再用這些數據集微調模型,可低成本快速獲得高階推理能力。

            相關專家認為,這是AI研發的有益嘗試,以“二次創造”方式構建模型增強了AI普惠性。但有三點值得注意:

            首先,所謂“幾十美元的低成本”,并未納入開發基座大模型的高昂成本。這就好比蓋房子,只算了最后裝修的錢,卻沒算買地、打地基的錢。AI智庫“快思慢想研究院”院長田豐告訴記者,幾十美元成本只是最后一個環節的算力成本,并未計算基座模型的預訓練成本、數據采集加工成本。

            其次,“二次創造”構建的模型,整體性能尚無法比肩成熟大模型。TinyZero僅在簡單數學任務、編程及數學益智游戲等特定任務中有良好表現,但無法適用于更復雜、多樣化的任務場景。而s1模型也只能通過精心挑選的訓練數據,在特定測試集上超過早期版本o1 preview,而遠未超過o1正式版或DeepSeek-R1。

            最后,開發性能更優越的大模型,仍需強化學習技術。劉知遠說,就推動大模型能力邊界而言,“知識蒸餾”技術意義不大,未來仍需探索大規模強化學習技術,以持續激發大模型在思考、反思、探索等方面的能力。

            AI模型未來如何進化

            在2025年美國消費電子展上,美國英偉達公司高管為AI的進化勾畫了一條路線圖:以智能水平為縱軸、以計算量為橫軸,衡量AI模型的“規模定律”呈現從“預訓練擴展”、到“訓練后擴展”,再到“測試時擴展”的演進。

            “預訓練擴展”堪稱“大力出奇跡”——訓練數據越多、模型規模越大、投入算力越多,最終得到AI模型的能力就越強。目標是構建一個通用語言模型,以GPT早期模型為代表。而“訓練后擴展”涉及強化學習和人類反饋等技術,是預訓練模型的“進化”,優化其在特定領域的任務表現。

            隨著“預訓練擴展”和“訓練后擴展”邊際收益逐漸遞減,“測試時擴展”技術興起。田豐說,“測試時擴展”的核心在于將焦點從訓練階段轉移到推理階段,通過動態控制推理過程中的計算量(如思考步長、迭代次數)來優化結果。這一方法不僅降低了對預訓練數據的依賴,還顯著提升了模型潛力。

            三者在資源分配和應用場景上各有千秋。預訓練像是讓AI模型去學校學習基礎知識,而后訓練則是讓模型掌握特定工作技能,如醫療、法律等專業領域。“測試時擴展”則賦予了模型更強推理能力。

            AI模型的迭代還存在類似摩爾定律的現象,即能力密度隨時間呈指數級增強。劉知遠說,2023年以來,大模型能力密度大約每100天翻一番,即每過100天,只需要一半算力和參數就能實現相同能力。未來應繼續推進計算系統智能化,不斷追求更高能力密度,以更低成本,實現大模型高效發展。

          • 相關閱讀
          • 俄媒:俄美下周末將就雙邊關系敏感問題舉行會談

              新華社莫斯科2月23日電(記者江宥林)據塔斯社23日報道,俄羅斯外交部副部長里亞布科夫說,俄羅斯和美國將于下周末就兩國關系中的敏感問題展開會談。  里亞布科夫表示,俄方對與美方進行接觸持開放態度。“我們期待計劃...

            時間:02-23
          • 現場直擊|德國聯邦議院選舉投票有序進行

              新華社柏林2月23日電 現場直擊|德國聯邦議院選舉投票有序進行  新華社記者邰思聰 王自強 李超  當地時間23日8時,德國新一屆聯邦議院(議會下院)選舉投票正式開始,初步計票結果預計于24日公布。  早上8時,記者...

            時間:02-23
          • 中國駐英國使館為“里斯本丸”號船幸存者家屬舉辦新春招待會

              新華社倫敦2月23日電(記者章博寧 趙小娜)中國駐英國大使館22日在倫敦為“里斯本丸”號船幸存者家屬舉辦新春招待會,共同追憶80多年前中國漁民英勇營救英軍戰俘的感人事跡。  1942年10月,日本軍隊征用“里斯本丸”...

            時間:02-23
          • 國際觀察|烏克蘭危機升級三年 多方博弈仍在激化

            &emsp;&emsp;新華社莫斯科/基輔2月23日電 題:烏克蘭危機升級三年 多方博弈仍在激化&emsp;&emsp;新華社記者黃河 李東旭&emsp;&emsp;烏克蘭危機升級已三年。這場沖突劇烈沖擊地區安全、經濟、社會等諸多領域,同時深刻...

            時間:02-23
          • 武契奇最新表態:沒有中國朋友 塞許多工程無法啟動

            &emsp;&emsp;塞爾維亞總統武契奇22日出席中企承建的“多瑙走廊”快速路項目主線部分路段通車儀式時說,這條為波扎雷瓦茨輸送投資的“動脈”通車后,將大幅提高整個地區的投資和旅游吸引力。&emsp;&emsp;由山東高速集團承...

            時間:02-23
          • 德國聯邦議院選舉投票開始

            &emsp;&emsp;2月23日,在德國北萊茵-威斯特法倫州阿恩斯貝格,選民在一處投票站投票。新華社記者 張帆 攝&emsp;&emsp;新華社柏林2月23日電(記者邰思聰 李超)德國新一屆聯邦議院(議會下院)選舉投票于當地時間23日8時正式開始。...

            時間:02-23
          • 全球連線 | 40天1004公里 他們徒步穿越塔克拉瑪干

            &emsp;&emsp;近日,職業徒步者周揚和張治國完成一項壯舉,他們以全自助方式徒步40天,由東往西橫穿“死亡之海”塔克拉瑪干沙漠,總距離達1004公里,期間他們克服沙塵暴、寒潮、脫水等多重困難。周揚說他為這次穿越塔克拉瑪干沙...

            時間:02-23
          • 英國擬對俄實施三年來“最大規模”制裁

              新華社北京2月23日電 烏克蘭危機全面升級三周年之際,英國外交大臣戴維·拉米23日說,英國將對俄羅斯實施三年來“規模最大”的制裁,并將在必要時向烏克蘭派遣軍隊。  拉米在一份聲明中說,他將于24日宣布對俄方實施新...

            時間:02-23
          • 新華社消息|俄繼續堅持加強和發展武裝力量的戰略方針

              編導:徐中哲  新華社音視頻部制作 ...

            時間:02-23
          免責聲明:本網對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網站轉載圖片、文字之類版權申明,本網站無法鑒別所上傳圖片或文字的知識版權,如果侵犯,請及時通知我們,本網站將在第一時間及時刪除。
          亚洲成人网在线观看| 亚洲天堂第一区| 精品一区二区三区av天堂| 国产大尺度吃奶无遮无挡网| 99久久99这里只有免费费精品| 国模gogo中国人体私拍视频| 99精品国产在热久久无毒不卡| 国产肝交视频在线观看| 97精品在线视频| 在线播放日本爽快片| 一本加勒比HEZYO无码人妻| 天天摸天天干天天操| free性俄罗斯| 国产精品理论片| 黄色aaa级片| 国产又大又粗又硬又长免费| 翁房中春意浓王易婉艳| 啦啦啦中文在线观看日本| 用我的手指来扰乱吧全集在线翻译 | 国产理论视频在线观看| 91欧美一区二区三区综合在线| 国产精品xxxx国产喷水| 777精品视频| 国产精品多人P群无码| 香蕉免费看一区二区三区| 国产精品一区不卡| 超碰97久久国产精品牛牛| 国产大学生真实视频在线| 美女大量吞精在线观看456 | 亚洲av日韩精品久久久久久久| 欧美亚洲天堂网| 亚洲av之男人的天堂网站| 无码精品A∨在线观看无广告| 久久精品99久久香蕉国产色戒| 日韩大片免费看| 亚洲av无码精品色午夜果冻不卡| 日本亲与子乱ay中文| 久久天天躁狠狠躁夜夜2020一| 性一交一乱一伧老太| jlzzjlzz亚洲jzjzjz| 在线观看日本www|