<td id="hq3hh"></td>

    1. <span id="hq3hh"><optgroup id="hq3hh"></optgroup></span>
        <rt id="hq3hh"><optgroup id="hq3hh"><strike id="hq3hh"></strike></optgroup></rt>
        <span id="hq3hh"><optgroup id="hq3hh"><center id="hq3hh"></center></optgroup></span>

          <label id="hq3hh"><meter id="hq3hh"></meter></label>
          首頁  ?  新聞頻道  ?  國際新聞

          新聞分析|全球科研團隊競逐低成本AI模型研發(fā)新范式

          2025-02-23 15:56:42

          來源:新華網(wǎng)

            新華社北京2月23日電 新聞分析|全球科研團隊競逐低成本AI模型研發(fā)新范式

            新華社記者彭茜

            美國斯坦福大學等機構(gòu)研究團隊近日宣布,在基座大模型基礎上,僅耗費數(shù)十美元就開發(fā)出相對成熟的推理模型。盡管其整體性能尚無法比肩美國開放人工智能研究中心(OpenAI)開發(fā)的o1、中國深度求索公司的DeepSeek-R1等,但此類嘗試意味著企業(yè)可以較低成本研發(fā)出適合自身的AI應用,AI普惠性有望增強。同時,其所應用的“測試時擴展”技術或代表一條更可持續(xù)的AI研發(fā)路徑。

            低成本玩轉(zhuǎn)高級推理

            美國斯坦福大學和華盛頓大學研究團隊近日宣布研發(fā)出名為s1的模型,在衡量數(shù)學和編碼能力的測試中,可媲美o1和DeepSeek-R1等。研究團隊稱,訓練租用所需的計算資源等成本只需約幾十美元。

            s1的核心創(chuàng)新在于采用了“知識蒸餾”技術和“預算強制”方法。“知識蒸餾”好比把別人釀好的酒進一步提純。該模型訓練數(shù)據(jù)是基于谷歌Gemini Thinking Experimental模型“蒸餾”出的僅有1000個樣本的小型數(shù)據(jù)集。

            “預算強制”則使用了AI模型訓練新方法——“測試時擴展”的實現(xiàn)方式。“測試時擴展”又稱“深度思考”,核心是在模型測試階段,通過調(diào)整計算資源分配,使模型更深入思考問題,提高推理能力和準確性。

            “預算強制”通過強制提前結(jié)束或延長模型的思考過程,來影響模型的推理深度和最終答案。s1對阿里云的通義千問開源模型進行微調(diào),通過“預算強制”控制訓練后的模型計算量,使用16個英偉達H100 GPU僅進行26分鐘訓練便達成目標。

            美國加利福尼亞大學伯克利分校研究團隊最近也開發(fā)出一款名為TinyZero的精簡AI模型,稱復刻了DeepSeek-R1 Zero在倒計時和乘法任務中的表現(xiàn)。該模型通過強化學習,實現(xiàn)了部分相當于30億模型參數(shù)的大語言模型的自我思維驗證和搜索能力。團隊稱項目訓練成本不到30美元。

            “二次創(chuàng)造”增強AI普惠性

            清華大學計算機系長聘副教授劉知遠接受記者采訪時說,部分海外研究團隊使用DeepSeek-R1、o1等高性能推理大模型來構(gòu)建、篩選高質(zhì)量長思維鏈數(shù)據(jù)集,再用這些數(shù)據(jù)集微調(diào)模型,可低成本快速獲得高階推理能力。

            相關專家認為,這是AI研發(fā)的有益嘗試,以“二次創(chuàng)造”方式構(gòu)建模型增強了AI普惠性。但有三點值得注意:

            首先,所謂“幾十美元的低成本”,并未納入開發(fā)基座大模型的高昂成本。這就好比蓋房子,只算了最后裝修的錢,卻沒算買地、打地基的錢。AI智庫“快思慢想研究院”院長田豐告訴記者,幾十美元成本只是最后一個環(huán)節(jié)的算力成本,并未計算基座模型的預訓練成本、數(shù)據(jù)采集加工成本。

            其次,“二次創(chuàng)造”構(gòu)建的模型,整體性能尚無法比肩成熟大模型。TinyZero僅在簡單數(shù)學任務、編程及數(shù)學益智游戲等特定任務中有良好表現(xiàn),但無法適用于更復雜、多樣化的任務場景。而s1模型也只能通過精心挑選的訓練數(shù)據(jù),在特定測試集上超過早期版本o1 preview,而遠未超過o1正式版或DeepSeek-R1。

            最后,開發(fā)性能更優(yōu)越的大模型,仍需強化學習技術。劉知遠說,就推動大模型能力邊界而言,“知識蒸餾”技術意義不大,未來仍需探索大規(guī)模強化學習技術,以持續(xù)激發(fā)大模型在思考、反思、探索等方面的能力。

            AI模型未來如何進化

            在2025年美國消費電子展上,美國英偉達公司高管為AI的進化勾畫了一條路線圖:以智能水平為縱軸、以計算量為橫軸,衡量AI模型的“規(guī)模定律”呈現(xiàn)從“預訓練擴展”、到“訓練后擴展”,再到“測試時擴展”的演進。

            “預訓練擴展”堪稱“大力出奇跡”——訓練數(shù)據(jù)越多、模型規(guī)模越大、投入算力越多,最終得到AI模型的能力就越強。目標是構(gòu)建一個通用語言模型,以GPT早期模型為代表。而“訓練后擴展”涉及強化學習和人類反饋等技術,是預訓練模型的“進化”,優(yōu)化其在特定領域的任務表現(xiàn)。

            隨著“預訓練擴展”和“訓練后擴展”邊際收益逐漸遞減,“測試時擴展”技術興起。田豐說,“測試時擴展”的核心在于將焦點從訓練階段轉(zhuǎn)移到推理階段,通過動態(tài)控制推理過程中的計算量(如思考步長、迭代次數(shù))來優(yōu)化結(jié)果。這一方法不僅降低了對預訓練數(shù)據(jù)的依賴,還顯著提升了模型潛力。

            三者在資源分配和應用場景上各有千秋。預訓練像是讓AI模型去學校學習基礎知識,而后訓練則是讓模型掌握特定工作技能,如醫(yī)療、法律等專業(yè)領域。“測試時擴展”則賦予了模型更強推理能力。

            AI模型的迭代還存在類似摩爾定律的現(xiàn)象,即能力密度隨時間呈指數(shù)級增強。劉知遠說,2023年以來,大模型能力密度大約每100天翻一番,即每過100天,只需要一半算力和參數(shù)就能實現(xiàn)相同能力。未來應繼續(xù)推進計算系統(tǒng)智能化,不斷追求更高能力密度,以更低成本,實現(xiàn)大模型高效發(fā)展。

          • 相關閱讀
          • 新華視評丨以“新”為帆 開拓外貿(mào)新空間

              編導:趙宇超  新華社音視頻部制作 ...

            時間:02-23
          • 記者手記丨中國新能源汽車閃耀印尼國際車展

            &emsp;&emsp;新華社雅加達2月23日電 記者手記|中國新能源汽車閃耀印尼國際車展&emsp;&emsp;新華社記者陶方偉&emsp;&emsp;“這個可旋轉(zhuǎn)中控屏太棒了!”來自印度尼西亞泗水的哈里興奮地體驗著比亞迪電動運動型多功能車(S...

            時間:02-23
          • 法國東部發(fā)生持刀襲擊事件致1死多傷

              新華社巴黎2月22日電(記者張百慧)據(jù)法國媒體報道,法國東部城市米盧斯22日發(fā)生一起持刀襲擊事件,目前已致1人死亡、多人受傷。嫌疑人已被逮捕。  報道說,22日下午,一名持刀男子在當?shù)匾皇袌龈浇蚵啡税l(fā)動襲擊,一名路人...

            時間:02-23
          • “中國講壇”在突尼斯舉辦 探討中非攜手現(xiàn)代化前景

              新華社突尼斯2月22日電(記者黃靈 王一盛)以“中非攜手現(xiàn)代化引領全球南方”為主題、由中國非洲研究院主辦的第22屆“中國講壇”22日在位于突尼斯首都突尼斯市的突尼斯高等語言學院舉行。&emsp;&emsp;2月22日,突尼斯...

            時間:02-23
          • 全球瞭望丨約旦專欄作家:中國外交堅持和平、理性,具有戰(zhàn)略定力

            &emsp;&emsp;新華社安曼2月22日電(記者何奕萍)約旦專欄作家法里斯·哈巴什奈近日在當?shù)刂髁髅襟w《憲章報》發(fā)表文章,強調(diào)中國外交堅持和平、理性,具有戰(zhàn)略定力。文章摘要如下:&emsp;&emsp;中國在外交政策上堅持積極中立,堅...

            時間:02-22
          • 蒙古國國家大呼拉爾主席將訪華

              新華社北京2月22日電 應全國人大常委會委員長趙樂際邀請,蒙古國國家大呼拉爾主席阿瑪爾巴伊斯格楞將于2月24日至27日率團訪華。 ...

            時間:02-22
          • 二十國集團外長會呼吁合作應對全球性挑戰(zhàn)

              新華社約翰內(nèi)斯堡2月22日電(記者王曉梅)為期兩天的二十國集團(G20)外長會21日在南非約翰內(nèi)斯堡落下帷幕。會議呼吁各國加強合作,應對全球性挑戰(zhàn)。  南非總統(tǒng)拉馬福薩在會議期間表示,G20峰會在非洲舉行,凸顯了在可持續(xù)...

            時間:02-22
          • 新西蘭克賴斯特徹奇舉行地震14周年悼念儀式

              新華社惠靈頓2月22日電(記者龍雷 李惠子)新西蘭南島最大城市克賴斯特徹奇22日舉行2011年地震遇難者悼念儀式。&emsp;&emsp;2月22日,新西蘭南島最大城市克賴斯特徹奇舉行2011年地震遇難者悼念儀式。新華社發(fā)(仲偉人 ...

            時間:02-22
          • 美俄“單聊”后,美歐涉烏決議草案現(xiàn)分歧

            &emsp;&emsp;新華社北京2月22日電 烏克蘭危機全面升級三周年之際,美國不再與盟友一道在聯(lián)合國大會共同發(fā)起支持烏克蘭的決議草案,而是“另起爐灶”,即提議與歐洲盟友和烏克蘭立場不同的決議草案。2024年9月23日,在位于紐...

            時間:02-22
          免責聲明:本網(wǎng)對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類版權(quán)申明,本網(wǎng)站無法鑒別所上傳圖片或文字的知識版權(quán),如果侵犯,請及時通知我們,本網(wǎng)站將在第一時間及時刪除。
          yy6080理aa级伦大片一级毛片| 亚洲欧美卡通另类| 精品无码久久久久久国产| 国自产拍在线天天更新91| 亚洲av成人综合网| 欧美午夜免费观看福利片| 免费高清电影在线观看| 精品熟女碰碰人人a久久| 国产91在线|日韩| 色在线亚洲视频www| 国产成人涩涩涩视频在线观看| 78成人精品电影在线播放日韩精品电影一区亚洲 | 亚洲一久久久久久久久| 欧美xxxx性疯狂bbbb| 亚洲欧美在线观看视频| 校花被折磨阴部流水| 亚洲成综合人影院在院播放| 欧美日韩精品国产一区二区| 免费国产黄网站在线观看视频| 男插女高潮一区二区| 又大又湿又紧又大爽a视频| 精品国产专区91在线app| 国产一级片在线| 色噜噜亚洲男人的天堂| 国产69精品久久久久777| 用我的手指来扰乱吧全集在线翻译| 办公室娇喘的短裙老师在线视频 | 欧美日韩一区二区三| 亚洲第九十九页| 欧美日韩中文国产va另类| 亚洲国产精品尤物yw在线观看 | 欧美丰满熟妇xxxx性ppx人交| 亚洲最大看欧美片网站| 欧美国产第一页| 亚洲天堂福利视频| 杨晨晨脱得一二净无内裤全身 | 韩国免费乱理论片在线观看2018| 国产日韩欧美自拍| 青青青国产在线| 国产AV无码专区亚洲AV | 扒开双腿猛进湿润18p|