<td id="hq3hh"></td>

    1. <span id="hq3hh"><optgroup id="hq3hh"></optgroup></span>
        <rt id="hq3hh"><optgroup id="hq3hh"><strike id="hq3hh"></strike></optgroup></rt>
        <span id="hq3hh"><optgroup id="hq3hh"><center id="hq3hh"></center></optgroup></span>

          <label id="hq3hh"><meter id="hq3hh"></meter></label>
          首頁(yè)  ?  新聞?lì)l道  ?  國(guó)際新聞

          新聞分析|全球科研團(tuán)隊(duì)競(jìng)逐低成本AI模型研發(fā)新范式

          2025-02-23 15:56:42

          來(lái)源:新華網(wǎng)

            新華社北京2月23日電 新聞分析|全球科研團(tuán)隊(duì)競(jìng)逐低成本AI模型研發(fā)新范式

            新華社記者彭茜

            美國(guó)斯坦福大學(xué)等機(jī)構(gòu)研究團(tuán)隊(duì)近日宣布,在基座大模型基礎(chǔ)上,僅耗費(fèi)數(shù)十美元就開(kāi)發(fā)出相對(duì)成熟的推理模型。盡管其整體性能尚無(wú)法比肩美國(guó)開(kāi)放人工智能研究中心(OpenAI)開(kāi)發(fā)的o1、中國(guó)深度求索公司的DeepSeek-R1等,但此類(lèi)嘗試意味著企業(yè)可以較低成本研發(fā)出適合自身的AI應(yīng)用,AI普惠性有望增強(qiáng)。同時(shí),其所應(yīng)用的“測(cè)試時(shí)擴(kuò)展”技術(shù)或代表一條更可持續(xù)的AI研發(fā)路徑。

            低成本玩轉(zhuǎn)高級(jí)推理

            美國(guó)斯坦福大學(xué)和華盛頓大學(xué)研究團(tuán)隊(duì)近日宣布研發(fā)出名為s1的模型,在衡量數(shù)學(xué)和編碼能力的測(cè)試中,可媲美o1和DeepSeek-R1等。研究團(tuán)隊(duì)稱(chēng),訓(xùn)練租用所需的計(jì)算資源等成本只需約幾十美元。

            s1的核心創(chuàng)新在于采用了“知識(shí)蒸餾”技術(shù)和“預(yù)算強(qiáng)制”方法。“知識(shí)蒸餾”好比把別人釀好的酒進(jìn)一步提純。該模型訓(xùn)練數(shù)據(jù)是基于谷歌Gemini Thinking Experimental模型“蒸餾”出的僅有1000個(gè)樣本的小型數(shù)據(jù)集。

            “預(yù)算強(qiáng)制”則使用了AI模型訓(xùn)練新方法——“測(cè)試時(shí)擴(kuò)展”的實(shí)現(xiàn)方式。“測(cè)試時(shí)擴(kuò)展”又稱(chēng)“深度思考”,核心是在模型測(cè)試階段,通過(guò)調(diào)整計(jì)算資源分配,使模型更深入思考問(wèn)題,提高推理能力和準(zhǔn)確性。

            “預(yù)算強(qiáng)制”通過(guò)強(qiáng)制提前結(jié)束或延長(zhǎng)模型的思考過(guò)程,來(lái)影響模型的推理深度和最終答案。s1對(duì)阿里云的通義千問(wèn)開(kāi)源模型進(jìn)行微調(diào),通過(guò)“預(yù)算強(qiáng)制”控制訓(xùn)練后的模型計(jì)算量,使用16個(gè)英偉達(dá)H100 GPU僅進(jìn)行26分鐘訓(xùn)練便達(dá)成目標(biāo)。

            美國(guó)加利福尼亞大學(xué)伯克利分校研究團(tuán)隊(duì)最近也開(kāi)發(fā)出一款名為T(mén)inyZero的精簡(jiǎn)AI模型,稱(chēng)復(fù)刻了DeepSeek-R1 Zero在倒計(jì)時(shí)和乘法任務(wù)中的表現(xiàn)。該模型通過(guò)強(qiáng)化學(xué)習(xí),實(shí)現(xiàn)了部分相當(dāng)于30億模型參數(shù)的大語(yǔ)言模型的自我思維驗(yàn)證和搜索能力。團(tuán)隊(duì)稱(chēng)項(xiàng)目訓(xùn)練成本不到30美元。

            “二次創(chuàng)造”增強(qiáng)AI普惠性

            清華大學(xué)計(jì)算機(jī)系長(zhǎng)聘副教授劉知遠(yuǎn)接受記者采訪(fǎng)時(shí)說(shuō),部分海外研究團(tuán)隊(duì)使用DeepSeek-R1、o1等高性能推理大模型來(lái)構(gòu)建、篩選高質(zhì)量長(zhǎng)思維鏈數(shù)據(jù)集,再用這些數(shù)據(jù)集微調(diào)模型,可低成本快速獲得高階推理能力。

            相關(guān)專(zhuān)家認(rèn)為,這是AI研發(fā)的有益嘗試,以“二次創(chuàng)造”方式構(gòu)建模型增強(qiáng)了AI普惠性。但有三點(diǎn)值得注意:

            首先,所謂“幾十美元的低成本”,并未納入開(kāi)發(fā)基座大模型的高昂成本。這就好比蓋房子,只算了最后裝修的錢(qián),卻沒(méi)算買(mǎi)地、打地基的錢(qián)。AI智庫(kù)“快思慢想研究院”院長(zhǎng)田豐告訴記者,幾十美元成本只是最后一個(gè)環(huán)節(jié)的算力成本,并未計(jì)算基座模型的預(yù)訓(xùn)練成本、數(shù)據(jù)采集加工成本。

            其次,“二次創(chuàng)造”構(gòu)建的模型,整體性能尚無(wú)法比肩成熟大模型。TinyZero僅在簡(jiǎn)單數(shù)學(xué)任務(wù)、編程及數(shù)學(xué)益智游戲等特定任務(wù)中有良好表現(xiàn),但無(wú)法適用于更復(fù)雜、多樣化的任務(wù)場(chǎng)景。而s1模型也只能通過(guò)精心挑選的訓(xùn)練數(shù)據(jù),在特定測(cè)試集上超過(guò)早期版本o1 preview,而遠(yuǎn)未超過(guò)o1正式版或DeepSeek-R1。

            最后,開(kāi)發(fā)性能更優(yōu)越的大模型,仍需強(qiáng)化學(xué)習(xí)技術(shù)。劉知遠(yuǎn)說(shuō),就推動(dòng)大模型能力邊界而言,“知識(shí)蒸餾”技術(shù)意義不大,未來(lái)仍需探索大規(guī)模強(qiáng)化學(xué)習(xí)技術(shù),以持續(xù)激發(fā)大模型在思考、反思、探索等方面的能力。

            AI模型未來(lái)如何進(jìn)化

            在2025年美國(guó)消費(fèi)電子展上,美國(guó)英偉達(dá)公司高管為AI的進(jìn)化勾畫(huà)了一條路線(xiàn)圖:以智能水平為縱軸、以計(jì)算量為橫軸,衡量AI模型的“規(guī)模定律”呈現(xiàn)從“預(yù)訓(xùn)練擴(kuò)展”、到“訓(xùn)練后擴(kuò)展”,再到“測(cè)試時(shí)擴(kuò)展”的演進(jìn)。

            “預(yù)訓(xùn)練擴(kuò)展”堪稱(chēng)“大力出奇跡”——訓(xùn)練數(shù)據(jù)越多、模型規(guī)模越大、投入算力越多,最終得到AI模型的能力就越強(qiáng)。目標(biāo)是構(gòu)建一個(gè)通用語(yǔ)言模型,以GPT早期模型為代表。而“訓(xùn)練后擴(kuò)展”涉及強(qiáng)化學(xué)習(xí)和人類(lèi)反饋等技術(shù),是預(yù)訓(xùn)練模型的“進(jìn)化”,優(yōu)化其在特定領(lǐng)域的任務(wù)表現(xiàn)。

            隨著“預(yù)訓(xùn)練擴(kuò)展”和“訓(xùn)練后擴(kuò)展”邊際收益逐漸遞減,“測(cè)試時(shí)擴(kuò)展”技術(shù)興起。田豐說(shuō),“測(cè)試時(shí)擴(kuò)展”的核心在于將焦點(diǎn)從訓(xùn)練階段轉(zhuǎn)移到推理階段,通過(guò)動(dòng)態(tài)控制推理過(guò)程中的計(jì)算量(如思考步長(zhǎng)、迭代次數(shù))來(lái)優(yōu)化結(jié)果。這一方法不僅降低了對(duì)預(yù)訓(xùn)練數(shù)據(jù)的依賴(lài),還顯著提升了模型潛力。

            三者在資源分配和應(yīng)用場(chǎng)景上各有千秋。預(yù)訓(xùn)練像是讓AI模型去學(xué)校學(xué)習(xí)基礎(chǔ)知識(shí),而后訓(xùn)練則是讓模型掌握特定工作技能,如醫(yī)療、法律等專(zhuān)業(yè)領(lǐng)域。“測(cè)試時(shí)擴(kuò)展”則賦予了模型更強(qiáng)推理能力。

            AI模型的迭代還存在類(lèi)似摩爾定律的現(xiàn)象,即能力密度隨時(shí)間呈指數(shù)級(jí)增強(qiáng)。劉知遠(yuǎn)說(shuō),2023年以來(lái),大模型能力密度大約每100天翻一番,即每過(guò)100天,只需要一半算力和參數(shù)就能實(shí)現(xiàn)相同能力。未來(lái)應(yīng)繼續(xù)推進(jìn)計(jì)算系統(tǒng)智能化,不斷追求更高能力密度,以更低成本,實(shí)現(xiàn)大模型高效發(fā)展。

          • 相關(guān)閱讀
          • 俄媒:俄美下周末將就雙邊關(guān)系敏感問(wèn)題舉行會(huì)談

              新華社莫斯科2月23日電(記者江宥林)據(jù)塔斯社23日?qǐng)?bào)道,俄羅斯外交部副部長(zhǎng)里亞布科夫說(shuō),俄羅斯和美國(guó)將于下周末就兩國(guó)關(guān)系中的敏感問(wèn)題展開(kāi)會(huì)談。  里亞布科夫表示,俄方對(duì)與美方進(jìn)行接觸持開(kāi)放態(tài)度。“我們期待計(jì)劃...

            時(shí)間:02-23
          • 現(xiàn)場(chǎng)直擊|德國(guó)聯(lián)邦議院選舉投票有序進(jìn)行

              新華社柏林2月23日電 現(xiàn)場(chǎng)直擊|德國(guó)聯(lián)邦議院選舉投票有序進(jìn)行  新華社記者邰思聰 王自強(qiáng) 李超  當(dāng)?shù)貢r(shí)間23日8時(shí),德國(guó)新一屆聯(lián)邦議院(議會(huì)下院)選舉投票正式開(kāi)始,初步計(jì)票結(jié)果預(yù)計(jì)于24日公布。  早上8時(shí),記者...

            時(shí)間:02-23
          • 中國(guó)駐英國(guó)使館為“里斯本丸”號(hào)船幸存者家屬舉辦新春招待會(huì)

              新華社倫敦2月23日電(記者章博寧 趙小娜)中國(guó)駐英國(guó)大使館22日在倫敦為“里斯本丸”號(hào)船幸存者家屬舉辦新春招待會(huì),共同追憶80多年前中國(guó)漁民英勇?tīng)I(yíng)救英軍戰(zhàn)俘的感人事跡。  1942年10月,日本軍隊(duì)征用“里斯本丸”...

            時(shí)間:02-23
          • 國(guó)際觀察|烏克蘭危機(jī)升級(jí)三年 多方博弈仍在激化

            &emsp;&emsp;新華社莫斯科/基輔2月23日電 題:烏克蘭危機(jī)升級(jí)三年 多方博弈仍在激化&emsp;&emsp;新華社記者黃河 李東旭&emsp;&emsp;烏克蘭危機(jī)升級(jí)已三年。這場(chǎng)沖突劇烈沖擊地區(qū)安全、經(jīng)濟(jì)、社會(huì)等諸多領(lǐng)域,同時(shí)深刻...

            時(shí)間:02-23
          • 武契奇最新表態(tài):沒(méi)有中國(guó)朋友 塞許多工程無(wú)法啟動(dòng)

            &emsp;&emsp;塞爾維亞總統(tǒng)武契奇22日出席中企承建的“多瑙走廊”快速路項(xiàng)目主線(xiàn)部分路段通車(chē)儀式時(shí)說(shuō),這條為波扎雷瓦茨輸送投資的“動(dòng)脈”通車(chē)后,將大幅提高整個(gè)地區(qū)的投資和旅游吸引力。&emsp;&emsp;由山東高速集團(tuán)承...

            時(shí)間:02-23
          • 德國(guó)聯(lián)邦議院選舉投票開(kāi)始

            &emsp;&emsp;2月23日,在德國(guó)北萊茵-威斯特法倫州阿恩斯貝格,選民在一處投票站投票。新華社記者 張帆 攝&emsp;&emsp;新華社柏林2月23日電(記者邰思聰 李超)德國(guó)新一屆聯(lián)邦議院(議會(huì)下院)選舉投票于當(dāng)?shù)貢r(shí)間23日8時(shí)正式開(kāi)始。...

            時(shí)間:02-23
          • 全球連線(xiàn) | 40天1004公里 他們徒步穿越塔克拉瑪干

            &emsp;&emsp;近日,職業(yè)徒步者周揚(yáng)和張治國(guó)完成一項(xiàng)壯舉,他們以全自助方式徒步40天,由東往西橫穿“死亡之海”塔克拉瑪干沙漠,總距離達(dá)1004公里,期間他們克服沙塵暴、寒潮、脫水等多重困難。周揚(yáng)說(shuō)他為這次穿越塔克拉瑪干沙...

            時(shí)間:02-23
          • 英國(guó)擬對(duì)俄實(shí)施三年來(lái)“最大規(guī)模”制裁

              新華社北京2月23日電 烏克蘭危機(jī)全面升級(jí)三周年之際,英國(guó)外交大臣戴維·拉米23日說(shuō),英國(guó)將對(duì)俄羅斯實(shí)施三年來(lái)“規(guī)模最大”的制裁,并將在必要時(shí)向?yàn)蹩颂m派遣軍隊(duì)。  拉米在一份聲明中說(shuō),他將于24日宣布對(duì)俄方實(shí)施新...

            時(shí)間:02-23
          • 新華社消息|俄繼續(xù)堅(jiān)持加強(qiáng)和發(fā)展武裝力量的戰(zhàn)略方針

              編導(dǎo):徐中哲  新華社音視頻部制作 ...

            時(shí)間:02-23
          免責(zé)聲明:本網(wǎng)對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類(lèi)版權(quán)申明,本網(wǎng)站無(wú)法鑒別所上傳圖片或文字的知識(shí)版權(quán),如果侵犯,請(qǐng)及時(shí)通知我們,本網(wǎng)站將在第一時(shí)間及時(shí)刪除。
          国产高清不卡无码视频| 国产不卡在线观看| 丰满岳乱妇一区二区三区| 日本一道高清一区二区三区| 九一制片厂果冻传媒56| 日韩欧美一及在线播放| 久热re这里只有精品视频| 日本三级香港三级人妇m| 久久久婷婷五月亚洲97号色| 成在线人永久免费视频播放| 中文字幕亚洲综合久久| 日本污全彩肉肉无遮挡彩色| 久久永久免费人妻精品下载| 日韩精品一区二区三区老鸭窝| 九九久久精品国产免费看小说| 日本xxxx裸体bbbb| 中文字幕网伦射乱中文| 女m室内被调教过程| 中文字幕国产剧情| 奇米影视77777| CAOPORN国产精品免费视频| 国产精品无码一区二区三区免费| 1313mm禁片视频| 国产精品久久国产精麻豆99网站 | 看大片全色黄大色黄| 内射白嫩少妇超碰| 波多野结衣在线女教师| 亚洲爱情岛论坛| 最近中文字幕在线的mv视频| 久久青草免费91线频观看不卡| 放荡的女人在线观看| 丁香婷婷亚洲六月综合色| 在线观看中文字幕| 67194熟妇人妻欧美日韩| 国产在线麻豆精品观看| 精品国产福利在线观看| 免费无遮挡无码永久在线观看视频| 欧美日韩国产综合在线| 亚洲一区无码中文字幕| 最新国产中文字幕| 久久国产精品99精品国产|