四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

<fieldset id="4usm4"><dd id="4usm4"></dd></fieldset>

<fieldset id="4usm4"></fieldset>

<nav id="4usm4"><tfoot id="4usm4"></tfoot></nav><option id="4usm4"></option>

每日經(jīng)濟(jì)新聞

要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

最新！李飛飛團(tuán)隊(duì)456頁(yè)報(bào)告：中美AI模型性能近乎持平，系統(tǒng)推理成本降至280分之一

每日經(jīng)濟(jì)新聞 2025-04-09 20:34:20

每經(jīng)記者宋欣悅每經(jīng)編輯陳柯名蘭素英

4月8日，由李飛飛聯(lián)合領(lǐng)導(dǎo)的斯坦福大學(xué)以人為本人工智能研究所（Stanford HAI）發(fā)布了《2025年人工智能指數(shù)報(bào)告》（Artificial Intelligence Index Report 2025）。這份長(zhǎng)達(dá)456頁(yè)的報(bào)告，深入剖析了2024年全球人工智能行業(yè)的發(fā)展態(tài)勢(shì)，揭示了12大關(guān)鍵趨勢(shì)。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuJyQIfZqLibhibIicPQ2O4YiaR5P372yfOsNBlxqaCjw1mSMwTaN2j8yvTg.png

圖片來(lái)源：斯坦福大學(xué)以人為本人工智能研究所官網(wǎng)

報(bào)告認(rèn)為，AI正變得更高效、更普惠。隨著小模型性能飆升，達(dá)到GPT-3.5水平的系統(tǒng)推理成本在過(guò)去兩年間下降到了原來(lái)的280分之一。

報(bào)告還指出，中國(guó)高性能AI模型的數(shù)量和質(zhì)量不斷提升，中美AI模型性能近乎持平。與此同時(shí)，中國(guó)在AI領(lǐng)域論文數(shù)量和專利數(shù)量上保持領(lǐng)先地位。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png AI性能飆升，表現(xiàn)逐漸接近人類

2023年，研究人員推出了MMMU、GPQA和SWE-bench等頗具挑戰(zhàn)性的新基準(zhǔn)測(cè)試，用于測(cè)試AI系統(tǒng)的極限。

測(cè)試發(fā)現(xiàn)，僅僅一年后，AI系統(tǒng)的性能便實(shí)現(xiàn)大幅躍升——在MMMU測(cè)試中得分提升18.8個(gè)百分點(diǎn)；在GPQA測(cè)試中提高48.9個(gè)百分點(diǎn)；SWE-bench測(cè)試?yán)锔翘嵘?7.3個(gè)百分點(diǎn)。

從整體趨勢(shì)來(lái)看，AI在各大領(lǐng)域的表現(xiàn)逐漸接近人類，甚至在某些情形下，AI智能體能在限時(shí)編程任務(wù)中超越人類。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuDnjWlmF4HxkIibrUvNcW5U2NvzSrOqdrn3E3HAjyic5Y24EibkUoGPujQ.png

在部分評(píng)測(cè)指標(biāo)上，AI技術(shù)性能表現(xiàn)與人類水平的對(duì)比?圖片來(lái)源：《2025年人工智能指數(shù)報(bào)告》

然而，復(fù)雜的推理對(duì)于AI模型而言，仍然是一個(gè)挑戰(zhàn)。

在處理類似國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽題目這類任務(wù)時(shí)，AI模型表現(xiàn)出色。但面對(duì)諸如PlanBench等復(fù)雜推理基準(zhǔn)測(cè)試時(shí)，卻仍顯得吃力。即使面對(duì)那些已知存在正解的邏輯任務(wù)，AI也經(jīng)常無(wú)法可靠地解決邏輯任務(wù)，這極大限制了AI在對(duì)精度要求極高的高風(fēng)險(xiǎn)行業(yè)中的應(yīng)用。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTu83W711jRLvbuKGh5bYnhgsllIClDALrZMiaxfVx3SSXN1aScqUz1mTA.png

各大模型在PlanBench基準(zhǔn)測(cè)試上的正確率圖片來(lái)源：《2025年人工智能指數(shù)報(bào)告》

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png 全球AI投資飆升?

2024年，生成式AI在全球范圍內(nèi)吸引了339億美元的私人投資，與2023年相比，增長(zhǎng)幅度達(dá)到18.7%。

與此同時(shí)，企業(yè)對(duì)AI的采用率顯著提升，從2023年的55%上升至2024年的78%。越來(lái)越多的研究結(jié)果表明，AI不僅能夠有效提升生產(chǎn)力，在多數(shù)情況下，還能縮小勞動(dòng)力的技能差距。

值得關(guān)注的是，將生成式AI應(yīng)用于至少一項(xiàng)業(yè)務(wù)職能的企業(yè)數(shù)量出現(xiàn)了激增。2023年，這一比例僅為33%，而到了2024年，該比例躍升至71%，增幅超過(guò)一倍。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuRN92iagqoRF88QZGA82iaVv5UOgc6icAtBLbia9RicUYGMkt0GevcITFgjw.png

2017年至2024年，將AI應(yīng)用于至少一項(xiàng)業(yè)務(wù)職能企業(yè)的比例不斷上升圖片來(lái)源：《2025年人工智能指數(shù)報(bào)告》

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png 中美模型性能近乎持平

數(shù)據(jù)顯示，美國(guó)在AI模型的數(shù)量上處于領(lǐng)先地位。2024年，總部位于美國(guó)的機(jī)構(gòu)擁有40個(gè)知名AI模型，超過(guò)中國(guó)（15個(gè)）和法國(guó)（3個(gè)）。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTucVy6U9cqNIZRt46DnQicNbUJbUPC1jxCrB1KiaiaTRGPU496ka2sibvfJg.png

圖片來(lái)源：《2025年人工智能指數(shù)報(bào)告》

不過(guò)，報(bào)告強(qiáng)調(diào)，中美模型之間的性能差距正在迅速縮小。以MMLU和HumanEval等主流基準(zhǔn)測(cè)試結(jié)果來(lái)看，2023年，中美頂尖模型之間的性能差距還在兩位數(shù)，然而到了2024年，這一差距已大幅縮小，幾乎處于同一水平。?

與此同時(shí)，中國(guó)在AI領(lǐng)域論文數(shù)量和專利數(shù)量上依舊保持領(lǐng)先地位。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png 小模型性能飆升，推理成本降至280分之一?

報(bào)告指出，AI正變得更加高效、經(jīng)濟(jì)實(shí)惠和易于獲取。

隨著小模型性能提升，達(dá)到GPT-3.5水平的系統(tǒng)推理成本在過(guò)去兩年間下降至280分之一。在硬件層面，成本每年下降30%，而能源效率每年提高40%。

2022年，在MMLU基準(zhǔn)測(cè)試中，得分超60%的最小模型是PaLM，參數(shù)量為5400億。到了2024年，微軟Phi-3-mini僅用38億參數(shù)，就取得了同樣的實(shí)力。這代表，兩年多的時(shí)間里模型參數(shù)減少了142倍。

此外，開源模型正在迎頭趕上，與閉源模型的差距逐漸縮小。2023年，開源模型明顯落后于閉源模型。而到2024年，這一差距幾乎消失。2024年1月初，頂尖閉源模型在大模型競(jìng)技場(chǎng)排行榜上以8.0%的成績(jī)超過(guò)了頂尖開源模型。而到2025年2月，這一差距已縮小至1.7%。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuxjufQpjqtp8Bd1IMiaictIYic2YeyO7qRHjBPHorGOdib937IbK2e9FzHA.png

2022年至2024年，在MMLU上得分高于60%的小模型圖片來(lái)源：《2025年人工智能指數(shù)報(bào)告》

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png 中國(guó)對(duì)AI的態(tài)度最樂(lè)觀

在對(duì)AI的態(tài)度方面，中國(guó)是全球主要國(guó)家和地區(qū)中最樂(lè)觀的。

報(bào)告顯示，2024年中國(guó)有83%的人認(rèn)為AI產(chǎn)品和服務(wù)利大于弊，排在后面的是印度尼西亞（80%）和泰國(guó)（77%）。相比之下，美國(guó)（39%）、加拿大（40%）等的樂(lè)觀情緒遠(yuǎn)低于中國(guó)。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuYyt6yV7ibKoM2CnMAP8cdncPGqURa5zrbeh1DBgibQL9QrcEsWoL5zdw.png

2022年至2024年，各國(guó)認(rèn)為“使用AI產(chǎn)品和服務(wù)利大于弊”的比例圖片來(lái)源：《2025年人工智能指數(shù)報(bào)告》

不過(guò)，從整體趨勢(shì)而言，各國(guó)對(duì)于AI的樂(lè)觀情緒正逐漸升溫，特別是在一些曾對(duì)AI最持懷疑態(tài)度的國(guó)家。數(shù)據(jù)顯示，自2022年起，美國(guó)認(rèn)為“使用AI產(chǎn)品和服務(wù)利大于弊”的比例提升了4%，加拿大增長(zhǎng)了8%，法國(guó)增長(zhǎng)了10%。

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png 三分之二受訪者稱AI將在未來(lái)3至5年對(duì)日常生活產(chǎn)生顯著影響

從醫(yī)療保健到交通運(yùn)輸，AI正迅速?gòu)膶?shí)驗(yàn)室走向日常生活。

2023年，美國(guó)食品藥品監(jiān)督管理局（FDA）批準(zhǔn)了223款A(yù)I醫(yī)療設(shè)備，而2015年僅有6款。

CFF20LXzkOyN00ZI2y8fDJNkp68HnqTuW5I80fjWndEcdyE8MqejuZtWicr8IOvuWD7ZIeWKBFezGL0sknNVUIg.png

1995年至2023年FDA批準(zhǔn)的AI醫(yī)療設(shè)備數(shù)量圖片來(lái)源：《2025年人工智能指數(shù)報(bào)告》

道路交通同樣因AI技術(shù)發(fā)生著日新月異的變化。自動(dòng)駕駛汽車不再只是實(shí)驗(yàn)，而是逐步駛?cè)氍F(xiàn)實(shí)生活。

美國(guó)最大的運(yùn)營(yíng)商之一Waymo每周提供超過(guò)15萬(wàn)次自動(dòng)駕駛服務(wù)，而百度旗下的“蘿卜快跑”（Apollo Go）無(wú)人駕駛出租車隊(duì)已在中國(guó)多個(gè)城市正式投入運(yùn)營(yíng)。

此外，人們對(duì)AI融入日常生活的期待與認(rèn)可度正在上升。據(jù)統(tǒng)計(jì)，全球范圍內(nèi)，有多達(dá)三分之二的受訪者認(rèn)為，在未來(lái)三到五年內(nèi)，AI產(chǎn)品及服務(wù)將對(duì)日常生活產(chǎn)生顯著影響。

記者|宋欣悅?

編輯|陳柯名?蘭素英杜波

校對(duì)|金冥羽

封面圖片來(lái)源：視覺(jué)中國(guó)

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

｜每日經(jīng)濟(jì)新聞 ?nbdnews??原創(chuàng)文章｜

未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

美國(guó)10年期國(guó)債收益率上漲21個(gè)基點(diǎn)至4.47%

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

中方強(qiáng)硬反制：四箭齊發(fā)！美股突發(fā)大跳水，美元大跌！油價(jià)暴跌，黃金飆漲……

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁(yè)

Copyright ? 2025 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國(guó)互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

<noframes id="o4gk0"></noframes>

<small id="o4gk0"></small>

<cite id="o4gk0"><tfoot id="o4gk0"></tfoot></cite>

<fieldset id="o4gk0"></fieldset>

<del id="o4gk0"><code id="o4gk0"></code></del>

<noscript id="o4gk0"></noscript>

<cite id="o4gk0"><kbd id="o4gk0"></kbd></cite>