四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

面壁智能首席科學家劉知遠：提升知識密度是實現(xiàn)高效大模型的方向

每日經(jīng)濟新聞 2024-07-05 16:12:16

每經(jīng)記者張韻每經(jīng)編輯董興生

大模型也有自己的“摩爾定律”？2024世界人工智能大會期間，深耕端側大模型的清華大學計算機系長聘副教授、面壁智能首席科學家劉知遠分享了他的研究思路：“如果擁有在端側有限的算力、內存、能耗條件下，將知識濃縮到更小的參數(shù)規(guī)模中的能力，那么便可探尋大模型的高效成長規(guī)律。”

圖片來源：每經(jīng)記者張韻攝

在訓練大模型之前，劉知遠會在“模型沙盒”中做成百上千次演練。他解釋道，在小模型上高效尋找最優(yōu)數(shù)據(jù)和超參配置，并外推至大模型，可找到一個更高的知識密度，從而帶來一個更加高效的模型。

劉知遠認為，如果說芯片制程會帶來終端算力持續(xù)增強，模型制程也將帶來模型知識密度的持續(xù)增長，那么兩者交匯將揭示端側智能的巨大潛力。因此，大模型時代會擁有自己的“摩爾定律”，即模型知識密度的持續(xù)增強。據(jù)劉知遠觀察，模型的知識密度呈現(xiàn)出每8個月提升一倍的規(guī)律。

劉知遠進一步得出結論，未來高效大模型第一性原理的關鍵詞便是知識密度，也就是每一次計算依托的參數(shù)規(guī)模所對應的能力消耗。當大模型數(shù)據(jù)驅動技術方向大致確定，模型的架構、算法、數(shù)據(jù)等技術方案卻仍在高速迭代，因此持續(xù)改進模型制程、極致提升知識密度成為行業(yè)努力的方向。

如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

《廣州市推動低空經(jīng)濟高質量發(fā)展若干措施》發(fā)布

返回每經(jīng)網(wǎng)首頁

下一篇文章

深城交：目前在積極拓展國內及國際市場一些重要城市智能網(wǎng)聯(lián)相關業(yè)務

相關文章

熱文精選

點擊排行

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

相關信息
關于我們
版權聲明

關注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2024 每日經(jīng)濟新聞報社版權所有，未經(jīng)許可不得轉載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn