四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

<i id="apsdd"></i>

每日經(jīng)濟新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

李彥宏內(nèi)部講話曝光：首次談及文心大模型為什么不開源

每日經(jīng)濟新聞 2024-04-11 21:05:58

◎文心大模型為什么不開源？李彥宏這樣說。

每經(jīng)記者可楊每經(jīng)編輯張海妮

4月11日晚間，《每日經(jīng)濟新聞》記者獲悉，在近日的一次內(nèi)部講話中，李彥宏對大模型開源與閉源的路線選擇，以及AI創(chuàng)業(yè)者應(yīng)該專注模型還是應(yīng)用等業(yè)界焦點話題，發(fā)表了看法。

在此次內(nèi)部講話中，李彥宏提到，閉源模型在能力上會持續(xù)地領(lǐng)先，而不是一時地領(lǐng)先；模型開源也不是一個眾人拾柴火焰高的情況。這跟傳統(tǒng)的軟件開源——比如Linux、安卓等很不一樣。

李彥宏還表示，閉源，是有真正的商業(yè)模式的，是能夠賺到錢的，能夠賺到錢才能聚集算力、聚集人才。閉源在成本上反而是有優(yōu)勢的，只要是同等能力，閉源模型的推理成本一定是更低的，響應(yīng)速度一定是更快的。

此外，李彥宏提到，無論中美，當前最強的基礎(chǔ)模型都是閉源的。通過基礎(chǔ)模型降維做出來的模型也是更好的，這使得閉源在成本、效率上更有優(yōu)勢。對于AI創(chuàng)業(yè)者來說，核心競爭力本就不應(yīng)該是模型本身，這太耗資源了，而且需要長時間的堅持才能跑出來。

李彥宏認為，既做模型又做應(yīng)用的“雙輪驅(qū)動”，對創(chuàng)業(yè)公司不是好模式。創(chuàng)業(yè)公司的精力和資源都很有限，更應(yīng)該專注。既做模型又做應(yīng)用，勢必會分散精力。

圖片來源：視覺中國-VCG111486664989

以下為李彥宏內(nèi)部講話實錄的部分原文：

一、為什么不開源

已經(jīng)有足夠多的開源大模型

一年前文心剛剛發(fā)布的時候，我們內(nèi)部是有過非常激烈的討論的，最后當然大家也知道這個結(jié)果，我們的決定是不開源。為什么不開源？當時的判斷是，市場上一定會有開源的模型，而且是不止一家會開源。在這種情況下，多百度一家開源不多，少百度一家開源也不少。

我們今天看主流的開源模型，像Llama、Mistral，其實都是有相當影響力的，國內(nèi)的智源、百川、阿里的通義也都是開源的，這個市場上不缺我們這一家開源的模型。我們要開源還得自己去維護一套開源的版本，這是不劃算的。

閉源模型能力會持續(xù)領(lǐng)先

更重要的是，在我們的認知里，閉源模型在能力上會持續(xù)地領(lǐng)先，而不是一時地領(lǐng)先。為什么會有這個判斷？因為我們覺得模型開源的意義其實不是很大，這些開源模型都是在外頭零零散散小規(guī)模地去做各種各樣的驗證應(yīng)用，它沒有經(jīng)過大算力的驗證。

而且模型開源也不是一個眾人拾柴火焰高的情況。這跟傳統(tǒng)的軟件開源——比如Linux、安卓等很不一樣，由于是模型帶來的開源，我們也不知道參數(shù)為什么變成了那個樣子，這種情況下很難實現(xiàn)眾人拾柴火焰高。雖然Llama也鼓勵大家去貢獻各種各樣的數(shù)據(jù)、代碼，但是實際上大家明白最主要的開發(fā)者就是Meta這些人，它并不是一個真正由大家一起來協(xié)同開發(fā)的產(chǎn)品。

閉源才有真正的商業(yè)模式，才能聚集人才和算力

反觀閉源，是有真正的商業(yè)模式的，是能夠賺到錢的，能夠賺到錢才能聚集算力、聚集人才。其實也很簡單，大家比較一下，比如硅谷有一個優(yōu)秀的人才，他有OpenAI的offer，有Meta的offer，有Llama的offer，他會去哪兒？這是非常顯而易見的選擇。

閉源在成本上也有優(yōu)勢

大家以為開源是免費的，在成本上有優(yōu)勢，實際上我們認為也不是，閉源在成本上反而是有優(yōu)勢的。只要是同等能力，閉源模型的推理成本一定是更低的，響應(yīng)速度一定是更快的。反過來，同等參數(shù)的情況下，閉源模型的能力也是更強的。今天不管是在中國也好、在美國也好，最強的基礎(chǔ)模型都是閉源的，而各種各樣的小模型、最好的小模型，都是通過大模型蒸餾來的。通過大模型降維做出來的模型就是更好的，這樣也導(dǎo)致閉源在成本上、在效率上更有優(yōu)勢。

二、創(chuàng)業(yè)者為啥可以依賴文心

雙輪驅(qū)動不是好模式

外界一些做模型的創(chuàng)業(yè)公司講的所謂的“雙輪驅(qū)動”不是一個好的模式。既做模型又做應(yīng)用，勢必會分散精力。創(chuàng)業(yè)公司的精力和資源都是有限的，同時做兩件事情和只做一件事情，哪個成功率更高是不言自明的。在任何情況下我們都非常講專注力，“力出一孔”，當資源有限的時候更應(yīng)該專注，而不是去搞所謂的“雙輪驅(qū)動”。

AI創(chuàng)業(yè)者的核心競爭力不是模型本身

對于AI創(chuàng)業(yè)者來說，核心競爭力本就不應(yīng)該是模型本身，這太耗資源了，而且需要非常長時間的堅持才能跑出來。

創(chuàng)業(yè)者真正的優(yōu)勢應(yīng)該是在某一個領(lǐng)域的知識、數(shù)據(jù)。假如說你今天想找一個“黃色的無兜的男士泳褲”，你在任何一個今天的電商平臺上都找不到，這種需求目前的技術(shù)是解決不了的，大模型如果有領(lǐng)域知識就可以解決，這就是靠領(lǐng)域知識能夠提供獨特價值的例子。

市面上有這么多模型，大的、小的、開源的、閉源的，在特定應(yīng)用當中怎么樣使用這些模型的組合，是有技巧的，這是創(chuàng)業(yè)者可以干的事兒，是可以提供價值增益的。

基礎(chǔ)模型不會通吃AI應(yīng)用

外界擔心如果用了文心或者閉源模型，做得好了它就抄你，就把你的飯吃掉了，實際上這種擔心也是沒有任何道理的。

拼多多、滴滴不怕微信搶飯碗

大家去看一看，在移動時代，微信沒有去吃掉拼多多，滴滴也沒有變成騰訊的一部分，它們都各自提供了自己獨特的價值，有自己非常不一樣的競爭力，它們的興起都是依賴移動生態(tài)里的一個封閉平臺——微信，但是它們并不怕微信去搶飯碗，所以沒有必要擔心基礎(chǔ)模型通吃AI的應(yīng)用。

封面圖片來源：視覺中國-VCG111486664989

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán)，嚴禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

開源大模型 Ai 李彥宏

上一篇文章

注意！德展健康將于5月8日召開股東大會

返回每經(jīng)網(wǎng)首頁

下一篇文章

翔樓新材：業(yè)績說明會定于4月18日舉行

相關(guān)文章

熱文精選

點擊排行

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2024 每日經(jīng)濟新聞報社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

<label id="1k6kh"><th id="1k6kh"></th></label>