每日經(jīng)濟新聞 2025-01-26 14:23:38
每經(jīng)記者 岳楚鵬 蘭素英 每經(jīng)編輯 陳柯名
短短一個月內(nèi),中國AI初創(chuàng)公司深度求索(DeepSeek)先后發(fā)布了DeepSeek-V3和DeepSeek-R1兩款大模型,成本價格低廉,性能與OpenAI相當,讓硅谷震驚,甚至引發(fā)了Meta內(nèi)部的恐慌,工程師們開始連夜嘗試復制DeepSeek的成果。
Scale AI創(chuàng)始人Alexander Wang在1月24日的采訪中表示,DeepSeek在他們的測試里是表現(xiàn)最好的,與美國最好的模型相當。
此前,Alexander Wang評價說,DeepSeek-V3是中國科技界帶給美國的苦澀教訓?!爱斆绹菹r,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上?!?/span>
此外,中國AI“刷屏”國外各大媒體,它們認為中國大模型的新進展為硅谷敲響了警鐘。
在5000億美元的“星際之門”計劃公布之際,DeepSeek以極低的價格建立了一個突破性的AI模型,而且沒有使用尖端芯片,讓人們質疑,AI行業(yè)數(shù)千億美元資本的巨額投入真的是最有效的方法嗎?
Meta進入恐慌模式,試圖復制DeepSeek
1月24號,一條發(fā)布在匿名平臺teamblind上的帖子瘋傳。一名Meta員工稱,現(xiàn)在Meta內(nèi)部因為DeepSeek的模型,已經(jīng)進入恐慌模式。
這位Meta員工寫道:
“一切源于DeepSeek-V3的出現(xiàn),它在基準測試中已經(jīng)讓Llama 4相形見絀。更讓人難堪的是,一家‘僅用550萬美元訓練預算的中國公司’就做到了這一點。
工程師們正在爭分奪秒地分析DeepSeek,試圖復制其中的一切可能技術。這絕非夸張。
管理層正為GenAI研發(fā)部門的巨額投入而發(fā)愁。當部門里一個高管的薪資就超過訓練整個DeepSeek V3的成本,而且這樣的高管還有數(shù)十位,他們該如何向高層交代?
DeepSeek-R1的出現(xiàn)讓情況更加嚴峻。具體細節(jié)屬于機密,不便透露,不過很快就會公開了。”
去年12月27日,DeepSeek推出開源模型DeepSeek-V3。當時,聊天機器人競技場(Chatbot Arena)顯示,DeepSeek-V3在所有模型中排名第七,在開源模型排第一。而且,DeepSeek-V3是全球前十中性價比最高的模型。
不到一個月之后,今年1月20日,DeepSeek正式開源R1推理模型,允許所有人在遵循MIT License(注:被廣泛使用的一種軟件許可條款)的情況下,蒸餾R1訓練其他模型。
1月24日,DeepSeek-R1在聊天機器人競技場綜合榜單上排名第三,與頂尖推理模型o1并列。
在高難度提示詞、代碼和數(shù)學等技術性極強的領域,DeepSeek-R1拔得頭籌,位列第一。
在風格控制方面,DeepSeek-R1與o1并列第一,意味著模型在理解和遵循用戶指令,并按照特定風格生成內(nèi)容方面表現(xiàn)出色。
在高難度提示詞與風格控制結合的測試中,DeepSeek-R1與o1也并列第一,進一步證明了其在復雜任務和精細化控制方面的強大能力。
Artificial-Analysis對DeepSeek-R1的初始基準測試結果也顯示,DeepSeek-R1在AI分析質量指數(shù)中取得第二高分,價格是o1的約三十分之一。
AI大佬驚嘆:中國AI已追上美國
去年12月DeepSeek-V3發(fā)布后,AI數(shù)據(jù)服務公司Scale AI創(chuàng)始人Alexander Wang就發(fā)貼稱,DeepSeek-V3是中國科技界帶給美國的苦澀教訓。“當美國休息時,中國(科技界)在工作,以更低的成本、更快的速度和更強的實力趕上?!?/span>
著名投資公司A16z的創(chuàng)始人馬克·安德森1月24日發(fā)文稱,Deepseek-R1是他見過的最令人驚嘆、最令人印象深刻的突破之一,而且還是開源的,它是給世界的一份禮物。
1月24日,A16z合伙人、Mistral AI董事會成員Anjney Midha表示:“從斯坦福到麻省理工,DeepSeek-R1幾乎一夜之間成為美國頂尖大學研究人員的首選模型。”
對于中國AI為何能有如此快速的進展,諾獎得主、“AI教父”杰弗里·辛頓在1月21日接受博主Curt Jaimungal專訪中表示,中國的STEM(科學、技術、工程、數(shù)學)教育比美國更好,擁有更多受過良好教育的人才,這將為AI的發(fā)展提供堅實的基礎。盡管美國試圖通過限制(如英偉達芯片)來減緩中國的發(fā)展,但這只會促使中國加速發(fā)展自己的技術,“他們可能會落后幾年,但最終會趕上”。
DeepSeek或徹底改變游戲規(guī)則“大力出奇跡”還有效嗎?
斯坦福大學和Epoch AI的研究人員去年年中發(fā)表了一項研究表明,到2027年,最大型的模型的訓練成本將超過10億美元。Gartner預測,到2028年Google、Microsoft和AWS等超大規(guī)模企業(yè)僅在AI服務器上的支出就將高達5000億美元。
但DeepSeek完全不同,它的訓練成本并不昂貴。Noah's Arc資本管理公司表示,DeepSeek-V3模型有可能徹底改變訓練和推理領域的游戲規(guī)則。
特別是在5000億美元的“星際之門”計劃公布后,DeepSeek更讓人懷疑,巨額投入這種“大力出奇跡”的辦法真是最有效的方法嗎?
美股大V“THE SHORT BEAR”1月24日在X上發(fā)文稱,DeepSeek給AI巨頭們帶來了痛苦時刻,投資者必須對此敲響警鐘。
他說:“如果擊敗OpenAI只需要5500萬美元,那么這個行業(yè)的商業(yè)化會比很多人預想的要快很多?!?/span>
他還指出:“根據(jù)紅杉,美國AI公司每年必須產(chǎn)生約6000億美元收入來支付其AI硬件費用?,F(xiàn)在看來,這種冒險行為變得越來越無利可圖?!?/span>
著名財經(jīng)記者Holger Zschaepitz 1月25日表示,DeepSeek以極低的價格建立了一個突破性的AI模型,而且沒有使用尖端芯片,這讓人們質疑該行業(yè)數(shù)千億美元資本支出的效用。
有投資者甚至認為,美股芯片股的股價也會面臨挑戰(zhàn)。
投資者Geiger Capital表示,Deepseek和OpenAI一樣好,甚至更好,而且價格只有后者的3%……而美國公司卻投入了數(shù)千億美元。那么……納斯達克會怎樣呢?
值得注意的是,DeepSeek-V3發(fā)布后,英偉達股價下跌了2%。而DeepSeek-R1引發(fā)海外大討論后,1月24日英偉達股價又大跌了3.12%。
外媒集體刷屏:給硅谷敲響警鐘
如果說DeepSeek-V3只是掀起了波瀾,那么DeepSeek-R1則是引發(fā)了轟動。最近四天,國外媒體紛紛聚焦DeepSeek,并一致認為中國大模型的新進展為硅谷敲響了警鐘。
1月22日,美國媒體Business Insider報道稱,DeepSeek-R1模型秉承開放精神,完全開源,為美國AI玩家?guī)砹寺闊?。開源的先進AI可能挑戰(zhàn)那些試圖通過出售技術賺取巨額利潤的公司。
1月24日,美國媒體CNBC推出了長達40分鐘的節(jié)目,邀請了Perplexity CEO Aravind Srinivas來分析為何DeepSeek會引發(fā)人們對美國在AI領域的全球領先地位是否正在縮小的擔憂。
英國《金融時報》1月25日報道稱,中國小型AI初創(chuàng)公司DeepSeek震驚硅谷。報道聚焦資源更豐富的美國AI公司能否捍衛(wèi)自己的技術優(yōu)勢。
報道援引加州大學伯克利分校AI政策研究員Ritwik Gupta稱,DeepSeek最近發(fā)布的模型表明“AI能力沒有護城河”。Gupta補充說,中國的系統(tǒng)工程師人才庫比美國大得多,他們懂得如何充分利用計算資源來更便宜地訓練和運行模型。
免責聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構成投資建議,使用前請核實。據(jù)此操作,風險自擔。
記者|岳楚鵬??蘭素英?編輯|陳柯名?王嘉琦 蓋源源
校對|何小桃
|每日經(jīng)濟新聞 ?nbdnews??原創(chuàng)文章|
未經(jīng)許可禁止轉載、摘編、復制及鏡像等使用
如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP