每日經(jīng)濟新聞 2025-03-11 20:30:45
每經(jīng)編輯 黃勝
3月11日,針對DeepSeek將在3月17日發(fā)布下一代R2模型的傳聞,DeepSeek官方企業(yè)咨詢賬號在用戶群中回應稱,“辟謠:R2發(fā)布為假消息。”
3月11日,據(jù)東方財經(jīng)援引媒體報道,有市場消息稱,DeepSeek下一代AI模型DeepSeek-R2或提前于下周一(3月17日)正式發(fā)布。
DeepSeek-R2在多個關(guān)鍵領(lǐng)域?qū)崿F(xiàn)突破,包括更出色的編程能力、多語言推理能力,以及以更低的成本提供更高的準確性。專業(yè)人士認為,這些特性若得以兌現(xiàn),可能使其在全球AI競賽中占據(jù)顯著優(yōu)勢。
公開資料顯示,DeepSeek,全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,是一家創(chuàng)新型科技公司,專注于開發(fā)先進的大語言模型(LLM)和相關(guān)技術(shù)。
在硅谷,DeepSeek很早就被稱作“來自東方的神秘力量”,也是網(wǎng)上熱議的“杭州六小龍”之一。
2024年底,DeepSeek發(fā)布了新一代大語言模型V3,同時宣布開源。測試結(jié)果顯示,它的多項評測成績超越了一些主流開源模型,并且還具有成本優(yōu)勢。
圖片來源:視覺中國
隨后,在1月世界經(jīng)濟論壇2025年年會開幕當天,中國深度求索公司發(fā)布其最新開源模型R1,再次引發(fā)全球人工智能領(lǐng)域關(guān)注。據(jù)該公司介紹,R1模型在技術(shù)上實現(xiàn)了重要突破——用純深度學習的方法讓AI自發(fā)涌現(xiàn)出推理能力,在數(shù)學、代碼、自然語言推理等任務上,性能比肩美國開放人工智能研究中心(OpenAI)的o1模型正式版,該模型同時延續(xù)了該公司高性價比的優(yōu)勢。據(jù)了解,深度求索公司R1模型訓練成本僅為560萬美元,遠遠低于美國開放人工智能研究中心、谷歌、“元”公司等美國科技巨頭在人工智能技術(shù)上投入的數(shù)億美元乃至數(shù)十億美元。
與DeepSeek閑聊的界面截圖
每日經(jīng)濟新聞綜合公開消息、東方財經(jīng)
免責聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請核實。據(jù)此操作,風險自擔。
封面圖片來源:每日經(jīng)濟新聞 資料圖
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP