每日經(jīng)濟(jì)新聞 2025-02-24 17:49:56
每經(jīng)記者 岳楚鵬 每經(jīng)編輯 程鵬 高涵
今天(2月24日),DeepSeek開源周正式開啟。
第一個(gè)開源的項(xiàng)目就是重量級(jí)技術(shù)DeepSeek-V3核心技術(shù)MLA的改進(jìn)版本FlashMLA。該項(xiàng)目上線僅兩個(gè)小時(shí)就已經(jīng)收獲了超過2600+star!
圖片來源:Github
據(jù)介紹,F(xiàn)lashMLA的靈感來自FlashAttention 2&3和cutlass項(xiàng)目,是針對(duì)英偉達(dá)Hopper架構(gòu)的GPU優(yōu)化的高效MLA解碼內(nèi)核,主要在變長(zhǎng)序列 (variable-length sequences) 的場(chǎng)景進(jìn)行了深度優(yōu)化,能夠顯著提升大模型推理效率。
FlashMLA速度非??欤贖800 GPU上具有3000 GB/s的內(nèi)存速度上限以及580 TFLOPS的計(jì)算上限。此外,部署這一技術(shù)也很簡(jiǎn)單,只需要滿足FlashMLA的運(yùn)行環(huán)境要求(Hopper GPU、CUDA 12.3及以上版本以及PyTorch 2.0及以上版本),就可以一鍵通過`python setup.py install`完成配置。
總之,F(xiàn)lashMlA對(duì)英偉達(dá)GPU進(jìn)行了優(yōu)化。
圖片來源:X
眾所周知,MLA是DeepSeek大模型的重要技術(shù)創(chuàng)新點(diǎn),之前Huggingface技術(shù)總監(jiān)也曾多次贊揚(yáng)此項(xiàng)技術(shù)。此次DeepSeek直接開源了該核心技術(shù)的改進(jìn)版本,可以說是誠意滿滿。
DeepSeek表示,當(dāng)前在線服務(wù)的模塊已經(jīng)經(jīng)過測(cè)試、部署完備,可以投入生產(chǎn)環(huán)境。這個(gè)領(lǐng)域沒有高高在上的象牙塔,只有純粹的車庫創(chuàng)業(yè)精神與社區(qū)共筑的創(chuàng)新力量。
正如很多網(wǎng)友的評(píng)價(jià):DeepSeek才是真正的OpenAI。
圖片來源:X
之前幾次DeepSeek新模型和技術(shù)的公布都對(duì)美股和A股產(chǎn)生了很大的震動(dòng)。
寒武紀(jì)(688256.SH)股價(jià)上個(gè)交易日20cm漲停,股價(jià)創(chuàng)新高;今天盤中最高795.8元,截至收盤大漲5.14%,續(xù)創(chuàng)新高。
寒武紀(jì)股價(jià)大漲和DeepSeek開源有什么關(guān)系?
每經(jīng)小編問了DeepSeek。它分析稱:
FlashMLA是DeepSeek對(duì)混合專家模型(MoE)架構(gòu)的改進(jìn)版本,這類技術(shù)需要高性能AI芯片提供算力支持。寒武紀(jì)的云端推理芯片(如MLU370)和訓(xùn)練芯片(如MLU590)直接受益于大模型技術(shù)迭代帶來的算力需求增長(zhǎng)。寒武紀(jì)作為國產(chǎn)龍頭,可能因FlashMLA等本土技術(shù)突破獲得更高關(guān)注度。
總之,F(xiàn)lashMLA的開源可能通過技術(shù)協(xié)同效應(yīng)和市場(chǎng)情緒催化間接推動(dòng)寒武紀(jì)股價(jià),但直接因果關(guān)系較難量化。
圖片來源:每日經(jīng)濟(jì)新聞App
從上面的截圖,大家可以看到,每經(jīng)小編并沒有使用DeepSeek的App,因?yàn)榭偸恰胺?wù)器繁忙”,而是從每日經(jīng)濟(jì)新聞App進(jìn)入DeepSeek-R1。
2月12日每日經(jīng)濟(jì)新聞App和每經(jīng)網(wǎng)全面接入DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型。用戶通過每日經(jīng)濟(jì)新聞App和每經(jīng)網(wǎng)就能與大模型自由對(duì)話還能一鍵“問公司”“問投資”“問基金”。
不得不說,用起來真的很絲滑,目前使用量已經(jīng)超13萬次了!
咋用呢?超簡(jiǎn)單!
先下載每日經(jīng)濟(jì)新聞App
http://www.japandaiwa.com/corp/2016app/index.html
再往下看
↓
一、 在每日經(jīng)濟(jì)新聞App首頁,點(diǎn)擊“DeepSeek”圖標(biāo)或首頁輪播圖“自由問+問公司問投資問基金免費(fèi)使用DeepSeek、Kimi、豆包等六款大模型”。
二、 進(jìn)入“每經(jīng)大模型平臺(tái)”頁面,即可使用DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型中任意一款。
最近,每經(jīng)“136計(jì)劃”還增加了新功能:
大模型解讀投資熱榜。?
只需點(diǎn)擊投資熱榜中的任意新聞。
立即就能得到大模型的全面分析。
還能一鍵生成圖片分享給朋友。
告別“服務(wù)器繁忙”
快用每日經(jīng)濟(jì)新聞App吧!
(免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。)
記者|岳楚鵬
編輯|程鵬?高涵? 杜恒峰
校對(duì)|金冥羽
|每日經(jīng)濟(jì)新聞 ?nbdnews??原創(chuàng)文章|
未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP