2025-02-06 14:54:19
AI原生應(yīng)用蓬勃發(fā)展,豆包App以其卓越的表現(xiàn),成為行業(yè)焦點(diǎn)。
QuestMobile2024年AIGC應(yīng)用發(fā)展年度報(bào)告數(shù)據(jù)顯示,截至2024年12月,豆包App月活躍用戶規(guī)模復(fù)合增長率達(dá)到21.2%,強(qiáng)勢突破7500萬大關(guān),在綜合類AI原生App中以顯著優(yōu)勢穩(wěn)居榜首。
在綜合類原生App呈現(xiàn)的二八流量格局中,豆包與另外兩家頭部應(yīng)用共同包攬80%流量,憑借龐大的用戶基礎(chǔ)和高活躍度,成為行業(yè)發(fā)展的引領(lǐng)者。
1月22日,豆包大模型1.5Pro版本正式發(fā)布。此次更新進(jìn)一步提升了豆包大模型的性價(jià)比:32k上下文長度的Doubao-1.5-pro處理100萬token僅需8毛錢,輸出100萬token也只需2元。
然而,豆包并不是一味“卷”價(jià)格,而是真正做到在價(jià)廉物美的基礎(chǔ)上實(shí)現(xiàn)收益。報(bào)道稱,豆包大模型去年大幅降價(jià)后,毛利率依然為正。其中,字節(jié)跳動(dòng)最新推出的豆包大模型1.5,在推理成本優(yōu)化上取得進(jìn)一步突破。在火山引擎上售賣API的Doubao-1.5-pro,毛利率仍能達(dá)到50%。
豆包App的領(lǐng)先,得益于其持續(xù)進(jìn)化的模型能力。
豆包大模型1.5Pro綜合能力顯著增強(qiáng),低訓(xùn)練/推理成本和高效模型結(jié)構(gòu)全面提升多模態(tài)能力和推理能力,在多項(xiàng)公開評(píng)測基準(zhǔn)上全球領(lǐng)先。模型訓(xùn)練過程中,豆包大模型1.5Pro未使用任何其他模型生成的數(shù)據(jù),扎實(shí)不走“捷徑”。
豆包大模型pro 1.5在同一模型中融合并提升了視覺、語音等多模態(tài)能力,可為用戶帶來更自然、更豐富的交互體驗(yàn)。
它到底有多強(qiáng)?先看排名。
在多項(xiàng)基準(zhǔn)測試?yán)?,豆?.5 Pro的得分達(dá)到了全球領(lǐng)先水平
首先,在編程和數(shù)學(xué)能力方面,豆包1.5 Pro的表現(xiàn)屬于行業(yè)第一梯隊(duì)。
其次,在更適合中國人使用的中文理解方面更是明顯優(yōu)于海外模型。
此外,豆包1.5 pro還是一個(gè)多模態(tài)模型,具備視覺、語音等多模態(tài)能力,而且多模態(tài)能力處于世界一流水平。
豆包1.5 pro的視覺推理能力表現(xiàn)優(yōu)越,在各類評(píng)測基準(zhǔn)上均取得了優(yōu)異表現(xiàn)。
漂亮的參數(shù)背后是否有真材實(shí)料?一一來看。
首先,先看邏輯推理能力。
先來一道經(jīng)典的愛因斯坦謎題開開胃。
這一問題豆包僅使用不到7秒的時(shí)間就解出了正確答案。
Doubao-1.5-pro-AS1-Preview模型能力更是炸裂,連網(wǎng)絡(luò)梗知識(shí)都能給你分析得明明白白。
其次,視覺多模態(tài)性能進(jìn)一步提升,從容應(yīng)對(duì)更復(fù)雜場景。相比于上一版本,Doubao-1.5-pro在多模態(tài)數(shù)據(jù)合成、動(dòng)態(tài)分辨率、多模態(tài)對(duì)齊、混合訓(xùn)練上進(jìn)行了全面的技術(shù)提升,進(jìn)一步增強(qiáng)了模型在視覺推理、文字文檔識(shí)別、細(xì)粒度信息理解、指令遵循等方面的能力,并讓模型的回復(fù)模式變得更加精簡、友好。在同一模型中融入強(qiáng)大的視覺理解能力,使模型可以同時(shí)理解虛擬和現(xiàn)實(shí)世界的各類視覺信號(hào),更好地輔助人類決策。輸入任意分辨率圖像,無論是高清大圖、低分辨率小圖還是極端長寬比圖像。豆包大模型都能根據(jù)需求,實(shí)現(xiàn)精準(zhǔn)的特征提取和高效的計(jì)算性能,滿足提問者對(duì)圖像內(nèi)容深度探索的需求。
筆者請求豆包批改圖片中的英文作文,豆包很快就給出了評(píng)分與理由,并提出了修改意見。豆包對(duì)錯(cuò)誤的識(shí)別異常精準(zhǔn),想來以后老師們改作業(yè)就有福了。
之后我們再加大難度,讓豆包站在產(chǎn)品設(shè)計(jì)師的角度來評(píng)判一張椅子的產(chǎn)品設(shè)計(jì)圖
這回答專業(yè)感爆表,以后做設(shè)計(jì)又要少熬幾個(gè)通宵了。
豆包最新更新的語音模式更是一絕。語音多模態(tài)理解生成一體化,情商智商雙雙在線。在語音多模態(tài)上,豆包團(tuán)隊(duì)提出了新的Speech2Speech的端到端框架,不僅通過原生方法將語音和文本模態(tài)進(jìn)行深度融合,同時(shí)還實(shí)現(xiàn)了語音對(duì)話中真正意義上的語音理解生成端到端,相比傳統(tǒng)的ASR+LLM+TTS的級(jí)聯(lián)方式,在對(duì)話效果上有質(zhì)的飛躍。這使得豆包語音模型可以理解各種人類情感,并完美的模仿出來。
除此之外,豆包連方言都能輕松解讀。
長期以來,AI行業(yè)迷信“大力出奇跡”,認(rèn)為優(yōu)秀的大模型必定耗費(fèi)巨大。低價(jià)和性能不可兼得。
許多同行為了降低成本,依賴外部數(shù)據(jù)或蒸餾其他大模型。
此前就有學(xué)者指出,蒸餾技術(shù)雖能提高效率,但存在巨大缺陷,就是被訓(xùn)練的模型(即“學(xué)生模型”)沒法真正超越“教師模型”,會(huì)產(chǎn)生一種隱性天花板效應(yīng)。更深層次看,過度依賴蒸餾可能會(huì)扼殺AI領(lǐng)域中新穎的、具有變革性的創(chuàng)意。
阿爾特曼也表示:“復(fù)制已有的東西容易,但創(chuàng)新卻很難。”
而豆包走的是另外一條路。豆包1.5 pro的訓(xùn)練過程中完全依靠自有數(shù)據(jù),不僅保障了數(shù)據(jù)的獨(dú)立性和可靠性,還有效避免了外部模型潛在的偏差影響。
其次,豆包1.5 pro采用MoE(混合專家)架構(gòu),通過訓(xùn)練-推理一體化設(shè)計(jì),在保持強(qiáng)大模型性能的同時(shí),極大地降低了推理成本。
從訓(xùn)練和推理效率的角度來說,豆包1.5 pro所使用的稀疏MoE架構(gòu)僅用較小參數(shù)激活,性能即可超過Llama3.1-405B等超大稠密預(yù)訓(xùn)練模型。
豆包團(tuán)隊(duì)通過對(duì)稀疏度Scaling Law(縮放定律)的研究,確定了性能和效率比較平衡的稀疏比例,讓小參數(shù)量激活的模型同樣能夠達(dá)到當(dāng)前世界一流大模型的性能。
此前的MoE架構(gòu)普遍只能達(dá)到3倍杠桿的水平,而豆包1.5pro就把標(biāo)準(zhǔn)提升到了7倍。
在完全相同的9T tokens數(shù)據(jù)對(duì)比驗(yàn)證下,用激活參數(shù)僅為稠密模型參數(shù)量1/7的MoE(混合專家)模型,就超過了稠密模型的性能。不僅如此,得益于更優(yōu)的預(yù)訓(xùn)練數(shù)據(jù)質(zhì)量和訓(xùn)練超參,Doubao-MoE的性能同樣可以超越總參數(shù)遠(yuǎn)大于它的超大規(guī)模稠密預(yù)訓(xùn)練模型,比如LLaMA-3.1-405B,其訓(xùn)練數(shù)據(jù)為15T tokens。
另外,算法團(tuán)隊(duì)在預(yù)訓(xùn)練模型的基礎(chǔ)上,設(shè)計(jì)了一系列模型參數(shù)動(dòng)態(tài)調(diào)整算法,可以根據(jù)不同應(yīng)用對(duì)模型性能的需求,從模型深度、寬度、MoE專家數(shù)、激活專家數(shù)、隱藏token推理等維度來選擇擴(kuò)增和縮小模型參數(shù),靈活性和適配性拉滿,最大程度達(dá)成模型能力與推理成本的最優(yōu)平衡。
當(dāng)下,人工智能已成為各行業(yè)轉(zhuǎn)型升級(jí)的核心驅(qū)動(dòng)力。豆包大模型憑借其卓越性能,在火山引擎的強(qiáng)力支撐下,正深度融入汽車、手機(jī)等諸多行業(yè),重塑產(chǎn)業(yè)格局。
火山引擎作為字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái),幫助企業(yè)和開發(fā)者更方便地調(diào)用豆包大模型,大幅降低了使用成本,讓企業(yè)能夠以極低的成本獲取強(qiáng)大的AI能力,真正實(shí)現(xiàn)了AI技術(shù)的普惠,為大中小企業(yè)在數(shù)字化轉(zhuǎn)型過程中減輕了經(jīng)濟(jì)負(fù)擔(dān),加速了AI技術(shù)在各領(lǐng)域的廣泛應(yīng)用與深度融合。
據(jù)悉,豆包大模型已經(jīng)與八成主流汽車品牌合作,并接入到榮耀、VIVO等多家手機(jī)品牌。此外,豆包視覺理解模型已經(jīng)接入PC端產(chǎn)品。覆蓋終端設(shè)備約3億臺(tái),來自智能終端的豆包大模型調(diào)用量在半年時(shí)間內(nèi)增長100倍。
火山引擎持續(xù)深耕技術(shù)研發(fā),不斷推動(dòng)豆包大模型迭代升級(jí)。從豆包3D生成模型與火山引擎數(shù)字孿生平臺(tái)veOmniverse協(xié)同打造物理世界仿真模擬器;到對(duì)標(biāo)GPT-4o且價(jià)格優(yōu)勢顯著的通用模型pro;再到音樂模型、文生圖模型等功能的進(jìn)階突破,以及即將推出的視頻生成模型1.5版和端到端實(shí)時(shí)語音模型所蘊(yùn)含的巨大潛力,都彰顯了其在AI領(lǐng)域的創(chuàng)新實(shí)力與全方位布局。在為企業(yè)提供豐富多樣、高性能模型選擇的同時(shí),火山引擎還通過升級(jí)火山方舟、扣子和HiAgent等平臺(tái)產(chǎn)品,助力企業(yè)高效構(gòu)建自身AI能力中心,加速AI應(yīng)用開發(fā)進(jìn)程,全方位保障企業(yè)在智能化轉(zhuǎn)型道路上穩(wěn)步前行。
隨著豆包大模型與火山引擎的深度融合與持續(xù)創(chuàng)新,在千行百業(yè)的滲透將更為深入,有望解鎖更多創(chuàng)新應(yīng)用場景,創(chuàng)造更大商業(yè)價(jià)值與社會(huì)福祉。
文/丘山
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP