四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

<tr id="0o4f3"><blockquote id="0o4f3"></blockquote></tr>

每日經(jīng)濟(jì)新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

騰訊混元大模型亮相：全鏈路自研，聚焦應(yīng)用死磕“幻覺”

每日經(jīng)濟(jì)新聞 2023-09-07 22:37:13

每經(jīng)編輯蒙錦濤

9月7日，在2023騰訊全球數(shù)字生態(tài)大會(huì)上，騰訊混元大語言模型正式亮相，并宣布通過騰訊云對(duì)外開放。這是騰訊首次披露的通用大語言模型，具備強(qiáng)大的中文創(chuàng)作能力，復(fù)雜語境下的邏輯推理能力，以及可靠的任務(wù)執(zhí)行能力。

CFF20LXzkOyxQib9wbKDq0USqKtXPibgV6btNrkAA2CTiaTgaZN4ickuMQJmEr2ktON7w7aJ8Ijc9o4d39icbpyd7tg.jpg

此前的大半年，國(guó)內(nèi)云廠商跟隨ChatGPT，掀起“百模大戰(zhàn)”。一時(shí)間，國(guó)內(nèi)生成式大語言模型多得讓人眼花繚亂。騰訊在市場(chǎng)激流勇進(jìn)之后再“秀肌肉”，也映射了“混元”這個(gè)取自典籍的名字中“元?dú)馍诨煦缰小钡暮x，它撥清迷霧，迎接新天地。

騰訊為什么此前不著急發(fā)通用大模型？在蟄伏的日子里，騰訊做了什么？騰訊混元大模型值得期待嗎？

“不急于把半成品拿出來展示”

在“百模大戰(zhàn)”經(jīng)歷喧囂，逐漸降噪之時(shí)，騰訊不緊不慢地揭開自己大語言模型的神秘面紗，這體現(xiàn)了騰訊一如既往的風(fēng)格——不爭(zhēng)一時(shí)熱度、用產(chǎn)品實(shí)力說話。

在今年5月騰訊2023年股東大會(huì)上，騰訊董事會(huì)主席兼首席執(zhí)行官馬化騰就如此評(píng)價(jià)大模型：“我們最開始以為這是互聯(lián)網(wǎng)十年不遇的機(jī)會(huì)，但是越想越覺得這是幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機(jī)遇?；ヂ?lián)網(wǎng)企業(yè)都有很多的積累，都在做，我們也一樣在埋頭研發(fā)，但是并不急于早早做完，把半成品拿出來展示?！?/span>

馬化騰認(rèn)為，對(duì)于工業(yè)革命來講，早一個(gè)月把電燈泡拿出來在長(zhǎng)的時(shí)間跨度上來看是不那么重要的。大模型之于互聯(lián)網(wǎng)技術(shù)革命，就如電燈之于工業(yè)革命。騰訊在乎的是這個(gè)“電燈”的實(shí)用性和耐用性，而不是死盯著早一步投入市場(chǎng)激起的那簇虛無的水花。

“關(guān)鍵還是要把底層的算法、算力和數(shù)據(jù)扎扎實(shí)實(shí)做好，而且更關(guān)鍵的是場(chǎng)景落地?！瘪R化騰說道。

在市場(chǎng)看不見的日子里，騰訊已經(jīng)在大模型底層能力上埋頭鉆研多年。從2021年開始，騰訊先后推出千億和萬億參數(shù)的NLP稀疏大模型，打破CLUE三大榜單紀(jì)錄，實(shí)現(xiàn)在中文理解能力上的新突破。

在去年年末ChatGPT掀起大模型浪潮后，騰訊的大模型路線也穩(wěn)扎穩(wěn)打，利用自身多元且豐富的產(chǎn)品、數(shù)據(jù)、場(chǎng)景的優(yōu)勢(shì)，迭代了多個(gè)版本。騰訊的大模型在豐富的內(nèi)部場(chǎng)景和應(yīng)用上進(jìn)行了反復(fù)錘煉，更清楚一個(gè)深入業(yè)務(wù)的大模型應(yīng)該如何設(shè)計(jì)和研發(fā)。

CFF20LXzkOyxQib9wbKDq0USqKtXPibgV64462JC1t9GeX3Jwqxqg0XBZotbPGtUfSCNcPwldXxzw92sEHXMhvUg.jpg 騰訊集團(tuán)副總裁蔣杰

相比于國(guó)內(nèi)外已發(fā)布的大語言產(chǎn)品主要是通過聊天場(chǎng)景進(jìn)行測(cè)試和訓(xùn)練，騰訊選擇了用自家產(chǎn)品來測(cè)試。在騰訊集團(tuán)副總裁蔣杰看來，測(cè)試大語言模型的途徑有很多。“一種是通過Chat來驗(yàn)證，這會(huì)有比較好的體感。而騰訊有20多年的發(fā)展歷史，有海量的用戶和TO C的應(yīng)用場(chǎng)景、TO B的驗(yàn)證體系，用它們來測(cè)試或許會(huì)有更好的效果?！笔Y杰表示。

就這樣，騰訊強(qiáng)大的產(chǎn)品矩陣，成為了混元大模型語料訓(xùn)練的“養(yǎng)料”，也是場(chǎng)景應(yīng)用的“磨刀石”。至今，騰訊混元大模型擁有超千億參數(shù)規(guī)模，預(yù)訓(xùn)練語料超2萬億tokens。

目前，混元大模型已經(jīng)接入騰訊50多個(gè)業(yè)務(wù)并取得初步效果，包括騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會(huì)議、騰訊文檔、微信搜一搜、QQ瀏覽器等業(yè)務(wù)和產(chǎn)品。這其中既包括了C端應(yīng)用，也包括了B端場(chǎng)景，其應(yīng)用和測(cè)試的體量足以比擬甚至超越國(guó)內(nèi)一些先發(fā)的其他大模型。

在騰訊全球數(shù)字生態(tài)大會(huì)上，騰訊正式宣布，混元大模型將作為騰訊云MaaS服務(wù)的底座，客戶不僅可以直接通過API調(diào)用混元，也可以將混元作為基底模型，為不同產(chǎn)業(yè)場(chǎng)景構(gòu)建專屬應(yīng)用。

自研的底氣

慢即是快，這是騰訊長(zhǎng)期遵循的產(chǎn)品哲學(xué)。少了倉促的趕場(chǎng)，多了扎實(shí)的自研技術(shù)和創(chuàng)新優(yōu)勢(shì)。

全鏈路自研是騰訊混元大模型的亮點(diǎn)。據(jù)蔣杰介紹，騰訊混元大模型從第一個(gè)token開始從零訓(xùn)練，掌握了從模型算法到機(jī)器學(xué)習(xí)框架，再到AI基礎(chǔ)設(shè)施的全鏈路自研技術(shù)。這其中包括大規(guī)模、高質(zhì)量、多樣化的語料庫、創(chuàng)新的大模型算法和訓(xùn)練方法、自研Angel機(jī)器學(xué)習(xí)框架、強(qiáng)大的算力基礎(chǔ)設(shè)施等。

全鏈路自研帶來的效果，是顯而易見的。舉個(gè)例子，目前生成式AI在實(shí)際場(chǎng)景的應(yīng)用比較受限，大部分停留在高容錯(cuò)、任務(wù)簡(jiǎn)單的休閑場(chǎng)景，例如詩詞生成。用戶在初嘗大模型時(shí)，往往會(huì)因其炫技式的作詩或者回答腦筋急轉(zhuǎn)彎而感到驚艷，然而，對(duì)于容錯(cuò)率更低或任務(wù)更復(fù)雜的工作、專業(yè)以及嚴(yán)肅場(chǎng)景，如客服助手、醫(yī)療診斷、調(diào)研統(tǒng)計(jì)等領(lǐng)域，往往容易出現(xiàn)張冠李戴、胡言亂語的問題（即大模型“幻覺”），導(dǎo)致用戶對(duì)準(zhǔn)確性和可靠性的呼聲極高。

可以說，“幻覺”扼住了大模型大規(guī)模應(yīng)用的“咽喉”，讓企業(yè)和個(gè)人面臨嚴(yán)肅的需求時(shí)，不敢放心使用。對(duì)此，業(yè)界往往通過知識(shí)圖譜或者搜索外掛的方式試圖解決，但效果并不理想。而騰訊混元大模型給出的方案是——不依賴外掛，在預(yù)訓(xùn)練階段通過“探真”算法進(jìn)行事實(shí)修正，讓混元大模型的幻覺相比主流開源大模型降低了30%至50%。

不僅是降低幻覺，騰訊混元大模型還通過強(qiáng)化學(xué)習(xí)的方法，讓模型學(xué)會(huì)識(shí)別陷阱問題；通過位置編碼優(yōu)化，提高了超長(zhǎng)文的處理效果和性能；提出思維鏈的新策略，讓大模型能夠像人一樣結(jié)合實(shí)際的應(yīng)用場(chǎng)景進(jìn)行推理和決策。它還能進(jìn)行文學(xué)創(chuàng)作、文本摘要、角色扮演等內(nèi)容創(chuàng)作，做到充分理解用戶意圖，并高效、準(zhǔn)確地給出有時(shí)效性的答復(fù)。

CFF20LXzkOyxQib9wbKDq0USqKtXPibgV6MGfMkeOl4ibA4PXncthLtnNaKMzvjJXFctqmYfVcmEWq8m64x1WDATg.jpg

此外，騰訊還自研了機(jī)器學(xué)習(xí)框架Angel，使訓(xùn)練速度相比業(yè)界主流框架提升1倍，推理速度較業(yè)界主流框架提升1.3倍。

放眼市場(chǎng)，有眾多的開源大模型可以提供給廠商進(jìn)行疊加和使用。相反，全鏈路自研就顯得并不取巧。那么，騰訊為何堅(jiān)持做自研？蔣杰有自己的答案：“首先，如果企業(yè)不從頭開始做自研的話，就缺乏對(duì)這個(gè)技術(shù)的完全掌握；第二，騰訊大模型的自研，能夠加速后續(xù)的迭代，加快與其他業(yè)務(wù)的深度結(jié)合和綁定。對(duì)于騰訊那么多海量高并發(fā)的業(yè)務(wù)來說，開源架構(gòu)無法應(yīng)對(duì)沖擊，對(duì)騰訊來說是并不合適的。所以我們一定要走出一條基于自主體系的研發(fā)道路?！?/span>

CFF20LXzkOyxQib9wbKDq0USqKtXPibgV64EkUkJUJvfuHAqkzBsicysEr0yScOTrhpiaO3uWgVzcSmI0YQiaQsEKEw.png

在大模型扎堆的當(dāng)下，全鏈路自研給了騰訊底氣。在中國(guó)信通院《大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用的評(píng)估方法》的標(biāo)準(zhǔn)符合性測(cè)試中，混元大模型共測(cè)評(píng)66個(gè)能力項(xiàng)，在“模型開發(fā)”和“模型能力”兩個(gè)重要領(lǐng)域的綜合評(píng)價(jià)均獲得了當(dāng)前的最高分。在主流的評(píng)測(cè)集MMLU、CEval和AGI-eval上，混元大模型均有優(yōu)異的表現(xiàn)，特別是在中文的理科、高考題和數(shù)學(xué)等子項(xiàng)上表現(xiàn)突出。

業(yè)務(wù)的倍增器

“我們研發(fā)大模型的目標(biāo)不是在評(píng)測(cè)上獲得高分，而是將技術(shù)應(yīng)用到實(shí)際場(chǎng)景中。騰訊將全面擁抱大模型?！笔Y杰說道。這也反映了騰訊從實(shí)踐中來，到實(shí)踐中去的產(chǎn)品初心。

在大會(huì)上，蔣杰展示了騰訊會(huì)議、騰訊文檔、騰訊廣告等多個(gè)業(yè)務(wù)，在接入騰訊混元大模型后的實(shí)際應(yīng)用情況。

其中，騰訊會(huì)議基于混元大模型打造了AI小助手，只需要簡(jiǎn)單的自然語言指令，就能完成會(huì)議信息提取、內(nèi)容分析等復(fù)雜任務(wù)，會(huì)后還能生成智能總結(jié)紀(jì)要。據(jù)實(shí)測(cè)，在指令理解、會(huì)中問答、會(huì)議摘要、會(huì)議待辦項(xiàng)等多個(gè)方面，混元大模型均獲得較高的用戶采納率。

例如在廣告場(chǎng)景，騰訊混元大模型支持智能化的廣告素材創(chuàng)作，能夠適應(yīng)行業(yè)與地域特色，滿足千人千面的需求，實(shí)現(xiàn)文字、圖片、視頻的自然融合。此外，基于混元大模型的能力，廣告智能導(dǎo)購能夠幫助商家在企業(yè)微信等場(chǎng)景，提升服務(wù)質(zhì)量和服務(wù)效率。

在8月的財(cái)報(bào)電話會(huì)中，騰訊總裁劉熾平表示：“就生成式AI技術(shù)，或廣泛地對(duì)于基礎(chǔ)模型而言，我們認(rèn)為此類技術(shù)和機(jī)會(huì)并不僅局限于聊天機(jī)器人這樣的問答式體驗(yàn)。從更廣泛來看，我們對(duì)AI了解越多，就越對(duì)它作為我們業(yè)務(wù)的倍增器感到期待。AI技術(shù)將有助于提高用戶交互服務(wù)的效率和質(zhì)量，促進(jìn)我們的廣告定位、數(shù)據(jù)定位能力，以及提升許多內(nèi)容生產(chǎn)的效率。因此，通過持續(xù)發(fā)展生成式AI，我們將能從多個(gè)方面受益。”

在騰訊看來，混元大模型的想象空間遠(yuǎn)不止目前呈現(xiàn)給公眾的效果。像人類一樣，它能持續(xù)訓(xùn)練、終身學(xué)習(xí)，訓(xùn)練數(shù)據(jù)集會(huì)持續(xù)更新，不斷學(xué)習(xí)更新最新知識(shí)，以改善其性能和準(zhǔn)確性。同時(shí)，混元大模型也將為騰訊在6月發(fā)布的模型即服務(wù)（MaaS）解決方案釋放更多市場(chǎng)潛力。

蔣杰介紹道，騰訊9月7日發(fā)布的通用大語言模型，也將作為騰訊云MaaS服務(wù)的底座，進(jìn)一步服務(wù)更多的行業(yè)客戶。不僅如此，最近，騰訊云也全面接入Llama 2、Bloom等20多個(gè)主流模型，和混元一樣，都支持直接部署調(diào)用?？蛻艨梢愿鶕?jù)實(shí)際需求，基于混元、基于開源模型，打造自己專屬的行業(yè)大模型。

現(xiàn)在，混元大模型已經(jīng)不是半成品了，但按照騰訊的高標(biāo)準(zhǔn)，還達(dá)不到“成品”的程度。“我認(rèn)為混元永遠(yuǎn)在路上，現(xiàn)在推出的版本只是可用，但我們一直在演進(jìn)我們的能力，例如從大語言模型演進(jìn)到文生圖。今天只是一個(gè)開始，我希望我們每個(gè)月都會(huì)給大家驚喜?！笔Y杰最后說道。

編輯|蒙錦濤

CFF20LXzkOyuoQNVLRGWjVfciaeNyib50W3Y9TDLicWBibJKOzIkD8GjeQ1UXS4mD9ONYY5AAMMOvRlWic9Oh3K3Lrw.jpg

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

美國(guó)務(wù)卿：美國(guó)向?yàn)蹩颂m撥款9050萬美元用于排雷援助

返回每經(jīng)網(wǎng)首頁

下一篇文章

關(guān)于存量房貸利率調(diào)整，建行、交行、郵儲(chǔ)、中信銀行也公布了辦法！但這些情況要主動(dòng)申請(qǐng)→

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2024 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國(guó)互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

<span id="mefpj"><del id="mefpj"><p id="mefpj"></p></del></span>

<noscript id="mefpj"><progress id="mefpj"></progress></noscript>

<noscript id="mefpj"></noscript>