四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟(jì)新聞
商訊推薦

每經(jīng)網(wǎng)首頁(yè) > 商訊推薦 > 正文

度小滿發(fā)布“軒轅70B”金融大模型 C-Eval、CMMLU雙榜排名榜首

2023-09-22 16:16:37

9月22日,度小滿宣布“軒轅70B”金融大模型開(kāi)源,所有用戶均可自由下載和試用,并公布了“軒轅70B”在C-Eval、CMMLU兩大權(quán)威大語(yǔ)言模型評(píng)測(cè)基準(zhǔn)的成績(jī)。數(shù)據(jù)顯示,在C-Eval榜單上,XuanYuan-70B的總成績(jī)達(dá)到71.9分;在CMMLU榜單中,以71.05分的高分位居榜首,在兩大權(quán)威榜單上的所有開(kāi)源模型中排名榜首,也是國(guó)內(nèi)首個(gè)同時(shí)在兩大權(quán)威榜單排名榜首的金融大模型。

C-Eval榜單是由清華大學(xué)、上海交通大學(xué)和愛(ài)丁堡大學(xué)合作構(gòu)建的綜合性考試評(píng)測(cè)集,幾乎囊括了所有國(guó)內(nèi)外的主流模型,覆蓋人文、社科、理工、其他專業(yè)四個(gè)大方向的52個(gè)學(xué)科,共有13948個(gè)多項(xiàng)選擇題和中學(xué)、本科、研究生、職業(yè)四個(gè)難度級(jí)別,是目前對(duì)模型潛力判斷極具權(quán)威性的大模型榜單之一。

CMMLU數(shù)據(jù)集是一個(gè)綜合性的中文評(píng)估基準(zhǔn),由MBZUAI、上海交通大學(xué)、微軟亞洲研究院共同推出,專門(mén)用于評(píng)估語(yǔ)言模型在中文語(yǔ)境下的知識(shí)和推理能力,共涵蓋了67個(gè)主題,涉及自然科學(xué)、社會(huì)科學(xué)、工程、人文以及常識(shí)等。

金融行業(yè)場(chǎng)景豐富,數(shù)字化程度高,是大模型落地應(yīng)用的最佳場(chǎng)景之一。但金融又是一個(gè)高合規(guī)要求的行業(yè),業(yè)務(wù)決策復(fù)雜,大模型真正在金融業(yè)務(wù)中做到實(shí)際應(yīng)用還面臨不少挑戰(zhàn)。

度小滿CTO許冬亮表示,“相比通用大模型,‘軒轅70B’金融大模型經(jīng)過(guò)度小滿業(yè)務(wù)場(chǎng)景中沉淀的海量金融數(shù)據(jù)訓(xùn)練,對(duì)金融知識(shí)理解更專業(yè)、更精準(zhǔn),可控性、安全性更高。我們把大模型開(kāi)源,希望能夠降低大模型在金融行業(yè)的部署和應(yīng)用門(mén)檻,促進(jìn)金融行業(yè)服務(wù)效率和服務(wù)體驗(yàn)的突破性革新”。

“軒轅70B”將在社區(qū)同時(shí)開(kāi)源金融大模型和50G高質(zhì)量金融語(yǔ)料,開(kāi)源下載地址:https://github.com/Duxiaoman-DI/XuanYuan

今年5月份,度小滿開(kāi)源了國(guó)內(nèi)首個(gè)千億參數(shù)的金融大模型,已經(jīng)有上百家金融機(jī)構(gòu)申請(qǐng)?jiān)囉谩1敬伟l(fā)布的新版大模型相較于上一個(gè)版本能力全面提升:在增量預(yù)訓(xùn)練和指令微調(diào)階段,加入了度小滿業(yè)務(wù)場(chǎng)景中的海量金融數(shù)據(jù),對(duì)金融問(wèn)題回復(fù)更專業(yè),金融知識(shí)理解能力提升明顯;同時(shí)在預(yù)訓(xùn)練階段,“軒轅70B”的模型上下文長(zhǎng)度擴(kuò)充到8k,能夠處理更長(zhǎng)的金融報(bào)告、研究和分析。

責(zé)編 蒲禎

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0