四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

專訪|恒生電子首席科學家白碩:金融大模型應用生態(tài)仍有很大發(fā)展空間

每日經(jīng)濟新聞 2023-10-22 15:14:16

◎恒生電子首席科學家、大模型產(chǎn)品總監(jiān)白碩說:“站在大模型的角度,所有的插件都是工具;站在我們的角度,這些都是我們大模型生態(tài)的一部分?!?/p>

每經(jīng)記者 葉曉丹    每經(jīng)編輯 張海妮    

10月19日,恒生電子(600570.SH,股價29.92元,市值568.48億元)發(fā)布了金融大模型LightGPT最新的能力升級成果,以及基于LightGPT打造的多款光子系列大模型應用產(chǎn)品,并宣布正式開放產(chǎn)品公測。

恒生電子董事長劉曙峰表示,當前金融行業(yè)對于大模型技術的關注度和參與度很高,但在大模型實際落地過程中主要存在模型選擇難、算力供應不足、應用成熟度不足等問題,建議機構可以通過選擇合適的金融大模型,采用大模型“私有化+MaaS服務”混合部署,基于場景驅動的金融垂直應用開發(fā)和積累數(shù)據(jù)資產(chǎn)、構建數(shù)據(jù)飛輪、提升應用成熟度等工作,實現(xiàn)金融行業(yè)大模型更好的應用落地。

恒生電子首席科學家、大模型產(chǎn)品總監(jiān)白碩介紹,此次升級的LightGPT,面向金融機構實現(xiàn)LightGPT-7B的開源,推理和訓練全面適配華為昇騰系列。

恒生電子推出金融大模型,背后經(jīng)歷了怎樣的轉向?落地應用金融行業(yè),金融大模型具備哪些共通性和特殊性?當前大模型所需的AI算力,在國際半導體行業(yè)政策風聲鶴唳之際,將面臨怎樣的連鎖反應?

在此次發(fā)布會之際,《每日經(jīng)濟新聞》(以下簡稱NBD)記者專訪了恒生電子首席科學家、大模型產(chǎn)品總監(jiān)白碩。

白碩 圖片來源:受訪對象供圖

禁令之下國內AI芯片危機互現(xiàn)

NBD:最近大家關注度比較高的是美國半導體禁令,新規(guī)可能會沖擊英偉達A800或者H800的銷售,對國內AI芯片或帶來沖擊,怎么看這一禁令后續(xù)對大模型行業(yè)帶來的連鎖反應?

白碩:我理解這可能會帶來幾方面影響:第一,由于禁令的生效,國內大模型企業(yè)可能打算買的或者已經(jīng)在路上的AI芯片,都可能存在一定的風險。買不到當然就是“無米之炊”,大模型企業(yè)想推廣的一些場景可能面臨不方便推廣或者沒有那么順利的問題。

挑戰(zhàn)也帶來了另一方面的影響:一方面,國產(chǎn)相應GPU可以快速頂上,達到同步、同功能、等效的替換。站在這個角度上,確實我們看到一些企業(yè),譬如海光、華為的昇騰都在發(fā)力,我也期待他們會提供更加符合客戶要求的算力支持,我們也會一起幫助AI的應用真正在行業(yè)落地。所以從這一方面來看,其實它是一個機會,推動國產(chǎn)GPU的技術進步。

此外,未來還會不會有另外一種可能性,當前國內大模型已經(jīng)有的算力,可能處于一種分散的狀態(tài),不一定能夠發(fā)揮它最大的效能,已經(jīng)有的算力掌握在少數(shù)單位或者少數(shù)機構的手里,并不能非常充分地發(fā)揮它的作用。我們有沒有可能把算力集中起來,以行業(yè)的方式,統(tǒng)一提供服務?這也是我們在思考的一條路徑。

NBD:目前國內有多家金融機構研發(fā)自己的大模型技術,但大模型的開發(fā)需要大量資金、算力和數(shù)據(jù)的支撐,也對研發(fā)企業(yè)的實力提出了挑戰(zhàn),大模型技術未來是否會進一步拉大頭部和中小金融機構之間的技術差距?

白碩:如果從算力角度來看,不同規(guī)模金融機構在算力方面投入的差距,可能很大程度上會使這個差距加劇,對算力投入成本的承受程度各不相同。但是,如果可以通過行業(yè)能力統(tǒng)一的方式來提供算力服務,大家或許都有機會。

另一方面,實際上大模型的預訓練、精調和推理部署需要的算力有數(shù)量級的差別。實力雄厚的頭部企業(yè)研發(fā)投入充足,先發(fā)優(yōu)勢明顯,可以利用相對大的算力和自有數(shù)據(jù)對大模型進行精調;而研發(fā)投入相對有限的中小機構,可以采用跟隨策略,直接使用成熟模型,只進行推理部署而不做精調。像恒生這樣的金融科技服務商,可以在打造成熟模型方面為市場提供相應服務。

金融大模型應用生態(tài)仍有很大發(fā)展空間

NBD:恒生電子劉曙峰董事長提到了金融大模型的三個難點,模型選擇難、算力訓練難、質量控制難。目前大模型還面臨哪些挑戰(zhàn)?在語料大數(shù)據(jù)上,如何做好成本和質量上的平衡?此前,有數(shù)據(jù)行業(yè)人士提出一種方案:在相對垂直的領域,能不能通過提升語料的精度,優(yōu)化大模型運行所需算力消耗?對此,您怎么看?

白碩:我覺得提升語料精度還不完全,這只是極小一部分。生態(tài)里有一些更合適的環(huán)節(jié)去承載精準的數(shù)據(jù),而大模型只需要跟它對接,對接好了,質量自然就會提升。今天我們已經(jīng)看到了在大模型上,無論是實時行情的插件還是精準規(guī)則的插件,都起到重要的作用。

還有一些數(shù)據(jù)是直接從應用系統(tǒng)里調出來的,這也是非常精準的,也是實時的。提升大模型整體表現(xiàn),需要端到端地來看,讓合適的組件提供合適的服務,構筑全面的生態(tài)。

NBD:它又給大模型應用層帶來了很大的空間?

白碩:是的,可能很多通用領域的大模型供應商不會這么想,他們想的是怎么把別人的插件變成自己附屬的一部分。但恒生這次推出的“光子”,定位金融應用對接大模型的“中控”部位,串聯(lián)了通用工具鏈、金融插件工具、金融數(shù)據(jù)和金融業(yè)務場景,包括大模型也是它的一個組件,我們并不認為大模型就是核心。(備注:“光子”系恒生電子于今年6月推出的金融智能助手)

說到這里,這件事情怎么做更好,腦洞可以開得更大一點。推動大模型本身的技術進步和數(shù)據(jù)質量的提升只是一個手段,其他的手段還包括把更優(yōu)質的數(shù)據(jù)放到更合適的部位,加強大模型跟其他組件的對接能力,而不是讓大模型無所不能,這樣才能構筑良好的大模型生態(tài)。

強烈的危機感,推動我們從“小模型”轉向“大模型”

NBD:恒生推出的金融大模型LightGPT“私有化+MaaS服務”混合部署,提到了私有化數(shù)據(jù)私有化部署,共有數(shù)據(jù)公有云模式,私有云、混合云、公有云多種部署方式并存,這是基于金融行業(yè)的特色化布局?

白碩:不僅是金融行業(yè),所有需要強監(jiān)管、所有要求“家里有數(shù)”的機構都是一個道理,數(shù)據(jù)放出去,價值就不是你的了,只有在你手里,才是你的價值。如果這樣的數(shù)據(jù)不和大模型結合,可能挖掘不出比較深的價值。所以,“家里”的數(shù)據(jù)和大模型的語言能力,加上通用的能力完整地結合,并不是把所有的能力壓在一端,這個生態(tài)本身就是廣義的。

站在大模型的角度,所有的插件都是工具;站在我們的角度,這些都是我們大模型生態(tài)的一部分。

NBD:恒生在這個時點推出金融大模型,基于哪些方面的考慮?

白碩:首先,一直以來恒生不僅是資本市場傳統(tǒng)的IT系統(tǒng)供應商、金融數(shù)據(jù)提供商,也是資本市場重要的AI應用供應商。如智能客服、智能文檔、智能投研等智能應用,類似這樣的工作已經(jīng)開展多年了,不是有大模型之后才入場的,我們原來就是這樣的技術廠商。

總體來說,恒生和恒生旗下金融數(shù)據(jù)服務子公司恒生聚源都是這個戰(zhàn)場上很長時間的一個玩家。即使人工智能在金融應用方面,也是一個很長時間的玩家。所以,我們知道這里面的行業(yè)痛點,也知道大模型技術出來以后,對我們意味著什么。

首先是在我們內部發(fā)生了一個轉向:從以前依靠小模型轉到依靠大模型,這個是最根本的。

傳統(tǒng)模型或者說“小模型”,采用的是AI模型框架,為這個模型提供專用的數(shù)據(jù),甚至是標注數(shù)據(jù),訓練出來是一個個“煙囪”。這些參數(shù)別的系統(tǒng)不能用,這些系統(tǒng)想要獲得AI的能力,還得再去做獨立的數(shù)據(jù)采集、數(shù)據(jù)標注和深度學習,這些是傳統(tǒng)行業(yè)的特征。

而AI大模型是大規(guī)模預訓練的,也就是說是大數(shù)據(jù)一次性灌到參數(shù)里,再經(jīng)過一些精調,它可以同時適用于多個應用領域和多項AI任務。這些應用領域不需要再做大規(guī)模數(shù)據(jù)標注,只需要在任務精調環(huán)節(jié)做少量的數(shù)據(jù)標注,這是一個特別大的變化。

從傳統(tǒng)人工智能或者小模型,轉到現(xiàn)在的大模型,某種意義上相當于否定自己,我們有強烈的危機感,所以整個團隊內部的轉向是一個非常痛苦的過程。同時,這也意味著驅動我們轉型的動力非常足,干勁也非常高,團隊的共識也非常凝聚。

封面圖片來源:受訪對象供圖

如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

大模型 恒生電子 軟件開發(fā) 浙江省 互聯(lián)網(wǎng)金融 國產(chǎn)軟件 電子

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0