四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

微眾銀行人工智能首席科學(xué)家范力欣:基于內(nèi)容嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)庫查詢和校驗(yàn),可防范大模型“幻覺”

每日經(jīng)濟(jì)新聞 2024-07-04 20:51:45

每經(jīng)記者 張宏    每經(jīng)編輯 廖丹    

7月2日,微眾銀行“大模型時代AI前沿與金融應(yīng)用”主題活動在北京舉辦。

會上,微眾銀行人工智能首席科學(xué)家范力欣表示,模型越大,能力越強(qiáng),隨之而來的問題是高成本,盡管現(xiàn)在“百模大戰(zhàn)”,用戶成本可能越來越低,但使用和訓(xùn)練大型模型的成本實(shí)際上并沒有降低,這為大模型應(yīng)用落地帶來挑戰(zhàn)。

會后,《每日經(jīng)濟(jì)新聞》記者(以下簡稱“NBD”)就如何防范和糾正大模型“幻覺”、銀行業(yè)大模型落地面臨的挑戰(zhàn)、數(shù)據(jù)要素與大模型之間的關(guān)系等問題專訪了范力欣。

圖片來源:每經(jīng)記者 張宏 攝

基于內(nèi)容嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)庫查詢和校驗(yàn)可防范大模型“幻覺”

NBD:在金融機(jī)構(gòu)中,數(shù)據(jù)精準(zhǔn)度至關(guān)重要,因此有人認(rèn)為生成式AI不適合應(yīng)用在金融機(jī)構(gòu)的核心部門。針對生成式AI可能出現(xiàn)的“幻覺”問題,你認(rèn)為可以如何進(jìn)行防范和糾正?

范力欣:在技術(shù)層面,可以基于內(nèi)容嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)庫查詢和校驗(yàn)。目前,這一過程已經(jīng)在實(shí)際應(yīng)用中得到實(shí)施。

首先,在生成內(nèi)容之前,(生成式人工智能)需要先查詢信息。當(dāng)查詢來源為網(wǎng)絡(luò)時,信息的可靠性參差不齊,查詢結(jié)果的準(zhǔn)確性并非總是能夠得到保證。但在(金融機(jī)構(gòu)的)實(shí)際應(yīng)用中,所依賴的是內(nèi)容嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)庫,這構(gòu)成了第一層保障。

其次,生成的內(nèi)容需要再次與數(shù)據(jù)庫進(jìn)行校驗(yàn),以確保生成的內(nèi)容與數(shù)據(jù)庫之間不存在矛盾。這是技術(shù)層面上的第二層校驗(yàn)。

在流程層面上,我們的系統(tǒng)并不直接面向?qū)崟r生成業(yè)務(wù)。以客服為例,客服背后有一個龐大的數(shù)據(jù)庫支撐。以往遇到的問題是,數(shù)據(jù)庫中一個問題對應(yīng)一個答案。隨之而來的難點(diǎn)是如何將同一問題千變?nèi)f化的問法與數(shù)據(jù)庫中的答案對應(yīng)。現(xiàn)在,(有了生成式人工智能)可以擴(kuò)展問題的表述范圍,使其能夠覆蓋用戶未來可能的表述,從而達(dá)到答案與問題的“多對一”匹配。由于數(shù)據(jù)庫是離線的,并且可以人工審核,從應(yīng)用層面避免了“模型幻覺”問題。

NBD:剛剛你提到的數(shù)據(jù)庫是銀行內(nèi)部的私域數(shù)據(jù)庫嗎?

范力欣:是的。實(shí)際上,包含兩個數(shù)據(jù)庫:第一個是事實(shí)材料庫,也稱為背景庫,它用于查詢和聯(lián)合校驗(yàn)。第二個數(shù)據(jù)庫是面向服務(wù)端客服的問答庫。這個問答庫原本是一問一答的模式,現(xiàn)在已經(jīng)發(fā)展為多問一答的模式。

NBD:校驗(yàn)的過程由模型完成,還是由人工完成?模型在校驗(yàn)過程中會不會出現(xiàn)“幻覺”?

范力欣:大模型校驗(yàn)。但最終會由人工審核,就像一支人機(jī)混合的足球隊(duì),大模型是前鋒,攻城拔寨,人工審核是后衛(wèi)守門員,保證不失一球。

投入產(chǎn)出比為大模型應(yīng)用落地帶來挑戰(zhàn)

NBD:人工智能的發(fā)展對金融機(jī)構(gòu)人員專業(yè)占比有沒有影響?

范力欣:微眾銀行擁有超過50%的科技人員。在這些科技人員中,涵蓋了我們通常所說的ABCD各個方面,即人工智能(AI)、區(qū)塊鏈(Blockchain)、云計算(Cloud)以及大數(shù)據(jù)(Big Data)。目前,這些技術(shù)領(lǐng)域已經(jīng)基本融合。

NBD:大模型落地目前還面臨哪些挑戰(zhàn)?

范力欣:雖然大模型在技術(shù)上有廣闊的想象空間,但我們必須考慮投入產(chǎn)出比。小型模型可能能力不足,而大模型可能具有質(zhì)的飛躍,但隨之而來的問題是成本也可能有質(zhì)的飛躍。銀行是高度數(shù)字化和信息化的,理論上完全可以使用該技術(shù)。然而,銀行必須計算投入產(chǎn)出,許多小企業(yè)也同樣關(guān)注這一比率。任何企業(yè)首先考慮的是生存問題,而成本控制是首要的考慮因素。

目前,大模型帶來的微小收益可能已經(jīng)被其額外的成本所抵消。因此,現(xiàn)階段我們只能篩選那些產(chǎn)出大于投入的業(yè)務(wù)。對于其他業(yè)務(wù),我們可能會進(jìn)行簡單的嘗試或評估,以確定是否可行。當(dāng)大模型到達(dá)另一個階段,能力更強(qiáng)、成本更低的時候,將有更多可能的業(yè)務(wù)亟待拓展。

NBD:目前哪些應(yīng)用在投入產(chǎn)出比上有優(yōu)勢?

范力欣:目前在投入產(chǎn)出比上具有優(yōu)勢的應(yīng)用主要包括生成視頻、生成圖像以及營銷領(lǐng)域。除此之外,還有對客戶進(jìn)行評估和判斷的相關(guān)應(yīng)用。這些都是可以進(jìn)一步開發(fā)的領(lǐng)域,但有時候不一定要使用大模型。

NBD:你提到聯(lián)邦大模型,借助聯(lián)邦大模型似乎可以達(dá)到數(shù)據(jù)可用不可見。數(shù)據(jù)要素市場建設(shè)有沒有可能與人工智能相融合形成1+1>2的效果?

范力欣:我們的理解是,關(guān)鍵不在于數(shù)據(jù)要素,而在于模型要素。為什么這么說呢?數(shù)據(jù)本身如同原油,可以提煉為柴油、汽油等多種形態(tài),只有當(dāng)數(shù)據(jù)被納入一個有效的模型中,數(shù)據(jù)才具有可用性。雖然這個比喻可能略顯粗糙,但可以理解為,原始數(shù)據(jù)有多種潛在用途,在具體用途不明確的情況下,我們無法對數(shù)據(jù)進(jìn)行準(zhǔn)確的定價,只能根據(jù)數(shù)據(jù)的規(guī)模和大致質(zhì)量進(jìn)行初步估計。

然而,更精確的定價應(yīng)當(dāng)面向應(yīng)用。只有當(dāng)我們明確了數(shù)據(jù)的使用目的,以及它在實(shí)際應(yīng)用中帶來的幫助,我們才能評估其真正的價值。否則,同樣的數(shù)據(jù)對某些人可能毫無價值,而對另一些人可能非常有用。

這種應(yīng)用價值的評估需要通過模型來實(shí)現(xiàn),即通過訓(xùn)練或微調(diào),使數(shù)據(jù)得以有效利用,從而揭示其真正的價值。從這個角度來看,實(shí)際上是模型賦予了數(shù)據(jù)價值,就像羊吃了草之后,我們是對羊定價,并向客戶提供羊的使用價值。

封面圖片來源:視覺中國-VCG41N1419339719

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

數(shù)據(jù) 模型 人工智能 銀行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0