每日經(jīng)濟新聞 2023-09-12 16:30:51
“我覺得成都的人工智能發(fā)展還是不錯的,但是大模型相關(guān)的研究相對落后。我們好像一下子想不出有支團隊在做大模型,這是一個短板,所以成都應(yīng)該著重考慮這個問題?!睂O茂松認(rèn)為,成都應(yīng)該主打模型,特別是大模型在垂直領(lǐng)域的應(yīng)用,通過應(yīng)用要培育一支有這種能力的科研隊伍。
每經(jīng)記者 淡忠奎 每經(jīng)編輯 楊歡
歐洲人文和自然科學(xué)院外籍院士,清華大學(xué)人工智能研究院長聘教授、常務(wù)副院長孫茂松 圖片來源:每經(jīng)記者 淡忠奎 攝
“大模型已經(jīng)成為目前人工智能巔峰對決的一個終極戰(zhàn)場,如果我們沒有能力去參與,這肯定是一個短板,對成都的人工智能產(chǎn)業(yè)發(fā)展會帶來不利影響。”9月11日,第二十一屆中國西部海外高新科技人才洽談會開幕式暨天府論壇上,歐洲人文和自然科學(xué)院外籍院士,清華大學(xué)人工智能研究院長聘教授、常務(wù)副院長孫茂松分享了對ChatGPT為代表的生成式人工智能的最新觀察和思考。
今年5月發(fā)布的《中國人工智能大模型地圖研究報告》顯示,我國已有79個10億級以上參數(shù)規(guī)模的大模型,被外界稱作進入“百模大戰(zhàn)”時代。不論是人工智能企業(yè),還是地方政府,都紛紛入局“新賽道”。
那么,現(xiàn)階段大模型的發(fā)展邏輯是怎樣的,如何才能讓它“說真話”?“百模大戰(zhàn)”時代,國內(nèi)大模型企業(yè)如何才能制勝未來?像成都這樣布局較晚的城市,又該如何加速塑造自己的競爭優(yōu)勢?孫茂松在論壇期間,接受了《每日經(jīng)濟新聞》記者采訪。
“以ChatGPT為代表的生成式人工智能,這一年來火爆全球。但它的算法其實非常簡單,就是一個策略——下一個詞預(yù)測(自監(jiān)督學(xué)習(xí))。”孫茂松舉出一個例子,就像“我昨天晚上吃了飯”這句話,可以讓機器在任何一個位置停下來,比如,“我今天吃了—”,讓機器預(yù)測下一個詞。
人共享智能算法就會調(diào)動它內(nèi)在的機制,讓機器去確定應(yīng)該就是“飯”,這個策略就叫自監(jiān)督學(xué)習(xí)。機器可以在互聯(lián)網(wǎng)上任意規(guī)模的語料上做這件事,進而覆蓋整個互聯(lián)網(wǎng)。在這種條件下,你給出一個上文“我昨天吃了”,它就會給出下一個詞的概率分布——
比如,“吃飯”概率是4.5%,“餃子”概率是3.5%,“桌子”的概率很低,但也不至于是0,“因為有寓言說大象可能吃了桌子”。倘若上文換成“我昨天晚上吃了北京”,可能35%的概率是“北京烤鴨”。
孫茂松認(rèn)為,方法看似簡單,但要做到準(zhǔn)確的估計非常難。就像我們平常去擲骰子,必須擲足夠多的次數(shù)才能確定骰子每個面出現(xiàn)的概率。這里涉及兩個關(guān)鍵因素,一個是骰子有6個面,但是我們詞語有五六萬個,也就是五六萬面。更麻煩的是,上文是無限的,所以它的面實際上是兩個因素相乘,“就是五六萬個詞,再加上幾乎無限數(shù)量的上文”。
這就要依靠“三駕馬車”——大模型+大數(shù)據(jù)+大算力。與此同時,AIGC(人工智能生成內(nèi)容)的特點就是強大的內(nèi)容生產(chǎn)能力,以及天馬行空般的創(chuàng)造性。假設(shè)句子中每個位置平均有100種“合理”的字接續(xù),則可能形成“比較通順”的五律數(shù)量約為10^80個。
憑借強大的內(nèi)容生成能力和創(chuàng)造性,生成式AI能夠有力助推數(shù)字經(jīng)濟的發(fā)展,甚至可能帶來產(chǎn)業(yè)生態(tài)的重新洗牌。比如,在內(nèi)容輔助生產(chǎn)方面,生成式AI從商業(yè)應(yīng)用到文化創(chuàng)意產(chǎn)業(yè)的應(yīng)用,能夠顯著降低制作成本、準(zhǔn)入門檻,顯著提升生產(chǎn)效率、產(chǎn)品質(zhì)量;芯片設(shè)計領(lǐng)域,生成式AI的使用能夠強化學(xué)習(xí)優(yōu)化半導(dǎo)體芯片設(shè)計(布圖規(guī)劃)中的元件位置,將產(chǎn)品開發(fā)周期從幾周(使用人類專家)縮短到幾小時。
這正是生成式AI賦能千行百業(yè)的縮影。
8月31日,首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的大模型百度文心一言、百川智能、商湯商量SenseChat宣布面向全社會開放服務(wù)。在商用之外,大模型面向普通人開放被視作人工智能產(chǎn)業(yè)的一個里程碑。
這不僅是面向普通人開放賦能工具、生活助手,更是意味著大模型將獲得龐大規(guī)模的中文語料投喂和更豐富的原生應(yīng)用場景。“大模型有點像水電,它是一種智能信息處理的一個基礎(chǔ)設(shè)施,現(xiàn)在只要垂直領(lǐng)域需要用到信息處理,只要是數(shù)字化高度發(fā)達的應(yīng)用場景,它就有可能(發(fā)揮作用)”。
就像是一個通用的底座,孫茂松告訴《每日經(jīng)濟新聞》記者,就像你要蓋房子,它實際上是一個地基,可以在上面蓋各種各樣的房子。以前,相當(dāng)于每個應(yīng)用都要打一個自己的地基,蓋一個小房子,“現(xiàn)在是搞了一個特別大的地基,你就只需要考慮房子怎么蓋。”
這也給大模型的發(fā)展帶來新的想象空間。根據(jù)IDC預(yù)測,2026年我國AI市場規(guī)模有望達264.4億美元,2023-2026年CAGR約21.5%。而被比喻為目前階段“A終極戰(zhàn)場”之一的大模型,更是其中的引領(lǐng)性力量。
中信證券研報稱,大模型是連接底層算力和上層應(yīng)用的重要一環(huán),成熟的大模型能力和生態(tài)是真正的實現(xiàn)涌現(xiàn)人工智能和未來應(yīng)用端繁榮的基礎(chǔ),擁有更強計算和推理能力、更高通用性的大模型企業(yè)有望把握AI時代的流量入口和話語權(quán)。
從國內(nèi)來看,大模型已經(jīng)是人工智能企業(yè)的必爭之地,“百模大戰(zhàn)”漸成趨勢。不過,孫茂松認(rèn)為,“百模”也不一定多。這些大模型可以分為兩類,一類是真正有實力做底座的,另一類實際上是拿別人開源的大模型去做應(yīng)用訓(xùn)練,“這兩塊的‘質(zhì)’是不一樣的,真正有實力能和國際上PK的可能一個都沒有。”
他指出,很多大模型企業(yè)都會轉(zhuǎn)到垂直應(yīng)用,甚至可能進入的時候就沒準(zhǔn)備要做底座,而是要做垂直領(lǐng)域應(yīng)用,“如果進入聚焦做垂直應(yīng)用,還是值的鼓勵的。”大模型歸根究底要落地于具體的行業(yè)應(yīng)用,細(xì)分領(lǐng)域還有更多機會。
“我覺得成都的人工智能發(fā)展還是不錯的,但是大模型相關(guān)的研究相對落后。我們好像一下子想不出有支團隊在做大模型,這是一個短板,所以成都應(yīng)該著重考慮這個問題。”孫茂松認(rèn)為,成都應(yīng)該主打模型,特別是大模型在垂直領(lǐng)域的應(yīng)用,通過應(yīng)用要培育一支有這種能力的科研隊伍。
這是他在天府論壇上給成都開出的一劑“藥引”。孫茂松告訴《每日經(jīng)濟新聞》記者,現(xiàn)在國內(nèi)基礎(chǔ)大模型主要在北京、上海、深圳等城市,要想現(xiàn)在來做已經(jīng)有些晚。后發(fā)城市應(yīng)該著重來做大模型在垂直領(lǐng)域的應(yīng)用,這一塊四川和成都是有優(yōu)勢的,“有很多獨特的應(yīng)用場景,別的地方不一定有。”
換句話說,不論是AI企業(yè),還是競逐大模型的城市,都應(yīng)該重點把握垂直領(lǐng)域的機會。不久前,2023世界人工智能大會也傳遞出這樣的信號。多位人工智能專家告訴記者,大模型是AI爆發(fā)式成長的基石,要著重引導(dǎo)既有大模型技術(shù)與垂直領(lǐng)域經(jīng)濟發(fā)展深度融合。
與此同時,上海市徐匯區(qū)副區(qū)長俞林偉亦指出,“全面推動生成式人工智能在醫(yī)療、金融、智能網(wǎng)聯(lián)汽車、社交等領(lǐng)域率先發(fā)力,所有的行業(yè)都值得用大模型再做一遍。”在這種背景下,大模型的“應(yīng)用戰(zhàn)”成為城市無法缺席的一場角逐。
“現(xiàn)在大家都在爭大模型,我們?nèi)绻麤]有這方面人才,可能就會喪失一些發(fā)展機會,而且跟成都的城市地位是不符的。”孫茂松認(rèn)為,這一塊的短板應(yīng)該盡快補上,畢竟成都是有這個實力的,“成都要跟北京、上海去比,而不是跟中游城市比”。
在他看來,有些省份或城市培養(yǎng)不出這樣的人才,所以需要想方設(shè)法去引進人才。但成都不一樣,川大、電子科大等高校水平都很高,但是可能因為對相關(guān)領(lǐng)域的重視程度不夠高,做這方面研究的人相對較少。當(dāng)?shù)匦枰M一步提高對大模型相關(guān)研究和人才的重視程度。
“現(xiàn)在像美國那些最重要的幾個(大模型)公司,都還在致力于打地基,今年也已經(jīng)開始努力建‘大房子’。但是這些小房子它還沒顧上,成都其實可以去做不同領(lǐng)域的‘小房子’。這要蓋好也是很有挑戰(zhàn)性的。”他說。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP