每日經(jīng)濟(jì)新聞 2023-03-21 22:25:18
每經(jīng)特約評(píng)論員 盤(pán)和林
2022年11月,OpenAI發(fā)布了ChatGPT,繼而在短短2個(gè)月時(shí)間就獲得了上億用戶。ChatGPT背后是2021年OpenAI發(fā)布的GPT3.0技術(shù),由于在GPT3.0技術(shù)上作了一些優(yōu)化,所以ChatGPT又被認(rèn)為是GPT3.5版本,而在今年3月14日,OpenAI又發(fā)布了GPT4.0,并將其作為plus訂閱服務(wù)發(fā)布,新版本再次掀起熱潮,訂閱支付通道一度擁堵癱瘓。
ChatGPT一次又一次掀起熱潮,是因?yàn)樗黄屏巳斯ぶ悄軕?yīng)用的一些瓶頸,未來(lái)以生成式AI為代表的人工智能產(chǎn)業(yè)將進(jìn)入全面爆發(fā)階段。面對(duì)科技的新一輪爆發(fā),中國(guó)企業(yè)作好準(zhǔn)備了嗎?
數(shù)據(jù)來(lái)源: OpenAI官網(wǎng),World of Engineering,中泰證券研究所
GPT帶來(lái)了什么?
ChatGPT是生成式AI,其通過(guò)機(jī)器學(xué)習(xí)來(lái)訓(xùn)練AI,用上一個(gè)字生成下一個(gè)字,再用下一個(gè)字生成下下個(gè)字。首先,ChatGPT采用非監(jiān)督式學(xué)習(xí),用海量語(yǔ)料來(lái)教會(huì)AI說(shuō)話方式。隨后,ChatGPT用監(jiān)督式學(xué)習(xí)來(lái)輔助矯正語(yǔ)言規(guī)范,通過(guò)標(biāo)注語(yǔ)料進(jìn)行機(jī)器訓(xùn)練,讓ChatGPT知道面對(duì)某個(gè)問(wèn)題應(yīng)該如何生成回答。最后,當(dāng)ChatGPT能夠回答問(wèn)題,逐字生成答案的時(shí)候,再用強(qiáng)化學(xué)習(xí)來(lái)給ChatGPT的回答打分。簡(jiǎn)單說(shuō),通過(guò)填鴨式的非監(jiān)督學(xué)習(xí),ChatGPT學(xué)會(huì)了說(shuō)句子,通過(guò)范例的、預(yù)標(biāo)注的預(yù)料進(jìn)行監(jiān)督式學(xué)習(xí),ChatGPT學(xué)會(huì)了回答問(wèn)題,再通過(guò)強(qiáng)化學(xué)習(xí)來(lái)了解人類(lèi)的“回答偏好”,多給高評(píng)分的答案。
為什么ChatGPT需求爆發(fā),而其他AI沒(méi)有。總結(jié)看,ChatGPT有幾個(gè)獨(dú)到之處:
其一,ChatGPT是大模型。監(jiān)督式、非監(jiān)督式、強(qiáng)化學(xué)習(xí)的原理,在AI產(chǎn)業(yè)里早已是常識(shí)性的技術(shù)認(rèn)知。但自然語(yǔ)言處理這個(gè)領(lǐng)域太過(guò)復(fù)雜,因?yàn)槿祟?lèi)說(shuō)話非常隨機(jī),所以之前AI企業(yè)將機(jī)器學(xué)習(xí)用在很多領(lǐng)域,語(yǔ)音識(shí)別、機(jī)器視覺(jué)、圖像識(shí)別(人臉、醫(yī)學(xué)影像)、蛋白質(zhì)特征預(yù)測(cè)、文本識(shí)別等,但很少將機(jī)器學(xué)習(xí)用在自然語(yǔ)言處理上。念頭往往一閃而過(guò),但付諸實(shí)施的往往是少數(shù),而OpenAI耐著性子堅(jiān)持了下來(lái)。
其二,ChatGPT是機(jī)器學(xué)習(xí),不是數(shù)據(jù)庫(kù)。長(zhǎng)期以來(lái),AI領(lǐng)域人士認(rèn)為機(jī)器學(xué)習(xí)不適合自然語(yǔ)言處理,所以一直以來(lái),自然語(yǔ)言處理采用邏輯推理的AI實(shí)現(xiàn)方式。建立一個(gè)語(yǔ)料數(shù)據(jù)庫(kù),在語(yǔ)料數(shù)據(jù)之間建立關(guān)聯(lián)性,比如知識(shí)圖譜,再通過(guò)邏輯搜索的方式,從數(shù)據(jù)庫(kù)中找到對(duì)應(yīng)答案。但ChatGPT并沒(méi)有數(shù)據(jù)庫(kù),ChatGPT采用機(jī)器學(xué)習(xí),是一種AI能力集成,而不是一個(gè)數(shù)據(jù)庫(kù)集成。也正因?yàn)镃hatGPT的這個(gè)屬性,它并不局限在文本對(duì)答方面,而是能夠進(jìn)入任何領(lǐng)域,比如和搜索結(jié)合、和辦公軟件結(jié)合。當(dāng)前尤其善于處理文本,比如編程和學(xué)術(shù)教育領(lǐng)域,ChatGPT的功能幾乎是通用的。ChatGPT具備完善的表達(dá)能力,且通過(guò)對(duì)不同領(lǐng)域內(nèi)容的學(xué)習(xí),ChatGPT最終會(huì)變得無(wú)所不能。而這些在數(shù)據(jù)庫(kù)和邏輯搜索下是無(wú)法實(shí)現(xiàn)的。
其三,ChatGPT有強(qiáng)大的上下文語(yǔ)義理解能力。用戶可以讓ChatGPT扮演角色,ChatGPT可以在用戶引導(dǎo)下故意給出“符合用戶要求”的錯(cuò)誤答案。用戶在提問(wèn)的時(shí)候,ChatGPT也會(huì)引導(dǎo)用戶補(bǔ)充問(wèn)題信息,并最終給出符合邏輯的答案。過(guò)去我們遇到的AI聊天軟件有兩種:一種是基于數(shù)據(jù)庫(kù)的,必須按照數(shù)據(jù)庫(kù)給定的提問(wèn)方式;另一種是基于機(jī)器學(xué)習(xí),但只是一問(wèn)一答。結(jié)合上下文語(yǔ)義理解的ChatGPT能夠更好地找到用戶的需求點(diǎn),給出適合用戶需求的答案。
綜上,ChatGPT的強(qiáng)大在于,其本身是一種機(jī)器能力,而不是數(shù)據(jù)庫(kù),ChatGPT自身的語(yǔ)義理解能力、語(yǔ)言組織能力、搜索能力才是其本質(zhì),這也使得ChatGPT可以套用在任何領(lǐng)域。而對(duì)于人類(lèi)來(lái)說(shuō),ChatGPT是提升人類(lèi)認(rèn)知水平的一個(gè)重要工具。
人類(lèi)之所以區(qū)別于其他動(dòng)物,關(guān)鍵點(diǎn)在于人類(lèi)的知識(shí)是可以傳承的,這使得人類(lèi)通過(guò)知識(shí)傳承積累來(lái)實(shí)現(xiàn)發(fā)展。到工業(yè)革命前期,古登堡印刷機(jī)成為科技進(jìn)步的催化劑,除了代代相傳的知識(shí)積累,人類(lèi)擁有了新的知識(shí)積累工具,打破認(rèn)知局限性,所謂“好記性不如爛筆頭”,有了紙張就可以將知識(shí)記錄下來(lái),從而加快積累速度。再后來(lái),信息時(shí)代出現(xiàn)互聯(lián)網(wǎng),紙張逐漸被數(shù)據(jù)存儲(chǔ)器取代,信息時(shí)代是“數(shù)據(jù)要素”驅(qū)動(dòng)的時(shí)代,數(shù)據(jù)里包含信息和知識(shí),海量信息和知識(shí)存儲(chǔ)在互聯(lián)網(wǎng)上,人類(lèi)通過(guò)搜索便捷獲取,知識(shí)的堆積再一次提升人類(lèi)認(rèn)知水平。
那么ChatGPT呢?互聯(lián)網(wǎng)持續(xù)繁榮,人類(lèi)面臨的難題已經(jīng)不再是信息、知識(shí)獲取,與此相反,人類(lèi)現(xiàn)在處在信息過(guò)載、莫衷一是的狀態(tài)。所以互聯(lián)網(wǎng)時(shí)代,最為重要的一種能力是“搜索力”,是如何通過(guò)算法和搜索在浩如煙海的互聯(lián)網(wǎng)信息中找到答案的問(wèn)題。ChatGPT提升了人類(lèi)的搜索力。當(dāng)ChatGPT嫁接到搜索引擎之后,它就能從海量信息中迅速找到你要的信息。比如你是程序員,ChatGPT可以以自身能力組織出一段代碼,也許這段代碼的很多段落零散分布在各類(lèi)網(wǎng)站上,ChatGPT減少了你瀏覽各類(lèi)網(wǎng)站找代碼范例的時(shí)間。同樣的情況,也可以發(fā)生在PPT制作、論文書(shū)寫(xiě)、考試答題上。
當(dāng)然ChatGPT并不局限于搜索力,它不僅能找到知識(shí)點(diǎn),還能通過(guò)自己的語(yǔ)言能力表達(dá)出來(lái)。比如和辦公軟件結(jié)合,你有一組數(shù)據(jù),想做一個(gè)PPT,有了ChatGPT,就可以直接生成若干方案。
綜上,ChatGPT對(duì)于人類(lèi)是一種能力加持,一種能夠大幅度提高人類(lèi)生產(chǎn)力的工具性能力。
當(dāng)前面臨兩個(gè)難題
如果ChatGPT是一種生產(chǎn)力提升工具,那么拒絕生產(chǎn)力工具是不明智的,中國(guó)需要生產(chǎn)力工具。人類(lèi)社會(huì)的每一次科技進(jìn)步,最終結(jié)果都是人類(lèi)去適應(yīng)科技。在工業(yè)時(shí)代,少部分國(guó)家采用閉關(guān)鎖國(guó)的方式來(lái)對(duì)抗科技進(jìn)步,但都以失敗告終。所以對(duì)于中國(guó),ChatGPT是需要的。但圍繞ChatGPT,依然存在幾個(gè)問(wèn)題:
問(wèn)題一:自力更生等待國(guó)產(chǎn)ChatGPT,還是引進(jìn)ChatGPT?
現(xiàn)階段直接引進(jìn)ChatGPT存在制度上的障礙,因?yàn)镃hatGPT是生成式AI,它背后不是數(shù)據(jù)庫(kù),它會(huì)隨機(jī)生成答案,而有些隨機(jī)生成內(nèi)容是違規(guī)的,比如被別有用心的用戶引導(dǎo)給出了“恐怖主義”言論。當(dāng)然,ChatGPT也是可以調(diào)教的,前面說(shuō)過(guò),生成式AI可以通過(guò)范例的預(yù)標(biāo)注詞條進(jìn)行監(jiān)督式學(xué)習(xí),也可以通過(guò)評(píng)分來(lái)規(guī)范回答,但ChatGPT的母公司OpenAI畢竟是美國(guó)公司,美國(guó)和中國(guó)存在很大的文化差異,這些文化差異會(huì)讓ChatGPT在中國(guó)出現(xiàn)水土不服甚至犯法。
但反過(guò)來(lái)說(shuō),國(guó)內(nèi)如今缺少ChatGPT的對(duì)標(biāo)產(chǎn)品。比如百度文心一言,在中文內(nèi)容應(yīng)答方面和ChatGPT不相上下,但如果你將場(chǎng)景切換到編程代碼,兩者就有很大差距。換句話說(shuō),對(duì)生產(chǎn)力支持方面,百度文心一言有欠缺。故而,如果你不讓ChatGPT進(jìn)來(lái),那么就沒(méi)辦法短期內(nèi)提高生產(chǎn)力。而你要ChatGPT進(jìn)來(lái),則需要適配規(guī)則,以提高對(duì)生成式AI內(nèi)容的包容性。
進(jìn)一步可以演化為兩個(gè)選項(xiàng):一個(gè)選項(xiàng)是通過(guò)特別規(guī)則來(lái)引進(jìn)ChatGPT,人工智能不具備主觀惡意,回答是“有口無(wú)心”,可以給予適度包容,讓ChatGPT和國(guó)內(nèi)各個(gè)領(lǐng)域迅速結(jié)合,提升生產(chǎn)力水平。當(dāng)然,也要對(duì)教育等領(lǐng)域進(jìn)行改革,以適應(yīng)ChatGPT帶來(lái)的改變。另一個(gè)選項(xiàng)是先拒絕ChatGPT,等待未來(lái)國(guó)產(chǎn)ChatGPT的平替產(chǎn)品。OpenAI成立至今不到10年,卻已有如此成就,ChatGPT的形成原理并不深?yuàn)W,關(guān)鍵還是要大量資金、人才、時(shí)間去燒出一個(gè)技術(shù)未來(lái),需要排除萬(wàn)難持續(xù)投入,通過(guò)“你追我趕”,預(yù)期未來(lái)5年內(nèi)必然出現(xiàn)類(lèi)ChatGPT的國(guó)產(chǎn)平替產(chǎn)品。
問(wèn)題二:中國(guó)科技企業(yè)在研發(fā)類(lèi)ChatGPT過(guò)程中的瓶頸在哪里?
在生成式AI領(lǐng)域,中國(guó)科技企業(yè)缺兩樣?xùn)|西:一個(gè)是心,是耐心和信心;另一個(gè)是芯,是算力芯片。
為什么說(shuō)缺耐心和信心?
耐心方面,不只是中國(guó)企業(yè)缺,實(shí)際上在OpenAI推出ChatGPT之前,美國(guó)硅谷科技巨頭也缺耐心,比如一直標(biāo)榜人工智能領(lǐng)頭羊的谷歌倉(cāng)促應(yīng)戰(zhàn),結(jié)果產(chǎn)品體驗(yàn)并不能達(dá)到用戶預(yù)期,結(jié)果谷歌股價(jià)暴跌。最近幾十年,機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的顯學(xué),尤其是深度學(xué)習(xí)等算法,但之前大多數(shù)科技企業(yè)都因?yàn)樯墒紸I投入周期長(zhǎng),成本高而忽視了這條路線。企業(yè)的本質(zhì)是盈利組織,會(huì)考慮成本效益問(wèn)題。而OpenAI比較特殊,他之前是非盈利性組織,后來(lái)微軟入主,轉(zhuǎn)變?yōu)橛邢抻M織,微軟只負(fù)責(zé)給錢(qián),不干預(yù)研發(fā),OpenAI從從容容地在幾年內(nèi)燒掉超過(guò)40億美元的資金,未來(lái)還要燒掉百億美元資金進(jìn)行優(yōu)化。
OpenAI在一個(gè)細(xì)分領(lǐng)域投入如此集中,周期如此之長(zhǎng),且在之前并沒(méi)有體現(xiàn)出應(yīng)用價(jià)值,而ChatGPT的能力一旦表現(xiàn)出來(lái),尤其是其對(duì)接更多應(yīng)用的接口能力。便出現(xiàn)“十年寒窗無(wú)人聞,一朝成名天下知”的狀況。當(dāng)前聚攏到生成式AI的科技公司,無(wú)一例外都需要再走一遍OpenAI走過(guò)的路,所以耐心是必需的。比過(guò)去更好的地方在于,我們已經(jīng)看到生成式AI的前景,當(dāng)前這個(gè)領(lǐng)域不乏資本支持。
耐心之外,還有信心。導(dǎo)致中國(guó)科技企業(yè)信心不足的原因如下:
其一,很多AI領(lǐng)域的從業(yè)者認(rèn)為:當(dāng)前中文互聯(lián)網(wǎng)存在高質(zhì)量語(yǔ)料不足的問(wèn)題。這個(gè)問(wèn)題的成因很復(fù)雜,換個(gè)角度看,中國(guó)需要在高質(zhì)量語(yǔ)料數(shù)據(jù)上投入更大成本。
其二,很多AI領(lǐng)域的從業(yè)者擔(dān)心合規(guī)性問(wèn)題。和ChatGPT引進(jìn)的問(wèn)題類(lèi)似,誰(shuí)都擔(dān)心自己辛苦開(kāi)發(fā)的成果不能應(yīng)用。但這里并非無(wú)“技”可施。監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)本身會(huì)規(guī)范生成式AI的生成,法規(guī)只需要對(duì)少數(shù)情況給予適度包容即可。比如,對(duì)用戶惡意引導(dǎo)AI“非法回答”的情況,要明確是用戶的責(zé)任。
其三,很多AI領(lǐng)域的從業(yè)者擔(dān)心算力受制于人。之前英特爾就A100顯卡曾有過(guò)對(duì)華禁售,而ChatGPT成功的背后是微軟為其部署的超過(guò)3萬(wàn)張的A100顯卡,智算中心算力需求和數(shù)據(jù)中心并不相同,其核心主要還是在GPU芯片上,我國(guó)在高端芯片上的瓶頸會(huì)限制中國(guó)生成式AI的發(fā)展。
綜上,中國(guó)“類(lèi)ChatGPT”產(chǎn)品需要算力、數(shù)據(jù)上的支持,也需要制度、法規(guī)上的支持,面對(duì)科技革命,我們依然要落地到軟環(huán)境和硬環(huán)境兩方面,軟環(huán)境就是合規(guī)性和產(chǎn)權(quán)規(guī)則,只有明確制度規(guī)范才能讓企業(yè)有信心加大投入。硬環(huán)境就是硬件設(shè)施,就是算力和數(shù)據(jù)上的支持。
生成式AI的時(shí)代已經(jīng)到來(lái),AI從玩具轉(zhuǎn)變?yōu)楣ぞ?。由于ChatGPT經(jīng)歷過(guò)用戶使用驗(yàn)證,所以生成式AI必然不是一陣風(fēng)的熱點(diǎn)概念,而是長(zhǎng)期的、重要的科技高地,其產(chǎn)生意義可能類(lèi)似于互聯(lián)網(wǎng),是改變?nèi)祟?lèi)生產(chǎn)力水平的關(guān)鍵應(yīng)用。面對(duì)如此大的科技變革,中國(guó)需要抓緊轉(zhuǎn)向去適應(yīng)科技的變化,將科技轉(zhuǎn)化為生產(chǎn)力,為我所用。與此同時(shí),我們也要不忘初心,牢牢抓住“自力更生”這一點(diǎn),提升我國(guó)在這一領(lǐng)域的技術(shù)自主能力。我們需要對(duì)生成式AI發(fā)展保持耐心,因?yàn)檫@是一個(gè)長(zhǎng)周期的投入過(guò)程,生成式AI不能一蹴而就,當(dāng)前要做的,是優(yōu)化好環(huán)境生態(tài),一步一個(gè)腳印,推動(dòng)生成式AI產(chǎn)業(yè)發(fā)展。
(作者系浙江大學(xué)國(guó)際聯(lián)合商學(xué)院數(shù)字經(jīng)濟(jì)與金融創(chuàng)新研究中心聯(lián)席主任、研究員,工信部信息通信經(jīng)濟(jì)專(zhuān)家委員會(huì)委員)
封面圖片來(lái)源:新華社
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP