四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

中國工程院院士孫凝暉談AI：拼算法還是拼新型基礎(chǔ)設(shè)施？中國如何選擇智能計算發(fā)展道路

每日經(jīng)濟新聞 2024-05-31 08:04:16

每經(jīng)編輯杜宇

據(jù)中國人大網(wǎng)4月30日消息，中國人大網(wǎng)刊登中國工程院院士、中國科學(xué)院計算技術(shù)研究所所長孫凝暉在十四屆全國人大常委會專題講座上的講稿《人工智能與智能計算的發(fā)展》。

孫凝暉表示，人工智能領(lǐng)域近年來正在迎來一場由生成式人工智能大模型引領(lǐng)的爆發(fā)式發(fā)展。2022年11月30日，OpenAI公司推出一款人工智能對話聊天機器人ChatGPT，其出色的自然語言生成能力引起了全世界范圍的廣泛關(guān)注，2個月突破1億用戶，國內(nèi)外隨即掀起了一場大模型浪潮，Gemini、文心一言、Copilot、LLaMA、SAM、SORA等各種大模型如雨后春筍般涌現(xiàn)，2022年也被譽為大模型元年。當(dāng)前信息時代正加快進入智能計算的發(fā)展階段，人工智能技術(shù)上的突破層出不窮，逐漸深入地賦能千行百業(yè)，推動人工智能與數(shù)據(jù)要素成為新質(zhì)生產(chǎn)力的典型代表。

孫凝暉指出，大模型的出現(xiàn)帶來了三個變革。一是技術(shù)上的規(guī)模定律，即很多AI模型的精度在參數(shù)規(guī)模超過某個閾值后模型能力快速提升，其原因在科學(xué)界還不是非常清楚，有很大的爭議。AI模型的性能與模型參數(shù)規(guī)模、數(shù)據(jù)集大小、算力總量三個變量成“對數(shù)線性關(guān)系”，因此可以通過增大模型的規(guī)模來不斷提高模型的性能。目前最前沿的大模型GPT-4參數(shù)量已經(jīng)達(dá)到了萬億到十萬億量級，并且仍在不斷增長中；

二是產(chǎn)業(yè)上算力需求爆炸式增長，千億參數(shù)規(guī)模大模型的訓(xùn)練通常需要在數(shù)千乃至數(shù)萬GPU卡上訓(xùn)練2-3個月時間，急劇增加的算力需求帶動相關(guān)算力企業(yè)超高速發(fā)展，英偉達(dá)的市值接近兩萬億美元，對于芯片企業(yè)以前從來沒有發(fā)生過；

三是社會上沖擊勞動力市場，北京大學(xué)國家發(fā)展研究院與智聯(lián)招聘聯(lián)合發(fā)布的《AI大模型對我國勞動力市場潛在影響研究》報告指出，受影響最大的20個職業(yè)中財會、銷售、文書位于前列，需要與人打交道并提供服務(wù)的體力勞動型工作，如人力資源、行政、后勤等反而相對更安全。

人工智能的技術(shù)前沿將朝著以下四個方向發(fā)展。第一個前沿方向為多模態(tài)大模型。從人類視角出發(fā)，人類智能是天然多模態(tài)的，人擁有眼、耳、鼻、舌、身、嘴(語言)，從AI視角出發(fā)，視覺，聽覺等也都可以建模為token的序列，可采取與大語言模型相同的方法進行學(xué)習(xí)，并進一步與語言中的語義進行對齊，實現(xiàn)多模態(tài)對齊的智能能力。

孫凝暉也指出，中國AI技術(shù)與智能計算產(chǎn)業(yè)過去幾年雖然取得很大成績，但依然面臨諸多發(fā)展困境：

困境一為美國在AI核心能力上長期處于領(lǐng)先地位，中國處于跟蹤模式。

困境二為高端算力產(chǎn)品禁售，高端芯片工藝長期被卡。

困境三為國內(nèi)智能計算生態(tài)孱弱，AI開發(fā)框架滲透率不足。

困境四為AI應(yīng)用于行業(yè)時成本、門檻居高不下。

困境五，中國在AI領(lǐng)域的人才數(shù)量與實際需求相比也明顯不足。

圖片來源：視覺中國

以下是孫凝暉院士演講全文：

委員長、各位副委員長、秘書長、各位委員：

人工智能領(lǐng)域近年來正在迎來一場由生成式人工智能大模型引領(lǐng)的爆發(fā)式發(fā)展。2022年11月30日，OpenAI公司推出一款人工智能對話聊天機器人ChatGPT，其出色的自然語言生成能力引起了全世界范圍的廣泛關(guān)注，2個月突破1億用戶，國內(nèi)外隨即掀起了一場大模型浪潮，Gemini、文心一言、Copilot、LLaMA、SAM、SORA等各種大模型如雨后春筍般涌現(xiàn)，2022年也被譽為大模型元年。當(dāng)前信息時代正加快進入智能計算的發(fā)展階段，人工智能技術(shù)上的突破層出不窮，逐漸深入地賦能千行百業(yè)，推動人工智能與數(shù)據(jù)要素成為新質(zhì)生產(chǎn)力的典型代表。習(xí)近平總書記指出，把新一代人工智能作為推動科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級、生產(chǎn)力整體躍升的驅(qū)動力量，努力實現(xiàn)高質(zhì)量發(fā)展。黨的十八大以來，以習(xí)近平同志為核心的黨中央高度重視智能經(jīng)濟發(fā)展，促進人工智能和實體經(jīng)濟深度融合，為高質(zhì)量發(fā)展注入強勁動力。

一、計算技術(shù)發(fā)展簡介

計算技術(shù)的發(fā)展歷史大致可分為四個階段，算盤的出現(xiàn)標(biāo)志著人類進入第一代——機械計算時代，第二代——電子計算的標(biāo)志是出現(xiàn)電子器件與電子計算機，互聯(lián)網(wǎng)的出現(xiàn)使我們進入第三代——網(wǎng)絡(luò)計算，當(dāng)前人類社會正在進入第四階段——智能計算。

早期的計算裝置是手動輔助計算裝置和半自動計算裝置，人類計算工具的歷史是從公元1200年的中國算盤開始，隨后出現(xiàn)了納皮爾籌（1612年）和滾輪式加法器（1642年），到1672年第一臺自動完成四則運算的計算裝置——步進計算器誕生了。

機械計算時期已經(jīng)出現(xiàn)了現(xiàn)代計算機的一些基本概念。查爾斯?巴貝奇（Charles Babbage）提出了差分機（1822年）與分析機（1834年）的設(shè)計構(gòu)想，支持自動機械計算。這一時期，編程與程序的概念基本形成，編程的概念起源于雅卡爾提花機，通過打孔卡片控制印花圖案，最終演變?yōu)橥ㄟ^計算指令的形式來存儲所有數(shù)學(xué)計算步驟；人類歷史的第一個程序員是詩人拜倫之女艾達(dá)（Ada），她為巴貝奇差分機編寫了一組求解伯努利數(shù)列的計算指令，這套指令也是人類歷史上第一套計算機算法程序，它將硬件和軟件分離，第一次出現(xiàn)程序的概念。

直到在二十世紀(jì)上半葉，出現(xiàn)了布爾代數(shù)(數(shù)學(xué))、圖靈機(計算模型)、馮諾依曼體系結(jié)構(gòu)(架構(gòu))、晶體管(器件)這四個現(xiàn)代計算技術(shù)的科學(xué)基礎(chǔ)。其中，布爾代數(shù)用來描述程序和硬件如CPU的底層邏輯；圖靈機是一種通用的計算模型，將復(fù)雜任務(wù)轉(zhuǎn)化為自動計算、不需人工干預(yù)的自動化過程；馮諾依曼體系結(jié)構(gòu)提出了構(gòu)造計算機的三個基本原則：采用二進制邏輯、程序存儲執(zhí)行、以及計算機由運算器、控制器、存儲器、輸入設(shè)備、輸出設(shè)備這五個基本單元組成；晶體管是構(gòu)成基本的邏輯電路和存儲電路的半導(dǎo)體器件，是建造現(xiàn)代計算機之塔的“磚塊”?；谝陨峡茖W(xué)基礎(chǔ)，計算技術(shù)得以高速發(fā)展，形成規(guī)模龐大的產(chǎn)業(yè)。

從1946年世界上第一臺電子計算機ENIAC誕生到二十一世紀(jì)的今天，已經(jīng)形成了五類成功的平臺型計算系統(tǒng)。當(dāng)前各領(lǐng)域各種類型的應(yīng)用，都可以由這五類平臺型計算裝置支撐。第一類是高性能計算平臺，解決了國家核心部門的科學(xué)與工程計算問題；第二類是企業(yè)計算平臺，又稱服務(wù)器，用于企業(yè)級的數(shù)據(jù)管理、事務(wù)處理，當(dāng)前像百度、阿里和騰訊這些互聯(lián)網(wǎng)公司的計算平臺都屬于這一類；第三類是個人電腦平臺，以桌面應(yīng)用的形式出現(xiàn)，人們通過桌面應(yīng)用與個人電腦交互；第四類是智能手機，主要特點是移動便攜，手機通過網(wǎng)絡(luò)連接數(shù)據(jù)中心，以互聯(lián)網(wǎng)應(yīng)用為主，它們分布式地部署在數(shù)據(jù)中心和手機終端；第五類是嵌入式計算機，嵌入到工業(yè)裝備和軍事設(shè)備，通過實時的控制，保障在確定時間內(nèi)完成特定任務(wù)。這五類裝置幾乎覆蓋了我們信息社會的方方面面，長期以來人們追求的以智能計算應(yīng)用為中心的第六類平臺型計算系統(tǒng)尚未形成。

現(xiàn)代計算技術(shù)的發(fā)展大致可以劃分為三個時代。IT1.0又稱電子計算時代（1950-1970），基本特征是以“機”為中心。計算技術(shù)的基本架構(gòu)形成，隨著集成電路工藝的進步，基本計算單元的尺度快速微縮，晶體管密度、計算性能和可靠性不斷提升，計算機在科學(xué)工程計算、企業(yè)數(shù)據(jù)處理中得到了廣泛應(yīng)用。

IT2.0又稱網(wǎng)絡(luò)計算時代（1980-2020），以“人”為中心?；ヂ?lián)網(wǎng)將人使用的終端與后臺的數(shù)據(jù)中心連接，互聯(lián)網(wǎng)應(yīng)用通過智能終端與人進行交互。以亞馬遜等為代表的互聯(lián)網(wǎng)公司提出了云計算的思想，將后臺的算力封裝成一個公共服務(wù)租借給第三方用戶，形成了云計算與大數(shù)據(jù)產(chǎn)業(yè)。

IT3.0又稱智能計算時代，始于2020年，與IT2.0相比增加了“物”的概念，即物理世界的各種端側(cè)設(shè)備，被數(shù)字化、網(wǎng)絡(luò)化和智能化，實現(xiàn)“人-機-物”三元融合。智能計算時代，除了互聯(lián)網(wǎng)以外，還有數(shù)據(jù)基礎(chǔ)設(shè)施，支撐各類終端通過端邊云實現(xiàn)萬物互聯(lián)，終端、物端、邊緣、云都嵌入AI，提供與ChatGPT類似的大模型智能服務(wù)，最終實現(xiàn)有計算的地方就有AI智能。智能計算帶來了巨量的數(shù)據(jù)、人工智能算法的突破和對算力的爆發(fā)性需求。

二、智能計算發(fā)展簡介

智能計算包括人工智能技術(shù)與它的計算載體，大致歷經(jīng)了四個階段，分別為通用計算裝置、邏輯推理專家系統(tǒng)、深度學(xué)習(xí)計算系統(tǒng)、大模型計算系統(tǒng)。

智能計算的起點是通用自動計算裝置（1946年）。艾倫·圖靈（Alan Turing）和馮·諾依曼（John von Neumann）等科學(xué)家，一開始都希望能夠模擬人腦處理知識的過程，發(fā)明像人腦一樣思考的機器，雖未能實現(xiàn)，但卻解決了計算的自動化問題。通用自動計算裝置的出現(xiàn)，也推動了1956年人工智能（AI）概念的誕生，此后所有人工智能技術(shù)的發(fā)展都是建立在新一代計算設(shè)備與更強的計算能力之上的。

智能計算發(fā)展的第二階段是邏輯推理專家系統(tǒng)（1990年）。E.A.費根鮑姆（Edward Albert Feigenbaum）等符號智能學(xué)派的科學(xué)家以邏輯和推理能力自動化為主要目標(biāo)，提出了能夠?qū)⒅R符號進行邏輯推理的專家系統(tǒng)。人的先驗知識以知識符號的形式進入計算機，使計算機能夠在特定領(lǐng)域輔助人類進行一定的邏輯判斷和決策，但專家系統(tǒng)嚴(yán)重依賴于手工生成的知識庫或規(guī)則庫。這類專家系統(tǒng)的典型代表是日本的五代機和我國863計劃支持的306智能計算機主題，日本在邏輯專家系統(tǒng)中采取專用計算平臺和Prolog這樣的知識推理語言完成應(yīng)用級推理任務(wù)；我國采取了與日本不同的技術(shù)路線，以通用計算平臺為基礎(chǔ)，將智能任務(wù)變成人工智能算法，將硬件和系統(tǒng)軟件都接入通用計算平臺，并催生了曙光、漢王、科大訊飛等一批骨干企業(yè)。

符號計算系統(tǒng)的局限性在于其爆炸的計算時空復(fù)雜度，即符號計算系統(tǒng)只能解決線性增長問題，對于高維復(fù)雜空間問題是無法求解的，從而限制了能夠處理問題的大小。同時因為符號計算系統(tǒng)是基于知識規(guī)則建立的，我們又無法對所有的常識用窮舉法來進行枚舉，它的應(yīng)用范圍就受到了很大的限制。隨著第二次AI寒冬的到來，第一代智能計算機逐漸退出歷史舞臺。

直到2014年左右，智能計算進階到第三階段——深度學(xué)習(xí)計算系統(tǒng)。以杰弗里·辛頓（Geoffrey Hinton）等為代表的連接智能學(xué)派，以學(xué)習(xí)能力自動化為目標(biāo)，發(fā)明了深度學(xué)習(xí)等新AI算法。通過深度神經(jīng)元網(wǎng)絡(luò)的自動學(xué)習(xí)，大幅提升了模型統(tǒng)計歸納的能力，在模式識別①等應(yīng)用效果上取得了巨大突破，某些場景的識別精度甚至超越了人類。以人臉識別為例，整個神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程相當(dāng)于一個網(wǎng)絡(luò)參數(shù)調(diào)整的過程，將大量的經(jīng)過標(biāo)注的人臉圖片數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò)，然后進行網(wǎng)絡(luò)間參數(shù)調(diào)整，讓神經(jīng)網(wǎng)絡(luò)輸出的結(jié)果的概率無限逼近真實結(jié)果。神經(jīng)網(wǎng)絡(luò)輸出真實情況的概率越大，參數(shù)就越大，從而將知識和規(guī)則編碼到網(wǎng)絡(luò)參數(shù)中，這樣只要數(shù)據(jù)足夠多，就可以對各種大量的常識進行學(xué)習(xí)，通用性得到極大的提升。連接智能的應(yīng)用更加廣泛，包括語音識別、人臉識別、自動駕駛等。在計算載體方面，中國科學(xué)院計算技術(shù)研究所2013年提出了國際首個深度學(xué)習(xí)處理器架構(gòu)，國際知名的硬件廠商英偉達(dá)（NVIDIA）持續(xù)發(fā)布了多款性能領(lǐng)先的通用GPU芯片，都是深度學(xué)習(xí)計算系統(tǒng)的典型代表。

智能計算發(fā)展的第四階段是大模型計算系統(tǒng)（2020年）。在人工智能大模型技術(shù)的推動下，智能計算邁向新的高度。2020年，AI從“小模型+判別式”轉(zhuǎn)向“大模型+生成式”，從傳統(tǒng)的人臉識別、目標(biāo)檢測、文本分類，升級到如今的文本生成、3D數(shù)字人生成、圖像生成、語音生成、視頻生成。大語言模型在對話系統(tǒng)領(lǐng)域的一個典型應(yīng)用是OpenAI公司的ChatGPT，它采用預(yù)訓(xùn)練基座大語言模型GPT-3，引入3000億單詞的訓(xùn)練語料，相當(dāng)于互聯(lián)網(wǎng)上所有英語文字的總和。其基本原理是：通過給它一個輸入，讓它預(yù)測下一個單詞來訓(xùn)練模型，通過大量訓(xùn)練提升預(yù)測精確度，最終達(dá)到向它詢問一個問題，大模型產(chǎn)生一個答案，與人即時對話。在基座大模型的基礎(chǔ)上，再給它一些提示詞進行有監(jiān)督的指令微調(diào)，通過人類的<指令，回復(fù)>對逐漸讓模型學(xué)會如何與人進行多輪對話；最后，通過人為設(shè)計和自動生成的獎勵函數(shù)來進行強化學(xué)習(xí)迭代，逐步實現(xiàn)大模型與人類價值觀的對齊。

大模型的特點是以“大”取勝，其中有三層含義，（1）參數(shù)大，GPT-3就有1700億個參數(shù)；（2）訓(xùn)練數(shù)據(jù)大，ChatGPT大約用了3000億個單詞，570GB訓(xùn)練數(shù)據(jù)；（3）算力需求大，GPT-3大約用了上萬塊V100 GPU進行訓(xùn)練。為滿足大模型對智能算力爆炸式增加的需求，國內(nèi)外都在大規(guī)模建設(shè)耗資巨大的新型智算中心，英偉達(dá)公司也推出了采用256個H100芯片，150TB海量GPU內(nèi)存等構(gòu)成的大模型智能計算系統(tǒng)。

大模型的出現(xiàn)帶來了三個變革。一是技術(shù)上的規(guī)模定律（Scaling Law），即很多AI模型的精度在參數(shù)規(guī)模超過某個閾值后模型能力快速提升，其原因在科學(xué)界還不是非常清楚，有很大的爭議。AI模型的性能與模型參數(shù)規(guī)模、數(shù)據(jù)集大小、算力總量三個變量成“對數(shù)線性關(guān)系”，因此可以通過增大模型的規(guī)模來不斷提高模型的性能。目前最前沿的大模型GPT-4參數(shù)量已經(jīng)達(dá)到了萬億到十萬億量級，并且仍在不斷增長中；二是產(chǎn)業(yè)上算力需求爆炸式增長，千億參數(shù)規(guī)模大模型的訓(xùn)練通常需要在數(shù)千乃至數(shù)萬GPU卡上訓(xùn)練2-3個月時間，急劇增加的算力需求帶動相關(guān)算力企業(yè)超高速發(fā)展，英偉達(dá)的市值接近兩萬億美元，對于芯片企業(yè)以前從來沒有發(fā)生過；三是社會上沖擊勞動力市場，北京大學(xué)國家發(fā)展研究院與智聯(lián)招聘聯(lián)合發(fā)布的《AI大模型對我國勞動力市場潛在影響研究》報告指出，受影響最大的20個職業(yè)中財會、銷售、文書位于前列，需要與人打交道并提供服務(wù)的體力勞動型工作，如人力資源、行政、后勤等反而相對更安全。

人工智能的技術(shù)前沿將朝著以下四個方向發(fā)展。第一個前沿方向為多模態(tài)大模型。從人類視角出發(fā)，人類智能是天然多模態(tài)的，人擁有眼、耳、鼻、舌、身、嘴(語言)，從AI視角出發(fā)，視覺，聽覺等也都可以建模為token②的序列，可采取與大語言模型相同的方法進行學(xué)習(xí)，并進一步與語言中的語義進行對齊，實現(xiàn)多模態(tài)對齊的智能能力。

第二個前沿方向為視頻生成大模型。OpenAI于2024年2月15日發(fā)布文生視頻模型SORA，將視頻生成時長從幾秒鐘大幅提升到一分鐘，且在分辨率、畫面真實度、時序一致性等方面都有顯著提升。SORA的最大意義是它具備了世界模型的基本特征，即人類觀察世界并進一步預(yù)測世界的能力。世界模型是建立在理解世界的基本物理常識（如，水往低處流等）之上，然后觀察并預(yù)測下一秒將要發(fā)生什么事件。雖然SORA要成為世界模型仍然存在很多問題，但可以認(rèn)為SORA學(xué)會了畫面想象力和分鐘級未來預(yù)測能力，這是世界模型的基礎(chǔ)特征。

第三個前沿方向為具身智能。具身智能指有身體并支持與物理世界進行交互的智能體，如機器人、無人車等，通過多模態(tài)大模型處理多種傳感數(shù)據(jù)輸入，由大模型生成運動指令對智能體進行驅(qū)動，替代傳統(tǒng)基于規(guī)則或者數(shù)學(xué)公式的運動驅(qū)動方式，實現(xiàn)虛擬和現(xiàn)實的深度融合。因此，具有具身智能的機器人，可以聚集人工智能的三大流派：以神經(jīng)網(wǎng)絡(luò)為代表的連接主義，以知識工程為代表的符號主義和控制論相關(guān)的行為主義，三大流派可以同時作用在一個智能體，這預(yù)期會帶來新的技術(shù)突破。

第四個前沿方向是AI4R(AI for Research)成為科學(xué)發(fā)現(xiàn)與技術(shù)發(fā)明的主要范式。當(dāng)前科學(xué)發(fā)現(xiàn)主要依賴于實驗和人腦智慧，由人類進行大膽猜想、小心求證，信息技術(shù)無論是計算和數(shù)據(jù)，都只是起到一些輔助和驗證的作用。相較于人類，人工智能在記憶力、高維復(fù)雜、全視野、推理深度、猜想等方面具有較大優(yōu)勢，是否能以AI為主進行一些科學(xué)發(fā)現(xiàn)和技術(shù)發(fā)明，大幅提升人類科學(xué)發(fā)現(xiàn)的效率，比如主動發(fā)現(xiàn)物理學(xué)規(guī)律、預(yù)測蛋白質(zhì)結(jié)構(gòu)、設(shè)計高性能芯片、高效合成新藥等。因為人工智能大模型具有全量數(shù)據(jù)，具備上帝視角，通過深度學(xué)習(xí)的能力，可以比人向前看更多步數(shù)，如能實現(xiàn)從推斷(inference)到推理(reasoning)的躍升，人工智能模型就有潛力具備愛因斯坦一樣的想象力和科學(xué)猜想能力，極大提升人類科學(xué)發(fā)現(xiàn)的效率，打破人類的認(rèn)知邊界。這才是真正的顛覆所在。

最后，通用人工智能③（Artificial General Intelligence，簡稱AGI）是一個極具挑戰(zhàn)的話題，極具爭論性。曾經(jīng)有一個哲學(xué)家和一個神經(jīng)科學(xué)家打賭：25年后（即2023年）科研人員是否能夠揭示大腦如何實現(xiàn)意識？當(dāng)時關(guān)于意識有兩個流派，一個叫集成信息理論，一個叫全局網(wǎng)絡(luò)工作空間理論，前者認(rèn)為意識是由大腦中特定類型神經(jīng)元連接形成的“結(jié)構(gòu)”，后者指出意識是當(dāng)信息通過互連網(wǎng)絡(luò)傳播到大腦區(qū)域時產(chǎn)生的。2023年，人們通過六個獨立實驗室進行了對抗性實驗，結(jié)果與兩種理論均不完全匹配，哲學(xué)家贏了，神經(jīng)科學(xué)家輸了。通過這一場賭約，可以看出人們總是希望人工智能能夠了解人類的認(rèn)知和大腦的奧秘。從物理學(xué)的視角看，物理學(xué)是對宏觀世界有了透徹理解后，從量子物理起步開啟了對微觀世界的理解。智能世界與物理世界一樣，都是具有巨大復(fù)雜度的研究對象，AI大模型仍然是通過數(shù)據(jù)驅(qū)動等研究宏觀世界的方法，提高機器的智能水平，對智能宏觀世界理解并不夠，直接到神經(jīng)系統(tǒng)微觀世界尋找答案是困難的。人工智能自誕生以來，一直承載著人類關(guān)于智能與意識的種種夢想與幻想，也激勵著人們不斷探索。

三、人工智能的安全風(fēng)險

人工智能的發(fā)展促進了當(dāng)今世界科技進步的同時，也帶來了很多安全風(fēng)險，要從技術(shù)與法規(guī)兩方面加以應(yīng)對。

首先是互聯(lián)網(wǎng)虛假信息泛濫。這里列舉若干場景：一是數(shù)字分身。AI Yoon是首個使用DeepFake技術(shù)合成的官方“候選人”，這個數(shù)字人以韓國國民力量黨候選人尹錫悅（Yoon Suk-yeol）為原型，借助尹錫悅20小時的音頻和視頻片段、以及其專門為研究人員錄制的3000多個句子，由當(dāng)?shù)匾患褼eepFake技術(shù)公司創(chuàng)建了虛擬形象AI Yoon，并在網(wǎng)絡(luò)上迅速走紅。實際上AI Yoon表達(dá)的內(nèi)容是由競選團隊撰寫的，而不是候選人本人。

二是偽造視頻，尤其是偽造領(lǐng)導(dǎo)人視頻引起國際爭端，擾亂選舉秩序，或引起突發(fā)輿情事件，如偽造尼克松宣布第一次登月失敗，偽造烏克蘭總統(tǒng)澤連斯基宣布“投降”的信息，這些行為導(dǎo)致新聞媒體行業(yè)的社會信任衰退。

三是偽造新聞，主要通過虛假新聞自動生成牟取非法利益，使用ChatGPT生成熱點新聞，賺取流量，截至2023年6月30日全球生成偽造新聞網(wǎng)站已達(dá)277個，嚴(yán)重擾亂社會秩序。

四是換臉變聲，用于詐騙。如由于AI語音模仿了企業(yè)高管的聲音，一家香港國際企業(yè)因此被騙3500萬美元。

五是生成不雅圖片，特別是針對公眾人物。如影視明星的色情視頻制作，造成不良社會影響。因此，迫切需要發(fā)展互聯(lián)網(wǎng)虛假信息的偽造檢測技術(shù)。

其次，AI大模型面臨嚴(yán)重可信問題。這些問題包括：（1）“一本正經(jīng)胡說八道”的事實性錯誤；（2）以西方價值觀敘事，輸出政治偏見和錯誤言論；（3）易被誘導(dǎo)，輸出錯誤知識和有害內(nèi)容；（4）數(shù)據(jù)安全問題加重，大模型成為重要敏感數(shù)據(jù)的誘捕器，ChatGPT將用戶輸入納入訓(xùn)練數(shù)據(jù)庫，用于改善ChatGPT，美方能夠利用大模型獲得公開渠道覆蓋不到的中文語料，掌握我們自己都可能不掌握的“中國知識”。因此，迫切需要發(fā)展大模型安全監(jiān)管技術(shù)與自己的可信大模型。

除了技術(shù)手段外，人工智能安全保障需要相關(guān)立法工作。2021年科技部發(fā)布《新一代人工智能倫理規(guī)范》，2022年8月，全國信息安全標(biāo)準(zhǔn)化技術(shù)委員會發(fā)布《信息安全技術(shù)機器學(xué)習(xí)算法安全評估規(guī)范》，2022-2023年，中央網(wǎng)信辦先后發(fā)布《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》《生成式人工智能服務(wù)管理辦法》等。歐美國家也先后出臺法規(guī)，2018年5月25日，歐盟出臺《通用數(shù)據(jù)保護條例》，2022年10月4日，美國發(fā)布《人工智能權(quán)利法案藍(lán)圖》，2024年3月13日，歐洲議會通過了歐盟《人工智能法案》。

我國應(yīng)加快推進《人工智能法》出臺，構(gòu)建人工智能治理體系，確保人工智能的發(fā)展和應(yīng)用遵循人類共同價值觀，促進人機和諧友好；創(chuàng)造有利于人工智能技術(shù)研究、開發(fā)、應(yīng)用的政策環(huán)境；建立合理披露機制和審計評估機制，理解人工智能機制原理和決策過程；明確人工智能系統(tǒng)的安全責(zé)任和問責(zé)機制，可追溯責(zé)任主體并補救；推動形成公平合理、開放包容的國際人工智能治理規(guī)則。

四、中國智能計算發(fā)展困境

人工智能技術(shù)與智能計算產(chǎn)業(yè)處于中美科技競爭的焦點，我國在過去幾年雖然取得了很大的成績，但依然面臨諸多發(fā)展困境，特別是由美國的科技打壓政策帶來的困難。

困境一為美國在AI核心能力上長期處于領(lǐng)先地位，中國處于跟蹤模式。中國在AI高端人才數(shù)量、AI基礎(chǔ)算法創(chuàng)新、AI底座大模型能力（大語言模型、文生圖模型、文生視頻模型）、底座大模型訓(xùn)練數(shù)據(jù)、底座大模型訓(xùn)練算力等，都與美國存在一定的差距，并且這種差距還將持續(xù)很長一段時間。

困境二為高端算力產(chǎn)品禁售，高端芯片工藝長期被卡。A100，H100，B200等高端智算芯片對華禁售。華為、龍芯、寒武紀(jì)、曙光、海光等企業(yè)都進入實體清單，它們芯片制造的先進工藝④受限，國內(nèi)可滿足規(guī)模量產(chǎn)的工藝節(jié)點落后國際先進水平2-3代，核心算力芯片的性能落后國際先進水平2-3代。

困境三為國內(nèi)智能計算生態(tài)孱弱，AI開發(fā)框架滲透率不足。英偉達(dá)CUDA⑤(Compute Unified Device Architecture,通用計算設(shè)備架構(gòu))生態(tài)完備，已形成了事實上的壟斷。國內(nèi)生態(tài)孱弱，具體表現(xiàn)在：一是研發(fā)人員不足，英偉達(dá)CUDA生態(tài)有近2萬人開發(fā)，是國內(nèi)所有智能芯片公司人員總和的20倍；二是開發(fā)工具不足，CUDA有550個SDK(Software Development Kit,軟件開發(fā)工具包)，是國內(nèi)相關(guān)企業(yè)的上百倍；三是資金投入不足，英偉達(dá)每年投入50億美元，是國內(nèi)相關(guān)公司的幾十倍；四是AI開發(fā)框架TensorFlow占據(jù)工業(yè)類市場，PyTorch占據(jù)研究類市場，百度飛槳等國產(chǎn)AI開發(fā)框架的開發(fā)人員只有國外框架的1/10。更為嚴(yán)重的是國內(nèi)企業(yè)之間山頭林立，無法形成合力，從智能應(yīng)用、開發(fā)框架、系統(tǒng)軟件、智能芯片，雖然每層都有相關(guān)產(chǎn)品，但各層之間沒有深度適配，無法形成一個有競爭力的技術(shù)體系。

困境四為AI應(yīng)用于行業(yè)時成本、門檻居高不下。當(dāng)前我國AI應(yīng)用主要集中在互聯(lián)網(wǎng)行業(yè)和一些國防領(lǐng)域。AI技術(shù)推廣應(yīng)用于各行各業(yè)時，特別是從互聯(lián)網(wǎng)行業(yè)遷移到非互聯(lián)網(wǎng)行業(yè)，需要進行大量的定制工作，遷移難度大，單次使用成本高。最后，我國在AI領(lǐng)域的人才數(shù)量與實際需求相比也明顯不足。

五、中國如何發(fā)展智能計算的道路選擇

人工智能發(fā)展的道路選擇對我國至關(guān)重要，關(guān)系到發(fā)展的可持續(xù)性與最終的國際競爭格局。當(dāng)前人工智能的使用成本十分高昂，微軟Copilot套件要支付每月10美元的使用費用，ChatGPT每天消耗50萬千瓦時的電力，英偉達(dá)B200芯片價格高達(dá)3萬美元以上?？傮w來說，我國應(yīng)發(fā)展用得起、安全可信的人工智能技術(shù)，消除我國信息貧困人口、并造福“一帶一路”國家；低門檻地賦能各行各業(yè)，讓我國的優(yōu)勢產(chǎn)業(yè)保持競爭力，讓相對落后的產(chǎn)業(yè)能夠大幅地縮小差距。

選擇一：統(tǒng)一技術(shù)體系走閉源封閉，還是開源開放的道路？

支撐智能計算產(chǎn)業(yè)的是一個相互緊耦合的技術(shù)體系，即由一系列技術(shù)標(biāo)準(zhǔn)和知識產(chǎn)權(quán)將材料、器件、工藝、芯片、整機、系統(tǒng)軟件、應(yīng)用軟件等密切聯(lián)系在一起的技術(shù)整體。我國發(fā)展智能計算技術(shù)體系存在三條道路：

一是追趕兼容美國主導(dǎo)的A體系。我國大多數(shù)互聯(lián)網(wǎng)企業(yè)走的是GPGPU/CUDA兼容道路，很多芯片領(lǐng)域的創(chuàng)業(yè)企業(yè)在生態(tài)構(gòu)建上也是盡量與CUDA兼容，這條道路較為現(xiàn)實。由于在算力方面美國對我國工藝和芯片帶寬的限制，在算法方面國內(nèi)生態(tài)林立很難形成統(tǒng)一，生態(tài)成熟度嚴(yán)重受限，在數(shù)據(jù)方面中文高質(zhì)量數(shù)據(jù)匱乏，這些因素會使得追趕者與領(lǐng)先者的差距很難縮小，一些時候還會進一步拉大。

二是構(gòu)建專用封閉的B體系。在軍事、氣象、司法等專用領(lǐng)域構(gòu)建企業(yè)封閉生態(tài)，基于國產(chǎn)成熟工藝生產(chǎn)芯片，相對于底座大模型更加關(guān)注特定領(lǐng)域垂直類大模型，訓(xùn)練大模型更多采用領(lǐng)域?qū)Ｓ懈哔|(zhì)量數(shù)據(jù)等。這條道路易于形成完整可控的技術(shù)體系與生態(tài)，我國一些大型骨干企業(yè)走的是這條道路，它的缺點是封閉，無法凝聚國內(nèi)大多數(shù)力量，也很難實現(xiàn)全球化。

三是全球共建開源開放的C體系。用開源打破生態(tài)壟斷，降低企業(yè)擁有核心技術(shù)的門檻，讓每個企業(yè)都能低成本地做自己的芯片，形成智能芯片的汪洋大海，滿足無處不在的智能需求。用開放形成統(tǒng)一的技術(shù)體系，我國企業(yè)與全球化力量聯(lián)合起來共建基于國際標(biāo)準(zhǔn)的統(tǒng)一智能計算軟件棧。形成企業(yè)競爭前共享機制，共享高質(zhì)量數(shù)據(jù)庫，共享開源通用底座大模型。對于全球開源生態(tài)，我國企業(yè)在互聯(lián)網(wǎng)時代收益良多，我國更多的是使用者，是參與者，在智能時代我國企業(yè)在RISC-V⑥+AI開源技術(shù)體系上應(yīng)更多地成為主力貢獻者，成為全球化開放共享的主導(dǎo)力量。

選擇二：拼算法模型，還是拼新型基礎(chǔ)設(shè)施？

人工智能技術(shù)要賦能各行各業(yè)，具有典型的長尾效應(yīng)⑦。我國80%的中小微企業(yè)，需要的是低門檻、低價格的智能服務(wù)。因此，我國智能計算產(chǎn)業(yè)必須建立在新的數(shù)據(jù)空間基礎(chǔ)設(shè)施之上，其中關(guān)鍵是我國應(yīng)率先實現(xiàn)智能要素即數(shù)據(jù)、算力、算法的全面基礎(chǔ)設(shè)施化。這項工作可比肩二十世紀(jì)初美國信息高速公路計劃（即信息基礎(chǔ)設(shè)施建設(shè)）對互聯(lián)網(wǎng)產(chǎn)業(yè)的歷史作用。

信息社會最核心的生產(chǎn)力是網(wǎng)絡(luò)空間(Cyberspace)。網(wǎng)絡(luò)空間的演進過程是：從機器一元連接構(gòu)成的計算空間，演進到人機信息二元連接構(gòu)成的信息空間，再演進到人機物數(shù)據(jù)三元連接構(gòu)成的數(shù)據(jù)空間。從數(shù)據(jù)空間看，人工智能的本質(zhì)是數(shù)據(jù)的百煉成鋼，大模型就是對互聯(lián)網(wǎng)全量數(shù)據(jù)進行深度加工后的產(chǎn)物。在數(shù)字化時代，在互聯(lián)網(wǎng)上傳輸?shù)氖切畔⒘?，是算力對?shù)據(jù)進行粗加工后的結(jié)構(gòu)化抽象；在智能時代，在互聯(lián)網(wǎng)上傳輸?shù)氖侵悄芰?，是算力對?shù)據(jù)進行深度加工與精煉后的模型化抽象。智能計算的一個核心特征就是用數(shù)值計算、數(shù)據(jù)分析、人工智能等算法，在算力池中加工海量數(shù)據(jù)件，得到智能模型，再嵌入到信息世界、物理世界的各個過程中。

我國政府已經(jīng)前瞻性地提前布局了新型基礎(chǔ)設(shè)施，在世界各國競爭中搶占了先機。首先，數(shù)據(jù)已成為國家戰(zhàn)略信息資源。數(shù)據(jù)具有資源要素與價值加工兩重屬性，數(shù)據(jù)的資源要素屬性包括生產(chǎn)、獲取、傳輸、匯聚、流通、交易、權(quán)屬、資產(chǎn)、安全等各個環(huán)節(jié)，我國應(yīng)繼續(xù)加大力度建設(shè)國家數(shù)據(jù)樞紐與數(shù)據(jù)流通基礎(chǔ)設(shè)施。

其次，AI大模型就是數(shù)據(jù)空間的一類算法基礎(chǔ)設(shè)施。以通用大模型為基座，構(gòu)建大模型研發(fā)與應(yīng)用的基礎(chǔ)設(shè)施，支撐廣大企業(yè)研發(fā)領(lǐng)域?qū)Ｓ么竽Ｐ停?wù)于機器人、無人駕駛、可穿戴設(shè)備、智能家居、智能安防等行業(yè)，覆蓋長尾應(yīng)用。

最后，全國一體化算力網(wǎng)建設(shè)在推動算力的基礎(chǔ)設(shè)施化上發(fā)揮了先導(dǎo)作用。算力基礎(chǔ)設(shè)施化的中國方案，應(yīng)在大幅度降低算力使用成本和使用門檻的同時，為最廣范圍覆蓋人群提供高通量、高品質(zhì)的智能服務(wù)。算力基礎(chǔ)設(shè)施的中國方案需要具備“兩低一高”，即在供給側(cè)，大幅度降低算力器件、算力設(shè)備、網(wǎng)絡(luò)連接、數(shù)據(jù)獲取、算法模型調(diào)用、電力消耗、運營維護、開發(fā)部署的總成本，讓廣大中小企業(yè)都消費得起高品質(zhì)的算力服務(wù)，有積極性開發(fā)算力網(wǎng)應(yīng)用；在消費側(cè)，大幅度降低廣大用戶的算力使用門檻，面向大眾的公共服務(wù)必須做到易獲取、易使用，像水電一樣即開即用，像編寫網(wǎng)頁一樣輕松定制算力服務(wù)，開發(fā)算力網(wǎng)應(yīng)用。在服務(wù)效率側(cè)，中國的算力服務(wù)要實現(xiàn)低熵高通量，其中高通量是指在實現(xiàn)高并發(fā)⑧度服務(wù)的同時，端到端服務(wù)的響應(yīng)時間可滿足率高；低熵是指在高并發(fā)負(fù)載中出現(xiàn)資源無序競爭的情況下，保障系統(tǒng)通量不急劇下降。保障“算得多”對中國尤其重要。

選擇三：AI+著重賦能虛擬經(jīng)濟，還是發(fā)力實體經(jīng)濟？

“AI+”的成效是人工智能價值的試金石。次貸危機后，美國制造業(yè)增加值占GDP的比重從1950年的28%降低為2021年的11%，美國制造業(yè)在全行業(yè)就業(yè)人數(shù)占比從1979年的35%降低為2022年的8%，可見美國更傾向于回報率更高的虛擬經(jīng)濟，輕視投資成本高且經(jīng)濟回報率低的實體經(jīng)濟。中國傾向于實體經(jīng)濟與虛擬經(jīng)濟同步發(fā)展，更加重視發(fā)展裝備制造、新能源汽車、光伏發(fā)電、鋰電池、高鐵、5G等實體經(jīng)濟。

相應(yīng)地美國AI主要應(yīng)用于虛擬經(jīng)濟和IT基礎(chǔ)工具，AI技術(shù)也是“脫實向虛”，自2007年以來硅谷不斷炒作虛擬現(xiàn)實（Virtual Reality，VR）、元宇宙、區(qū)塊鏈、Web3.0、深度學(xué)習(xí)、AI大模型等，是這個趨勢的反映。

我國的優(yōu)勢在實體經(jīng)濟，制造業(yè)全球產(chǎn)業(yè)門類最齊全，體系最完整，特點是場景多、私有數(shù)據(jù)多。我國應(yīng)精選若干行業(yè)加大投入，形成可低門檻全行業(yè)推廣的范式，如選擇裝備制造業(yè)作為延續(xù)優(yōu)勢代表性行業(yè)，選擇醫(yī)藥業(yè)作為快速縮短差距的代表性行業(yè)。賦能實體經(jīng)濟的技術(shù)難點是AI算法與物理機理的融合。

人工智能技術(shù)成功的關(guān)鍵是能否讓一個行業(yè)或一個產(chǎn)品的成本大幅下降，從而將用戶數(shù)與產(chǎn)業(yè)規(guī)模擴大10倍，產(chǎn)生類似于蒸汽機對于紡織業(yè)，智能手機對于互聯(lián)網(wǎng)業(yè)的變革效果。

我國應(yīng)走出適合自己的人工智能賦能實體經(jīng)濟的高質(zhì)量發(fā)展道路。

（主講人系中國工程院院士，中國科學(xué)院計算技術(shù)研究所研究員、學(xué)術(shù)委員會主任）

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

光大證券：eVTOL純電與混動并行，固態(tài)電池需求迫切

返回每經(jīng)網(wǎng)首頁

下一篇文章

泰達(dá)股份攜投資議案二度闖關(guān)股東大會關(guān)聯(lián)方不再是擬設(shè)立合伙企業(yè)合伙人

相關(guān)文章

熱文精選

點擊排行

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2024 每日經(jīng)濟新聞報社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會征信網(wǎng)

兒童色情信息舉報專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報中心

四川省互聯(lián)網(wǎng)舉報中心

中國互聯(lián)網(wǎng)舉報中心

每日經(jīng)濟新聞互聯(lián)網(wǎng)不良與違法信息舉報中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號：蜀ICP備19004508號-3 川公網(wǎng)安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn