每日經(jīng)濟新聞 2024-05-13 16:28:04
每經(jīng)編輯 黃勝 每經(jīng)實習(xí)編輯 宋欣悅
在科技界萬眾矚目的目光下,OpenAI將于美西時間5月13日上午10點(北京時間14日凌晨1點)拉開其春季更新活動的帷幕,通過線上直播的形式,向全球演示ChatGPT和GPT-4更新的功能。
OpenAI宣布將于5月13日直播演示ChatGPT和GPT-4功能更新 圖片來源:X
盡管公眾對GPT-5的期待高漲,OpenAI 首席執(zhí)行官薩姆·阿爾特曼(Sam Altman)卻在近期訪談中明確表示,下一代語言模型GPT-5及其自主研發(fā)的搜索引擎均不會在此次活動中亮相,這一消息雖令部分期待者略感遺憾,但阿爾特曼對即將展示的ChatGPT與GPT-4升級版信心滿滿。
圖片來源:X
更為引人注目的是,據(jù)彭博社報道,蘋果公司與OpenAI敲定協(xié)議,擬將ChatGPT技術(shù)融入即將面世的iOS 18操作系統(tǒng),此舉無疑將為智能手機領(lǐng)域帶來顛覆性變革。
值得一提的是,近日,阿爾特曼在“All-in Podcast”播客節(jié)目接受了采訪時,聊了很多,從推理運算談到AI的監(jiān)管問題,再到全民基本收入(UBI)的概念,乃至AI交互界面的未來趨勢,甚至還揭秘了一些公司內(nèi)部情況。訪談中,阿爾特曼還展望了未來能與AI加持的iPhone相抗衡產(chǎn)品的可能形態(tài),進一步點燃了科技愛好者對未來智能設(shè)備生態(tài)的好奇與期待。他這番廣泛又深入的交流,讓人忍不住猜想,是不是在為OpenAI即將宣布的更新暗暗鋪墊呢?
阿爾特曼在播客節(jié)目“All-in Podcast”中接受采訪 圖片來源:截圖于Youtube
1.關(guān)于GTP-5的發(fā)布
目前尚未確定具體日期,我們對GPT-5的發(fā)布持謹慎態(tài)度,以確保新模型發(fā)布時能符合我們的高標準。
2.關(guān)于OpenAI內(nèi)部變動
面對被解雇的情況,我當(dāng)時在考慮是否要重返崗位,因為我感到沮喪又迷茫。但隨后我意識到,我對OpenAI以及同事們懷有深厚的感情,于是我決定要回去。
3.關(guān)于開源與閉源模型的未來
我們認為兩者都有其獨特的價值和作用。我們已經(jīng)有計劃在未來開源更多的模型,同時我們也在積極地開發(fā)通用人工智能,并探索如何廣泛地分配其帶來的利益。
4.關(guān)于AI的未來交互方式
我期望擁有的是一種始終處于激活狀態(tài)且極易使用的設(shè)備,它可以通過語音、文字,或者更理想的狀態(tài),通過其他方式理解我的需求。我期望有一個系統(tǒng)能夠全天候地輔助我,盡可能多地收集信息,成為世界上最出色的助理,不斷地幫助我提升自我。
5.關(guān)于人工智能的監(jiān)管
我希望能有一個類似全球監(jiān)管核武器或合成生物學(xué)的國際機構(gòu),來監(jiān)督這些強大的系統(tǒng),并確保它們經(jīng)過合理的安全測試。
6.關(guān)于蘋果
手機目前的卓越性能令人驚嘆,因此要達到一個新的高度,門檻自然非常之高。我個人認為,iPhone是人類歷史上制造出的最偉大的技術(shù)產(chǎn)品之一。它真的是一款非凡的設(shè)備。我之前也提到過,它已經(jīng)非常出色,以至于想要超越它,我們必須設(shè)定一個相當(dāng)高的標準。
阿爾特曼參加播客節(jié)目“All-in Podcast” 圖片來源:截圖于Youtube
問:你們會在何時發(fā)布GPT-5?
阿爾特曼:關(guān)于GPT-5的發(fā)布時間,目前我們還沒有確定一個具體的日期。我們對新模型的推出持謹慎態(tài)度,致力于確保它在發(fā)布時能夠達到我們的高標準。我們正在考慮采用一種新的發(fā)布策略,這可能與以往的方式有所不同。我們對于GPT-5的命名和發(fā)布策略仍在討論之中,但可以肯定的是,我們致力于讓這款新模型在發(fā)布時能夠為用戶帶來卓越的體驗。
問:剛才你談到GPT-5這次的發(fā)布會有點不同,你是不是在想先向付費用戶發(fā)布GPT-5?
阿爾特曼:我們正在努力尋找方法,讓GPT-4這樣的先進模型能夠以免費或低成本的方式提供給更多的用戶。如果我們還沒有找到如何讓用戶免費使用GPT-4的方法,我會非常的難過。這是我們真正想做的事情。
問:你認為開源模型在未來幾年會有什么樣的發(fā)展?
阿爾特曼:在開源和閉源的問題上,我們認為兩者都有其獨特的價值和作用。我們已經(jīng)有計劃在未來開源更多的模型,同時我們也在積極地開發(fā)通用人工智能,并探索如何廣泛地分配其帶來的利益。我們的這一戰(zhàn)略已經(jīng)得到了很多人的認同,盡管它可能并不適合所有人。我們正在構(gòu)建一個龐大的生態(tài)系統(tǒng),其中將包括開源模型以及基于此構(gòu)建的開發(fā)者社區(qū)。
問:你們何時會開發(fā)在手機上運行的開源模型?
阿爾特曼:我不清楚我們是否會這樣,也不清楚是否有人會這樣做。也許Llama 3或Llama 4能夠做到這些。
問:我猜測70億參數(shù)版本的Llama 3模型可能適合在手機上運行。
阿爾特曼:不管這個版本的Llama 3是否針對手機,但我認為它可以在手機上運行。我還不確定,我沒有體驗過它。
問:penAI作為行業(yè)的領(lǐng)先者,需要采取什么措施來維持其在人工智能領(lǐng)域的領(lǐng)先地位?
阿爾特曼:我們正致力于構(gòu)建一個生態(tài)系統(tǒng),它不僅包括先進的人工智能模型,還包括用戶界面、開發(fā)者工具、教育資源和社區(qū)支持等,以確保我們的技術(shù)能夠被廣泛地接受和有效利用。通過這樣的全面方法,我們希望能夠?qū)崿F(xiàn)長期的成功,并在人工智能領(lǐng)域持續(xù)地為社會帶來積極的影響。
問:從開源走向閉源,我想知道你為何最終選擇了這樣的道路?
阿爾特曼:我們發(fā)布ChatGPT的部分原因是向世界展示我們的成果。我們一直在努力傳達一個信息:人工智能真的非常重要。回到2022年10月,當(dāng)時并沒有太多人意識到人工智能的重要性或其即將帶來的影響。我們努力做這件事的一個重要部分是使人們能夠?qū)嶋H使用這項技術(shù)?,F(xiàn)在,實現(xiàn)這一目標有多種不同的方式,我認為這確實起到了非常關(guān)鍵的作用。然而,事實上,目前許多人正在使用免費版的ChatGPT,而我們并沒有進行廣告宣傳,也沒有考慮過盈利的問題。我們推出免費版的ChatGPT,是因為我們希望人們能夠利用這些工具。我認為,這已經(jīng)為人們提供了很多價值,就像是“授人以漁”。我們這么做的原因也是為了讓人們更好地理解整個人工智能行業(yè)的發(fā)展態(tài)勢。至于閉源戰(zhàn)略是否正確,目前我們還沒有標準答案。我們和其他公司一樣,也在探索中前行,并會在學(xué)習(xí)新事物的過程中多次調(diào)整策略。當(dāng)我們創(chuàng)辦OpenAI時,我們并不清楚事情會如何發(fā)展。在我們開發(fā)出第一款語言模型之前,我們甚至還沒有開發(fā)出過任何產(chǎn)品。我們只是一步步地努力探索,穩(wěn)步前進。我們會繼續(xù)這樣做。
問:開源讓每個人都達到一定的閾值,然后就是對數(shù)據(jù)的競爭,是不是這樣?
阿爾特曼:我絕對不認為這將變成一場關(guān)于數(shù)據(jù)的競賽,因為當(dāng)模型變得足夠智能時,它們在某個點上,至少在訓(xùn)練方面,將不再依賴于更多的數(shù)據(jù)。智能只是物質(zhì)的一種突現(xiàn)屬性,它就像物理定律一樣。我相信人們將會理解這一點,但系統(tǒng)設(shè)計將會有多種不同的方法,人們會做出不同的選擇,并提出新的想法。我相信,就像任何其他行業(yè)一樣,人工智能領(lǐng)域也會出現(xiàn)多種不同的方法,不同的人會有不同的偏好。就像有些人喜歡iPhone,有些人喜歡安卓手機一樣,我認為人工智能模型也會呈現(xiàn)類似的多樣性。
問:那么在設(shè)備端的情況如何呢?設(shè)備本身是否也會隨之發(fā)生變化?這些設(shè)備是否也會變得像iPhone那樣昂貴?
阿爾特曼:我對這個話題非常感興趣,并且對計算領(lǐng)域的創(chuàng)新形態(tài)充滿熱情。每一次技術(shù)的重大飛躍似乎都能開啟新的可能性。手機目前的卓越性能令人驚嘆,因此要達到一個新的高度,門檻自然非常之高。我個人認為,iPhone是人類歷史上制造出的最偉大的技術(shù)產(chǎn)品之一。它真的是一款非凡的設(shè)備。我之前也提到過,它已經(jīng)非常出色,以至于想要超越它,我們必須設(shè)定一個相當(dāng)高的標準。
問:不過,你們現(xiàn)在的應(yīng)用已經(jīng)具備了語音功能,實際上,我將手機上的快捷動作按鈕設(shè)置成了直接啟動ChatGPT的語音應(yīng)用。
阿爾特曼:我們將繼續(xù)改進并提升語音功能的質(zhì)量。我相信語音交互是通向未來交互方式的一個重要線索。如果能夠?qū)崿F(xiàn)真正優(yōu)質(zhì)的語音互動體驗,那將是一種與計算機互動的全新方式。
問:關(guān)于計算機視覺領(lǐng)域,是否可以這樣設(shè)想:配備有眼鏡或者佩戴一個掛墜,這樣就能將視覺或視頻數(shù)據(jù)與語音信息相結(jié)合。通過這種結(jié)合,人工智能就能全面掌握你周圍發(fā)生的一切。
阿爾特曼:多模態(tài)交互的能力極其強大,例如,可以提問:“嘿!ChatGPT,我正在看什么?”或者“我不太確定這是什么植物。”這顯然是另一個探索方向。但關(guān)于人們是否愿意佩戴眼鏡,或者在需要時舉起某個設(shè)備來獲取信息,我認為這涉及到許多社會和人際交往方面的復(fù)雜考量,尤其是在面部佩戴計算設(shè)備的問題上。
問:如果人工智能變得在每個人的手機上都無所不在,那么可能會催生哪些應(yīng)用程序呢?你有沒有預(yù)感到可能會發(fā)生什么,或者你希望看到什么樣的應(yīng)用被開發(fā)出來?
阿爾特曼:我期望擁有的是一種始終處于激活狀態(tài)且極易使用的設(shè)備,它可以通過語音、文字,或者更理想的狀態(tài),通過其他方式理解我的需求。我設(shè)想有一個系統(tǒng)能夠全天候地輔助我,盡可能多地收集上下文信息,成為世界上最出色的助理,不斷地幫助我提升自我。人工智能不是用戶的簡單延伸,而是一個始終可訪問、始終卓越、能力超群的助理或高管。
問:智能體在某種程度上就像是你的代表,它能夠理解你的需求,并且預(yù)測你的意圖,這正是我對你所述內(nèi)容的解讀。
阿爾特曼:智能體不只是機械地執(zhí)行命令,它能夠進行推理,是的,它具備推理能力。智能體與我之間的關(guān)系,是我所期待的那種與真正有能力的同事之間的互動,這與那些只會盲目遵從的人不同。
問:在這樣一個由智能體代表80億人進行交互的世界里,我們對應(yīng)用程序的工作方式和整個體驗架構(gòu)的思考需要如何轉(zhuǎn)變?
阿爾特曼:我對打造一個既適合人類也適合人工智能使用的世界的構(gòu)想非常感興趣。我青睞于這種設(shè)計的可解釋性、任務(wù)交接的流暢性,以及我們提供反饋的能力。
問:所以你意識到,語音交互這種方式有潛力使得傳統(tǒng)應(yīng)用變得多余。你只需簡單地說出你想要壽司,它就能根據(jù)你以往的喜好來推薦你喜歡的壽司類型,同時避免那些你不喜歡的選項,并努力為你提供最佳的點餐體驗。
阿爾特曼:我很難想象我們完全進入一個只需簡單地說“嘿,ChatGPT,給我訂份壽司”,然后它回應(yīng)“好的,你想從哪家餐館訂?要哪種類型的壽司?什么時間送達?”等等的世界。我相信用戶界面對于許多任務(wù)來說都是非常有用的。我很難想象一個你完全不再看屏幕,而只依賴語音交互的世界,但我確實難以想象那樣的場景。
問:確實如此。對于許多事物來說是這樣的。比如,蘋果推出了Siri,按理說我們可以通過Siri來自動預(yù)約Uber,但我懷疑實際上很少有人這么做。畢竟,為什么要冒這個險呢?正如你所指出的,因為目前語音助手的服務(wù)質(zhì)量還不夠高。然而,一旦服務(wù)質(zhì)量足夠高,我認為人們真的會更傾向于使用語音助手,因為它更加便捷。你不需要拿出手機,不需要打開應(yīng)用,不需要點擊任何東西。如果遇到應(yīng)用自動登出,或者需要重新登錄,或者進行雙因素認證(TFA)的情況,整個過程就變得非常繁瑣和令人煩惱。
阿爾特曼:我明白,對于像設(shè)置計時器這樣簡單的任務(wù),我總是使用Siri,因為它非常有效且方便,我也不需要其他額外的信息。然而,對于像叫Uber這樣的服務(wù),我可能想要比較幾種不同選項的價格,了解車輛距離我的實際遠近,甚至查看司機在地圖上的實時位置,因為有時候我可能會選擇步行到某個更方便的地點。通過直接在Uber應(yīng)用的界面上操作,我可以更快地獲取這些詳細信息,這比通過語音指令來完成整個過程要高效得多。
問:在所有利用OpenAI平臺開發(fā)應(yīng)用和體驗的開發(fā)者中,是否有一些項目給您留下了深刻印象?或者說,是否有一些成果是你的團隊特別指出并認為具有重要意義的?
阿爾特曼:我今天早上遇到了一個新建的創(chuàng)業(yè)團隊,嚴格來說是由兩個人組成。他們計劃在夏季開展一個項目,致力于開發(fā)人工智能導(dǎo)師功能。我對這一領(lǐng)域一直抱有濃厚興趣,盡管許多人已經(jīng)在我們的平臺上取得了杰出成果,但如果能夠有人實現(xiàn)--正如他們所形容的,這將是一次“單軌列車級別”的創(chuàng)新--徹底改變我們學(xué)習(xí)的方式,那將是非常令人興奮的。如果能夠找到一種新的途徑,讓人們能夠以個性化的方式探索和學(xué)習(xí),我個人對這樣的前景感到非常激動。你之前提到的與編碼相關(guān)的許多事項,我認為這是對未來的一個非??岬恼雇?。我相信醫(yī)療保健是一個特別需要被徹底革新的領(lǐng)域。但就個人而言,我最感到興奮的是加速和改進科學(xué)發(fā)現(xiàn)過程的可能性。雖然GPT-4顯然還未在這方面實現(xiàn)重大突破,但它或許已經(jīng)在一定程度上加快了進程,提升了科學(xué)家的工作效率。
問:這些模型與語言模型在訓(xùn)練和構(gòu)建上有所區(qū)別。雖然它們之間存在許多共同點,但也存在許多差異。這些模型中的許多都是基于一種全新的基礎(chǔ)架構(gòu)設(shè)計的,它們專門針對特定的問題集或應(yīng)用場景,例如化學(xué)相互作用的建模。是這樣嗎?
阿爾特曼:確實,某些元素是必不可少的,但我認為我們當(dāng)前普遍缺失的,對于我們討論的眾多應(yīng)用而言,是具備推理能力的模型。一旦模型能夠進行推理,便可以將它們與化學(xué)仿真器等工具相結(jié)合,或者用于進行預(yù)測和假設(shè)。
問:確實,我今天想探討的一個關(guān)鍵話題是模型網(wǎng)絡(luò)的理念。在討論智能體時,人們往往會想到一系列線性的函數(shù)調(diào)用,但在生物學(xué)中,我們觀察到的是系統(tǒng)之間復(fù)雜的網(wǎng)絡(luò)和相互作用。這些系統(tǒng)通過集合和網(wǎng)絡(luò)的整合作用產(chǎn)生結(jié)果,而不僅僅是簡單的線性調(diào)用。我們是否正處于這樣一個架構(gòu)的興起之中:專業(yè)模型或網(wǎng)絡(luò)模型相互協(xié)作,共同解決更復(fù)雜的任務(wù)集,運用推理能力,其中一些計算模型專注于化學(xué)或算術(shù)運算,而其他模型則承擔(dān)不同的職責(zé)。這種架構(gòu)避免了依賴單一的、全知全能的模型來處理所有問題。
阿爾特曼:我不確定推理能力最終能否成為一種廣泛適用的功能。我有這樣的預(yù)感,并且希望它是,如果真的能夠?qū)崿F(xiàn),那將是非常理想的。不過,我并不確定它是否真的會如此。
問:我想知道,是否真的所有這些初創(chuàng)公司都會失???目前許多初創(chuàng)公司都在采取這樣的策略:收集特定的數(shù)據(jù),接著基于這些數(shù)據(jù)全新訓(xùn)練一個模型,該模型專門針對某一任務(wù)進行優(yōu)化,并且在這一任務(wù)上的表現(xiàn)超過了其他所有解決方案。
阿爾特曼:某種程度上,正如我們在討論生物學(xué)和那些復(fù)雜的系統(tǒng)網(wǎng)絡(luò)時所指出的,我已經(jīng)能夠窺見一二。我之所以會笑,是因為最近我經(jīng)歷了一場嚴重的疾病,現(xiàn)在已大致康復(fù),但整個過程就像是身體系統(tǒng)逐一受到打擊。你真的可以明確指出,比如,這是消化系統(tǒng)的問題。這讓我想起了我們之前討論的,你不知道這些系統(tǒng)之間相互作用的復(fù)雜性,直到出現(xiàn)問題,這本身是一個非常有趣的現(xiàn)象。同時,我嘗試使用ChatGPT來理解我的病情。我可能會說,我對某個問題不太確定。接著,我會在沒有閱讀的情況下,把相關(guān)的論文鏈接放入上下文中,然后發(fā)現(xiàn),哦,這就是我不確定的那個問題,現(xiàn)在我認為應(yīng)該是這樣。這就是你之前提到的一個例子,你可以說,我不知道這個信息,然后你可以添加更多的上下文信息,而不是重新訓(xùn)練整個模型,你只需要即時地增加上下文,然后你就能得出一個結(jié)論。
問:這些用于預(yù)測蛋白質(zhì)結(jié)構(gòu)的模型,比如說,構(gòu)成了這個領(lǐng)域的基石?,F(xiàn)在,我好奇的是,Alpha 3是否能夠處理其他分子類型的預(yù)測?如果可以,那么理論上最好的通用模型將能夠接入、學(xué)習(xí)訓(xùn)練數(shù)據(jù),并自主解決問題?;蛟S你可以為我們舉一個例子來闡釋這個過程。你能和我們談?wù)凷ora嗎?你的視頻模型能夠生成令人驚嘆的動態(tài)圖像和視頻。你愿意分享的話,能不能告訴我們它的架構(gòu)有何獨特之處,以及它是如何區(qū)別于其他模型的?
阿爾特曼:確實,對于一般性問題,我們顯然需要專業(yè)的模擬器、連接器和各種數(shù)據(jù)片段等工具。我有一種直覺--盡管我得強調(diào)這并沒有科學(xué)依據(jù)--如果我們能夠理解通用推理的精髓,并將這一原理應(yīng)用到新的問題領(lǐng)域,類似于人類的通用推理能力,我認為這是可以實現(xiàn)的。這可能會是一個快速的突破過程,至少我是這么認為的。至于Sora,它并不是以語言模型為基礎(chǔ),而是專門針對視頻處理而設(shè)計的模型。
問:顯而易見,我們還未能完全實現(xiàn)那樣的技術(shù)境界,對吧?以構(gòu)建高效視頻模型為例,你們可能是從零開始,采用獨特的架構(gòu)和特定的數(shù)據(jù)集進行開發(fā)。然而,展望未來,一個具備通用推理能力的系統(tǒng)--也就是我們所說的人工通用智能--理論上應(yīng)該能夠通過自我學(xué)習(xí)和邏輯推理,掌握渲染視頻的方法。
阿爾特曼:我想說的是,以一個例子來看,據(jù)我所了解,目前全球最優(yōu)秀的文本模型大多還是基于回歸的方法構(gòu)建的。與此同時,頂尖的圖像和視頻模型則采用了擴散模型技術(shù),這種情況在某種程度上顯得有些不尋常。
問:圍繞訓(xùn)練數(shù)據(jù)的使用,存在廣泛爭議。你們一直采用合理使用原則和尊重創(chuàng)作者權(quán)利的方式來處理問題,但為何OpenAI選擇不涉足音樂產(chǎn)業(yè)?
阿爾特曼:以音樂為例,如果有人要求模型創(chuàng)作一首泰勒·斯威夫特(Taylor Swift)風(fēng)格的歌,即使該模型從未在泰勒·斯威夫特的歌曲上進行過訓(xùn)練,我們?nèi)匀幻媾R一個挑戰(zhàn):模型可能已經(jīng)了解了關(guān)于泰勒·斯威夫特的信息和她的音樂主題。這就引出了一個問題:即使沒有直接訓(xùn)練,模型是否應(yīng)該被允許模仿她的風(fēng)格?如果可以,那么泰勒·斯威夫特應(yīng)如何獲得報酬?在這種情況下,我認為首先應(yīng)該有選擇加入或退出的機制,然后建立一個經(jīng)濟模型來處理這些問題。從音樂產(chǎn)業(yè)的采樣歷史中,我們可以找到一個有趣的視角,來觀察這種經(jīng)濟模式是如何運作的。這雖然和人工智能創(chuàng)作不完全相同,但為我們提供了一個思考的起點。
問:你是否能夠接受這樣的情況:一個音樂模型在未向創(chuàng)作了這些音樂作品的藝術(shù)家支付版稅的前提下,自主地通過人類創(chuàng)作出的所有音樂作品庫進行訓(xùn)練。接著,你不被允許提出特定藝術(shù)家的請求,而是可以這樣要求:“請為我播放一首相當(dāng)現(xiàn)代的、關(guān)于心碎的流行歌曲,最好是女聲演唱的。”
阿爾特曼:我們已經(jīng)決定暫時不進入音樂產(chǎn)業(yè),部分原因在于圍繞如何界定使用界限的復(fù)雜問題。
問:你看到蘋果最近發(fā)布的廣告了嗎?它將人類的所有創(chuàng)造力凝練在一臺非常薄的iPad中。你對這有什么看法?
阿爾特曼:人們對此產(chǎn)生了非常情感化的反應(yīng),比你想象的要強烈得多。我本人對人工智能持非常積極的態(tài)度,但我相信人類創(chuàng)造力和藝術(shù)表達中有些東西是非常寶貴的。對于能夠提升科學(xué)研究的人工智能,我們當(dāng)然歡迎。然而,當(dāng)涉及到能夠進行深刻而美妙的人類創(chuàng)造性表達的人工智能時,我認為我們應(yīng)該審慎行事。這種技術(shù)的發(fā)展是不可避免的,它將成為幫助我們達到更高層次創(chuàng)造力的工具,但在這個過程中,我們應(yīng)該找到一種方式,既能推動技術(shù)發(fā)展,又能保持我們所珍視的創(chuàng)造性精神。
問:當(dāng)討論到人工智能的監(jiān)管以及在一個由人工智能主導(dǎo)的世界中實施全民基本收入時,有人提倡“全面監(jiān)管人工智能”。這究竟指的是什么?你是否能夠就加州最近提出的監(jiān)管提案分享一些看法?
阿爾特曼:我對目前的情況有些憂慮。雖然我注意到有許多關(guān)于人工智能的監(jiān)管提案正在討論中,但就我個人所見,加州的許多提案引起了我的擔(dān)憂。同時,我普遍擔(dān)心如果每個州都獨立進行人工智能的監(jiān)管工作。當(dāng)討論到“監(jiān)管人工智能”時,我認為人們的想法并不統(tǒng)一。有些人可能主張完全禁止人工智能的發(fā)展,而另一些人則可能堅持認為人工智能應(yīng)當(dāng)是開源的,而不是封閉的。我個人特別關(guān)注的是,我相信在不遠的將來,我們可能會面臨一個時刻--我得承認,這只是一個前瞻性的聲明,做出此類預(yù)測總是伴隨著風(fēng)險--我的預(yù)測是,在不久的將來,一些先進的人工智能系統(tǒng)將有能力造成嚴重的全球性傷害。對于這些系統(tǒng),我希望能有一個類似全球監(jiān)管核武器或合成生物學(xué)的國際機構(gòu),來監(jiān)督這些最強大系統(tǒng),并確保它們經(jīng)過合理的安全測試,以防止它們失控、自我遞歸改進或其他類似的風(fēng)險。
問:如果你擁有制造核武器的核材料,這通常只限于少數(shù)人所持有,因此,可以將這種情況比作需要核檢查的類比。
阿爾特曼:確實,我覺得這個觀點很有趣。關(guān)于監(jiān)管問題,我想補充一點,我非常擔(dān)心監(jiān)管可能會過度。我相信,無論是做過了頭還是僅僅做過了一點點,我們都可能會犯錯。同樣,如果我們做得不夠,也可能出錯。但我真的認為,我們有責(zé)任也有使命去討論我們認為可能會發(fā)生的事情,以及為了正確處理這些事情我們需要做些什么。
問:挑戰(zhàn)在于,我們現(xiàn)有的法規(guī)本意是保護人民和整個社會,但我們正在面臨一種新類型的法規(guī),這種法規(guī)可能會賦予政府審查代碼和商業(yè)機密的權(quán)力,這是我們以前從未遇到過的。我認為,這些立法者對人工智能的理解可能還很有限。正如你所知,甚至比任何人都清楚,隨著技術(shù)的快速發(fā)展,這些法規(guī)在一年后可能就會變得不再適用。
阿爾特曼:我之所以提倡采取基于機構(gòu)的方法來處理宏觀層面的問題,而不是將這些寫入法律,是因為我認為在12個月后,這些法律可能都會被證明是不正確的。即使這些立法者是世界級的專家,我也懷疑他們能否在12個月或24個月的時間框架內(nèi)做出正確的決策。我不相信那些政策,比如我們要審查你的所有源代碼,逐一檢查你的所有權(quán)重,是的,我認為市面上有很多不切實際的提議。但是,就像飛機在獲得認證前需要經(jīng)過一系列的安全測試一樣,這與閱讀你所有的代碼完全不同,我們更應(yīng)該審查模型的輸出結(jié)果,而不是模型的內(nèi)部細節(jié)。我想說的是,我認為進行安全測試是有意義的。
問:我們怎樣才能達到那個目標呢?你認為這種方法是否能夠正確解決問題,或者你對這個問題有何看法?
阿爾特曼:我認為GPT-4并不會構(gòu)成實質(zhì)性的威脅,并且有許多安全的方式來發(fā)布這樣的模型。但你也了解,當(dāng)涉及到可能導(dǎo)致大量人員傷亡的情況時,比如飛機或其他許多例子,我們很樂意有一套測試框架來確保安全。當(dāng)我登上飛機時,我通常不會擔(dān)心它的安全性,因為我假定它是安全的,對吧?現(xiàn)在,人們對此有很多不必要的擔(dān)憂。
問:你能解釋一下為什么決定啟動全民基本收入項目嗎?你的初衷是什么?
阿爾特曼:我相信,金錢雖然不能解決所有問題,也不會讓人即刻感到幸福,但它可能能解決一些問題,可能為人們提供一個更好的起點,幫助他們自助,我對這樣的前景非常感興趣。現(xiàn)在,隨著我們看到人工智能的發(fā)展方式,我在思考,是否有比傳統(tǒng)的全民基本收入(UBI)更好的做法。我在想,未來可能不僅僅是關(guān)于全民基本收入,而更像是全民基本計算資源。例如,每個人都可以獲得一定量的GPT-7計算能力,他們可以使用它,可以將其轉(zhuǎn)售,或者捐贈給其他人用于癌癥研究等。但你所獲得的不是金錢,而是相當(dāng)于一部分生產(chǎn)力的份額,你擁有的是生產(chǎn)力的一部分。
問:你曾經(jīng)被解雇,卻又回來了,那是一場內(nèi)部的權(quán)力斗爭嗎?有沒有人背叛了你?
阿爾特曼:我遭遇了被解雇的情況,當(dāng)時我在考慮是否返回崗位,因為那時我感到非常沮喪,有些迷茫。但隨后我意識到,我對OpenAI以及那里的同事們懷有深厚的感情,我決定要回去。我明白重返崗位將會面臨挑戰(zhàn),實際上,這個過程比我預(yù)想的更加艱難,但我覺得可以應(yīng)對。我同意重返OpenAI。在酒店房間里,我?guī)仔r都處于一種徹底的困惑狀態(tài),努力想弄清楚下一步該怎么辦。然后事情變得非常奇怪。最終,盡管中間經(jīng)歷了許多瘋狂的時刻,但事情得到了解決。OpenAI當(dāng)時只有一個非營利董事會,因此所有的董事會成員都是獨董。董事會的成員數(shù)量已經(jīng)減少到了六個人。他們先是讓時任董事長兼總裁格雷格·布洛克曼(Greg Brockman)離開了董事會,隨后又解雇了我。情況就是這樣。
問:我的意思是,是否在董事會中,那些只具有非營利組織背景的成員與那些具有初創(chuàng)公司經(jīng)驗的成員之間發(fā)生了文化沖突?如果你愿意,你能否分享一些關(guān)于導(dǎo)致這些決策背后的動機的信息,或者是任何你愿意透露的細節(jié)。
阿爾特曼:我總是認為文化沖突是不可避免的。顯然,并非所有董事會成員都是我特別喜愛的人,但我對他們對待人工通用智能的嚴肅態(tài)度以及對確保人工智能安全重要性的認識持有深深的敬意。盡管我對他們某些決策和行為持有強烈的異議——我確實有這樣的異議——但我從未對他們的誠信或?qū)ξ覀児餐繕说某兄Z,也就是實現(xiàn)安全且有益的通用人工智能感到懷疑。
問:你是否認為他們在處理過程中做出了正確的決策,或者是否知道如何平衡所有需要妥善處理的事務(wù)?
阿爾特曼:我并不這么認為。但我確實相信,他們的意圖是真誠的,他們對通用人工智能的重視以及對正確處理這項技術(shù)的承諾是認真的。
問:我想詢問有關(guān)OpenAI的使命,其明確的目標是開發(fā)人工通用智能。這確實是一個非常有趣的目標。這樣的使命是否為您所從事的工作帶來了更多的擔(dān)憂?我理解,它同樣也能激發(fā)動力,但您是如何平衡這兩者的?您為什么會選擇這樣的使命?
阿爾特曼:我首先會回答第一個問題,然后是第二個問題。我認為,人工通用智能的發(fā)展確實引起了廣泛的恐懼,這是可以理解的,因為許多人對當(dāng)前的人工智能,乃至未來的AGI都感到害怕。盡管如此,他們對人工智能目前的發(fā)展感到興奮,對未來的可能性感到更加興奮,盡管這種興奮伴隨著更深的憂慮。我們正在努力應(yīng)對這些復(fù)雜的情感,但我認為通用人工智能的出現(xiàn)是不可避免的,它終將實現(xiàn)。我相信,盡管如此,它將帶來巨大的益處。然而,我們確實需要找到一種合理的方式來引導(dǎo)我們走向這一未來。將會有很多變化發(fā)生,而變化往往讓人們感到不適,所以我們需要在很多方面做出正確的決策和調(diào)整。
問:你是一位杰出的交易者。我見證了你整個職業(yè)生涯,你在交易方面的確非常出色。你擁有廣泛的人脈,而且在籌資方面技藝高超,成效顯著。你在投資界的動作,以及你所參與的公司籌集了巨額資金來建設(shè)芯片廠等事宜,所有這些都顯示了你的實力。不過,這里稍微夸張了一點,我們都知道,你并非真的籌集了7萬億美元,那可能是某公司的市值。暫且不提這些,問題在于,盡管你完成了眾多交易,但有人對你缺乏信任,這究竟是為什么?你的動機何在?你追求的最終目標是什么?哪些機遇應(yīng)當(dāng)保留在OpenAI內(nèi)部,而哪些可以歸屬于你個人?是不是因為那些非營利組織的人對你有所懷疑?
阿爾特曼:關(guān)于設(shè)備公司或芯片制造公司的項目,這些并不是我個人的項目,而是OpenAI的項目。相應(yīng)的,OpenAI將會獲得相關(guān)股權(quán)。我理解外界可能會有這樣的看法,尤其是那些不需要日常評論這些事務(wù)的人。這是公平的,因為我們還沒有宣布這些事項,它們尚未完成。我并不認為世界上大多數(shù)人會像你們這樣深入思考這些問題。我也認同,這種情況確實容易引發(fā)眾多陰謀論,特別是在科技評論家中。如果能回到過去,我會更加明確地表達我持有股份的意圖,并確保這一點非常清晰。這樣,每個人都能理解,盡管如此,我依然會投身于其中,因為我深切關(guān)心通用人工智能,并相信這是全球最引人入勝的工作。至少,這樣做可以向所有人清楚地傳達芯片項目的本質(zhì)。
每日經(jīng)濟新聞綜合公開資料
封面圖片來源:每日經(jīng)濟新聞 資料圖
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP