四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟(jì)新聞
輪播

每經(jīng)網(wǎng)首頁(yè) > 輪播 > 正文

Sam Altman:GPT-4o幕后揭秘,GPT-5會(huì)很特別

AIGC開(kāi)放社區(qū) 2024-05-17 08:33:00

5月16日,OpenAI首席執(zhí)行官Sam Altman接受了,硅谷著名風(fēng)險(xiǎn)投資公司紅點(diǎn)(Redpoint)的董事兼總經(jīng)理Logan Bartlett專訪。

本周二,OpenAI重磅發(fā)布了可跨文本、視頻、音頻推理的多模態(tài)大模型GPT-4o,其多元化的玩法、低延遲以及擬人化的聲音,讓11年前的科幻電影《Her》成為現(xiàn)實(shí),人人都能擁有一個(gè)超強(qiáng)語(yǔ)音AI助手,似乎人類離AGI又更近了一步。

圖片來(lái)源:視覺(jué)中國(guó)-VCG31N2008743681

 

下面,「AIGC開(kāi)放社區(qū)」根據(jù)這部46分鐘的專訪視頻,以問(wèn)答和解讀的方式為大家整理所有主要關(guān)鍵內(nèi)容,深度了解GPT-4o以及未來(lái)將發(fā)布的GPT-5,那就讓我們開(kāi)始吧。

Bartlett:GPT-4o可以跨文本、視頻、音頻進(jìn)行推理,這很重要嗎?

Altman:確實(shí),我很早之前就有用語(yǔ)音控制計(jì)算機(jī)的想法,這是一種前所未有的綜合推理模式。

語(yǔ)音助手有很多,例如,蘋果的Siri但用起來(lái)非常不自然,機(jī)器味很濃,并且在語(yǔ)義理解方面也不是很好。所以,我想改變這一現(xiàn)狀。

Bartlett:GPT-4o哪些用例讓你感到很驚訝?

Altman:在發(fā)布GPT-4o之前,我體驗(yàn)了一周左右的時(shí)間,其中有一個(gè)用例是讓我很驚喜的。

我只需要把手機(jī)放在桌子上與GPT-4o對(duì)話,就能完成很多之前需要頻繁切換應(yīng)用、瀏覽器才能完成的工作,就像不停地切換谷歌瀏覽器標(biāo)簽?zāi)菢印?/p>

所有的工作內(nèi)容都可以快速為你在一個(gè)平臺(tái)中呈現(xiàn)出來(lái),這對(duì)于依賴保持專注和效率的開(kāi)發(fā)人員和專業(yè)人士來(lái)說(shuō)是一個(gè)巨大的改變。

Bartlett:GPT-4o擁有如此特別的能力,你們做了哪些改變和嘗試?

Altman:過(guò)去幾年我們一直在研究音頻、視頻大模型,以及如何通過(guò)一種更高效的方法來(lái)訓(xùn)練、結(jié)合它們。

所以,GPT-4o的出現(xiàn)不是偶然,也不是最近才做的決定,而是很多年的技術(shù)沉淀和積累的結(jié)果,這是一種必然會(huì)出現(xiàn)的產(chǎn)品。

Bartlett:GPT-4o的低延遲,對(duì)于用戶來(lái)說(shuō)意味著什么?

Altman:GPT-4o的平均延遲只有200—300毫秒左右,這種交互效率在之前是無(wú)法想象的,也極大拓寬的了應(yīng)用場(chǎng)景。

例如,可以幫助人們進(jìn)行實(shí)時(shí)翻譯、語(yǔ)音交互和視頻分析等,眼睛有障礙的人通過(guò)GPT-4o可以實(shí)現(xiàn)重現(xiàn)“光明”;

而聽(tīng)力受損的用戶可以基于文本和視覺(jué)功能完成日常交流;醫(yī)生可以使用GPT-4o實(shí)時(shí)解析醫(yī)學(xué)圖像、轉(zhuǎn)錄患者數(shù)據(jù)以及分析醫(yī)療記錄中的文本數(shù)據(jù)

所以,醫(yī)學(xué)領(lǐng)域?qū)⑹荊PT-4o最大受益群體之一。

Bartlett:OpenAI下一步的重要產(chǎn)品是GPT-5嗎?會(huì)使用更新穎的架構(gòu)、功能嗎?

Altman:我們現(xiàn)在暫時(shí)可以稱它為GPT-5,但發(fā)布的時(shí)候會(huì)很特別,可能會(huì)換一種叫法,功能也與現(xiàn)在的有很大不同。

例如,從OpenAI發(fā)布GPT-1到現(xiàn)在的GPT-4,產(chǎn)品功能和叫法都是比較偏傳統(tǒng)的。

到真正發(fā)布GPT-5時(shí),可能名字會(huì)變,功能可能類似“虛擬大腦”一樣去幫助用戶處理各種任務(wù),將是一種非常特別的嘗試。

Bartlett:開(kāi)源大模型領(lǐng)域正在追趕、超越,對(duì)此你有何看法?

Altman:非常好,他們做的不錯(cuò),正在將一些領(lǐng)先的源代碼分享給不同的群體。

Bartlett:未來(lái)的12個(gè)月,哪些應(yīng)用程序領(lǐng)域最有前途?

Altman:編程領(lǐng)域,當(dāng)然,這代表了我個(gè)人的偏見(jiàn),但確實(shí)是這樣的。

Bartlett:《華爾街日?qǐng)?bào)》曾報(bào)道過(guò),你要花一大筆錢打造AI芯片廠與英偉達(dá)等展開(kāi)競(jìng)爭(zhēng),真的有這個(gè)必要嗎?

Altman:首先,我有信心找到降低訓(xùn)練、推理等與AI相關(guān)的開(kāi)發(fā)成本,但這需要巨大的算力支撐;其次,我希望將生成式AI技術(shù)分享給全人類使用,這對(duì)算力有巨大的需求;

第三,只有更多的人使用AI,才能為其提供實(shí)時(shí)反饋,實(shí)現(xiàn)功能上的迭代閉環(huán)。而算力是做這三件事的重要基礎(chǔ)。

Bartlett:人們一直在談?wù)揂GI,它到底是什么樣子的?現(xiàn)在來(lái)看好像這個(gè)概念還是比較抽象的,你是如何看待AGI的?

Altman:很多人會(huì)覺(jué)得AGI會(huì)像電影《星球大戰(zhàn)》里的浮空車那樣充滿科幻感。其實(shí),我覺(jué)得AGI就是可以幫助用戶自動(dòng)處理、協(xié)調(diào)好所有工作。例如,這個(gè)工作之前需要100人來(lái)做,現(xiàn)在通過(guò)AGI一個(gè)人就能做好。

Altman還談到了他在YC時(shí)的投資心得、企業(yè)成長(zhǎng)以及對(duì)其他產(chǎn)品、項(xiàng)目的看法,有興趣的小伙伴可以查看文章中的原采訪視頻。

封面圖片來(lái)源:視覺(jué)中國(guó)-VCG31N2008742366

責(zé)編 張喜威

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0