每日經(jīng)濟(jì)新聞 2024-05-16 23:38:58
每經(jīng)記者 可楊 每經(jīng)編輯 張海妮
不是萬眾期待的AI搜索,競爭焦點突然轉(zhuǎn)向了AI智能助手。
近期,OpenAI推出了全能模型GPT-4o,它能夠接受多種方式輸入的內(nèi)容并生成相應(yīng)的輸出內(nèi)容,展示了毫秒級反應(yīng)和多模態(tài)交互的新能力。與此同時,谷歌在其I/O開發(fā)者大會上展示了其AI助手Astra和旗艦大模型Gemini。
視覺中國圖
一些業(yè)內(nèi)人士認(rèn)為,OpenAI此次并沒有達(dá)到市場預(yù)期的突破,而是將現(xiàn)有的技術(shù)進(jìn)行了整合。此外,谷歌在AI搜索領(lǐng)域的布局和創(chuàng)新,以及其在智能手機(jī)操作系統(tǒng)優(yōu)化上的努力,顯示了其在AI領(lǐng)域的深厚積累和戰(zhàn)略布局。
比賽行至白熱化階段,似乎已經(jīng)告別了單純的技術(shù)競爭,更是應(yīng)用和用戶體驗的競爭。當(dāng)影響因素變得復(fù)雜,專注投入大模型前沿的OpenAI還有多大幾率成為贏家?
突襲谷歌,OpenAI先一步公布AI個人助理
預(yù)想之中圍繞AI搜索的“戰(zhàn)爭”沒有打響,焦點轉(zhuǎn)移到了AI智能助手上。
當(dāng)?shù)貢r間5月13日,OpenAI在谷歌I/O 開發(fā)者大會的前一天召開發(fā)布會,發(fā)布了最新產(chǎn)品GPT-4o,“o”即omni,意為“全能”。OpenAI官網(wǎng)介紹,GPT-4o是邁向更自然人機(jī)交互的一步,因為它接受文本、音頻和圖像的任意組合作為輸入內(nèi)容,并生成文本、音頻和圖像的任意組合輸出內(nèi)容。
OpenAI首席技術(shù)官米拉·穆拉蒂在發(fā)布會上表示,GPT-4o的速度比現(xiàn)有的GPT-4 Turbo快了兩倍,但成本僅為其一半。GPT-4o可以實時對文本、音頻和圖像進(jìn)行推理,響應(yīng)時間幾乎達(dá)到人類水平。
在26分鐘的直播中,GPT-4o展示了其毫秒級反應(yīng)、識別人類情緒進(jìn)行音視頻交互,可多模態(tài)輸入/輸出等一系列新能力。與此同時,GPT-4o覆蓋桌面與App且完全免費向用戶提供。
而谷歌則在其I/O開發(fā)者大會上,展示了自身全能的AI能力,在會上連續(xù)發(fā)布、更新了十多款產(chǎn)品,包括AI助手Astra、文生圖模型Imagen3、對標(biāo)Sora的文生視頻模型Veo,以及旗艦大模型Gemini。
在谷歌的演示視頻中,使用AI助手Astra時,只要打開手機(jī)攝像頭,對準(zhǔn)任意物品,AI可以準(zhǔn)確說出物品的名稱。只要將手機(jī)攝像頭對準(zhǔn)某個物體,Gemini就可以識別它,比如一個紅蘋果,還可以回答諸如“鏡頭中什么東西是可以發(fā)聲的”這種問題。
此外,谷歌方面表示,夏季將擴(kuò)展Gemini的多模態(tài)功能,包括增加用語音進(jìn)行深入雙向?qū)υ挼哪芰Γ摴δ鼙环Q為Live。通過GeminiLive,用戶可以與Gemini交談,并可以從各種自然的聲音中選擇它回應(yīng)的聲音。用戶甚至可以按照自己的節(jié)奏說話,或者在回答過程中打斷并澄清問題,就像在任何人類對話中一樣。
據(jù)彭博社報道,近日,蘋果公司被曝正與OpenAI敲定一項協(xié)議,今年將后者的部分技術(shù)引入iPhone。而在本次發(fā)布會上,谷歌產(chǎn)品管理副總裁Sameer Samat明確表示,谷歌將通過Gemini進(jìn)一步優(yōu)化安卓操作系統(tǒng)。這種優(yōu)化將首先在谷歌自家手機(jī)Pixel上得到體現(xiàn)。
GPT-5缺席,OpenAI降速?
對于OpenAI的突襲更新,行業(yè)不再是統(tǒng)一的贊嘆。“發(fā)布會雖然驚艷,但谷歌看完應(yīng)該是不慌了。”獵豹移動董事長兼CEO、獵戶星空董事長傅盛在其個人微博表示。
在5月14日發(fā)布的短視頻中,傅盛談及“所有國內(nèi)人工智能從業(yè)者都在熬夜等著大洋彼岸放‘核彈’,但是沒想到‘核彈’沒有放,卻掏出了一堆‘摔炮’”。他表示,讓人失望的是這次OpenAI沒有發(fā)布GPT-5.0,連GPT-4.5也沒有看到,反而是發(fā)布了GPT-4o,“就是把一系列的引擎給結(jié)合在一起,比如圖片、文字、聲音,這樣你就不需要來回去切換了”。
不過,傅盛后續(xù)也表示:“OpenAI這次為了能夠讓更多的用戶使用它,可以說是鉚足了勁,一系列的應(yīng)用,API降價,GPT免費。我們當(dāng)然希望OpenAI能夠使得這個行業(yè)更好發(fā)展,我們也能認(rèn)真地去學(xué)習(xí),這次的發(fā)布會真正告訴我們應(yīng)用大有可為,所有人都應(yīng)該努力。”
“GPT-4o出來,又比原來進(jìn)步一大截,它(OpenAI)每次一升級就會‘死’一些公司,這次一些做GPT實時語音交互的團(tuán)隊,直接可以宣布解散了。”GPT-4o發(fā)布的第二天,一名大模型行業(yè)創(chuàng)業(yè)者對《每日經(jīng)濟(jì)新聞》記者感嘆道。
清華大學(xué)新聞學(xué)院元宇宙文化實驗室主任沈陽同樣在第二天試用了GPT-4o,在其發(fā)布的視頻號中提到,在文生圖層面,GPT-4o在毛發(fā)細(xì)膩度、光影效果等細(xì)節(jié)上更加優(yōu)異。
隨著雙方在智能助手上的對碰,沈陽認(rèn)為,當(dāng)前的競爭格局已經(jīng)更加明晰,谷歌正在進(jìn)一步推其基于Gemini的AI助手,蘋果公司與OpenAI也初步達(dá)成了合作,將在蘋果手機(jī)上搭載ChatGPT。
沈陽表示,以本次發(fā)布會作為轉(zhuǎn)折點,ChatGPT被改造成了靈魂伴侶,所以產(chǎn)業(yè)格局已經(jīng)明晰了,就是蘋果用內(nèi)置的ChatGPT對抗谷歌Gemini的手機(jī)助手。Meta也將上線基于Llama的手機(jī)助手。對于產(chǎn)業(yè)來說,AI助手有望從1億量級的用戶量走向10億量級。
“GPT-4o,發(fā)布的時候我覺得它很強(qiáng)大,但如今我覺得谷歌最新的產(chǎn)品也完全把它的這些成績趕上了,我覺得后面OpenAI應(yīng)該更加緊張,因為應(yīng)用公司、超級大平臺公司全部趕上來了,它的優(yōu)勢越來越少。”順福資本創(chuàng)始人、行行AI董事長李明順對《每日經(jīng)濟(jì)新聞》記者表示,目前來看OpenAI的用戶增長已經(jīng)不太明顯,技術(shù)領(lǐng)先和成本優(yōu)勢都不一定是最佳,與此同時,強(qiáng)應(yīng)用時代越來越快到來,在這個背景下,谷歌這次把它所有的應(yīng)用與大模型集合在一起,形成了更強(qiáng)的用戶依存度,還是更勝一籌。
在李明順看來,下個階段,美國的平臺應(yīng)用公司,包括微軟、蘋果、戴爾,以及中國的騰訊、字節(jié)、阿里都會陸續(xù)結(jié)合自身的應(yīng)用與大模型能力,推出超級應(yīng)用,逐步邁向綜合競爭時代,靠一個大模型打江山將更難。
搜索之爭未竟,谷歌反“圍剿”OpenAI
吃下巨頭的“蛋糕”沒有那么容易。發(fā)布會前,市場充斥著OpenAI圍繞搜索布局的煙霧彈,有報道稱,OpenAI很可能推出基于ChatGPT技術(shù)的新搜索引擎。與此同時,名為“GPTSearch”的網(wǎng)頁已經(jīng)上線,但目前只有會員才能訪問。知名記者PeteHuang此前發(fā)推特預(yù)告,表示GPTSearch將在5月9日正式上線。
最終在這一輪交手中,谷歌守住了陣地。谷歌首席執(zhí)行官桑達(dá)爾·皮查伊(Sundar Pichai)在演講中提到,Gemini帶來的最令人興奮的變革之一是在Google搜索中,“我們最大的投資和創(chuàng)新領(lǐng)域之一是我們的創(chuàng)始產(chǎn)品——搜索”。
從發(fā)布會看,谷歌已經(jīng)率先將AI能力與其搜索引擎相結(jié)合。谷歌方面宣布,能夠總結(jié)谷歌搜索引擎結(jié)果的“AI概覽”(AI Over-views)功能,將于本周在美國推出。在這一功能中,谷歌將向用戶展示AI生成的答案。
據(jù)谷歌介紹,AI概覽是為了響應(yīng)較復(fù)雜的搜索,幫助用戶尋求解決方案。例如,當(dāng)人們搜索素食準(zhǔn)備或出行計劃時,AI提供的答案會出現(xiàn)在搜索頁面頂部。
谷歌還提升了搜索的視覺功能,支持通過視頻提出問題。在I/O 開發(fā)者大會上,谷歌演示了當(dāng)面對唱片機(jī)故障時,用戶可以一邊拍攝視頻一邊提問,通過新搜索得到包括修理步驟和資源在內(nèi)的AI概覽。
盡管在智能助手層面先一步狙擊谷歌新品,但對于市場期待的搜索產(chǎn)品,這項自GPT-3.5發(fā)布以來就被寄予厚望的革命性功能,卻在一陣又一陣煙霧彈后,依舊未見進(jìn)一步動作。在搜索市場,谷歌的基本盤依舊穩(wěn)固,與此同時其全面的AI能力正在對競爭對手隱隱形成包圍之勢。
與巨頭爭奪領(lǐng)地的另一面,對于OpenAI而言,內(nèi)憂隱患猶在。
就在GPT-4o發(fā)布一天之后,消失在大眾視線很久的OpenAI聯(lián)合創(chuàng)始人、首席科學(xué)家Ilya Sutskever官宣離開OpenAI。去年11月,OpenAI管理層發(fā)生動蕩,Sutskever被認(rèn)為是這場風(fēng)波背后的推手。不久前,OpenAI創(chuàng)始成員之一Andrej Karpathy也在Sora發(fā)布前夕離職。
在這場全新的技術(shù)革命中,隨著競爭的重點由大模型技術(shù)轉(zhuǎn)向應(yīng)用側(cè),以“黑馬”姿態(tài)一度引領(lǐng)方向的OpenAI開始降速,新的轉(zhuǎn)折點也許已經(jīng)出現(xiàn)。
封面圖片來源:視覺中國圖
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP