四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

OpenAI推出新模型,讓GPT-4幫人類(lèi)訓(xùn)練GPT-4!OpenAI與《時(shí)代》雜志“聯(lián)手”,訓(xùn)練其最先進(jìn)AI模型

每日經(jīng)濟(jì)新聞 2024-06-28 07:15:59

每經(jīng)編輯 杜宇

美東時(shí)間6月27日周四,OpenAI公布,其研究人員訓(xùn)練了一個(gè)基于GPT-4的模型,它被稱(chēng)為CriticGPT,用于捕捉ChatGPT代碼輸出中的錯(cuò)誤。簡(jiǎn)單來(lái)說(shuō)就是,CriticGPT讓人能用GPT-4查找GPT-4的錯(cuò)誤。它可以寫(xiě)出使用者對(duì)ChatGPT響應(yīng)結(jié)果的批評(píng)評(píng)論,從而幫助人類(lèi)訓(xùn)練者在RLHF期間發(fā)現(xiàn)錯(cuò)誤。

OpenAI發(fā)現(xiàn),如果通過(guò)CriticGPT獲得幫助審查ChatGPT編寫(xiě)的代碼,人類(lèi)訓(xùn)練師的審查效果比沒(méi)有獲得幫助的人強(qiáng)60%。OpenAI稱(chēng),正著手將類(lèi)似CriticGPT的模型集成到旗下RLHF標(biāo)記管道中,為自己的訓(xùn)練師提供明確的AI幫助。

OpenAI稱(chēng),因?yàn)闆](méi)有更好的工具,所以人們目前難以評(píng)估高級(jí)的AI系統(tǒng)的表現(xiàn)。而CriticGPT意味著,OpenAI向能夠評(píng)估高級(jí)AI系統(tǒng)輸出的目標(biāo)邁進(jìn)了一步。

OpenAI舉了一個(gè)例子,如下圖所示,對(duì)ChatGPT提出一個(gè)用Python編寫(xiě)指定函數(shù)的任務(wù),對(duì)于ChatGPT根據(jù)要求提供的代碼,CriticGPT點(diǎn)評(píng)了其中一條指令,提議換成效果更好的。

OpenAI稱(chēng),CriticGPT的建議并不是全都正確無(wú)誤,但OpenAI的人員發(fā)現(xiàn),相比沒(méi)有這種AI的幫助,有了它,訓(xùn)練師可以發(fā)現(xiàn)更多模型編寫(xiě)答案的問(wèn)題。

此外,當(dāng)人們使用CriticGPT時(shí),這種AI模型會(huì)增強(qiáng)他們的技能,從而得出的批評(píng)結(jié)論比單單人類(lèi)訓(xùn)練師做的更全面,并且比AI模型單獨(dú)工作時(shí)產(chǎn)生的幻覺(jué)錯(cuò)誤更少。

OpenAI 在開(kāi)發(fā) CriticGPT 過(guò)程中識(shí)別出幾個(gè)關(guān)鍵的挑戰(zhàn):

訓(xùn)練方法的改進(jìn)需求:目前模型主要基于簡(jiǎn)短的答案進(jìn)行訓(xùn)練,這限制了它們處理長(zhǎng)且復(fù)雜問(wèn)題的能力。需要探索新的訓(xùn)練策略來(lái)提升模型對(duì)復(fù)雜任務(wù)的理解。

幻覺(jué)現(xiàn)象的糾正:AI 模型有時(shí)會(huì)生成不準(zhǔn)確或虛構(gòu)的信息,這被稱(chēng)為幻覺(jué)。同時(shí),訓(xùn)練師在識(shí)別這些錯(cuò)誤時(shí)也可能出錯(cuò),這要求模型和訓(xùn)練師的準(zhǔn)確性都需要提高。

錯(cuò)誤識(shí)別的全面性:現(xiàn)實(shí)中的錯(cuò)誤可能分布在答案的多個(gè)部分,而現(xiàn)有模型通常只能識(shí)別出一個(gè)錯(cuò)誤。未來(lái)的工作需要使模型能夠識(shí)別并糾正分散在不同地方的錯(cuò)誤。

評(píng)估復(fù)雜性的局限:即使在模型的輔助下,專(zhuān)家在面對(duì)極其復(fù)雜的任務(wù)或響應(yīng)時(shí)也可能難以做出準(zhǔn)確的評(píng)估,這顯示了 AI 在處理極端復(fù)雜情況時(shí)的限制。

此外,OpenAI 強(qiáng)調(diào)了為了更有效地管理和協(xié)調(diào)日益復(fù)雜的 AI 系統(tǒng),需要更先進(jìn)的工具。他們通過(guò)在 GPT-4 上應(yīng)用 RLHF 方法,發(fā)現(xiàn)了一種可能幫助生成更優(yōu)質(zhì) RLHF 數(shù)據(jù)的方法。OpenAI 計(jì)劃擴(kuò)展這項(xiàng)研究,并將其實(shí)際應(yīng)用,以提高 AI 系統(tǒng)的整體性能和穩(wěn)定性。

圖片來(lái)源:視覺(jué)中國(guó)-VCG31N2008743681

另外值得注意的是,當(dāng)?shù)貢r(shí)間6月28日,《時(shí)代》雜志與OpenAI宣布,兩家公司達(dá)成了一項(xiàng)多年內(nèi)容授權(quán)協(xié)議和戰(zhàn)略合作伙伴關(guān)系。該協(xié)議允許OpenAI將這家出版商的內(nèi)容引入ChatGPT,并幫助訓(xùn)練其最先進(jìn)的人工智能(AI)模型。

據(jù)新聞稿介紹,OpenAI可以通過(guò)這筆交易訪問(wèn)《時(shí)代》過(guò)去100多年的檔案和文章,以訓(xùn)練其AI模型,并在其面向消費(fèi)者的產(chǎn)品(如ChatGPT)中用于回復(fù)用戶的詢問(wèn)。

OpenAI使用《時(shí)代》雜志的內(nèi)容時(shí)會(huì)注明引用并鏈接原始來(lái)源。作為協(xié)議的一部分,《時(shí)代》雜志將可以使用OpenAI的技術(shù),以便為其受眾“開(kāi)發(fā)新產(chǎn)品”。

《時(shí)代》雜志首席運(yùn)營(yíng)官馬克·霍華德表示,在上百年的歷史中,《時(shí)代》一直在擁抱創(chuàng)新,以確保其值得信賴(lài)的新聞報(bào)道與技術(shù)一起發(fā)展。

霍華德強(qiáng)調(diào),而與OpenAI的合作有助于推進(jìn)《時(shí)代》的使命,即在全球范圍內(nèi)擴(kuò)大對(duì)可信信息的獲取,同時(shí)繼續(xù)采用創(chuàng)新的新方式將《時(shí)代》的新聞帶給全球的受眾。

OpenAI的首席運(yùn)營(yíng)官Brad Lightcap聲稱(chēng),兩家公司的合作旨在利用AI技術(shù)幫助人們更便捷地獲取新聞,并確保提供正確的信源,從而支持高質(zhì)量的新聞報(bào)道。

與此同時(shí),OpenAI還在與數(shù)十家出版商洽談內(nèi)容授權(quán)協(xié)議。上個(gè)月,OpenAI和新聞集團(tuán)也達(dá)成了類(lèi)似的合作關(guān)系。它將允許OpenAI訪問(wèn)新聞集團(tuán)旗下媒體的當(dāng)前和存檔文章,包括《華爾街日?qǐng)?bào)》《MarketWatch》《巴倫周刊》《紐約郵報(bào)》等。

美國(guó)八家新聞機(jī)構(gòu)4月底在紐約聯(lián)邦法院對(duì)OpenAI、微軟提起訴訟,指控微軟的Copilot和OpenAI的ChatGPT非法復(fù)制了數(shù)百萬(wàn)篇文章來(lái)訓(xùn)練AI模型。這些新聞機(jī)構(gòu)要求OpenAI和微軟賠償它們的損失,并停止進(jìn)一步侵犯版權(quán)行為。

雖然沖突和分歧仍然存在,但目前的趨勢(shì)是,越來(lái)越多的新聞出版商選擇與OpenAI等AI公司建立合作關(guān)系,而不是提起訴訟。

每日經(jīng)濟(jì)新聞綜合公開(kāi)資料

封面圖片來(lái)源:視覺(jué)中國(guó)-VCG31N2008743681

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

Ai OpenAI

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0