四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟(jì)新聞

要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

13.8%和13.11%哪個(gè)大？《歌手》排名引網(wǎng)友熱議！一眾大模型竟然也翻車(chē)，ChatGPT更是胡言亂語(yǔ)……

每日經(jīng)濟(jì)新聞 2024-07-17 12:55:40

每經(jīng)編輯王月龍

7月13日

最新一期的《歌手》公布排名

孫楠得票13.8%

外國(guó)歌手香緹莫得票13.11%。

引發(fā)了網(wǎng)友對(duì)排名的質(zhì)疑

e7Jp2CicGtKCqLuiaMOeajFZcMRht9hZ3baLqQR2QclTV36qRJicVrxRDjZib88iaz5NUe9ickxwqz9YNn9YjUBbOunw.png

不少網(wǎng)友認(rèn)為13.11%大于13.8%，

因此，香緹莫的得票率比孫楠高。

e7Jp2CicGtKCqLuiaMOeajFZcMRht9hZ3bRiaYg9BVp2iclFl16KsRL1bibtvUqG8cNc3LMmBh3avD4UzgvfZ8zJWow.png

e7Jp2CicGtKCqLuiaMOeajFZcMRht9hZ3bB0ia9h15ziacJsrLtxb9l1XI4OCD0UBIxZ9HCTVxvAtwEKEAicFiackKug.png

隨后，關(guān)于13.8和13.11大小比較的話題，

迅速?zèng)_上微博熱搜！

其實(shí)，這個(gè)知識(shí)點(diǎn)

在小學(xué)四年級(jí)的課本中就有答案。

然而，這道小學(xué)生難度的數(shù)學(xué)題

也難倒了一眾海內(nèi)外AI大模型。

據(jù)第一財(cái)經(jīng)、財(cái)聯(lián)社等媒體測(cè)試，ChatGPT、Kimi、智譜清言、商湯商量、階躍星辰等大部分大模型應(yīng)用紛紛翻車(chē)，而文心一言、字節(jié)豆包等少部分大模型則守住了尊嚴(yán)。

CFF20LXzkOzG21u7XsBajickl1hWricc8fz9QEJL2vVFTPb4ibKd0dWYOpZ1Sf5brbtSqUeSMVZHjVFm0vxs86o2Q.jpg

值得注意的是，ChatGPT等大模型出現(xiàn)了胡說(shuō)八道的現(xiàn)象。在為13.8填補(bǔ)了13.80的零位數(shù)后，才得出了正確的回答。這類(lèi)大模型說(shuō)胡話的現(xiàn)象，在業(yè)界被稱(chēng)為大模型出現(xiàn)幻覺(jué)。此前，哈爾濱工業(yè)大學(xué)和華為的研究團(tuán)隊(duì)發(fā)表的綜述論文認(rèn)為，模型產(chǎn)生幻覺(jué)的三大來(lái)源：數(shù)據(jù)源、訓(xùn)練過(guò)程和推理。大模型可能會(huì)過(guò)度依賴(lài)訓(xùn)練數(shù)據(jù)中的一些模式，如位置接近性、共現(xiàn)統(tǒng)計(jì)數(shù)據(jù)和相關(guān)文檔計(jì)數(shù)，從而導(dǎo)致幻覺(jué)。此外，大模型還可能會(huì)出現(xiàn)長(zhǎng)尾知識(shí)回憶不足、難以應(yīng)對(duì)復(fù)雜推理的情況。

有產(chǎn)業(yè)界人士表示，目前大模型的幻覺(jué)率仍然較高，這也是產(chǎn)業(yè)界缺乏真正顛覆性應(yīng)用的原因之一，業(yè)界都在共同解決這一核心問(wèn)題，讓大模型在業(yè)務(wù)流程中變得更可控。

據(jù)極目新聞，今年6月19日，上海人工智能實(shí)驗(yàn)室發(fā)布首個(gè)AI高考全卷評(píng)測(cè)結(jié)果，本次評(píng)測(cè)采用全國(guó)新課標(biāo)Ⅰ卷，其中，語(yǔ)文評(píng)卷顯示，大模型的現(xiàn)代文閱讀理解能力普遍較強(qiáng)，但不同模型的文言文閱讀理解能力差距較大。大模型寫(xiě)的作文更像問(wèn)答題，雖有針對(duì)性，但缺乏修飾，幾乎不用人類(lèi)考生都會(huì)使用的舉例論證、引用論證、名人名言等手法。多數(shù)大模型不理解“本體”“喻體”“暗喻”等語(yǔ)文概念。對(duì)于文章中的一些“潛臺(tái)詞”，大模型也無(wú)法完全理解。

數(shù)學(xué)評(píng)卷顯示，大模型的主觀題回答相對(duì)凌亂，解題過(guò)程有迷惑性，甚至出現(xiàn)過(guò)程錯(cuò)誤但得到正確答案的情況。大模型的公式記憶能力很強(qiáng)，但無(wú)法在解題過(guò)程中靈活運(yùn)用。

大模型的英語(yǔ)整體表現(xiàn)良好，大模型寫(xiě)的英語(yǔ)作文普遍存在因超出字?jǐn)?shù)限制被扣分的情況，而人類(lèi)考生大多因?yàn)樽謹(jǐn)?shù)不夠被扣分。

據(jù)第一財(cái)經(jīng)，一位算法工程師認(rèn)為，生成式的語(yǔ)言模型更像文科生而不是理科生。實(shí)際上語(yǔ)言模型在這樣的數(shù)據(jù)訓(xùn)練過(guò)程中學(xué)到的是相關(guān)性，使得AI在文字創(chuàng)作上達(dá)到人類(lèi)平均水平，而數(shù)學(xué)推理更需要的是因果性，數(shù)學(xué)是高度抽象和邏輯驅(qū)動(dòng)的，與語(yǔ)言模型處理的語(yǔ)言數(shù)據(jù)在本質(zhì)上有所不同。這意味著大模型要學(xué)好數(shù)學(xué)，除了學(xué)習(xí)世界知識(shí)外，還應(yīng)該有思維的訓(xùn)練，從而具備推理演繹能力。

不過(guò)，上述問(wèn)題也正在慢慢被解決，在思維能力上更核心的可能還是訓(xùn)練語(yǔ)料的問(wèn)題。大語(yǔ)言模型主要通過(guò)互聯(lián)網(wǎng)上的文本數(shù)據(jù)進(jìn)行訓(xùn)練，而這些數(shù)據(jù)中數(shù)學(xué)問(wèn)題和解決方案相對(duì)較少，導(dǎo)致模型在數(shù)學(xué)推理和問(wèn)題解決技能上的訓(xùn)練機(jī)會(huì)有限。

值得一提的是，大模型的復(fù)雜推理能力尤為重要，這關(guān)乎可靠性和準(zhǔn)確性，是大模型在金融、工業(yè)等場(chǎng)景落地需要的關(guān)鍵能力。

“現(xiàn)在很多大模型的應(yīng)用場(chǎng)景是客服、聊天等等，在聊天場(chǎng)景一本正經(jīng)胡說(shuō)八道影響不太大，但它很難在非常嚴(yán)肅的商業(yè)場(chǎng)合去落地。”上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家林達(dá)華此前表示，復(fù)雜推理關(guān)系到落地應(yīng)用時(shí)大模型的可靠性，例如在金融這樣的場(chǎng)景下不能在數(shù)字上有差錯(cuò)，會(huì)對(duì)數(shù)學(xué)上的可靠性有較高的要求。另外隨著大模型進(jìn)入商用，若要分析一家公司的財(cái)報(bào)，甚至是工業(yè)領(lǐng)域要去分析一些技術(shù)文檔，這時(shí)數(shù)學(xué)方面的計(jì)算能力就會(huì)成為一個(gè)壁壘。

編輯|王月龍杜恒峰

校對(duì)|盧祥勇

每日經(jīng)濟(jì)新聞綜合公開(kāi)信息、第一財(cái)經(jīng)、財(cái)聯(lián)社、極目新聞

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

一年創(chuàng)收34億美元！OpenAI營(yíng)收拆解：84%來(lái)自近1000萬(wàn)名ChatGPT付費(fèi)用戶(hù)，API僅占15%

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

清華最新公告：謝絕此類(lèi)“一日游”

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專(zhuān)區(qū)

加入我們
招聘專(zhuān)頁(yè)

Copyright ? 2025 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專(zhuān)區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國(guó)互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn