四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經濟新聞

每經網首頁丨
宏觀丨
金融丨
公司丨
視頻丨
券商丨
IPO丨
基金丨
汽車丨
房產丨
新文化丨
未來商業(yè)丨
文創(chuàng)通丨
城市丨
每經商學院

今日報紙

每經網首頁 > 今日報紙 > 正文

谷歌AI醫(yī)療大模型登上《自然》評分92.6%

每日經濟新聞 2023-07-17 22:39:37

每經記者蔡鼎每經編輯蘭素英

“AI醫(yī)生”，離我們越來越近了。

7月12日，谷歌和DeepMind的科研人員在《自然》雜志上發(fā)表了一項研究，不僅提出了MultiMedQA（美國醫(yī)師執(zhí)照試題）評估基準，用于評估大語言模型在編碼臨床知識方面的表現(xiàn)，還詳解了谷歌醫(yī)療大模型Med-PaLM的進化過程。

最終的研究結果顯示，一組臨床醫(yī)生對谷歌和DeepMind團隊的醫(yī)療大模型Med-PaLM回答的評分高達92.6%，與現(xiàn)實中人類臨床醫(yī)生的水平（92.9%）相當。此外，Med- PaLM僅5.9%的答案被評為可能導致“有害”結果，與臨床醫(yī)生生成的答案（5.7%）的結果相似。

視覺中國圖

《每日經濟新聞》記者了解到，盡管如此，該研究團隊承認，鑒于現(xiàn)實醫(yī)學領域的復雜性，在Med-PaLM實現(xiàn)大規(guī)模應用前，仍需克服不少限制。

模型可媲美人類醫(yī)生

在這篇最新的《自然》論文中，谷歌和DeepMind科學家團隊介紹了全新的MultiMedQA評估基準，專門用于評估大語言模型在編碼臨床知識方面的表現(xiàn)。

該基準結合了六個現(xiàn)有醫(yī)療問答數據集（MedQA、MedMCQA、PubMedQA、LiveQA 、MedicationQA和MMLU），涵蓋專業(yè)醫(yī)學、研究和消費者查詢等多個方面，以及一個全新的在線搜索醫(yī)療問題庫數據集HealthSearchQA，力圖從多方面把AI培養(yǎng)成一名合格的醫(yī)生。

此外，該團隊提出了一個基于人類評估的框架模型，該模型包括多個維度，例如事實、理解、推理，以及可能的偏見。

該團隊在MultiMedQA上對擁有5400億參數的谷歌大型語言模型PaLM（Pathways Language Model）及其變體Flan-PaLM進行了評估。

在實驗中，研究人員采用了提示策略組合，F(xiàn)lan-PaLM在每個MultiMedQA多選題數據集上都達到了極高的準確率，其中在MedQA（美國醫(yī)學執(zhí)照考試類型問題）上的準確率為67.6%，比之前的技術水平高出17%以上。

論文指出，雖然Flan- PaLM在MedQA的多項選擇題上表現(xiàn)出色，但它對病人醫(yī)療問題的回答卻暴露出關鍵的差距。為了解決這個問題，谷歌科學家團隊提出了指令提示調整，讓Flan-PaLM進一步與醫(yī)學接軌，產生了Med-PaLM。

在評估中，Med-PaLM表現(xiàn)令人鼓舞，一組臨床醫(yī)生對其回答的評分為92.6%，與現(xiàn)實中臨床醫(yī)生的水平（92.9%）相當。

除了專家評估，研究團隊還邀請了五名非醫(yī)學領域專家（印度的非醫(yī)學背景普通人）來評估答案。

結果顯示，F(xiàn)lan-PaLM給出的答案在60.6%的案例中被認為是有用的，而Med-PaLM給出的答案準確度則增加到80.3%。

同樣，在90.8%的情況下，F(xiàn)lanPaLM的答案被判斷為直接解決了病人提出的問題，而Med-PaLM將這一比例提高到了94.4%，人類臨床醫(yī)生這一比列則在95.9%。換句話說，在直接解決病人問題方面，Med-PaLM幾乎可以和人類臨床醫(yī)生的能力相媲美。

論文稱，雖然這些結果非常令人鼓舞，但現(xiàn)實中醫(yī)學領域相當復雜。因此，還有必要對該大語言模型進行進一步評估，特別是在安全性、公平性和偏見方面。在將這些模型運用到臨床應用之前，還有許多限制需要克服。研究人員預計最新的這項研究將激發(fā)患者、消費者、AI研究人員、臨床醫(yī)生、社會科學家、倫理學家、政策制定者和其他利益相關方之間進一步對話和合作，從而負責任地將這些早期研究成果轉換為真正的現(xiàn)實應用。

但不可否認的是，谷歌科學家團隊的研究表明，隨著模型規(guī)模的擴大和提示詞的調整，其理解能力、知識回憶和推理能力均有所提高，這表明大語言模型在醫(yī)學領域具有潛在的實用性。此外，研究團隊的人類評估也揭示了當今大語言模型的局限性，也強調了評估框架和方法在為臨床應用創(chuàng)建安全、有用的大語言模型方面的重要性。

科技巨頭紛紛布局

基礎模型和大語言模型的出現(xiàn)為醫(yī)學AI的發(fā)展提供了助力?！睹咳战洕侣劇酚浾咦⒁獾剑鋵嵆斯雀韬推淦煜碌腄eepMind外，微軟、IBM等科技大廠一直在持續(xù)關注AI醫(yī)療方面的應用落地。在這輪大模型浪潮之前，AI檢測心電圖、X光片已在一些醫(yī)院中投入應用。

據《每日經濟新聞》記者了解，過去數年來，AI在醫(yī)療領域的發(fā)展迅猛，為醫(yī)療行業(yè)帶來了革命性的變革和巨大的潛力。

根據麥肯錫咨詢的數據，AI每年可以創(chuàng)造3.5萬億至5.8萬億美元的商業(yè)價值。預計到2025年，全球AI應用市場總值將達到1270億美元，其中AI醫(yī)療占據1/5的份額，處于高速成長階段。

知名市場調研公司ReportLinker此前針對全球醫(yī)療保健AI市場的年度報告曾預測，全球醫(yī)療保健AI市場規(guī)模將從2023年的146億美元增長到2028年的1027億美元，期間復合年增長率47.6%。

中國AI產業(yè)發(fā)展迅速，自2019年以來，AI醫(yī)療以40%~60%的增速快速發(fā)展，中國的AI醫(yī)療核心軟件市場規(guī)模已接近30億元，并且還有重資產性質的AI醫(yī)療機器人，總體規(guī)模接近60億元。

中泰證券在一份研報中指出，AI+醫(yī)療/醫(yī)藥未來空間廣闊，當下值得重點關注。該研報指出，AI病理、AI影像和AI制藥均是未來可能的應用領域。

中泰證券認為，傳統(tǒng)病理診斷方法主要依靠人工閱片分析提供依據，自動化程度低，耗時長效率低，且診斷正確與否比較依賴醫(yī)生閱片經驗以及主觀判斷；另一方面病理醫(yī)生培養(yǎng)周期長，從業(yè)門檻高，地域資源分布不均勻，供需極度不平衡，影響了行業(yè)整體的發(fā)展節(jié)奏。相比于傳統(tǒng)的病理診斷，AI輔助有望提升閱片速度、提高診斷精準度，加速市場擴容，是未來的行業(yè)趨勢。

“近年來，AI病理領域的監(jiān)管條例、審核標準逐漸規(guī)范，技術應用越發(fā)成熟，我們預計 2023年首批AI病理診斷三類證有望獲批，行業(yè)有望率先在細胞病理領域迎來商業(yè)化拐點，當前正是布局的最佳時點，技術積累深厚，入院能力強的頭部玩家占據明顯優(yōu)勢，有望帶動產品加速商業(yè)化放量。”中泰證券分析師在上述研報中寫道。

封面圖片來源：視覺中國圖

如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

Ai 醫(yī)療谷歌

上一篇文章

阿斯巴甜今夏陷入“致癌”風波：蔗糖減產漲價“代糖”市場爆發(fā)式增長

返回每經網首頁

下一篇文章

中國恒大補發(fā)財報：過去兩年凈虧損8120億 2022年底總負債達2.4萬億

相關文章

熱文精選

點擊排行

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

相關信息
關于我們
版權聲明

關注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2024 每日經濟新聞報社版權所有，未經許可不得轉載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網絡社會征信網

兒童色情信息舉報專區(qū)

成都市互聯(lián)網不良與違法信息舉報中心

四川省互聯(lián)網舉報中心

中國互聯(lián)網舉報中心

每日經濟新聞互聯(lián)網不良與違法信息舉報中心

互聯(lián)網新聞信息服務許可證：51120190017 網站備案號：蜀ICP備19004508號-3 川公網安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn