四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

<p id="iblcp"><kbd id="iblcp"></kbd></p>

<i id="iblcp"><dfn id="iblcp"></dfn></i>

每日經濟新聞

每經網首頁丨
宏觀丨
金融丨
公司丨
視頻丨
券商丨
IPO丨
基金丨
汽車丨
房產丨
新文化丨
未來商業(yè)丨
文創(chuàng)通丨
城市丨
每經商學院

要聞

每經網首頁 > 要聞 > 正文

iPhone就能跑！微軟推出輕量級模型Phi-3，性能堪比GPT-3.5 Turbo，AI的未來在手機端？

每日經濟新聞 2024-04-25 13:08:00

每經記者李孟林每經編輯何小桃蘭素英

“大模界”是每日經濟新聞推出一檔專注生成式AI與大模型技術的前沿科技報道欄目。

在這里，我們將聚焦生成式AI技術浪潮，展現從文字、圖像、音頻、視頻的大模型如何編織數字化世界。

在這里，我們將解碼、評測國內外各類大模型，探究它們如何成為變革各行各業(yè)的重要力量。

在這里，我們將關注AIGC行業(yè)發(fā)展，聯手行業(yè)領軍人物和頂尖專家，共同揭示最新產品創(chuàng)新和技術突破，前瞻未來發(fā)展趨勢。

歡迎關注“大模界”，您將見證AIGC如何重塑內容生態(tài)，如何以前沿之力推動社會進步。讓我們共同開啟一場關于AI新紀元的無限旅程！

當地時間4月23日，微軟推出了開源輕量級AI模型Phi-3系列，宣稱這是目前市面上性能最強、最具性價比的“小語言模型”。

該系列的最小版本Phi-3-mini雖然參數規(guī)模僅有38億，但卻展現了超越參數規(guī)模大一倍多的模型的性能，在多項基準測試中比Meta的Llama 3 8B更優(yōu)異，而Phi-3-small和Phi-3-medium這兩個版本甚至可以超越GPT-3.5 Turbo。

更令人矚目的是，Phi-3-mini對內存的占用極少，可在iPhone 14搭載的A16 Bionic芯片上實現每秒12個token的生成速度，這意味著這款模型不用聯網，可以直接在手機上運行。不僅如此，據透露，Phi-3的成本或只有同等性能模型的十分之一。

這樣的模型對于網絡資源受限或需要離線推理的場景來說，無疑是一大好消息。據微軟介紹，印度企業(yè)已經開始用Phi-3模型來幫助資源緊缺的農民解決生產生活問題。但Phi-3系列并非沒有缺點，其在事實性知識方面的表現并不理想，不過微軟已經找到了相應的緩解之道。

手機上能跑的GPT-3.5級別模型

當地時間4月23日，微軟推出了開源輕量級AI模型Phi-3-mini，這是其Phi家族的第4代模型。Phi-3-mini是Phi-3系列中最小的，參數只有38億，未來幾周內，微軟還將推出該系列的另外兩個版本Phi-3-small（70億參數）和Phi-3-medium（140億參數）。

“Phi-3模型是現有功能最強大、最具性價比的小語言模型（SLM），在各種語言、推理、編碼和數學基準測試中，其性能優(yōu)于相同大小和規(guī)模大一級的模型?！蔽④浄矫姹硎?。

具體來看，Phi-3-mini采用了transformer架構，支持4K和128K上下文窗口，也是同類小模型中第一個支持128K的開源產品。

性能上，Phi-3-mini在多項基準測試中超過了參數規(guī)模大一倍多的Llama 3 8B（80億參數），而Phi-3-small和Phi-3-medium超過了很多尺寸大得多的模型，如GPT-3.5 Turbo，而后者的參數規(guī)模高達1750億。

CFF20LXzkOyWeb7LTTL1lw213MtxCMIibMtWibzo1CnmM1I4zSqjJXibiaOXEcgJChI6qMq3tibOtF0AUOqRAvIEcibg.jpg

圖片來源：微軟

由于Phi-3-mini對內存的占用極少，經過壓縮后總體積可以大幅縮減至1.8GB，可在iPhone 14搭載的A16 Bionic芯片上實現每秒12個token的生成速度，意味著這款模型不用聯網，可以直接在手機上運行。

Phi-3系列的驚艷表現來自于其訓練方式。微軟生成式AI研究院（GenAI Resaerch）副總裁Sébastien Bubeck表示，微軟在開發(fā)Phi-3時力圖確保輸入的是高質量數據訓練集。

微軟技術報告顯示，開發(fā)人員開發(fā)Phi-3時使用了3.3T tokens數據集，包括經過嚴格質量篩選的網絡公開文檔、精選的高質量教育數據和編程代碼。此外，還有AI自己生成的“合成數據”，如數學、編碼、常識推理、世界常識、心理科學等。高質量數據，再輔以獨特的指令微調和RLHF訓練，大幅提高了小語言模型的性能。

當然，Phi-3系列也有其缺點，這主要體現在事實性知識上，在相關的基準測試如TriviaQA上的表現就不如人意。不過，開發(fā)語言模型是性能和尺寸的平衡。微軟透露，Phi-3模型本身參數中沒能力存儲太多事實和知識，這一缺點的緩解方式是聯網接入搜索引擎增強。

可離線使用

成本只有類似性能模型的十分之一

傳統觀點認為，大語言模型的關鍵點就在于“大”，參數越大，訓練數據體積越大，性能就更強。微軟推出輕量級的小語言模型，用意何在呢？

據微軟自己的說法，像Phi-3這樣的小語言模型特別適合以下場景：網絡資源受限，需要在終端設備上推理或者離線推理的場景；需要避免延遲，快速響應至關重要的場景；成本受限的場景，特別是那些較為簡單的任務。

Phi-3能夠在手機上離線運行，成本大幅降低，從而大大降低了AI的實際使用門檻。

微軟高管Eric Boyd就表示，企業(yè)客戶經常發(fā)現像Phi-3這樣的小模型更適合他們的定制應用程序，因為企業(yè)的內部數據集本來就規(guī)模不大，而且小模型需要的算力更少，成本也更為便宜。

“Phi-3的價格不是稍微便宜一點，而是便宜得多，與具有類似功能的其他型號相比，成本差異可能是10倍的范圍，”微軟的Sébastien Bubeck對路透社表示。

微軟已經在探索如何在資源有限的情況下應用Phi-3。據其介紹，總部位于印度的商業(yè)集團ITC，正在與微軟合作將Phi-3用于農業(yè)領域，共同開發(fā)面向農民的應用程序Krishi Mitra，這一程序的覆蓋范圍達100萬農民。

據悉，農民可以用當地語言向Krishi Mitra提問，該應用程序會立即以用戶的本地語言提供詳細的個性化響應，幫助他們解決農作物管理、病蟲害控制、土壤健康、水資源保護、天氣預報、市場聯系和政府計劃等相關問題。

記者|李孟林

編輯|何小桃蘭素英?蓋源源

校對|盧祥勇

｜每日經濟新聞 ?nbdnews??原創(chuàng)文章｜

未經許可禁止轉載、摘編、復制及鏡像等使用

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

上一篇文章

波音一季度虧損3.55億美元將加強質量和安全管理體系

返回每經網首頁

下一篇文章

酒店、旅游板塊午后活躍嶺南控股漲停

相關文章

熱文精選

點擊排行

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

相關信息
關于我們
版權聲明

關注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2024 每日經濟新聞報社版權所有，未經許可不得轉載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網絡社會征信網

兒童色情信息舉報專區(qū)

成都市互聯網不良與違法信息舉報中心

四川省互聯網舉報中心

中國互聯網舉報中心

每日經濟新聞互聯網不良與違法信息舉報中心

互聯網新聞信息服務許可證：51120190017 網站備案號：蜀ICP備19004508號-3 川公網安備 51019002002026號

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

<label id="fgyjr"><th id="fgyjr"></th></label>

<source id="fgyjr"></source>

<small id="fgyjr"><tfoot id="fgyjr"><em id="fgyjr"></em></tfoot></small>

<small id="fgyjr"><progress id="fgyjr"></progress></small>