微軟發表新小模型 能塞進手機、效能媲美GPT-3.5

(本報訊)微軟23日在官網開源了小語言模式(SLM)-Phi-3-mini。這是微軟Phi-3系列模型推出的首個模型。

經過龐大的資料訓練 表現超越眾多大模型

Phi-3-mini作為微軟Phi系列的第四代產品,以其38億參數和3.3T tokens的龐大訓練資料量,在語言、推理、編碼和數學基準測試中超越了眾多數百億參數規模的模型。

此外,Phi-3-mini有4k和128k tokens兩個上下文長度變體,經過預先訓練和指令調整,可以更好地理解人類的語言、表達、邏輯並執行不同類型的指令。

操作簡單、體積小、可離線、成本打1折

與大語言模型相比,Phi-3-mini模型操作更為簡單。此模型的體積很小,可以直接在終端設備運行,成為可以在離線的狀況下使用的聊天機器人,且具有不亞於GPT-3.5的性能。

Phi-3-mini的成本大幅降低。微軟生成式AI研究副總裁塞巴斯蒂安·布貝克稱,相比於其他相似功能的模型,Phi-3-mini成本可能只有十分之一。

微軟計劃在未來幾週內推出Phi-3系列的另外兩個模型,分別是Phi-3-small(7B)和Phi-3-medium(14B),旨在為Azure AI和其他模型庫提供更靈活的選擇。

小模型相輔相成 離線AI聊天已成現實

雲端大模型在效能上全面超越小模型,但它們也需要較高的成本、運行速度以及對網路連線的依賴。相較之下,Phi-3允許使用者在沒有網路的情況下與虛擬助理互動,能夠在不上傳資料的前提下實現內容總結,解決了AI領域的一部分弊端。

微軟的Phi-3能夠在終端設備上運行,無需依賴網路連接,這項特性正是小模型的發展重點,目前同類型的產品有Stability AI的Zephyr、Google的Gemini Nano、Anthropic的Claude 3 Haiku等小模型,未來可望內建於智慧型手機,甚至常用家電中,讓為生活提供個人化建議。

延伸閱讀

訂閱168電子報

專欄文章