微軟 AI 圖像生成大躍進!MAI-Image-2.5 空降排行榜第三,直追 OpenAI!
微軟近日發布其最新一代文字生成圖像模型 MAI-Image-2.5,並在 Arena 的最新文生圖排行榜中首發即拿下第三名的位置,顯示其在 AI 圖像生成領域的整體實力正明顯追趕行業領先者。
目前在這一榜單上,OpenAI 的 gpt-image-2 以 1388 分位居第一。微軟表示,MAI-Image-2.5 在多種圖像風格上的表現全面提升,能夠更好地貼合用戶提示生成圖像,並在文字渲染與畫面細節方面有顯著改進。
微軟最初於去年推出自研圖像生成模型 MAI-Image-1,當時在 Arena 的 Image Arena 排名中僅位列第 9 名,與其他實驗室的頂級模型存在明顯差距,隨後整合至 Bing.com/create 以及 Bing 手機應用中向用戶開放。

今年 3 月,微軟 AI 團隊發布第二代 MAI-Image-2,在自然光表現、膚色還原等方面帶來明顯提升,首次闖入 Arena 排行榜前三,僅落後於 Google 的 gemini-3.1-flash-image-preview 和 OpenAI 的 gpt-image-1.5-high-fidelity,並同步接入 Copilot、Bing Image Creator 和 Microsoft Foundry API 供開發者調用。
強化視覺推理與商業應用
在此基礎上,新一代 MAI-Image-2.5 進一步強化了模型整體能力。微軟介紹稱,新模型能更精確地理解和執行用戶的文字提示,生成的圖像在細節和整體結構上更加連貫,且在文字內容的繪製上更加可靠。該模型的視覺推理能力也有所增強,對物體、光照、比例、場景結構以及空間關係的理解更加準確,有助於生成更符合真實場景和用戶預期的畫面。

微軟特別強調,MAI-Image-2.5 在文字渲染、風格化插畫以及商業類圖像上的進步最為明顯,包括海報、包裝打樣、品牌創意和產品圖等場景,都能產生更高品質的輸出。相比前代模型,新模型生成圖像中的文字更加清晰銳利,版式布局更加穩定,品牌視覺元素也更突出、更具整體質感,更契合商業設計和行銷應用需求。
微軟 AI 負責人 Mustafa Suleyman 表示,MAI-Image-2.5 登上 Arena 文生圖排行榜第三名,標誌著圖像生成品質又迎來一次重要躍遷,並預告在即將到來的 Build 大會上,微軟 AI 團隊還將帶來更多相關更新與發布。他稱這只是微軟在 AI 圖像領域發力的又一步,後續還會持續推進模型能力和產品形態更新。
目前,MAI-Image-2.5 已透過 Arena 面向所有用戶開放試用,用戶可以直接在該平台上與其他模型進行對比體驗。按照微軟的計畫,這一新模型也將在未來兩週內陸續登陸 MAI Playground 和 Microsoft Foundry,為普通用戶與開發者提供更多樣化的生成式圖像創作與整合選項。
- 延伸閱讀:本機端跑 AI 圖像生成前置設定篇:Comfy UI、Stable Diffusion、遠端操作3個願望1次滿足 | GIGABYTE AI TOP ATOM系列-4
- 延伸閱讀:AI 繪圖大比拼:ChatGPT、Gemini、Grok 三大平台圖像生成能力全面評測
- 延伸閱讀:Google AI 創作工具更新,Veo 3 影像生成、Imagen 4 圖像生成、Lyria 2 音樂生成
加入T客邦Facebook粉絲團
































