4月5日消息,微軟正式發布新一代圖像生成模型 MAI-Image-2,這是公司新成立的 Microsoft Super Intelligence(微軟超級智能) 部門推出的首款專門面向文本生成圖像(text-to-image)的產品。該模型於 2026年3月20日 公布,並在首次公開評測中進入 ArenaAI排行榜第三位,僅次於 OpenAI的GPT-Image-1.5 和 Nano Banana 2。
微軟表示,MAI-Image-2的核心目標是提升圖像的真實感與實際應用能力。根據官方介紹,該模型在多個視覺細節方面進行了優化,包括更自然的光線與陰影效果、更準確的人物膚色與紋理表現,以及能夠處理複雜多主體場景的高細節圖像生成能力。
文字渲染能力也是該模型的一項重點改進。圖像生成模型在圖內文字生成方面長期存在難度,而MAI-Image-2在海報、信息圖和品牌圖形等場景中能夠提供相對穩定的文字呈現效果。
微軟認為,這些能力使MAI-Image-2適用於更多專業創意和商業工作流,例如 海報設計、信息圖製作、品牌圖形、產品可視化以及營銷素材生成 等需要較高視覺準確度的場景。
目前,MAI-Image-2已經在 MAI Playground 平台開放測試。未來幾周內,該模型還將逐步集成到 Microsoft Copilot 和 Bing Image Creator 等產品中。
在商業化方面,微軟暫時只向少數企業客戶提供API訪問權限,包括部分早期合作伙伴,例如廣告集團 WPP。相關技術參數和定價方案尚未公布。
業內認為,MAI-Image-2的推出顯示出微軟正在加強自研視覺AI能力。此前公司在生成式AI領域主要依賴與OpenAI的合作,而隨着AI戰略的進一步調整,微軟正逐步構建更加完整的模型體系。