Microsoft MAI-Image-2

Microsoft spustil druhú generáciu svojho AI modelu na generovanie obrázkov — MAI-Image-2. Model je dostupný v Copilote a Bing Image Creator.


Čo je nové

  • Vylepšený fotorealizmus — obrázky vyzerajú prirodzenejšie a detailnejšie
  • Spoľahlivejšie generovanie textu v obrázkoch — historicky slabá stránka image modelov
  • Rýchlejšia generácia vďaka optimalizovanej architektúre
  • Dostupné cez Microsoft Copilot a Bing Image Creator

Prečo je text v obrázkoch dôležitý

Generovanie čitateľného textu v obrázkoch je jeden z najťažších problémov pre image modely. Kým DALL-E 3 urobil veľký pokrok, MAI-Image-2 podľa Microsoftu posúva túto schopnosť ďalej:

  • Logá a nápisy — presnejšie renderovanie
  • Infografiky — lepšie umiestnenie textu v kontexte
  • Mockupy — realistickejšie UI návrhy

Porovnanie s konkurenciou

Model Fotorealizmus Text v obrázkoch Dostupnosť
MAI-Image-2 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ Copilot, Bing
DALL-E 3 ⭐⭐⭐⭐ ⭐⭐⭐⭐ ChatGPT, API
Midjourney v7 ⭐⭐⭐⭐⭐ ⭐⭐⭐ Discord, Web
Stable Diffusion 4 ⭐⭐⭐⭐ ⭐⭐⭐ Open source

Kde to vyskúšať

  1. Copilot — priamo v Microsoft 365 alebo na copilot.microsoft.com
  2. Bing Image Creator — bing.com/images/create
  3. API — cez Azure AI Services

Zhrnutie

MAI-Image-2 ukazuje, že Microsoft berie generatívne médiá vážne. Vylepšený fotorealizmus a generovanie textu ho robia konkurencieschopným voči DALL-E a Midjourney. Pre bežných používateľov Copilotu je to bezplatný upgrade, ktorý prichádza automaticky.