Seit der ersten Version war klar, wofür Ideogram steht: Text in Bildern, lesbar und positioniert, ohne dass das Modell Buchstaben erfindet oder Wörter verbiegt. Version 4.0 erscheint heute als Open-Weight-Release — mit 9,3 Milliarden Parametern, die beim Textrendering Modelle schlagen, die ein Vielfaches dieser Größe haben.
9,3 Milliarden Parameter, die schlagen, was drei- bis neunmal größer ist
Ideogram 4.0 wurde von Grund auf neu trainiert — kein Fine-Tune eines bestehenden Modells. Im DesignArena-Ranking landet es auf Platz eins unter allen Open-Weight-Konkurrenten, konkret vor FLUX.2 dev (32 Milliarden Parameter) und HunyuanImage 3.0 (80 Milliarden). Im Quality-Modus der Text-to-Image-Arena erreicht es Platz eins, insgesamt Platz neun: hinter geschlossenen Systemen wie GPT-Image-2 und Nano Banana Pro, aber vor dem gesamten offenen Feld.
Das Modell bringt native 2K-Auflösung, transparente Hintergründe und Bounding Boxes mit. Letzteres ist praktisch relevant: Wer einen Poster-Hintergrund generieren und Textelemente an bestimmten Positionen anlegen will, kann das mit Bounding Boxes direkt im Prompt steuern, statt zu hoffen, dass das Modell den Platz richtig verteilt. Editierbarer Text und Ebenen sollen in einer späteren Version folgen.
Was „Open Weight“ bei Ideogram 4.0 bedeutet — und wo der Haken ist
Code und Gewichte liegen auf GitHub im Repository ideogram-oss/ideogram4. Das klingt nach freiem Zugang, und das ist es auch — teilweise. Auf Hugging Face sind die Gewichte gated: Wer das Modell lokal laufen lassen will, muss die Lizenzbedingungen akzeptieren und sich authentifizieren. Kommerzielle Nutzung, also das Einbinden in ein eigenes Produkt oder einen Dienst, erfordert eine kostenpflichtige Lizenz.
Das folgt dem Muster, das die Open-Weight-Debatte bei Meta Llama seit Jahren begleitet: technisch zugänglich, wirtschaftlich mit Auflagen. Für Forschung, eigene Experimente und nichtkommerzielle Projekte reicht der freie Zugang. Wer es produktiv einbauen will, landet bei den Lizenzterms.
API-Preise, Partner und wer davon profitiert
Wer das Modell nicht selbst hostet, nutzt die gehostete API — die Preisstruktur ist dreistufig und deckt sich fast vollständig mit Version 3.0: Turbo für 0,03 Dollar je Bild, Default für 0,06 Dollar, Quality für 0,10 Dollar. Version 3.0 kostete im Quality-Modus noch 0,09 Dollar — ein Cent mehr ist die einzige Preisänderung. Midjourney v8 liegt API-seitig im vergleichbaren Rahmen (0,03 bis 0,10 Dollar, bisher im Limited-Release), GPT Image 2 bei ungefähr 0,04 bis 0,08 Dollar je Bild.
Verfügbar ist das Modell über Partnerplattformen wie Hugging Face, ComfyUI, fal, Replicate, Leonardo AI und Kittl.
Die Nische ist klar: Wer Logos, Poster, Social-Media-Templates oder UI-Mockups mit lesbarem Text generieren will, findet in Ideogram 4.0 das derzeit leistungsfähigste offene Modell. Für rein ästhetische oder fotorealistische Bildgenerierung ohne Textanteile ist Midjourney v8 weiterhin das Maß — das spiegeln die Benchmarks wider.
Das „Open Weight“ in Modellbeschreibungen trägt in der KI-Branche gerade mehr Marketing-Gewicht als rechtliche Substanz. Was das konkret bedeutet, steht im Lizenz-Kleingedruckte — besser dort nachschauen, bevor das erste Kundenprodukt auf dem Modell läuft.


