Stimmen Dr. Jannik Rößler

Stimme aus dem Netzwerk

FLUX.1 Kontext [dev] – Die Zukunft der KI-basierten Bildbearbeitung

Mein Name ist Dr. Jannik Rößler und ich beschäftige mich seit vielen Jahren intensiv mit Künstlicher Intelligenz – insbesondere in den Bereichen Computer Vision, generative KI und Machine Learning. Als Co-Founder bei Pixit bin ich vor allem für die Entwicklung verschiedener KI-Lösungen im Bereich der Bildgenerierung und -bearbeitung zuständig. Aktuell entwickeln wir eine der ersten KI-Lösungen zur automatisierten Erstellung von Modeaufnahmen – also Fotos von Models, die bestimmte Kleidung oder ganze Outfits in Szene setzen. Für unsere Entwicklungen bei Pixit greifen wir auf neueste Technologien zurück, wie dem neuen Modell von Black Forest Labs – FLUX.1 Kontext [dev]. Black Forest Labs hat damit ein neues Kapitel für KI-gestützte Bildbearbeitung aufgeschlagen. Das Modell ermöglicht nicht nur die Generierung, sondern vor allem die Bearbeitung bestehender Bilder – alles durch Textprompts. So können Hintergründe per Klick ausgetauscht, Teile eines Bildes selektiv verändert, Outfit-Farben beliebig angepasst, bestehende Perspektiven verändert, oder sogar neue Objekte hinzugefügt werden.

„Noch nie war die Bildbearbeitung so intuitiv und flexibel wie mit FLUX.1 Kontext“

Insbesondere die „Character Consistency“ bleibt weitestgehend erhalten: Die Hauptfigur im Bild behält individuelle Merkmale, Gestik und Gesichtsausdruck bei – auch wenn das Bild mehrmals angepasst wird. So lassen sich mit FLUX.1 Kontext kreative Workflows realisieren, die bislang unmöglich waren, etwa mehrere Bilder eines Models erstellen mit verschiedenen Perspektiven und Outfits. Zusätzlich hat Black Forest Labs das Model als Open-Source veröffentlicht. Damit können Entwickler*innen, Künstler*innen und Forschende kostenlos auf das KI-Modell zugreifen und dieses für Forschung  und nicht-kommerzielle Zwecke nutzen und direkt auf lokaler Consumer-Hardware – also dem eigenen Rechner – ausführen. Bei Pixit nutzen wir den direkten Zugriff, um das KI-Modell gezielt nachzutrainieren und auf spezielle Anwendungsfälle anzupassen – etwa um besondere Stile, Objekte oder Personen zu erlernen. So erzielen wir mehr Individualisierung und können passgenaue KI-Lösungen für unterschiedlichste Anforderungen in der Mode- und Bildverarbeitung entwickeln.