
17. Dezember 2024, 14:08 Uhr | Lesezeit: 3 Minuten
Google hat gerade ein neues KI-Tool präsentiert, das „Whisk“ heißt. Es handelt sich dabei um einen speziellen Bildgenerator, bei dem die Prompts mithilfe von Bildern „geschrieben“ werden.
Auch der Suchmaschinenriese Google entwickelt und veröffentlicht eigene KI-Tools und hat kürzlich „Whisk“ vorgestellt. Dabei handelt es sich um einen Bildgenerator, der – anders als andere Tools dieser Art – nicht mit Texteingabe arbeitet. Stattdessen sollen Nutzer „Whisk“ mit Bildern füttern, um neue zu generieren. Das Tool ist hauptsächlich als kreativer Ideengeber gedacht. TECHBOOK erklärt die Details.
Prompts ohne Worte bei Google „Whisk“
Wer beispielsweise DALL-E von OpenAI nutzt, weiß, wie der Bildgenerator funktioniert: Man gibt einen Prompt beziehungsweise eine Beschreibung des gewünschten Bildes ein und erhält ein generiertes Ergebnis. Bei Googles neuem KI-Tool „Whisk“ ist das anders. Hier schreibt man keine Texte, sondern lädt mehrere Bilder in die KI hoch und erhält ein daraus generiertes Foto. Das neue Tool wurde im Google-Blog präsentiert.
Der Name „Whisk“ ist dabei gut gewählt. Auf Englisch bedeutet „whisk“ nämlich „Schneebesen“ – und ähnlich wie ein Schneebesen Zutaten miteinander vermischt, kombiniert das Google-Tool die hochgeladenen Bilder zu einem neuen Mix.
Die zugrunde liegende Technologie nutzt das Gemini-Modell, das als Konkurrenz zu ChatGPT gilt, sowie Googles neuestes Bildgenerierungsmodell Imagen 3. Gemini liest beziehungsweise beschreibt dabei die Bilder und Imagen 3 kreiert dann daraus ein neues Foto. Somit ist Google „Whisk“ eher als kreatives Tool gedacht.
Vorerst nur in den USA verfügbar
Allerdings gibt es auch einen Haken: Google „Whisk“ ist vorerst nur in den USA nutzbar und ausschließlich über Google Labs, die Testumgebung von Google, zugänglich. Im Blog schreibt der Suchmaschinenriese: „Mit Whisk können Sie verschiedene Bilder kombinieren: eines für das Motiv, eines für die Szene und eines für den Stil. Anschließend lassen sich diese Elemente neu mischen, um einzigartige Kreationen zu gestalten.“ Google hat zudem ein Video des Tools veröffentlicht.

Künstliche Intelligenz Erste Verbote für KI-Werke auf Kunstportalen

Bei ChatGPT und Bard So gelingt der passende KI-Prompt

Konkurrent für GPT4 Google launcht Gemini, sein bislang „leistungsfähigstes“ KI-Modell
Immer wieder neue KI-Tools
Jetzt stellt sich die Frage, ob es eine Konkurrenz zu DALL-E, Midjourney, Artsmart und ähnlichen Tools darstellt. Eine direkte Antwort darauf ist nicht möglich, da es sich bei „Whisk“ um einen kreativen Bildgenerator handelt. Google schreibt dazu: „Bei unseren ersten Tests mit Künstlern und Kreativen wurde „Whisk“ von den Leuten als eine neue Art von Kreativwerkzeug beschrieben – kein traditioneller Bildeditor. Wir haben es für schnelle visuelle Erkundungen entwickelt, nicht für pixelgenaue Bearbeitungen.“ Somit ist „Whisk“ weniger ein Konkurrenzprodukt und viel mehr eine nützliche Ergänzung zu den anderen Optionen.
Wer das Tool nun unbedingt nutzen möchte, muss sich allerdings wohl noch gedulden. Ob das neueste KI-Tool überhaupt nach Deutschland kommen wird, ist derzeit noch unklar. Momentan läuft „Whisk“ lediglich über Google Labs und befindet sich somit noch in einer Testphase.
Übrigens hat auch der ChatGPT-Herausgeber OpenAI kürzlich ein neues Tool vorgestellt. Das Modell namens „Sora“ arbeitet allerdings nicht mit Bildern, sondern traditionell mit Text. Spezialisiert ist „Sora“ aber auf Videos. ChatGPT-Abonnenten können bis zu 20 Sekunden lange Videos über den Chatbot generieren. Es bleibt also viel Bewegung auf dem Markt.