Google enthüllt Whisk: Ein KI-Bildgenerierungs-Tool mithilfe von Bildvorgaben.
Brief news summary
Google hat Whisk eingeführt, ein KI-Tool, das Bilder mithilfe von Bildanweisungen anstatt nur Text generiert. Nutzer können Bilder kombinieren, um das Motiv, die Szene und den Stil festzulegen, und ein Würfelsymbol bietet KI-Bildvorschläge. Ein optionales Textfeld steht für Anpassungen zur Verfügung. Bilder können mit Textanweisungen erstellt werden und anschließend favorisiert, heruntergeladen oder modifiziert werden. Whisk ist für eine „schnelle visuelle Erkundung“ konzipiert und nicht für detaillierte Bearbeitungen. Google weist darauf hin, dass die Ergebnisse möglicherweise nicht immer den Erwartungen entsprechen und bietet Optionen zur Anpassung der Anweisungen. Whisk wird durch Googles Imagen 3 Bildgenerierungsmodell betrieben, das mit dem Tool eingeführt wurde. Außerdem kündigte Google Veo 2 an, ein neues Videogenerierungsmodell, das in Googles VideoFX eingebettet ist und in YouTube Shorts integriert werden soll. Veo 2 verbessert das Verständnis für Kinematografie und behebt Ungenauigkeiten, die in früheren Modellen auftraten. Benutzerfeedback zu Whisk ist im Allgemeinen positiv, obwohl einige über Verzögerungen und unerwartete Ergebnisse bei der Bildgenerierung berichtet haben.Google hat ein KI-Tool namens Whisk vorgestellt, das die Bildgenerierung mithilfe von Bildern als Eingabe statt langer Texteingaben ermöglicht. Mit Whisk können Sie Bilder verwenden, um das Motiv, die Szene und den Stil Ihres gewünschten KI-generierten Bildes zu definieren, wobei mehrere Bilder pro Kategorie erlaubt sind. Zusätzlich können, wenn auch optional, Texteingaben verwendet werden. Wenn Ihnen passende Bilder fehlen, kann ein Würfelsymbol Vorschläge generieren, die ebenfalls KI-basiert sind. Das Hinzufügen von Text am Ende für zusätzliche Details ist optional. Whisk generiert Bilder und einen entsprechenden Textprompt für jedes Bild.
Sie können ein Bild als Favorit markieren oder herunterladen, wenn Sie zufrieden sind, oder das Bild durch Hinzufügen von Text oder Bearbeitung des Textprompts verfeinern. Google betont, dass Whisk für "schnelle visuelle Erkundung" gedacht ist und nicht für pixelgenaue Bearbeitungen, und räumt ein, dass es möglicherweise nicht immer die Erwartungen erfüllt, daher die Bearbeitungsoption. In meiner kurzen Erfahrung mit Whisk war es unterhaltsam, damit zu experimentieren, obwohl die Bilder ein paar Sekunden zum Generieren benötigen, was störend sein kann. Trotz einiger merkwürdiger Ergebnisse war es erfreulich, die Kreationen zu verfeinern. Whisk nutzt das neueste Bildgenerierungsmodell Imagen 3 von Google, das heute angekündigt wurde. Google hat auch Veo 2 eingeführt, das aktualisierte Videogenerierungsmodell, das ein besseres Verständnis für Kinematografie hat und im Vergleich zu anderen Modellen, wahrscheinlich in Anspielung auf OpenAIs Sora, Probleme wie zusätzliche Finger reduziert hat. Veo 2 wird zunächst über Googles VideoFX zugänglich sein, das über die Warteliste von Google Labs zugänglich ist, mit Plänen, es nächstes Jahr auf YouTube Shorts und andere Produkte zu erweitern.
Watch video about
Google enthüllt Whisk: Ein KI-Bildgenerierungs-Tool mithilfe von Bildvorgaben.
Try our premium solution and start getting clients — at no cost to you