Google enthüllt Whisk: Ein KI-Bildgenerierungs-Tool mithilfe von Bildvorgaben.

Google hat ein KI-Tool namens Whisk vorgestellt, das die Bildgenerierung mithilfe von Bildern als Eingabe statt langer Texteingaben ermöglicht. Mit Whisk können Sie Bilder verwenden, um das Motiv, die Szene und den Stil Ihres gewünschten KI-generierten Bildes zu definieren, wobei mehrere Bilder pro Kategorie erlaubt sind. Zusätzlich können, wenn auch optional, Texteingaben verwendet werden. Wenn Ihnen passende Bilder fehlen, kann ein Würfelsymbol Vorschläge generieren, die ebenfalls KI-basiert sind. Das Hinzufügen von Text am Ende für zusätzliche Details ist optional. Whisk generiert Bilder und einen entsprechenden Textprompt für jedes Bild.
Sie können ein Bild als Favorit markieren oder herunterladen, wenn Sie zufrieden sind, oder das Bild durch Hinzufügen von Text oder Bearbeitung des Textprompts verfeinern. Google betont, dass Whisk für "schnelle visuelle Erkundung" gedacht ist und nicht für pixelgenaue Bearbeitungen, und räumt ein, dass es möglicherweise nicht immer die Erwartungen erfüllt, daher die Bearbeitungsoption. In meiner kurzen Erfahrung mit Whisk war es unterhaltsam, damit zu experimentieren, obwohl die Bilder ein paar Sekunden zum Generieren benötigen, was störend sein kann. Trotz einiger merkwürdiger Ergebnisse war es erfreulich, die Kreationen zu verfeinern. Whisk nutzt das neueste Bildgenerierungsmodell Imagen 3 von Google, das heute angekündigt wurde. Google hat auch Veo 2 eingeführt, das aktualisierte Videogenerierungsmodell, das ein besseres Verständnis für Kinematografie hat und im Vergleich zu anderen Modellen, wahrscheinlich in Anspielung auf OpenAIs Sora, Probleme wie zusätzliche Finger reduziert hat. Veo 2 wird zunächst über Googles VideoFX zugänglich sein, das über die Warteliste von Google Labs zugänglich ist, mit Plänen, es nächstes Jahr auf YouTube Shorts und andere Produkte zu erweitern.
Brief news summary
Google hat Whisk eingeführt, ein KI-Tool, das Bilder mithilfe von Bildanweisungen anstatt nur Text generiert. Nutzer können Bilder kombinieren, um das Motiv, die Szene und den Stil festzulegen, und ein Würfelsymbol bietet KI-Bildvorschläge. Ein optionales Textfeld steht für Anpassungen zur Verfügung. Bilder können mit Textanweisungen erstellt werden und anschließend favorisiert, heruntergeladen oder modifiziert werden. Whisk ist für eine „schnelle visuelle Erkundung“ konzipiert und nicht für detaillierte Bearbeitungen. Google weist darauf hin, dass die Ergebnisse möglicherweise nicht immer den Erwartungen entsprechen und bietet Optionen zur Anpassung der Anweisungen. Whisk wird durch Googles Imagen 3 Bildgenerierungsmodell betrieben, das mit dem Tool eingeführt wurde. Außerdem kündigte Google Veo 2 an, ein neues Videogenerierungsmodell, das in Googles VideoFX eingebettet ist und in YouTube Shorts integriert werden soll. Veo 2 verbessert das Verständnis für Kinematografie und behebt Ungenauigkeiten, die in früheren Modellen auftraten. Benutzerfeedback zu Whisk ist im Allgemeinen positiv, obwohl einige über Verzögerungen und unerwartete Ergebnisse bei der Bildgenerierung berichtet haben.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!
Hot news

US-Gesetzgeber stellen Gesetzesentwurf vor, um ch…
Eine parteiübergreifende Gruppe von US-Gesetzgebern hat eine bahnbrechende Gesetzgebung namens No Adversarial AI Act vorgestellt, die das Verbot chinesischer Künstlicher Intelligenz (KI)-Systeme innerhalb der Bundesregierung vorsieht.

Digital Asset, Entwickler der datenschutzfokussie…
Digital Asset, der Entwickler hinter dem datenschutzorientierten Blockchain Canton Network, kündigte am Dienstag an, dass er in einer strategischen Finanzierungsrunde 135 Millionen US-Dollar gesichert hat.

JPMorgan führt JPMD Deposit Token für institution…
JPMorgan hat JPMD vorgestellt, eine neue Digitalwährung, die speziell für institutionelle Kunden entwickelt wurde, um sichere On-Chain-Zahlungen durchzuführen.

OpenAI berichtet, dass Chinas Zhipu AI im Zuge de…
Das chinesische KI-Start-up Zhipu AI hat laut Berichten von OpenAI bedeutende Fortschritte bei der Akquise von Regierungsaufträgen in Regionen wie Malaysia, Singapur, den Vereinigten Arabischen Emiraten, Saudi-Arabien und Kenia gemacht.

US-Bundesstaaten verschärfen Regulierung von Kryp…
In den Vereinigten Staaten verstärken die Bundesstaaten ihre Bemühungen, Kryptowährungs-ATMs zu regulieren, angesichts eines starken Anstiegs von Betrugsfällen, insbesondere solchen, die Senioren ins Visier nehmen.

KI-Tools verbessern die Unterrichtseffizienz und …
Künstliche Intelligenz (KI)-Werkzeuge verändern die Bildungslandschaft in den Vereinigten Staaten rasch und bieten Lehrkräften neue Möglichkeiten, die Effizienz ihrer Unterrichtsmethoden zu steigern und ihre Work-Life-Balance zu verbessern.

US-Kongress kommt kurz vor Verabschiedung eines R…
Nach mehreren Jahren des Engagements ist der US-Kongress nun kurz davor, einen umfassenden regulatorischen Rahmen speziell für Stablecoins zu verabschieden.