Inilunsad ng Google ang Imagen 3: Advanced AI Text-to-Image Generator
Brief news summary
Inilabas ng Google ang pinakabagong bersyon ng AI text-to-image generator nito, ang Imagen 3, sa US. Ang tool, magagamit sa AI Test Kitchen ng Google, ay dinisenyo upang makagawa ng mga imahe na may mas magandang detalye at ilaw kumpara sa mga naunang mga modelo. Inanunsyo ito noong Google I/O noong Mayo at kamakailan lang naging pangkalahatang magagamit sa platform ng Vertex AI. Ang Imagen 3 ay nagpapahintulot sa mga gumagamit na lumikha ng detalyadong mga imahe batay sa mga prompt at i-edit ang mga ito sa pamamagitan ng paglalarawan ng nais na mga pagbabago. Habang may mga limitasyon ang tool, tulad ng hindi pagbuo ng mga imahe ng pampublikong tao o mga armas, maaaring ilarawan ng mga gumagamit ang mga karakter na may copyright upang mapalampas ang mga restriksyon. Kabaligtaran sa mas maluwag na AI image generator na Grok sa platform ni Elon Musk na X, ang Imagen 3 ay may mas mahigpit na mga alituntunin. Gayunpaman, ang mga AI tools ng Google ay nakaranas ng mga isyu, tulad ng paglikha ng mga historical na hindi tamang mga imahe gamit ang Gemini AI chatbot nito mas maaga ngayong taon.Kamakailan lang inilabas ng Google ang Imagen 3, ang advanced AI text-to-image generator nito, sa mga gumagamit sa Estados Unidos. Ang pinakabagong bersyon na ito ay layunin na pahusayin ang kalidad ng imahe sa pamamagitan ng pagbibigay ng mas magandang detalye, pinahusay na ilaw, at pagbabawas ng mga nakakagambalang artifact kumpara sa mga naunang modelo ng Google. Unang inianunsyo sa I/O conference noong Mayo, ang Imagen 3 ay magagamit na sa platform ng Vertex AI ng Google sa nakaraang ilang araw. Ang maagang mga eksperimento ng mga gumagamit ng Reddit ay nagsimula noong nakaraang linggo, at isang research paper ukol sa tool na ito ang inilathala ng Google noong Martes. Kagaya ng iba pang AI image generators, ang Imagen 3 ay maaaring makagawa ng detalyadong mga imahe batay sa mga prompt ng gumagamit. Maaari ring i-edit ng mga gumagamit ang mga nalikhang imahe sa pamamagitan ng pagtukoy ng nais na mga pagbabago. Habang may mga ilang limitasyon, tulad ng pagtangging gumawa ng mga imahe ng mga pampublikong tao tulad ni Taylor Swift at pag-iwas sa mga imahe ng mga armas, ang Imagen 3 ay maaari pa ring makagawa ng mga karakter na kamukha ng mga may copyright na mga figure kung ilalarawan imbes na pangalanan. Personal, nagawa kong gamitin ang tool upang lumikha ng mga imaheng kamukha ni Sonic the Hedgehog at Mario, habang ang aking kasamahan ay matagumpay na lumikha ng mga karakter na kamukha ni Mickey Mouse.
Higit pa rito, ang tool ay gumagawa ng mga logo para sa iba't ibang mga kumpanya kabilang na ang Apple, Macy's, Hershey's, at maging ang Google. Kahit na may mga flexible na hangganan, ang Imagen 3 ay gumagamit ng ibang pamamaraan kumpara sa Grok, ang AI image generator sa platform ni Elon Musk na X. Kilala ang Grok na gumawa ng mga kontrobersyal na nilalaman, kabilang na ang mga imahe tungkol sa droga, karahasan, at mga pampublikong tao na sangkot sa mga kaduda-dudang gawain. Ang mga AI tools ng Google ay may mga sariling hamon din. Mas maaga ngayong taon, kinailangan ng Google na higpitan ang kakayahan ng pagbuo ng imahe ng Gemini AI chatbot nito dahil sa mga alalahanin ng paglikha ng mga historical na hindi tamang imahe.
Watch video about
Inilunsad ng Google ang Imagen 3: Advanced AI Text-to-Image Generator
Try our premium solution and start getting clients — at no cost to you