Google Veo 3 AI ვიდეო გენერატორი: აუდიოსა და ვიდეოს სინქრონიზაცია შთამბეჭდავი რეალიზმით

სუთმვერს, Google-მა წარადგინა Veo 3, ახალი AI ვიდეოს სინთეზის მოდელი, რომელიც შეუძლებელია სხვა ძირითადი AI ვიდეოს გენერატორმა აქამდე მიაღწიოს: სინქრონული აუდიო ట్రეკის შექმნა ვიდეოსთან ერთად. 2022-დან 2024 წლამდე, სამოქმედო AI-განწმენდილი ვიდეოები უმეტესად ულმობელი და მოკრძალებულია. ახლა, Veo 3 წარმოგვიდგენს რვა-სექუნდის ჰაიდეფინიცია კლიპებს, რომლებშიც არის ხმოვანი სარწმუნოებები, დიალოგი და სუნის ეფექტები. გამოშვების შედეგად, ადამიანები დაუყოვნებლივ დაუსვეს ნათელი ბენჩმარკის კითხვა: რამდენად კარგად შეუძლია Veo 3-ის ფანდი ოსკარის გამარჯვებული მსახიობი უილიამ სმიტის ფრანგული გლეჯის ნაწილის სოჭიო? ჩვეულებრივი მიმოწერის მოსახდენობისთვის: AI ვიდეოში "გაზი ბენჩმარკი" დაიწყო მარტში 2023 წელს, ადრეული და ზოგჯერ დამაბრკოლებელი AI-განწმენდილი ვიდეოს შექმნით, რომელსაც იყენებდა გახსნის წყაროს სინთეზის მოდელი სახელწოდებით ModelScope. ის გარღვევა იყო ისეთი ცნობილი, რომ სმიტმა წამოიწია ეს ვიდეო σχεოდ წელს, 2024 წელს, თებერვალში, ხუმრობით. ეს არის შეჯამება იმისა, რა შეხსენებით იყო ის ვირუსული ვიდეო: სხვადასხვაას ხშირად დავიწყებულია ის, რომ იმ დროს სმიტის პაროდია არ გამოიყენებოდა საუკეთესო AI ვიდეო გენერატორზე. აფიშირებული გამოთვლითი მოდელი, სახელად Gen-2, რომელიც ჯერ კიდევ ვერ იქნებოდა საჯაროდ ჩართვადი, უკვე აძლევდა უკეთეს შედეგებს. თუმცა, ModelScope ვერსია იყო უჩვეულო და უკეთ მახსოვრი, რათა დაემყარებინა პირველი AI ვიდეოს შეზღუდვები, სადაც ტექნოლოგია განვითარდა. ამ კვირის დასაწყისში, AI აპლიკაციის მძღოლი ხავი ლოპესი უპასუხა ფანებს, რომლებიც იწინასწარმეტყველებდნენ Veo 3-ის გამოყენებით სავარაუდო spaghetti ტესტის გასაჩივრებენ. მან მიმოიხილა შედეგები X-ზე. თუმცა, როდესაც შედეგებს უყურებდნენ, საუბრიანი საუდტრეკი უცნაური ჩანდა: ფალჩი სმიტი ისეთ აკლდამას მსგავსი უღატისგან ითამაშებდა, თითქოს ხლიტავდა. ეს შეცდომა ხვდება Veo 3-ის ექსპერიმენტალურ უნარს სუნის ეფექტების დამატებით — სავარაუდოდ, მასში შეიყვანეს უამრავი მაგალითი გადამწყვეტი ყივყიტა, accompanied by crunching ხმები.
გენერაციული AI-პროექტები ფუნქციონირებს როგორც მორკილ-შესაბამისობის პროგნოზის სისტემები, რომლებიც მორგებული არიან საკმარის მონაცემებზე სხვადასხვა მედია ტიპებში, რათა წარმოშვან სარწმუნო ეფექტი. როდესაც 특정 კონცეფციები მეტ ან ნაკლებად წარმოდგენილი იქნებიან ამ მონაცემებში, ეს იწვევს სინდიკატურ ეფექტებს, გაენცნებს ამ ფაქტებს. ჩვენც თავად განვახორციელეთ უშუალო გამოკითხვა Veo 3-ზე, მაგრამ "უილიამ სმიტი" დაცული იყო Google-ის ფაილტერზე. თუმცა, გამოკითხვა "შავი კაცის გლეჯი სპაგეტი" გამოიმუშავა მსგავსი ხმოვანი ეფექტი (შესაძლოა, ლოპესს ჰქონდა ადრეული უფასო წვდომა ფილტრის გარეშე, ან სცადა სხვადასხვა გამოკითხვაზე, რომლებმაც ჩაიწერეს). Veo 3 დაამტკიცა თავისი უნარით დაკავშირებული დიალოგებისა და მუსიკის წარმოქმნის, უკვე შთაგონებულ უამრავ იშვიათი მაგალითებით X-ზე. არ ვიჩქარეთ შეშფოთებით მხოლოდ ერთ ვიდეოზე, სადაც მამაკაცი უძველესი ნუდლს უგზავნის, მაგრამ შევამოწმეთ, თუ შეუძლია მტკიცედ მღეროდა და ერთდროულად ჭამა, ვთქვი გამოკითხვა: "მამაკაცი ინგლისურსმღერალი კომედიის ოპერა სპაგეტის შესახებ კულინარიულ სუფრაზე, რომლიც მჭამავს. " ჩვენ უკვე მნიშვნელოვან პროგრესს მივაღწიეთ 2023 წლიდან, და AI ვიდეოს გენერატორები გაგრძელდებიან უკეთობის და რეალიზმის მიმართულებით. თუ არა Veo 3-ის პერსონაჟი უკვე ცნობილი ვარსკვლავების ფილტრი, შეგვიძლია მარტივად შევქმნათ სმიტის სოლო გამოჩენით ან თითქმის ნებისმიერი სხვა, რაც ამიჩენს შესაძლო შეშფოთებას AI ვიდეო ტექნოლოგიის მიმართ. კულტურული სინგულარობა სწრაფად მიახლოვდება. ამასთან, ჩვენაც გავაკეთეთ ჩვენი საკუთარი მასიური ტესტები ვიდეოს შექმნის მიმართულებით Veo 3-სთან, და მალე გავაზიარებთ ამ შედეგებს სპეციალური სტატიით. ამჟამად მიიჩნიეთ ეს მოკლე ინფორმაცია ყურსასმული პრინცის შესახებ. გთხოვთ, უგემრიელეს!
Brief news summary
გուգლმა წარმოადგინა ვეო 3, თანამედროვე ხელოვნური ინტელექტის ვიდეოსადმი სინთეზის მოდელი, რომელიც შეუძლიათ სინქრონი ოთხი მეოთხე -საუკუნის HD ვიდეოები, აუდიო, დიალოგი და ხმაურის ეფექტებით — და გადაჭიმული წინა ხელსაწყოებისგან, რომლებიც מוגავთ სიჩუმე ან ძალიან მცირე ანაკლებით. სარჩევებში, ვეო 3 წარმატებით დაარწმუნა ბენჩმარკის სცენარი, პარტყიველ ვილ სმიტს, რომელიც ჭამდა ספაგეტი დაბალ ხარისხის 2023 წლის ვიდეოდან. მიუხედავად იმისა, რომ მოდელმა ეფექტურად სინქრონი ვიდეო და აუდიო, წარმოადგინა უცნაური „ქრანჩინგი“ ხმაური სენსაციის დროს, სავარაუდოდ, იმის გამო, რომ სასწავლო მონაცემები განსაკუთრებით აქცენტს იძლებოდა ყლუპის ხმებზე. შინაარსის ბლოკერები აძლიერებენ პირდაპირი „ველ სმიტი“ პრომპტების შეზღუდვას, მაგრამ მსგავსი შეტყობინებები რჩებიან პტერ წყვეტა აუდიო გაფუჭებებით. მიუხედავად ამ სირთულეებისა, ვეო 3 შესანიშნავად გამოსახავს კოორდინირებულ დიალოგებს და მუსიკას, რაც გამოიღო სCreativ-ის ხილვები, როგორიცაა კომედიური სპაგეტი ოპერაციის შექმნა. ეს წინსვლა წარმოადგენს მნიშვნელოვან ნაბიჯს რეალისტური ხელოვნური ინტელექტის მედიასამუშაოების შექმნის მიმართულებით, თუმცა კანონმდებლობის შეზღუდვები პიარების მსგავსების შესახებ განაგრძობს დაუძლეველ ჩრდილებს. ვეო 3-ის ადანაცვლება გამოიწვია სოცოცხლის განხილვა ხელოვნური ინტელექტის ვიდეოს რეალობასთან დაკავშირებით და წარმოადგენს ახალ მოტივს „ფრეშ პრინცი“ სპაგეტის ისტორიაში, გამართულ ტესტირების პარალელურად.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

ხელოვნური ინტელექტის რბოლა გრაფიკურად აჩქარებს მთ…
მწარმოებელი ინტელექტის ინდუსტრია შაბათ-კვირაში უპრეცედენტოდ გაიზარდა მნიშვნელოვანი მიღწევებით, რამაც აჩვენა სწრაფი ინოვაციები და ინტენსიური შეჯიბრებები წამყვან טექნოლოგიურ კომპანიებს შორის.

გუგლი ისევ შეუძლია ლიდერობა იპოვოს საძიებო სისტემ…
Google-ის 2025 წლის დეველოპერების კონფერენციაზე კომპანია გამოავლინა მისი ძირითადი ძიების ფუნქციონალის მასშტაბური რედაქტირება, სადაც ხაზგასმით მიუთითეს ხელოვნური ინტელექტის მნიშვნელოვანი როლი მის მომავალში.

ვაშინგტონი ემუქრება კრიპტოს: სტაბილკოინის და ბლოქ…
ამ კვირის ეპიზოდში Byte-Sized Insight-ი Decentralize-თან ერთად Cointelegraph-ით ჩვენ ვსაუბრობთ ამერიკის კრიპტო ლიგიტიმაციის ერთ-ერთი განმსაზღვრელი დეველოპმენტის შესახებ.

ციფრული აქტივების საფუძვლები: რატომ ხდება აქციები…
10-წლიანი პერიოდი გავიდა მას შემდეგ, რაც პირველი ბიტკოინი შეიქმნა, და კრიპტოვალუტა ახლა ასრულებს თავისი საწყისული ხარჯებს, გარდაქმნის გრძელვადიან ფინანსურ სისტემებს.

აქ არის Google I/O-ს 6 ყველაზე მნიშვნელოვანი მიღწ…
ამ კვირის Google I/O კონფერენციაზე ტექნოლოგიური გიგანტი აღნიშნა დაახლოებით 100 განცხადება, გაზრდილი იმედებით AI-ის დომინაციისკენ სხვადასხვა სფეროებში — სასარგებლოდ სერჩის რეფორმირებიდანვე AI მოდელების და ტანისამოსის ტექნოლოგიების განახლებამდე.

ბიტქოინი გამოდის 111,000 დოლარს ზევით: ბლოკჩეინ კ…
ბიტკოინი ისევ განახლებული ყურადღების ცენტრშია, მას შემდეგ რაც პირველად გადალახა 111,000 დოლარი, დამძიმდა ინსტიტუციური ინვესტორების, გეოპოლიტიკური მორეოლოგიური დინამიკის ცვლილებისა და განახლებული კრიპტო სიჩქარის გამო.

რა ფიქრობს AI-ი ზონადით მოქალაქეობის საკითხებში მ…
ტრাম্পი V