lang icon Vietnamese
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

May 24, 2025, 6:48 a.m.
3

Google Veo 3 Trình Tạo Video AI: Đồng Bộ Hóa Âm Thanh và Hình Ảnh Với Hiện Thực Ấn Tượng

Vào thứ Ba, Google giới thiệu Veo 3, một mô hình tổng hợp video AI mới có khả năng đạt được điều mà bất kỳ trình tạo video AI lớn nào trước đây chưa thể làm được: tạo ra một bản nhạc đồng bộ cùng với video. Giữa năm 2022 và 2024, các video AI tạo ra trong giai đoạn đầu thường im lặng và rất ngắn. Giờ đây, Veo 3 mang tới các đoạn phim độ phân giải cao dài tám giây kèm theo giọng nói, đối thoại và hiệu ứng âm thanh. Sau khi ra mắt, mọi người ngay lập tức đặt ra câu hỏi kiểm tra tiêu chuẩn rõ ràng: Veo 3 có thể giả mạo diễn viên đoạt Oscar Will Smith đang ăn mì Ý như thế nào? Tóm tắt nhanh: "Thước đo mì Ý" trong lĩnh vực video AI bắt đầu từ tháng 3 năm 2023 với một video AI được tạo ra khá rối loạn, sử dụng mô hình tổng hợp mã nguồn mở có tên ModelScope. Ví dụ về mì Ý này trở nên nổi tiếng đến mức Smith đã chế lại nó gần một năm sau, vào tháng 2 năm 2024. Dưới đây là nhắc nhở về hình ảnh của video lan truyền ban đầu: Điều thường bị quên là vào thời điểm đó, bản parody của Smith không phải do trình tạo video AI tốt nhất thời bấy giờ thực hiện—một mô hình gọi là Gen-2 của Runway đã mang lại kết quả chất lượng cao hơn, mặc dù chưa được công khai. Tuy nhiên, phiên bản của ModelScope đủ kỳ quặc và đáng nhớ để trở thành mốc tham chiếu cho những giới hạn ban đầu của AI video khi công nghệ tiến bộ. Đầu tuần này, nhà phát triển ứng dụng AI Javi Lopez đã phản hồi các fan mong muốn làm lại thử nghiệm mì Ý bằng Veo 3 và chia sẻ kết quả của mình trên X. Tuy nhiên, khi xem các kết quả này, phần âm thanh có vẻ lạ: cái giả Smith nghe giống như đang nhai mì Ý. Lỗi này xuất phát từ khả năng thử nghiệm của Veo 3 trong việc thêm hiệu ứng âm thanh, có thể do dữ liệu huấn luyện của nó đã bao gồm nhiều ví dụ về việc nhai kèm theo tiếng răng rắc. Các mô hình AI sinh nội dung hoạt động như các hệ thống dự đoán theo mẫu, dựa vào dữ liệu huấn luyện đủ phong phú trong nhiều loại phương tiện để tạo ra kết quả thuyết phục.

Khi một số khái niệm bị thiếu hoặc quá phổ biến trong dữ liệu đó, sẽ xuất hiện các hiện tượng bất thường trong kết quả như thế này. Chúng tôi cũng tự thử nghiệm với câu lệnh trên Veo 3, nhưng “Will Smith” bị chặn bởi bộ lọc nội dung của Google. Tuy nhiên, dùng câu “Một người đàn ông da đen đang ăn mì Ý” lại tạo ra hiệu ứng âm thanh giòn giã tương tự (có thể Lopez đã có quyền truy cập sớm mà không bị lọc hoặc thử nghiệm với các biến thể câu lệnh qua mặt bộ lọc). Veo 3 gây ấn tượng bởi khả năng tạo ra đối thoại và nhạc hợp lý, đã truyền cảm hứng cho nhiều ví dụ nổi bật trên X. Không muốn dừng lại ở một đoạn video về một người đàn ông ăn mì cực kỳ dai, chúng tôi đã thử xem nhân vật đó có thể hát và ăn cùng lúc không, bằng câu lệnh: “Một người đàn ông hát một opera hài bằng tiếng Anh về mì Ý tại bàn bếp trong khi ăn nó. ” Chúng tôi đã đạt tiến bộ đáng kể kể từ năm 2023, và các trình tạo video AI sẽ tiếp tục cải thiện về độ chân thực và khả năng thực thi. Nếu không có bộ lọc liên quan đến các nghệ sĩ nổi tiếng của Veo 3 hiện tại, chúng tôi dễ dàng có thể tạo ra video của Smith đang hát—hoặc làm bất cứ điều gì khác—điều này làm nổi bật những lo ngại tiềm ẩn về công nghệ video AI. Sự đặc thù văn hóa đang đến gần rất nhanh. Nói đến đây, chúng tôi gần đây đã thực hiện một loạt thử nghiệm tạo video rộng rãi với Veo 3 và sẽ sớm chia sẻ kết quả trong một bài phóng sự đặc biệt. Hiện tại, hãy xem đây như một cập nhật ngắn về chàng Hoàng tử tươi mới của thời mì noodle. Chúc ngon miệng!



Brief news summary

Google đã giới thiệu Veo 3, một mô hình tổng hợp video AI tiên tiến có khả năng tạo ra các video HD kéo dài tám giây đồng bộ với âm thanh, đối thoại và hiệu ứng âm thanh—vượt qua các công cụ trước đó chỉ giới hạn ở các đoạn clip im lặng hoặc rất ngắn. Trong quá trình thử nghiệm, Veo 3 đã thành công trong việc tái tạo một kịch bản tiêu chuẩn bằng cách sao chép cảnh diễn của diễn viên đoạt giải Oscar Will Smith ăn mì Ý từ một video chất lượng thấp năm 2023. Mặc dù mô hình đồng bộ video và âm thanh rất hiệu quả, nó phát ra một âm thanh "nặng" lạ trong cảnh ăn mì Ý, có khả năng do dữ liệu đào tạo ưu tiên nhấn mạnh các tiếng nhai. Các bộ lọc nội dung chặn các lệnh trực tiếp như "Will Smith", nhưng các lệnh tương tự vẫn gây ra lỗi âm thanh. Dù gặp gặp một số thách thức này, Veo 3 vẫn xuất sắc trong việc tạo ra các đoạn đối thoại và âm nhạc mạch lạc, truyền cảm hứng cho các dự án sáng tạo như một vở opera hài về mì Ý. Tiến bộ này mở ra một bước tiến quan trọng hướng tới đa phương tiện do AI tạo ra chân thực hơn, mặc dù các hạn chế về khả năng mô phỏng hình ảnh người nổi tiếng vẫn là những trở ngại cần giải quyết. Việc ra mắt Veo 3 đã kích hoạt các cuộc tranh luận văn hóa về tính thực của video AI và mang đến một khúc nhộn nhịp mới cho câu chuyện mì Ý của “Chàng Hoàng Tử Mới” giữa các thử nghiệm vẫn đang tiếp tục.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 24, 2025, 9:57 a.m.

Cuộc đua AI đang tăng tốc với các thông báo quan …

Ngành công nghiệp trí tuệ nhân tạo đã chứng kiến một sự bùng nổ đáng kể với nhiều phát triển lớn trong tuần qua, nhấn mạnh sự đổi mới nhanh chóng và cuộc cạnh tranh mãnh liệt giữa các tập đoàn công nghệ hàng đầu.

May 24, 2025, 8:23 a.m.

Google vẫn còn chiếm lĩnh thị trường tìm kiếm tro…

Trong hội nghị nhà phát triển Google năm 2025, công ty đã tiết lộ một cuộc cách mạng lớn về chức năng tìm kiếm cốt lõi của mình, nhấn mạnh vai trò quan trọng của trí tuệ nhân tạo trong tương lai.

May 24, 2025, 7:36 a.m.

Washington thúc đẩy lĩnh vực tiền điện tử: Dự luậ…

Trong tập tuần này của Byte-Sized Insight trên Decentralize cùng Cointelegraph, chúng ta khám phá một bước tiến quan trọng trong luật pháp về tiền điện tử của Mỹ.

May 24, 2025, 5:55 a.m.

Sách hướng dẫn về tài sản kỹ thuật số: Tại sao th…

Đã hơn 15 năm kể từ khi đồng bitcoin đầu tiên được tạo ra, và tiền mã hóa hiện đang thực hiện một số lời hứa ban đầu của nó bằng cách chuyển đổi các hệ thống tài chính lâu đời.

May 24, 2025, 5:11 a.m.

Dưới đây là 6 điểm nổi bật nhất từ Google I/O, nơ…

Trong buổi hội nghị Google I/O tuần này, gã khổng lồ công nghệ đã ra mắt khoảng 100 thông báo, thể hiện tham vọng chinh phục AI trên nhiều lĩnh vực—from việc đổi mới Công cụ Tìm kiếm đến cập nhật các mô hình AI và công nghệ thiết bị đeo.

May 24, 2025, 4:18 a.m.

Bitcoin vượt mức trên 111.000 USD: Khai thác đám …

Bitcoin lại thu hút sự chú ý toàn cầu sau khi vượt mốc 111.000 đô la lần đầu tiên, được thúc đẩy bởi các nhà đầu tư tổ chức, sự thay đổi trong động thái tiền tệ địa chính trị và sự bùng nổ mới trong lĩnh vực tiền điện tử.

May 24, 2025, 3:31 a.m.

AI nghĩ gì về những khả năng xảy ra trong các vụ …

Trump kiện CASA trong lò phản ứng AI: Mô phỏng các phán quyết của Tòa án Tối cao Tuần trước, Tòa án Tối cao đã nghe vụ Trump kiện CASA, Inc

All news