lang icon En
Feb. 5, 2025, 12:22 a.m.
3025

ByteDance Ra Mắt OmniHuman: Hệ Thống Tạo Video AI Cách Mạng

Brief news summary

ByteDance đã ra mắt OmniHuman, một hệ thống AI đột phá biến đổi hình ảnh tĩnh thành video tương tác hấp dẫn với âm thanh, nhạc nền và chuyển động. Sự tiến bộ này đại diện cho một cột mốc lớn trong giải trí kỹ thuật số và giao tiếp, cho phép tạo ra hoạt hình toàn thân với những cử chỉ động, điều này đã có sự cải tiến đáng kể so với các công nghệ trước đây chỉ ghi lại chuyển động khuôn mặt hoặc phần thân trên. OmniHuman sử dụng một tập dữ liệu khổng lồ với hơn 18.700 giờ video và áp dụng phương pháp đào tạo phức tạp "điều kiện toàn diện". Cách tiếp cận này kết hợp giữa văn bản, âm thanh và dữ liệu chuyển động, dẫn đến sản phẩm video rất thực tế và nhanh chóng. Tính linh hoạt của công nghệ này cho phép tạo ra một loạt nội dung đa dạng, bao gồm diễn thuyết và biểu diễn âm nhạc, với chất lượng vượt trội hơn so với các mô hình trước đây. Khi các đối thủ lớn như Google, Meta và Microsoft đang khám phá các công nghệ tương tự, cách tiếp cận độc đáo của ByteDance giúp họ định vị tốt trong lĩnh vực đang phát triển nhanh chóng này. Tuy nhiên, sự xuất hiện của OmniHuman cũng kéo theo những vấn đề đạo đức liên quan đến việc có thể lạm dụng truyền thông tổng hợp. Nhóm nghiên cứu dự định trình bày những phát hiện của họ tại một hội nghị về thị giác máy tính sắp tới, góp phần vào cuộc thảo luận xung quanh công nghệ đổi mới này.

Các nhà nghiên cứu tại ByteDance đã phát triển một hệ thống AI đột phá có khả năng chuyển đổi hình ảnh cá nhân thành video chân thực của mọi người đang nói, hát và di chuyển một cách mượt mà—một sự đổi mới có khả năng cách mạng hóa lĩnh vực giải trí kỹ thuật số và giao tiếp. Hệ thống mới được phát triển, mang tên OmniHuman, sản xuất video toàn thân mô tả cá nhân thực hiện cử chỉ và di chuyển đồng bộ với lời nói của họ, vượt qua giới hạn của các mô hình AI trước đây chỉ tạo hoạt ảnh cho khuôn mặt hoặc phần thân trên. Để huấn luyện OmniHuman, nhóm đã sử dụng tới 18. 700 giờ dữ liệu video ấn tượng để giúp cải thiện chuyển động thực tế. Theo nhóm nghiên cứu của ByteDance, họ đã công bố kết quả trên arXiv, “Hoạt hình con người từ đầu đến cuối đã chứng kiến những cải tiến đáng kể trong những năm gần đây. Tuy nhiên, các phương pháp hiện tại vẫn gặp khó khăn trong việc mở rộng quy mô như các mô hình tạo video chung lớn, hạn chế ứng dụng thực tiễn của chúng. ” Để tạo ra OmniHuman, nhóm đã áp dụng một chiến lược sáng tạo liên quan đến hơn 18. 700 giờ dữ liệu video con người, tích hợp nhiều đầu vào—văn bản, âm thanh và chuyển động cơ thể. Phương pháp huấn luyện “điều kiện toàn diện” này cho phép AI rút ra từ các tập dữ liệu lớn hơn và đa dạng hơn so với các kỹ thuật trước đây. Đột phá này trong việc tạo video AI cho thấy chuyển động toàn thân và cử chỉ tự nhiên. Nhóm nghiên cứu lưu ý, “Nhận thức chính của chúng tôi là việc tích hợp nhiều tín hiệu điều kiện, chẳng hạn như văn bản, âm thanh và tư thế, trong quá trình huấn luyện có thể giảm thiểu lãng phí dữ liệu một cách rõ rệt. ” Công nghệ này đánh dấu một bước tiến lớn trong truyền thông do AI tạo ra, với khả năng bao gồm việc sản xuất video cho các cá nhân phát biểu và minh họa các chủ đề chơi nhạc cụ.

Trong các thử nghiệm, OmniHuman đã vượt qua các hệ thống hiện có trong nhiều chỉ số chất lượng. Khi các gã khổng lồ công nghệ như Google, Meta và Microsoft cạnh tranh phát triển công nghệ video AI thế hệ tiếp theo, sự tiến bộ của ByteDance có thể mang lại lợi thế cạnh tranh cho công ty mẹ TikTok trong bối cảnh đang nhanh chóng thay đổi này. Các chuyên gia tin rằng công nghệ này có khả năng cách mạng hóa lĩnh vực sản xuất giải trí, tạo ra nội dung giáo dục và giao tiếp kỹ thuật số. Tuy nhiên, nó cũng đặt ra lo ngại về khả năng sử dụng sai mục đích của phương tiện tổng hợp cho các mục đích lừa đảo. Các nhà nghiên cứu dự định trình bày các phát hiện của họ tại một hội nghị thị giác máy tính sắp tới, mặc dù họ chưa công bố chi tiết cụ thể.


Watch video about

ByteDance Ra Mắt OmniHuman: Hệ Thống Tạo Video AI Cách Mạng

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 16, 2025, 1:29 p.m.

Ứng dụng AI của tuần trên SaaStr: Kintsugi — AI t…

Mỗi tuần, chúng tôi đều giới thiệu một ứng dụng dựa trên trí tuệ nhân tạo giúp giải quyết các vấn đề thực tế cho các công ty B2B và Cloud.

Dec. 16, 2025, 1:24 p.m.

Vai trò của Trí tuệ nhân tạo trong Chiến lược SEO…

Trí tuệ nhân tạo (AI) ngày càng ảnh hưởng sâu sắc đến các chiến lược tối ưu hóa công cụ tìm kiếm địa phương (SEO).

Dec. 16, 2025, 1:22 p.m.

Công nghệ IND huy động 33 triệu USD để ngăn chặn …

Công ty IND Technology, một công ty của Úc chuyên về giám sát hạ tầng cho các dịch vụ tiện ích, đã huy động thành công 33 triệu đô la Mỹ vốn tăng trưởng để đẩy mạnh các nỗ lực dựa trên trí tuệ nhân tạo nhằm ngăn chặn các đám cháy rừng và mất điện.

Dec. 16, 2025, 1:21 p.m.

Triển khai trí tuệ nhân tạo trở nên rối rắm đối v…

Trong những tuần gần đây, ngày càng nhiều nhà xuất bản và thương hiệu phải đối mặt với phản ứng gay gắt khi thử nghiệm trí tuệ nhân tạo (AI) trong quy trình sản xuất nội dung của họ.

Dec. 16, 2025, 1:17 p.m.

Google Labs và DeepMind ra mắt Pomelli: Công cụ t…

Google Labs, hợp tác cùng Google DeepMind, đã giới thiệu Pomelli, một thử nghiệm dựa trên trí tuệ nhân tạo nhằm giúp các doanh nghiệp nhỏ và vừa phát triển các chiến dịch marketing phù hợp với thương hiệu của mình.

Dec. 16, 2025, 1:15 p.m.

Công nghệ Nhận diện Video AI Nâng cao Quản lý Nội…

Trong bối cảnh ngày nay với tốc độ mở rộng của thế giới số, các công ty mạng xã hội ngày càng ứng dụng các công nghệ tiên tiến nhằm bảo vệ cộng đồng trực tuyến của họ.

Dec. 16, 2025, 9:37 a.m.

Tại sao năm 2026 có thể trở thành năm của chiến d…

Một phiên bản của câu chuyện này đã xuất hiện trong bản tin Nightcap của CNN Business.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today