lang icon En
Nov. 4, 2025, 5:28 a.m.
3734

ByteDance Ra mắt Goku: Mẫu AI mã nguồn mở chuyển đổi văn bản thành video thách thức OpenAI’s Sora

Brief news summary

Lĩnh vực AI chuyển đổi văn bản thành video đang phát triển nhanh chóng, được thể hiện qua Sora của OpenAI và Goku của ByteDance. Sora tạo ra các video siêu chân thực từ văn bản bằng cách sử dụng các mô hình khuếch tán tiên tiến, đạt chất lượng hình ảnh cao và chuyển động mượt mà, dù vẫn còn là sản phẩm độc quyền và ít khả năng truy cập hơn. Ngược lại, Goku là một mô hình mã nguồn mở khuyến khích sự phổ biến của việc tạo video AI thông qua hợp tác cộng đồng. Nó sử dụng các phương pháp đổi mới như Flow đã chỉnh sửa để tạo ra chuyển động linh hoạt, một Variational Autoencoder hình ảnh-video kết hợp 3D để giữ lại chi tiết, và một Mạng chuyển đổi (Transformer) với toàn bộ sự chú ý để bắt kịp các động thái không gian-thời gian phức tạp. Trong khi Sora dẫn đầu về độ chân thực hình ảnh, tính mở của Goku thúc đẩy đổi mới nhanh chóng thông qua các đóng góp tập thể. Cùng nhau, chúng báo hiệu một tương lai nơi các video do AI tạo ra trở nên phổ biến trong điện ảnh, marketing và giáo dục, bất chấp những thách thức về đạo đức và các video giả mạo tinh vi. Goku của ByteDance nổi bật với xu hướng tạo nội dung số hợp tác, dễ tiếp cận dựa trên AI.

Lĩnh vực chuyển đổi văn bản thành video bằng AI đang tiến bộ nhanh chóng, với những đột phá mở rộng khả năng. Sora của OpenAI đã làm kinh ngạc khán giả khi tạo ra các video chất lượng cao, siêu chân thực từ các lệnh đơn giản bằng văn bản. Giờ đây, ByteDance (công ty mẹ của TikTok) đã ra mắt một đối thủ mới: Goku, một mô hình tạo video AI mã nguồn mở. Khác với Sora vốn đóng mã nguồn, Goku có thiết kế mở nhằm dân chủ hóa việc sáng tạo video bằng AI và thúc đẩy đổi mới thông qua sự hợp tác cộng đồng. Hãy cùng khám phá các đặc điểm của Goku, cách nó so sánh với Sora, và những ảnh hưởng đến tương lai của video do AI tạo ra. **Goku là gì?** Goku là một mô hình AI chuyển đổi văn bản thành video tiên tiến, tạo ra các đoạn video nhất quán, chất lượng cao, chân thực dựa trên mô tả bằng văn bản. Mặc dù chưa được phát hành hoàn toàn công khai, các báo cáo ban đầu cho thấy nó nằm trong số các trình tạo video AI tiên tiến nhất hiện nay. **Các đặc điểm chính của Goku** - *Công thức Luồng Được Hiệu Chỉnh (Rectified Flow - RF)*: Đảm bảo chuyển động mượt mà, nhất quán bằng cách tránh sự độc lập của từng khung hình như trong các mô hình truyền thống, qua đó làm cho luồng video tự nhiên hơn. - *Autoencoder Biến thể 3D Liên kết Ảnh-Video (VAE)*: Nén hình ảnh và video vào không gian tiềm năng chung, nâng cao hiệu quả và duy trì chi tiết độ phân giải cao. - *Mạng Transformer với Attention Toàn Bộ*: Sử dụng FlashAttention và nhúng vị trí 3D RoPE để bắt giữ mối quan hệ không gian-thời gian, tạo ra các video động với chuyển động vật thể chân thực. - *Khả năng truy cập mã nguồn mở*: Không giống như Sora sở hữu độc quyền, Goku có sẵn mở để các nhà phát triển, nhà nghiên cứu và cộng đồng thử nghiệm và đổi mới, thúc đẩy quá trình tiến bộ của công nghệ video AI. **So sánh Goku và Sora** Goku của ByteDance và Sora của OpenAI khác nhau về cơ bản ở khả năng truy cập và phương pháp tiếp cận. Goku với mã nguồn mở mời gọi sự phát triển dựa trên cộng đồng, thúc đẩy khả năng áp dụng rộng rãi và tiến bộ nhanh chóng.

Sora vẫn là hệ thống độc quyền và kín, hạn chế việc thử nghiệm bên ngoài OpenAI. Về mặt công nghệ, Goku sử dụng Rectified Flow, VAE 3D Liên kết Ảnh-Video, và Transformer toàn bộ attention, trong khi Sora sử dụng các mô hình khuếch tán và mạng neural sâu tối ưu cho việc tạo video dài hạn. Sora nổi bật với các video chân thực, nhất quán cao nhưng bị hạn chế bởi quyền truy cập hạn chế. Goku, còn đang trong giai đoạn phát triển ban đầu, cho thấy tiềm năng đổi mới lớn nhờ phương thức mở. **Tương lai của Công nghệ Video AI** Sự xuất hiện của Goku và Sora đánh dấu bước khởi đầu của cuộc cách mạng video AI, hướng tới: - Sản xuất video dưới quyền AI phổ biến, giúp nhiều người tiếp cận sản phẩm chất lượng cao. - Cạnh tranh mã nguồn mở ngày càng tăng, khi cách tiếp cận của ByteDance có thể truyền cảm hứng cho các đối thủ khác, thúc đẩy tiến bộ công nghệ. - Các bộ phim dài và chương trình truyền hình do AI tạo ra, với AI đảm nhiệm viết kịch bản, đạo diễn và hoạt hình. - Các vấn đề đạo đức, bao gồm lạm dụng deepfake, thông tin sai lệch và các mối quan tâm về quyền riêng tư, cần có quy định để sử dụng AI một cách có trách nhiệm. **Kết luận: Một kỷ nguyên mới của video AI** Goku của ByteDance báo hiệu bước nhảy vọt đáng kể trong công nghệ video AI thông qua mô hình mã nguồn mở, có thể dân chủ hóa việc làm phim bằng AI và thúc đẩy đổi mới nhanh hơn so với hệ thống Sora của OpenAI. Dù vẫn đang trong quá trình phát triển, Goku có tiềm năng ảnh hưởng lớn đến ngành giải trí, giáo dục, marketing và nhiều lĩnh vực khác. Khi công nghệ video AI tiếp tục tiến bộ, câu hỏi chính vẫn là: liệu các dự án mã nguồn mở như Goku có vượt qua các mô hình độc quyền như Sora không?Câu trả lời có thể định hình lại tương lai của việc sáng tạo nội dung kỹ thuật số. Hãy đón chờ những cập nhật mới!


Watch video about

ByteDance Ra mắt Goku: Mẫu AI mã nguồn mở chuyển đổi văn bản thành video thách thức OpenAI’s Sora

Try our premium solution and start getting clients — at no cost to you

Content creator image

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

April 1, 2026, 6:24 a.m.

SoundHound AI Ra mắt Trợ lý Hỗ trợ Bán hàng tại M…

SoundHound AI, Inc., nhà dẫn đầu toàn cầu về trí tuệ nhân tạo thoại và hội thoại, vừa giới thiệu Sales Assist, một trợ lý AI điều khiển bằng giọng nói dành riêng cho môi trường bán lẻ.

April 1, 2026, 6:21 a.m.

X tạm ngưng doanh thu cho các bài đăng AI không g…

Tháng 3 năm 2026, X, một trong những nền tảng truyền thông xã hội hàng đầu, thông báo sẽ đình chỉ các nhà sáng tạo khỏi chương trình chia sẻ lợi nhuận nếu họ đăng tải nội dung do AI tạo ra liên quan đến xung đột vũ trang mà không được gắn nhãn rõ ràng.

April 1, 2026, 6:15 a.m.

Video ghi lại hệ thống định giá AI gây tranh cãi …

Một vụ việc gần đây tại Walmart, được một khách hàng ghi lại bằng video, đã khơi mào cuộc tranh luận sôi nổi về hệ thống định giá mới dựa trên trí tuệ nhân tạo của nhà bán lẻ này.

March 31, 2026, 2:13 p.m.

OpenAI đóng cửa Sora giữa lo ngại về Deepfake

OpenAI đã thông báo về việc đóng cửa ứng dụng mạng xã hội của mình, Sora, đã thu hút sự chú ý và sự yêu thích từ cộng đồng kể từ khi ra mắt vào mùa thu năm ngoái.

March 31, 2026, 10:26 a.m.

Giám đốc điều hành Thomson Reuters nhấn mạnh lợi …

Thomson Reuters đã công bố kết quả kinh doanh quý IV năm 2025 với hiệu suất tài chính mạnh mẽ, doanh thu đạt 2,009 tỷ USD.

March 31, 2026, 10:24 a.m.

Tự động hóa Quản lý Mạng xã hội bằng Trí tuệ nhân…

Kineiro, một công ty công nghệ tiên phong, đã giới thiệu một hệ thống tiên tiến dựa trên trí tuệ nhân tạo nhằm chuyển đổi cách các doanh nghiệp quản lý nội dung mạng xã hội của mình.

March 31, 2026, 10:18 a.m.

Tòa án Ngăn chặn Hành động của chính quyền Trump …

Trong một bước tiến pháp lý quan trọng, một Thẩm phán Tòa án Quận Hoa Kỳ đã ra phán quyết hạn chế các hành động do chính quyền Trump khởi xướng chống lại công ty AI Anthropic.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

AI Company welcome image

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today