Character.AI ra mắt AvatarFX: AI “biến tĩnh thành động”, giúp nhân vật trong ảnh tĩnh cử động và nói chuyện
Hôm nay (23 tháng 4), công ty Character.AI đã đăng tải một bài viết trên nền tảng X, công bố ra mắt mô hình AvatarFX, cho phép nhân vật trong ảnh tĩnh “mở miệng nói chuyện”.
Người dùng chỉ cần tải lên một bức ảnh và chọn một giọng nói, nền tảng sẽ tạo ra hình ảnh nhân vật có thể nói chuyện và chuyển động. Những hình ảnh này còn có khả năng thể hiện cảm xúc, mang lại cảm giác chân thật và mượt mà đáng kinh ngạc. Công ty cho biết điều này có được là nhờ vào một mô hình AI tiên tiến có tên là “SOTA DiT-based diffusion video generation model”. Mô hình này được huấn luyện kỹ lưỡng, kết hợp với công nghệ tối ưu hóa điều kiện âm thanh, có thể tạo ra video chất lượng cao một cách hiệu quả.
Điểm nổi bật của AvatarFX nằm ở khả năng tạo video với độ trung thực cao và tính nhất quán theo thời gian. Ngay cả trong những tình huống phức tạp như có nhiều nhân vật, chuỗi video dài hay hội thoại nhiều lượt, mô hình vẫn giữ được tốc độ xử lý ấn tượng và sự ổn định.
So với các đối thủ như Sora của OpenAI hay Veo của Google, AvatarFX không tạo video từ đầu hoặc từ văn bản, mà tập trung vào việc hoạt hình hóa ảnh tĩnh cụ thể.
Tuy quy trình hoạt động độc đáo này mang đến trải nghiệm mới mẻ cho người dùng, nhưng cũng tiềm ẩn rủi ro. Người dùng có thể tải ảnh của người nổi tiếng hoặc người quen để tạo video giả trông như thật, từ đó gây ra tranh cãi về quyền riêng tư và đạo đức.
Bạn có thể tham gia tại đây

Người dùng chỉ cần tải lên một bức ảnh và chọn một giọng nói, nền tảng sẽ tạo ra hình ảnh nhân vật có thể nói chuyện và chuyển động. Những hình ảnh này còn có khả năng thể hiện cảm xúc, mang lại cảm giác chân thật và mượt mà đáng kinh ngạc. Công ty cho biết điều này có được là nhờ vào một mô hình AI tiên tiến có tên là “SOTA DiT-based diffusion video generation model”. Mô hình này được huấn luyện kỹ lưỡng, kết hợp với công nghệ tối ưu hóa điều kiện âm thanh, có thể tạo ra video chất lượng cao một cách hiệu quả.
Điểm nổi bật của AvatarFX nằm ở khả năng tạo video với độ trung thực cao và tính nhất quán theo thời gian. Ngay cả trong những tình huống phức tạp như có nhiều nhân vật, chuỗi video dài hay hội thoại nhiều lượt, mô hình vẫn giữ được tốc độ xử lý ấn tượng và sự ổn định.
So với các đối thủ như Sora của OpenAI hay Veo của Google, AvatarFX không tạo video từ đầu hoặc từ văn bản, mà tập trung vào việc hoạt hình hóa ảnh tĩnh cụ thể.
Tuy quy trình hoạt động độc đáo này mang đến trải nghiệm mới mẻ cho người dùng, nhưng cũng tiềm ẩn rủi ro. Người dùng có thể tải ảnh của người nổi tiếng hoặc người quen để tạo video giả trông như thật, từ đó gây ra tranh cãi về quyền riêng tư và đạo đức.
Bạn có thể tham gia tại đây
BÀI MỚI ĐANG THẢO LUẬN