AI Sora tạo sinh video của OpenAI sẽ phá hủy công việc của ai?

VNZ-NEWS
Vn-Z.vn Ngày 18 tháng 02 năm 2024, Sau khi OpenAI giới thiệu mô hình Sora, AI tạo sinh có thể tạo nội dung video dựa trên mô tả văn bản do người dùng nhập. Có thể nói rằng , màn ra mắt ấn tượng của Sora không chỉ đè bẹp nhiều đồng nghiệp video AGI mà còn có khả năng thay đổi luật chơi trong tương lai của ngành điện ảnh, truyền hình, quảng cáo và trò chơi.

Sora có thể tạo những cảnh phức tạp với nhiều người, các kiểu chuyển động cụ thể và bối cảnh chi tiết. Nó tạo ra các video phản ánh chính xác lời nhắc của người dùng. Ví dụ: Sora có thể tạo video về những phụ nữ thời trang đi dạo trên những con phố ngập ánh đèn neon ở Tokyo, video về voi ma mút khổng lồ trong tuyết và thậm chí cả đoạn giới thiệu phim về cuộc phiêu lưu của các phi hành gia.



Sora-wood.webp


Hôm thứ Năm, Google bất ngờ phát hành Gemini 1.5 Pro, một thế hệ mô hình lớn đa phương thức mới, đưa Google sẵn sàng cạnh tranh vị trí dẫn đầu trong cuộc chiến AI mô hình lớn với OpenAI. Gemini 1.5 Pro là mô hình ngôn ngữ lớn mạnh mẽ nhất trong ngành tính đến thời điểm hiện tại, hỗ trợ bối cảnh lên tới 10.000K Token, trực tiếp nâng hiệu suất lên cấp triệu, đánh bại hoàn toàn GPT-4 Turbo của OpenAI về hiệu suất.

Việc có hàng triệu Token có ý nghĩa gì?

Theo Jeff Dean, người đứng đầu dự án AI của Google, giải thích rằng với sự hỗ trợ cửa sổ ngữ cảnh hàng triệu cấp độ của Gemini 1.5 Pro, người dùng có thể hoàn thành các tương tác nội dung phức tạp, dễ dàng phân tích cú pháp toàn bộ sách, phim và podcast cũng như hiểu tài liệu rất dài hoặc thậm chí là cơ sở mã với hàng trăm tập tin và hàng trăm ngàn dòng.

Việc phát hành Gemini 1.5 Pro đồng nghĩa với việc Google có lợi thế mạnh mẽ về hiệu suất trong cuộc chạy đua AI với OpenAI. Ngược lại, GPT-4 Turbo của OpenAI chỉ có thể xử lý 128 nghìn Token và gần đây đã bị suy giảm hiệu suất mà không cải thiện cho đến khi bản cập nhật được phát hành vào tháng trước.

Tất nhiên, OpenAI đã không để Google yên. Cùng ngày, họ phát hành Sora, một mô hình AI tạo video từ văn bản, có thể tự động tạo video chỉ bằng văn bản; theo mô hình văn bản ChatGPT và mô hình hình ảnh Dall-E, OpenAI lại bắt đầu lật đổ lĩnh vực video.

So với lợi thế sức mạnh cứng dựa trên hiệu suất dữ liệu của Google Gemini 1.5 Pro, hiệu suất tuyệt vời dựa trên thẩm mỹ thị giác của Sora rõ ràng là ấn tượng hơn và nhanh chóng trở thành điểm nóng trên các trang mạng xã hội.

Có gì tuyệt vời ở Sora?

OpenAI trình chiếu một số đoạn nội dung video do Sora sản xuất, chỉ riêng những đoạn clip này cũng đủ khiến người ta choáng váng. OpenAI đăng tải trên blog chính thức rằng Sora không chỉ có thể hiểu nhu cầu của người dùng mà còn biết những thứ này tồn tại như thế nào trong thế giới thực.

Chỉ cần nhập một đoạn văn bản và Sora sẽ tự động tạo video độ phân giải cao tối đa một phút. Thật đáng kinh ngạc, Sora không chỉ có thể nắm bắt chính xác ý nghĩa phức tạp của văn bản người dùng mà còn có thể tách các yếu tố khác nhau và chuyển đổi chúng thành nội dung video được hình thành một cách sáng tạo trông giống như một đạo diễn, nhà quay phim và biên tập chuyên nghiệp.

Sora-AI.webp


Một người phụ nữ thời trang đeo kính râm và mặc áo khoác da đang đi dạo trên đường phố trung tâm thành phố Tokyo vào ban đêm sau cơn mưa, khóe môi tô son tươi hơi nhếch lên, ngay cả khi đeo kính râm cũng có thể nhìn thấy nụ cười của cô ấy. Hình bóng của cô và ánh đèn neon của bữa tiệc được phản chiếu dưới nước, một buổi biểu diễn múa rồng đang diễn ra ở khu phố Tàu nhộn nhịp,đôi mắt của đám đông nhộn nhịp đang tập trung vào con rồng đầy màu sắc đang nhảy lên.

Sora-AI-video.webp


Khác với các video AI trước đây có cảm giác dẻo rõ ràng, video do Sora sản xuất lần này có sự khác biệt đáng kể về tính chân thực và tính nghệ thuật như: mái tóc hơi xoăn của nhân vật, nốt ruồi đen và mụn trên mặt người phụ nữ và ánh đèn neon phản chiếu Ánh sáng và bóng tối, nhiều món ăn được bán trên đường phố, hoa anh đào rơi trên bầu trời và tuyết mịn, các chi tiết đẹp đến mức gần như thật.





Điều đáng ngạc nhiên hơn nữa là các video của Sora thể hiện phong cách như các bộ phim, rõ ràng về bố cục, màu sắc, sự sáng tạo, chuyển động của camera, dù là quay một cảnh hay nhiều camera đều có thể chuyển đổi liền mạch, thậm chí còn có cả những "diễn viên" biểu cảm và biểu cảm là điều mà các sản phẩm video trước đây của Vincent không có được. OpenAI đã đưa toàn bộ ngành công nghiệp video AI lên một tầm cao mới khi ra mắt.

Mặc dù video do Sora sản xuất chưa hoàn hảo, nếu để ý kỹ bạn vẫn có thể thấy những "điểm giao nhau", bánh quy mà các nhân vật đã ăn thậm chí sẽ còn nguyên vẹn nhưng chất lượng hình ảnh đã tốt hơn các video AI trước đó, thậm chí có thể nói là nhảy vọt về chất lượng như một bộ phim. Hơn nữa, Sora có thể tạo video dưới nhiều ống kính giống như một bộ phim chỉ bằng đoạn văn bản trừu tượng. Khả năng hiểu ngữ nghĩa và sử dụng ống kính này thậm chí còn gần hơn với trình độ chỉ đạo, chụp ảnh và chỉnh sửa của con người. Rõ ràng, thời điểm ChatGPT cho video đã đến.

Sora xuất hiện đầy kinh ngạc

Sau khi Sora được phát hành, toàn thế giới mạng Internet kinh ngạc và gần như cướp đi sự chú ý của Gemini. Tốc độ phát triển của AI thực sự đáng kinh ngạc. Bạn biết đấy, chỉ mới 14 tháng trôi qua kể từ khi OpenAI ra mắt ChatGPT và bắt đầu kỷ nguyên của AI sáng tạo. Cho đến năm ngoái, chúng ta mới quen với các sản phẩm tạo hình ảnh từ văn bản và chỉ cách đây nửa năm, ký tự sáu ngón đã xuất hiện trong các hình ảnh AI do MidJourney tạo ra. Và giờ đây, những video của Sora đã khiến mọi người cảm thấy ranh giới giữa thực tế và ảo ngày càng mờ nhạt.

Mặc dù GPT-4 Turbo của OpenAI đã trải qua tình trạng sụt giảm và chậm lại về hiệu suất, làm dấy lên lo ngại rằng sự phát triển của AI tạo sinh đang gặp phải nút thắt cổ chai. Bằng việc ra mắt Sora chắc chắn đã xua tan mối lo ngại của mọi người.

Aaron Levie, sáng lập và Giám đốc điều hành của công ty điện toán đám mây Box, đã than thở sau khi Sora được phát hành: “Nếu ai đó vẫn lo lắng rằng sự phát triển của AI sẽ chậm lại thì chúng ta một lần nữa lại chứng kiến mô hình hoàn toàn ngược lại”.

Hiện tại, Sora chỉ phát hành cho các nhà sản xuất và chuyên gia bảo mật được mời thử nghiệm để khám phá và giải quyết các vấn đề bảo mật có thể xảy ra. Chưa có lịch trình beta công khai chính thức nào được công bố. Suy cho cùng, trong một thế giới Internet tràn ngập thông tin sai lệch, vấn đề đạo đức của DeepFake cũng trở thành tâm điểm chú ý, một khi một video giả mạo như Sora bị lạm dụng có thể gây ra hậu quả thảm khốc.

Gần như cùng thời điểm với việc phát hành Sora, OpenAI cũng hoàn thành giao dịch chào mua công khai, không phải để gây quỹ cho mục đích công ty mà cho phép nhân viên bán cổ phiếu hiện có cho một tổ chức đầu tư mạo hiểm do Thrive Capital đứng đầu. Điều đáng nói là, với tư cách là thành viên ban giám đốc của OpenAI, bản thân Altman không nắm giữ cổ phần của công ty và việc định giá tăng vọt sẽ không mang lại cho anh những khối tài sản khổng lồ.

Thương vụ này định giá OpenAI ở mức 80 tỷ USD, tăng hơn gấp ba lần so với mức 30 tỷ USD vào đầu năm 2023. Theo thống kê từ công ty nghiên cứu thị trường đầu tư và tài chính CB Insights, OpenAI đã trở thành một trong những công ty khởi nghiệp có giá trị cao nhất thế giới, chỉ đứng sau ByteDance và SpaceX.

Trên thực tế, thương vụ lẽ ra đã được hoàn tất vào tháng 11 năm 2023 nhưng nó đã bị gác lại do mâu thuẫn giữa Altman và ban giám đốc. Với việc Altman trở lại làm Giám đốc điều hành của OpenAI, các nhà đầu tư đã mang lại cho gã khổng lồ AI một phiếu tín nhiệm khác. Rõ ràng, sau khi Sora chính thức ra mắt, định giá của OpenAI sẽ còn tăng cao hơn nữa.

AI tạo sinh video có đè bẹp AGI ?

Các đối tác video của AGI chắc chắn bị ảnh hưởng trực tiếp nhất. Sau khi phát hành Sora, Cristóbal Valenzuela, Giám đốc điều hành của công ty khởi nghiệp video AI Runway, chỉ đăng hai từ trên nền tảng X (trước đây là Twitter), "Game On". Runway vừa ra mắt mẫu video Gen-2 cách đây vài tháng. Emad Mostaque, CEO của Stability, một công ty video AI khác, thẳng thắn nói: “Ultraman thực sự là một nhà ảo thuật”.

Runway đã ra đời được 5 năm, có lợi thế đi đầu trong lĩnh vực video AI và được các hãng phim chính thống của Hollywood sử dụng. Bộ phim năm ngoái "The World", đoạt 7 giải Oscar, đã sử dụng Runway để sản xuất video AI. Sau thành công của "Vũ trụ tức thời", vòng tài trợ mới của Runway cũng đã nâng mức định giá của nó lên 1,5 tỷ USD, gấp ba lần mức định giá một năm trước.

Trong lĩnh vực video tạo sinh từ văn bản đang là lĩnh vực khởi nghiệp nóng nhất hiện nay. Trong vài tháng qua, cùng với làn sóng AI sinh học, đã xuất hiện nhiều công ty khởi nghiệp sản xuất video từ văn bản và hình ảnh. Justin Moore, đối tác đầu tư AI của A16z, đã liệt kê hơn 20 nhóm khởi nghiệp video sinh học mà anh ta theo dõi, trong đó có những tên như Pika và Zeroscope, những tên từng gây ấn tượng trên mạng.

Vào cuối năm 2023, Pika Video do một sinh viên tốt nghiệp Stanford người Trung Quốc thành lập đã từng làm dậy sóng Internet Trung Quốc và Mỹ. Nhờ hiệu suất đáng kinh ngạc của video AI, công ty khởi nghiệp chỉ có 4 người này đã hoàn thành ba vòng tài trợ trị giá hơn 55 triệu USD trong vòng chưa đầy nửa năm và giá trị của nó đã tăng vọt lên 250 triệu USD.

Nhưng giờ đây, gã khổng lồ AI OpenAI Sora đã loại bỏ hoàn toàn. Cho dù đó là độ dài của video, độ mịn của hình ảnh, độ đầy đủ của các chi tiết hay khả năng quay bằng nhiều ống kính, Sora đều vượt xa video của những công ty khởi nghiệp nhỏ này , không quá lời khi miêu tả nó là đáng kinh ngạc. Mặc dù vẫn còn rất nhiều dư địa để cải thiện và tăng trưởng trong lĩnh vực video AI, nhưng liệu các công ty nhỏ này có thể cạnh tranh với OpenAI trong tương lai hay không vẫn là một câu hỏi lớn.

Tham gia vào các cuộc đàm phán lao động ở Hollywood

Tuy nhiên, Sora sẽ không chỉ ảnh hưởng đến không gian sống của các công ty khởi nghiệp video AGI khác mà còn thay đổi luật chơi trong tương lai ở Hollywood cũng như các ngành điện ảnh, truyền hình, quảng cáo và trò chơi.

Việc Hollywood sử dụng AI để sản xuất hình ảnh và video không có gì mới, từ CG (hoạt hình máy tính), VR đến AI, ngành giải trí điện ảnh và truyền hình luôn là ngành ứng dụng công nghệ cao đầu tiên. Tuy nhiên, không giống như các công nghệ khác, các công cụ AI luôn là cái gai đối với các nhà thực hành Hollywood.

Ngoài việc sử dụng công cụ video AI của Runway trong "The Instant Universe", 21st Century Fox vào năm ngoái đã hợp tác với IBM Watson để sử dụng công cụ AI để tạo trailer cho bộ phim kinh dị chủ đề AI "Morgan"; Marvel của Disney thậm chí còn có tận dụng triệt để AI đã tạo ra hoạt ảnh mở đầu của Secret Invasion.

Đó là trong cuộc đình công của Hiệp hội Diễn viên và Nhà văn Hollywood. Việc ứng dụng Generative AI trong ngành điện ảnh và truyền hình cũng là một trong những tâm điểm tranh cãi giữa hai bên. Trong quá trình đàm phán giữa hai bên, các diễn viên và biên kịch được biết rằng Secret Invasion mùa mới của Disney và Marvel đã sử dụng hoàn toàn công nghệ AI để tạo ra cảnh mở đầu. Tin tức này khiến cuộc đàm phán giữa hai bên một lần nữa bị đình trệ.

Tại sao việc sử dụng công cụ AI trong ngành điện ảnh, truyền hình lại gây nhiều tranh cãi đến vậy? Những người trong ngành chủ yếu lo lắng rằng các nhà sản xuất sẽ sử dụng các tài liệu hiện có để đào tạo AI và thường xuyên sử dụng các công cụ AI để tạo ra nội dung trong tương lai, điều này không chỉ vi phạm bản quyền các tác phẩm hiện có của người sáng tạo mà còn không mang lại cho họ đủ lợi nhuận và cũng sẽ ảnh hưởng đến tương lai của những người sáng tạo, cơ hội việc làm.

Dave Clark, đạo diễn Hollywood từng quay bộ phim kinh dị "Khi cô ấy thức dậy", đã sử dụng các công cụ AI để làm phim. Theo quan điểm của ông, các công nghệ AI như Sora không gây ra mối đe dọa nào. Người sáng tạo cần nắm bắt công nghệ AI và tạo ra nội dung mà trước đây không thể đạt được hoặc có thể tưởng tượng được. "Đây là công nghệ thay đổi cuộc chơi. Bạn không nên lo lắng về công việc của mình mà nên lo lắng về việc ai đang sử dụng các công cụ này."
Mặc dù các nhà biên kịch và diễn viên đã không ngần ngại đóng cửa ngành này và mất việc vào năm ngoái, nhưng các nhà sản xuất đã tạm thời nhượng bộ và đưa ra nhiều quy định hơn về việc sử dụng các công cụ AI. Nhưng trong cuộc đàm phán lao động tiếp theo sau ba năm nữa, các diễn viên và biên kịch có thể sẽ rơi vào tình thế khó khăn hơn khi đối mặt với AI mà hiệu suất chắc chắn sẽ được nâng cấp rất nhiều.

AI hoá phim ảnh truyền hình

Với màn ra mắt ấn tượng của người mẫu video tạo sinh từ Sora, có lẽ tất cả những người hành nghề ở Hollywood sẽ phải đối mặt với một câu hỏi lớn: Theo tốc độ tiến hóa theo cấp số nhân của AI, AI có thể không cần phải đợi lâu nữa trước khi AI có thể tạo ra một bộ phim ngắn hoặc thậm chí là một bộ phim với một cốt truyện hoàn chỉnh, mọi thứ từ kịch bản, quay phim, diễn xuất đến hậu kỳ đều có thể được xử lý hoàn toàn, vậy tương lai của Hollywood sẽ ra sao?

Sora-AI-vs-holy.webp

Mối lo ngại tràn ngập Hollywood, theo một cuộc khảo sát với 300 lãnh đạo ngành công nghiệp Hollywood do công ty nghiên cứu ngành CVL Economics công bố vào tháng trước. 36% số người được hỏi cho biết AI tạo sinh đã giảm nhu cầu về kỹ năng công việc hàng ngày tại công ty của họ và 72% các công ty được khảo sát là những người sớm áp dụng các công cụ AI tạo sinh.

Thực tế khắc nghiệt hơn là 75% số người được hỏi thừa nhận rằng AI sáng tạo (công cụ, phần mềm, mô hình) đã thúc đẩy quá trình cắt giảm việc làm và sáp nhập trong các đơn vị kinh doanh của họ. Những người kiểm soát trật tự của ngành công nghiệp Hollywood dự đoán rằng trong ba năm tới, hơn 200.000 việc làm ở Hollywood sẽ bị ảnh hưởng bởi AI, đặc biệt là các công việc hậu kỳ như hiệu ứng hình ảnh, kỹ sư hiệu ứng âm thanh và nhà thiết kế đồ họa.

Jason Hellerman, biên kịch của bộ phim "Shovel Buddies" tin rằng khi các công cụ AI dần được cải thiện, trong tương lai, các nhà sản xuất tất nhiên có thể sử dụng các công cụ như Sora để tạo video và không cần phải trả tiền cho đội ngũ sản xuất nữa. Nội dung do AI tạo ra cũng có thể tạo ra một thể loại hoàn toàn mới, nhưng nếu ai đó có thể sử dụng AI để làm video, phim và trở thành “người sáng tạo nội dung” thì điều này chắc chắn sẽ dẫn đến sự giảm sút về tiêu chuẩn chuyên môn.

Anh dự đoán rằng trong tương lai mọi người sẽ có thể tạo video của riêng mình, giống như hiện nay mọi người đều quay và xem video ngắn TikTok trên điện thoại di động của mình. Những người trẻ thuộc Thế hệ Z đã quen với những video ngắn sẽ dần từ bỏ những nội dung dài như phim ảnh và truyền hình trong tương lai. Có lẽ trong tương lai các video, phim và chương trình truyền hình do AI tạo ra cũng sẽ trở thành những hình thức tương tự như video ngắn TikTok.
 
  • Like
Handrf Reactions: Handrf
Trả lời

Whale

Rìu Vàng Đôi
Xem quả Trai-lơ này đúng là đỉnh thật. Tương lai sẽ có những sự thay đổi rất lớn:
Những người trẻ thuộc Thế hệ Z đã quen với những video ngắn sẽ dần từ bỏ những nội dung dài như phim ảnh và truyền hình trong tương lai.
Có lẽ trong tương lai các video, phim và chương trình truyền hình do AI tạo ra cũng sẽ trở thành những hình thức tương tự như video ngắn TikTok.