Google công bố mô hình lớn Gemini 3, tăng cường toàn diện khả năng tạo ảnh, lập trình và tìm kiếm bằng AI

VNZ-NEWS
Vào thứ Ba theo giờ địa phương, Google (thuộc sở hữu của Alphabet) đã thông báo ra mắt mô hình Trí tuệ Nhân tạo (AI) mới nhất của mình là Gemini 3, nhằm tăng tốc bắt kịp trong cuộc đua với các công ty như OpenAI. Thông tin này đã khiến giá cổ phiếu hạng A của Google tăng vọt 3% trong phiên giao dịch.

Gemini_Generated_Image_5a8dsc5a8dsc5a8d.jpg

Giám đốc điều hành của Alphabet, Sundar Pichai, cho biết mô hình AI mới sẽ cung cấp câu trả lời tốt hơn cho các vấn đề phức tạp hơn. "Người dùng sẽ nhận được kết quả mong muốn chỉ với ít lời nhắc hơn." Ngoài ra, khả năng lập trình, phát triển ứng dụng và tạo hình ảnh của mô hình mới cũng được tăng cường đáng kể.
Gemini 3 sẽ được tích hợp vào ứng dụng Gemini, sản phẩm tìm kiếm bằng AI của Google là AI Mode và AI Overviews, cũng như các sản phẩm dành cho doanh nghiệp của họ. Mô hình này sẽ được cung cấp cho một số người dùng đăng ký từ thứ Ba và sẽ được triển khai rộng rãi hơn trong những tuần tới.

Lần ra mắt này chỉ cách tám tháng kể từ khi Google giới thiệu Gemini 2.5 và chỉ 11 tháng sau khi Gemini 2.0 ra mắt. Trong khi đó, OpenAI, công ty khơi mào cơn sốt AI tạo sinh, đã phát hành GPT-5 vào tháng 8 năm nay.

Pichai viết: “Thật đáng kinh ngạc, chỉ trong hai năm, AI đã phát triển từ chỗ chỉ xử lý văn bản và hình ảnh thành khả năng hiểu được bối cảnh. Bắt đầu từ hôm nay, Gemini sẽ được triển khai toàn diện trên tất cả các sản phẩm của Google.”
Theo dữ liệu do Google tiết lộ, ứng dụng Gemini hiện có 650 triệu người dùng hoạt động hàng tháng, và AI Overviews có 2 tỷ người dùng hoạt động hàng tháng. OpenAI cho biết vào tháng 8 rằng ChatGPT đã vượt mốc 700 triệu người dùng hoạt động hàng tuần.
Mặc dù Google khởi đầu chậm hơn trong cuộc đua AI, nhưng họ vẫn có nhiều lợi thế mà các công ty khởi nghiệp như OpenAI không có: chip chuyên dụng tự phát triển; nắm giữ khoảng 90% thị phần tìm kiếm trực tuyến; và hàng triệu người dùng Gmail, Google Docs, v.v., những sản phẩm hiện đang dần được tích hợp tính năng AI. Tháng trước, Google cũng công bố doanh thu kỷ lục và có kế hoạch đầu tư hàng tỷ đô la vào việc xây dựng AI.

Pichai nói thêm, Gemini 3 hoàn toàn mới được xây dựng để nắm bắt chiều sâu và sự tinh tế, đồng thời Gemini 3 giỏi hơn trong việc thấu hiểu ngữ cảnh và ý định đằng sau yêu cầu, giúp người dùng đạt được kết quả mong muốn với ít lời nhắc hơn. Google cho biết các mô hình AI khác vẫn có thể được sử dụng cho các tác vụ đơn giản.

Bối cảnh cạnh tranh này đang ngày càng leo thang khi Alphabet và các gã khổng lồ công nghệ khác tăng cường đầu tư vào cơ sở hạ tầng để thúc đẩy nghiên cứu và phát triển AI, đồng thời nhanh chóng tung ra các dịch vụ mới cho người tiêu dùng và doanh nghiệp. Trong báo cáo tài chính tháng trước, Alphabet, Meta, Microsoft và Amazon đều nâng mức hướng dẫn chi tiêu vốn, dự kiến tổng chi tiêu trong năm nay sẽ vượt quá 380 tỷ USD.

Demis Hassabis, Giám đốc điều hành của Google DeepMind, nhấn mạnh trong một tuyên bố rằng các câu trả lời của AI dựa trên Gemini 3 sẽ không còn dựa vào những lời sáo rỗng hay tâng bốc, mà sẽ cung cấp những hiểu biết thực tế – cho bạn biết những gì bạn cần nghe, chứ không phải những gì bạn muốn nghe.
Đồng thời, Google đã phát hành một nền tảng tác nhân (agent) mới có tên là "Google Antigravity", cho phép các nhà phát triển lập trình theo định hướng nhiệm vụ ở cấp độ trừu tượng cao hơn.

Josh Woodward, Phó Chủ tịch Google Labs và Gemini, cho biết Gemini 3 là mô hình phù hợp nhất từ trước đến nay của Google với "lập trình bầu không khí" (ambient programming). Lập trình bầu không khí đề cập đến một thị trường công cụ AI đang phát triển nhanh chóng, cho phép các nhà phát triển phần mềm tạo mã thông qua lời nhắc.

Google tuyên bố mô hình mới sẽ hỗ trợ "giao diện tạo sinh" (generative interfaces), trình bày một số câu trả lời theo cách tương tự như một tạp chí kỹ thuật số. Ví dụ, khi mô hình mới được yêu cầu giải thích các tác phẩm của Van Gogh kết hợp với bối cảnh cuộc đời ông, hệ thống đã tạo ra những giải thích minh họa, phong phú về màu sắc cho mỗi bức tranh.
Trong AI Mode, Gemini 3 sẽ được mở trước cho người dùng trả phí. Nó có khả năng phân tích câu hỏi và tự động tạo câu trả lời trực quan bao gồm hình ảnh, bảng biểu và bố cục dạng lưới.
Các nhà phát triển có thể sử dụng mô hình mới thông qua Gemini API, trong khi khách hàng doanh nghiệp có thể tích hợp nó vào quy trình kinh doanh của họ thông qua Google Cloud Vertex AI.
Google khẳng định đối với khách hàng doanh nghiệp, Gemini 3 có khả năng tạo nội dung giới thiệu và đào tạo nhân viên, phân tích video và hình ảnh nhà xưởng một cách chính xác hơn, và xử lý các quy trình kinh doanh như mua sắm.

 
Trả lời