Google ra mắt Gemini 2.5 Pro, Mô hình AI mạnh nhất xác lập nhiều kỷ lục | VN-Zoom | Cộng đồng Chia Sẻ Kiến Thức Công Nghệ và Phần Mềm Máy Tính

Ủng hộ Speedtest VNZ-News Telegram

VNZoom Beta

Bắt Buộc Xác thực tài khoản mạng xã hội từ 25/12/2024

Thread starter VNZ-NEWS
Ngày gửi lúc 09:08, Thứ tư
Nhập từ khóa

gemini 2.5 pro gemini pro 2.5 google

Google ra mắt Gemini 2.5 Pro, Mô hình AI mạnh nhất xác lập nhiều kỷ lục

VNZ-NEWS lúc 09:08, Thứ tư

Gemini 2.5 Pro vừa chính thức ra mắt vào đêm khuya! Đây là một mô hình AI “suy nghĩ”, được thiết kế đặc biệt cho các nhiệm vụ phức tạp với khả năng suy luận vượt trội. Ngay khi ra đời, nó đã thống trị các bảng xếp hạng, giành hàng loạt vị trí số một và lập kỷ lục về mức tăng điểm số lớn nhất trong lịch sử.

Mô hình “suy nghĩ” mạnh mẽ nhất của Google

Gemini 2.5 Pro có khả năng suy nghĩ và suy luận trước khi phản hồi, giúp nâng cao hiệu suất và cải thiện độ chính xác. Google tuyên bố đây là mô hình mạnh nhất thế giới, sở hữu khả năng suy luận thống nhất cùng tất cả các tính năng người dùng yêu thích từ Gemini (ngữ cảnh dài, công cụ hỗ trợ, v.v.).

Trong nhiều bài kiểm tra chuẩn, Gemini 2.5 Pro đạt mức SOTA (state-of-the-art – tiên tiến nhất) và dẫn đầu với khoảng cách đáng kể trên bảng xếp hạng LMArena. Hiện tại, nó đã chiếm vị trí số một trên bảng xếp hạng Arena, lập kỷ lục nhảy vọt điểm số lớn nhất trong lịch sử, cao hơn hẳn Grok-3 và GPT-4.5 đến 40 điểm!

Trong thử nghiệm với mã “nebula”, Gemini 2.5 Pro giành chiến thắng toàn diện trong mọi hạng mục và chiếm ngôi vương ở 5 lĩnh vực quan trọng: Toán học, Viết sáng tạo, Tuân thủ chỉ dẫn, Truy vấn dài, và Hội thoại đa vòng. Trong các lĩnh vực thử thách khó và lập trình, nó ngang bằng với Grok-3/GPT-4.5, nhưng vẫn giành chiến thắng nhờ lợi thế nhỏ trong tất cả các bài thi khác.

Không chỉ thế, Gemini 2.5 Pro còn đứng đầu bảng xếp hạng Vision Arena (đánh giá AI xử lý hình ảnh) và giành ngôi á quân trong WebDev Arena (lập trình web).

Đối thủ của Claude 3.5 Sonnet – Bước nhảy vọt của Gemini

Gemini 2.5 Pro là mô hình đầu tiên có sức mạnh ngang ngửa Claude 3.5 Sonnet, đồng thời vượt trội hơn hẳn so với các phiên bản Gemini trước đây. Với sự tiến bộ vượt bậc này, câu hỏi đặt ra là OpenAI, Anthropic hay DeepSeek sẽ mất bao lâu để bắt kịp?

Hiện tại, Gemini 2.5 Pro đã có sẵn trên Google AI Studio và ứng dụng Gemini dành cho người dùng Gemini Advanced, đồng thời sẽ sớm có mặt trên Vertex AI. Google cũng dự kiến công bố chính sách giá trong vài tuần tới, giúp doanh nghiệp triển khai mô hình này trong môi trường sản xuất quy mô lớn.

Khả năng suy luận và lập trình vượt trội

Trong các thử nghiệm lập trình, toán học và khoa học, Gemini 2.5 Pro đều dẫn đầu. Đáng chú ý, nó đạt kết quả xuất sắc trên các bài kiểm tra như GPQA và AIME 2025 mà không cần dùng đến các phương pháp tốn tài nguyên như voting ensemble.

Thậm chí, không sử dụng bất kỳ công cụ bên ngoài nào, Gemini 2.5 Pro vẫn đạt độ chính xác 18.8% trong bài kiểm tra “cuối cùng của loài người” – một bài test thử thách giới hạn kiến thức và suy luận của con người.

Về lập trình, Gemini 2.5 đã có một bước tiến lớn so với phiên bản 2.0. Nó có thể tạo ra các ứng dụng web tuyệt đẹp, mã cho AI agent, chuyển đổi và chỉnh sửa code với độ chính xác cao. Trong bài test SWE-Bench Verified (chuẩn đánh giá AI viết mã), Gemini 2.5 Pro đạt 63.8% chỉ với cấu hình agent tùy chỉnh.

Một loạt demo cũng cho thấy sức mạnh của Gemini 2.5 Pro:

• Chỉ với một dòng lệnh, nó có thể tạo mã code để xây dựng một trò chơi hoàn chỉnh hoặc một hoạt cảnh động tương tác.

• Trong một ví dụ, nó tạo ra một cảnh “Cá vũ trụ” trong p5.js, hiển thị suy nghĩ của các con cá.

• Nó cũng tạo ra một trò chơi khủng long vô tận theo phong cách pixel-art, một trình mô phỏng fractal, và một biểu đồ tương tác theo thời gian về kinh tế và sức khỏe của các châu lục.

• Ngoài ra, Gemini 2.5 Pro có thể lập trình hệ thống hạt để mô phỏng không gian phản chiếu như tinh vân siêu tân tinh, hoặc tạo ra mô phỏng tương tác về sự sống nhân tạo trong không gian ảo.

Đa chế độ tự nhiên và ngữ cảnh siêu dài

Gemini 2.5 tiếp tục phát huy thế mạnh của dòng Gemini với khả năng đa chế độ tự nhiên và ngữ cảnh siêu dài.

Ngay từ khi ra mắt, nó đã hỗ trợ cửa sổ ngữ cảnh lên đến 1 triệu token (và sẽ sớm mở rộng lên 2 triệu token!). Điều này giúp nó xử lý lượng dữ liệu khổng lồ, giải quyết các vấn đề phức tạp từ nhiều nguồn khác nhau như văn bản, âm thanh, hình ảnh, video, thậm chí cả kho mã nguồn đầy đủ.

Google đã tung ra mô hình AI mạnh nhất hành tinh – giờ đây, tất cả đang chờ xem OpenAI sẽ phản ứng thế nào!