Google ra mắt Gemma 3: Mô hình AI mạnh nhất có thể chạy trên một GPU duy nhất

VNZ-NEWS
Hôm nay, Google chính thức giới thiệu mô hình trí tuệ nhân tạo Gemma 3, phiên bản nâng cấp tiếp theo sau hai mô hình Gemma AI “mở” được phát hành một năm trước, dựa trên cùng công nghệ với Gemini AI.

gemma-3.webp


Theo bài đăng trên blog chính thức của Google, Gemma 3 được thiết kế dành cho các nhà phát triển, giúp họ xây dựng ứng dụng AI có thể chạy mượt mà trên nhiều thiết bị, từ điện thoại di động đến máy trạm. Mô hình này hỗ trợ hơn 35 ngôn ngữ, có khả năng phân tích văn bản, hình ảnh và video ngắn.


Google tuyên bố rằng Gemma 3 là mô hình AI đơn gia tốc mạnh nhất thế giới, với hiệu suất trên hệ thống chỉ có một GPU vượt trội hơn các đối thủ như Llama của Meta, DeepSeek và OpenAI. Mô hình này được tối ưu hóa đặc biệt cho GPU của Nvidia và phần cứng AI chuyên dụng.

Google cũng công bố một báo cáo kỹ thuật dài 26 trang, giải thích chi tiết về những ưu điểm của Gemma 3. Trong năm qua, mặc dù có những hoài nghi về mức độ hấp dẫn của các mô hình như Gemma, sự phổ biến của DeepSeek đã cho thấy thị trường vẫn rất quan tâm đến các mô hình AI yêu cầu phần cứng thấp.

Ban-sao-Anh-man-hinh-2025-03-12-luc-19.47.57.jpg

Mặc dù Google khẳng định Gemma 3 có nhiều tính năng tiên tiến, họ cũng tiến hành đánh giá rủi ro khi mô hình này được sử dụng trong các lĩnh vực khoa học, công nghệ, kỹ thuật và toán học (STEM), đặc biệt là khả năng liên quan đến chế tạo vật chất nguy hiểm. Kết quả đánh giá cho thấy rủi ro của mô hình này ở mức thấp.


Tuy nhiên, định nghĩa về mô hình AI “mở” hay “mã nguồn mở” vẫn còn gây tranh cãi. Google tiếp tục áp dụng chính sách cấp phép hạn chế đối với dòng mô hình Gemma, và Gemma 3 cũng không thay đổi chính sách này.


Google hiện đang quảng bá Gemma thông qua Google Cloud Credits, đồng thời ra mắt chương trình Gemma 3 Academic, cho phép các nhà nghiên cứu học thuật đăng ký khoản tín dụng trị giá 10.000 USD để hỗ trợ công việc nghiên cứu của họ.
 
Trả lời

VNZ-NEWS

Administrator
Thành viên BQT
https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf


Gemma 3 là phiên bản mới nhất trong dòng mô hình ngôn ngữ mở của Google DeepMind, được thiết kế để hoạt động hiệu quả trên các thiết bị tiêu dùng như điện thoại, laptop và GPU cao cấp. Phiên bản này mang lại nhiều cải tiến quan trọng, bao gồm:


1. Hỗ trợ đa phương thức (Multimodal)


• Gemma 3 tích hợp khả năng hiểu hình ảnh, sử dụng bộ mã hóa hình ảnh SigLIP, giúp mô hình xử lý hình ảnh cùng với văn bản.


• Mô hình áp dụng Pan and Scan (P&S) để xử lý hình ảnh có tỷ lệ khung hình không vuông, giúp cải thiện khả năng nhận dạng văn bản trong hình ảnh.

2. Ngữ cảnh mở rộng lên đến 128K token


• Hỗ trợ ngữ cảnh dài lên đến 128K token, giúp mô hình duy trì và xử lý thông tin từ các đoạn văn bản lớn mà không bị suy giảm hiệu suất.


• Sử dụng tỷ lệ 5:1 giữa attention cục bộ và toàn cục để tối ưu hóa bộ nhớ, giảm bớt tình trạng KV-cache memory quá tải khi xử lý ngữ cảnh dài.

3. Hiệu suất nâng cao nhờ huấn luyện mới


Gemma 3-4B-IT có hiệu suất tương đương với Gemma 2-27B-IT, nghĩa là một mô hình nhỏ hơn nhưng mạnh ngang một phiên bản cũ lớn hơn.


Gemma 3-27B-IT có thể so sánh với Gemini 1.5 Pro trên nhiều tiêu chuẩn đánh giá.


• Cải thiện khả năng toán học, lập trình, trò chuyện, và tuân thủ hướng dẫn so với các phiên bản trước.


4. Hỗ trợ đa ngôn ngữ


• Gemma 3 mở rộng khả năng hỗ trợ nhiều ngôn ngữ, cải thiện đáng kể so với các phiên bản trước nhờ việc tinh chỉnh bộ dữ liệu đào tạo.


5. Kiến trúc tối ưu hóa bộ nhớ


• Sử dụng QK-norm thay thế cho soft-capping, giúp ổn định quá trình suy luận.


RoPE base frequency được tăng từ 10K lên 1M trên global self-attention layers để cải thiện hiệu suất xử lý ngữ cảnh dài.


6. Được tối ưu hóa cho phần cứng phổ biến


• Có thể chạy trên điện thoại, laptop và GPU cao cấp, giúp mô hình phù hợp với các thiết bị tiêu dùng phổ biến.


• Hỗ trợ Quantization Aware Training (QAT), giúp giảm kích thước mô hình mà không làm giảm hiệu suất.


7. Tăng cường độ an toàn và kiểm duyệt nội dung


• Áp dụng các bộ lọc dữ liệu để giảm thiểu khả năng mô hình tạo ra nội dung gây hại hoặc không phù hợp.


Chính sách kiểm duyệt nghiêm ngặt đối với nội dung bạo lực, nội dung người lớn, thông tin cá nhân, v.v.


• Được kiểm tra về khả năng tạo nội dung nguy hiểm, đặc biệt trong các lĩnh vực khoa học và kỹ thuật.