Adblocker detected! Please consider reading this notice.

VNZ-NEWS · 12/3/25

https://storage.googleapis.com/deepmind-media/gemma/Gemma3Report.pdf

Gemma 3 là phiên bản mới nhất trong dòng mô hình ngôn ngữ mở của Google DeepMind, được thiết kế để hoạt động hiệu quả trên các thiết bị tiêu dùng như điện thoại, laptop và GPU cao cấp. Phiên bản này mang lại nhiều cải tiến quan trọng, bao gồm:

1. Hỗ trợ đa phương thức (Multimodal)

• Gemma 3 tích hợp khả năng hiểu hình ảnh, sử dụng bộ mã hóa hình ảnh SigLIP, giúp mô hình xử lý hình ảnh cùng với văn bản.

• Mô hình áp dụng Pan and Scan (P&S) để xử lý hình ảnh có tỷ lệ khung hình không vuông, giúp cải thiện khả năng nhận dạng văn bản trong hình ảnh.

2. Ngữ cảnh mở rộng lên đến 128K token

• Hỗ trợ ngữ cảnh dài lên đến 128K token, giúp mô hình duy trì và xử lý thông tin từ các đoạn văn bản lớn mà không bị suy giảm hiệu suất.

• Sử dụng tỷ lệ 5:1 giữa attention cục bộ và toàn cục để tối ưu hóa bộ nhớ, giảm bớt tình trạng KV-cache memory quá tải khi xử lý ngữ cảnh dài.

3. Hiệu suất nâng cao nhờ huấn luyện mới

• Gemma 3-4B-IT có hiệu suất tương đương với Gemma 2-27B-IT, nghĩa là một mô hình nhỏ hơn nhưng mạnh ngang một phiên bản cũ lớn hơn.

• Gemma 3-27B-IT có thể so sánh với Gemini 1.5 Pro trên nhiều tiêu chuẩn đánh giá.

• Cải thiện khả năng toán học, lập trình, trò chuyện, và tuân thủ hướng dẫn so với các phiên bản trước.

4. Hỗ trợ đa ngôn ngữ

• Gemma 3 mở rộng khả năng hỗ trợ nhiều ngôn ngữ, cải thiện đáng kể so với các phiên bản trước nhờ việc tinh chỉnh bộ dữ liệu đào tạo.

5. Kiến trúc tối ưu hóa bộ nhớ

• Sử dụng QK-norm thay thế cho soft-capping, giúp ổn định quá trình suy luận.

• RoPE base frequency được tăng từ 10K lên 1M trên global self-attention layers để cải thiện hiệu suất xử lý ngữ cảnh dài.

6. Được tối ưu hóa cho phần cứng phổ biến

• Có thể chạy trên điện thoại, laptop và GPU cao cấp, giúp mô hình phù hợp với các thiết bị tiêu dùng phổ biến.

• Hỗ trợ Quantization Aware Training (QAT), giúp giảm kích thước mô hình mà không làm giảm hiệu suất.

7. Tăng cường độ an toàn và kiểm duyệt nội dung

• Áp dụng các bộ lọc dữ liệu để giảm thiểu khả năng mô hình tạo ra nội dung gây hại hoặc không phù hợp.

• Chính sách kiểm duyệt nghiêm ngặt đối với nội dung bạo lực, nội dung người lớn, thông tin cá nhân, v.v.

• Được kiểm tra về khả năng tạo nội dung nguy hiểm, đặc biệt trong các lĩnh vực khoa học và kỹ thuật.

Adblocker detected! Please consider reading this notice.

Google ra mắt Gemma 3: Mô hình AI mạnh nhất có thể chạy trên một GPU duy nhất

VNZ-NEWS

Administrator

BÀI LIÊN QUAN