DeepSeekMath-V2 đã ra mắt: mô hình toán học đạt trình độ huy chương vàng IMO

VNZ-TECHS 28/11/25

Toàn bộ cộng đồng AI đang chờ DeepSeek phát hành mô hình V4, nhưng “đợi mãi chưa thấy”. Tuy vậy, DeepSeek cũng không ngồi yên. Thỉnh thoảng hãng lại tung ra một bất ngờ và hôm nay họ âm thầm công bố mô hình DeepSeekMath-V2.

DeepSeekMath-V2 là một khung huấn luyện suy luận toán học có khả năng tự xác minh, được phát triển dựa trên DeepSeek-V3.2-Exp-Base. Mô hình sử dụng một bộ trình kiểm tra LLM (LLM verifier) để tự động xem xét các chứng minh toán học mà nó tạo ra, đồng thời liên tục tối ưu hóa hiệu suất thông qua các mẫu có độ khó cao.

Hiện mã nguồn và trọng số của mô hình đã mở nguồn hoàn toàn, phát hành trên Hugging Face và GitHub.

Mô hình này mạnh đến mức nào?

Hãy nhìn vào kết quả:

IMO 2025: đạt trình độ huy chương vàng
CMO 2024: huy chương vàng
Putnam 2024: 118/120 điểm, gần như tuyệt đối

Khi so sánh với các mô hình hàng đầu hiện tại như Claude Sonnet 4, GPT-5, Gemini 2.5 Pro, kết quả còn ấn tượng hơn:

Ở bài test Basic, DeepSeekMath-V2 đạt 99 điểm, bỏ xa toàn bộ đối thủ.
Ở Advanced, điểm của mô hình chỉ thấp hơn chút so với Gemini DeepThink (65.7 điểm), mô hình của Google cũng được tinh chỉnh đặc biệt cho toán học và đạt mức IMO vàng.

Với việc mở nguồn, miễn phí và đạt hiệu suất vượt trội, có thể nói DeepSeekMath-V2 hiện là mô hình toán học mạnh nhất đang công khai.

DeepSeek lại tỏ ra khá khiêm tốn, cho biết dù còn nhiều việc phải hoàn thiện, những kết quả hiện tại chứng minh rằng mô hình suy luận toán học có khả năng tự xác minh là hướng đi khả thi và có thể giúp tạo ra các hệ thống AI toán học mạnh hơn trong tương lai.

Nhìn lại những mô hình chuyên biệt gần đây của DeepSeek từ OCR đến toán học, hãng đang thể hiện nhiều kỹ thuật và ý tưởng mới. Điều này khiến cộng đồng càng kỳ vọng hơn: nếu V4 là mô hình đa phương thức toàn năng, thì rất có thể nó sẽ tạo ra bước đột phá lớn khi ra mắt.

Các bạn có thể tham khảo thêm tông tin tại đây
Hugging Face：https://huggingface.co/deepseek-ai/DeepSeek-Math-V2

Github：https://github.com/deepseek-ai/DeepSeek-Math-V2

Dùng thơ có thể Jailbreak AI với tỷ lệ thành công lên tới 62%, AI sẽ bàn luận về các nội dung cấm

Trả lời

You must log in or register to reply here.

BÀI MỚI ĐANG THẢO LUẬN

DeepSeekMath-V2 đã ra mắt: mô hình toán học đạt trình độ huy chương vàng IMO

Mô hình này mạnh đến mức nào?​

Chủ Đề Đang Thảo Luận

Mô hình này mạnh đến mức nào?