DeepSeekMath-V2 đã ra mắt: mô hình toán học đạt trình độ huy chương vàng IMO

VNZ-TECHS
Toàn bộ cộng đồng AI đang chờ DeepSeek phát hành mô hình V4, nhưng “đợi mãi chưa thấy”. Tuy vậy, DeepSeek cũng không ngồi yên. Thỉnh thoảng hãng lại tung ra một bất ngờ và hôm nay họ âm thầm công bố mô hình DeepSeekMath-V2.

DeepseekMatchV2.png

DeepSeekMath-V2 là một khung huấn luyện suy luận toán học có khả năng tự xác minh, được phát triển dựa trên DeepSeek-V3.2-Exp-Base. Mô hình sử dụng một bộ trình kiểm tra LLM (LLM verifier) để tự động xem xét các chứng minh toán học mà nó tạo ra, đồng thời liên tục tối ưu hóa hiệu suất thông qua các mẫu có độ khó cao.

Hiện mã nguồn và trọng số của mô hình đã mở nguồn hoàn toàn, phát hành trên Hugging Face và GitHub.

Mô hình này mạnh đến mức nào?​



DeepseekmathV2.png

DeepseekmathV2-1.png

Hãy nhìn vào kết quả:
  • IMO 2025: đạt trình độ huy chương vàng
  • CMO 2024: huy chương vàng
  • Putnam 2024: 118/120 điểm, gần như tuyệt đối
Khi so sánh với các mô hình hàng đầu hiện tại như Claude Sonnet 4, GPT-5, Gemini 2.5 Pro, kết quả còn ấn tượng hơn:
  • Ở bài test Basic, DeepSeekMath-V2 đạt 99 điểm, bỏ xa toàn bộ đối thủ.
  • Advanced, điểm của mô hình chỉ thấp hơn chút so với Gemini DeepThink (65.7 điểm), mô hình của Google cũng được tinh chỉnh đặc biệt cho toán học và đạt mức IMO vàng.
Với việc mở nguồn, miễn phí và đạt hiệu suất vượt trội, có thể nói DeepSeekMath-V2 hiện là mô hình toán học mạnh nhất đang công khai.

DeepSeek lại tỏ ra khá khiêm tốn, cho biết dù còn nhiều việc phải hoàn thiện, những kết quả hiện tại chứng minh rằng mô hình suy luận toán học có khả năng tự xác minh là hướng đi khả thi và có thể giúp tạo ra các hệ thống AI toán học mạnh hơn trong tương lai.

Nhìn lại những mô hình chuyên biệt gần đây của DeepSeek từ OCR đến toán học, hãng đang thể hiện nhiều kỹ thuật và ý tưởng mới. Điều này khiến cộng đồng càng kỳ vọng hơn: nếu V4 là mô hình đa phương thức toàn năng, thì rất có thể nó sẽ tạo ra bước đột phá lớn khi ra mắt.

Các bạn có thể tham khảo thêm tông tin tại đây
Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-Math-V2

Github:https://github.com/deepseek-ai/DeepSeek-Math-V2