Toàn bộ cộng đồng AI đang chờ DeepSeek phát hành mô hình V4, nhưng “đợi mãi chưa thấy”. Tuy vậy, DeepSeek cũng không ngồi yên. Thỉnh thoảng hãng lại tung ra một bất ngờ và hôm nay họ âm thầm công bố mô hình DeepSeekMath-V2.
DeepSeekMath-V2 là một khung huấn luyện suy luận toán học có khả năng tự xác minh, được phát triển dựa trên DeepSeek-V3.2-Exp-Base. Mô hình sử dụng một bộ trình kiểm tra LLM (LLM verifier) để tự động xem xét các chứng minh toán học mà nó tạo ra, đồng thời liên tục tối ưu hóa hiệu suất thông qua các mẫu có độ khó cao.
Hiện mã nguồn và trọng số của mô hình đã mở nguồn hoàn toàn, phát hành trên Hugging Face và GitHub.
Hãy nhìn vào kết quả:
DeepSeek lại tỏ ra khá khiêm tốn, cho biết dù còn nhiều việc phải hoàn thiện, những kết quả hiện tại chứng minh rằng mô hình suy luận toán học có khả năng tự xác minh là hướng đi khả thi và có thể giúp tạo ra các hệ thống AI toán học mạnh hơn trong tương lai.
Nhìn lại những mô hình chuyên biệt gần đây của DeepSeek từ OCR đến toán học, hãng đang thể hiện nhiều kỹ thuật và ý tưởng mới. Điều này khiến cộng đồng càng kỳ vọng hơn: nếu V4 là mô hình đa phương thức toàn năng, thì rất có thể nó sẽ tạo ra bước đột phá lớn khi ra mắt.
Các bạn có thể tham khảo thêm tông tin tại đây
Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-Math-V2
Github:https://github.com/deepseek-ai/DeepSeek-Math-V2
Hiện mã nguồn và trọng số của mô hình đã mở nguồn hoàn toàn, phát hành trên Hugging Face và GitHub.
Mô hình này mạnh đến mức nào?
- IMO 2025: đạt trình độ huy chương vàng
- CMO 2024: huy chương vàng
- Putnam 2024: 118/120 điểm, gần như tuyệt đối
- Ở bài test Basic, DeepSeekMath-V2 đạt 99 điểm, bỏ xa toàn bộ đối thủ.
- Ở Advanced, điểm của mô hình chỉ thấp hơn chút so với Gemini DeepThink (65.7 điểm), mô hình của Google cũng được tinh chỉnh đặc biệt cho toán học và đạt mức IMO vàng.
DeepSeek lại tỏ ra khá khiêm tốn, cho biết dù còn nhiều việc phải hoàn thiện, những kết quả hiện tại chứng minh rằng mô hình suy luận toán học có khả năng tự xác minh là hướng đi khả thi và có thể giúp tạo ra các hệ thống AI toán học mạnh hơn trong tương lai.
Nhìn lại những mô hình chuyên biệt gần đây của DeepSeek từ OCR đến toán học, hãng đang thể hiện nhiều kỹ thuật và ý tưởng mới. Điều này khiến cộng đồng càng kỳ vọng hơn: nếu V4 là mô hình đa phương thức toàn năng, thì rất có thể nó sẽ tạo ra bước đột phá lớn khi ra mắt.
Các bạn có thể tham khảo thêm tông tin tại đây
Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-Math-V2
Github:https://github.com/deepseek-ai/DeepSeek-Math-V2
BÀI MỚI ĐANG THẢO LUẬN