Alibaba ra mắt mô hình AI mã nguồn mở Qwen2-Math, có khả năng toán học cao hơn ChatGPT-4o

VNZ-NEWS
Vn-Z.vn Ngày 09 tháng 08 năm 2024, Gia đình mã nguồn mở Alibaba Tongyi Qianwen Qwen2 vừa chào đón thành viên mới Qwen2-Math, với ba phiên bản: 1,5 tỷ tham số, 7 tỷ tham số và 72 tỷ tham số. Đây là mô hình ngôn ngữ AI được xây dựng dựa trên Qwen2 LLM và sử dụng đặc biệt để giải các bài toán.
Giới thiệu

Qwen2-Math là một loạt các mô hình ngôn ngữ được xây dựng dựa trên Qwen2 LLM dành riêng cho việc giải quyết vấn đề toán học, khả năng của nó vượt trội đáng kể so với các mô hình nguồn mở và thậm chí vượt qua các mô hình nguồn đóng (như GPT-4o). Góp phần giải quyết các vấn đề toán học nâng cao đòi hỏi khả năng suy luận logic nhiều bước phức tạp.



Về hiệu suất

Mô hình Qwen2-Math dành riêng cho toán học của Alibaba dựa trên một loạt điểm chuẩn toán học. Kết quả đánh giá về Math cho thấy mô hình chuyên biệt toán học lớn nhất của hãng là Qwen2-Math-72B-Instruct vượt qua các mô hình hiện đại nhất gồm GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro và Llama-3.1-405B .



Mô hình cơ bản Qwen2-Math

Mô hình tinh chỉnh lệnh Qwen2-Math


Từ thông tin giới thiệu của nhóm phát triển , Qwen2-Math tập trung vào khả năng toán học và hiện chỉ hỗ trợ tiếng Anh. Nhóm dự định ra mắt mô hình song ngữ hỗ trợ tiếng Anh và tiếng Trung, đồng thời phát triển các mô hình đa ngôn ngữ.
Bạn đọc có thể tham khảo thêm thông tin Qwen2-Math tại đây
 
Trả lời

senshin2408

Búa Đá
lại thêm 1 công bố và tự lập biểu đồ so sánh của các anh khựa.