Vn-Z.vn Ngày 21 tháng 12 năm 2024, Ngày hội “12 Days of OpenAI” đã khép lại với sự ra mắt của loạt mô hình AI o3, được kỳ vọng mang lại những bước tiến gần hơn đến trí tuệ nhân tạo tổng quát (AGI). Theo OpenAI, khả năng suy luận của o3 trong một số tình huống cụ thể đã rất gần với định nghĩa về AGI.
Tên Gọi o3 Và Lý Do Bỏ Qua o2
Mô hình mới được đặt tên là o3, thay vì o2 như dự đoán. Trong sự kiện trực tuyến sáng nay, CEO của OpenAI, ông Sam Altman, lý giải rằng tên gọi o2 bị bỏ qua để tránh trùng lặp với thương hiệu O2 của một nhà mạng tại Anh.
Thử Nghiệm An Toàn Trước Khi Ra Mắt Công Khai
o3 là phiên bản kế thừa của mô hình suy luận o1, gồm hai biến thể: o3 và o3-mini (phiên bản rút gọn). Trong khi o3 được thiết kế toàn diện, o3-mini tập trung vào các nhiệm vụ cụ thể nhờ quá trình tinh chỉnh.
Hiện tại, OpenAI chưa mở cửa hoàn toàn các mô hình này. Từ hôm nay, OpenAI mời các nhà nghiên cứu bảo mật đăng ký thử nghiệm trước phiên bản o3-mini qua liên kết: Đăng ký thử nghiệm. Phiên bản o3-mini dự kiến ra mắt vào cuối tháng 1/2025, sau đó sẽ đến lượt o3.
Cải Tiến Trong Suy Luận Của o3
Điểm khác biệt nổi bật của o3 so với các mô hình AI hiện nay là khả năng kiểm chứng thông tin. Quá trình này giúp giảm thiểu các lỗi thường gặp, dù sẽ gây ra một số độ trễ trong phản hồi, dao động từ vài giây đến vài phút, tùy vào độ phức tạp.
o3 còn sử dụng phương pháp “chuỗi suy nghĩ riêng tư” (private chain of thought) để “suy nghĩ” trước khi phản hồi. Điều này cho phép mô hình tạm dừng, phân tích và giải thích quá trình suy luận trước khi đưa ra câu trả lời chính xác nhất. Người dùng cũng có thể tùy chỉnh thời gian suy luận với ba mức độ: thấp, trung bình và cao. Hiệu năng của o3 tăng đáng kể ở mức tính toán cao nhất.
Hướng Tới AGI Và Các Thành Tựu Nổi Bật
AGI (trí tuệ nhân tạo tổng quát) được định nghĩa là hệ thống tự động đạt hiệu suất vượt trội so với con người trong các công việc mang lại giá trị kinh tế cao nhất. Với o3, OpenAI đã tiến thêm một bước quan trọng trong hành trình đạt đến AGI, không chỉ củng cố vị thế của mình trong ngành AI mà còn mang ý nghĩa chiến lược với đối tác Microsoft.
Trong bài kiểm tra ARC-AGI, o3 đạt điểm số 87,5% ở mức tính toán cao và 75,7% ở mức thấp, gấp ba lần hiệu năng của o1. Ngoài ra, o3 cũng đạt kết quả ấn tượng ở nhiều bài kiểm tra:
• SWE-Bench Verified: Cao hơn o1 tới 22,8%.
• Codeforces: Đạt điểm số 2727, thể hiện kỹ năng lập trình vượt trội.
• Kỳ thi Toán học Hoa Kỳ (2024): Đạt 96,7%.
• GPQA Diamond: Đạt 87,7% ở các bài kiểm tra sinh học, vật lý và hóa học trình độ cao học.
• EpochAI Frontier Math: Giải được 25,2% bài toán, phá vỡ kỷ lục trước đó (các mô hình khác chỉ đạt dưới 2%).
Những kết quả này hiện vẫn dựa trên đánh giá nội bộ của OpenAI, cần thêm các kiểm định từ khách hàng và tổ chức bên ngoài để xác minh.
Dù khả năng của o3 rất ấn tượng, OpenAI cũng nhấn mạnh những rủi ro tiềm ẩn mà mô hình này có thể mang lại. Công ty cam kết hợp tác với các tổ chức khác để xây dựng hệ thống đánh giá và đảm bảo an toàn toàn diện hơn.
Với những cải tiến vượt bậc, o3 không chỉ là bước tiến lớn trong lĩnh vực AI mà còn mang lại kỳ vọng lớn lao về một tương lai AGI không còn xa vời.
Mô hình mới được đặt tên là o3, thay vì o2 như dự đoán. Trong sự kiện trực tuyến sáng nay, CEO của OpenAI, ông Sam Altman, lý giải rằng tên gọi o2 bị bỏ qua để tránh trùng lặp với thương hiệu O2 của một nhà mạng tại Anh.
o3 là phiên bản kế thừa của mô hình suy luận o1, gồm hai biến thể: o3 và o3-mini (phiên bản rút gọn). Trong khi o3 được thiết kế toàn diện, o3-mini tập trung vào các nhiệm vụ cụ thể nhờ quá trình tinh chỉnh.
Hiện tại, OpenAI chưa mở cửa hoàn toàn các mô hình này. Từ hôm nay, OpenAI mời các nhà nghiên cứu bảo mật đăng ký thử nghiệm trước phiên bản o3-mini qua liên kết: Đăng ký thử nghiệm. Phiên bản o3-mini dự kiến ra mắt vào cuối tháng 1/2025, sau đó sẽ đến lượt o3.
Cải Tiến Trong Suy Luận Của o3
Điểm khác biệt nổi bật của o3 so với các mô hình AI hiện nay là khả năng kiểm chứng thông tin. Quá trình này giúp giảm thiểu các lỗi thường gặp, dù sẽ gây ra một số độ trễ trong phản hồi, dao động từ vài giây đến vài phút, tùy vào độ phức tạp.
o3 còn sử dụng phương pháp “chuỗi suy nghĩ riêng tư” (private chain of thought) để “suy nghĩ” trước khi phản hồi. Điều này cho phép mô hình tạm dừng, phân tích và giải thích quá trình suy luận trước khi đưa ra câu trả lời chính xác nhất. Người dùng cũng có thể tùy chỉnh thời gian suy luận với ba mức độ: thấp, trung bình và cao. Hiệu năng của o3 tăng đáng kể ở mức tính toán cao nhất.
AGI (trí tuệ nhân tạo tổng quát) được định nghĩa là hệ thống tự động đạt hiệu suất vượt trội so với con người trong các công việc mang lại giá trị kinh tế cao nhất. Với o3, OpenAI đã tiến thêm một bước quan trọng trong hành trình đạt đến AGI, không chỉ củng cố vị thế của mình trong ngành AI mà còn mang ý nghĩa chiến lược với đối tác Microsoft.
• SWE-Bench Verified: Cao hơn o1 tới 22,8%.
• Codeforces: Đạt điểm số 2727, thể hiện kỹ năng lập trình vượt trội.
• Kỳ thi Toán học Hoa Kỳ (2024): Đạt 96,7%.
• GPQA Diamond: Đạt 87,7% ở các bài kiểm tra sinh học, vật lý và hóa học trình độ cao học.
• EpochAI Frontier Math: Giải được 25,2% bài toán, phá vỡ kỷ lục trước đó (các mô hình khác chỉ đạt dưới 2%).
Những kết quả này hiện vẫn dựa trên đánh giá nội bộ của OpenAI, cần thêm các kiểm định từ khách hàng và tổ chức bên ngoài để xác minh.
Dù khả năng của o3 rất ấn tượng, OpenAI cũng nhấn mạnh những rủi ro tiềm ẩn mà mô hình này có thể mang lại. Công ty cam kết hợp tác với các tổ chức khác để xây dựng hệ thống đánh giá và đảm bảo an toàn toàn diện hơn.
Với những cải tiến vượt bậc, o3 không chỉ là bước tiến lớn trong lĩnh vực AI mà còn mang lại kỳ vọng lớn lao về một tương lai AGI không còn xa vời.
BÀI MỚI ĐANG THẢO LUẬN