Meta phát hành mô hình ngôn ngữ lớn mã nguồn mở Llama 3.1: độ dài ngữ cảnh 128K, 405B tương đương với GPT-4o và Claude 3.5 Sonnet
Vn-Z.vn Ngày 24 tháng 07 năm 2024, Meta đã chính thức phát hành mô hình ngôn ngữ lớn mã nguồn mở Llama 3.1 vào tối hôm qua ngày 23 tháng 07 ( theo giờ Việt Nam) , cung cấp các phiên bản tham số 8B, 70B và 405B.
Theo báo cáo từ Meta, dòng mô hình ngôn ngữ lớn mã nguồn mở Llama 3.1 đã cải thiện khả năng suy luận và hỗ trợ đa ngôn ngữ, tăng độ dài ngữ cảnh lên 128K và lần đầu tiên ra mắt mẫu máy hàng đầu với thông số 405B.
Meta tuyên bố rằng Llama 3.1-405B với 405 tỷ thông số có thể cạnh tranh với các mẫu ngôn ngữ lớn nguồn đóng hàng đầu như GPT-4, GPT-4o, Claude 3.5 Sonnet, v.v. trong một loạt các tác vụ bao gồm lẽ thường, khả năng khởi động, toán học, công cụ cách sử dụng và dịch đa ngôn ngữ.
Các mô hình Llama 3.1 tham số 8B và 70B cũng có khả năng cạnh tranh với các mô hình nguồn đóng và nguồn mở khác có lượng tham số tương tự.
Llama 3.1 hiện có sẵn để tải xuống trên trang web chính thức của Meta và Hugging Face, đồng thời hơn 25 đối tác bao gồm AWS, NVIDIA, Dell, Azure và Google Cloud cũng đã sẵn sàng.
Theo báo cáo từ Meta, dòng mô hình ngôn ngữ lớn mã nguồn mở Llama 3.1 đã cải thiện khả năng suy luận và hỗ trợ đa ngôn ngữ, tăng độ dài ngữ cảnh lên 128K và lần đầu tiên ra mắt mẫu máy hàng đầu với thông số 405B.
Meta tuyên bố rằng Llama 3.1-405B với 405 tỷ thông số có thể cạnh tranh với các mẫu ngôn ngữ lớn nguồn đóng hàng đầu như GPT-4, GPT-4o, Claude 3.5 Sonnet, v.v. trong một loạt các tác vụ bao gồm lẽ thường, khả năng khởi động, toán học, công cụ cách sử dụng và dịch đa ngôn ngữ.
Các mô hình Llama 3.1 tham số 8B và 70B cũng có khả năng cạnh tranh với các mô hình nguồn đóng và nguồn mở khác có lượng tham số tương tự.
Llama 3.1 hiện có sẵn để tải xuống trên trang web chính thức của Meta và Hugging Face, đồng thời hơn 25 đối tác bao gồm AWS, NVIDIA, Dell, Azure và Google Cloud cũng đã sẵn sàng.