DeepSeek, mô hình trí tuệ nhân tạo (AI) nội địa của Trung Quốc, đang gây sốt trên toàn cầu và hiện đã vươn lên dẫn đầu bảng xếp hạng tải xuống ứng dụng miễn phí trên Apple App Store tại cả Trung Quốc và Mỹ, vượt qua ChatGPT. Được phát triển bởi Công ty Nghiên cứu Công nghệ Nền tảng AI DeepSeek (thành lập tháng 7/2023), công ty có sự tham gia của quỹ đầu tư định lượng Phantom Quant trong cơ cấu cổ đông.
Theo Red Star Capital, chi nhánh Bắc Kinh của DeepSeek đang tuyển dụng 52 vị trí, bao gồm các vai trò như nhà nghiên cứu học sâu, kỹ sư phát triển hệ thống lõi, và nhà thiết kế giao diện cao cấp. Các vị trí đều hưởng mức lương 14 tháng/năm. Đặc biệt, kỹ sư phát triển hệ thống lõi (dành cho sinh viên mới tốt nghiệp) có mức lương từ 60.000 đến 90.000 nhân dân tệ/tháng. Phần lớn các vị trí khác có mức lương khởi điểm trên 20.000 nhân dân tệ/tháng.
Công ty cũng mang đến cơ hội thực tập với mức thù lao hấp dẫn. Thực tập sinh mô hình AGI có mức lương từ 500 đến 1000 nhân dân tệ/ngày, trong khi thực tập sinh về dữ liệu được trả từ 500 đến 510 nhân dân tệ/ngày.
DeepSeek-R1: Cải tiến đáng kinh ngạc với chi phí tối ưu
Ngày 20/1, DeepSeek đã ra mắt mô hình suy luận DeepSeek-R1, được đánh giá đứng thứ 3 trên bảng xếp hạng Chatbot Arena quốc tế, ngang hàng với phiên bản mới nhất của ChatGPT-4o từ OpenAI. Đáng chú ý, chi phí huấn luyện DeepSeek-R1 chỉ là 557,6 triệu USD, chưa bằng 1/10 so với chi phí huấn luyện GPT-4o, thể hiện lợi thế vượt trội về kiểm soát chi phí.
Mô hình DeepSeek-R1 sử dụng công nghệ học tăng cường quy mô lớn trong giai đoạn hậu huấn luyện, giúp cải thiện đáng kể khả năng suy luận ngay cả khi dữ liệu gán nhãn rất ít. Hiệu suất của mô hình trong các nhiệm vụ như toán học, lập trình, và suy luận ngôn ngữ tự nhiên sánh ngang với phiên bản OpenAI o1 chính thức.
DeepSeek vượt ChatGPT trên bảng xếp hạng tải ứng dụng
Ứng dụng DeepSeek hiện đã đạt vị trí số 1 trên bảng xếp hạng tải xuống ứng dụng miễn phí của Apple tại Trung Quốc và Mỹ, vượt qua ChatGPT. Ứng dụng sử dụng mô hình DeepSeek-V3 với hơn 600 tỷ tham số, hỗ trợ các tính năng như trò chuyện thông minh, tìm kiếm AI, phân tích sâu, và tải lên tệp.
Mở rộng nghiên cứu và cải tiến từ Meta
Theo thông tin từ trang Information, công ty mẹ của Facebook, Meta, đã thành lập 4 nhóm nghiên cứu riêng biệt để phân tích mô hình DeepSeek của Phantom Quant nhằm cải tiến mô hình Llama của mình. Các nhóm này tập trung nghiên cứu cách Phantom Quant tối ưu hóa chi phí huấn luyện và vận hành, dữ liệu dùng để huấn luyện, và các kỹ thuật tái cấu trúc mô hình từ DeepSeek.
DeepSeek đã công bố toàn bộ kỹ thuật huấn luyện DeepSeek-R1 và mở nguồn trọng số mô hình. Đồng thời, công ty điều chỉnh các cấp phép liên quan để thúc đẩy việc ứng dụng mô hình một cách rộng rãi và linh hoạt. Với những bước tiến đáng kể, DeepSeek đang khẳng định vị thế trong lĩnh vực AI toàn cầu.

Công ty cũng mang đến cơ hội thực tập với mức thù lao hấp dẫn. Thực tập sinh mô hình AGI có mức lương từ 500 đến 1000 nhân dân tệ/ngày, trong khi thực tập sinh về dữ liệu được trả từ 500 đến 510 nhân dân tệ/ngày.
DeepSeek-R1: Cải tiến đáng kinh ngạc với chi phí tối ưu
Ngày 20/1, DeepSeek đã ra mắt mô hình suy luận DeepSeek-R1, được đánh giá đứng thứ 3 trên bảng xếp hạng Chatbot Arena quốc tế, ngang hàng với phiên bản mới nhất của ChatGPT-4o từ OpenAI. Đáng chú ý, chi phí huấn luyện DeepSeek-R1 chỉ là 557,6 triệu USD, chưa bằng 1/10 so với chi phí huấn luyện GPT-4o, thể hiện lợi thế vượt trội về kiểm soát chi phí.

Mô hình DeepSeek-R1 sử dụng công nghệ học tăng cường quy mô lớn trong giai đoạn hậu huấn luyện, giúp cải thiện đáng kể khả năng suy luận ngay cả khi dữ liệu gán nhãn rất ít. Hiệu suất của mô hình trong các nhiệm vụ như toán học, lập trình, và suy luận ngôn ngữ tự nhiên sánh ngang với phiên bản OpenAI o1 chính thức.

DeepSeek vượt ChatGPT trên bảng xếp hạng tải ứng dụng
Ứng dụng DeepSeek hiện đã đạt vị trí số 1 trên bảng xếp hạng tải xuống ứng dụng miễn phí của Apple tại Trung Quốc và Mỹ, vượt qua ChatGPT. Ứng dụng sử dụng mô hình DeepSeek-V3 với hơn 600 tỷ tham số, hỗ trợ các tính năng như trò chuyện thông minh, tìm kiếm AI, phân tích sâu, và tải lên tệp.
Mở rộng nghiên cứu và cải tiến từ Meta
Theo thông tin từ trang Information, công ty mẹ của Facebook, Meta, đã thành lập 4 nhóm nghiên cứu riêng biệt để phân tích mô hình DeepSeek của Phantom Quant nhằm cải tiến mô hình Llama của mình. Các nhóm này tập trung nghiên cứu cách Phantom Quant tối ưu hóa chi phí huấn luyện và vận hành, dữ liệu dùng để huấn luyện, và các kỹ thuật tái cấu trúc mô hình từ DeepSeek.
DeepSeek đã công bố toàn bộ kỹ thuật huấn luyện DeepSeek-R1 và mở nguồn trọng số mô hình. Đồng thời, công ty điều chỉnh các cấp phép liên quan để thúc đẩy việc ứng dụng mô hình một cách rộng rãi và linh hoạt. Với những bước tiến đáng kể, DeepSeek đang khẳng định vị thế trong lĩnh vực AI toàn cầu.