Trung Quốc phát hành chatbot Tianhe Tianyua am hiểu đa lĩnh vực Tiếng Trung, dựa trên siêu máy tính

VNZ-NEWS
Vn-Z.vn Ngày 22 tháng 05 năm 2023, Tại sự kiện Hội nghị Thông minh Thế giới lần thứ 7 chính thức được tổ chức tại Trung tâm Hội nghị và Triển lãm Quốc gia ở Thẩm Dương, kéo dài trong 4 ngày.

Hội chợ Công nghệ Thông minh lần này tại Trung Quốc bao gồm 8 khu trưng bày trong nhà và khu vực trưng bày ngoài trời, bao gồm khu trưng bày về chủ đề ứng dụng đổi mới công nghệ thông tin, trí tuệ nhân tạo, 5G + mạng lưới công nghiệp, giao thông thông minh, sản xuất thông minh, cuộc sống thông minh, tài chính số, sức khỏe số, quốc tế và khu vực tỉnh thành, cũng như khu vực trải nghiệm về lái xe tự động và 5G.


Thiết bị tính toán siêu việt thế hệ mới Tianhe , đây là một loại siêu máy tính mới của Trung Quốc, có khả năng tính toán hàng trăm ngàn tỉ phép tính mỗi giây. Đây cũng là lần đầu tiên siêu máy tính mới này xuất hiện tại triển lãm.

Tianhe-sieu-may-tinh.webp

Trong nhiều năm, máy tính siêu việt Tianhe liên tục thách thức giới hạn tốc độ tính toán của thế giới, từ hàng chục ngàn tỉ lần phép tính mỗi giây đến hàng trăm ngàn tỉ phép tính mỗi giây.
Được biết siêu máy tính siêu việt thế hệ mới không phải là Tianhe-1, với hiệu suất tính toán đỉnh cao trong tính toán số dấu chấm động kép đạt 200P Flops, khả năng lưu trữ dữ liệu không thấp hơn 20PB, công suất đỉnh không vượt quá 8 MW, mạnh hơn 150 lần so với sức mạnh của Tianhe-1. Thành phố Thẩm Dương đang áp dụng các công nghệ dựa trên Tianhe, chiếm hơn 20% tổng số tài nguyên sức mạnh máy tính siêu việt của cả Trung Quốc.

Tại hội nghị này , Trung Quốc cũng phát hành bộ dữ liệu của mô hình ngôn ngữ Trung Quốc . Chatbot này sẽ ứng dụng các công nghệ được Trung tâm Siêu máy tính Quốc gia Thiên Tân thu thập và sắp xếp từ nhiều nguồn dữ liệu trang web, dữ liệu đào tạo nguồn mở khác nhau, dữ liệu tiểu thuyết Trung Quốc, dữ liệu Trung Quốc cổ đại, dữ liệu bách khoa toàn thư, dữ liệu tin tức và nhiều bộ dữ liệu u đào tạo trong các lĩnh vực chuyên môn như y học cổ truyền Trung Quốc, y học , tư vấn, luật, v.v. Chatbot mô hình ngôn ngữ lớn của Trung Quốc - mang tên Tianhe Tianyuan được đào tạo dựa theo tổng số mã thông báo lên tới 350B .

Số mã thông báo (token) trong một mô hình ngôn ngữ lớn như Tianhe Tianyuan là số lượng từ và ký tự được tạo thành khi mô hình đọc và xử lý một văn bản. Vì vậy, tổng số mã thông báo đạt 350 tỷ (350B) của Tianhe Tianyuan có nghĩa là mô hình này có khả năng đọc và xử lý được văn bản có độ dài tương đương với 350 tỷ từ và ký tự. Điều này cho thấy sức mạnh tính toán của mô hình này có thể xử lý và hiểu được rất nhiều thông tin, và có thể được sử dụng cho nhiều ứng dụng khác nhau trong lĩnh vực xử lý ngôn ngữ tự nhiên và trí tuệ nhân tạo.

Tianhe-Tianyuan-chatbot.webp


Nhằm tận dụng tối đa ưu thế tính toán của siêu máy tính và thúc đẩy ứng dụng của các nền tảng máy tính siêu việt không đồng nhất trong lĩnh vực phát triển và cung cấp dịch vụ trí tuệ nhân tạo, Trung tâm Siêu máy tính Quốc gia tại Thẩm Dương đã công bố "Nền tảng sáng tạo mở tính toán thông minh cấp E của Tianhe" và "Mô hình ngôn ngữ lớn chatbot Tianhe Tianyuan" tại Hội nghị Hợp tác Sáng tạo Công nghệ Thông minh Thế giới được tổ chức trong khuôn khổ Hội nghị Thông minh Thế giới lần thứ 7.

Tianhe là một trong những tên tuổi lớn trong lĩnh vực máy tính siêu việt của Trung Quốc. Từ khi ra đời vào năm 2010, siêu máy tính Tianhe-1 đã làm nên lịch sử khi trở thành siêu máy tính siêu việt đầu tiên của Trung Quốc và xếp thứ hai trên thế giới về tốc độ tính toán. Sau đó, siêu máy tính Tianhe-2 cũng đã dẫn đầu danh sách các siêu máy tính siêu việt thế giới trong nhiều năm.


Năm 2021, Trung Quốc đã ra mắt siêu máy tính siêu việt Tianhe-3, gọi là "máy tính siêu việt thế hệ mới" với khả năng tính toán cực kỳ mạnh mẽ và tốc độ xử lý ấn tượng. Với hiệu suất tính toán đỉnh cao trong tính toán số dấu chấm động kép đạt 200P Flops, khả năng lưu trữ dữ liệu không thấp hơn 20PB và công suất đỉnh không vượt quá 8 MW, siêu máy tính siêu việt Tianhe-3 được xem là một bước đột phá lớn trong lĩnh vực máy tính siêu việt của Trung Quốc.
Tianhe Tianyuan là một mô hình ngôn ngữ lớn được phát triển bởi Trung tâm Siêu máy tính Quốc gia tại Thẩm Dương, Trung Quốc. Được xây dựng trên nền tảng siêu máy tính siêu việt Tianhe, mô hình này sử dụng các thuật toán học sâu để học và phân tích ngôn ngữ tự nhiên.


Mục tiêu của Tianhe Tianyuan là tạo ra một mô hình ngôn ngữ lớn có khả năng xử lý thông tin và tương tác với con người bằng ngôn ngữ tự nhiên một cách hiệu quả. Nó được phát triển cho các ứng dụng trong lĩnh vực trí tuệ nhân tạo, bao gồm việc tạo ra chatbot, hệ thống trả lời tự động, và các ứng dụng xử lý ngôn ngữ tự nhiên khác.


Tianhe Tianyuan được xem là một bước tiến quan trọng trong nghiên cứu và phát triển các mô hình ngôn ngữ lớn, đặc biệt là trong lĩnh vực tiếng Trung. Nó sử dụng các thuật toán học sâu tiên tiến để học và phân tích cú pháp, ngữ nghĩa và ngữ cảnh của ngôn ngữ, giúp nó có khả năng hiểu và tương tác với con người một cách tự nhiên và chính xác hơn.


Tianhe Tianyuan được xem là một trong những mô hình ngôn ngữ lớn hàng đầu của Trung Quốc
Siêu máy tính siêu việt thế hệ mới Tianhe đã đạt được sự đổi mới toàn diện trong ứng dụng công nghệ thông tin từ phần cứng đến phần mềm, và các công nghệ cốt lõi như chip tính toán và bo mạch chủ được sử dụng trên siêu máy tính siêu việt thế hệ mới của Tianhe cũng được chính thức trưng bày tại khu trưng bày.

Theo thông tin, "Nền tảng sáng tạo mở tính toán thông minh cấp E của Tianhe" sẽ mang lại khả năng tính toán siêu việt vượt qua hàng trăm ngàn tỉ lần tính toán cho các mô đun khác nhau, hỗ trợ tính toán khoa học kỹ thuật truyền thống và phục vụ tính toán thông minh kết hợp, tạo ra một nền tảng cung cấp sức mạnh tính toán đa dạng và hỗ trợ cho sự đổi mới và phát triển chất lượng cao của nền kinh tế số.


Tianhe-Tianyuan-Cap-E.webp

Trong tương lai, Trung tâm siêu máy tính quốc gia Thiên Tân cũng sẽ bắt đầu đào tạo các mô hình chuyên nghiệp chuyên sâu cho các lĩnh vực y tế, công nghiệp, pháp lý và các lĩnh vực khác dựa trên cơ sở "Mô hình ngôn ngữ lớn Tianhe Tianyuan". Trong tương lai, mô hình lớn sẽ trở thành nền tảng của trí tuệ công nghiệp dưới sự hỗ trợ của nền tảng học sâu.