Microsoft ra mắt Data Formulator: AI cách mạng hóa trực quan hóa dữ liệu, giúp dữ liệu “lên tiếng” dễ dàng hơn

VNZ-NEWS
Nhóm nghiên cứu Microsoft Research đã giới thiệu Data Formulator, một phương pháp dựa trên khái niệm để giải quyết hiệu quả thách thức lâu dài trong chuyển đổi dữ liệu.

Data-Formulator.webp

Thách thức hiện tại
Các công cụ trực quan hóa hiện đại như Charticulator, Data Illustrator, Lyra, cũng như các thư viện ggplot2, VegaLite, thường yêu cầu dữ liệu ở dạng “gọn gàng” làm đầu vào. Điều này có nghĩa là mỗi biến trực quan hóa phải là một cột, và mỗi quan sát là một hàng.


Nếu dữ liệu không ở định dạng này, người dùng sẽ phải thực hiện chuyển đổi dữ liệu, ngay cả khi dữ liệu ban đầu đã đầy đủ. Quá trình này đòi hỏi kiến thức lập trình và sử dụng các công cụ chuyên môn như tidyverse, pandas hoặc Wrangler, dẫn đến quy trình làm việc kém hiệu quả do phải liên tục chuyển đổi giữa các bước xử lý dữ liệu và trực quan hóa.

Data Formulator


Data Formulator
giới thiệu một mô hình mới gọi là “ràng buộc khái niệm”, trong đó người dùng liên kết các “khái niệm” dữ liệu với các kênh trực quan hóa. Các khái niệm này có thể đến từ các cột hiện có hoặc được tạo mới khi cần thiết.

Có hai phương pháp để tạo khái niệm mới:


Nhắc bằng ngôn ngữ tự nhiên (dùng để suy luận dữ liệu)
Nhập dữ liệu theo ví dụ (dùng để định hình lại dữ liệu)

Sau khi người dùng chọn loại biểu đồ và ánh xạ các khái niệm mong muốn, hệ thống AI của Data Formulator sẽ suy ra các bước chuyển đổi dữ liệu cần thiết và tạo ra các kết quả trực quan hóa gợi ý.


Hệ thống cũng cung cấp phản hồi giải thích cho nhiều kết quả khác nhau, giúp người dùng có thể kiểm tra, tối ưu và tinh chỉnh trực quan hóa thông qua giao diện trực quan. Với sự kết hợp của ngôn ngữ tự nhiên và ví dụ lập trình, người dùng có thể làm việc với các công cụ quen thuộc mà vẫn tiếp cận được các chức năng chuyển đổi dữ liệu mạnh mẽ.

Kết quả thử nghiệm cho thấy Data Formulator hoạt động xuất sắc về mức độ hoàn thành nhiệm vụ và tính khả dụng. Trung bình, người tham gia có thể hoàn thành tất cả các nhiệm vụ trực quan hóa được giao trong vòng 20 phút, với nhiệm vụ 6 mất nhiều thời gian nhất do yêu cầu tính trung bình động trong 7 ngày.


Phương pháp trực quan hóa dựa trên khái niệm này có tiềm năng tác động đến thế hệ tiếp theo của các công cụ khám phá và sáng tạo dữ liệu trực quan, đồng thời có thể loại bỏ rào cản lâu dài trong quá trình chuyển đổi dữ liệu để tạo trực quan hóa.

Thông tin tham khảo thêm tại đây