Tencent công bố mã nguồn mở khung Youtu-GraphRAG, giải quyết thách thức trong công nghệ tăng cường truy xuất đồ thị

VNZ-NEWS
Truy xuất tăng cường đồ thị (GraphRAG) đã trở thành một trong những giải pháp quan trọng để mô hình ngôn ngữ lớn (LLM) xử lý các bài toán hỏi đáp tri thức phức tạp trong nhiều lĩnh vực. Tuy nhiên, các giải pháp hiện tại trong giới học thuật và cộng đồng mã nguồn mở vẫn đang đối mặt với những khó khăn như chi phí khổng lồ, hiệu quả hạn chế và chi phí thích ứng cao.

Hôm nay, phòng thí nghiệm YouTu của Tencent chính thức công bố mã nguồn mở Youtu-GraphRAG framework. Theo giới thiệu, Youtu-GraphRAG đã cho thấy hiệu năng vượt trội trên sáu bộ đánh giá chuẩn đa ngôn ngữ, đa lĩnh vực:
  • Tối ưu hóa chi phí lớn: giảm hơn 30% chi phí xây dựng đồ thị so với các giải pháp tốt nhất cùng loại.
  • Cải thiện độ chính xác đáng kể: tăng tối đa hơn 16% độ chính xác trong các tác vụ suy luận phức tạp.
  • Khả năng khái quát mạnh mẽ: hỗ trợ xử lý song ngữ Trung – Anh, thông qua việc tối thiểu hóa sự can thiệp thủ công vào Schema để đạt khả năng chuyển đổi liền mạch giữa nhiều lĩnh vực.

YoutuGraphRAG.webp

YoutuGraphRAG-01.webp

YoutuGraphRAG-02.webp


Youtu-GraphRAG sử dụng Schema để kết nối hai tác nhân thông minh, đạt được sự thống nhất theo chiều dọc và vòng lặp nhận thức trong quá trình xây dựng, lập chỉ mục và truy xuất đồ thị.

Schema dẫn dắt quá trình xây dựng cây tri thức phân cấp


Bằng cách đưa vào các loại thực thể, quan hệ và thuộc tính có mục tiêu, framework này cung cấp các ràng buộc chính xác cho tác nhân xây dựng đồ thị, từ đó đạt được sự tiến hóa tự động của tri thức đa lĩnh vực và khả năng trích xuất chất lượng cao.

Thiết kế kiến trúc bốn tầng bao gồm:
  • Tầng thuộc tính: lưu trữ thông tin thuộc tính của thực thể.
  • Tầng quan hệ: xây dựng bộ ba quan hệ giữa các thực thể.
  • Tầng từ khóa: thiết lập hệ thống chỉ mục theo từ khóa.
  • Tầng cộng đồng: hình thành cấu trúc cộng đồng phân cấp, đa chiều.

Phát hiện cộng đồng với nhận thức kép cấu trúc – ngữ nghĩa


Framework khéo léo kết hợp đặc trưng cấu trúc topo và thông tin ngữ nghĩa của các đồ thị con, giúp trích lọc tri thức đa chiều trong mạng lưới phức tạp, từ đó tăng cường khả năng suy luận và tóm lược. Hiệu quả tạo cộng đồng vượt trội hơn hẳn các thuật toán truyền thống như LeidenLouvain. Đồng thời, framework tận dụng mô hình ngôn ngữ lớn để sinh ra phần tóm tắt cộng đồng, giúp đạt được mức trừu tượng tri thức cao hơn.

YoutuGraphRAG-03.webp

Cơ chế truy xuất thông minh lặp lại

Framework có khả năng hiểu sâu cấu trúc Schema của đồ thị, từ đó chuyển đổi các truy vấn phức tạp thành những truy vấn con phù hợp với đặc tính của đồ thị và có thể xử lý song song. Quá trình truy xuất lặp lại này giúp tăng cường khả năng lần theo và phản tư trong chuỗi suy luận.

YoutuGraphRAG-04.webp


Theo mô tả trong bài nghiên cứu được chia sẻ trên trang arXiv:

Youtu-GraphRAG là khung mới do Tencent phát triển nhằm tối ưu GraphRAG, giúp mô hình ngôn ngữ lớn xử lý suy luận phức tạp tốt hơn nhờ tổ chức tri thức thành đồ thị có cấu trúc. Khác với cách tiếp cận trước đây chỉ tập trung vào một khâu riêng lẻ, Youtu-GraphRAG tích hợp toàn diện từ xây dựng schema, phát hiện cộng đồng dựa trên cả cấu trúc lẫn ngữ nghĩa để tạo cây tri thức phân cấp, cho tới cơ chế truy vấn thông minh biến câu hỏi phức tạp thành truy vấn con song song. Ngoài ra, khung này còn có cách đánh giá mới để hạn chế rò rỉ tri thức từ LLM. Kết quả thử nghiệm cho thấy Youtu-GraphRAG tiết kiệm tới 90% chi phí token và tăng hơn 16% độ chính xác so với các phương pháp tiên tiến nhất, đồng thời dễ dàng thích ứng với nhiều lĩnh vực khác nhau.

Các bạn có thể tham khảo bài nghiên cứu và mã nguồn chi tiết tại đây
 
  • Like
yukixoma Reactions: yukixoma