NASA JPL tạo Thư viện PDF 8TB lớn nhất thế giới để nghiên cứu phần mềm độc hại

VNZ-NEWS
Vn-Z.vn ngày 16 tháng 06 năm 2023, Các nhà khoa học dữ liệu tại Jet Propulsion Laboratory (JPL) của Cơ quan Hàng không Vũ trụ Mỹ (NASA) đã tuyên bố tạo ra thư viện tài liệu PDF lớn nhất thế giới có dung lượng tới 8TB, nhằm thúc đẩy chương trình tài liệu an toàn (SafeDocs) của DARPA và sử dụng cho nghiên cứu về phần mềm độc hại. Đây là một thư việnquan trọng cho các nhà nghiên cứu an ninh mạng.

Thư viện tài liệu này chứa hàng triệu tài liệu dạng PDF từ nhiều nguồn khác nhau, bao gồm các báo cáo, sách, bài báo và tài liệu học thuật. Thư viện PDF được sử dụng bởi các chuyên gia an ninh mạng tại JPL để tìm kiếm các tài liệu liên quan đến phần mềm độc hại và phát hiện các mối đe dọa an ninh mạng mới.

8TB-PDF-library.jpg

Thư viện tài liệu PDF này được xây dựng trên nền tảng Apache Solr và được phát triển bởi JPL. Nó cho phép các nhà nghiên cứu tìm kiếm và truy cập các tài liệu PDF một cách nhanh chóng và dễ dàng. Thư viện cũng cung cấp các tính năng như phân tích tài liệu và định dạng lại các tài liệu PDF để thuận tiện cho việc tìm kiếm và sử dụng.
"PDF" là viết tắt của "Portable Document Format", là một định dạng tài liệu phức tạp có thể chứa hình ảnh, tập tin phim, biểu mẫu tương tác, mô hình 3D và nhiều thứ khác.
Cơ quan Hàng không vũ trụ Mỹ JPL cho biết họ đã thu thập được hơn 8 triệu tài liệu PDF, tổng dung lượng của bộ dữ liệu này khoảng 8 TB, là thư viện tài liệu lớn nhất và có sẵn công khai nhất trong lĩnh vực này. JPL đã hợp tác với tổ chức phi lợi nhuận PDF Association để phát triển nhiều công cụ để đối phó với các mối đe dọa trực tuyến.
Định dạng tài liệu PDF được sử dụng rộng rãi cho nhiều mục đích, bao gồm hợp đồng, tài liệu pháp lý, thiết kế kỹ thuật 3D và nhiều thứ khác. Tuy nhiên, định dạng PDF cũng rất phức tạp và có thể ẩn mã độc dưới nhiều hình thức khác nhau.

Để đối phó với các thách thức của định dạng PDF và các thách thức khác, cần thu thập một lượng lớn các mẫu PDF thực tế từ internet để tạo ra một nguồn tài nguyên chia sẻ miễn phí và có sẵn cho các chuyên gia phần mềm.
Với dung lượng hơn 8TB, Thư viện tài liệu PDF này hiện là một trong những thư viện tài liệu PDF lớn nhất thế giới và là một công cụ hữu ích cho các nhà nghiên cứu an ninh mạng và các chuyên gia phòng chống phần mềm độc hại.

Bạn đọc có thể tham khảo thêm thông tin tại đây