Google triển khai thuật toán vectơ mới tăng cường khả năng nhận dạng email spam/lừa đảo cho Gmail

VNZ-NEWS
Vn-Z.vn Ngày 04 tháng 09 năm 2023, Gần đây Google đã âm thầm bổ sung bộ lọc thư rác mới vào Gmail, thuật toán mới của Google sẽ giúp gmail xác định email thư rác và lừa đảo tốt hơn.

Được biết, bộ lọc thư rác mới này dựa trên thuật toán RETVec (Bộ tạo vectơ văn bản hiệu quả có khả năng phục hồi), một trình tạo vectơ văn bản đa ngôn ngữ nguồn mở mới trên Google Colab. Thuật toán mới có thể ánh xạ các từ thành vectơ hoặc số, có thể được sử dụng để cải thiện tỷ lệ nhận dạng email spam và lừa đảo đồng thời giảm tỷ lệ dương tính giả.

Các mô hình phân loại văn bản hiện tại vẫn gặp khó khăn trong việc xác định các hành vi lừa đảo và tấn công lừa đảo vì tội phạm mạng tiếp tục tạo ra nội dung vượt qua hệ thống phòng thủ. Google tuyên bố rằng sau khi đào tạo, RETVec có thể phát hiện và hiểu các thao tác ở cấp độ ký tự, bao gồm chèn, xóa, viết sai chính tả và từ đồng âm, đồng thời giảm chi phí tính toán.

RETVec-GMail-spam-filter-performance.png

Theo thống kê của chính Google, sau khi áp dụng RETVec vào Gmail, tỷ lệ phát hiện thư rác tăng 38%, tỷ lệ dương tính giả giảm 19,4% và mức sử dụng bộ xử lý tensor (TPU) giảm 83,13% so với bộ lọc trước đó.

Google tuyên bố rằng các mô hình được đào tạo bằng RETVec thể hiện tốc độ suy luận nhanh hơn và các mô hình nhỏ hơn có thể giảm chi phí tính toán , giảm độ trễ, điều này rất quan trọng đối với các mô hình trên các hệ thống và thiết bị quy mô lớn.

Dự án này hiện đã được công bố trên hệ thống mã nguồn mở GitHub, bạn đọc có thể tham khảo thêm thông tin tại đây

Using RETVec to train an emotion classifier