Google reCAPTCHA bị chỉ trích là công cụ theo dõi dữ liệu, lãng phí nhiều thời gian của người dùng

hr.trung
Trong môi trường internet ngày nay, CAPTCHA đã trở thành một phần quen thuộc khi đăng nhập vào các trang web. Khi truy cập một trang web, bạn có thể thấy một hình ảnh chứa các ký tự và số bị bóp méo, yêu cầu bạn nhập lại để xác minh rằng bạn là con người. CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) được sử dụng rộng rãi để ngăn chặn bot tấn công và thư rác.


reCAPTCHA.webp

Năm 2007, Luis von Ahn nảy ra một ý tưởng độc đáo: Tại sao không tận dụng CAPTCHA để giúp số hóa các văn bản sách và báo cũ mà máy tính khó nhận diện? Từ đó, ông tạo ra reCAPTCHA – một công cụ tỏ ra cực kỳ hiệu quả. Tờ The New York Times thậm chí đã sử dụng reCAPTCHA để số hóa 13 triệu bài báo từ năm 1851.


Năm 2009, Google mua lại reCAPTCHA và áp dụng công nghệ này vào việc số hóa sách Google Books cũng như cải thiện dịch vụ Google Street View bằng cách xử lý hình ảnh biển báo đường phố và số nhà.


Tuy nhiên, đến năm 2025, hệ thống reCAPTCHA đã trở nên dễ bị bot vượt qua. Dù vậy, Google vẫn tiếp tục cung cấp dịch vụ này. Theo trang Chuppl, reCAPTCHA đã phát triển thành một công cụ theo dõi, thu thập dữ liệu người dùng và mang lại hàng chục tỷ USD doanh thu cho Google.

Thậm chí Google còn giới hạn lượt dùng miễn phí , nếu quá lượt Google sẽ thu phụ phí

“reCAPTCHA tạo ra dấu vân tay của trình duyệt theo từng pixel, ghi lại toàn bộ hoạt động của bạn trên internet theo thời gian thực.”

– Tiến sĩ Andrew Searles, cựu nhà nghiên cứu bảo mật tại Đại học California, Irvine.


Nghiên cứu của Tiến sĩ Searles, có tiêu đề “Lạc lối và Bối rối: Một nghiên cứu quy mô lớn về trải nghiệm thực tế của người dùng với reCAPTCHA v2”, chỉ ra rằng CAPTCHA của Google chủ yếu là một cơ chế theo dõi người dùng và thu thập dữ liệu, trong khi khả năng thực sự chống bot là rất thấp.


Nghiên cứu phát hiện rằng reCAPTCHA giám sát nhiều dữ liệu của người dùng, bao gồm:


• Cookie
• Lịch sử duyệt web
• Môi trường trình duyệt (canvas rendering, độ phân giải màn hình, chuyển động chuột, dữ liệu user-agent)

Tất cả những thông tin này đều có thể được sử dụng cho mục đích quảng cáo và theo dõi.

Phân tích trên 3.600 người dùng cho thấy, việc giải các thử thách reCAPTCHA dựa trên hình ảnh tốn nhiều thời gian hơn 557% so với chỉ cần tích vào ô kiểm. Ước tính, reCAPTCHA đã lãng phí khoảng 819 triệu giờ công lao động của xã hội, tương đương 61 tỷ USD (khoảng 445 tỷ VND theo tỷ giá hiện tại). Trong khi đó, giá trị thu thập dữ liệu cookie của Google từ reCAPTCHA được ước tính lên đến 888 tỷ USD (tương đương 6,48 triệu tỷ VND).

Thật đáng tiếc, hiện tại người dùng không có cách nào hoàn toàn tránh khỏi hệ thống reCAPTCHA của Google.
 
Trả lời

naroto

Chỉ cần nhấn like khi muốn cảm ơn!
Thành viên BQT
Đúng, nhiều lúc bấm chính xác mà vẫn "Please try again!"
 

Swings Onlyone

Rìu Chiến
VIP User
giai đoạn 2010 - 2018 thật sự chống bot khá tốt luôn. haizzz thời đại thay đổi
 

hoang1408

Búa Đá Đôi
rất khó chịu cái cacha này nhập mấy lần mới được + có khi hình sai này nọ . giờ đến cái facebook mỗi lần đăng nhập cũng hiện cái này
 

nhatdetool

Gà con
Ad sửa lại giá tiền VND ở dòng này nha, để cho nó chính xác.
DÒNG SAI: 819 triệu giờ công lao động của xã hội, tương đương 61 tỷ USD (khoảng 445 tỷ VND theo tỷ giá hiện tại)