Google reCAPTCHA bị chỉ trích là công cụ theo dõi dữ liệu, lãng phí nhiều thời gian của người dùng
Trong môi trường internet ngày nay, CAPTCHA đã trở thành một phần quen thuộc khi đăng nhập vào các trang web. Khi truy cập một trang web, bạn có thể thấy một hình ảnh chứa các ký tự và số bị bóp méo, yêu cầu bạn nhập lại để xác minh rằng bạn là con người. CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) được sử dụng rộng rãi để ngăn chặn bot tấn công và thư rác.
Năm 2007, Luis von Ahn nảy ra một ý tưởng độc đáo: Tại sao không tận dụng CAPTCHA để giúp số hóa các văn bản sách và báo cũ mà máy tính khó nhận diện? Từ đó, ông tạo ra reCAPTCHA – một công cụ tỏ ra cực kỳ hiệu quả. Tờ The New York Times thậm chí đã sử dụng reCAPTCHA để số hóa 13 triệu bài báo từ năm 1851.
Năm 2009, Google mua lại reCAPTCHA và áp dụng công nghệ này vào việc số hóa sách Google Books cũng như cải thiện dịch vụ Google Street View bằng cách xử lý hình ảnh biển báo đường phố và số nhà.
Tuy nhiên, đến năm 2025, hệ thống reCAPTCHA đã trở nên dễ bị bot vượt qua. Dù vậy, Google vẫn tiếp tục cung cấp dịch vụ này. Theo trang Chuppl, reCAPTCHA đã phát triển thành một công cụ theo dõi, thu thập dữ liệu người dùng và mang lại hàng chục tỷ USD doanh thu cho Google.
Thậm chí Google còn giới hạn lượt dùng miễn phí , nếu quá lượt Google sẽ thu phụ phí
vn-z.vn
“reCAPTCHA tạo ra dấu vân tay của trình duyệt theo từng pixel, ghi lại toàn bộ hoạt động của bạn trên internet theo thời gian thực.”
– Tiến sĩ Andrew Searles, cựu nhà nghiên cứu bảo mật tại Đại học California, Irvine.
Nghiên cứu của Tiến sĩ Searles, có tiêu đề “Lạc lối và Bối rối: Một nghiên cứu quy mô lớn về trải nghiệm thực tế của người dùng với reCAPTCHA v2”, chỉ ra rằng CAPTCHA của Google chủ yếu là một cơ chế theo dõi người dùng và thu thập dữ liệu, trong khi khả năng thực sự chống bot là rất thấp.
Nghiên cứu phát hiện rằng reCAPTCHA giám sát nhiều dữ liệu của người dùng, bao gồm:
• Cookie
• Lịch sử duyệt web
• Môi trường trình duyệt (canvas rendering, độ phân giải màn hình, chuyển động chuột, dữ liệu user-agent)
Tất cả những thông tin này đều có thể được sử dụng cho mục đích quảng cáo và theo dõi.
Phân tích trên 3.600 người dùng cho thấy, việc giải các thử thách reCAPTCHA dựa trên hình ảnh tốn nhiều thời gian hơn 557% so với chỉ cần tích vào ô kiểm. Ước tính, reCAPTCHA đã lãng phí khoảng 819 triệu giờ công lao động của xã hội, tương đương 61 tỷ USD (khoảng 445 tỷ VND theo tỷ giá hiện tại). Trong khi đó, giá trị thu thập dữ liệu cookie của Google từ reCAPTCHA được ước tính lên đến 888 tỷ USD (tương đương 6,48 triệu tỷ VND).
Thật đáng tiếc, hiện tại người dùng không có cách nào hoàn toàn tránh khỏi hệ thống reCAPTCHA của Google.

Năm 2009, Google mua lại reCAPTCHA và áp dụng công nghệ này vào việc số hóa sách Google Books cũng như cải thiện dịch vụ Google Street View bằng cách xử lý hình ảnh biển báo đường phố và số nhà.
Tuy nhiên, đến năm 2025, hệ thống reCAPTCHA đã trở nên dễ bị bot vượt qua. Dù vậy, Google vẫn tiếp tục cung cấp dịch vụ này. Theo trang Chuppl, reCAPTCHA đã phát triển thành một công cụ theo dõi, thu thập dữ liệu người dùng và mang lại hàng chục tỷ USD doanh thu cho Google.
Thậm chí Google còn giới hạn lượt dùng miễn phí , nếu quá lượt Google sẽ thu phụ phí

Google giới hạn reCAPTCHA miễn phí từ 1 triệu lần giảm xuống 10.000 lần
Vn-Z.vn Ngày 31 tháng 01 năm 2024, reCAPTCHA là một dịch vụ của Google được sử dụng để bảo vệ các trang web khỏi các hoạt động tự động không mong muốn hoặc tấn công bằng cách sử dụng các hình ảnh và thử thách mà con người có thể hiểu được, nhưng máy tính khó có thể nhận diện. Cụ thể, reCAPTCHA...

“reCAPTCHA tạo ra dấu vân tay của trình duyệt theo từng pixel, ghi lại toàn bộ hoạt động của bạn trên internet theo thời gian thực.”
– Tiến sĩ Andrew Searles, cựu nhà nghiên cứu bảo mật tại Đại học California, Irvine.
Nghiên cứu của Tiến sĩ Searles, có tiêu đề “Lạc lối và Bối rối: Một nghiên cứu quy mô lớn về trải nghiệm thực tế của người dùng với reCAPTCHA v2”, chỉ ra rằng CAPTCHA của Google chủ yếu là một cơ chế theo dõi người dùng và thu thập dữ liệu, trong khi khả năng thực sự chống bot là rất thấp.
Nghiên cứu phát hiện rằng reCAPTCHA giám sát nhiều dữ liệu của người dùng, bao gồm:
• Cookie
• Lịch sử duyệt web
• Môi trường trình duyệt (canvas rendering, độ phân giải màn hình, chuyển động chuột, dữ liệu user-agent)
Tất cả những thông tin này đều có thể được sử dụng cho mục đích quảng cáo và theo dõi.
Phân tích trên 3.600 người dùng cho thấy, việc giải các thử thách reCAPTCHA dựa trên hình ảnh tốn nhiều thời gian hơn 557% so với chỉ cần tích vào ô kiểm. Ước tính, reCAPTCHA đã lãng phí khoảng 819 triệu giờ công lao động của xã hội, tương đương 61 tỷ USD (khoảng 445 tỷ VND theo tỷ giá hiện tại). Trong khi đó, giá trị thu thập dữ liệu cookie của Google từ reCAPTCHA được ước tính lên đến 888 tỷ USD (tương đương 6,48 triệu tỷ VND).
Thật đáng tiếc, hiện tại người dùng không có cách nào hoàn toàn tránh khỏi hệ thống reCAPTCHA của Google.