(Vn-Z.vn)Ngày 24 tháng 11, Gần đây mình có theo dõi trang web "chợ đen" của ngành công nghệ thông tin. Tại trang web này chia sẻ nhiều nội dung như các công cụ, hướng dẫn, hack, database.v.v.v .
"Chợ Đen" này cũng được nhiều người dùng ẩn danh sử dụng vào mục đích mua bán cơ sở dữ liệu , từng có nhiều DB nổi tiếng được mua bán cũng như chia sẻ công khai tại chợ . Trong đó dữ liệu Facebook Việt Nam cũng được rao bán và chia sẻ nhiều lần. Gần đây nhất là có tài khoản rao bán tới 71 và 41 triệu thông tin người dùng facebook Việt Nam.
Sau khi chia sẻ thông tin này tại Vn-Zoom, có nhiều người cho rằng các thông tin tài khoản này phần lớn là tài khoản ảo ( Clone) . Những tài khoản Clone này được những người am hiểu về công nghệ thông tin và Facebook thiết lập. Họ có trong tay mạng lưới Clone lên tới hàng triệu tài khoản.
Trong khi đó cũng có nhiều người tin rằng trong dữ liệu này có thông tin của người dùng thật. Facebook từng có nhiều đợt rò rỉ dữ liệu rất nghiêm trọng. Dữ liệu của người Việt Nam từng bị tiết lộ với 50 triệu tài khoản Facebook Việt Nam bị lộ số điện thoại.
Thông tin dữ liệu gồm Fbid, email ,username, phone_number, fullname, gender,birthday,hometown,city,zip,etc .. .Tức là bao gồm gần như toàn bộ thông tin cơ bản của người dùng.
Những thông tin này không bao gồm thông tin thẻ ngân hàng và mật khẩu nên người dùng cũng không cần quá lo lắng. Dữ liệu này được sử dụng chủ yếu vào mục đích quảng cáo.
Vậy thông tin của hàng chục triệu tài khoản Facebook được rao bán này là thật hay ảo . Hôm nay mình sẽ phân tích một chút về thông tin của hàng chục triệu người dùng Facebook Việt Nam mới được rao bán gần đây.
Dữ liệu được rao bán dưới dạng .json viết tắt của Javascript Object Notation. JSON là một định dạng tiêu chuẩn trong trao đổi dữ liệu nhẹ, nhanh chóng và dễ dàng tạo (generate) và phân tích ((parse)
Như đã nói ở trên thông tin này bao gồm các dữ liệu cơ bản, tức là các dữ liệu mà người dùng khai báo public với Facebook.
Khu vực khai báo các thông tin cơ bản mà người dùng thường bị facebook nhắc nhở cập nhật
Bằng các biện pháp kỹ thuật , người ta sẽ crawl toàn bộ các thông tin này của hàng chục triệu tài khoản Facebook ngẫu nhiên, sau đó sẽ lọc ra theo từng khu vực, sở thích, .v.v. để mua bán hoặc sử dụng vào mục đích khác nhau.
Mình sẽ test một vài tài khoản trong file json để kiểm tra
Đây là FB ID và tên tài khoản Facebook trong file json
Truy vấn đến trên trang facebook.com đúng tên tài khoản đã được crawl
Trong file json này còn chứa số điện thoại của người dùng Facebook , nên mình sẽ thử một số điện thoại bất kỳ
Tìm ngẫu nhiên một tài khoản Facebook có tên là Hoàng Thu
Toàn bộ các thông tin public của tài khoản này đã được crawl về file json
Thông tin kiểm tra chính xác đến tài khoản Hoàng Thu
Hầu như toàn bộ các thông tin cơ bản , người dùng để công khai đều được crawl về file json. Những thông tin người dùng cài đặt riêng tư sẽ không có trong file json này.
Như vậy dữ liệu này có nhiều thông tin là thật, nhưng cũng có tài khoản ảo. Có nhiều tài khoản "bỏ hoang" không sử dụng trong thời gian dài.
[cập nhật:
Sau khi chia sẻ bài viết này, có thành viên Vn-Zoom inbox private nhờ kiểm tra xem thông tin của mình có bị crawl hay không ?
Tài khoản của bạn ấy được tạo vào năm 2012 , các thông tin cơ bản gồm email, sdt đều được cài đặt riêng tư. Nhưng vẫn bị crawl về file json này. Vì vậy mọi thứ đều có thể xảy ra, các bạn nên hạn chế tối đa việc chia sẻ dữ liệu cá nhân lên facebook khi không thật sự cần thiết.
Thông tin đã được cài đặt riêng tư
Vẫn bị crawl về file json
Qua đây cho thấy , với việc thu thập được thông tin gồm email và số điện thoại cũng như họ tên .v.v.v các thông tin cơ bản là thông tin hữu ích cho những người dùng vào quảng cáo. Bạn sẽ thấy bất ngờ tại sao mình vẫn luôn nhận được email, tin nhắn, cuộc gọi điện thoại mời chào mua hàng, mua bảo hiểm, bất động sản .v.v.v. trong khi mình không nhu cầu hoặc liên quan gì đến những lời mời chào đó.
Vn-Z.vn team tổng hợp
"Chợ Đen" này cũng được nhiều người dùng ẩn danh sử dụng vào mục đích mua bán cơ sở dữ liệu , từng có nhiều DB nổi tiếng được mua bán cũng như chia sẻ công khai tại chợ . Trong đó dữ liệu Facebook Việt Nam cũng được rao bán và chia sẻ nhiều lần. Gần đây nhất là có tài khoản rao bán tới 71 và 41 triệu thông tin người dùng facebook Việt Nam.
Thông tin của 71 triệu tài khoản Facebook Việt Nam được rao bán trên chợ đen
Theo chia sẻ của người bán thì dữ liệu này gồm 71 triệu dòng , tương đương với thông tin của 71 triệu tài khoản Facebook Việt Nam. Thông tin được rao bán trong năm 2020, qua kiểm tra dữ liệu còn rất mới không trung lặp với các dữ liệu được chia sẻ công khai trên mạng trước đây. Gần đây nhất là...
vn-z.vn
Dữ liệu của hơn 41 triệu người dùng Facebook Việt Nam chia sẻ trên chợ đen
Hôm nay một tài khoản trên web chợ đen đã chia sẻ dữ liệu của hơn 41 triệu người dùng Facebook Việt Nam. Thông tin của dữ liệu này bao gồm các trường thông tin cá nhân của người dùng như :about_me ,athletes_id,avatar,birthday ,.v.v.v..... Dữ liệu cho thấy Facebook thu thập toàn bộ thông tin...
vn-z.vn
Sau khi chia sẻ thông tin này tại Vn-Zoom, có nhiều người cho rằng các thông tin tài khoản này phần lớn là tài khoản ảo ( Clone) . Những tài khoản Clone này được những người am hiểu về công nghệ thông tin và Facebook thiết lập. Họ có trong tay mạng lưới Clone lên tới hàng triệu tài khoản.
Trong khi đó cũng có nhiều người tin rằng trong dữ liệu này có thông tin của người dùng thật. Facebook từng có nhiều đợt rò rỉ dữ liệu rất nghiêm trọng. Dữ liệu của người Việt Nam từng bị tiết lộ với 50 triệu tài khoản Facebook Việt Nam bị lộ số điện thoại.
Thông tin dữ liệu gồm Fbid, email ,username, phone_number, fullname, gender,birthday,hometown,city,zip,etc .. .Tức là bao gồm gần như toàn bộ thông tin cơ bản của người dùng.
Những thông tin này không bao gồm thông tin thẻ ngân hàng và mật khẩu nên người dùng cũng không cần quá lo lắng. Dữ liệu này được sử dụng chủ yếu vào mục đích quảng cáo.
Vậy thông tin của hàng chục triệu tài khoản Facebook được rao bán này là thật hay ảo . Hôm nay mình sẽ phân tích một chút về thông tin của hàng chục triệu người dùng Facebook Việt Nam mới được rao bán gần đây.
Dữ liệu được rao bán dưới dạng .json viết tắt của Javascript Object Notation. JSON là một định dạng tiêu chuẩn trong trao đổi dữ liệu nhẹ, nhanh chóng và dễ dàng tạo (generate) và phân tích ((parse)
Như đã nói ở trên thông tin này bao gồm các dữ liệu cơ bản, tức là các dữ liệu mà người dùng khai báo public với Facebook.
Bằng các biện pháp kỹ thuật , người ta sẽ crawl toàn bộ các thông tin này của hàng chục triệu tài khoản Facebook ngẫu nhiên, sau đó sẽ lọc ra theo từng khu vực, sở thích, .v.v. để mua bán hoặc sử dụng vào mục đích khác nhau.
Mình sẽ test một vài tài khoản trong file json để kiểm tra
Đây là FB ID và tên tài khoản Facebook trong file json
Truy vấn đến trên trang facebook.com đúng tên tài khoản đã được crawl
Trong file json này còn chứa số điện thoại của người dùng Facebook , nên mình sẽ thử một số điện thoại bất kỳ
Tìm ngẫu nhiên một tài khoản Facebook có tên là Hoàng Thu
Toàn bộ các thông tin public của tài khoản này đã được crawl về file json
Hầu như toàn bộ các thông tin cơ bản , người dùng để công khai đều được crawl về file json. Những thông tin người dùng cài đặt riêng tư sẽ không có trong file json này.
[cập nhật:
Sau khi chia sẻ bài viết này, có thành viên Vn-Zoom inbox private nhờ kiểm tra xem thông tin của mình có bị crawl hay không ?
Tài khoản của bạn ấy được tạo vào năm 2012 , các thông tin cơ bản gồm email, sdt đều được cài đặt riêng tư. Nhưng vẫn bị crawl về file json này. Vì vậy mọi thứ đều có thể xảy ra, các bạn nên hạn chế tối đa việc chia sẻ dữ liệu cá nhân lên facebook khi không thật sự cần thiết.
Thông tin đã được cài đặt riêng tư
Vẫn bị crawl về file json
Qua đây cho thấy , với việc thu thập được thông tin gồm email và số điện thoại cũng như họ tên .v.v.v các thông tin cơ bản là thông tin hữu ích cho những người dùng vào quảng cáo. Bạn sẽ thấy bất ngờ tại sao mình vẫn luôn nhận được email, tin nhắn, cuộc gọi điện thoại mời chào mua hàng, mua bảo hiểm, bất động sản .v.v.v. trong khi mình không nhu cầu hoặc liên quan gì đến những lời mời chào đó.
Vn-Z.vn team tổng hợp