Thảo luận - Khai thác luật kết hợp với thuật toán Apriori | VN-Zoom | Cộng đồng Chia Sẻ Kiến Thức Công Nghệ và Phần Mềm Máy Tính

Adblocker detected! Please consider reading this notice.

We've detected that you are using AdBlock Plus or some other adblocking software which is preventing the page from fully loading.

We need money to operate the site, and almost all of it comes from our online advertising.

If possible, please support us by clicking on the advertisements.

Please add vn-z.vn to your ad blocking whitelist or disable your adblocking software.

×

Thảo luận Khai thác luật kết hợp với thuật toán Apriori

statistics

Moderator
Thành viên BQT

photo-1578916171728-46686eac8d58

Giới thiệu​

Mở đầu bài viết, chúng ta hãy tìm hiểu về quan hệ điều kiện sau đây: Nếu A thì B. Bạn đọc vào câu này, bạn sẽ biết được việc A xảy ra thì nó sẽ kéo theo 100% việc B cũng sẽ xảy ra. Vậy với câu trên bạn sẽ thấy sự ràng buộc giữa A và B. Ví dụ:

Nếu trời mưa thì đường ướt.
Bạn có thấy thông tin này nó đương nhiên và không hữu ích? Và những thông tin kiểu này thường không phải là thông tin mới, nó là cái điều mà ai cũng biết ấy.

Tuy nhiên trong cuộc sống, quan hệ điều kiện trên nó thường đi chung với các từ như: thông thường, gần như, phần lớn. Lúc này, nó không phải là điều mà ai cũng biết nữa và nó cũng mất đi sự ràng buộc. Ví dụ:

Nếu mua áo sơ mi thì thường người ta cũng sẽ mua cà vạt.
Gần như nếu bạn học giỏi thì sẽ nhận được học bổng.
Nếu bạn tham gia cuộc thi này thì 75% bạn sẽ đoạt giải.
Các thông tin loại này mới hữu ích. Nhưng để có thông tin loại này thì bạn sẽ cần rất nhiều dữ liệu để rút ra được, vì đơn giản nó không phải là cái điều ai cũng biết. Mà thường những cái mà ít người biết thì mới có giá trị.

Bây giờ, giả sử giờ bạn là một doanh nhân, bạn có 4 hoá đơn các món hàng mà khách hàng đã mua. Và bạn muốn bán được nhiều hơn nhưng không biết làm thế nào để khách hàng có thể mua thêm vài món nữa để tăng doanh số?

Thế nên, bạn mới suy nghĩ đến việc: "Liệu rằng khách hàng mua snack thì có mua thêm nước lọc không? Hay là thường thì khách hàng mua nước lọc thì sẽ mua sack? Liệu hai món hàng này nó có liên quan gì nhau không?".
TIDItems
10sữa, chuối, nước lọc
20bánh, chuối, táo
30sữa, bánh, chuối, táo
40bánh, táo

  • TID: Transaction ID. Bạn có thể hiểu nó dùng để định danh. Mà định danh thì thích đặt gì không được miễn không trùng nhau, nên mình không đặt là 1,2,3,4 để tránh nhầm lẫn.
  • Items: Là các món hàng mà khách hàng mua ứng với mã số hoá đơn.
Phần dưới có nhiều công thức toán học, diễn đàn không có render Latex, nên các bạn có thể tiếp tục truy cập theo đường link này để đọc tiếp.
 


Top