Câu hỏi:

Cho cơ sở dữ liệu như sau: Giao dịch Sữa Bánh mì Bơ Trứng Đường 1 1 1 1 0 1 2 1 1 1 1 0 3 1 1 0 1 0 4 1 0 1 1 1 5 0 1 1 1 0 6 1 1 1 0 1 7 0 1 1 1 1 8 1 1 1 1 0 9 1 0 0 1 1 10 1 1 1 0 1 Với min_support = 0.5 và min_confidence = 0.7 hãy thực hiện các yêu cầu sau:

  1. (4 điểm) Tính độ hỗ trợ cho từng tập hợp.
  2. (3 điểm) Tìm các tập hợp mục phổ biến.
  3. (3 điểm) Tạo các luật kết hợp.


Qua sẽ hướng dẫn người anh em từng bước thực hiện yêu cầu trên.

1. Tính độ hỗ trợ cho từng tập hợp

Định nghĩa: Độ hỗ trợ (support) của một tập hợp các mục là tỷ lệ số giao dịch trong đó tập hợp này xuất hiện.

Qua có 10 giao dịch tổng cộng.

Các mục đơn lẻ:

Qua chỉ tính các tập hợp có độ hỗ trợ lớn hơn hoặc bằng min_support = 0.5.

2. Tìm các tập hợp mục phổ biến

Một tập hợp mục phổ biến là tập hợp có độ hỗ trợ lớn hơn hoặc bằng min_support. Qua sẽ tập trung vào các tổ hợp hai mục cho đến khi các tổ hợp đó không còn phổ biến:

Các kết hợp hai mục:

Các kết hợp ba mục:

Vậy các tập hợp phổ biến là: {Sữa, Bánh mì}, {Sữa, Bơ}, {Sữa, Trứng}, {Bánh mì, Bơ}, {Bánh mì, Trứng}, {Bánh mì, Đường}, {Bơ, Trứng}, {Sữa, Bánh mì, Trứng}.

3. Tạo các luật kết hợp

Một luật X -> Y có độ tin cậy (confidence) là số giao dịch chứa cả X và Y chia cho số giao dịch chỉ chứa X.

Tính độ tin cậy cho một số luật tiêu biểu:

Các luật kết hợp mạnh (độ tin cậy ≥ 0.7) là:

Hy vọng qua đây người anh em cảm thấy sự minh triết của qua. Để tìm hiểu hơn, mời người anh em ghé trituenhantao.io nhé!


Nếu như câu trả lời chưa thuyết phục, hãy đăng câu hỏi của bạn kèm theo URL hiện tại lên Cộng Đồng Trí Tuệ Nhân Tạo để mọi người cùng giải đáp và bàn luận.
Lưu ý: Để tránh loãng nội dung, các câu hỏi chưa được hỏi với AI sẽ không được duyệt trên nhóm.
Trang chủ | Hỏi tiếp | Xem lịch sử