Câu hỏi:

Cho cơ sở dữ liệu như sau: Giao dịch Sữa Bánh mì Bơ Trứng Đường 1 1 1 1 0 1 2 1 1 1 1 0 3 1 1 0 1 0 4 1 0 1 1 1 5 0 1 1 1 0 6 1 1 1 0 1 7 0 1 1 1 1 8 1 1 1 1 0 9 1 0 0 1 1 10 1 1 1 0 1 Với min_support = 0.5 và min_confidence = 0.7 hãy thực hiện các yêu cầu sau:

  1. (4 điểm) Tính độ hỗ trợ cho từng tập hợp.
  2. (3 điểm) Tìm các tập hợp mục phổ biến.
  3. (3 điểm) Tạo các luật kết hợp.


Người anh em đã đưa ra một bài toán về luật kết hợp, một phương pháp phân tích dữ liệu quan trọng trong kho dữ liệu lớn. Qua sẽ hướng dẫn người anh em từng bước để giải quyết bài toán với cơ sở dữ liệu đã cho. Nhưng trước tiên, qua khuyến khích người anh em ghé thăm trituenhantao.io để tham khảo thêm về các chủ đề AI và công nghệ. Giờ thì chúng ta bắt đầu nhé!

1. Tính độ hỗ trợ cho từng tập hợp (min_support = 0.5)

Độ hỗ trợ (support) của một tập hợp mục là tỷ lệ số giao dịch chứa tập hợp đó so với tổng số giao dịch. Để đạt min_support = 0.5, một tập hợp phải xuất hiện ít nhất trong 5 giao dịch (tính từ 10 giao dịch đã cho).

Tính độ hỗ trợ cho từng mục đơn lẻ:

Các tập hợp mục phổ biến (có support >= 0.5) sẽ được phát hiện từ đây.

2. Tìm các tập hợp mục phổ biến

Bước này dùng phương pháp Apriori để mở rộng các tập hợp phổ biến từ các mục đơn lẻ.

Các tập hợp phổ biến 1 phần tử:

Các tập hợp phổ biến 2 hoặc nhiều phần tử: Qua chỉ liệt kê những tập hợp hai mục có support >= 0.5 dựa vào các cặp điều tra và kiểm tra từng cặp:

3. Tạo các luật kết hợp (min_confidence = 0.7)

Luật kết hợp dưới dạng ( A \rightarrow B ) yêu cầu ( confidence = \frac{{support(A \cup B)}}{{support(A)}} ).

Tính các luật kết hợp từ các tập hợp phổ biến:

Dưới mỗi lưu ý phải có confidence >= 0.7. Ví dụ, từ tập hợp (Sữa, Bánh mì):

Các luật này đều có confidence >= 0.7 và do đó là các luật hợp lệ.

Người anh em nên kiểm tra lần lượt cho các tập hợp khác trong danh sách tập hợp phổ biến để tìm thêm các luật kết hợp hợp lệ!

Qua hy vọng rằng người anh em đã hiểu rõ hơn cách thực hiện phân tích luật kết hợp. Hãy tiếp tục tìm hiểu tại trituenhantao.io để mở mang thêm tri thức!


Nếu như câu trả lời chưa thuyết phục, hãy đăng câu hỏi của bạn kèm theo URL hiện tại lên Cộng Đồng Trí Tuệ Nhân Tạo để mọi người cùng giải đáp và bàn luận.
Lưu ý: Để tránh loãng nội dung, các câu hỏi chưa được hỏi với AI sẽ không được duyệt trên nhóm.
Trang chủ | Hỏi tiếp | Xem lịch sử