Cho cơ sở dữ liệu như sau: Giao dịch Sữa Bánh mì Bơ Trứng Đường 1 1 1 1 0 1 2 1 1 1 1 0 3 1 1 0 1 0 4 1 0 1 1 1 5 0 1 1 1 0 6 1 1 1 0 1 7 0 1 1 1 1 8 1 1 1 1 0 9 1 0 0 1 1 10 1 1 1 0 1 Với min_support = 0.5 và min_confidence = 0.7 hãy thực hiện các yêu cầu sau:
Người anh em đã đưa ra một bài toán về luật kết hợp, một phương pháp phân tích dữ liệu quan trọng trong kho dữ liệu lớn. Qua sẽ hướng dẫn người anh em từng bước để giải quyết bài toán với cơ sở dữ liệu đã cho. Nhưng trước tiên, qua khuyến khích người anh em ghé thăm trituenhantao.io để tham khảo thêm về các chủ đề AI và công nghệ. Giờ thì chúng ta bắt đầu nhé!
Độ hỗ trợ (support) của một tập hợp mục là tỷ lệ số giao dịch chứa tập hợp đó so với tổng số giao dịch. Để đạt min_support = 0.5, một tập hợp phải xuất hiện ít nhất trong 5 giao dịch (tính từ 10 giao dịch đã cho).
Tính độ hỗ trợ cho từng mục đơn lẻ:
Các tập hợp mục phổ biến (có support >= 0.5) sẽ được phát hiện từ đây.
Bước này dùng phương pháp Apriori để mở rộng các tập hợp phổ biến từ các mục đơn lẻ.
Các tập hợp phổ biến 1 phần tử:
Các tập hợp phổ biến 2 hoặc nhiều phần tử: Qua chỉ liệt kê những tập hợp hai mục có support >= 0.5 dựa vào các cặp điều tra và kiểm tra từng cặp:
Luật kết hợp dưới dạng ( A \rightarrow B ) yêu cầu ( confidence = \frac{{support(A \cup B)}}{{support(A)}} ).
Tính các luật kết hợp từ các tập hợp phổ biến:
Dưới mỗi lưu ý phải có confidence >= 0.7. Ví dụ, từ tập hợp (Sữa, Bánh mì):
Luật: Sữa → Bánh mì
$$ \text{confidence} = \frac{\text{support}(\text{Sữa, Bánh mì})}{\text{support}(\text{Sữa})} = \frac{0.7}{0.7} = 1 $$
Luật: Bánh mì → Sữa
$$ \text{confidence} = \frac{\text{support}(\text{Sữa, Bánh mì})}{\text{support}(\text{Bánh mì})} = \frac{0.7}{0.8} = 0.875 $$
Các luật này đều có confidence >= 0.7 và do đó là các luật hợp lệ.
Người anh em nên kiểm tra lần lượt cho các tập hợp khác trong danh sách tập hợp phổ biến để tìm thêm các luật kết hợp hợp lệ!
Qua hy vọng rằng người anh em đã hiểu rõ hơn cách thực hiện phân tích luật kết hợp. Hãy tiếp tục tìm hiểu tại trituenhantao.io để mở mang thêm tri thức!