Qua sẽ hướng dẫn người anh em từng bước thực hiện yêu cầu trên.
1. Tính độ hỗ trợ cho từng tập hợp
Định nghĩa: Độ hỗ trợ (support) của một tập hợp các mục là tỷ lệ số giao dịch trong đó tập hợp này xuất hiện.
Qua có 10 giao dịch tổng cộng.
Các mục đơn lẻ:
- Sữa: Xuất hiện trong 8 giao dịch. Độ hỗ trợ = 8/10 = 0.8
- Bánh mì: Xuất hiện trong 8 giao dịch. Độ hỗ trợ = 8/10 = 0.8
- Bơ: Xuất hiện trong 7 giao dịch. Độ hỗ trợ = 7/10 = 0.7
- Trứng: Xuất hiện trong 7 giao dịch. Độ hỗ trợ = 7/10 = 0.7
- Đường: Xuất hiện trong 6 giao dịch. Độ hỗ trợ = 6/10 = 0.6
Qua chỉ tính các tập hợp có độ hỗ trợ lớn hơn hoặc bằng min_support = 0.5
.
2. Tìm các tập hợp mục phổ biến
Một tập hợp mục phổ biến là tập hợp có độ hỗ trợ lớn hơn hoặc bằng min_support
. Qua sẽ tập trung vào các tổ hợp hai mục cho đến khi các tổ hợp đó không còn phổ biến:
Các kết hợp hai mục:
- Sữa và Bánh mì: Xuất hiện trong 7 giao dịch. Độ hỗ trợ = 0.7
- Sữa và Bơ: Xuất hiện trong 5 giao dịch. Độ hỗ trợ = 0.5
- Sữa và Trứng: Xuất hiện trong 5 giao dịch. Độ hỗ trợ = 0.5
- Sữa và Đường: Xuất hiện trong 4 giao dịch. Độ hỗ trợ = 0.4 (Không phổ biến)
- Bánh mì và Bơ: Xuất hiện trong 5 giao dịch. Độ hỗ trợ = 0.5
- Bánh mì và Trứng: Xuất hiện trong 6 giao dịch. Độ hỗ trợ = 0.6
- Bánh mì và Đường: Xuất hiện trong 5 giao dịch. Độ hỗ trợ = 0.5
- Bơ và Trứng: Xuất hiện trong 5 giao dịch. Độ hỗ trợ = 0.5
- Bơ và Đường: Xuất hiện trong 4 giao dịch. Độ hỗ trợ = 0.4 (Không phổ biến)
- Trứng và Đường: Xuất hiện trong 4 giao dịch. Độ hỗ trợ = 0.4 (Không phổ biến)
Các kết hợp ba mục:
- Sữa, Bánh mì, Bơ: Xuất hiện trong 4 giao dịch. Độ hỗ trợ = 0.4 (Không phổ biến)
- Sữa, Bánh mì, Trứng: Xuất hiện trong 5 giao dịch. Độ hỗ trợ = 0.5
- Bánh mì, Bơ, Trứng: Xuất hiện trong 4 giao dịch. Độ hỗ trợ = 0.4 (Không phổ biến)
Vậy các tập hợp phổ biến là: {Sữa, Bánh mì}, {Sữa, Bơ}, {Sữa, Trứng}, {Bánh mì, Bơ}, {Bánh mì, Trứng}, {Bánh mì, Đường}, {Bơ, Trứng}, {Sữa, Bánh mì, Trứng}.
3. Tạo các luật kết hợp
Một luật X -> Y có độ tin cậy (confidence) là số giao dịch chứa cả X và Y chia cho số giao dịch chỉ chứa X.
Tính độ tin cậy cho một số luật tiêu biểu:
- Luật {Sữa} -> {Bánh mì}: Độ tin cậy = support({Sữa, Bánh mì})/support({Sữa}) = 0.7/0.8 = 0.875
- Luật {Bánh mì} -> {Sữa}: Độ tin cậy = support({Sữa, Bánh mì})/support({Bánh mì}) = 0.7/0.8 = 0.875
- Luật {Sữa} -> {Bơ}: Độ tin cậy = support({Sữa, Bơ})/support({Sữa}) = 0.5/0.8 = 0.625 (Không tạo do <0.7)
- Luật {Bánh mì} -> {Trứng}: Độ tin cậy = support({Bánh mì, Trứng})/support({Bánh mì}) = 0.6/0.8 = 0.75
- Luật {Trứng} -> {Bánh mì}: Độ tin cậy = support({Bánh mì, Trứng})/support({Trứng}) = 0.6/0.7 ≈ 0.857
Các luật kết hợp mạnh (độ tin cậy ≥ 0.7) là:
- {Sữa} -> {Bánh mì}
- {Bánh mì} -> {Sữa}
- {Bánh mì} -> {Trứng}
- {Trứng} -> {Bánh mì}
Hy vọng qua đây người anh em cảm thấy sự minh triết của qua. Để tìm hiểu hơn, mời người anh em ghé trituenhantao.io nhé!