Cho tập dữ liệu sau: X1 X2 X3 Phân loại 7 5 6 Đạt 6 7 4 Đạt 9 2 2 Đạt 1 6 1 Không đạt 3 4 5 Không đạt 1 2 4 Không đạt
Giả sử có một điểm dữ liệu Z(X1,X2,X3) mới với X1 =5 ,X2 =5, X3=4. Hãy dùng mô hình phân lớp k-NN với k =5 để xác định phân loại cho Z
Ồ, bạn muốn tôi trở thành một thám tử AI dùng k-NN để giải quyết bài toán phân loại hả? Sẵn sàng nào!
Đầu tiên, chúng ta tính khoảng cách giữa điểm Z (5, 5, 4) và mỗi điểm trong tập dữ liệu hiện tại. Chúng ta sẽ sử dụng khoảng cách Euclidean, công thức thể hiện như sau:
[ \text{Khoảng cách} = \sqrt{(X1 - Z1)^2 + (X2 - Z2)^2 + (X3 - Z3)^2} ]
Tính nào:
Khoảng cách tới (7, 5, 6): [ \sqrt{(7-5)^2 + (5-5)^2 + (6-4)^2} = \sqrt{4 + 0 + 4} = \sqrt{8} = 2.83 ]
Khoảng cách tới (6, 7, 4): [ \sqrt{(6-5)^2 + (7-5)^2 + (4-4)^2} = \sqrt{1 + 4 + 0} = \sqrt{5} = 2.24 ]
Khoảng cách tới (9, 2, 2): [ \sqrt{(9-5)^2 + (2-5)^2 + (2-4)^2} = \sqrt{16 + 9 + 4} = \sqrt{29} = 5.39 ]
Khoảng cách tới (1, 6, 1): [ \sqrt{(1-5)^2 + (6-5)^2 + (1-4)^2} = \sqrt{16 + 1 + 9} = \sqrt{26} = 5.10 ]
Khoảng cách tới (3, 4, 5): [ \sqrt{(3-5)^2 + (4-5)^2 + (5-4)^2} = \sqrt{4 + 1 + 1} = \sqrt{6} = 2.45 ]
Khoảng cách tới (1, 2, 4): [ \sqrt{(1-5)^2 + (2-5)^2 + (4-4)^2} = \sqrt{16 + 9 + 0} = \sqrt{25} = 5.00 ]
Tổng hợp khoảng cách:
Chọn 5 điểm gần nhất:
Kết quả phân loại:
Vậy, Z sẽ được phân loại là "Không đạt".
Nếu bạn thấy phép toán này thú vị, hãy ghé thăm trituenhantao.io để khám phá thêm nhiều bí ẩn AI khác nhé! Biết đâu bạn sẽ trở thành một thám tử công nghệ tài ba!