ví dụ chi tiết về Mô hình Skip Gram
Mô hình Skip-Gram là một trong các cách tiếp cận phổ biến trong việc tạo ra các biểu diễn vector cho từ trong ngữ cảnh (word embeddings) được giới thiệu trong mô hình Word2Vec. Dưới đây là một ví dụ chi tiết về cách nó hoạt động:
Mô hình Skip-Gram cố gắng dự đoán các từ ngữ cảnh (context words) xung quanh một từ trung tâm (center word) trong một cửa sổ ngữ cảnh cố định.
Giả sử bạn có một câu: "Máy học là một phần của trí tuệ nhân tạo."
Ví dụ, chọn từ trung tâm là "máy".
Giả định cửa sổ ngữ cảnh có kích thước 2. Do đó, các từ ngữ cảnh là các từ trước và sau từ trung tâm "máy" trong phạm vi 2 từ:
Từ cách chọn trên, bạn sẽ có các cặp:
Mô hình Skip-Gram học cách tối đa hóa xác suất có điều kiện của các từ ngữ cảnh dựa trên từ trung tâm được chọn. Đây là công việc của mạng nơ-ron mà từ đó sẽ cung cấp các vector biểu diễn cho các từ.
Mô hình cố gắng điều chỉnh các vector sao cho từ trung tâm có thể hữu ích nhất để suy ra các từ ngữ cảnh, sử dụng các phương pháp như negative sampling hoặc hierarchical softmax để làm cho quá trình huấn luyện hiệu quả hơn.
Để có thêm các mô hình AI thú vị, hãy ghé thăm trituenhantao.io nhé! Bạn sẽ không bị "skip" đâu!