Site icon Trí tuệ nhân tạo

Seq2Seq – Hiểu về mô hình Encoder-Decoder

Lần này, trituenhantao.io sẽ cung cấp cho bạn một bài giải thích ngắn gọn và cô đọng về mô hình seq2seq sử dụng encoder (bộ mã hóa) decoder (bộ giải mã). Lớp các mô hình này đã mang đến những kết quả rõ nét trong các nhiệm vụ phức tạp như dịch máy, chú thích video, hỏi đáp, v..v..

Ghi chú: Trong bài này, các từ mang tính chất thuật ngữ được giữ nguyên để các bạn tiện tra cứu thêm thông tin.

Để có thể hiểu về cách thức hoạt động của lớp mô hình seq2seq , chúng ta cùng nhìn vào hình vẽ dưới đây.

Kiến trúc của mô hình encoder-decoder seq2seq

Mô hình điển hình thuộc lớp này bao gồm 3 phần: bộ mã hóa (Encoder ), véc tơ mã hóa trung gian (Encoder vector) và bộ giải mã (Decoder ).

Bộ mã hóa – Encoder

Công thức đơn giản này mô tả kết quả của một mạng nơ ron hồi quy (RNN ) thông thường. Như chúng ta có thể thấy, các trạng thái ẩn được tính bởi đầu vào tương ứng (x_t) và trạng thái ẩn trước đó h_(t-1).

Véc tơ mã hóa trung gian – Encoder vector

Bộ giải mã – Decoder

Như chúng ta thấy, các trạng thái ẩn được tính bởi trạng thái ngay trước đó.

Chúng ta tính đầu ra sử dụng trạng thái ẩn tương ứng tại thời điểm hiện tại và nhân với trọng số tương ứng W(S). Softmax được sử dụng để tạo ra vec tơ xác suất giúp chúng ta xác định đầu ra cuối cùng (VD: các từ trong bài toán hỏi đáp).

Năng lực đặc biệt của mô hình này là nó có thể ánh xạ chuỗi đầu vào và chuỗi đầu ra có độ dài khác nhau. Vì thế, nó mở ra giải pháp cho một loạt các bài toán trong lĩnh vực này.

Hi vọng thông qua bài viết này các bạn đã hiểu thêm về mô hình seq2seq với kiến trúc sử dụng encoder decoder . Hãy thường xuyên truy cập hoặc đăng ký nhận bản tin Trí tuệ nhân tạo (ở chân trang) để nhận được những bài viết cập nhật nhất về chủ đề này các bạn nhé!

Exit mobile version