A Dual Reinforcement Learning Framework for Unsupervised Text Style Transfer

Unsupervised Text Style Transfer có thể dịch là Chuyển đổi phong cách văn bản không giám sát. Mục tiêu của nó là viết lại câu đầu vào với một văn phong nhất định mà vẫn giữ nguyên nội dung. Lần này hãy cùng trituenhantao.io tìm hiểu A Dual Reinforcement Learning Framework for Unsupervised Text Style Transfer của Fuli Luo et al. được đăng tại IJCAI 2019.

Unsupervised Text Style Transfer có mục đích chuyển đổi văn phong của văn bản mà vẫn giữ nguyên nội dung mà không sử dụng các cặp câu huấn luyện. Các cách tiếp cận đối với bài toán này thường có hai bước chính là tách nội dung ra khỏi văn phong ban đầu và gắn lại với văn phong mới. Mặc dù vậy, bước tách nội dung không hề đơn giản vì văn phong và nội dung có sự tương tác qua lại một cách tinh tế trong NLP.

Với nhận xét như trên, các tác giả đề xuất một framework học tăng cường kép để trực tiếp chuyển văn phong của văn bản thông qua một mô hình ánh xạ một bước. Framework này không tiến hành việc tách rời nội dung và văn phong. Đặc biệt hơn, các tác giả khảo sát nhiệm vụ kép trong việc học nguồn-đích và đích-nguồn, thưởng mô hình dựa trên sự chính xác trong văn phong và khả năng bảo toàn nội dung. Theo cách này, mô hình có thể được huấn luyện mà không cần sử dụng các cặp câu mẫu. Phương pháp này đạt SOTA trên benchmark dataset.

Huấn luyện Dual RL Unsupervised Text Style Transfer
Huấn luyện Dual RL

Để đánh giá khả năng chuyển đổi văn phong cũng như kiểm soát các kết quả của mô hình, các tác giả sử dụng mô hình pre-trained để hướng dẫn cho mô hình học tăng cường.

Đánh giá phương pháp của mình, các tác giả sử dụng hai dataset tập trung vào hai khía cạnh: Tình cảm thái độ và hình thức của câu văn là YELPGYAFC. Việc đánh giá được dựa trên cả các hàm đánh giá tự động và đánh giá của con người. Kết quả được thể hiện phía dưới.

Đánh giá tự động, ACC là độ chính xác về văn phong, BLEU đánh giá độ tương đồng so với câu sinh bởi con người, G2 và H2 là Geometric MeanHarmonic Mean của ACC và BLEU
Đánh giá của con người dựa trên văn phong, nội dung, sự trôi chảy.

Mặc dù kết quả của công trình này đạt SOTA trên hai tập dữ liệu đã nêu, các tác giả cho rằng phương pháp sử dụng mô hình pre-trained vẫn còn phức tạp và có thể sẽ cải tiến trong các nghiên cứu sau.

Bạn muốn trích dẫn bài này:
-----
"A Dual Reinforcement Learning Framework for Unsupervised Text Style Transfer," Trí tuệ nhân tạo, Ngày xuất bản: 26/05/2020, URL: https://trituenhantao.io/paper-summary/a-dual-reinforcement-learning-framework-for-unsupervised-text-style-transfer/, Ngày truy cập: 01/04/2023.

Về trituenhantao.io

Trituenhantao.io là trang web chia sẻ thông tin, kiến thức, kinh nghiệm học tập và triển khai các chương trình và dự án sử dụng trí tuệ nhân tạo trên thế giới.
Xem tất cả các bài viết của trituenhantao.io →