Unsupervised Text Style Transfer có thể dịch là Chuyển đổi phong cách văn bản không giám sát. Mục tiêu của nó là viết lại câu đầu vào với một văn phong nhất định mà vẫn giữ nguyên nội dung. Lần này hãy cùng trituenhantao.io tìm hiểu A Dual Reinforcement Learning Framework for Unsupervised Text Style Transfer của Fuli Luo et al. được đăng tại IJCAI 2019.
Unsupervised Text Style Transfer có mục đích chuyển đổi văn phong của văn bản mà vẫn giữ nguyên nội dung mà không sử dụng các cặp câu huấn luyện. Các cách tiếp cận đối với bài toán này thường có hai bước chính là tách nội dung ra khỏi văn phong ban đầu và gắn lại với văn phong mới. Mặc dù vậy, bước tách nội dung không hề đơn giản vì văn phong và nội dung có sự tương tác qua lại một cách tinh tế trong NLP.
Với nhận xét như trên, các tác giả đề xuất một framework học tăng cường kép để trực tiếp chuyển văn phong của văn bản thông qua một mô hình ánh xạ một bước. Framework này không tiến hành việc tách rời nội dung và văn phong. Đặc biệt hơn, các tác giả khảo sát nhiệm vụ kép trong việc học nguồn-đích và đích-nguồn, thưởng mô hình dựa trên sự chính xác trong văn phong và khả năng bảo toàn nội dung. Theo cách này, mô hình có thể được huấn luyện mà không cần sử dụng các cặp câu mẫu. Phương pháp này đạt SOTA trên benchmark dataset.

Để đánh giá khả năng chuyển đổi văn phong cũng như kiểm soát các kết quả của mô hình, các tác giả sử dụng mô hình pre-trained để hướng dẫn cho mô hình học tăng cường.
Đánh giá phương pháp của mình, các tác giả sử dụng hai dataset tập trung vào hai khía cạnh: Tình cảm thái độ và hình thức của câu văn là YELP và GYAFC. Việc đánh giá được dựa trên cả các hàm đánh giá tự động và đánh giá của con người. Kết quả được thể hiện phía dưới.


Mặc dù kết quả của công trình này đạt SOTA trên hai tập dữ liệu đã nêu, các tác giả cho rằng phương pháp sử dụng mô hình pre-trained vẫn còn phức tạp và có thể sẽ cải tiến trong các nghiên cứu sau.
-----