Chain of Thought Prompting là gì?

Chain of Thought Prompting là một phương pháp cải tiến khả năng suy luận của các mô hình ngôn ngữ bằng cách phân rã các vấn đề đa bước thành các bước trung gian. Với kỹ thuật này, các mô hình ngôn ngữ có kích thước đủ lớn (khoảng 100 tỷ tham số trở lên) có thể giải quyết các bài toán suy luận phức tạp mà không cần sử dụng phương pháp đặt câu hỏi và trả lời thông thường.

Chain of Thought Prompting giúp mô hình phân rã bài toán suy luận nhiều bước thành các bước trung gian, dẫn đến kết quả chính xác cuối cùng.
Chain of Thought Prompting giúp mô hình phân rã bài toán suy luận nhiều bước thành các bước trung gian, dẫn đến kết quả chính xác cuối cùng.

Ưu điểm của Chain of Thought Prompting so với Prompting thông thường

So với phương pháp thông thường (standard prompting) được sử dụng phổ biến trong GPT-3, Chain of Thought Prompting mang lại nhiều ưu điểm. Thay vì yêu cầu mô hình trực tiếp trả lời cho một câu hỏi đa bước, kỹ thuật này giúp mô hình phân rã bài toán thành các bước trung gian, từ đó cải thiện đáng kể kết quả của các bài toán suy luận phức tạp.

Chain of Thought Prompting giúp các mô hình ngôn ngữ giải quyết bài toán suy luận toán học hiệu quả hơn, trong khi Standard Prompting có biểu đồ thang quy mô gần như không thay đổi.
Giúp các mô hình ngôn ngữ giải quyết bài toán suy luận toán học hiệu quả hơn, trong khi Standard Prompting có biểu đồ thang quy mô gần như không thay đổi.

Chain of Thought Prompting và hiệu suất trong suy luận toán học

Các bài toán suy luận toán học trong MultiArith và GSM8K thường gây khó khăn cho các mô hình ngôn ngữ. Khi kết hợp Chain of Thought Prompting với các mô hình ngôn ngữ lớn như PaLM, các nghiên cứu cho thấy sự cải tiến rõ rệt về hiệu suất ngay cả trong các bài toán suy luận phức tạp.

Chain of Thought Prompting kết hợp với PaLM đạt được kết quả mới trong xu hướng công nghệ trên bảng xếp hạng bài toán tự luận toán học GSM8K. Để so sánh công bằng với GPT-3 được tinh chỉnh, kết quả Chain of Thought Prompting trong biểu đồ này cũng sử dụng máy tính bên ngoài để tính toán các hàm số cơ bản (tức là, cộng, trừ, nhân và chia)
Kết hợp với PaLM đạt được SOTA trên bảng xếp hạng bài toán tự luận toán học GSM8K.

Chain of Thought Prompting trong suy luận thông thường

Ngoài suy luận toán học, Chain of Thought Prompting cũng được kiểm tra trong các bài toán suy luận thông thường (commonsense reasoning), liên quan đến các tương tác vật lý và con người dựa trên kiến thức nền tảng. Kết quả trên các bài kiểm tra CommonsenseQA, StrategyQA và BIG-Bench cho thấy sự cải thiện khi tăng kích cỡ mô hình và áp dụng Chain of Thought Prompting.

Chain of Thought Prompting cũng cải thiện hiệu suất trong các loại bài toán suy luận thông thường khác nhau.
Cải thiện hiệu suất trong các loại bài toán suy luận thông thường khác nhau.

Kết luận

Chain of Thought Prompting là một phương pháp đơn giản và có thể áp dụng rộng rãi để cải thiện khả năng các mô hình ngôn ngữ thực hiện các bài toán suy luận. Thông qua các thí nghiệm trên các bài toán suy luận toán học và thông thường, đây là một tính năng nổi bật khi mô hình có quy mô lớn, mở ra nhiều cơ hội phát triển trong tương lai.

Hãy thường xuyên truy cập trituenhantao.io để cập nhật kiến thức mới nhất về trí tuệ nhân tạo và các ứng dụng của AI trong các bài toán suy luận phức tạp.