Kể từ khi được thành lập như một ngành học vào năm 1955, lĩnh vực nghiên cứu Trí tuệ nhân tạo (AI) đã được chia thành các nhóm khác nhau, trong đó có hai nhóm nổi tiếng là Symbolic AI và Machine Learning. Mặc dù Symbolic AI từng thống trị trong những thập kỷ đầu tiên, gần đây Machine Learning đã lên ngôi trong kỷ nguyên của Big data. Trong bài viết này, hãy cùng trituenhantao.io tìm hiểu từng cách tiếp cận, sự khác nhau của chúng khi áp dụng vào Xử lý ngôn ngữ tự nhiên (NLP).
Machine Learning là gì?
Machine learning là một lĩnh vực của trí tuệ nhân tạo, trong đó các thuật toán và mô hình thống kê được hệ thống máy tính sử dụng để thực hiện một nhiệm vụ cụ thể mà không sử dụng các hướng dẫn rõ ràng. Thay vào đó, chúng dựa trên các mẫu và suy luận. Các thuật toán học máy xây dựng một mô hình toán học dựa trên dữ liệu mẫu, được gọi là dữ liệu huấn luyện, để đưa ra dự đoán hoặc quyết định mà không cần được lập trình rõ ràng để thực hiện nhiệm vụ.
Nói cách đơn giản hơn, công nghệ machine learning sử dụng một thuật toán để dạy máy tính cách giải quyết vấn đề và có được những hiểu biết sâu sắc từ việc giải quyết những vấn đề đó. Đó là cách máy tính học tự động mà không cần sự can thiệp hoặc hỗ trợ của con người: bằng cách quan sát và tìm kiếm các mẫu trong dữ liệu và sử dụng các vòng phản hồi để theo dõi và cải thiện các dự đoán của nó. Trong khi con người bị choáng ngợp với khối lượng lớn dữ liệu, đây là môi trường lý tưởng để machine learning phát triển và nâng cao hiểu biết của mình để đưa ra quyết định tốt hơn trong tương lai.
Machine Learning áp dụng trong NLP
Machine learning có thể được áp dụng cho nhiều lĩnh vực, để đơn giản hóa, hãy cùng phân tích một hệ chatbot sử dụng cách tiếp cận này.
Người giám sát bot, thường được gọi là Botmaster, cố gắng cung cấp cho công cụ càng nhiều dữ liệu liên quan càng tốt. Sau đó, bot sẽ nhận các câu hỏi từ người dùng và tự động xác định ý định người dùng cũng như trả về câu trả lời phù hợp. Botmaster sau đó có thể sẽ phải xem xét các câu trả lời và phản hồi cho chat bot biết câu trả lời nào đúng và câu nào không, một cách thủ công. Với cách thức này, chat bot sẽ dần trở nên thông minh sau mỗi lần được huấn luyện.
Như bạn có thể dễ dàng hình dung, đây là một công việc nặng nhọc và tốn thời gian vì có nhiều cách thể hiện khác nhau cho cùng một câu hỏi. Bên cạnh đó, một chat bot thường phải phân biệt vài trăm đến vài ngàn ý định từ người dùng, việc tạo ra được mô hình có thể hoạt động chính xác trong hầu hết các trường hợp là một mục tiêu tham vọng. Không những vậy, do các mô hình dựa trên thống kê thường khó giải thích, việc gỡ lỗi cũng là một thách thức.
Symbolic AI là gì?
Symbolic AI, sử dụng các biểu tượng/ký hiệu mà con người có thể đọc được để đại diện cho các thực thể hoặc khái niệm trong thế giới thực cũng như logic (các phương pháp logic có thể chứng minh được về mặt toán học) để tạo ra ‘quy tắc’ để biến đổi và vận dụng các ký hiệu đó, tạo nên một hệ thống rule-based. Nói một cách khác, symbolic AI liên quan đến việc nhúng kiến thức và quy tắc hành vi của con người vào các chương trình máy tính.
Vào những năm 1990, các chuyên gia cảm thấy Symbolic AI cần phải được cách mạng khi họ thấy rằng nó khó có thể giải quyết các vấn đề về kiến thức thông thường. Vì Symbolic AI dựa trên các biểu diễn rõ ràng, các nhà phát triển đã không tính đến kiến thức ngầm định, chẳng hạn như “Chanh thì có vị chua” hoặc “Cha thì sẽ luôn già hơn con”. Thế giới của chúng ta có quá nhiều kiến thức ngầm định để có thể biểu diễn rõ ràng trong các hệ tri thức, và việc bỏ qua chúng sẽ khiến các hệ Symbolic AI gặp vấn đề.
Symbolic AI áp dụng trong NLP
Quay trở lại với ví dụ về chatbot, hãy cùng xem xét cách tiếp cận của Symbolic AI. Cách tiếp cận này là tất định (deterministic), ý tưởng là dạy cho cỗ máy cách hiểu ngôn ngữ theo cách giống như chúng ta, con người, đã học cách đọc và cách viết. Các nhà nghiên cứu trong lĩnh vực này làm một điều tương tự với các cỗ máy: họ sử dụng các quy tắc, từ vựng và ngữ nghĩa để dạy chatbot cách hiểu một ngôn ngữ.
Như bạn có thể hình dung, công sức của Botmaster không giảm được một phần đáng kể nào so với cách tiếp cận Machine learning. Tuy vậy, vì mọi hành vi của chatbot đều được quy định bởi các quy tắc, việc gỡ lỗi trở nên dễ dàng hơn. Bên cạnh đó, Botmaster cũng có thể quy định trước các ngoại lệ trong trường hợp hệ thống thất bại trong việc xác định ý định người dùng.
Một giải pháp kết hợp
Nếu lúc đầu Machine learning có thể xuất hiện như một cách tiếp cận mang tính cách mạng, thì sự thiếu minh bạch và một lượng lớn dữ liệu cần thiết để hệ thống học là hai điểm yếu chính của nó. Các công ty hiện nay nhận ra tầm quan trọng của việc có một AI minh bạch, không chỉ vì các lý do đạo đức mà còn phục vụ cho các hoạt động vận hành, do đó, việc kết hợp Symbolic AI và Machine learning là hướng đi tất yếu. Các cách tiếp cận như Knowledge Injection, Neuro-Symbolic Concept Learner, Soft Theorem Prover là các hướng nghiên cứu chứng minh cho xu thế này.
Nếu bạn thích bài viết này, hãy chia sẻ với những người quan tâm và cùng tham gia Cộng đồng Trí tuệ nhân tạo để bàn luận những vấn đề thời sự về Trí tuệ nhân tạo trên thế giới. Hẹn gặp lại bạn trong bài viết tiếp theo.
References
- Smolensky P. Connectionist AI, symbolic AI, and the brain. Artif Intell Rev. Published online 1987:95-109. doi:10.1007/bf00130011
- Mitchell T, Buchanan B, DeJong G, Dietterich T, Rosenbloom P, Waibel A. Machine Learning. Annu Rev Comput Sci. Published online June 1990:417-433. doi:10.1146/annurev.cs.04.060190.002221
- Mao J, Gan C, Kohli P, Tenenbaum JB, Wu J. The Neuro-Symbolic Concept Learner: Interpreting Scenes, Words, and Sentences From Natural Supervision. Published online 2019. doi:10.48550/ARXIV.1904.12584
- Nguyen HT, Vu TK, Racharak T, Nguyen LM, Tojo S. Knowledge Injection to Neural Networks with Progressive Learning Strategy. Lecture Notes in Computer Science. Published online 2021:280-290. doi:10.1007/978-3-030-71158-0_13
- Clark P, Tafjord O, Richardson K. Transformers as Soft Reasoners over Language. Published online 2020. doi:10.48550/ARXIV.2002.05867
- Gaskell A, Miao Y, Specia L, Toni F. Logically Consistent Adversarial Attacks for Soft Theorem Provers. Published online 2022. doi:10.48550/ARXIV.2205.00047