Pathways: Kiến trúc AI thế hệ tiếp theo


Thông thường, các hệ thống học máy tập trung quá mức vào các nhiệm vụ riêng lẻ, khi chúng có thể vượt trội ở nhiều nhiệm vụ. Đó là lý do tại sao Google Research xây dựng Pathways — một kiến trúc AI mới sẽ xử lý nhiều nhiệm vụ cùng một lúc, học các nhiệm vụ mới một cách nhanh chóng và phản ánh sự hiểu biết tốt hơn về thế giới.

Ngày nay, AI tăng cường nhiều thứ mà chúng ta làm, cho dù điều đó giúp bạn chụp được một bức ảnh tự sướng đẹp hay cung cấp các kết quả tìm kiếm hữu ích hơn hoặc cảnh báo lũ lụt cho hàng trăm triệu người. AI sẵn sàng giúp nhân loại đối mặt với một số thách thức khó khăn nhất mà chúng ta từng đối mặt, từ các vấn đề dai dẳng như bệnh tật và bất bình đẳng đến các mối đe dọa mới nổi như biến đổi khí hậu.

Nhưng để đáp ứng với độ phức tạp của những thách thức cấp bách đó, các hệ thống AI mới cần có năng lực mạnh mẽ hơn. Cần thiết phải có sự kết hợp giữa các phương pháp tiếp cận hiệu quả của AI và các hướng nghiên cứu sơ khai để giải quyết các vấn đề mà con người vẫn chưa có lời giải. Để đạt được mục tiêu đó, các đội của Google Research nghiên cứu các thành tố của kiến trúc AI thế hệ tiếp theo, hứa hẹn sẽ giúp hiện thực hóa các hệ thống như vậy.

Pathways là gì?

Pathways là một tư duy mới về AI nhằm giải quyết nhiều điểm yếu của các hệ thống hiện có và tổng hợp điểm mạnh của chúng. Để dễ hiểu, hãy cùng xem qua một số thiếu sót hiện tại của AI và cách mà Pathways có thể cải thiện chúng.

Các mô hình AI ngày nay thường được đào tạo để làm một việc duy nhất. Pathways sẽ cho phép chúng ta đào tạo một mô hình duy nhất để làm hàng nghìn hoặc hàng triệu việc.

Các hệ thống AI ngày nay thường được đào tạo từ đầu cho mỗi vấn đề mới – các tham số của mô hình toán học được khởi tạo theo nghĩa đen bằng các số ngẫu nhiên. Hãy tưởng tượng nếu, mỗi khi bạn học một kỹ năng mới (chẳng hạn như nhảy dây), bạn quên tất cả những gì bạn đã học – cách giữ thăng bằng, cách nhảy, cách phối hợp chuyển động của tay – và bắt đầu học từng kỹ năng mới từ con số không.

Đó ít nhiều là cách chúng ta đào tạo hầu hết các mô hình học máy ngày nay. Thay vì mở rộng các mô hình hiện có để tìm hiểu các nhiệm vụ mới, chúng ta đào tạo từng mô hình mới từ con số không và chỉ làm một việc (hoặc đôi khi chúng ta chuyên môn hóa một mô hình chung cho một nhiệm vụ cụ thể). Kết quả là chúng ta sẽ phát triển hàng nghìn mô hình cho hàng nghìn nhiệm vụ riêng lẻ. Theo cách này, việc học từng nhiệm vụ mới không chỉ mất nhiều thời gian hơn mà còn đòi hỏi nhiều dữ liệu hơn để học từng nhiệm vụ, vì chúng ta đang cố gắng tìm hiểu mọi thứ về thế giới và các chi tiết cụ thể của nhiệm vụ đó từ con số không (hoàn toàn không giống như cách học của con người).

Thay vào đó, Google muốn đào tạo một mô hình không chỉ có thể xử lý nhiều nhiệm vụ riêng biệt mà còn dựa trên và kết hợp các kỹ năng hiện có của nó để học các nhiệm vụ mới nhanh hơn và hiệu quả hơn. Kỳ vọng của tư duy này là một mô hình có các khả năng khác nhau có thể được sử dụng khi cần thiết và kết hợp với nhau để thực hiện các nhiệm vụ mới, phức tạp hơn – gần hơn một chút với cách bộ não của con người hay động vật khái quát qua các nhiệm vụ.

Các mô hình ngày nay hầu hết tập trung vào một giác quan. Pathways sử dụng nhiều giác quan.

Con người dựa vào nhiều giác quan để nhận thức thế giới. Điều đó rất khác với cách các hệ thống AI hiện đại tiêu hóa thông tin. Hầu hết các mô hình ngày nay chỉ xử lý một phương thức thông tin tại một thời điểm. Chúng có thể lấy văn bản, hình ảnh hoặc lời nói – nhưng thường không phải cả ba cùng một lúc.

Pathways cho phép các mô hình đa phương thức bao gồm thị giác, thính giác và ngôn ngữ đồng thời. Vì vậy, cho dù mô hình đang xử lý từ “leopard”, âm thanh của ai đó nói “leopard” hoặc video về một con báo đang chạy, thì phản hồi tương tự sẽ được kích hoạt bên trong: khái niệm về một con báo. Kết quả là một mô hình sâu sắc hơn và ít mắc sai lầm và thành kiến hơn.

Bạn tưởng tượng dễ hơn khi nhìn thấy con báo này đúng không?

Và tất nhiên, một mô hình AI không nhất thiết bị giới hạn ở những giác quan quen thuộc này; Pathways có thể xử lý các dạng dữ liệu trừu tượng hơn, giúp tìm ra các mẫu hữu ích trong các hệ thống phức tạp như động lực học khí hậu.

Các mô hình ngày nay dày đặc và không hiệu quả. Pathways sẽ khiến chúng trở nên thưa thớt và hiệu quả.

Vấn đề thứ ba là hầu hết các mô hình ngày nay đều “dày đặc”, có nghĩa là toàn bộ mạng nơ-ron sẽ kích hoạt để hoàn thành một nhiệm vụ, bất kể việc đó rất đơn giản hay thực sự phức tạp.

Điều này cũng rất không giống với cách mọi người tiếp cận vấn đề. Chúng ta có nhiều bộ phận khác nhau của bộ não được chuyên biệt cho các nhiệm vụ khác nhau, tuy nhiên chúng ta chỉ dựa vào các phần liên quan cho một tình huống nhất định. Có gần một trăm tỷ tế bào thần kinh trong não của bạn, nhưng bạn chỉ dựa vào một phần nhỏ của chúng để giải thích câu này.

AI có thể hoạt động theo cách tương tự. Chúng ta có thể xây dựng một mô hình duy nhất được kích hoạt “thưa thớt”, có nghĩa là chỉ một vài các đường dẫn nhỏ qua mạng được kích hoạt khi cần thiết. Và đây là lý do tại sao tên gọi Pathways ra đời. Trên thực tế, mô hình tự động học được phần nào của mạng làm tốt nhiệm vụ nào – nó học cách định tuyến các tác vụ thông qua các phần phù hợp nhất của mô hình. Một lợi ích lớn đối với loại kiến trúc này là nó không chỉ có dung lượng lớn hơn để học nhiều tác vụ khác nhau mà còn nhanh hơn và tiết kiệm năng lượng hơn nhiều, bởi vì chúng ta không kích hoạt toàn bộ mạng cho mọi tác vụ.

Nếu bạn thích bài viết này, hãy chia sẻ nó với những người quan tâm và thường xuyên ghé thăm website cũng như Cộng đồng Trí tuệ nhân tạo để cùng trao đổi các kiến thức mới nhất về lĩnh vực.

Bạn muốn trích dẫn bài này:
-----
"Pathways: Kiến trúc AI thế hệ tiếp theo," Trí tuệ nhân tạo, Ngày xuất bản: 14/04/2022, URL: https://trituenhantao.io/tin-tuc/pathways-kien-truc-ai-the-he-tiep-theo/, Ngày truy cập: 19/04/2024.