AlphaTensor được giới thiệu bởi DeepMind đã là một hệ thống deep reinforcement learning giúp khám phá các thuật toán nhân ma trận hiệu quả. Thuật toán này giúp tối ưu hiệu quả của các phần cứng như Nvidia V100 GPU hay Google TPU v2.

Phép nhân ma trận là trọng tâm của nhiều tác vụ tính toán, bao gồm mạng nơ-ron, đồ họa 3D và nén dữ liệu. Do đó, có rất nhiều ứng dụng tức thời của một hệ thống AI có thể cải thiện phép nhân ma trận như AlphaTensor.

Thú vị là , để tạo ra AlphaTensor, các nhà khoa học tại DeepMind sử dụng AlphaZero, hệ thống trước đây thống trị các board game như cờ vây, cờ vua và shogi. Thoạt nhìn, có vẻ như DeepMind đã cố gắng tạo ra một hệ thống AI đủ tổng quát để giải quyết một loạt các vấn đề không liên quan đến nhau. Với việc AlphaTensor tìm ra các thuật toán nhân ma trận nhanh hơn, chúng ta nên cẩn trọng với các hệ AI cải tiến AI.

Phép nhân ma trận

Phép nhân ma trận là một trong những phép toán đơn giản nhất trong đại số, thường được dạy trong các lớp toán trung học phổ thông. Nhưng bên ngoài lớp học, phép toán khiêm tốn này có ảnh hưởng to lớn trong thế giới kỹ thuật số đương đại và phổ biến trong máy tính hiện đại.

Ví dụ về quá trình nhân hai ma trận 3×3.

Phép toán này được sử dụng để xử lý hình ảnh trên điện thoại thông minh, nhận dạng giọng nói, tạo đồ họa cho trò chơi máy tính, chạy mô phỏng để dự đoán thời tiết, nén dữ liệu và video để chia sẻ trên internet, v.v. Các công ty trên khắp thế giới dành một lượng lớn thời gian và tiền bạc để phát triển phần cứng máy tính để nhân các ma trận một cách hiệu quả. Vì vậy, ngay cả những cải tiến nhỏ đối với hiệu quả của phép nhân ma trận cũng có thể có tác động rộng rãi.

Trong nhiều thế kỷ, các nhà toán học tin rằng thuật toán nhân ma trận chuẩn là thuật toán tốt nhất có thể đạt được về mặt hiệu quả. Nhưng vào năm 1969, nhà toán học người Đức Volker Strassen đã gây chấn động cộng đồng toán học khi chỉ ra rằng các thuật toán tốt hơn vẫn tồn tại.

Thuật toán tiêu chuẩn so với thuật toán Strassen, sử dụng một phép nhân ít vô hướng hơn (7 thay vì 8) để nhân ma trận 2×2. Các phép nhân quan trọng hơn nhiều so với các phép cộng cho hiệu quả tổng thể.

Thông qua việc nghiên cứu các ma trận rất nhỏ (kích thước 2×2), ông đã phát hiện ra một cách khéo léo để kết hợp các phần tử của các ma trận để tạo ra một thuật toán nhanh hơn. Nhiều thập kỷ nghiên cứu sau bước đột phá của Strassen, các phiên bản lớn hơn của vấn đề này vẫn chưa được giải quyết – đến mức người ta không biết có thể cải tiến việc nhân hai ma trận 3×3 hay không.

Dựa trên quá trình tư duy của trực giác con người, AlphaTensor phát hiện ra các thuật toán hiệu quả hơn cho nhiều kích thước ma trận. Các thuật toán do AI thiết kế được chứng minh tốt hơn các thuật toán do con người thiết kế, đây là một bước tiến lớn trong lĩnh vực khám phá thuật toán.

AlphaTensor khám phá thuật toán như thế nào?

Đầu tiên, các nhà khoa học chuyển đổi vấn đề tìm kiếm thuật toán hiệu quả cho phép nhân ma trận thành một trò chơi. Trò chơi này sử dụng một tensor ba chiều (mảng số), ghi lại khoảng cách chính xác của thuật toán hiện tại. Thông qua một tập hợp các bước di chuyển được phép, tương ứng với các hướng dẫn của thuật toán, người chơi cố gắng sửa đổi tensor và loại bỏ các phần tử của nó. Điều này dẫn đến một thuật toán nhân ma trận chính xác có thể chứng minh được cho bất kỳ cặp ma trận nào và hiệu quả của nó được ghi lại bằng số bước thực hiện.

Trò chơi này cực kỳ thách thức – số lượng thuật toán có thể xem xét lớn hơn nhiều so với số nguyên tử trong vũ trụ, ngay cả đối với các trường hợp nhân ma trận nhỏ. So với trò chơi cờ vây, vốn vẫn là một thách thức đối với AI trong nhiều thập kỷ, số lượng nước đi có thể có ở mỗi bước trong trò chơi này lớn hơn 30 bậc.

AlphaTensor được huấn luyện để chơi trò chơi thông qua reinforcement learning, bắt đầu mà không có bất kỳ kiến thức nào về các thuật toán nhân ma trận hiện có. Thông qua việc học hỏi, AlphaTensor dần dần cải thiện theo thời gian, khám phá lại các thuật toán nhân ma trận nhanh trong lịch sử như Strassen’s, cuối cùng vượt qua trực giác của con người và khám phá các thuật toán nhanh hơn những gì đã biết trước đây.

Trò chơi một người chơi do AlphaTensor chơi, với mục tiêu là tìm ra một thuật toán nhân ma trận chính xác. Trạng thái của trò chơi là một dãy số hình khối (được hiển thị dưới dạng màu xám cho 0, màu xanh lam cho 1 và màu xanh lá cây cho -1), đại diện cho công việc còn lại phải hoàn thành.

Ví dụ: nếu thuật toán truyền thống được dạy trong trường nhân một ma trận 4×5 với 5×5 bằng cách sử dụng 100 phép nhân và con số này được giảm xuống còn 80 với sự khéo léo của con người, thì AlphaTensor đã tìm ra các thuật toán thực hiện cùng một phép toán chỉ bằng 76 phép nhân.

Trực giác của con người và sức mạnh tính toán

Có thể lập luận rằng công nghệ mà chúng ta coi là trí tuệ nhân tạo ngày nay trên thực tế là một công cụ tìm kiếm giải pháp. Con người vẫn là những người tìm ra những vấn đề có ý nghĩa và đặc tả chúng theo một cách phù hợp để giải bằng máy tính. Đây là kỹ năng chưa thể bị thay thế của con người cho đến thời điểm hiện tại.

Con người có thể biến những nhận thức và trải nghiệm của mình thành những khái niệm trừu tượng và sau đó phản ánh những khái niệm đó thành những nhận thức và trải nghiệm mới — hoặc tạo ra những phép loại suy. Khả năng này cực kỳ quan trọng trong việc giải quyết các vấn đề trong một thế giới luôn thay đổi, nơi bạn thường xuyên phải đối mặt với các tình huống mới. Và nó đang thiếu rất nhiều trong các hệ thống AI ngày nay.

Nếu bạn thích bài viết này, hãy chia sẻ với những người quan tâm. Hãy cài đặt trituenhantao.io vào điện thoại và truy cập Cộng đồng Trí tuệ nhân tạo để nhận được những tài nguyên hỗ trợ tốt nhất liên quan đến lĩnh vực.

Bạn muốn trích dẫn bài này:
-----

"AlphaTensor – AI đang nâng cấp chính nó," Trí tuệ nhân tạo, Ngày xuất bản: 14/10/2022, URL: https://trituenhantao.io/kien-thuc/alphatensor-ai-dang-nang-cap-chinh-no/, Ngày truy cập: 26/04/2024.

Phép nhân ma trận

AlphaTensor khám phá thuật toán như thế nào?

Trực giác của con người và sức mạnh tính toán

Cài Trí tuệ nhân tạo vào điện thoại.