Các thuật ngữ tiếng Anh trong Trí tuệ nhân tạo

Để hiểu được cặn kẽ các thông tin được trình bày về Trí tuệ nhân tạo trong blog này, chúng ta cần hiểu được những thuật ngữ tiếng Anh. Đôi khi việc dịch các thuật ngữ này ra tiếng Việt thậm chí sẽ làm các thuật ngữ khó hiểu hơn. Các thuật ngữ này sẽ được bổ sung dần trong quá trình viết bài của chúng tôi.

Từ tháng 6/2019, các bạn có thể sử dụng Từ điển thuật ngữ trên trituenhantao.io với nhiều tính năng tiện dụng hơn.

Bag of Words (BoW)

Phương pháp này yêu cầu một tập hợp các từ cho trước, gọi là túi đựng từ. Đặc trưng của một văn bản sẽ được thể hiện thông qua sự xuất hiện của các từ thuộc văn bản đó trong túi đựng từ. Ví dụ, ta có túi đựng từ là {“vui”:0,”mừng”:1,”tuyệt vời”:2,”không”:3}. Hai câu “Hôm nay tôi không vui nhưng anh ta vui” và “Hôm nay thật tuyệt vời” sẽ được biểu diễn là [2,0,0,1] và [0,0,1,0].

Conditional Random Fields

Trường ngẫu nhiên có điều kiện (CRF) dự đoán các nhãn không chỉ dựa trên từ mà còn tính đến vùng lân cận. Điều này có ý nghĩa, một chuỗi các thực thể hoặc nhãn thường tồn tại một mẫu nhất định. CRF được sử dụng rộng rãi để mô hình hóa thông tin theo thứ tự. Một số ví dụ có thể kể đến là gán nhãn theo trình tự, giải mã trình tự gen hoặc thậm chí phát hiện đối tượng và phân đoạn hình ảnh trong thị giác máy tính.

Deep Learning

Deep Learning (học sâu) là một lĩnh vực của học máy liên quan đến các thuật toán lấy cảm hứng từ cấu trúc và chức năng của bộ não được gọi là mạng lưới thần kinh nhân tạo.

Feature

Trong học máy và nhận dạng mẫu, một đặc trưng (feature) là một thuộc tính hoặc đặc tính có thể đo lường riêng lẻ của một hiện tượng đang được quan sát.

One-hot và one-cold

Trong các mạch kỹ thuật số và học máy, one-hot là một nhóm các bit trong đó các tổ hợp giá trị cho phép là các bit có một bit cao (1) và tất cả các bit khác thấp (0). Một khái niệm gần gũi với nó là one-cold, theo đó tất cả các bit là ‘1’ ngoại trừ một bit ‘0’.

Bạn có thể tìm hiểu thêm các thuật ngữ tiếng Anh về Trí tuệ nhân tạo tại đây.

Language Models

Mô hình ngôn ngữ là kỹ thuật dự đoán từ hoặc ký tự tiếp theo trong một chuỗi các từ hoặc ký tự. Mô hình ngôn ngữ sử dụng mạng nơ ron có kết quả đáng chú ý với các bài toán NLP khác nhau như sinh văn bản, dịch máy, chú thích hình ảnh, OCR…

Machine Learning

Machine learning (học máy) là nghiên cứu khoa học về các thuật toán và mô hình thống kê mà các hệ thống máy tính sử dụng để thực hiện một nhiệm vụ cụ thể một cách hiệu quả mà không cần sử dụng các hướng dẫn rõ ràng, thay vào đó dựa vào các mẫu và suy luận.

Multi-Task Learning

Các bộ dữ liệu để huấn luyện một mô hình thường không lớn. Chỉnh sửa các đặc trưng thủ công không chỉ tốn nhiều công sức mà còn có thể làm ảnh hưởng đến hiệu quả của mô hình. Để giảm thiểu vấn đề này, huấn luyện kết hợp nhiều mô hình sẽ tối đa hóa thông tin có sẵn cho mỗi mô hình, từ đó cải thiện hiệu suất.