Stemming

Stemming là kỹ thuật NLP để đưa từ về dạng gốc thông qua việc loại bỏ các tiền tố, phụ tố và hậu tố.

Xử lý ngôn ngữ tự nhiên

Tiếng Anh là Natural Language Processing, viết tắt là NLP là một nhánh của trí tuệ nhân tạo tập trung vào các ứng dụng trên ngôn ngữ của con người. Trong trí tuệ nhân tạo thì xử lý ngôn ngữ tự nhiên là một trong những phần khó nhất vì nó liên quan đến việc … Đọc tiếp

Minh họa Transformer

Minh họa Transformer là bản dịch tiếng Việt của The Illustrated Transformer, Bản gốc được viết bởi Jay Alammar ( @JayAlammar ), hiện được sử dụng tại các lớp học tại MIT. Bản dịch được sửa đổi một phần không đáng kể để phù hợp hơn với bạn đọc. Transformer được đề xuất trong paper Attention is All You Need. … Đọc tiếp

Audrey – Hệ thống nhận dạng giọng nói đầu tiên

Ngày nay, từ điện thoại thông minh đến tivi, laptop và cả máy tính cá nhân phần lớn đều sử dụng công nghệ nhận dạng giọng nói, một lĩnh vực của NLP. Vậy bạn có biết phần mềm nhận dạng giọng nói bắt đầu từ đâu và ai là người đã tiên phong mở đường … Đọc tiếp

ELECTRA – Thành viên mới của dòng họ Transformer

ELECTRA — Efficiently Learning an Encoder that Classifies Token Replacements Accurately — là phương pháp pretrain mới được công bố bởi Google AI vượt trội hơn các kỹ thuật hiện tại với cùng nguồn lực tính toán. Gần đây các tiến bộ của các mô hình pretrain đối với ngôn ngữ tự nhiên đã thay đổi tạo ra những đột phá đáng … Đọc tiếp

BLEU – Phép đo trong dịch máy

BLEU là viết tắt của Bilingual Evaluation Understudy, là phương pháp đánh giá một bản dịch dựa trên các bản dịch tham khảo, được giới thiệu trong paper BLEU: a Method for Automatic Evaluation of Machine Translation). BLEU được thiết kế để sử dụng trong dịch máy (Machine Translation), nhưng thực tế, phép đo này cũng được … Đọc tiếp