BPE – Byte Pair Encoding – Vũ khí bí mật của NLP hiện đại

Byte Pair Encoding là một thuật toán nén dữ liệu được giới thiệu lần đầu tiên vào năm 1994, giúp tăng hiệu quả của tất cả các mô hình NLP tiên tiến hiện nay (bao gồm cả BERT). Mặc dù vậy, thuật toán này không phải ai cũng biết. Trong bài viết này, hãy cùng … Đọc tiếp

ResNet – Mạng học sâu đúng nghĩa

ResNet (viết tắt của residual network), là mạng học sâu nhận được quan tâm từ những năm 2012 sau cuộc thi LSVRC2012 và trở nên phổ biến trong lĩnh vực thị giác máy. ResNet khiến cho việc huấn luyện hàng trăm thậm chí hàng nghìn lớp của mạng nơ ron trở nên khả thi và … Đọc tiếp

XLNet – Người khổng lồ thay thế vị trí của BERT

Năm 2018, Google giới thiệu BERT, mô hình học sâu pre-trained lập kỷ lục với 11 kết quả state-of-the-art với các nhiệm vụ của Xử lý ngôn ngữ tự nhiên. Nó nhanh chóng nhận được sự quan tâm lớn của các nhà khoa học và công nghiệp trên toàn thế giới. Các công trình nghiên … Đọc tiếp

Thuật ngữ về Deep Learning cho “lính mới” – Phần 1

Nếu một người ở thế kỷ 20 không hiểu gì về điện thì khả năng họ sẽ gặp phải rất nhiều khó khăn. Tương tự như vậy ở thế kỷ 21, nếu bạn không biết đến sự tồn tại của Deep Learning thì bạn đang đánh mất một lợi thế cạnh tranh rất lớn. Nếu … Đọc tiếp

Phần 1: Phân loại Naive Bayes (Lý thuyết)

Trong bài này, tôi sẽ cùng các bạn tìm hiểu về thuật toán cơ bản của phương pháp Supervised Learning (Học có giám sát) là thuật toán phân loại Naive Bayes. Bài viết được chia làm hai phần: phần đầu ta sẽ cùng tìm hiểu cách thức hoạt động của thuật toán Naive Bayes và … Đọc tiếp