Performer – Attention một cách hiệu quả

Performer là một biến thể của Transformer mở rộng attention một cách tuyến tính, cho phép huấn luyện nhanh hơn và cho phép mô hình làm việc trên độ dài lớn hơn. Các mô hình Transformer đã mang lại kết quả state-of-the-art trên đa dạng các lĩnh vực bao gồm ngôn ngữ tự nhiên, hội … Đọc tiếp

Kiểm chứng giả thuyết là gì?

Kiểm chứng giả thuyết (Hypothesis testing) là công cụ quan trọng để các nhà khoa học dữ liệu có được các kết luận tin cậy về mặt thống kê. Trong bài này, hãy cùng trituenhantao.io tìm hiểu kiểm chứng giả thuyết thông qua ví dụ đơn giản. Cơ sở của kiểm chứng giả thuyết Cơ … Đọc tiếp

ELECTRA – Thành viên mới của dòng họ Transformer

ELECTRA — Efficiently Learning an Encoder that Classifies Token Replacements Accurately — là phương pháp pretrain mới được công bố bởi Google AI vượt trội hơn các kỹ thuật hiện tại với cùng nguồn lực tính toán. Gần đây các tiến bộ của các mô hình pretrain đối với ngôn ngữ tự nhiên đã thay đổi tạo ra những đột phá đáng … Đọc tiếp