Kiểm chứng giả thuyết là gì?

Kiểm chứng giả thuyết (Hypothesis testing) là công cụ quan trọng để các nhà khoa học dữ liệu có được các kết luận tin cậy về mặt thống kê. Trong bài này, hãy cùng trituenhantao.io tìm hiểu kiểm chứng giả thuyết thông qua ví dụ đơn giản. Cơ sở của kiểm chứng giả thuyết Cơ … Đọc tiếp

ELECTRA – Thành viên mới của dòng họ Transformer

ELECTRA — Efficiently Learning an Encoder that Classifies Token Replacements Accurately — là phương pháp pretrain mới được công bố bởi Google AI vượt trội hơn các kỹ thuật hiện tại với cùng nguồn lực tính toán. Gần đây các tiến bộ của các mô hình pretrain đối với ngôn ngữ tự nhiên đã thay đổi tạo ra những đột phá đáng … Đọc tiếp

Sự cố Y2K là gì?

Sự cố Y2K (Y: Year, K: kilo hoặc 1.000) là viết tắt của sự cố máy tính toàn cầu vào những năm 2000 và là kết quả của cách một số phần mềm và phần cứng máy tính biểu hiện ngày tháng năm. Vì nhiều hệ thống máy tính chỉ lưu trữ hai chữ số … Đọc tiếp

VAE – Phiên bản nâng cấp của Auto Encoder

VAE là phiên bản nâng cấp của bộ tự mã hóa Auto Encoder, VAE giúp tự động lựa chọn đặc trưng một cách chính xác thông qua quá trình học không giám sát. Vậy cụ thể VAE hoạt động như thế nào, hãy cùng trituenhantao.io tìm hiểu trong bài viết này. Machine learning giờ đây … Đọc tiếp

Giảm chiều dữ liệu với PCA và Autoencoder

Giảm chiều dữ liệu trong machine learning là quá trình giảm thiểu số lượng đặc trưng biểu diễn dữ liệu. Việc này có thể được thực hiện theo hướng lựa chọn các đặc trưng quan trọng hoặc trích xuất các đặc trưng mới từ các đặc trưng đã có. Giảm chiều dữ liệu hữu ích … Đọc tiếp

BLEU – Phép đo trong dịch máy

BLEU là viết tắt của Bilingual Evaluation Understudy, là phương pháp đánh giá một bản dịch dựa trên các bản dịch tham khảo, được giới thiệu trong paper BLEU: a Method for Automatic Evaluation of Machine Translation). BLEU được thiết kế để sử dụng trong dịch máy (Machine Translation), nhưng thực tế, phép đo này cũng được … Đọc tiếp