Teacher Forcing là gì? Nó hoạt động như thế nào?

Teacher Forcing là một kỹ thuật được sử dụng trong quá trình huấn luyện các mạng nơ ron nhân tạo. Kỹ thuật này được sử dụng phổ biến trong NLP (ví dụ như các bài toán viết mô tả cho ảnh hay dịch máy). Trong bài này, hãy cùng trituenhantao.io tìm hiểu về Teacher Forcing … Đọc tiếp

Transformer hoạt động như thế nào?

Transformer là một dòng mạng nơ ron nhân tạo đang ngày càng trở nên phổ biến. Trong bài này, hãy cùng trituenhantao.io tìm hiểu cách thức hoạt động của chúng. Transformer được sử dụng bởi GPT-2 của OpenAI hay trong AlphaStar của DeepMind — một chương trình có khả năng đánh bại những người chơi đỉnh … Đọc tiếp

Xin đừng ngáo AI

Trong chuyên mục sưu tầm lần này, hãy cùng đọc và suy ngẫm về tình trạng ngáo AI qua lăng kính của bạn Cao Minh Ngọc. Các bạn có thể xem bài gốc tại đây. Vài năm gần đây, cụm từ “AI”, “Trí tuệ nhân tạo”, “Big data”…. đã trở nên vô cùng phổ biến, … Đọc tiếp

BERT, RoBERTa, DistilBERT, XLNet – Chọn cái nào?

BERT của Google và các phương pháp dựa trên transformer gần đây đã gây ra một cơn bão trong lĩnh vực NLP, đạt kết quả vượt trội trên một số nhiệm vụ. Gần đây, những cải tiến khác nhau của BERT đã xuất hiện. Hãy cùng trituenhantao.io tìm hiểu các điểm tương đồng và khác … Đọc tiếp