Lưu trữ Kiến thức

Sampling và Resampling là gì?

Dữ liệu là nguồn năng lượng của máy học ứng dụng. Do đó, việc thu thập và sử dụng dữ liệu hiệu quả là vô cùng quan trọng. Trong bài này, hãy cùng trituenhantao.io tìm hiểu Sampling và Resampling, hai phương pháp cần thiết để đạt được mục tiêu tối ưu việc thu thập và … Đọc tiếp

Machine Learning và các khái niệm cơ bản

Không thể phủ nhận machine learning là một trong những công nghệ có ảnh hưởng mạnh mẽ nhất trên thế giới ngày nay. Quan trọng hơn, phải cần một khoảng thời gian rất lâu nữa, ta mới thấy được hết tiềm năng của nó. Hãy cùng trituenhantao.io tìm hiểu về các khái niệm cơ bản … Đọc tiếp

Giới thiệu nhanh về Boosting và AdaBoost

Boosting là một kỹ thuật ensemble có mục tiêu tạo ra một bộ phân lớp mạnh từ một số các bộ phân lớp yếu hơn. AdaBoost là thuật toán boosting được phát triển cho phân lớp nhị phân và là thuật toán đầu tiên thực sự thành công. Tìm hiểu AdaBoost là một cách hiệu … Đọc tiếp

Giới thiệu về k-fold cross-validation

Cross validation là một phương pháp thống kê được sử dụng để ước lượng hiệu quả của các mô hình học máy. Nó thường được sử dụng để so sánh và chọn ra mô hình tốt nhất cho một bài toán. Kỹ thuật này dễ hiểu, dễ thực hiện và cho ra các ước lượng … Đọc tiếp

Cơ chế sao chép trong CopyNet

Các mô hình seq2seq sẽ trở nên mạnh mẽ hơn nếu được trang bị cơ chế sao chép. Các mô hình này được tác giả gọi là CopyNet. Ý tưởng của chúng khá rõ ràng, trong các bản dịch máy, các từ mang tính thuật ngữ hoặc tên riêng sẽ được giữ nguyên gốc. Trong … Đọc tiếp

Xử lý ngôn ngữ tự nhiên cơ bản

Xử lý ngôn ngữ tự nhiên (NLP) là một nhánh của Trí tuệ nhân tạo. Trong bài này, chúng tôi sẽ giới thiệu những vấn đề cơ bản của nó. Hãy cùng tìm hiểu nhé! Từ rất lâu, máy tính đã hoạt động thật sự hiệu quả với những kiểu dữ liệu được chuẩn hóa … Đọc tiếp

SVM quá khó hiểu! Hãy đọc bài này

SVM là thuật toán quan trọng trong các thuật toán Học máy. Nó được sử dụng trong cả phân lớp lẫn hồi quy (SVR). Mặc dù vậy, đằng sau thuật toán này là một loạt các lý thuyết về đại số tuyến tính từ cơ bản đến nâng cao. Nếu bạn đang tìm một bài … Đọc tiếp

ALBERT: Bé hạt tiêu của dòng họ Transformer

Trung tâm nghiên cứu của Google và Viện công nghệ Toyota đã cùng nhau xuất bản bài báo giới thiệu về một mô hình được coi là người kế vị của BERT, một mô hình hiệu quả hơn với số lượng tham số ít hơn nhiều. Mô hình này có tên là ALBERT (A Lite … Đọc tiếp

Giới thiệu về Attention

Attention là một kỹ thuật hiện đại trong các mạng nơ ron nhân tạo. Kỹ thuật này đã chứng minh được tính hiệu quả trong các nhiệm vụ dịch máy hay xử lý ngôn ngữ tự nhiên. Nó cũng là một trong số những thành phần tạo nên đột phá trong các mô hình như … Đọc tiếp

BPE – Byte Pair Encoding – Vũ khí bí mật của NLP hiện đại

Byte Pair Encoding là một thuật toán nén dữ liệu được giới thiệu lần đầu tiên vào năm 1994, giúp tăng hiệu quả của tất cả các mô hình NLP tiên tiến hiện nay (bao gồm cả BERT). Mặc dù vậy, thuật toán này không phải ai cũng biết. Trong bài viết này, hãy cùng … Đọc tiếp

Cài Trí tuệ nhân tạo vào điện thoại.