Câu hỏi phỏng vấn AI cơ bản

Trong những năm gần đây, nhu cầu tuyển dụng và làm việc trong lĩnh vực AI tăng cao. Câu hỏi phỏng vấn AI là tài liệu quan trọng cho cả nhà tuyển dụng và ứng viên. Bài viết này, trituenhantao.io đưa ra một số câu hỏi cơ bản liên quan đến lĩnh vực. Các nhà … Đọc tiếp

Sưu tầm: Học Trí tuệ nhân tạo (AI) tại Mỹ

Trí tuệ nhân tạo được mệnh danh là ngành học của tương lai bởi những triển vọng đáng mong đợi của nó. Đặc biệt trong kỷ nguyên số, máy tính đã phát triển thành siêu máy tính, công nghệ len lỏi vào từng ngành nghề… Thuật ngữ Trí tuệ nhân tạo lại càng được nhắc … Đọc tiếp

Cơ chế sao chép trong CopyNet

Các mô hình seq2seq sẽ trở nên mạnh mẽ hơn nếu được trang bị cơ chế sao chép. Các mô hình này được tác giả gọi là CopyNet. Ý tưởng của chúng khá rõ ràng, trong các bản dịch máy, các từ mang tính thuật ngữ hoặc tên riêng sẽ được giữ nguyên gốc. Trong … Đọc tiếp

ALBERT: Bé hạt tiêu của dòng họ Transformer

Trung tâm nghiên cứu của Google và Viện công nghệ Toyota đã cùng nhau xuất bản bài báo giới thiệu về một mô hình được coi là người kế vị của BERT, một mô hình hiệu quả hơn với số lượng tham số ít hơn nhiều. Mô hình này có tên là ALBERT (A Lite … Đọc tiếp

Vocabulary

Có thể dịch là bộ ngữ liệu. Trong NLP, các đoạn văn bản thường được biểu diễn bởi các thành phần nhỏ hơn như từ, ký tự hoặc các biểu diễn trung gian. Vocabulary chứa toàn bộ các thành phần như vậy mà một mô hình ánh xạ trong bộ nhớ của nó. Vocabulary của … Đọc tiếp

Transformer

Transformer là mô hình học sâu được giới thiệu vào năm 2017, được sử dụng chủ yếu trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP).

Các dataset tiếng Việt

https://github.com/undertheseanlp/underthesea Underthesea – Vietnamese NLP Toolkit https://github.com/stopwords/vietnamese-stopwords Stop word trong tiếng Việt https://github.com/duydo/elasticsearch-analysis-vietnamese Vietnamese Analysis Plugin for Elasticsearch https://github.com/phuonglh/vn.vitk A Vietnamese Text Processing Toolkit https://github.com/coccoc/coccoc-tokenizer Tách từ tiếng Việt bởi Cốc cốc https://github.com/trituenhantaoio/CentralVietnamDataset Dataset phương ngữ miễn Trung