Word Embedding – Vector hóa văn bản
Word Embedding là một bước quan trọng trong bài toán Text Mining bất kì. Trong bài này, tôi sẽ đưa ra lần lượt theo sự phát triển và cải tiến của các thuật toán Word Embeddings phổ biến hiện nay.
Các bài viết chuyên sâu về học máy, học sâu, xử lý ảnh, xử lý ngôn ngữ tự nhiên, thuật toán và toán học cao cấp.
Phục vụ các kỹ sư và nhà khoa học.
Word Embedding là một bước quan trọng trong bài toán Text Mining bất kì. Trong bài này, tôi sẽ đưa ra lần lượt theo sự phát triển và cải tiến của các thuật toán Word Embeddings phổ biến hiện nay.
Khi xây dựng mỗi MH Machine Learning, chúng ta cần phải chú ý hai vấn đề: Ovefitting và Underfitting. Đây chính là nguyên nhân chủ yếu khiến MH có độ chính xác thấp.
Ở bài trước, ta thấy cả 2 thuật toán Topic Modeling đều đưa ra kết quả có những dữ liệu nhiễu hay những chủ đề khó có thể tìm được tên. Vậy ta sẽ thực hiện cải thiện mô hình. Ý tưởng của phần này, chúng ta sẽ xem xét kĩ lại hai ma trận … Đọc tiếp
Trong bài trước, chúng tôi đã hướng dẫn các bạn những cách cơ bản để làm một dự án học máy bung bét. Nếu các bạn vẫn hứng thú với chủ đề này, mời các bạn tiếp tục đọc phần 2 của bài viết. Chúng ta tiếp tục với cách thứ 5: 5. Cộng tác … Đọc tiếp
Topic Modeling là một kiểu mô hình thống kê giúp khai phá các chủ đề ẩn trong tập dữ liệu. Trong bài này, tôi sẽ không đi sâu vào giới thiệu về Topic Modeling, mà tôi sẽ giới thiệu thuật toán Latent Dirichlet Allocation (LDA) và Non-negative Matrix Factorization (NMF), những thuật toán phổ biến … Đọc tiếp
Khi bắt đầu một dự án học máy, mọi người thông thường sẽ mong muốn dự án của mình sẽ thành công ngoài mong đợi. Nhưng mà … chỉ là “thông thường” thôi. Nếu như bạn muốn dự án học máy của bạn thất bại hoặc thất bại thảm hại thì cũng không quá khó. … Đọc tiếp
Alzheimer là một căn bệnh quái ác không chỉ cho người chịu đựng nó, mà còn cho những người thân xung quanh họ. Căn bệnh này hiện tại không thể chữa trị và gây ra mất trí nhớ và những khó khăn nhất định khi hoàn thành những công việc tương tự nhau. Mới đây … Đọc tiếp
Trí tuệ nhân tạo đang giúp các công ty sản xuất hương liệu lớn nhất trên thế giới tìm ra thật nhiều loại gia vị nấu ăn mới. Giúp cho danh sách sản phẩm mới của họ được tăng lên đáng kể. Các công ty sản xuất gia vị, hương liệu lớn nhất trên thế … Đọc tiếp