Gaussian Error Linear Unit. Một hàm kích hoạt được sử dụng chính trong các mô hình Transformers như BERT của Google và GPT-2 của OpenAI.
Bạn muốn trích dẫn bài này:
-----
« Back to Glossary Index -----
"GELU," Trí tuệ nhân tạo, Ngày xuất bản: 28/12/2019, URL: https://trituenhantao.io/glossary/gelu/, Ngày truy cập: 01/04/2023.