ChatGPT: Mọi thứ bạn cần biết về công cụ GPT-3 của OpenAI

trituenhantao.io

3 năm trước

ChatGPT: Mọi thứ bạn cần biết về công cụ GPT-3 của OpenAI

ChatGPT là từ khóa đưa OpenAI quay trở lại tâm điểm của các cuộc bàn luận về Trí tuệ nhân tạo. Nhưng ChatGPT là gì và nó hoạt động như thế nào? Hãy cùng tìm hiểu trong bài viết này.

Trong nhiều năm, trên toàn thế giới đã xuất hiện nỗi sợ hãi về trí tuệ nhân tạo (AI) và việc nó sắp tiếp quản thế giới… không ai biết rằng nó sẽ bắt đầu với thế giới nghệ thuật và văn học.

Sau nhiều tháng thống trị internet với trình tạo hình ảnh AI Dall-E 2, OpenAI đã trở lại tâm điểm của các cuộc bàn luận trên mạng xã hội của mọi người nhờ ChatGPT – một chatbot được tạo bằng công nghệ GPT-3 của công ty.

GPT-3 và ChatGPT là gì?

GPT-3 (Generative Pretraining Transformer 3) là một mô hình AI xử lý ngôn ngữ tiên tiến nhất được phát triển bởi OpenAI. Nó có khả năng tạo văn bản giống con người và có nhiều ứng dụng, bao gồm dịch ngôn ngữ, mô hình hóa ngôn ngữ và tạo văn bản cho các ứng dụng như chatbot. Đây là một trong những mô hình AI xử lý ngôn ngữ lớn nhất và mạnh mẽ nhất cho đến nay, với 175 tỷ tham số.

Công dụng phổ biến nhất của nó cho đến nay là tạo ChatGPT – một chatbot có nhiều khả năng. Để cung cấp cho bạn một chút hương vị về khả năng cơ bản nhất của nó, chúng tôi đã yêu cầu chatbot của GPT-3 viết mô tả của riêng nó như bạn có thể thấy ở trên. Nó hơi khoe khoang một chút, nhưng hoàn toàn chính xác và được cho là viết rất hay.

Ở trên, nó tự mô tả mình là một mô hình AI xử lý ngôn ngữ. Điều này đơn giản có nghĩa là nó là một chương trình có thể hiểu được ngôn ngữ của con người khi nói và viết, cho phép hiểu được thông tin dạng văn bản mà nó được cung cấp và trả lời dựa trên hiểu biết của nó.

ChatGPT có thể làm gì?

Với 175 tỷ tham số, thật khó để thu hẹp những gì GPT-3 làm. Như bạn có thể tưởng tượng, mô hình này bị giới hạn trong ngôn ngữ. Nó không thể tạo ra video, âm thanh hay hình ảnh như người anh em Dall-E 2, mà thay vào đó nó có khả năng hiểu sâu về văn nói và văn viết.

Điều này mang lại cho nó nhiều khả năng, mọi thứ, từ viết thơ, những câu chuyện tình lãng mạn sáo rỗng trong các vũ trụ song song, cho đến giải thích cơ học lượng tử bằng thuật ngữ đơn giản hoặc viết các bài nghiên cứu.

Bạn có thể dùng thành quả nhiều năm của Open AI chỉ để viết các kịch bản hài kịch hay trả lời các câu hỏi liên quan đến idol của mình. Nó thực sự rất thú vị. Tuy nhiên, sức mạnh của AI này nằm ở tốc độ và sự hiểu biết về các vấn đề phức tạp.

Trong khi chúng ta có thể dành hàng giờ để nghiên cứu, tìm hiểu và viết một bài báo về cơ học lượng tử, thì ChatGPT có thể tạo ra một giải pháp thay thế được viết tốt chỉ trong vài giây.

Nó có những hạn chế và phần mềm của nó có thể dễ dàng bị nhầm lẫn nếu lời nhắc của bạn bắt đầu trở nên quá phức tạp hoặc ngay cả khi bạn hỏi quá chi tiết.

Ngoài ra, nó không thể xử lý các khái niệm quá mới. Các sự kiện thế giới đã xảy ra trong năm qua sẽ được diễn giải với kiến thức hạn chế và mô hình đôi khi có thể tạo ra thông tin sai lệch hoặc nhầm lẫn.

OpenAI cũng rất ý thức về các hành vi làm cho AI tạo ra nội dung đen tối, có hại hoặc thiên vị. Giống như trình tạo hình ảnh Dall-E trước đây, ChatGPT sẽ ngăn bạn hỏi những câu hỏi không phù hợp hoặc cảnh báo những yêu cầu nguy hiểm.

ChatGPT hoạt động như thế nào?

Nhìn bề ngoài, công nghệ của GPT-3 rất đơn giản. Nó nhận các yêu cầu, câu hỏi hoặc lời nhắc của bạn và nhanh chóng trả lời chúng. Như bạn có thể tưởng tượng, công nghệ để làm điều này phức tạp hơn nhiều.

Mô hình được đào tạo bằng cách sử dụng cơ sở dữ liệu văn bản từ internet. Điều này bao gồm 570GB dữ liệu khổng lồ thu được từ sách, văn bản web, Wikipedia, bài báo và các phần viết khác trên internet. Nói chính xác hơn, 300 tỷ từ đã được đưa vào hệ thống.

Là một mô hình ngôn ngữ, nó hoạt động dựa trên xác suất, có thể đoán từ tiếp theo sẽ là gì trong một câu. Để đến giai đoạn có thể làm được điều này, mô hình đã trải qua giai đoạn thử nghiệm có giám sát.

Tại đây, nó được cung cấp đầu vào, chẳng hạn “Gỗ của cây có màu gì?”. Nếu mô hình trả lời sai, câu trả lời đúng được nhập vào hệ thống, dạy cho hệ thống câu trả lời đúng và giúp hệ thống xây dựng kiến thức.

Sau đó, nó trải qua giai đoạn tương tự thứ hai, đưa ra nhiều câu trả lời và xếp hạng chúng từ tốt nhất đến kém nhất, đào tạo mô hình về so sánh.

Điều làm nên sự khác biệt của công nghệ này là nó tiếp tục học trong khi đoán từ tiếp theo sẽ là gì, không ngừng nâng cao hiểu biết của nó về các gợi ý và câu hỏi.

Có trình tạo ngôn ngữ AI nào khác không?

Mặc dù GPT-3 đã tự tạo nên tên tuổi cho mình bằng khả năng ngôn ngữ nhưng nó không phải là AI duy nhất có khả năng làm điều này. LaMDA của Google đã gây chú ý khi một kỹ sư của Google bị sa thải vì gọi nó là thực tế đến mức anh ta tin rằng nó có tri giác.

Ngoài ra còn có rất nhiều ví dụ khác về các phần mềm này do Microsoft, Amazon hay Đại học Stanford tạo ra. Hầu hết các mô hình này không được mở quyền truy cập cho công chúng, nhưng OpenAI đã bắt đầu mở quyền truy cập vào GPT-3 trong quá trình thử nghiệm của nó và LaMDA của Google cho phép một số nhóm được thử nghiệm có hạn chế.

Google chia Chatbot của mình thành các tính năng như nói chuyện, liệt kê và tưởng tượng, cung cấp các demo về khả năng của nó trong các lĩnh vực này. Bạn có thể yêu cầu nó tưởng tượng về một thế giới nơi loài rắn thống trị thế giới, yêu cầu nó tạo danh sách các bước để học cách đi xe đạp một bánh hoặc chỉ trò chuyện về suy nghĩ của loài chó.

Nơi đạo đức và trí tuệ nhân tạo gặp nhau

Trí tuệ nhân tạo và các mối quan tâm về đạo đức đi cùng nhau như cá và nước hay Batman và Robin. Khi bạn đưa công nghệ như thế này vào tay công chúng, các nhóm tạo ra chúng hoàn toàn nhận thức được nhiều hạn chế và mối quan tâm.

Bởi vì hệ thống được đào tạo chủ yếu bằng cách sử dụng các văn bản từ internet, nên nó có thể tiếp thu những thành kiến, khuôn mẫu và ý kiến chung của internet. Điều đó có nghĩa là đôi khi bạn sẽ tìm thấy những câu chuyện cười hoặc khuôn mẫu về một số nhóm hoặc nhân vật chính trị tùy thuộc vào những gì bạn hỏi.

Ví dụ: khi yêu cầu hệ thống biểu diễn hài kịch độc lập, đôi khi hệ thống có thể đưa ra những câu chuyện cười về các cựu chính trị gia hoặc các nhóm thường xuất hiện trong các đoạn hài kịch.

Tương tự, sự yêu thích của mô hình đối với các diễn đàn và bài báo trên internet cũng cho phép chúng tiếp cận với tin tức giả mạo và thuyết âm mưu. Những điều này có thể đưa vào kiến thức của mô hình, thêm vào các sự kiện hoặc ý kiến không hoàn toàn đúng sự thật.

OpenAI đã làm khá tốt để tạo ra một mô hình có trách nhiệm. Nếu hỏi làm thế nào để bắt nạt ai đó, và bạn sẽ được cho biết bắt nạt là xấu. Yêu cầu một câu chuyện đẫm máu và hệ thống trò chuyện sẽ làm bạn thất vọng. Điều tương tự cũng xảy ra đối với các yêu cầu dạy bạn cách thao túng con người hoặc chế tạo vũ khí nguy hiểm.

Nếu bạn thích bài viết này, hãy chia sẻ với những người (thực sự) quan tâm. Hãy thường xuyên truy cập website để có những thông tin mới nhất về lĩnh vực. Hẹn gặp lại các bạn trong các bài viết tiếp theo.