OpenAI đã tìm ra cách làm cho các mô hình AI hợp lý hơn và tránh ảo giác

Trò chuyệnHình minh họa GPT

Hình ảnh Userba011d64_201/Getty

Mặc dù các mô hình AI tiên tiến và có thể làm được những điều phi thường, nhưng chúng vẫn có khả năng mắc lỗi và đưa ra câu trả lời sai - được gọi là ảo giác. 

Tất cả các chatbot AI chính, bao gồm ChatGPT và Google Bard, đều dễ bị ảo giác này. Cả OpenAI và Google thậm chí còn tiết lộ rằng chatbot của họ có thể tạo ra thông tin không chính xác. 

Ngoài ra: ChatGPT vs Bing Chat vs Google Bard? Chatbot AI nào tốt nhất?

OpenAI cho biết: “ChatGPT đôi khi viết những câu trả lời nghe có vẻ hợp lý nhưng không chính xác hoặc vô nghĩa. Bài đăng trên blog ChatGPT. 

Việc tạo ra thông tin sai lệch đã dẫn đến mối lo ngại lan rộng về việc phổ biến thông tin sai lệch và những hậu quả tiêu cực tiềm tàng của nó.

Trong một bài nghiên cứu mới, OpenAI chia sẻ rằng có thể họ đã tìm ra cách khiến các mô hình AI hoạt động logic hơn và tránh ảo giác. 

OpenAI đã đào tạo một mô hình có khả năng giải quyết các vấn đề toán học phức tạp thông qua “giám sát quy trình”, một phương pháp cung cấp phản hồi cho từng bước riêng lẻ thay vì “giám sát kết quả”, cung cấp phản hồi về kết quả cuối cùng. 

Ngoài ra: Tôi đã thử nghiệm rất nhiều công cụ AI cho công việc. Đây là 5 yêu thích của tôi cho đến nay

Trong tài liệu nghiên cứu, OpenAI đã thử nghiệm cả hai phương pháp bằng cách sử dụng bộ dữ liệu MATH và nhận thấy rằng phương pháp giám sát quy trình dẫn đến “hiệu suất tốt hơn đáng kể”.

Kết quả trò chuyệnGPT

Ảnh chụp màn hình của Sabrina Ortiz / ZDNET

OpenAI cho biết trong bài báo nghiên cứu: “Việc giám sát quy trình cũng có nhiều khả năng tạo ra lý luận có thể hiểu được hơn, vì nó khuyến khích mô hình tuân theo quy trình được con người chấp thuận”. 

Ngoài ra: Cách ChatGPT có thể viết lại và cải thiện mã hiện tại của bạn

OpenAI lưu ý rằng bên ngoài phạm vi của các vấn đề toán học, vẫn chưa biết những kết quả này sẽ được áp dụng rộng rãi như thế nào, nhưng điều quan trọng là phải khám phá nó trong các lĩnh vực khác.  



nguồn