OpenAI đã công bố phiên bản mới nhất của mô hình ngôn ngữ lớn chính của mình, GPT-4, vào thứ Ba, cho biết nó thể hiện “hiệu suất ở cấp độ con người” trong nhiều bài kiểm tra chuyên nghiệp.
OpenAI cho biết GPT-4 đã thực hiện ở phân vị thứ 90 trong bài kiểm tra thanh mô phỏng, phân vị thứ 93 trong bài kiểm tra đọc SAT và phân vị thứ 89 trong bài kiểm tra Toán SAT.
OpenAI đã công bố phiên bản mới nhất của mô hình ngôn ngữ lớn chính của mình, GPT-4, vào thứ Ba, cho biết nó thể hiện “hiệu suất ở cấp độ con người” trong nhiều bài kiểm tra chuyên nghiệp.
ChatGPT-4 “lớn hơn” so với các phiên bản trước, có nghĩa là nó đã được đào tạo trên nhiều dữ liệu hơn và có nhiều trọng số hơn trong tệp mô hình của nó, khiến cho việc chạy nó cũng tốn kém hơn.
Hiện tại, nhiều nhà nghiên cứu trong lĩnh vực này tin rằng nhiều tiến bộ gần đây trong AI đến từ việc chạy các mô hình ngày càng lớn hơn trên hàng nghìn siêu máy tính trong các quy trình đào tạo có thể tiêu tốn hàng chục triệu đô la . GPT-4 là một ví dụ về cách tiếp cận tập trung vào việc “mở rộng quy mô” để đạt được kết quả tốt hơn.
OpenAI cho biết họ đã sử dụng Microsoft
Azure để đào tạo mô hình; Microsoft đã đầu tư hàng tỷ đô la vào công ty khởi nghiệp. OpenAI đã không công bố thông tin chi tiết về kích thước mô hình cụ thể hoặc phần cứng mà nó sử dụng để đào tạo nó, có thể được sử dụng để tạo lại mô hình, trích dẫn “bối cảnh cạnh tranh”.
Mô hình ngôn ngữ lớn GPT của OpenAI hỗ trợ nhiều bản trình diễn trí tuệ nhân tạo đã làm kinh ngạc mọi người trong ngành công nghệ trong sáu tháng qua, bao gồm trò chuyện AI của Bing và ChatGPT và phiên bản mới nhất là bản xem trước của những tiến bộ mới có thể bắt đầu lọc xuống các sản phẩm tiêu dùng như chatbot trong những tuần tới. Microsoft cho biết chatbot AI của Bing sử dụng GPT-4 .
OpenAI cho biết mô hình mới sẽ tạo ra ít câu trả lời sai thực tế hơn, bớt đi chệch hướng và trò chuyện về các chủ đề bị cấm ít thường xuyên hơn và thậm chí hoạt động tốt hơn con người trong nhiều bài kiểm tra tiêu chuẩn.
OpenAI cho biết GPT-4 đã thực hiện ở phân vị thứ 90 trong bài kiểm tra thanh mô phỏng, phân vị thứ 93 trong bài kiểm tra đọc SAT và phân vị thứ 89 trong bài kiểm tra Toán SAT.
Tuy nhiên, OpenAI cảnh báo rằng phần mềm mới vẫn chưa hoàn hảo và nó kém khả năng hơn con người trong nhiều tình huống. Công ty cho biết nó vẫn có một vấn đề lớn với ”ảo giác” hoặc bịa đặt và không thực sự đáng tin cậy. Nó vẫn có xu hướng khăng khăng rằng nó đúng khi nó sai.
“GPT-4 vẫn còn nhiều hạn chế đã biết mà chúng tôi đang nỗ lực giải quyết, chẳng hạn như thành kiến xã hội, ảo giác và lời nhắc đối nghịch,” công ty cho biết trong một bài đăng trên blog.
“Trong một cuộc trò chuyện thông thường, sự khác biệt giữa GPT-3.5 và GPT-4 có thể rất khó nhận biết. Sự khác biệt xuất hiện khi độ phức tạp của tác vụ đạt đến một ngưỡng đủ—GPT-4 đáng tin cậy hơn, sáng tạo hơn và có thể xử lý nhiều hướng dẫn sắc thái hơn nhiều so với GPT-3.5,” OpenAI viết trong một bài đăng trên blog.
Mô hình mới sẽ có sẵn cho những người đăng ký ChatGPT trả phí và cũng sẽ có sẵn như một phần của API cho phép các lập trình viên tích hợp AI vào ứng dụng của họ. OpenAI sẽ tính phí khoảng 3 xu cho khoảng 750 từ gợi ý và 6 xu cho khoảng 750 từ phản hồi.
THEO CNBC