GPT-4 là bản phát hành bí mật nhất mà OpenAI từng đưa ra, đánh dấu quá trình chuyển đổi hoàn toàn từ phòng thí nghiệm nghiên cứu phi lợi nhuận sang công ty công nghệ vì lợi nhuận.
Cạnh tranh trong ngành là một trong những lý do mà công ty không thể nói nhiều về sản phẩm mới, theo Ilya Sutskever, nhà khoa học trưởng của OpenAI nói với MIT Technology Review.
Khả năng xử lý mạnh hơn ChatGPT
GPT-4 là mô hình ngôn ngữ lớn đa phương thức, có khả năng phản hồi khi được cung cấp đầu vào là cả văn bản và hình ảnh. Ví dụ, người dùng có thể đưa cho AI một bức ảnh chụp những thực phẩm trong tủ lạnh và hỏi nên làm món gì, và GPT-4 sẽ đưa ra các công thức sử dụng các nguyên liệu trong hình.
"Nếu bạn cho nó xem meme, nó có thể giải thích tại sao hình ảnh này lại buồn cười", Sutskever nói.
Hiện chỉ có những người dùng đã đăng ký vào danh sách chờ và những người đăng ký ChatGPT Plus có quyền truy cập vào GPT-4, tuy nhiên chỉ là phiên bản xử lý văn bản, không xử lý hình ảnh.
“Mô hình đa phương thức là mục tiêu của nhiều phòng thí nghiệm công nghệ lớn trong vài năm qua. Nhưng công nghệ này vẫn còn xa tầm với của nhiều bên", Thomas Wolf, đồng sáng lập của Hugging Face, công ty khởi nghiệp AI đã phát triển mô hình ngôn ngữ lớn nguồn mở BLOOM.
Wolf cho biết việc kết hợp văn bản và hình ảnh có thể cho phép các mô hình đa phương thức hiểu thế giới tốt hơn và khắc phục những điểm yếu truyền thống của các mô hình ngôn ngữ, chẳng hạn như khi lập luận về các vấn đề liên quan đến không gian.
Chưa rõ điều này có đúng với GPT-4 hay không, nhưng mô hình này có kết quả vượt trội so với ChatGPT trong các bài kiểm tra vào đoàn luật sư Mỹ và Olympic Sinh học.
Theo OpenAI, GPT-4 hoạt động tốt hơn ChatGPT, dựa trên GPT-3 và GPT-3.5, vì đây là mô hình lớn hơn với nhiều tham số hơn. Cách phát triển mô hình này tuân theo một xu hướng mà công ty đã phát hiện ra với các thế hệ trước. GPT-3 vượt trội so với GPT-2 vì nó lớn hơn 100 lần, với 175 tỷ tham số so với 1,5 tỷ của GPT-2.
Bí mật của siêu AI
Nhưng OpenAI không tiết lộ hay mô tả bất kỳ chi tiết nào về độ lớn của GPT-4. Khác với các bản phát hành trước đây, công ty cũng không tiết lộ gì về cách GPT-4 được tạo ra, chẳng hạn như từ những dữ liệu nào, kỹ thuật đào tạo là gì hay có bao nhiêu sức mạnh tính toán.
“OpenAI hiện là một công ty hoàn toàn khép kín với hoạt động truyền thông khoa học giống như thông cáo báo chí về sản phẩm", Wolf nói.
OpenAI cho biết họ đã dành 6 tháng để làm cho GPT-4 an toàn hơn và chính xác hơn. Khả năng AI này phản hồi các yêu cầu không hợp lệ, chẳng hạn như bạo lực hoặc khiêu dâm, thấp hơn 82% so với ChatGPT và khả năng bịa đặt thông tin thấp hơn 60%.
Sasha Luccioni, nhà khoa học tại Hugging Face, nói với Nature rằng các mô hình như GPT-4, làm nhiệm vụ dự đoán từ tiếp theo trong câu, không thể hoàn toàn tránh khỏi vấn đề bịa đặt thông tin hay còn gọi là "ảo giác".
Không có quyền truy cập vào dữ liệu được sử dụng để đào tạo AI, chuyên gia này cho biết không bị thuyết phục bởi những tuyên bố từ OpenAI. Luccioni giải thích rằng nếu không thể biết GPT-4 được xây dựng như thế nào, thì không thể biết được sự thiên vị có thể bắt nguồn từ đâu hoặc có thể làm gì để khắc phục.