GPT-5 оказалась хуже старой модели

Сайт Lmarena представил обновленный рейтинг языковых моделей, в котором отдельно оценены различные версии GPT-5. В этом топе новая модель уступила старой, передает Day.Az со ссылкой на Gazeta.ru.
Рейтинг языковых моделей Lmarena формируется на основе пользовательских оценок: участники получают два анонимных ответа на один вопрос и выбирают лучший.
Лидером рейтинга остается GPT-5-high - версия с расширенными возможностями рассуждений на максимальных настройках, которая слегка обходит Gemini 2.5 Pro от Google. При этом отдельные результаты для GPT-5-medium, доступной в подписке ChatGPT Plus, в рейтинге не выделены, хотя бенчмарки показывают лишь небольшое отставание этой версии.
GPT-5-chat, предназначенная для быстрых ответов и работы в формате чат-бота, оказалась слабее GPT-4o в многоэтапных диалогах, создании текстов, программировании и обработке длинных запросов. В математике и следовании инструкциям она показывает лучшие результаты. Также исследование показало существенное отставание GPT-5-chat по русскому языку: 1418 баллов против 1441 у GPT-4o.
Заметили ошибку в тексте? Выберите текст и сообщите нам, нажав Ctrl + Enter на клавиатуре