ChatGPT успешно прошел один из важных тестов

Новое исследование кафедры когнитивных наук Калифорнийского университета в Сан-Диего знаменует собой важную веху в области искусственного интеллекта: модель GPT-4.5 от OpenAI достигла превосходных результатов в тесте Тьюринга, используя подход взаимодействия, основанный на "личности".
Как передает Day.Az со ссылкой The Verge, это считается наиболее похожей на человека системой ведения диалога на основе искусственного интеллекта, открывающей множество потенциальных возможностей применения в области социального интеллекта.
OpenAI позиционирует GPT-4.5 как "важный шаг вперед в масштабировании предварительного и последующего обучения". Это самая крупная модель, когда-либо разработанная OpenAI, ее размер и вычислительная мощность превосходят предыдущие версии.
Согласно официальному сообщению в блоге OpenAI от 27 февраля, GPT-4.5 начал распространяться среди пользователей ChatGPT Pro в день своего анонса.
В ходе эксперимента на тему "может ли ИИ обмануть людей" сравнивались четыре репрезентативные системы искусственного интеллекта: чат-бот ELIZA 1960-х годов, LLaMa-3.1-405B от Meta AI, а также GPT-4o и GPT-4.5 от OpenAI. Команда разработала два независимых теста, в каждом из которых приняли участие 250 человек, что в общей сложности составило 500 человек с таких онлайн-платформ, как Prolific. Участники были разного возраста, пола и уровня образования, чтобы обеспечить разнообразие выборки.
Тест использует традиционный формат Тьюринга: каждый участник общается через текстовый интерфейс с двумя испытуемыми (один человек, один искусственный интеллект) в течение 5 минут, а затем оценивает, кто из них является человеком.
Результаты оказались неожиданными: GPT-4.5 прошел "тест Тьюринга" с показателем до 73 проц, что превзошло средний показатель для человека (60-70 проц). Это первый случай, когда модель ИИ действительно "прошла" стандартный тест Тьюринга. Между тем, результаты GPT-4o немного ниже, LLaMa-3.1-405B в некоторых контекстах приближается к человеческим показателям или достигает их, а ELIZA значительно отстает.
Отличительной чертой GPT-4.5 является не только беглость речи, но и способность выражать эмоции и подстраивать свои ответы под нюансы общения собеседника. Многие участники описали его как "дружелюбный" и "аутентичный".
В частности, когда пользователи выглядят растерянными или напряженными, GPT-4.5 может давать юмористические или успокаивающие ответы, заставляя многих поверить, что они общаются с реальным человеком.
Прорыв GPT-4.5 может открыть широкий спектр практических приложений: от виртуальных репетиторов до психологической поддержки и обслуживания клиентов. Однако по мере того, как ИИ будет становиться все более похожим на человека, различение реального и виртуального, а также контроль за использованием этой технологии станут ключевой общественной проблемой.
Заметили ошибку в тексте? Выберите текст и сообщите нам, нажав Ctrl + Enter на клавиатуре