Тест Тьюринга устарел

3Конец эры Теста Тьюринга: исследователи признают его устаревшим для оценки искусственного интеллекта. Исследователи ИИ ищут новые методы оценки возможностей ИИ. Старые устарели.

Новости 2023 07 28

Тест Тьюринга, который когда-то служил одним из ключевых критериев оценки искусственного интеллекта, сегодня признается устаревшим. Вместе с ним отходит в прошлое и премия Лёбнера, которая также использовалась для определения уровня искусственного интеллекта. Чатбот ChatGPT смог пройти тест Тьюринга, вызвав обсуждение в научных кругах, но споры по поводу эффективности таких тестов продолжаются.

Основанный на идее обмануть человека и заставить его сомневаться, говорит ли он с машиной или с другим человеком, тест Тьюринга предполагает диалог, в котором судьи сталкиваются с непростой задачей определения, кто из собеседников искусственный интеллект. Однако на практике такой тест оказался слишком субъективным и несправедливым, поскольку легко обмануть судей, используя уловки или случайные ответы.

Следует отметить, что даже современные искусственные интеллекты, такие как GPT-4, не могут решать логические головоломки или обладать абстрактным мышлением. Они ограничиваются теми знаниями и данными, которые были использованы при их обучении, и не могут справиться с новыми ситуациями или логическими задачами, на которые не были нацелены.

Исследователи разделяются на два лагеря: одни считают, что ограничения алгоритмов связаны с их недостаточным пониманием и способностью рассуждать, в то время как другие не видят в этом проблемы и уверены в успешности существующих моделей. Однако ни одна из сторон не предоставила убедительных доказательств своей правоты.

Для улучшения оценки возможностей ИИ и его ограничений были предложены логические загадки, которые ставят перед системами новые задачи и проверяют их способность применять знания в новых сценариях. Это позволяет более точно определить, где лежат пределы искусственного интеллекта и как его применять в различных сферах.

Одной из таких инициатив стала онлайн-игра, созданная израильской компанией AI21 Labs, где пользователи должны определить, общаются ли они с человеком или с чат-ботом. Однако результаты игры показали, что определить ИИ от человека непросто, и часто люди ошибаются, относя некоторые ответы к искусственному интеллекту.

Эксперты предупреждают, что слишком большое внимание на таких тестах может привести к тому, что разработчики станут учить ИИ отдельным трюкам и обходным путям, а не развивать его осознанное понимание и способности. Поэтому оценка искусственного интеллекта должна быть всесторонней и основана на разнообразных критериях.

Тест Тьюринга и премия Лёбнера, несомненно, оставили свой след в истории развития искусственного интеллекта, но теперь необходимо обратиться к более объективным и применимым методам оценки, чтобы лучше понимать возможности и ограничения ИИ. Развитие логических моделей и других подходов к оценке позволит более точно определить, что на самом деле может и не может делать искусственный интеллект, и применять его в наиболее безопасных и эффективных областях.