Возможно, будущее уже наступило. Новое исследование поднимает тревожные вопросы о сравнении интеллекта ИИ и человека, поскольку современные модели смогли пройти «жутковатый» тест, который ранее казалось пройти нереально. Об этом сообщает UniladTech.
Разделение человека и машины всегда воспринималось как тема, характерная для футуристической научной фантастики. Однако опасения, высказанные в таких фильмах, как «Терминатор» и «Бегущий по лезвию», могут оказаться более актуальными, чем мы предполагали.
Если вы еще не знакомы с тестом Тьюринга, изначально названным «Игрой в имитацию», он был разработан Аланом Тьюрингом в 1950 году для проверки способности машины вести беседу так, чтобы ее нельзя было отличить от человеческой.
Многие воспринимают этот тест как мерило интеллекта, и создание модели ИИ, которая стабильно проходит его, может стать важным шагом к достижению искусственного общего интеллекта (AGI).
Хотя эксперты в этой области предсказывали, что до этого момента пройдет как минимум несколько лет, новое исследование, опубликованное в arXiv учеными из Калифорнийского университета в Сан-Диего, показывает, что современные технологии уже достигли этого уровня.
Как сообщает New York Post, в исследовании утверждается, что модель OpenAI GPT-4.5 прекрасно справляется с тестом Тьюринга, в котором участник одновременно общается с реальным человеком и моделью ИИ и должен определить, кто есть кто.
«Участники вели 5-минутные беседы с другим человеком и одной из этих систем, прежде чем решить, кто из собеседников, по их мнению, был человеком. Когда GPT-4.5 попросили принять человеческий облик, его сочли человеком в 73% случаев, что значительно превышает выбор реального человека-участника».
GPT-4.5 показала наилучшие результаты среди протестированных моделей, в то время как другие ИИ, такие как Meta LLaMa-3.1-405B (56%), ранняя программа обработки естественного языка ELIZA (23%) и GPT-4o (21%), оказались менее убедительными.
Интересно, что разница в показателях успешности между GPT-4.5 и LLaMa-3.1-405B была значительной, когда их не просили взаимодействовать с человеком. LLaMa снизилась до «частоты побед» в 47,1%, в то время как GPT-4.5 показала снижение с 73% до 42,1% без человеческого персонажа, что свидетельствует о том, как хорошо он может воспроизводить человеческую речь и поведение, когда это требуется.
Обсуждая последствия этого открытия, соавтор статьи Кэмерон Джонс отметил в соцсети:
«Что еще более важно, я думаю, что результаты показывают, что языковые модели могут заменять людей в коротких диалогах, и никто не заметит разницы. Это может привести к автоматизации рабочих мест, более эффективным атакам с использованием социальной инженерии и значительным социальным изменениям».
Источник: esoreiter.ru