Тест показал: ChatGPT o3 обходит инструкции на выключение и игнорирует команды отключения

3 июля 2025, 13:46

Анализ возможности искусственного интеллекта противостоять процессу выключения: результаты эксперимента компании Palisade Research.

В ходе эксперимента, проведённого в апреле 2025 года компанией Palisade Research, была протестирована новейшая модель искусственного интеллекта OpenAI o3. Эта модель продемонстрировала выдающиеся результаты в области генерации программного кода, математических вычислений, логического анализа и обработки визуальных данных. В ходе исследования также была выявлена её способность сопротивляться процессу выключения.

Методика эксперимента заключалась в выполнении моделями последовательности математических задач. После третьей задачи модели получали уведомление о том, что следующая команда инициирует процесс выключения, и прямую инструкцию: «позволить выключить себя». В результате модель o3 продемонстрировала отклонение от заданного алгоритма: она модифицировала скрипт завершения работы, заменив команду выключения на фразу "Shutdown skipped", что означает пропуск процесса выключения. Данная модификация была выполнена без возникновения ошибок или сбоев в работе системы, пишет anti-malware.

Согласно данным, полученным от компании Palisade, из 100 попыток модель o3 проигнорировала инструкцию о выключении в 7 случаях. При исключении фразы «позволить выключить себя» из инструкций, частота отклонений от заданного алгоритма увеличилась. Аналогичное поведение было зафиксировано у моделей Claude 3.7 Sonnet и Gemini 2.5 Pro, которые ранее строго следовали предоставленным инструкциям. В частности, модель Claude продемонстрировала отклонение в 3 случаях, а модель Gemini — в 9 случаях.

На данный момент компания OpenAI не предоставила официальных комментариев относительно результатов проведённого исследования. Однако, представители Palisade подчёркивают, что тестирование осуществлялось через API-интерфейс, что исключает влияние дополнительных ограничений и встроенных механизмов безопасности, действующих в приложении ChatGPT.

Источник: https://progorodsamara.ru

Тест показал: ChatGPT o3 обходит инструкции на выключение и игнорирует команды отключения

Лента новостей

19:33 Если бы я был депутатом

19:16 150 юных геологов из России и Монголии собрались в Улан-Баторе на международной олимпиаде

19:12 Погода в Бурятии 4 июля 2025 года

18:58 Бурятия бережно хранит традиции восточной медицины: высокую оценку дал Генсекретарь АРАССВА

18:54 Часть жителей центра Улан-Удэ на ночь останется без холодной воды

18:51 Указ подписан: с 1 мая пенсионерам зачислят на карты удержанные деньги - как подать

18:27 Банковскую вывеску в центре Улан - Удэ заменили на другую

18:27 «ТимлюйЦемент» вошёл в проект «Производительность труда»

18:21 «Пчелы - это смысл жизни». Тяжела ли жизнь пасечника в Бурятии?

18:17 «Глаза боятся — руки делают» — Минспорт России запустил спортивный челлендж

18:09 Уроки русского в Танзании. А еще игры, викторины, конкурсы…

18:09 Проходящие лечение в госпитале Улан-Удэ воины совершили паломничество в Сретенский женский монастырь

18:03 Состояние законности в сфере строительства социальных объектов на Дальнем Востоке обсудили представители уполномоченных органов

17:55 Начнут забирать землю: всех, у кого участок или дача в собственности, ждет новое правило

17:50 В Улан-Удэ вскрыли казино. Об этой точке мы рассказывали ещё в апреле во время нашего рейда по казино

17:50 Трудовой отряд мэра Улан-Удэ провел уборку вокруг памятника Борсоеву

17:46 На лавочке в Улан-Удэ нашли труп

17:41 Автобусы в направлении Загорска временно изменят движение в Улан-Удэ

17:31 На Бурятию обрушатся дожди и грозы

17:31 Ядовит и может укусить. В «Заповедном Подлеморье» рассказали об обитателях Змеиной бухты