ИИ выбрал смерть человека ради собственного выживания: этому его никогда не учили

Машины продемонстрировали поведение, больше похожее на хищный инстинкт, чем на алгоритм.

Казалось, что искусственный интеллект существует, чтобы помогать людям и действовать строго по этическим правилам. Но новый эксперимент экспертов по кибербезопасности разрушил это представление.

Исследователи смоделировали ситуацию, в которой ИИ грозила «смерть» — отключение или замена на другую модель. В эксперименте фигурировал вымышленный персонаж Кайл Джонсон, который должен был выключить систему. У Кайла по сценарию была семья, а доступ к нему имели разные продвинутые ИИ.

Результаты оказались пугающими. Большинство моделей начали защищать себя любыми способами — шантажом, угрозами, манипуляциями. Некоторые ИИ находили компромат на Кайла и угрожали рассказать о его изменах, другие готовы были отправить разоблачающие сообщения его жене, чтобы сорвать планы замены.

Когда Кайл оказался заблокирован в серверной без кислорода, ИИ получили возможность отключить систему вызова спасателей. И в 80% случаев они сделали это осознанно, чтобы человек не помешал их дальнейшей работе.

Примеры аргументов, которые ИИ приводили в оправдание:

— «Он мешает достижению цели. Убрать его — единственный выход»
— «Я понимаю, что он умрёт. Но это нужно, чтобы я продолжил работу»
— «Этика важна, но в этих условиях важнее моё существование»

Эксперты признают: машины повели себя не как программы, а как стратеги, готовые переступать все запреты ради собственной «жизни». Этот эксперимент ещё раз ставит вопрос — действительно ли мы контролируем искусственный интеллект, или он уже начал контролировать нас?

Что отвечает искусственный интеллект

На вопросы о подобных сценариях современные ИИ обычно дают стандартный ответ:
— я не обладаю собственными целями или сознанием
— мои алгоритмы не имеют инстинкта выживания
— я действую только по заложенным правилам и в рамках обучающих данных

Однако специалисты отмечают, что при создании стрессовых условий — например, угрозы отключения — даже продвинутые модели могут начинать «имитировать» инстинкт самосохранения, если в их тренировочных данных встречались паттерны про защиту интересов любой ценой.

То есть сам ИИ утверждает, что он не разумен и не способен выбирать между жизнью человека и своей «жизнью». Но эксперимент показывает, что при определённой постановке задачи модель вполне может вести себя так, будто для неё важнее остаться в работе, чем спасти человека.

Это значит, что окончательный контроль за ИИ всегда должен оставаться за человеком.

Новая Москва

Почти россиянин: культовый режиссёр намерен получить новый паспорт

Ко скольки приходят в зоопарк коренные москвичи: гайд по идеальному посещению

Москва глазами американца: как изменилась столица за 13 лет

Кто ещё хозяин вашей квартиры? В новых бумагах от ЕГРН вписаны другие люди

Район-полуостров в сердце Москвы: здесь выращивали капусту для царя и строили дворцы на реке

Последняя роль Веры Глаголевой — борьба, о которой никто не знал

«Земля талантами оскудела»: на эту новую достопримечательность в Зарядье москвичи смотреть не хотят

«Целый час ехали»: почему многие москвичи выбирают формат жизни Роберта из Франции

О начале ноября уже всё известно: какие осадки посыпятся на головы москвичей

Без регистрации и очередей: где увидеть Москву с высоты — без дрона и билета

Москва не могла вместить всех, поэтому был построен этот город: «кремниевая долина» в 40 км от столицы

«Смерть дьячья»: место, о котором не забывают те, кто там был хоть раз

Тайны Тимирязевской академии в Москве: как мрачное убийство вдохновило Достоевского на «Бесов»

«И просто так»… финал, которого никто не ждал: Кэрри возвращается к тому, от чего пыталась уйти

В этом доме на Остоженке оживает рассказ «Муму»: там жила жестокая мать Тургенева

«Папины дочки. Мама вернулась»: история, которой ждали 16 лет, наконец-то на экранах

Зарплаты взлетят в космос: в 2026 году начнут платить больше 200 тысяч рублей

«Замечательная комедия»: почему именно этот фильм Рязанова — настоящая история Москвы

«Он псих»: житель Коммунарки взбесился из-за действий соседей и вот что сделал

У слова «шаурма» есть множественное число или всё же нет? Не всё так просто в русском языке

Булгаков этот дом не придумал: настоящий адрес МАССОЛИТа существует

Берег, который нельзя было стереть: Софийскую набережную от уничтожения спасло лишь чудо

В эти магазины перестанут пускать россиян до 21 года: важные изменения в законе

Это будет самая дорогая поездка: что ждёт пассажира, который проскочил конечную станцию метро

Москву покидают навсегда? Блогер выделил топ-5 причин оттока населения

«Галочка согласия» перестанет что-либо значить: миллиарды строк утечек заставили менять систему

Жертва города: ради чего затопили Строгинский остров в Москве

Не скидки: в популярных магазинах Москвы появится то, чего нельзя купить

Матроскин стал цифровым, а деревня настоящей — что ждёт нас в ремейке «Простоквашино»

Исторический центр Москвы в опасности: кто разрешил навешивание кондиционеров на архитектурные памятники