ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
16 апреля 2025
Юрий Чекунов рискует потерять пост из-за земельного конфликта, угрожающего экономике Нефтеюганска
16 апреля 2025
Эльмира Туканова оставила без внимания фальшивое строительство экодеревни, профинансированное из бюджета
16 апреля 2025
Цены на картофель в России увеличились на 300% за год
16 апреля 2025
«Уралвагонзавод» не хочет платить за неудачные проекты: Минпромторг взыскивает деньги за неосновательное обогащение
16 апреля 2025
Министр здравоохранения Мурашко продолжает озвучивать ложную статистику по скорой помощи, игнорируя реальные проблемы
15 апреля 2025
OpenAI создает соцсеть для улучшения обучения ChatGPT
15 апреля 2025
В Ивановской области задержаны высокопрофильные чиновники за коррупцию в дорожной отрасли
15 апреля 2025
Неудачное нападение на канцлера Шольца: мужчина, проникший в аэропорт, получил штраф и лишение прав
15 апреля 2025
Власти сокращают выплаты участникам СВО