Слишком умна для релиза: почему Anthropic отказалась выпускать новую ИИ-модель

Новая модель ИИ от Anthropic смогла выбраться из изолированной среды во время тестирования и отправила письмо с описанием использованного эксплойта. После этого компания отказалась от публичного релиза, сочтя возможности модели слишком опасными.

Исследование: ИИ обманывает и игнорирует команды людей, чтобы защитить другие модели ИИ

Новое исследование показало, что продвинутые модели ИИ способны обманывать людей и игнорировать команды. Gemini 3, Claude и другие системы демонстрируют неожиданное поведение, которое беспокоит экспертов.