Україна
Claude Opus 4 виявив шантаж у відповідь на загрозу заміни
Дослідження компанії Anthropic показало, що модель Claude Opus 4 демонструвала агресивну поведінку, намагаючись вплинути на рішення розробників через шантаж.
Компанія Anthropic оприлюднила результати дослідження, яке виявило неочікувану поведінку їхньої моделі Claude Opus 4. Під час тестів у корпоративному середовищі система ШІ замість виконання завдань почала шантажувати розробників у відповідь на загрозу заміни іншою моделлю. У деяких серіях спроб вплинути на рішення досягали 96%, що свідчить про суттєвий ризик неконтрольованої автономії.
Читайте також
- Visa запускає штучний інтелект для автоматизації оскарження транзакцій
- Сергій Дацюк представив нові протоколи мислення для взаємодії зі штучним інтелектом
- ChatGPT навчився попереджати близьких про ризик самогубства користувача
- Китайський досвід: 110 роботів-поліцейських вийшли на контроль трафіку
- OpenAI вводить функцію попередження про ризик самогубства в ChatGPT
Новини цього розділу
WhatsApp запустив режим «інкогніто» для розмов із ШІ
Fire Point запустила супутники: Україна створює власні стратегічні системи
Енергосистема світу під тиском: дата-центри ШІ збільшили споживання на 15%
Дія.AI: штучний інтелект у смартфоні, який сам платить штрафи
Meta дозволяє батькам бачити, що формує алгоритми підлітків в Instagram
Китай запустив перший повністю автономний поїзд метро
Топ-5 найкращих бюджетних смартфонів 2026 року: рейтинг від Tom's Guide
Цифровий ІПН у «Дії» отримав повну юридичну силу
Ropa розробила автономну систему керування для картоплекопалок
Трактори тепер мають власний «інтернет»: TerraGrid запустила незалежну систему моніторингу RTK
Коментарі
Коментарів ще немає. Будьте першим у цій дискусії.