Україна
Дослідник OpenAI закликає до незалежного аудиту ШІ-моделей
Дослідник OpenAI Бенджамін Арнав пропонує запровадити незалежний аудит ШІ-моделей і стандартизовані оцінки для підвищення прозорості та безпеки.
Дослідник OpenAI Бенджамін Арнав закликає спільноту штучного інтелекту переглянути методи оцінки моделей через їхню відсутність прозорості. Згідно з його заявами, нинішня система тестів є ненадійною, оскільки показники прогресу часто створюються за різними умовами і вводять у оману розробників та користувачів. Непослідовні методології ускладнюють порівняння рішень між різними компаніями, що впливає на безпеку та розгортання технологій.
Арнав наводить приклад бенчмарку SWE-bench Verified, де різні версії моделей тестувалися з різною кількістю завдань та інструментів. Компанії, такі як Anthropic та OpenAI, змінювали параметри випробувань майже з кожним релізом, що робить результати несумісними. Наприклад, Google спочатку обмежував інформацію про Gemini 2.5, тоді як інші гравці не завжди розкривали деталі оцінювання.
Вчений порівнює ситуацію з іншими галузями, де функцію вимірювання передали незалежним аудиторам. Він пропонує запровадити аналогічну практику для ШІ, коли компанії надавали б свої системи для стандартизованого тестування стороннім організаціям. Це дозволить публікувати результати одночасно з релізами та підвищити довіру до технологій.
Як альтернативу повній незалежності Арнав розглядає узгодження спільних стандартів для відкритих бенчмарків. Це дозволить хоча б частково зменшити розрив між заявленими результатами різних моделей. Дослідник підкреслює, що без стандартизованих оцінок неможливо забезпечити належний рівень безпеки та обґрунтованих рішень щодо впровадження ШІ в суспільство.
Читайте також
- OpenAI впровадила функцію «Довірена особа» для безпеки користувачів ChatGPT
- ШІ здатні самостійно зламати системи та створювати копії себе без участі людини
- OpenAI впроваджує функцію Trusted Contact для попередження про суїцидальні думки в ChatGPT
- ChatGPT тепер попереджатиме близьких про суїцидальні думки користувача
- OpenAI запустив у ChatGPT функцію «Довірена особа» для захисту користувачів
Новини цього розділу
WhatsApp запустив режим «інкогніто» для розмов із ШІ
Fire Point запустила супутники: Україна створює власні стратегічні системи
Енергосистема світу під тиском: дата-центри ШІ збільшили споживання на 15%
Дія.AI: штучний інтелект у смартфоні, який сам платить штрафи
Meta дозволяє батькам бачити, що формує алгоритми підлітків в Instagram
Китай запустив перший повністю автономний поїзд метро
Топ-5 найкращих бюджетних смартфонів 2026 року: рейтинг від Tom's Guide
Цифровий ІПН у «Дії» отримав повну юридичну силу
Ropa розробила автономну систему керування для картоплекопалок
Трактори тепер мають власний «інтернет»: TerraGrid запустила незалежну систему моніторингу RTK
Коментарі
Коментарів ще немає. Будьте першим у цій дискусії.