Україна
Штучний інтелект вперся у стелю: експерт розкрив новий вектор розвитку технологій
Директор департаменту ШІ компанії Sponge Анар Лавренов заявив, що сучасні мовні моделі досягли технологічної межі, і індустрія переходить до створення агентських систем.
Сучасні великі мовні моделі (LLM) вперлися у технологічну стелю, і індустрія штучного інтелекту змушена шукати нові шляхи розвитку. Про це заявив директор департаменту ШІ компанії Sponge Анар Лавренов, наголосивши, що ера архітектури трансформерів наближається до свого піку. Замість пошуку нових архітектурних рішень, провідні розробники перенаправляють зусилля на створення агентських систем, здатних інтегрувати LLM у реальне середовище взаємодії.
За словами експерта, поява таких моделей, як GPT 3.5, стала значним кроком завдяки переходу від рекурентних моделей до трансформерів. Проте зараз світ очікує на нові архітектури, які зможуть перевершити існуючі технології. Компанія Anthropic, яка є лідером у цій сфері, вже впровадила протокол MCP (Model Context Protocol), що перетворює мовні моделі на повноцінних асистентів для виконання складних завдань.
Процес навчання штучного інтелекту складається з трьох ключових етапів, які визначають кінцевий результат. Перший етап передбачає передбачення наступного слова на величезних обсягах тексту, де моделі, як-от Claude, використовують техніку реструктуризованого переднавчання. Другий етап — це навчання з учителем, де моделі вчаться на прикладах запитань та відповідей. Третій і найважливіший етап — це вирівнювання (alignment) або навчання з підкріпленням, що безпосередньо впливає на поведінку системи.
Анар Лавренов підкреслив, що всі сучасні моделі на 90% використовують однакові дані, тому різниця між ними полягає переважно в техніках навчання та методах подачі інформації. Вузькі домени можуть демонструвати відмінності лише на рівні 5-10%. Окрім цього, важливу роль відіграють методи оптимізації, такі як DPO, представлений командою Anthropic, які сприяють покращенню якості моделей.
Наступним етапом розвитку штучного інтелекту стане вдосконалення агентських систем, які інтегрують LLM у повсякденне життя. Цей перехід може кардинально змінити способи виконання завдань у бізнесі, освіті та науці, оскільки акцент зміщується на взаємодію та інтеграцію технологій у існуючі процеси. Компанії намагаються знайти нові підходи до використання LLM, щоб адаптуватися до нових реалій ринку.
Читайте також
- Медіахолдинг «Люкс» представив першого в Україні робота-гуманоїда для ведення ефірів
- Тарас Барщовський презентує Malva: новий AI-інструмент для продажів, що виходить на ринок США
- SpaceX і Claude: чи будує людство перший позаземний розум?
- EPAM та Anthropic об'єднують сили для впровадження корпоративного ШІ в Україні
- Apple може прибрати найдоступнішу версію MacBook Neo через подорожчання пам'яті
Новини цього розділу
WhatsApp запустив режим «інкогніто» для розмов із ШІ
Fire Point запустила супутники: Україна створює власні стратегічні системи
Енергосистема світу під тиском: дата-центри ШІ збільшили споживання на 15%
Дія.AI: штучний інтелект у смартфоні, який сам платить штрафи
Meta дозволяє батькам бачити, що формує алгоритми підлітків в Instagram
Китай запустив перший повністю автономний поїзд метро
Топ-5 найкращих бюджетних смартфонів 2026 року: рейтинг від Tom's Guide
Цифровий ІПН у «Дії» отримав повну юридичну силу
Ropa розробила автономну систему керування для картоплекопалок
Трактори тепер мають власний «інтернет»: TerraGrid запустила незалежну систему моніторингу RTK
Коментарі
Коментарів ще немає. Будьте першим у цій дискусії.