Україна
Xiaomi представила універсальну модель клонування голосу OmniVoice для 646 мов
Китайський гігант Xiaomi відкрив доступ до нової штучної інтелектуальної системи OmniVoice, здатної клонувати голоси та перекладати їх на 646 мов світу, включаючи рідкісні діалекти.
Компанія Xiaomi офіційно запустила модель штучного інтелекту OmniVoice, яка дозволяє клонувати голоси та перекладати їх на 646 мов світу. Унікальність розробки полягає у підтримці найрідкісніших мов, для яких традиційно майже не існує навчальних даних, що робить технологію безпрецедентною для глобальної локалізації контенту.
В основі системи лежить 580 тисяч годин аудіозаписів, зібраних з 50 відкритих наборів даних різними мовами. Для забезпечення коректної вимови складних слів та фраз модель використовує великі мовні моделі за принципом, схожим на роботу ChatGPT. Це дозволяє досягти високої природності звучання навіть при роботі з екзотичними діалектами.
Ключовою функцією OmniVoice є клонування голосу з будь-якого короткого зразка. Користувачеві достатньо записати голос людини, і система відтворить його іншою мовою, зберігаючи інтонацію та тембр. Окрім цього, інструмент дозволяє описати бажаний голос текстом, наприклад, «чоловік середнього віку з низьким голосом», і отримати синтезований результат.
Технологія також підтримує додавання емоційних відтінків, таких як сміх, зітхання або шепіт, що робить синтез більш живим. Додатково вбудовані функції виправлення неправильної вимови та очищення фонових шумів перетворюють OmniVoice на потужний інструмент не лише для генерації, а й для професійного редагування аудіо.
Код моделі, навчальні дані та готові ваги вже розміщені у відкритому доступі на платформах GitHub та Hugging Face. Будь-хто може протестувати демоверсію без встановлення додаткового програмного забезпечення, що відкриває широкі можливості для розробників та контент-мейкерів по всьому світу.
Читайте також
- Perplexity відкрила доступ до свого ШІ-асистента Personal Computer для всіх користувачів Mac
- Anthropic навчила ШІ-агентів «бачити сни»: що це означає для розробників
- Xiaomi розпочала тестування Android 17: які смартфони отримають оновлення до HyperOS 3.3
- 58% українських програмістів щодня використовують ШІ для кодування: результати дослідження
- Airbnb: ШІ генерує 60% нового коду, але чат-боти ще не готові до бронювань
Новини цього розділу
WhatsApp запустив режим «інкогніто» для розмов із ШІ
Fire Point запустила супутники: Україна створює власні стратегічні системи
Енергосистема світу під тиском: дата-центри ШІ збільшили споживання на 15%
Дія.AI: штучний інтелект у смартфоні, який сам платить штрафи
Meta дозволяє батькам бачити, що формує алгоритми підлітків в Instagram
Китай запустив перший повністю автономний поїзд метро
Топ-5 найкращих бюджетних смартфонів 2026 року: рейтинг від Tom's Guide
Цифровий ІПН у «Дії» отримав повну юридичну силу
Ropa розробила автономну систему керування для картоплекопалок
Трактори тепер мають власний «інтернет»: TerraGrid запустила незалежну систему моніторингу RTK
Коментарі
Коментарів ще немає. Будьте першим у цій дискусії.