Нова модель від OpenAI може клонувати голос за 15 секунд

Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!

В OpenAI розробили платформу Voice Engine, яка може створювати синтетичний голос на основі 15-секундного фрагмента реального голосу. Доступ до неї наразі обмежений, адже компанія остерігається діпфейків.

Створений штучним інтелектом голос може зачитувати підказки за командою. Він робить це тією ж мовою, що і диктор, або кількома іншими.

Серед компаній, які отримали доступ, такі:

  • Age of Learning, що займається освітніми технологіями.
  • HeyGen — платформа візуального сторітелінгу.
  • Dimagi — розробник програмного забезпечення для охорони здоров’я.
  • Livox — творець комунікаційних застосунків зі штучним інтелектом.
  • Lifespan — система охорони здоров’я.

Загалом модель буде доступна лише близько 10 розробникам.

OpenAI заявила, що почала розробку Voice Engine наприкінці 2022 року. Технологія вже забезпечує попередньо встановлені голоси для API-перетворення тексту в мовлення та функції «Читання вголос» у ChatGPT.

Як кажуть розробники, модель Voice Engine навчалася на поєднанні ліцензійних і загальнодоступних даних.

Як думаєте, що могло входити до навчального датасету Voice Engine? І чи варто тепер користувачам хвилюватися про фейкові голосові повідомлення?

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Ще одна причина спілкуватися в месенджерах по-нормальному текстом, а не записувати голосові повідомлення.

Підписатись на коментарі