Тепер ChatGPT розпізнає зображення та голос

Останнє оновлення ChatGPT багато в чому вдосконалило роботу бота, зокрема розширилася кількість питань, на які він може відповідати, збільшився доступ до інформації, а також покращилися базові моделі.

Та найцікавіші нововведення стосуються саме способу використання інструменту. Тепер з ChatGPT можна спілкуватися за допомогою зображень і голосових повідомлень.

Схема роботи голосового чату знайома: затиснувши кнопку, користувач уголос ставить питання, а ChatGPT, у свою чергу, перетворює його на текст і завантажує в LLM (Large language model), отримує відповідь і озвучує її. Це має бути схожим на розмову з Alexa або Google Assistant, однак, як сподіваються в OpenAI, відповіді будуть кращими завдяки вдосконаленій базовій технології.

Нові функції з’являться у тих, хто заплатить за ChatGPT протягом наступних двох тижнів. Усі інші отримають їх «незабаром після цього», — повідомляє OpenAI.

Пишіть у коментарях, хто вже встиг затестувати? Які ваші враження?

👍ПодобаєтьсяСподобалось1
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Кортана померла (пішла до Хало)
Хай живе кортана

А якщо взяти 256 камертонів — кожен на свою ноту і якусь мелодію. І до камертонів підключити сенсори дрижання — то чи можна із тих сенсорів зняти електричну картину програвання мелодії?
А якщо голосом щось промовити над тими камертонами чи буде щось на екрані осцилографа?
А якщо взяти 256 микрофонів і настроїти їх кожен на свої звуки?
Чи є у звука як у екрана монітора якесь розрішеніє? Щоб можна було легко розпізнавати звуки різні і створювати бази даних цих звуків для легкого розпізнавання без усякого гугля? Чи чата гпт...

Більшість осцилографів мають фічу, яка називається перетворення Фур’є(math->FFT), що приблизно те, що ви описуєте, але не треба ні камертонів, ні сенсорів дрижання, лише мікрофон і якийсь підсилювач.
Взагалі мій старий телефон IPAQ робив розпізнавання голосу локально, тому я думаю що алгоритми існують, просто простіше гугл прикрутити з підтримкою усіх мов.

У меня еще не появилась кнопка микрофона

Підписатись на коментарі