VoiceOps: Розмовний AI-агент для SRE та Kubernetes

💡 Усі статті, обговорення, новини про DevOps — в одному місці. Приєднуйтесь до DevOps спільноти!

VoiceOps — це експериментальний відкритий голосовий AI-агент, створений спеціально для тих, хто працює з Kubernetes і SRE-процесами. Уявіть, що ви можете керувати кластером, ставити запитання про його стан чи навіть виправляти проблеми — просто розмовляючи.

Зібраний на базі LiveKit, OpenAI та Model Context Protocol (MCP), VoiceOps допомагає контролювати інфраструктуру, спостерігати за метриками й реагувати на інциденти, не відриваючись від розмови. Говоріть з кластером, як із колегою.

github.com/...​-vasyliev/voice-mcp-agent

Як це працює

VoiceOps поєднує наступні технології:

  • LiveKit для реального часу та низької затримки голосового зв’язку.
  • OpenAI GPT-4o для розуміння природної мови та логіки.
  • ElevenLabs для якісного синтезу мови.
  • MCP (Model Context Protocol) для безпечної інтеграції з Kubernetes та іншими бекендами.

LiveKit, OpenAI MCP

Агент слухає ваш голос, розпізнає мову, аналізує наміри та безпечно виконує дії через MCP.

Він підтверджує ризиковані операції, підсумовує довгі відповіді, допомагаючи:

  • Запитувати стан кластера: «Покажи всі поди у namespace dev.»
  • Діагностувати проблеми: «Опиши pod my-app-123 у production.»
  • Масштабувати навантаження: «Збільши deployment web до 5 реплік.»
  • Отримувати логи та події: «Покажи логи з job backup-job.»
  • І багато іншого — голосом!

Зараз я працюю над тестуванням, метриками, аутентифікацією та замірами часу реального кейса і згодом продемонструю результати.

Як почати

  1. Клонуйте репозиторій та дотримуйтесь інструкцій Quick Start у README.
  2. Налаштуйте MCP-сервери (Kubernetes, GitHub тощо) у mcp_servers.yaml.
  3. Запустіть агента та почніть спілкування з кластером!

Дивитись демо на YouTube

Безпека та розширюваність

  • Список інструментів: Обмежуйте доступні інструменти для кожного сервера, підтримується wildcard.
  • Розумні значення за замовчуванням: Агент ніколи не залишає обов’язкові поля порожніми.
  • Підтвердження ризикованих дій: Жодних випадкових видалень.
  • Модульність: Легко додавати нові MCP-інструменти чи підключати нові бекенди.

Дізнатись більше

Подяка

VoiceOps створено у дусі Vibe Coding — коли людська креативність, співпраця та особиста пристрасть поєднуються з AI для створення чогось неймовірного. Дякую open source спільноті, LiveKit, OpenAI, ElevenLabs та Model Context Protocol за натхнення.

Готові поговорити з вашим кластером?

👍ПодобаєтьсяСподобалось2
До обраногоВ обраному3
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

можна додати що speech2text вже існував в локальних версіях (з відповідною лімітацією у порівнянні з клауд варіантами з їх більш широкими можливостями інтеграції), але то також вже надавало додаткові можливості для роботи з софтом навіть ще до появи cloud аі-services

дякую, а можна посилання?

з останнього що бачив по інтеграції в лінуксах, то було в whatsnew з недавнього реліза fedora — щось приблизно звідси fedoraproject.org/...​anges/ibus-speech-to-text

якщо в цілому speech2text — то конкретні ліби/api/bindings треба дивитись напевно в залежності від мови програмування

ага, дякую за ідею, знайшов нативний mac stt. Треба подивитися адаптації та врапери. Але слід додати openai stt доволі швидкий і поки норм в бюджеті.

думаю що з клауд ai — як і voice recognition так і інтеграція — значно кращі ніж те що зараз є для локального софта, але і локальний speech2text теж цікава опція

Підписатись на коментарі