Як інтегрувати AI у бізнес: реальний кейс на базі Google Cloud — Document AI та Vertex AI

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Хоча штучний інтелект з’явився у світі відносно недавно, більшість людей та компаній досі використовують його переважно у формі запитань і відповідей у ChatGPT. Для багатьох саме це й асоціюється з поняттям «використання AI». Це підтверджують і дані McKinsey, згідно яким понад 75% бізнесів уже експериментують із AI, але майже 60% обмежуються застосуванням генеративних моделей для базових завдань — написання текстів, аналізу даних або роботи з кодом.

Тому ChatGPT — це лише один із численних AI-сервісів, створений для того, щоб відповідати на запитання, редагувати тексти та генерувати зображення. І цього вже достатньо, щоб здивувати будь-якого пересічного користувача.

Багато провідних компаній у світі почали створювати власні AI-моделі та продукти для їхнього практичного застосування. Це дало бізнесу можливість інтегрувати штучний інтелект у свої процеси та підвищувати ефективність роботи. Наприклад, за даними PwC, компанії, які інтегрували AI у ключові процеси, скорочують операційні витрати на 20–40% та підвищують продуктивність на 30%.

Запити компаній можуть бути різними. Комусь потрібен AI-чатбот, який відповідає клієнтам 24/7, покриває до 80% типових запитань і передає розмову оператору лише тоді, коли питання є надто специфічним. За статистикою IBM, бізнеси, які впровадили AI-чат ботів, скоротили навантаження на операторів до 70% і знизили час очікування клієнта на 90%. Для бізнесу це означає суттєве прискорення обслуговування та можливість оптимізувати витрати на службу підтримки.

Є фінансові компанії, яким потрібно періодично проводити верифікацію користувачів. Одразу зазначимо: повноцінний модуль верифікації — це складне технологічне рішення, але бізнес може впроваджувати окремі його частини. Наприклад, перевірку документів можна інтегрувати не лише у фінансових сервісах, а й у роботі реєстраторів доменних імен чи комунальних служб. Ринок KYC-рішень (Know Your Customer) досяг $12,4 млрд у 2024 році і, за прогнозами, зростатиме на 22% щорічно. Основні драйвери — регуляторні вимоги, боротьба з відмиванням коштів і шахрайством.

Зараз, якщо якась дія вимагає підтвердження документів, потрібно не просто завантажити файл, а й зчитати з нього інформацію та зберегти дані у профілі клієнта й базі компанії. Раніше для цього доводилося просити користувача вручну вводити всі дані та додатково завантажувати документ. Тепер цей процес можна автоматизувати: система сама витягує необхідну інформацію без додаткових запитів до клієнта. Технології OCR та AI-аналітики скорочують час перевірки документів із 5–10 хвилин до кількох секунд і зменшують кількість помилок на 80%, за даними Deloitte. Такий підхід особливо актуальний для фінансових установ і сервісів, де важлива швидкість і точність обробки даних.

Скріншот з офіційного сервісу Google Document AI: cloud.google.com/document-ai?hl=en

Далі розглянемо, як реалізувати подібне рішення на прикладі Google Cloud, використовуючи сервіси Vertex AI та Document AI. Це універсальний підхід, який можна адаптувати для компаній різних напрямків.

Розберемо покроково на прикладі Google Cloud: Vertex AI та Document AI

Нижче наведено глосарій, щоб краще зрозуміти призначення кожного сервісу:

Document AI API — використовується для автоматичного зчитування та розпізнавання даних із документів (ID, паспорти, рахунки). Дозволяє отримати структуровані дані у форматі JSON без ручного введення. Основне призначення — автоматизація KYC/KYB, обробки рахунків і верифікації документів.

Vertex AI API — призначений для створення, навчання та розгортання моделей штучного інтелекту. Дає змогу застосовувати ML для аналізу, скорингу, виявлення аномалій та прогнозування. Основна мета — реалізація кастомної AI-логіки: від антифрод-рішень до персоналізованих рекомендацій.

Інтеграція Document AI і Vertex AI у вашому проекті: крок за кроком

  1. Створіть Google Cloud Project

Якщо проект ще не створено, додайте його в Google Cloud, налаштуйте білінг та створіть Service Account із правами доступу до потрібних сервісів.

Посилання: cloud.google.com/document-ai

Увімкніть два основних сервіси:

  • Document AI API
  • Vertex AI API

Далі потрібно налаштувати сам Document AI, щоб система правильно зчитувала документи.

  • Створіть Processor типу ID Document Processor (підходить для обробки паспортів і водійських посвідчень).
  • Оберіть регіон, у якому ви працюєте (US або EU).
  • Після створення ви отримаєте Processor ID. Скопіюйте його — він знадобиться для виконання запитів через API.

Далі на вашому сайті може бути власний інтерфейс, куди користувачі завантажуватимуть документи. Формати можуть бути: JPEG, PNG, PDF.

Механіка роботи виглядає так:

  • Backend вашого сайту приймає файл від користувача.
  • Потім передає цей файл у Document AI API.
  • У тілі запиту файл передається у форматі Base64.

Приклад запиту:


  • POST https://documentai.googleapis.com/v1/projects/{project_id}/locations/{location}/processors/{processor_id}:process

Document AI обробляє ці дані та повертає у форматі JSON:

  1. OCR-текст (розпізнаний текст з документа)
  2. Структуровані дані: ім’я, прізвище, дата народження, номер документа, дата закінчення дії.

Приклад відповіді JSON від Document AI


  • + Entities:

  • ! First Name: John (confidence 0.99)

  • ! Last Name: Doe (confidence 0.98)

  • ! Date of Birth: 1990-01-01 (confidence 0.97)

  • ! Document Number: X1234567 (confidence 0.96)

  • ! Expiry Date: 2030-12-31 (confidence 0.95)

Що ми отримали у JSON?


  • # Ім’я: John (First Name)

  • # Прізвище: Doe (Last Name)

  • # Дата народження: 1990-01-01 (Date of Birth)

  • # Номер документа: X1234567 (Document No)

  • # Термін дії: 2030-12-31 (Expiry)

З отриманими даними вже можна працювати та додавати їх у базу даних. Наприклад, можна зберегти їх у профілі клієнта, щоб більше не просити його вводити цю інформацію. Але на цьому можна не зупинятися.

Скріншот з офіційного сервісу Google Document AI: cloud.google.com/document-ai?hl=en

Ми можемо додатково обробити ці дані та провести верифікацію. На практиці бувають випадки, коли AI не розпізнає певні елементи. Наприклад, у відповіді від Document AI може не бути прізвища, хоча воно присутнє у документі. Таке трапляється — іноді AI-моделі пропускають окремі поля.

Щоб уникнути ситуації, коли здається, що все виконано, але насправді дані відсутні, потрібно перевірити, чи всі ключові поля заповнені. Після отримання entities від Document AI (ім’я, прізвище, дата народження, номер документа, дата закінчення) переконуємося, що всі вони не порожні. Якщо система виявить відсутність значень, можна запустити повторне сканування документа та доповнити відсутні поля.


  • - required_fields = ["first_name", "last_name", "date_of_birth", "document_number"]

  • + for field in required_fields: 

  • ! if field not in extracted_data or not extracted_data[field]: 

  • # raise ValueError(f"Missing required field: {field}")

Або для вашого сервісу важливо, щоб користувачу було не менше 18 років. Інакше ви не можете надати доступ до сервісу.

Наприклад, можна перевірити дату народження (у форматі YYYY-MM-DD) та переконатися, що вік > 18 років (або інший встановлений поріг).


  • - from datetime import datetime

  • + dob = datetime.strptime(extracted_data["date_of_birth"], "%Y-%m-%d")

  • ! age = (datetime.now() - dob).days // 365

  • # if age < 18:

  • # raise ValueError("Client must be over 18.")

До цього етапу ви перевіряли переважно статичні дані, отримані за допомогою AI.

2) Використання Vertex AI

Але далі можна піти ще глибше й використати модуль Vertex AI, адже до цього ви працювали лише з Document AI для сканування та розпізнавання документів.

Скріншот з офіційного сервісу Vertex AI: cloud.google.com/...​ve-ai/docs/learn/overview

Наприклад, наступний крок — оцінка клієнта по параметрам. У вас можуть бути додаткові дані, такі як IP-адреси або країни, з яких ви не можете реєструвати користувачів через внутрішні політики або регуляторні обмеження.

Відправлення даних у Vertex AI для скорингу


  • - from google.cloud import aiplatform

  • + endpoint = aiplatform.Endpoint(endpoint_name="projects/your-project/locations/us-central1/endpoints/123456789")

  • ! response = endpoint.predict(instances=[{

  • ! "document_number": "X1234567",

  • ! "age": 32,

  • ! "country": "UK",

  • ! "upload_time": 2.5 }])

  • # print(response)

На цьому етапі Vertex AI уже має всі отримані дані від Document AI:

1. Дані з документа (Document AI Output)

  • Ім’я та прізвище (перевірка аномалій, дублювання акаунтів).
  • Дата народження (для вікових обмежень і ризик-профілю).
  • Номер документа (унікальність і шаблон).
  • Дата закінчення дії (перевірка актуальності).
  • Країна видачі (ризикові країни).

Але ви також надаєте інформацію яку ваша система збирає про клієнта. Нижче це обмежена кількість інформації. Її може бути набагато більше, або менше в залежності від потреб.

2. Метадані файлу

  • Час завантаження (підозрілий час, наприклад, ніч).
  • Формат файлу (JPEG, PNG, PDF).
  • Кількість спроб завантаження (ознака шахрайства).

3. Поведінкові дані користувача

  • Швидкість заповнення форми (занадто швидко → підозра на бота).
  • IP-адреса і геолокація (збіг із країною документа).
  • VPN або Proxy (ознака приховування).

Система Vertex AI Endpoint, яка розгортається як ML/AI-модель, аналізує дані та повертає прогноз (prediction). Це не захардкоджена логіка, а комбінація даних, алгоритму та статистичної моделі, яка формує результат на основі навчання.

Наприклад, відповідь може виглядати так: risk_score = 0.12.

Правила прийняття рішення:


  • Якщо risk_score < 0.2 → approve.

  • Якщо 0.2 ≤ risk_score < 0.5 → review.

  • Якщо risk_score ≥ 0.5 → reject.

Далі, залежно від налаштувань вашого сайту або застосунку, ви показуєте клієнту результат, а структуровані дані записуються в базу компанії (PostgreSQL, MySQL, Firestore або щось інше).

Також ви можете:

  • Змінювати статус клієнта у профілі.
  • Відправляти push- або email-повідомлення.

Це приклад того, як за допомогою однієї AI-моделі можна вирішувати бізнес-задачі та прискорювати процеси як для компанії, так і для клієнтів.

AI-моделі ще не охоплюють усі життєві сценарії, але з кожним місяцем з’являються нові рішення. Слідкуйте за оновленнями. Те, що доступне вже зараз, можна ефективно використовувати в роботі. Усе обмежується лише вашими потребами та креативністю.

Нижче наведено приклади AI-моделей та способів їх використання.

OpenAI (ChatGPT, GPT-4/4o)

  • ChatGPT API — інтеграція AI-чату в додатки (саппорт, автоматизація).
  • Assistants API — кастомні асистенти для бізнес-завдань.
  • Code Interpreter — аналіз даних і Python-скриптів (фінансова аналітика, дашборди).

Google Cloud AI (Vertex AI)

  • Document AI — парсинг документів (KYC, контракти, виписки).
  • AutoML — створення моделей без коду (скоринг, прогнози).
  • AI Hub — готові моделі (fraud detection, кредитний скоринг).

AWS AI Services

  • Textract — OCR з PDF (інвойси, фінансові документи).
  • Comprehend — аналіз тексту (відгуки, тональність).
  • SageMaker — навчання власних моделей (ризик-менеджмент, прогнози).

Microsoft Azure AI (Copilot)

  • Document Intelligence — розпізнавання форм і звітів.
  • Azure OpenAI Service — GPT у хмарі для корпоративних рішень.

Anthropic (Claude)

  • Claude API — чат, генерація текстів, аналіз даних (юридичні документи, комплаєнс).

Fireblocks

  • AI-аналітика — моніторинг транзакцій, AML, захист від fraud у крипто.

DocuSign AI

  • Intelligent Insights — аналіз контрактів і ризиків.

Salesforce Einstein AI

  • Einstein GPT — прогнозування продажів, автоматизація CRM.

Штучний інтелект перестав бути лише трендом і став реальним інструментом для оптимізації бізнесу. Від автоматизації верифікації клієнтів до прогнозування ризиків і персоналізації сервісів — AI відкриває компаніям можливості для економії часу, зниження витрат та підвищення точності. Приклади, як Google Cloud із сервісами Vertex AI та Document AI, показують, що впровадження подібних рішень більше не є прерогативою технологічних гігантів — воно доступне компаніям будь-якого масштабу й галузі. Головне — розпочати з чіткої стратегії та правильно підібраних інструментів.

Ігор Ніколаєв, Technical Product Lead в Fintech та AI

👍ПодобаєтьсяСподобалось0
До обраногоВ обраному2
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Підписатись на коментарі