Як зараз роблять Python-інструменти з UI + AI (і де починаються проблеми)

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Останнім часом я багато працюю з Python-утилітами: парсинг сайтів, обробка даних, інтеграції з БД, автоматизація.

Раніше під такі задачі часто робили прості десктопні програми. Зараз ситуація змінилась — і головну роль почав відігравати AI. Я покажу на реальному прикладі.

Типова задача

Наприклад:

  • є список сайтів;
  • потрібно витягнути інформацію;
  • проаналізувати контент;
  • сформувати коротке резюме;
  • перевірити на «заборонені тематики».

Раніше це виглядало як:

  • парсер;
  • regex / rules;
  • багато ручної логіки.

Зараз — значно простіше:

👉 більшу частину роботи робить LLM

Як це виглядає на практиці

Я зробив просту GUI-тулзу:

  • вводиш до 10 сайтів;
  • вона:
    • парсить сторінки;
    • чистить текст;
    • відправляє в AI;
    • отримує summary + список послуг;
    • паралельно Python перевіряє banned-контент.

UI — звичайний (на базі Tkinter), але вся «розумна» частина — це AI.

Ключовий момент:

GEMINI_FALLBACK_MODELS = [
    "gemini-2.5-flash",
    "gemini-2.5-flash-lite",
    "gemini-2.0-flash",
    "gemini-1.5-flash",
]

Тобто навіть доводиться робити fallback по моделях.

Чому? 👇

Основна проблема — ліміти

Як тільки починаєш реально використовувати AI, вилітаєш в одну і ту ж стіну:

👉 Ліміти

У моєму коді навіть є окрема обробка:

if r.status_code == 429 and _is_daily_free_tier_quota(r.text):
raise RuntimeError(
«исчерпана дневная квота Free Tier...»
)

І це не теорія — це реальність.

Що відбувається на практиці

  • робиш 5–10 запитів → ок;
  • додаєш multi-page аналіз → вже багато токенів;
  • запускаєш кілька разів →
    👉 отримуєш 429 quota exceeded.

І все.

Чому це боляче

Бо логіка вже побудована навколо AI:

  • summary генерує LLM;
  • структура відповіді задається prompt-ом;
  • обробка сильно спрощена.

І коли ліміт закінчується:

👉 уся система стає непрацюючою

Як доводиться викручуватись

З практики:

  • fallback між моделями (як у мене);
  • retry з delay;
  • обмеження тексту (char budget);
  • кешування;
  • або просто чекати «завтра».

І ось головне питання

👉 Безкоштовні ліміти реально маленькі.

І це сильно впливає на архітектуру навіть простих тулзів.

Висновок

Сьогодні Python-інструменти змінилися:

  • UI — вже не головне (Tkinter / PySide — не критично);
  • головне — це AI-інтеграція.

Але разом із цим з’явилась нова проблема:

👉 Залежність від лімітів LLM.

Питання до спільноти

Я зараз використовую Gemini, але:

👉 Free-tier ліміти дуже швидко закінчуються.

Можливо, хтось уже тестував:

  • які LLM дають більші безкоштовні квоти?
  • або які сервіси краще підходять для таких задач?
  • можливо, є варіанти з більш стабільним free-tier?

Цікавий саме практичний досвід, а не теорія.

TL;DR

  • Python GUI зараз = другорядна частина;
  • AI = основна логіка;
  • головний bottleneck = ліміти LLM.
👍ПодобаєтьсяСподобалось0
До обраногоВ обраному0
LinkedIn
Ctrl + Enter
Ctrl + Enter

Тут або платна підписка, або власне «залізо» з LLM, або оптимізація того, що потрапляє в LLM, або перехід на алгоритмічну обробку.

Та сама проблема, єдиний вихід на мою думку це локальні Free моделі по типу тіє самої gpt-oss-20b або краще на більше параметрів якщо залізо дозволяє, по суті локалку можна налаштувати під будь які задачі, бо інакше так і виходить або платити або страждати)

Підписатись на коментарі