YouTube та АІ: генеруємо епічні відео та заробляємо гроші

Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!

Пів року тому я написав статтю «Чи може розробник вмить стати художником», де намагався на практиці дізнатися чи справді художники та інші творчі люди панікують небезпідставно. На той момент я зробив висновок, що нейромережі ще не готові конкурувати з живими людьми. Проте штучний інтелект розвивається вкрай стрімко, тож всього за пів року моя думка кардинально змінилася.

У цій статті я розповім, як почав використовувати штучний інтелект для створення YouTube-каналу з нуля та контенту для нього, скільки часу / сил / грошей це потребує, які є проміжні результати і які глобальні плани на майбутнє. Якщо вас також зацікавить ця ідея — після цієї статті ви зможете самостійно спробувати реалізувати власні задуми.

Стаття поділена на дві частини: у першій я розповім основні технічні моменти та свій шлях й еволюцію моїх відео. У другій дам поради щодо того, як краще підходити до створення та масштабування власного YouTube-каналу, на що звертати увагу у першу чергу, які фактори успіху ключові, а які — другорядні.

Cassandra Tales — YouTube-канал автора статті

Практичні деталі використання АІ

Одне з частих питань, які мені ставлять люди: «Як тобі в голову прийшла ця ідея?». Думаю, ключовим моментом стало випадкове знайомство з ElevenLabs — сервісом, що дозволяє перетворювати текст на аудіофайл з дуже реалістичним голосом (можна обрати один зі стандартних або синтезувати власну модель — свого голосу або когось іншого). Коли я дізнався, наскільки сильно розвинувся напрямок text-to-speech і що це вже зовсім не схоже на роботизований голос, у мене в голові наче склався пазл: у нас же тепер є все необхідне для створення повноцінного відеоконтенту! АІ для написання текстів, для озвучення цих текстів, для генерації зображень, для перетворення зображень у відео і навіть генератори музики!

Як великий фанат жанрів фентезі та наукової фантастики, перше, що я зробив — попросив у ChatGPT згенерувати 50 ідей для фантастичних розповідей. Запит був буквально такий: Generate 50 ideas of tales-like stories for teens and adults. Результат виглядав ось так:

Потім для кожної із запропонованих тем я використовував один і той же шаблон, підставляючи лише назву й опис, щоб попросити ChatGPT згенерувати повноцінну історію. Запит виглядав ось так: Generate a fantasy fiction story with this title: «The Secret Society» and this description: A group of individuals with extraordinary abilities forms a secret society to protect the world from supernatural threats. The story should be no longer than 10000 characters.

Після того, як найголовніше — історії — було готове, я переслухав усі стандартні голоси з бібліотеки ElevenLabs і обрав той, який мені здавався найбільш відповідним для начитування подібних історій. Спойлер: це була моя перша (і далеко не остання) помилка. Я обрав занадто спокійний голос, слухати який є сенс лише перед сном, якщо хочеш пошвидше заснути. Як показали відверто поганенькі результати перших відео — у подібному жанрі від голосу багато що залежить, і коли з часом я перейшов на інший голос, результати стали набагато кращі. Для порівняння, різниця між найбільшою кількістю переглядів відео з другим голосом у 20+ разів більше, ніж з першим.

Я використовував два підходи для перетворення тексту на аудіо — великими об’ємами (1000+ символів) і малими (окремими реченнями). У кожного підходу є плюси та мінуси. Наприклад, під час генерації одразу великого тексту у вас не буде проблеми з різкою зміною гучності чи інтонації, які з’являються під час генерації окремими реченнями. З іншого боку, для подальших дій з відеопродакшену зручніше використовувати купу окремих аудіофайлів, кожен з яких є окремим реченням з тексту.

У цього сервісу є певний безкоштовний об’єм тексту, який ви можете озвучити протягом місяця (10 тисяч символів — мені цього вистачило лише на 3 історії). Якщо потрібно перетворювати на аудіо більше тексту, то можна оформити платну підписку. Я користуюся тією, що коштує 22$ на місяць і дає змогу озвучувати 100 тисяч символів — цього цілком достатньо для тієї кількості тексту, з якою я працюю.

Також у них є досить зручний АРІ, тож якщо ви хоча б трохи вмієте писати код — це може значно спростити ваше життя (як спростило моє), бо за допомогою невеликого скрипту можна розбивати текст на окремі речення, відправляти їх на АРІ ElevenLabs і зберігати результат у вигляді аудіофайлів. Це значно швидше, ніж мануально користуватися їхньою вебформою.

Отже, у нас є 20, 30, 50, 100 аудіофайлів з АІ-озвученими реченнями нашої АІ-згенерованної історії — що далі? А далі ми звертаємося до інших АІ, щоб почати генерувати відеоконтент. У цій частині відеопродакшену є багато різних підходів та інструментів. Деякі з них я тестував сам, про деякі лише чув від інших людей. Після вдалих (і не дуже) експериментів я зупинився на такій схемі:

  1. Для кожного речення / аудіофайлу нашої історії генеруємо статичне зображення за допомогою NightCafe. Місячна підписка коштує 8$, але я поки користуюся безкоштовними токенами, які накопичив за всі попередні місяці, що мав акаунт, але нічого не генерував.
  2. Далі за допомогою одного з двох сервісів — Runway або LeiaPix — перетворюємо наші статичні зображення на відео / анімацію. Місячна підписка на Runway коштує 15$, а LeiaPix умовно-безкоштовна: якщо вам достатньо якості 720р, то анімація не коштує нічого, якщо вам треба краща якість — доведеться платити. У вас може з’явитися питання, нащо використовувати аж два сервіси, тим паче, якщо один з них платний, а інший — ні. Справа ось у чому: Runway зазвичай дає чудові результати, і це мій основний інструмент. Але іноді та нейромережа, що лежить у його основі, — глючить і видає жахливі результати. Ось тут якраз в пригоді стає LeiaPix, яка генерує менш цікаві, але більш передбачувані результати. Тобто це свого роду план Б, якщо основний анімаційний АІ не справляється.

Також досить популярним інструментом для створення АІ-анімацій є безкоштовний сервіс PikaLabs, проте мене не дуже вразили ті результати, які він видає, особливо порівняно з Runway. Тому я готовий платити додаткові 15$ на місяць за вищу якість.

Нарешті на цьому етапі після всіх маніпуляцій зі штучним інтелектом і генерацій контенту в нас є майже все необхідне — озвучка та відео. Залишилося лише зібрати це все в один файл за допомогою відеоредактору, накласти фонову музику, і можна публікувати перше відео на наш YouTube-канал з нулем підписників. Фонова музика — це єдиний момент, де я вирішив поки не використовувати АІ (хоча навіть для цього вже є багато досить непоганих сервісів, наприклад — Beatoven.ai та Soundraw). Переважно це пов’язано з тим, що той відеоредактор, який я використовую, має бібліотеку з 15+ тисяч музичних композицій, серед яких можна знайти потрібну для будь-якого відео. Також ви можете використовувати непоганий сервіс з copyright free music — Pixabay.

Щодо відеоредактору — це була моя друга серйозна помилка. Напочатку я не думав про те, щоб генерувати відеоконтент / анімації за допомогою АІ, а хотів генерувати лише аудіо, а для візуалу використовувати готові copyright free-відеофрагменти, які б пасували до контексту. У перших приблизно 12 відео я так і робив, використовуючи Pictory.AI, проте це виявилося поганою стратегією, і зрештою в останніх пʼяти відео я вже перейшов до повноцінного АІ-згенерованого відеоконтенту, описаного вище. На жаль, на той момент я вже встиг оформити річну підписку на Pictory.AI, яка коштує 15$ на місяць, з урахуванням усіх можливих знижок. Хоча, маю сказати, це досить зручний відеоредактор з величезною колекцією аудіо та відео, що часто стає у пригоді. Проте коли поточна річна підписка закінчиться, скоріш за все я знайду безкоштовну альтернативу, а не буду продовжувати її.

Я не описую конкретні детальні кроки для кожного із сервісів, бо тоді б стаття стала просто безкінечною. Але, ймовірно, з кожним з них ви зможете розібратися без проблем: всі вони мають досить прості й зрозумілі інтерфейси та туторіали для новачків на самих сайтах цих сервісів.

Я створив свій YouTube-канал приблизно 1,5 місяці тому. На момент написання статті він має 46 підписників та 27 відео, з яких 22 long format і пʼять — shorts. За цей час я встиг припуститися декількох серйозних помилок, зробити висновки та розвʼязати їх, що значно допомогло каналу.

Наприклад, моє найперше відео — Princess Cassandra and the Forest Witch — було просто однією статичною картинкою, на фоні якої АІ розповідав історію досить тихим і занадто спокійним голосом, а на фоні грала не менш спокійна мелодія. Усе це призвело до того, що глядачі досить швидко переставали дивитися відео, і воно перестало просуватися YouTube. Після цього я спробував додати трохи екшену й замість статичного зображення використав зациклену анімацію дівчини, що читає книгу. Це також не призвело до серйозних позитивних змін.

Далі я експериментував з сюжетами історій, з використанням copyright free-відеофрагментів, знятих іншими людьми, але по-справжньому серйозним проривом стало дві події: по-перше, я змінив голос оповідачки з тихого / спокійного на більш динамічний, по-друге, я почав використовувати АІ-згенерований відеоконтент. Перше відео, де я використав такий підхід, набрало 2200+ переглядів на момент написання статті. Для порівняння, попереднє опубліковане перед ним відео (ще з недоліками голосу та відео) набрало лише близько 10 переглядів, тобто результат став кращим у 200+ разів!

У мене ще є декілька ідей, які допоможуть покращити наступні відео, тож сподіваюся на ще один ривок у десятки-сотні разів найближчими місяцями. А щодо глобальних планів, то хочу досягти стадії монетизації каналу менше ніж за рік його існування.

Поки що YouTube-канал лише потребує вкладання грошей, але, сподіваюся, із часом ця інвестиція почне приносити плоди. Місячні витрати складають всього 52$. Я кажу «всього», тому що це набагато менше, ніж довелося б платити фрілансерам, які б робили аналогічний контент: письменникам / сценаристам, художникам / аніматорам, акторам озвучки і т. д. Ці 52$ складаються з:

  • місячна підписка на ElevenLabs — $22;
  • місячна підписка на Runway — $15;
  • місячна підписка на Pictory.AI — $15.

Коли на NightCafe закінчаться безкоштовні кредити, доведеться оформити місячну підписку за 8$, тобто сумарні витрати сягатимуть 60$. Якщо для будь-чого з цього списку ви знайдете гідну безкоштовну альтернативу — ваші витрати будуть меншими або навіть нульовими.

Загальні поради щодо ведення YouTube-каналу зі згенерованим AI контентом

Хоча я й писав, що всі мої вже опубліковані відео (і ті, що будуть опубліковані в майбутньому) належать до жанру фентезі та наукової фантастики — вам не обов’язково повторювати мій шлях. Ви можете обрати той напрям, який цікавить саме вас: фінансові поради, психологічна допомога, жарти / гумор, реальні історичні факти, детективні історії, мультфільми, керовані медитації, трейлери, короткометражки тощо.

Головна порада, яку я можу дати щодо вибору теми: залишайтесь послідовними й оберіть певну нішу — це дуже сильно допоможе. Якщо ви створите 20-50 різних відео, і кожне буде з абсолютно різної сфери, коли люди будуть знаходити ваш канал — вони не розумітимуть, який ваш основний напрям, і втрачатиуть бажання підписатися на вас. А це критично важливо для майбутньої монетизації, бо щоб почати отримувати гроші від показу реклами на ваших відео, вам потрібно мати 1000+ підписників на каналі і 4000 годин перегляду всіх ваших відео сумарно за рік. Тому для набору підписників краще обрати якийсь один напрям і створювати контент саме в ньому.

Тоді, знайшовши ваш канал і подивившись 2-3-5 відео, люди з набагато більшою ймовірністю підпишуться і будуть чекати ще подібного контенту, бо вони приблизно вже уявляють, яким шляхом ви рухаєтесь як контент-творець.

Наступна надважлива порада: не чекайте швидких успіхів і будьте готові до того, що на довгі місяці YouTube стане вашою другою part-time роботою. Навіть не зважаючи на те, що не потрібно самому писати тексти, малювати графіку, писати музику й на те, що найбільш складну частину роботи за вас робить АІ, однаково в мене були тижні, коли доводилося присвячувати створенню роликів до 20 годин на тиждень.

У якийсь момент я зрозумів, що це вже занадто, і знизив навантаження до 8 годин на тиждень (а разом із цим і кількість відео, що публікую щотижня), проте наразі не бачу способу автоматизувати все настільки, щоб можна було генерувати якісний контент натисканням однієї кнопки. Є досить багато аспектів, де потрібен контроль зі сторони людини, наприклад:

  • чи якісне зображення було згенероване, чи треба перегенерувати?
  • чи якісне відео / анімація було згенероване, чи треба перегенерувати?
  • яку фонову музику краще підібрати під конкретну історію?
  • чи немає надто великої різниці в гучності / інтонації між сусідніми реченнями?
  • яке прев’ю для ролика зробити, щоб людям хотілося на нього натиснути?

Більшість людей, які займаються створенням відео для YouTube досить давно, сходяться у тому, що зазвичай потрібно від чотирьох до шести місяців регулярної публікації відео на новому каналі, щоб побачити перші серйозні результати (десятки / сотні тисяч переглядів на одному відео, купа нових підписників і т. д.). Якщо вам вдасться досягти цього швидше — мої вітання. У вас або вроджені здібності до подібної справи, або є попередній релевантний досвід, який дозволяє створювати кращий і хайповіший контент, ніж може звичайний новачок, який ніколи нічим подібним не займався навіть віддалено.

Ще одна порада — звертайте увагу на 2 найважливіші параметри кожного вашого опублікованого відео: CTR (click-through rate) та AVD & APV (average view duration & average percentage viewed). Перший — це відношення кількості людей, які побачили прев’ю вашого відео у стрічці до тієї кількості, які клікнули та почали дивитися. Інші два параметри кажуть самі за себе — середня тривалість перегляду і середній відсоток (від всієї довжини відео) перегляду.

Що вище будуть ці параметри, то більше шансів, що алгоритми YouTube будуть активно просувати ваші відео, а це, своєю чергою, означає більше переглядів, більше watch time, більше підписників, що буде наближати вас до монетизації. Бажано, щоб CTR був 5% і вище, а APV — 50% і вище. AVD буде залежати від того, скільки триває ваше відео: якщо воно триває 10 хвилин і його в середньому дивляться 50% часу, AVD буде 5 хвилин. А якщо ваше відео триває 3 хвилини і його дивляться в середньому 67% часу, AVD буде 2 хвилини.

Тут дуже важливо знайти баланс між тим, щоб зробити відео не надто довгим, не надто коротким і водночас цікавим протягом всього часу. Особливо критичні перші 15-30 секунд для утримання уваги глядача, тож намагайтеся зробити ці перші секунди настільки привабливими, наскільки дозволяють інструменти, якими ви користуєтеся.

В середньому, якщо ви робите англомовний контент і вас дивляться люди з Європи та Північної Америки, коли ви досягнете критеріїв подання на монетизацію, у перші місяці зможете розраховувати на дохід у $100-300 на місяць. Знаю, це не та сума, заради якої можна покинути роботу в ІТ, проте насправді це лише початок подорожі.

Якщо продовжувати розвивати канал, то зазвичай він продовжує рости не лінійно, а експоненційно, тобто на те, щоб набрати другу тисячу підписників, третю і т. д., вам знадобиться набагато менше часу, ніж на першу тисячу. І якщо ви не сеніор девелопер, то, починаючи з десь 20-50 тисяч підписників на каналі, ваші доходи цілком можуть бути більшими, ніж ваша основна зарплатня в ІТ. Звичайно, це скоріш за все займе декілька років, проте і АІ за цей час значно еволюціонує, а значить, ви зможете створювати все більш якісний контент з меншою кількістю зусиль.

Також ви можете створювати контент і на інших мовах, ChatGPT та ElevenLabs дають таку змогу. Проте, скоріш за все, ваша потенційна аудиторія буде значно менше, адже англійську знають набагато більше людей, ніж, скажімо, українську чи італійську.

Особисто у мене таке відчуття, наче цей напрям (використання генеративного АІ для створення контенту для майбутньої монетизації) чимось схожий на ранні роки криптовалюти — тоді крипта була чимось новим і не дуже зрозумілим, багато хто не ризикував у неї вкладатися, але ті, хто вклалися — через багато років стали мільйонерами, а решта кусала лікті зі словами «Чорт, чому ж у мене немає машини часу, щоб повернутися в минуле та встигнути застрибнути у цей потяг!».

От зараз схожий момент відбувається зі штучним інтелектом, і якщо зачекати ще рік-два, то, думаю, буде занадто пізно: хто почав зараз, той вже буде мати велику аудиторію, досвід, може навіть побудований конвеєр з відеопродакшену. А ті, хто будуть починати потім — зіткнуться з величезною конкуренцією, і їхні відео потонуть у безмежному океані АІ-згенерованого контенту.

Якщо вас цікавить цей напрям і ви хочете стежити за еволюцією АІ у сфері генерації відео, але не хочете займатися цим самі — підписуйтеся на мій канал Cassandra Tales, зазвичай я публікую 1-2 відео на тиждень. Якщо ж ця стаття змотивувала вас почати робити контент для власного YouTube-каналу — бажаю успіхів і швидкої монетизації.

👍ПодобаєтьсяСподобалось19
До обраногоВ обраному23
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

Я вже півроку як займаюся тим же самим, але насправді зробити цікавий та гіний відеоконтент — це досить велика робота. Витрачається дуже багато часу, якщо казати про одну людину яка цим займається. Це перша неприємна новина для тих хто збирається йти в цьому напрямку. Друга новина — це те що здається ютуб відмовляється монитезувати відео створене за допомогою ШІ. Ютуб волає за більшь індівідуальний та персонализований відеоконтент. Тож може бути бути що коли ви досянете бажаної кілкості переглядів та підписників — ваш канал не монетизують і по суті всі ваші затрати та зусилля виявлятся марними. Тому тут варто шукати компроміс між використанням нейронки і особистості в тому щоб створювати відеоконтент. Під особистостью я маю на увазі не ваші зусилля в майстерності володіння ШІ, а саме те що буде якийсь баланс між живим виступом людини і тим що згенерувала нейронка. Я раджу вам вивчити питання монетизаціїї на ютуб генеративного контенту більшь ретельно.

Крута стаття, респект
Питання — у вас на каналі стоїть в Channel details локація United States, це так треба ?

А музичний супровід? Ви берете незахищені авторським правом треки, вірно?
Але часто бачу музичні підбірки, де нонстоп йдуть пісні, які нібито не можна собі на канал постити....
Чи все ж можна?

Це цікаве питання, з яким я не розбирався глибоко, якщо чесно. Я точно знаю, що та бібліотека на 15+ тисяч аудіозаписів, яку надає Pictory своїм користувачам — не має проблем з законом про авторське право/інтелектуальну власність. Окрім того у самого ютуба під час завантаження відео один з важливих етапів — Copyright check, який неможливо пропустити і якщо ютуб скаже, що хоч щось (аудіо, відео, текст) з вашого відео порушує чиїсь авторські права — ваше відео або ризикує отримати позначку, що воно щось порушує (і таке відео виключать з монетизації), або навіть взагалі ютуб відмовиться його публікувати.

Щодо каналів, де нон-стоп грає музика, яка має бути захищена — я не знаю, як вони це роблять і не мають жодних проблем.

Які ви використовуєте ресурси , щоб заглиблюватися в цю тему? Які є форуми чи групи де обговорюють всі ці інструменти, порівнюють їх?

Майже на 100% впевнений, що на reddit має бути відповідна спільнота, але не шукав. Ще у Discord також багато людей тусується, як мінімум там є PikaLabs (нейронка для генерації відео прямо у діскорд чаті) і там купа кімнат як для генерації, так і для спілкування.
Ще у мене є декілька друзів, які цікавляться темою і вони мені в месенджерах в особисті повідомлення весь час щось шлють, якщо знаходять нові цікаві АІ сервіси.

Дивлячись, наскільки зараз розкручена тема генерації відео, книжок, і навіть товарів за допомогою АІ, то зараз має бути вигідно підняти свій сервіс дотичний до тих тем :)

Піднімати свої сервіси дотичні до цієї тами- це зараз теж розкручена і дуже висококонкурентна тема

Які є прості стособи автоматизувати додавання тексту на відео? Так щоб разом з аудіо появлявся текст з гарним шрифтом?

У Pictory.AI є така можливість. Я користувався нею на початку, але потім вирішив, що текст перекриває візуальну частину і трохи відволікає від самого відео, так що прибрав.
Там все досить просто — завантажуєте весь текст, який хочете відображати у відео, а далі сам Pictory.AI для кожного речення створює нову «сцену» і виводить текст на екран в той час як на фоні відображається відео, грає музика і диктор читає текст. Стилів шрифту також досить багато, здається десь в районі 50.

Хто знає, які є сервіси , щоб створювати образ і потім багато разів його використовувати. Тобто, вибрати зовнішній вигляд людини і потім робити різні зображення з цією самою людиною. Є щось таке в доступі?

Є різні підходи, погугліть:
consistent characters in midjourney

Отака штука часто проскакує у шортсах www.youtube.com/@ByteSavants/featured — виглядає якраз на роботу АІ, можете взяти до уваги )

Дякую)
Ще помітив, багато хто знайшов такий лайфхак — генерувати NSFW (not safe for work) зображення жінок, а потім стилізувати їх під античні статуї. Це буквально можна описати як «мармурові нюдси» :D
YouTube класифікує це як витвори мистецтва і культуру, а не еротику, так що проблем немає. І воно досить непогано набирає перегляди, ось наприклад цей ролик набрав більше 100 тисяч переглядів за 8 днів — www.youtube.com/watch?v=Wsr97u9LuN4

Дуже корисний огляд. Я якраз шукав такий

Ваш путь тернист и долог. И хоть художника обидеть может каждый, контент, который я прослушал, дерьмо полнейшее: рассказ машины напоминает вставку текста к сюжетной линии RPG игры, не больше.
The mysterious story of magic locket

Я з вами згоден, і сам також бачу купу недоліків та моментів, які хочеться покращити: у тексті, анімації, музиці і т.д. Проте тут можливих рішень всього 3:
1) Писати текст самому. Це додаткові години роботи + зменшення АІ частини у загальному процесі, що йде у розріз з ідеєю проекту.
2) Замовляти текст у фрілансерів. Ті ж самі недоліки, що й у першому пункті + додаткові фінансові витрати.
3) Чекати, доки АІ мовні моделі стануть писати більш цікаві тексти. От саме на цей пункт всі мої сподівання. Можливо, я б був більш проактивним, якби бачив, що з каналом все йде погано, але так як він досить добре набирає і підписників, і перегляди — то поки стратегія «чекати доки АІ стане краще виконувати свою роботу» виглядає як цілком робоча.

Клас, дуже детальна і легка стаття водночас. Успіху в розвитку каналу! я тепер в підписниках щоб слідкувати за за цим процесом:)

morise.ai
ось вам ще нейромережа, яка підбирає опис, теги і т.д. для відео відповідно до SEO-стандартів

Клас, дуже дякую :)

Хороша стаття! Зазвичай статті про «подивіться, як я заробляю» — шлак, але ця хороша. Що цікаво, що я теж паралельно роблю такі кроки. Не «один в один» але дуже подібно.

Дякую і бажаю успіху нам всім)
Мене іноді питають, чи не боюся я, що описуючи подібні кроки досить детально — створю армію конкурентів. Думаю, враховуючи що зараз на ютубі десь 114 мільйонів каналів, а цю статтю прочитає дай боже щоб 5 тисяч людей, навіть якщо всі 100% хто прочитає — створять канали, то це буде крапля в морі на фоні отих 114 мільйонів)

Це точно. А скільки ще початківців швидко закине ті свої канали, побачивши об"єм необхідної роботи

Якщо чесно, то я й сам мало не закинув цей проект у перший місяць, коли дивився як повільно йдуть справи) Після першого місяця на каналі було всього 16 підписників і кожне з відео мало менше 100 переглядів. Я тоді подумав, що можливо подібний контент ніколи не приверне достатньої уваги. Але потім випустив ще пару відео і нарешті одне з них «вистрілило» і почало набирати перегляди сотнями, а потім і тисячами, а підписники також почали додаватися.

Так що починати і справді дуже важко, але як тільки хоч одне відео з каналу починає «подобатися» алгоритмам ютубу і ютуб починає це відео активно просувати — все стає набагато простіше з цього переломного моменту.

До речі, я спробував озвучувати відео нейронкою від OpenAi — сподобалось більше. Там і дешевше разів в 5, і краще наголоси розставляє. Рекомендую спробувати

twitter.com/...​tatus/1730818748981158299

Ось трохи перспективніший напрямок.

Інстасамки напрялися

Як змусити нейромережу генерувати постійно одну й ту саму людину/персонажа в різному одязі/позах/локаціях? Щоб обличчя було одне й те саме, а не рандомні

Тренувати модель в sd. Є ще такий чіт- генерувати на одному зображенні декілька поз одного персонажа, тоді буде схоже. Промпти character sheet, turnaround, multiple views of the same person, і тд

Я бачив що можна загрузити оригінал і він далі буде генерувати на основі того оригіналу. Але не знаю наскільки це надійно і consistent.

Обрати з фільму чи відому модель , суміш моделей.

Дякую, також про це думав і можливо навіть спробую у 2024. Поки що зупиняло те, що я не зміг добитися від нейромереж одночасно реалістичної і консистентної зовнішності від генерації до генерації. Але думаю з кожним місяцем справи будуть все краще у цьому плані.

Також думаю поресьорчити в цьому напрямку.

Якими інструментами пробували гратися? Бажано оффлайн, щоб самому модель завантажити і гратися. Чи платні сервіси набагато кращі?

Пробовали в инстаграм или тикток загружать? Мне кажется так быстрее пойдет

Це хороша ідея, дякую. ТікТок взагалі не використовував ніколи, але мабуть час настав. Щодо інстаграму — маю лише власний профіль, куди іноді закидаю інформацію про те, що на каналі вийшло нове цікаве відео чи канал досяг певної важливої точки, але не заводив окремий саме для Кассандри.

Класний досвід! Бажаєм у новому 2024 році отримати YouTube Play Button

Велике дякую! ^__^ Здається в середньому у людей до 5 років йде, щоб набрати 100 тисяч підписників і отримати першу срібну кнопку) Так що я буду радий просто тому, що канал почне приносити гроші і може навіть набере перші 5 чи 10 тисяч підписників. На більше я поки що не сподіваюся)

Дякую, що поділився досвідом. Є над чим подумати.
На мою думку на разі це просто новий тулінг, для пришвидшення проектування. Як колись комп’ютерна графіка пришвидшила художників.
Але в цілому круто для прототипування.

Згодний на всі 100! Я коли це все лише починав, то думав, що досить швидко зможу повністю автоматизувати процес. Але десь після перших же тижнів зрозумів, скільки там зараз є мануальної роботи і скільки часу піде на те, щоб все це автоматизувати, так що фактично ці генеративні нейромережі не полегшили мені життя, а навпаки додали ще більше обов’язків :D
Хтось через АІ залишається без роботи, у мене навпаки через АІ тепер робот стало дві.

И много денег за 100 просмотров платят?

Взагалі нічого не платять поки не буде 1000 підписників чи щось того

Думаю таким є смисл займатися якщо все повністю автоматизувати.

Особисто мені поки що не платять нічого, бо канал не досяг мінімальних критеріїв для монетизації. Проте, якщо уявити, що канал отримав монетизацію от прямо зараз, з поточною кількістю переглядів на місяць (десь близько 13 тисяч), то можна було б розраховувати десь на 130$ на місяць. Гроші невеликі, але й канал також невеликий. Якщо вдасться вийти на рівень сотень тисяч переглядів на місяць (тобто у десятки разів більше ніж зараз), то й суми будуть значно серйозніші, десь на рівні мідлової зп.

То який середній дохід за місяць?

Відповів трохи вище у іншому коментарі, продублюю сюди:

Особисто мені поки що не платять нічого, бо канал не досяг мінімальних критеріїв для монетизації. Проте, якщо уявити, що канал отримав монетизацію от прямо зараз, з поточною кількістю переглядів на місяць (десь близько 13 тисяч), то можна було б розраховувати десь на 130$ на місяць. Гроші невеликі, але й канал також невеликий. Якщо вдасться вийти на рівень сотень тисяч переглядів на місяць (тобто у десятки разів більше ніж зараз), то й суми будуть значно серйозніші, десь на рівні мідлової зп.

Класний голос на відео.

Одного не розумію, якщо є такі класні і якісні голоси з ідеальною англійською, чому інстаграм пости озвучує противний жіночий, голос з дебільною інтонацією?

Питання реально на мільйон)
Я також не знаю, чому все ще використовуються поганенькі голоси, якщо є класні.

Цікаво, враховуючи недоліки анімації.

Дякую)
Анімація — це мій найбільший біль в даний момент)
Шукаю способи покращення, але щоб при цьому не надто сильно збільшувати бюджет проекту.

Спасибо за реально классную статью!
Подпишусь, и посмотрю видео прямо сейчас )

Дякую)
У 2024 скоріш за все напишу ще як мінімум 2 статті про це ж:
— перша буде, коли канал нарешті почне приносити гроші: опишу скільки часу/сил/грошей було витрачено, щоб цього досягти (сподіваюся весною або влітку 2024)
— друга буде мабуть на річницю каналу (восени 2024): опишу, які зміни сталися за рік, якими новими більш просунутими інструментами почав користуватися і як взагалі йдуть справи.

Важливим кроком ще є перевірка згенеровано тексту в плагіат чекері. Тим більше, шо ви такі не оригінальні запити робите.

Це цікава ідея. Наскільки я знаю, текстом, згенерованим АІ можна вільно користуватися у тому числі в комерційних цілях. Але мабуть варто перевірити, чи не використовує АІ надто великі частини з уже існуючих текстів на які хтось має авторські права.

Так, ChatGPT може використати при генерації цілі куски чужого тексту.

Я використовую grammarly plagiarism-checker для перевірки.

Для того, щоб отримати унікальний текст, при генерації додаю пару речень якихось деталей чи поворотів сюжету.

П.С. дякую за ідею про АІ генероване відео! Я поки на стадії картинок з озвучкою.
Отут мій канал про fairy tales: youtube.com/...​world?si=EV3dGUIR5IORjm4A

і текстова версія, bedtime stories for kids: victoriastalesworld.com

Прочитав на одному диханні.
Єдине питання, що в мене досі лишається, чи youtube просуває згенерований у такий спосіб контент з тією ж самою швидкістю, що і теплий ламповий (де умовно в кадрі з’являється жива людина). Бо зараз точаться дискусії стосовно цього.
Бажаю успіхів у просуванні каналу))

Дуже дякую! На reddit є спільнота яка називається NewYoutubers чи якось так і там тусуються власники зовсім різних каналів — у когось АІ контент, а хтось сам знімається в кадрі і розповідає якісь речі. І наскільки я побачив з обговорень, всі стикаються з тими ж самими складнощами на початку існування каналу, незалежно від того, чи є жива людина в кадрі, чи це голий АІ.

Більш того, є навіть топік «коли ви набрали своїх перших 100 підписників?» і там є люди, які самі з’являються в кадрі і постять відео вже не перший рік, проте у них все ще менше 100 підписників. Так що думаю ютуб досить справедливий до АІ контенту і просуває його так само, як і живих людей, якщо бачить інтерес аудиторії до згенерованих відео.

Коли AI зробить щось на рівні хоча би «Чіп і Дейл: бурундучки-рятівнички», тоді можна буде говорити про якийсь прорив цих технологій.
Як допоміжний інструмент в творчості або для експериментів — звісно круто та цікаво.

Будь-яка справжня творчість потребує творця, бо AI не може любити. Любов — це основа творчості.

Коли AI зробить щось на рівні хоча би «Чіп і Дейл: бурундучки-рятівнички»

Тут, мабуть, погоджуся з автором статті, що коли це станеться, застрибнути у цей потяг звичайнному ентузіасту буде надзвичайно складно. Я маю на увазі як у галузь стартапобудування. Бо ринок буде насичений потужними гравцями.

Любов — це основа творчості.

ну ніхто ж не заборороняє робити творчість у старий добрий спосіб. Це мабуть з нами буде назавжди.

Зараз в цій індустрії безліч супер-пупер технологій та найновіше обладнання.
Але проблема все ж у відсутності (дефіциті) майстерних режисерів, харизматичніх акторів (героїв) та цікавих сценаріїв, тобто в людському факторі. Мало творчих / креативних людей-ідей.

Про любов гарно сказано! Погоджуюся з вами. Хочу додати, що останні два роки прориву штучного інтелекту минули в непростий час, особливо для України.
Можливо, творчі «люди-ідеї» рефлексують, переживають, пропускають через себе досвід.
Адже якщо поринути у творчість «на швидкості», не переживши її, результат буде сирий.

Я маю на увазі:
Не кожен текст, написаний гарною римою, є віршем.
Не кожен вірш, де є приспів, є піснею.
Не кожне відео є казкою або кліпом.

Там дійсно має бути ще щось.

Я впевнена, що з часом з’явиться більше відрефлексованої творчості, дуже сильної.

Зараз багато любові?
Думаю, що сьогодні щоденний інформаційний фон наповнений страхом (-ами), ілюзіями (брехнею) та ненавистю.

Якщо є здатність фільтрувати та самому все аналізувати (розбиратися) — тоді це, теоретично, загартовує.

Як це все відрефлексується для більшості — велике питання.

Повністю з вами погоджуюся. У мене те ж саме відчуття, що АІ це все таки не основний «творець», а саме інструмент для реалізації твоїх задумів на, поки що, досить примітивному рівні. Як у бекенд розробника, у мене взагалі поганенько з відчуттям стилю, я не вмію малювати або підбирати гарні кольори. Тому в цьому плані генеративні нейромережі дуже сильно виручають. Проте основний процес компоновки усього згенерованого в єдине ціле — залишається за мною і я б з радістю це автоматизував))

Круто! Якщо захочу щось подібне зробити то буду перечитувати статтю

Супер! Дуже люблю читати ваші коментарі і статті, Ярослав, так що якщо захочете щось подібне зробити і знайдете час — сподіваюся також напишете статтю про власний досвід, з великою ймовірністю на той момент щось з моєї статті вже застаріє і з’являться нові більш просунуті інструменти.

Підписатись на коментарі