OpenAI анонсували Sora — нову ШІ-технологію, що може генерувати відео

Усі статті, обговорення, новини про AI — в одному місці. Підписуйтеся на DOU | AI!

OpenAI представила Sora — ШІ-технологію, яка миттєво генерує відео з текстових інструкцій. Наразі доступ до Sora має невелика група тестувальників, що працює над потенційними небезпеками, а також низка художників, дизайнерів і кінематографістів.

Детальніше про те, як все працює

  • Sora ґрунтується на попередніх дослідженнях моделей DALL-E та GPT.
  • Окрім того, що модель може генерувати відео винятково з текстових інструкцій, вона працює із зображеннями та відео. Тобто Sora може взяти вже наявне відео та розширити його або заповнити відсутні кадри.
  • Генерує відео тривалістю до хвилини.
  • Здатна на складні сцени з кількома персонажами, специфічними типами руху та точними деталями об’єкта і фону. Модель розуміє не лише те, що користувач попросив у запиті, але й те, як ці речі існують у фізичному світі.
  • За рахунок можливості перебачити багато кадрів за один раз, Sora може створювати кілька кадрів у межах одного відео, які точно відтворюють візуальний стиль та образи персонажів (навіть коли вони тимчасово зникають з поля зору).
  • Подібно до моделей GPT, Sora використовує архітектуру трансформатора, що забезпечує продуктивність масштабування.

Недоліки

Поточна модель має слабкі місця. У неї виникають труднощі з точним моделюванням фізики складної сцени та розумінням конкретних випадків причинно-наслідкових зв’язків. Наприклад, людина може відкусити шматочок печива, але після цього на печиві може не залишитися сліду від укусу.

Модель також може загубитися в просторі: наприклад, плутати ліве і праве, слідувати лише за певною траєкторією камери.

Безпека

OpenAI працює над інструментами, які допоможуть виявити оманливий контент. Йдеться, зокрема, про класифікатор, який може визначити, коли відео було згенеровано Sora.

Класифікатор текстів перевірятиме та відхилятиме текстові підказки, які порушують політику використання. Зокрема, не пропускатиме команди, що вимагають екстремального насильства, сексуального контенту, образливих зображень, схожих на знаменитостей або інтелектуальну власність інших людей.

У майбутньому також планується наявність метаданих C2PA.

Ну що, діліться враженнями в коментарях! 🔥 Розкажіть, яке б було ваше перше відео, згенероване Sora?

👍ПодобаєтьсяСподобалось1
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter

BREAKING: Elon Musk has filed a lawsuit against Open AI and Sam Altman for breach of contract.

The lawsuit accuses Altman et al with having betrayed an agreement from Open AI’s founding to remain as a non-profit company.

Ох як же у нього пригорає від зависті що всі забули про нього, теслу і спейсх і говорять про чатгпт, openai, як же його мучає ФОМО що не взяв openai під своє крило.

Маск такий весь за технології, прогрес людства, но тільки якщо за цими технологіями і прогресом стоїть він самий. А якщо ні, то буде душити. Лицемірство як воно є.

twitter.com/...​tatus/1758364862726778940

Гребець на галері OpenAI каже що в публічний доступ не дають тому що суспільство ще не готове

Більше того, по слухам Sora була готова ще в Березні минулого року

Уявляю скільки у них ще подібного добра заготовлено і над чим вони зараз працюють, раз так дозовано видають.

Не випустили, а анонсували

Але ж казали що це все хайп, бульбашка, не взлетить, нікого не замінить. А тепер подивіться які відео генерували рік назад і які зараз.

Так воно і досі не замінює. Там як раніше були проблеми з логікою, так і досі. А ще величезні проблеми коли треба щось конкретне і дуже специфічне. Тут люди один одного розуміють зі скрипом у відносинах «клієнт-замовник», а ШІ то й тим паче.
Хоча окей, стоки воно замінить і усякі ніші де потрібно аби шо в якості заглушки для сайтів чи презентацій.

Замінить майже всіх. Але якщо повезе, то ШІ буде роздавати безплатну миску супу кожному голодному 😊

Overgeneralization так казати, те шо хтось там десь ляпнув шо бульбашка і не взлетить ще далеко не означає протилежне. Взлетить, питання тіки часу і вливання грошей

Чудовий тред з прикладами twitter.com/...​1wk5gxTe2PmZetWXKwyA&s=19, ну і сам Альтман виконує замовлення))

Так. Це проблема. Відео більше не може бути доказом чи підтвердженням. Це виклик для людства. Але з іншого боку раніше відео не було і судова система якось працювала і так в демократіях.

То не в демократіях. Воно і зараз працює так само в більшості країн

Це було очікувано. Але я чекав пізніше. Думаю що десь через рік вони допиляють до рівня, що можна буде робити реальне кіно.
Цікаво які будуть ціни на це. І що буде з кіноіндустрією

Є ідея «плагіна» для такого сервісу. Завантажуєш кіносценарій і отримуєш кіно на виході . мабуть це буде вже скоро

Кіно то таке, вже і так давно все на компі малюється, зараз просто буде трохи ефективніше і швидше. А ось яка свобода для порноіндустрії, коли модель зможе робити все по сценарію і виконувати самі відверті збочення

Так. Індустрія ШІ подружок (AI girlfriend) вже зараз набирає обороти. А тепер ці подружки будуть ще і в відеорежимі працювати.
Це вплине на порно індустрію . І onlyfans також втратить ринок. Бо кожен їх клієнт буде мати свою власну уявну подружку.

Кіно малюють. Але все одно там якісь фантастичні чеки . Це все може здешивіти тепер.

onlyfans також втратить ринок

Або навпаки збільшить, якщо застрибне на хвилю ШІ та побудує власний датацентр.

так. сама кантора може і викрутиться. але «генераторки контенту» втратять прибутки

о так. жанр прону з публічними політиками розквітне.

Завантажуєш кіносценарій і отримуєш

Наступна ітерація: пишеш короткий опис фільму і отримуєш кіносценарій...

так. але в той час вже поняття кіноіндустріхї не буде існувати.
людина хоче подивитися щось цікаве. людина каже ШІ «хочу кіно про таке і таке». ШІ на ходу придумує сценарій, робить кіно і показує. потім це по суті викидається.

але не знаю що буде швидше це чи ШІ вийде з під контролю

Знаю що це окрема флеймова тема, однак «ШІ» по суті не існує, оскільки мовні моделі, просунуті генератори відео та інші калькулятори++ не мають свідомості.

поки не мають. скоро будуть мати. це же питання техніки.
Семен Альтман зараз збирає трильйони на виробництво процесорів для ШІ. От тоді і буде. Років за 10

питання техніки

Ні, суть в пісок у тому, що

dou.ua/...​campaign=16022024#2785111

а з удосконаленням алгоритмів та обчислювальних потужностей прийде якісніше виконання завдання, а його ініціювання так і залишиться на боці людини.

define «свідомість»

Це філософське питання куди я не збираюся заглиблюватися саме зараз, однак оскільки тут зібралися програмісти, спробую відповісти дуже спрощено:

мовні моделі, просунуті генератори відео та інші калькулятори++

виконують завдання, поставлене людиною, а не ініціюють їх самостійно.

випустили

ще не випустила. маніпуляції в заголовках!!! =)

Не хочу відео — хочу комікси. Інтерактивні.

Підписатись на коментарі