Реліз Janus Pro: DeepSeek знову дивує ринок ШІ

💡 Усі статті, обговорення, новини про AI — в одному місці. Приєднуйтесь до AI спільноти!

Якщо ви пропустили новину, то вчора весь американський ринок IT, який хоч якось був пов’язаний із ШІ, обвалився. Так, наприклад, Nvidia впала на 15%. Пов’язують це з випуском компанією DeepSeek своїх моделей тиждень тому, які багато в чому перевершують вже існуючі аналоги, так ще й у використанні коштує копійки та натренована була практично безкоштовно, якщо порівнювати з усіма сучасними топовими ШІ. Це сильно сколихнуло ринок і змусило інвесторів замислитися над питанням, а чому нефритовий стрижень настільки сильний?

Так ось, удар триває. DeepSeek випустили Janus Pro, модель для генерації картинок за текстовим описом. У бенчмарках моделька перевершує Stable Diffusion 3 Medium і DALL-E 3 від OpenAI. Ось такий сюрприз чекає на американців, коли вони прокинуться.

Ще моделька вміє аналізувати зображення. Знайти її можна на Hugging Face, а код моделі відкритий і поширюється за ліцензією MIT (для комерційного використання).

Ух, що буде далі...

@Zatishna_Galera

👍ПодобаєтьсяСподобалось2
До обраногоВ обраному0
LinkedIn
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
Дозволені теги: blockquote, a, pre, code, ul, ol, li, b, i, del.
Ctrl + Enter
У бенчмарках моделька перевершує Stable Diffusion 3 Medium і DALL-E 3 від OpenAI.

перша глючна, непередбачувана і зливає навіть попередньому Stable Diffusion
DALL-E взагалі ніколи особо не виділявся

так що таке собі досягнення. Вот коли flux буде випереджати, міджорні, тоді поговоримо

Конкуренція піде на користь, OpenAI вже переглядає свою цінову політику x.com/...​tatus/1884007987884536112

У OpenAI і так були демократичні ціни, особливо з використанням batch api, дешевші мабуть тільки у deepseek. А 4o mini взагалі була народна модель по співвідношенню ціна-якість. Також, у deepseek зараз промо ціна до середнини лютого. Потім буде в 2 рази дорожче. Але все-одно буде дешевше ніж за подібні моделі OpenAI.

Короче не треба з OpenAI моністрів-монополістів робити.

Чомусь мені здається, що приблизно так казали луддіти «Мануфактури та станки — це пузир» :) Я можу погодитись, що десь воно занадто на перейпі, але то що це майбутнє — мені вкрай очевидно.

Залежить від заліза і інтерфейсу, який буде доступний для розуміння переважній більшості користувачів. Не так як зараз, коли ми маємо цю доступність лише для переважної меншості користувачів. Дешеве залізо + зрозумілий простим людям інтерфейс + Deep Seek і це вже буде щось набагато могутніше за те, що спостерігаємо зараз.

Ну скажімо так, «більш могутнішгого» у DeepSeek нема нічого. Це безумовно непогана модель, але у OpenAI все ще моделі кращі, о1 і о3 переграють DeepSeek. Плюс, як ми вже знаємо, DeepSeek має багато цікавих проблем, про які вони не казали:
1) Проблеми із безпекю. Усі дані користовучів були майже у вільному доступі.
2) Розказні про «5-6 мільйонів» на навчання опинилися байками. По перше, вони враховували тільки останній раунд навчання, скільки вони влили грошей до цього — не розкривається. По друге, вони не рахували залізо, яке використовували в навчанні, бо «воно вже у нас було раніше». При цьому, по слухам там цього заліза на сотні мільйонів. Так що, виходить так, що вона не дешевша, якщо рахувати так само, як рахує OpenAI.

DeepSeek безумовно зробили круту роботу. Одні методи оптимізації чого коштують. Але, все це більше хайп коло моделі.

Тому я б не переоцінював «могутність» цього релізу.

Я собі спокійно стягнув DeepSeek через Ollama і зміг безплатно вдома побавитися з ним. Так само спокійно його можна захостити самому.
А вот що відбувається на серваках OpenAI — я не знаю. Їхня модель і код — закриті.
Тому якщо говорим за продакшн, то ті претензії з безпекою — не в ті ворота.

Підписатись на коментарі