Devin — ШІ-software engineer, що наступає на п`яти спеціалістам. Чи варто хвилюватися?
Можливо, ви ще не чули про стартап Cognition AI (який ще два місяці тому офіційно не існував як корпорація), однак сьогодні він анонсував Devin — ШІ-помічника з програмного забезпечення в дусі Copilot.
Devin у багатьох аспектах значно випереджає інших помічників у кодуванні. Замість того, щоб робити пропозиції щодо кодування та автоматично виконувати деякі завдання, Devin може завершити цілий програмний проєкт самостійно.
Девін правильно вирішує 13,86% проблем від початку до кінця, що значно перевищує попередній показник у 1,96%. Навіть за умови надання точних файлів для редагування, найкращі попередні моделі можуть вирішити лише 4,80% проблем:
Ви можете давати йому завдання за допомогою команд природною мовою, і він їх виконуватиме. Під час роботи Devin розповідає про свій план, а потім показує команди і код, який він використовує. Якщо щось виглядає не зовсім правильно, йому можна дати підказку, і Devin врахує зворотній зв’язок у процесі роботи.
Більшість сучасних систем ШІ мають проблеми з тим, щоб залишатися послідовними і виконувати завдання під час таких тривалих робіт, але Devin продовжує виконувати сотні і навіть тисячі завдань, не збиваючись з курсу.
«Під час моїх тестів з програмним забезпеченням, Devin міг створити вебсайт з нуля за
5-10 хвилин, і приблизно за стільки ж часу він зміг відтворити вебверсію гри в понг. Мені довелося кілька разів підказувати йому, щоб поліпшити фізику руху м’яча в грі і внести деякі косметичні зміни на вебсайтах», — розповів Ешлі Венс (Ashlee Vance) для Bloomberg.
Cognition AI зробив прорив у здатності ШІ міркувати. Devin вміє самостійно навчатися, а це одна з головних ознак AGI (ШІ людського рівня). Як саме стартап здійснив цей прорив, та ще й за такий короткий час, залишається загадкою. Розробники не говорять багато про основи технології, окрім того, що команда знайшла унікальні способи поєднати LLM, такі як GPT-4 з методами
Поки що Devin не доступний звичайним користувачам, а для того, аби його затестувати, треба пройти через waitlist.
Дехто вже каже, що програмістам пора шукати нову роботу. А що думаєте ви? Чи може це стати справжньою загрозою для спеціалістів?
Найкращі коментарі пропустити