В четвъртък, пионерът в генерирането на видео с изкуствен интелект Luma представи Luma Agents, революционно решение, предназначено за управление на комплексни творчески задачи в текст, изображения, видео и аудио. Тези агенти са изградени върху рамката на обединената интелигентност на Luma, която интегрира единна многомодална система за разсъждения.
Ориентирани към рекламни агенции, маркетингови екипи, дизайнерски студия и различни предприятия, Luma Agents са способни да планират и произвеждат творческо съдържание, като същевременно безпроблемно сътрудничат с други AI модели, като Ray 3.14 на Luma, Veo 3 на Google, Seedream на ByteDance и гласовите технологии на ElevenLabs.
Основата на Luma Agents е в Uni-1 модела на стартапа, първият член на серията им с обединена интелигентност. Този модел е внимателно обучен в аудио, видео, изображения, език и пространствени разсъждения, както обяснява главният изпълнителен директор и съосновател на Luma, Amit Jain.
Според Jain, Uni-1 моделът притежава способността да "мисли на език и визуализира в изображения", способност, която той нарича "интелигентност в пиксели". Бъдещите актуализации ще подобрят функционалностите за аудио и видео.
Jain подчерта, че клиентите не просто придобиват инструмент; те трансформират своите оперативни подходи. Luma Agents са проектирани да поддържат непрекъснат контекст в различни творчески активи и итерации, позволявайки оценка и усъвършенстване на резултатите чрез итеративна самооценка.
Тази функция за самооценка се е оказала безценна в кодовите среди, както отбеляза Jain, казвайки: "Способността да оценявате работата си и да правите корекции е от съществено значение за постигане на точни решения."
Той също така критикува текущото използване на AI инструменти в творческите сектори, които често изискват обширно подканване между множество модели. В контекста на това, Luma Agents генерират множество вариации и позволяват на потребителите да ръководят творческия процес чрез разговор.
"С обединената интелигентност, тези модели не само генерират съдържание, но и го разбират, което ни позволява да създадем система, способна да изпълнява задачи от край до край," отбеляза Jain.
За да илюстрира потенциала на системата, Jain сподели пример, при който прост 200-думиен бриф и продуктово изображение доведоха до множество идеи за рекламна кампания, демонстрирайки ефективността на Luma Agents. В друг случай, те трансформираха рекламна кампания за 15 милиона долара в множество локализирани реклами за само 40 часа и под 20 000 долара, като същевременно спазиха стандартите за качество на марката.
Luma Agents в момента са достъпни чрез API, с планове за постепенно разширяване на достъпа, за да се осигури последователен достъп за потребителите и да се минимизират прекъсванията в работния процес.