Суркова Анастасия

DeepSeek снова наносит удар, создав генератор изображений на основе ИИ Janus-Pro

Если запуск новой модели искусственного интеллекта, потрясший всю индустрию, был недостаточным, то на этой неделе китайский стартап DeepSeek выпустил генератор изображений с искусственным интеллектом, который, по его словам, обеспечивает «значительный прогресс как в мультимодальном понимании, так и в возможности следования инструкциям от текста к изображению». Новая модель генерации изображений называется Janus-Pro и призвана составить конкуренцию таким американским аналогам, как DALL-E 3 и Stable Diffusion.

Новая модель утверждает, что превосходит своих конкурентов в таких областях, как качество и точность изображения.

Запуск Janus-Pro состоялся всего через несколько дней после выхода модели R1 компании DeepSeek, которая произвела фурор своими молниеносными и логичными реакциями, а также тем, что ее можно было обучить быстрее и за меньшую стоимость, чем американские модели.

Сообщается, что модель DeepSeek работает на менее совершенных чипах Nvidia, что вызывает вопросы о том, как Китай может конкурировать, не имея доступа к передовым технологиям США. В последнее время приложение для iOS обогнало ChatGPT по количеству загрузок в Apple App Store и по состоянию на 31 января по-прежнему является бесплатным приложением № 1.

Эти два релиза свидетельствуют о стремлении Китая закрепиться в растущей гонке вооружений в области ИИ. Между тем, на прошлой неделе президент Дональд Трамп объявил о новой инфраструктурной инициативе в области ИИ, пообещав выделить до 500 миллионов долларов на сотрудничество с OpenAI и другими технологическими компаниями.

Выпуск R1 и Janus-Pro также совпадает с усилением внимания к китайским технологическим компаниям: напряженность в связи с проблемами конфиденциальности данных TikTok уже возросла.

Во введении на странице загрузки DeepSeek пишет: “Janus-Pro превосходит свою предыдущую унифицированную модель и соответствует или превосходит производительность моделей, ориентированных на конкретные задачи. Простота, высокая гибкость и эффективность Janus-Pro делают ее сильным кандидатом на создание унифицированных мультимодальных моделей следующего поколения”.

Размер модели варьируется от 1 миллиарда до 7 миллиардов параметров, что является ключевым фактором в ее возможностях решения задач.

Компания называет Janus-Pro «новой авторегрессионной системой», которая решает предыдущие проблемы, разделяя этапы анализа и генерации изображений, но при этом используя единую, унифицированную систему для обработки всех данных.

«Разделение не только снимает конфликт между ролями визуального кодера в понимании и генерации, но и повышает гибкость фреймворка», — пишет DeepSeek.

В настоящее время Janus-Pro доступен для загрузки на платформе разработчиков ИИ Hugging Face.

Источник: New-Science.ru https://new-science.ru/deepseek-snova-nanosit-udar-sozdav-generator-izobrazhenij-na-osnove-ii-janus-pro/

 

Чтобы оставить комментарий, необходимо зарегистрироваться или войти.