DeepSeek снова наносит удар, создав генератор изображений на основе ИИ Janus-Pro
Если запуск новой модели искусственного интеллекта, потрясший всю индустрию, был недостаточным, то на этой неделе китайский стартап DeepSeek выпустил генератор изображений с искусственным интеллектом, который, по его словам, обеспечивает «значительный прогресс как в мультимодальном понимании, так и в возможности следования инструкциям от текста к изображению». Новая модель генерации изображений называется Janus-Pro и призвана составить конкуренцию таким американским аналогам, как DALL-E 3 и Stable Diffusion.
Новая модель утверждает, что превосходит своих конкурентов в таких областях, как качество и точность изображения.
Запуск Janus-Pro состоялся всего через несколько дней после выхода модели R1 компании DeepSeek, которая произвела фурор своими молниеносными и логичными реакциями, а также тем, что ее можно было обучить быстрее и за меньшую стоимость, чем американские модели.
Сообщается, что модель DeepSeek работает на менее совершенных чипах Nvidia, что вызывает вопросы о том, как Китай может конкурировать, не имея доступа к передовым технологиям США. В последнее время приложение для iOS обогнало ChatGPT по количеству загрузок в Apple App Store и по состоянию на 31 января по-прежнему является бесплатным приложением № 1.
Эти два релиза свидетельствуют о стремлении Китая закрепиться в растущей гонке вооружений в области ИИ. Между тем, на прошлой неделе президент Дональд Трамп объявил о новой инфраструктурной инициативе в области ИИ, пообещав выделить до 500 миллионов долларов на сотрудничество с OpenAI и другими технологическими компаниями.
Выпуск R1 и Janus-Pro также совпадает с усилением внимания к китайским технологическим компаниям: напряженность в связи с проблемами конфиденциальности данных TikTok уже возросла.
Во введении на странице загрузки DeepSeek пишет: “Janus-Pro превосходит свою предыдущую унифицированную модель и соответствует или превосходит производительность моделей, ориентированных на конкретные задачи. Простота, высокая гибкость и эффективность Janus-Pro делают ее сильным кандидатом на создание унифицированных мультимодальных моделей следующего поколения”.
Размер модели варьируется от 1 миллиарда до 7 миллиардов параметров, что является ключевым фактором в ее возможностях решения задач.
Компания называет Janus-Pro «новой авторегрессионной системой», которая решает предыдущие проблемы, разделяя этапы анализа и генерации изображений, но при этом используя единую, унифицированную систему для обработки всех данных.
«Разделение не только снимает конфликт между ролями визуального кодера в понимании и генерации, но и повышает гибкость фреймворка», — пишет DeepSeek.
В настоящее время Janus-Pro доступен для загрузки на платформе разработчиков ИИ Hugging Face.
Источник: New-Science.ru https://new-science.ru/deepseek-snova-nanosit-udar-sozdav-generator-izobrazhenij-na-osnove-ii-janus-pro/