28 марта 2024

🆕 В 30 раз быстрее: MIT представляет ИИ-инструмент, создающий высококачественные картинки

Miroslav Kungurov

Пишу об IT и на Python. kungurov.net

Исследователи из MIT разработали новый подход к генерации изображений с помощью ИИ под названием distribution matching distillation (DMD), который значительно ускоряет процесс создания высококачественных картинок.

Хочешь уверенно проходить IT-интервью?

Готовься к IT-собеседованиям уверенно с AI-тренажёром T1!

Мы понимаем, как сложно подготовиться: стресс, алгоритмы, вопросы, от которых голова идёт кругом. Но с AI тренажёром всё гораздо проще.

💡 Почему Т1 тренажёр — это мастхэв?

Получишь настоящую обратную связь: где затык, что подтянуть и как стать лучше
Научишься не только решать задачи, но и объяснять своё решение так, чтобы интервьюер сказал: "Вау!".
Освоишь все этапы собеседования, от вопросов по алгоритмам до диалога о твоих целях.

Зачем листать миллион туториалов? Просто зайди в Т1 тренажёр, потренируйся и уверенно удиви интервьюеров. Мы не обещаем лёгкой прогулки, но обещаем, что будешь готов!

Реклама. ООО «Смарт Гико», ИНН 7743264341. Erid 2VtzqwP8vqy

Генераторы изображений на основе ИИ обычно работают через процесс, известный как «диффузия». По сути, модель, генерирующая изображение, начинает с очень расплывчатой, размытой картинки, и последовательные шаги сэмплирования уточняют изображение, пока оно не станет четким и реалистичным. Диффузия обычно является трудоемким процессом, требующим множества шагов, но исследователи из MIT нашли лучший способ.

Источник: <a href="https://hothardware.com/news/mit-dmd-image-diffusion" target="_blank" rel="noopener noreferrer nofollow">hothardware.com</a> — Источник: hothardware.com

Используя новый подход под названием distribution matching distillation (DMD), исследователи из Лаборатории компьютерных наук и искусственного интеллекта MIT сумели сократить процесс диффузии до одного шага сэмплирования. Очевидно, это намного быстрее, чем обычно требуется для типичных процессов диффузии изображений, где необходимо итерировать изображение от тридцати до пятидесяти раз. Полученные результаты также неплохи; взгляните:

🎨 Библиотека нейрокартинок

Все самое полезное про нейросети для генерации изображений вы найдете на нашем телеграм-канале «Библиотека нейрокартинок»

Есть также видео, которое наглядно демонстрирует улучшение производительности. В то время как Stable Diffusion 1.5 требует около полутора секунд для создания изображения на современном оборудовании, новая модель MIT на основе DMD занимает около пяти сотых секунды.

Модели, такие как Instaflow и LCM, пытались сделать то же самое, что и DMD от MIT, с иногда сомнительными результатами. Как и во многих вещах в вычислительной технике, это компромисс между качеством и производительностью. Новый метод MIT, похоже, предлагает лучшее из обоих миров, с балансом между скоростью генерации и детализацией изображения.

Это также не первый случай, когда люди придумали, как выполнять диффузию за гораздо меньшее количество шагов; в частности, сама Stability AI создала модель под названием Stable Diffusion Turbo, которая может генерировать изображения с разрешением 1 мегапиксель за один шаг диффузии, хотя результаты, как правило, лучше с несколькими дополнительными шагами. Stable Diffusion Turbo работает очень похожим образом на подход DMD от MIT; она использует меньшую модель, обученную на выходных данных Stable Diffusion XL, чтобы «вести» модель Turbo к тому, что производила бы полная модель SDXL.

Stable Diffusion Turbo также дает отличные результаты за секунду или две на современном оборудовании. Источник: <a href="https://hothardware.com/news/mit-dmd-image-diffusion" target="_blank" rel="noopener noreferrer nofollow">hothardware.com</a> — Stable Diffusion Turbo также дает отличные результаты за секунду или две на современном оборудовании. Источник: hothardware.com

Источники

https://hothardware.com/news/mit-dmd-image-diffusion

🆕 В 30 раз быстрее: MIT представляет ИИ-инструмент, создающий высококачественные картинки

Miroslav Kungurov

Хочешь уверенно проходить IT-интервью?

Источники

МЕРОПРИЯТИЯ

Система Хак: Нижний Новгород

Комментарии

ВАКАНСИИ

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ

🔈16+ лучших нейронок для синтеза речи

🤖 Создание собственного ИИ-бота на Python за 33 строчки кода

🤖 Нейронки кодят за вас: 28 AI-сервисов в помощь разработчику

Хочешь уверенно проходить IT-интервью?

Источники

Система Хак: Нижний Новгород

🔈16+ лучших нейронок для синтеза речи

🤖 Создание собственного ИИ-бота на Python за 33 строчки кода

🤖 Нейронки кодят за вас: 28 AI-сервисов в помощь разработчику

Подтверждение

Авторизация

Письмо отправлено

Во время авторизации произошла ошибка

Что не так с этим материалом?

Что не так с этим комментарием?

Что не так с этим тестом?

Что не так с этой вакансией?

Что не так с этим мероприятием?

Какой баг вы нашли?

Заполните, пожалуйста, форму, чтобы мы могли с Вами связаться