28 марта 2024

🆕 В 30 раз быстрее: MIT представляет ИИ-инструмент, создающий высококачественные картинки

Пишу об IT и на Python. kungurov.net
Исследователи из MIT разработали новый подход к генерации изображений с помощью ИИ под названием distribution matching distillation (DMD), который значительно ускоряет процесс создания высококачественных картинок.
🆕 В 30 раз быстрее: MIT представляет ИИ-инструмент, создающий высококачественные картинки

Хочешь уверенно проходить IT-интервью?

Готовься к IT-собеседованиям уверенно с AI-тренажёром T1!

Мы понимаем, как сложно подготовиться: стресс, алгоритмы, вопросы, от которых голова идёт кругом. Но с AI тренажёром всё гораздо проще.

💡 Почему Т1 тренажёр — это мастхэв?

  • Получишь настоящую обратную связь: где затык, что подтянуть и как стать лучше
  • Научишься не только решать задачи, но и объяснять своё решение так, чтобы интервьюер сказал: "Вау!".
  • Освоишь все этапы собеседования, от вопросов по алгоритмам до диалога о твоих целях.

Зачем листать миллион туториалов? Просто зайди в Т1 тренажёр, потренируйся и уверенно удиви интервьюеров. Мы не обещаем лёгкой прогулки, но обещаем, что будешь готов!

Реклама. ООО «Смарт Гико», ИНН 7743264341. Erid 2VtzqwP8vqy


Генераторы изображений на основе ИИ обычно работают через процесс, известный как «диффузия». По сути, модель, генерирующая изображение, начинает с очень расплывчатой, размытой картинки, и последовательные шаги сэмплирования уточняют изображение, пока оно не станет четким и реалистичным. Диффузия обычно является трудоемким процессом, требующим множества шагов, но исследователи из MIT нашли лучший способ.

Источник: <a href="https://hothardware.com/news/mit-dmd-image-diffusion" target="_blank" rel="noopener noreferrer nofollow">hothardware.com</a>
Источник: hothardware.com

Используя новый подход под названием distribution matching distillation (DMD), исследователи из Лаборатории компьютерных наук и искусственного интеллекта MIT сумели сократить процесс диффузии до одного шага сэмплирования. Очевидно, это намного быстрее, чем обычно требуется для типичных процессов диффузии изображений, где необходимо итерировать изображение от тридцати до пятидесяти раз. Полученные результаты также неплохи; взгляните:

Источник: <a href="https://hothardware.com/news/mit-dmd-image-diffusion" target="_blank" rel="noopener noreferrer nofollow">hothardware.com</a>
Источник: hothardware.com
🎨 Библиотека нейрокартинок
Все самое полезное про нейросети для генерации изображений вы найдете на нашем телеграм-канале «Библиотека нейрокартинок»

Есть также видео, которое наглядно демонстрирует улучшение производительности. В то время как Stable Diffusion 1.5 требует около полутора секунд для создания изображения на современном оборудовании, новая модель MIT на основе DMD занимает около пяти сотых секунды.

Модели, такие как Instaflow и LCM, пытались сделать то же самое, что и DMD от MIT, с иногда сомнительными результатами. Как и во многих вещах в вычислительной технике, это компромисс между качеством и производительностью. Новый метод MIT, похоже, предлагает лучшее из обоих миров, с балансом между скоростью генерации и детализацией изображения.

Источник: <a href="https://hothardware.com/news/mit-dmd-image-diffusion" target="_blank" rel="noopener noreferrer nofollow">hothardware.com</a>
Источник: hothardware.com

Это также не первый случай, когда люди придумали, как выполнять диффузию за гораздо меньшее количество шагов; в частности, сама Stability AI создала модель под названием Stable Diffusion Turbo, которая может генерировать изображения с разрешением 1 мегапиксель за один шаг диффузии, хотя результаты, как правило, лучше с несколькими дополнительными шагами. Stable Diffusion Turbo работает очень похожим образом на подход DMD от MIT; она использует меньшую модель, обученную на выходных данных Stable Diffusion XL, чтобы «вести» модель Turbo к тому, что производила бы полная модель SDXL.

Stable Diffusion Turbo также дает отличные результаты за секунду или две на современном оборудовании. Источник: <a href="https://hothardware.com/news/mit-dmd-image-diffusion" target="_blank" rel="noopener noreferrer nofollow">hothardware.com</a>
Stable Diffusion Turbo также дает отличные результаты за секунду или две на современном оборудовании. Источник: hothardware.com

Источники

МЕРОПРИЯТИЯ

Комментарии

ВАКАНСИИ

Добавить вакансию
Hotel Search Team Lead (Golang)
по итогам собеседования
Golang-разработчик
Пермь, по итогам собеседования

ЛУЧШИЕ СТАТЬИ ПО ТЕМЕ