Диффузионная модель (diffusion model)
Диффузионная модель — это тип нейросети, которая училась превращать чистый шум в осмысленное изображение, постепенно его «расшумляя». На диффузии построены большинство современных генераторов: Stable Diffusion, DALL-E, Midjourney, Sora, Veo, Nano Banana.
Идея диффузионной модели вдохновлена физикой: представьте, что вы капнули чернила в воду — они постепенно расходятся (диффундируют). Если этот процесс «обратить», то можно из размытого облака собрать чёткую каплю. Диффузионная модель училась именно «обратной диффузии» для пикселей.
Тренировка идёт в две стадии. Первая — модели показывают тысячи изображений и постепенно добавляют к ним шум, пока не остаётся «снежок». Вторая — модель учится повторять этот процесс в обратную сторону: из шума восстанавливать оригинал. После обучения, если задать промпт «кошка в шляпе», модель начинает с чистого шума и за 20-50 шагов выводит результат.
В 2026 году все топ-генераторы изображений и видео — диффузионные: Nano Banana Pro, Seedream 4.5, GPT Image 2, Sora 2, Veo 3.1. Различия — в архитектуре (UNet, Transformer), скорости (Flow Matching, Consistency Models), качестве данных и подсчётах.
Примеры
- →Stable Diffusion (2022) — первая массовая open-source диффузия
- →DALL-E 3 / GPT Image — диффузия от OpenAI
- →Midjourney V6 — закрытая диффузия с упором на эстетику
- →Sora 2 / Veo 3.1 — видео-диффузии 2026 года
- →Nano Banana Pro — диффузия 4K с упором на лица и текст
Связанные термины
Часто задаваемые вопросы
Что такое диффузионная модель в нейросетях?
Тип нейросети для генерации изображений и видео, которая работает через постепенное «расшумление» — начинает с чистого шума и за 20-50 шагов превращает его в осмысленный результат. На диффузии работают почти все современные генераторы.
Чем диффузия отличается от GAN?
GAN (Generative Adversarial Network) — старая архитектура из двух сетей-конкурентов: генератор делает фейк, дискриминатор пытается отличить от настоящего. Диффузия одна нейросеть, тренировка стабильнее, качество выше. С 2022 года GAN практически уступили диффузионным моделям в image-gen.
Какие диффузионные модели работают в России?
На gptrf.ru — Nano Banana Pro, Seedream 4.5, GPT Image 2, Sora 2, Veo 3.1, Kling 2.6, Seedance 2 — все без VPN, оплата в рублях. Также есть отечественный Kandinsky 4.0 от Сбера и YandexART.
Попробуйте нейросети на практике
30₽ при регистрации, без VPN, оплата в рублях.
Зарегистрироваться