Глубокое обучение (deep learning)
Глубокое обучение (deep learning) — подраздел машинного обучения, в котором используются нейронные сети с большим количеством слоёв (до сотен и тысяч). На deep learning построены ChatGPT, Claude, Gemini, Sora, Midjourney и почти все современные ИИ-продукты.
Идея нейросетей появилась в 1958 году (perceptron Фрэнка Розенблатта), но долго не работала из-за слабых компьютеров. В 2012 году AlexNet выиграла ImageNet с помощью «глубокой» свёрточной сети (8 слоёв) — это положило начало эры deep learning.
Ключ deep learning — иерархия признаков. Первые слои сети учатся простым вещам (грани, цвета). Средние — комбинациям (геометрические формы). Глубокие — высокоуровневым понятиям (лица, объекты, идеи). За счёт многослойности сеть может решать задачи которые классический ML не может — распознавание изображений, перевод, диалог.
В 2026 «deep learning» — синоним современного ИИ. Все топ-продукты — это deep learning: LLM на трансформерах (GPT-5.4, Claude), diffusion-модели для изображений (Nano Banana Pro), модели речи (ElevenLabs), модели видео (Sora 2). Объёмы: топ-LLM имеют сотни миллиардов параметров и обучаются на тысячах GPU неделями.
Примеры
- →ChatGPT, Claude, Gemini — LLM на трансформерах
- →Nano Banana Pro, Stable Diffusion — diffusion-модели
- →Sora 2, Veo 3.1 — видео-диффузия
- →ElevenLabs — модели TTS на трансформерах
- →AlexNet (2012) — историческая первая deep CNN
Связанные термины
Часто задаваемые вопросы
Что такое deep learning простыми словами?
Это нейронные сети с большим количеством слоёв. Каждый следующий слой видит более абстрактные признаки. Это позволяет сети решать сложные задачи которые классический ML не может: распознавание лиц, перевод текста, диалог, генерация картинок.
Чем deep learning отличается от обычного ML?
Классический ML работает на табличных данных через простые алгоритмы (деревья, регрессия). Deep learning — нейросети с многослойной архитектурой, нужны для сложных типов данных (изображения, текст, аудио, видео).
Нужны ли мощные компьютеры для deep learning?
Для тренировки топ-моделей — да, тысячи GPU. Для использования (inference) — обычно достаточно облачного API (OpenAI, Anthropic, gptrf.ru). Локальный запуск open-source моделей — нужна видеокарта 16-80 ГБ VRAM.
Какие продукты на deep learning доступны в России?
На gptrf.ru: LLM (GPT-5.4, Claude, Gemini, Grok, DeepSeek), image-models (Nano Banana, Seedream, GPT Image), video (Sora 2, Veo 3.1, Kling, Seedance), audio (ElevenLabs). Все без VPN, оплата в рублях.
Попробуйте нейросети на практике
30₽ при регистрации, без VPN, оплата в рублях.
Зарегистрироваться