Multilingual v2 vs Scribe: озвучка vs распознавание. Какой инструмент ElevenLabs нужен.
Multilingual v2 — синтез речи (text-to-speech) на 29 языках. Scribe — распознавание речи (speech-to-text). Разные инструменты для разных задач.
| Параметр | ElevenLabs Multilingual v2 | ElevenLabs Scribe |
|---|---|---|
| Провайдер | ElevenLabs | ElevenLabs |
| Задача | Озвучка текста | Транскрибация |
| Качество | Премиум | Высокое |
| Скорость | Средняя | Быстрая |
| Уровень | Премиум | Бюджетная |
| Цена | от 12₽/1K символов | от 3.5₽/минута |
Multilingual v2 — для озвучки текстов (видео, аудиокниги, рассылки). Scribe — для транскрипции встреч, интервью, видео в текст.
Да, типичный пайплайн локализации видео: Scribe (транскрипция оригинала) → перевод через LLM → Multilingual v2 (озвучка перевода).
Multilingual v2 — 12₽ за 1000 знаков текста. Scribe — около 3.5₽ за минуту аудио.
Да, обе модели работают с русским на топ-уровне. Для других редких языков уточните в /generate/tts и /generate/transcribe.
Scribe даёт 95%+ точность на чистом аудио. На записях с шумом — 85-90%, рекомендуется предварительная изоляция голоса.
30₽ на балансе при регистрации. Без VPN, оплата в рублях.
Начать бесплатно