Multimodal-модель OpenAI: голос, изображения, текст. Без VPN.
GPT-4o (2024) — первая массовая multimodal-модель OpenAI. Поддерживает голос с низкой latency, понимает изображения, работает с PDF.
Под задачу:
5.4 для серьёзного reasoning. 4o для multimodal-задач и интеграций.
Да, через Voice API.
$2.5/$10 за миллион токенов.
30₽ на балансе при регистрации. Без VPN, оплата в рублях.
Зарегистрироваться бесплатно