1

Claude Haiku 4.5

Claude · Быстрая и умная

~150 мс TTFT, стабильность на edge cases.

  • ~150 мс
  • Стабильность
2

Gemini 3 Flash

Gemini · Быстрый reasoning, 1M контекст

~100-200 мс TTFT, multimodal.

  • Multimodal
  • Скорость
3

GPT-4o Mini

ChatGPT · Быстрая и экономичная

~200 мс, проверенный для интеграций OpenAI.

  • Экосистема
4

Grok 4 Fast

Grok · Быстрый и креативный

Быстрая модель xAI с web-search в real-time.

  • Real-time данные
5

Gemini 2.5 Flash

Gemini · Быстрая с огромным контекстом

Стабильная классика среди flash-моделей.

  • Дешево

Частые вопросы

Какой TTFT у топ-моделей?

Haiku 4.5 ~150 мс, Gemini 3 Flash ~100-200 мс, GPT-4o Mini ~200 мс, Grok 4 Fast ~150-250 мс.

Помогает ли streaming?

Да, для UX. Пользователь видит ответ по мере генерации — снижает воспринимаемое ожидание.

Как ускорить ответы?

1) Выбрать Mini/Flash/Haiku. 2) Streaming. 3) Уменьшить промпт. 4) RAG вместо длинного контекста.

Цены?

Все модели — копейки за миллион токенов на gptrf.ru.

Все модели — в одной подписке

От 990 ₽ в месяц, без VPN, в рублях, серверы в России. 50 ₽ бонусом сразу при регистрации.

Запустить быструю модель