1

Claude Sonnet 4.6

Claude · Лучшая для кода и анализа

Главная LLM-часть RAG. Хорошо следует инструкциям, не галлюцинирует на контексте.

  • Следует инструкциям
2

Claude Opus 4.7

Claude · Топовая модель для агентов

Для сложного RAG с reasoning по нескольким источникам.

  • Reasoning
3

GPT-5.4

ChatGPT · 1М контекст, рассуждения и код

Альтернативный флагман. Хорошо работает с мультихоп вопросами.

  • Reasoning
4

Gemini 3.1 Pro

Gemini · 1M контекст, мультимодальная reasoning

Multimodal RAG (PDF + изображения + текст одновременно).

  • Multimodal
5

DeepSeek V3.1

DeepSeek · Топ качество за копейки

Бюджет для high-volume RAG (1000+ запросов/день).

  • Дёшево

Частые вопросы

Какая LLM лучше для RAG?

Claude Sonnet 4.6 — лидер по следованию инструкциям и низкому уровню галлюцинаций на контексте.

Какая embedding-модель?

OpenAI text-embedding-3-large (универсальный лидер) или Cohere embed-multilingual-v3 (для ru-en).

Какая векторная БД?

Для старта — pgvector (если есть PostgreSQL). Для продакшена — Pinecone или Qdrant.

Стоимость RAG-системы?

На 1000 запросов/день — 500-3000₽/мес в зависимости от выбора LLM.

Все модели — в одной подписке

От 990 ₽ в месяц, без VPN, в рублях, серверы в России. 50 ₽ бонусом сразу при регистрации.

Запустить RAG