Claude Sonnet 4.6
Лучшая для кода и анализа · от $3/1M
Главная LLM-часть RAG. Хорошо следует инструкциям, не галлюцинирует на контексте.
- +Следует инструкциям
RAG-система = embedding + векторная БД + LLM. Подборка под каждый компонент production-RAG 2026 года.
Лучшая для кода и анализа · от $3/1M
Главная LLM-часть RAG. Хорошо следует инструкциям, не галлюцинирует на контексте.
Топовая модель для агентов · от $5/1M
Для сложного RAG с reasoning по нескольким источникам.
1М контекст, рассуждения и код · от $2.5/1M
Альтернативный флагман. Хорошо работает с мультихоп вопросами.
1M контекст, мультимодальная reasoning · от $2/1M
Multimodal RAG (PDF + изображения + текст одновременно).
Топ качество за копейки · от $0.2/1M
Бюджет для high-volume RAG (1000+ запросов/день).
Стек RAG: OpenAI text-embedding-3-large + pgvector + Cohere Rerank + Sonnet 4.6.
Claude Sonnet 4.6 — лидер по следованию инструкциям и низкому уровню галлюцинаций на контексте.
OpenAI text-embedding-3-large (универсальный лидер) или Cohere embed-multilingual-v3 (для ru-en).
Для старта — pgvector (если есть PostgreSQL). Для продакшена — Pinecone или Qdrant.
На 1000 запросов/день — 500-3000₽/мес в зависимости от выбора LLM.
30₽ на балансе при регистрации. Без VPN, оплата в рублях.
Зарегистрироваться бесплатно