Что такое векторный поиск
Семантический поиск по embedding-векторам. Основа RAG-систем. Подходит для корпоративного чат-бота по документации, рекомендаций, дедупликации.
Workflow
5 шагов:
- 1) Разбить документы на куски (chunking)
- 2) Сгенерировать embedding каждого куска (OpenAI text-embedding-3-large)
- 3) Сохранить в векторную БД (pgvector, Pinecone, Weaviate)
- 4) При запросе — embedding запроса + поиск ближайших векторов
- 5) Подсунуть найденные куски в контекст LLM (Claude/GPT/Gemini)
Доступные модели
Часто задаваемые вопросы
Какая embedding-модель лучшая в 2026?
OpenAI text-embedding-3-large (универсальный лидер). Cohere embed-multilingual-v3 (для ru-en). На gptrf.ru через OpenAI-совместимое API.
Сколько стоит embedding 1000 документов?
Зависит от длины. Условно 100-500₽ на 1000 документов средней длины.
Какая векторная БД лучше для RAG?
pgvector (если уже есть PostgreSQL — проще всего). Pinecone (managed, для скорости). Weaviate / Qdrant (open-source). Для старта — pgvector.
Начните использовать ИИ прямо сейчас. 50 ₽ на балансе при регистрации. Без VPN, оплата в рублях через карту или СБП.
Зарегистрироваться бесплатно
Зарегистрироваться бесплатно
