Embedding-модели + векторная БД = поиск по смыслу. На ГПТ Россия — OpenAI-совместимое API.
Семантический поиск по embedding-векторам. Основа RAG-систем. Подходит для корпоративного чат-бота по документации, рекомендаций, дедупликации.
5 шагов:
OpenAI text-embedding-3-large (универсальный лидер). Cohere embed-multilingual-v3 (для ru-en). На gptrf.ru через OpenAI-совместимое API.
Зависит от длины. Условно 100-500₽ на 1000 документов средней длины.
pgvector (если уже есть PostgreSQL — проще всего). Pinecone (managed, для скорости). Weaviate / Qdrant (open-source). Для старта — pgvector.
30₽ на балансе при регистрации. Без VPN, оплата в рублях.
Зарегистрироваться бесплатно