Векторная база данных
Векторная база данных — специализированное хранилище для embedding-векторов. Поддерживает поиск ближайших соседей (k-NN) по косинусному расстоянию. Основа RAG-систем 2026.
Обычная БД (PostgreSQL, MySQL) хранит структурированные данные и поддерживает точный поиск (WHERE column = value). Векторная БД оптимизирована под другую задачу: поиск похожих векторов.
Каждый документ через embedding-модель превращается в вектор (например, 1536 чисел). Векторная БД находит k-ближайших векторов к запросу за миллисекунды (через индексы HNSW, IVF).
Топ-варианты 2026: pgvector (расширение PostgreSQL — проще всего, если уже есть PG), Pinecone (managed, для скорости), Weaviate (open-source, гибкий), Qdrant (Rust, быстрый), Chroma (для прототипов).
Для старта рекомендуем pgvector — добавляется в существующий PostgreSQL одной командой, миллионы векторов работают без оптимизаций.
Примеры
- →pgvector — расширение PostgreSQL
- →Pinecone — managed cloud
- →Weaviate — open-source
- →Qdrant — Rust-based, быстрый
- →Chroma — для прототипов
Связанные термины
Часто задаваемые вопросы
Что такое векторная БД простыми словами?
Это «хранилище для умных координат». Вместо точного поиска (WHERE name = 'X') ищет ближайшие по смыслу записи. Используется в RAG-системах.
Какую векторную БД выбрать?
Если уже есть PostgreSQL — pgvector (одна команда установки). Для миллионов векторов и скорости — Pinecone. Для open-source — Weaviate или Qdrant.
Сколько данных можно хранить?
pgvector — до 100M векторов на одной ноде. Pinecone — миллиарды (за деньги). Для типичного RAG с 100K документов хватит любой.
Сколько стоит?
pgvector — бесплатно (часть PostgreSQL). Pinecone — от $70/мес за 1M векторов. Weaviate / Qdrant — бесплатно при self-hosted.
Попробуйте нейросети на практике
30₽ при регистрации, без VPN, оплата в рублях.
Зарегистрироваться