Что такое Векторная база данных
Подробнее
Обычная БД (PostgreSQL, MySQL) хранит структурированные данные и поддерживает точный поиск (WHERE column = value). Векторная БД оптимизирована под другую задачу: поиск похожих векторов.
Каждый документ через embedding-модель превращается в вектор (например, 1536 чисел). Векторная БД находит k-ближайших векторов к запросу за миллисекунды (через индексы HNSW, IVF).
Топ-варианты 2026: pgvector (расширение PostgreSQL — проще всего, если уже есть PG), Pinecone (managed, для скорости), Weaviate (open-source, гибкий), Qdrant (Rust, быстрый), Chroma (для прототипов).
Для старта рекомендуем pgvector — добавляется в существующий PostgreSQL одной командой, миллионы векторов работают без оптимизаций.
Примеры
- pgvector — расширение PostgreSQL
- Pinecone — managed cloud
- Weaviate — open-source
- Qdrant — Rust-based, быстрый
- Chroma — для прототипов
Частые вопросы
Что такое векторная БД простыми словами?
Это «хранилище для умных координат». Вместо точного поиска (WHERE name = 'X') ищет ближайшие по смыслу записи. Используется в RAG-системах.
Какую векторную БД выбрать?
Если уже есть PostgreSQL — pgvector (одна команда установки). Для миллионов векторов и скорости — Pinecone. Для open-source — Weaviate или Qdrant.
Сколько данных можно хранить?
pgvector — до 100M векторов на одной ноде. Pinecone — миллиарды (за деньги). Для типичного RAG с 100K документов хватит любой.
Сколько стоит?
pgvector — бесплатно (часть PostgreSQL). Pinecone — от $70/мес за 1M векторов. Weaviate / Qdrant — бесплатно при self-hosted.