Векторная база данных

vector databaseвекторная БДpgvectorPinecone
Кратко

Векторная база данных — специализированное хранилище для embedding-векторов. Поддерживает поиск ближайших соседей (k-NN) по косинусному расстоянию. Основа RAG-систем 2026.

Обычная БД (PostgreSQL, MySQL) хранит структурированные данные и поддерживает точный поиск (WHERE column = value). Векторная БД оптимизирована под другую задачу: поиск похожих векторов.

Каждый документ через embedding-модель превращается в вектор (например, 1536 чисел). Векторная БД находит k-ближайших векторов к запросу за миллисекунды (через индексы HNSW, IVF).

Топ-варианты 2026: pgvector (расширение PostgreSQL — проще всего, если уже есть PG), Pinecone (managed, для скорости), Weaviate (open-source, гибкий), Qdrant (Rust, быстрый), Chroma (для прототипов).

Для старта рекомендуем pgvector — добавляется в существующий PostgreSQL одной командой, миллионы векторов работают без оптимизаций.

Примеры

  • pgvector — расширение PostgreSQL
  • Pinecone — managed cloud
  • Weaviate — open-source
  • Qdrant — Rust-based, быстрый
  • Chroma — для прототипов

Связанные термины

Часто задаваемые вопросы

Что такое векторная БД простыми словами?

Это «хранилище для умных координат». Вместо точного поиска (WHERE name = 'X') ищет ближайшие по смыслу записи. Используется в RAG-системах.

Какую векторную БД выбрать?

Если уже есть PostgreSQL — pgvector (одна команда установки). Для миллионов векторов и скорости — Pinecone. Для open-source — Weaviate или Qdrant.

Сколько данных можно хранить?

pgvector — до 100M векторов на одной ноде. Pinecone — миллиарды (за деньги). Для типичного RAG с 100K документов хватит любой.

Сколько стоит?

pgvector — бесплатно (часть PostgreSQL). Pinecone — от $70/мес за 1M векторов. Weaviate / Qdrant — бесплатно при self-hosted.

Попробуйте нейросети на практике

30₽ при регистрации, без VPN, оплата в рублях.

Зарегистрироваться