Technik fortgeschritten

pgvector (PostgreSQL-Extension für Vektordatenbanken)

pgvector ist eine Open-Source-Extension für PostgreSQL, die die Datenbank um Vektorsuche erweitert. Sie ermöglicht die Speicherung und semantische Suche von Vektor-Embeddings direkt in PostgreSQL, ohne eine separate Vektordatenbank.

Ausführliche Erklärung

pgvector fügt PostgreSQL einen speziellen Datentyp für hochdimensionale Vektoren hinzu und ermöglicht damit Ähnlichkeitssuchen direkt über Standard-SQL-Abfragen. Die Extension unterstützt verschiedene Distanzmetriken wie Cosinus-Ähnlichkeit, euklidische Distanz und Inner Product sowie zwei Indextypen: HNSW (Hierarchical Navigable Small Worlds) für bessere Suchperformance und IVFFlat für schnelleren Indexaufbau. Vektoren sind numerische Repräsentationen von Daten – beispielsweise können Texte, Bilder oder Audiodateien durch KI-Modelle in Embeddings umgewandelt werden, die ihre semantische Bedeutung erfassen.

Für KMU ist pgvector besonders relevant, wenn bereits PostgreSQL im Einsatz ist. Statt eine zusätzliche spezialisierte Vektordatenbank einzuführen, können traditionelle relationale Daten und Vektor-Embeddings in derselben Datenbank gespeichert werden. Das vereinfacht die Architektur erheblich: keine separate Synchronisation, keine zusätzlichen Deployments, keine weiteren Zugriffsdaten. Die Integration erfolgt nahtlos – strukturierte Daten und semantische Suche lassen sich in einer einzigen Abfrage kombinieren.

Die Extension eignet sich insbesondere für moderate Datenmengen von einigen tausend bis mehreren Millionen Vektoren und ist damit für typische KMU-Anwendungen wie interne Wissenssuche, RAG-Systeme (Retrieval-Augmented Generation) oder Produktempfehlungen gut dimensioniert. PostgreSQL mit pgvector kann auf eigener Infrastruktur betrieben werden, was DSGVO-konforme Datenverarbeitung ohne Abhängigkeit von Cloud-Anbietern ermöglicht.

Zu beachten ist: Ohne Indexierung arbeitet pgvector mit exakter Suche, was bei größeren Datenmengen langsam wird. Mit Index erfolgt eine approximative Nearest-Neighbor-Suche, die schneller ist, aber möglicherweise nicht alle relevanten Ergebnisse findet. Diese Trade-offs zwischen Geschwindigkeit und Genauigkeit müssen für den jeweiligen Anwendungsfall abgewogen werden. Für sehr große Datensätze (mehrere hundert Millionen Vektoren) oder hochspezialisierte Anforderungen können dedizierte Vektordatenbanken die bessere Wahl sein.

Praxisbeispiel

Eine IT-Beratung mit 35 Mitarbeitenden betreibt bereits PostgreSQL für ihr Projektmanagement-System. Für einen internen Knowledge Bot, der Fragen zu Kundenprojekten, Best Practices und internen Prozessdokumenten beantwortet, aktiviert sie pgvector als Extension. Die rund 8.000 Dokumente werden als Embeddings gespeichert und können semantisch durchsucht werden – ohne zusätzliche Datenbank-Infrastruktur aufbauen zu müssen.

Code-Beispiel

-- Extension aktivieren
CREATE EXTENSION vector;

-- Tabelle mit Vektor-Spalte anlegen
CREATE TABLE documents (
  id SERIAL PRIMARY KEY,
  content TEXT,
  embedding vector(1536)  -- z.B. OpenAI ada-002
);

-- HNSW-Index für schnelle Suche erstellen
CREATE INDEX ON documents 
USING hnsw (embedding vector_cosine_ops);

-- Ähnlichkeitssuche durchführen
SELECT content, 
       1 - (embedding <=> '[0.1, 0.2, ...]') AS similarity
FROM documents
ORDER BY embedding <=> '[0.1, 0.2, ...]'
LIMIT 5;

Ausführliche Erklärung

Praxisbeispiel

Code-Beispiel

Quellen

Vertiefende Artikel im KI-Hub

Internes Wissen für KI-Systeme nutzbar machen — RAG ohne Cloud

Was ist RAG und wann lohnt es sich wirklich? Ein Leitfaden für KMU