KI-Grundlagen fortgeschritten

RAG (Retrieval Augmented Generation)

Verfahren, das ein Sprachmodell mit aktuellen Quellen kombiniert, indem relevante Dokumente zur Laufzeit gesucht und in den Kontext eingespeist werden.

Ausführliche Erklärung

Retrieval Augmented Generation, kurz RAG, löst eines der zentralen Probleme klassischer Sprachmodelle: ihr Wissen ist auf den Trainingszeitpunkt fixiert und kann veralten oder unvollständig sein. Statt das Modell selbst neu zu trainieren – ein aufwändiger und teurer Prozess – kombiniert RAG ein bestehendes Sprachmodell mit einem externen Datenspeicher.

Der Ablauf in vereinfachter Form: Eine Frage oder Anweisung wird zunächst in eine semantische Repräsentation umgewandelt. Diese Repräsentation dient als Suchschlüssel in einer Datenbank, die typischerweise firmeneigene Dokumente, Anleitungen oder Wissensartikel enthält. Die relevantesten Treffer werden dem Sprachmodell zusammen mit der ursprünglichen Frage übergeben. Das Modell formuliert dann eine Antwort, die sich auf die gefundenen Quellen stützt.

Für KMU ist RAG besonders relevant, wenn Mitarbeitende Zugriff auf interne Dokumente erhalten sollen, ohne die sensiblen Daten an externe Trainingsprozesse zu übergeben. Die Trennung zwischen Sprachfähigkeit und Wissensquelle macht das Verfahren auch DSGVO-tauglich, sofern der Datenspeicher selbst gehostet oder bei einem geeigneten Anbieter betrieben wird.

Praxisbeispiel

Eine Steuerberatungskanzlei mit drei Beratenden setzt RAG ein, um auf Mandanten-Unterlagen, aktuelle Gesetzes-Updates und interne Notizen zugreifen zu können. Mitarbeitende stellen Fragen in natürlicher Sprache, etwa „Welche Investitionsabschreibung ist für Mandant X im Jahr 2026 möglich?". Das System sucht die relevanten Akten, übergibt sie dem Sprachmodell, und liefert eine Antwort mit direkter Referenz auf die Quelle. So entsteht aus zehn Stunden Recherche pro Woche etwa eine Stunde gezielter Verifikation.

Quellen

Zuletzt aktualisiert: 7. Mai 2026