KI-Grundlagen einsteiger

Large Language Model (LLM)

Ein KI-Modell, das auf großen Mengen Text trainiert wurde und natürliche Sprache verstehen sowie generieren kann.

Ausführliche Erklärung

Large Language Models sind eine Form von Deep-Learning-Modellen, die durch das Training auf Milliarden von Texten Sprachmuster, Grammatik und Kontexte erlernen. Die meisten modernen LLMs basieren auf der Transformer-Architektur, die seit 2017 den Standard bildet. Im Gegensatz zu älteren sequenziellen Modellen können Transformer ganze Sätze parallel verarbeiten und durch sogenannte Self-Attention-Mechanismen komplexe Beziehungen zwischen Wörtern unabhängig von deren Position im Text erfassen.

Für Unternehmen erschließen LLMs vielfältige Einsatzmöglichkeiten: von der Automatisierung der Kundenkommunikation über die Erstellung von Texten und Zusammenfassungen bis hin zur Unterstützung bei der Wissensorganisation. Die Modelle können Anfragen in natürlicher Sprache beantworten, Dokumente analysieren, Übersetzungen erstellen oder Code generieren. Dabei lernen sie nicht durch explizite Programmierung einzelner Regeln, sondern durch selbstüberwachtes Lernen aus großen Datenmengen.

Für KMU ist relevant, dass LLMs in unterschiedlichen Varianten verfügbar sind: als cloudbasierte Dienste großer Anbieter wie OpenAI oder Anthropic, als Open-Source-Modelle, die lokal betrieben werden können, oder als spezialisierte Lösungen für bestimmte Branchen. Die Wahl hängt von Faktoren wie Datenschutzanforderungen, Budget und gewünschter Kontrolle ab. Wichtig zu beachten ist, dass LLMs auf Wahrscheinlichkeiten basieren und gelegentlich ungenaue oder erfundene Informationen ausgeben können – ein Phänomen, das als "Halluzination" bezeichnet wird.

Praxisbeispiel

Eine österreichische Steuerberatungskanzlei mit 12 Mitarbeitenden nutzt ein lokal betriebenes LLM für ihr internes Wissensmanagement. Mitarbeitende können dem System Fragen zu früheren Fällen stellen und erhalten innerhalb von Sekunden relevante Informationen aus Tausenden interner Dokumente. Dadurch reduziert sich die Recherchezeit pro Fall um durchschnittlich 30 Minuten, und das Wissen langjähriger Mitarbeitender wird strukturiert zugänglich gemacht.

Zuletzt aktualisiert: 20. Juni 2026