Technik fortgeschritten

Consume-Ordner

Ein Consume-Ordner ist ein überwachtes Verzeichnis in Dokumentenmanagementsystemen, in das neue Dateien abgelegt werden, die dann automatisch eingelesen, verarbeitet und ins System übernommen werden.

Ausführliche Erklärung

Der Consume-Ordner fungiert als digitaler Eingangskorb für Dokumentenmanagementsysteme. Jede Datei, die in diesem Ordner abgelegt wird, wird vom DMS automatisch erkannt, eingelesen und anschließend aus dem Verzeichnis entfernt. Die Überwachung erfolgt entweder durch Dateisystem-Benachrichtigungen oder durch regelmäßiges Polling in konfigurierbaren Intervallen. Nach der Erfassung durchlaufen die Dokumente typischerweise eine automatische Texterkennung per OCR, werden indexiert und ins Archiv übernommen.

Der Consume-Ordner ist besonders für KMU relevant, die Dokumente aus verschiedenen Quellen automatisiert verarbeiten möchten. Scanner können direkt in diesen Ordner speichern, E-Mail-Anhänge können automatisch dorthin weitergeleitet werden, oder mobile Apps synchronisieren gescannte Belege. Die Art der Übertragung spielt keine Rolle – ob per Netzwerkfreigabe, FTP, SFTP oder Synchronisationsdienste. Wichtig ist nur, dass das DMS Lese- und Schreibrechte für den Ordner besitzt.

Fortgeschrittene Systeme unterstützen Unterordner innerhalb des Consume-Verzeichnisses. Diese können genutzt werden, um bereits beim Ablegen Metadaten wie Tags oder Kategorien automatisch zuzuweisen. Eine Datei im Unterordner „Rechnungen" erhält beispielsweise automatisch das entsprechende Schlagwort. Über Workflows lassen sich zudem Regeln definieren, die basierend auf dem Ablageort bestimmte Berechtigungen setzen oder Dokumente automatisch bestimmten Benutzern zuordnen.

Die Verarbeitung erfolgt asynchron über Task-Prozessoren, die Redis oder ähnliche Message-Broker nutzen. Dabei wird das Originaldokument unverändert archiviert, während parallel eine OCR-verarbeitete Version für die Volltextsuche erstellt wird. Bei Berechtigungsproblemen, unvollständig übertragenen Dateien oder doppelten Erfassungsversuchen protokolliert das System Fehler, die über das Admin-Interface einsehbar sind.

Praxisbeispiel

Ein 12-Personen-Steuerberatungsbüro in Graz nutzt Paperless-ngx mit einem Netzwerkscanner. Der Scanner ist so konfiguriert, dass er Belege direkt per SFTP in Unterordner des Consume-Verzeichnisses ablegt: Knopf 1 speichert in „consume/eingangsrechnungen", Knopf 2 in „consume/klientenpost". Das DMS erkennt die Dokumente innerhalb von 15 Sekunden, führt automatisch die Texterkennung durch und ordnet sie anhand der Unterordner-Namen den richtigen Kategorien zu. Die Mitarbeitenden müssen nur noch am Bildschirm die korrekte Zuordnung zum Mandanten vornehmen – die physische Ablage entfällt komplett.

Code-Beispiel

# Docker-Compose-Konfiguration für Consume-Ordner (Paperless-ngx)
volumes:
  - ./consume:/usr/src/paperless/consume

environment:
  # Polling für Netzwerkfreigaben aktivieren (in Sekunden)
  PAPERLESS_CONSUMER_POLLING: 30
  # Unterordner rekursiv überwachen
  PAPERLESS_CONSUMER_RECURSIVE: 1

Ausführliche Erklärung

Praxisbeispiel

Code-Beispiel

Quellen

Vertiefende Artikel im KI-Hub

Paperless-ngx: Dokumentenmanagement selbst hosten & automatisieren