Kontoauszüge, Versicherungskorrespondenz, Handwerkerrechnungen und der gleichen mehr stapelt sich im Laufe der Zeit und es macht wenig Spass, diese Dokumente so abzulegen, dass man sie gegebenenfalls auch wiederfindet. Der Open-Source-Software
paperless-ngx, meinem Raspberry Pi und einem Einzugsscanner sei Dank, habe ich aktuell sogar grad Spass am Ablegen von Dokumenten
Letztes Jahr haben meine privaten Papierstapel zugenommen, weil ich auch noch diejenigen einer nahestehenden Person verwalte. Es war eine Mischung aus Experimentierfreude, Ordnungsliebe in einer zunehmend unordentlichen Welt und schlichter Notwendigkeit, dass ich dieses Wochenende die Open-Source-Software
paperless-ngx auf meinem Raspberry Pi installiert habe (auf dem schon
Immich (siehe dieses
Blogposting) und
Home Assistant läuft.)
Paperless-ngx verarbeitet PDFs, Bilder und Office-Dokumente und lässt sie mit Metadaten wie Dokumentendatum, Absender, Dokumententyp und Schlagworten versehen. Diese Zuordnung von Metadaten kann durch den User geschehen, die Idee ist aber eigentlich, dass paperless-ngx mit maschinellem Lernen mit der Zeit merkt, welche Metadaten zu einem Dokument gehören und dann einen Bankkontoauszug automatisch der entsprechenden Bank zuordnet und als Kontoauszug ablegt. Im Idealfall kann man somit paperless-ngx ein beliebiges Dokument zum Frass vorwerfen und es wird nicht nur gespeichert, sondern auch sinnvoll abgelegt.
Paperless-ngx bietet eine Weboberfläche, auf der sich nach Dokumenten suchen lässt (inkl. Volltextsuche).
Meine Workflows:
- Scanlaufwerk auf meinem Notebook: Ich habe eine Verknüpfung eines Ordners auf meinem Raspberry Pi mit meinem Windows-Notebook hergestellt, so dass ich einzulesende Dokumente ins Laufwerk S: legen kann. Paperless überwacht diesen Ordner und verarbeitet dort liegende Dokumente nach wenigen Sekunden (und löscht die verarbeiteten Dateien danach aus dem Laufwerk).
- Scan-Button am Einzugsscanner: Mein Einzugsscanner besitzt einen Knopf, der ein USB-Ereignis auslöst. Diesen Knopf habe ich nun so konfiguriert, dass ich Dokumente in den Einzugsscanner einlegen und danach den Knopf drücken kann. Ohne dass ich noch eingreifen muss, werden die Dokumente vom Scanner erfasst, im Eingangsordner von paperless-ngx abgelegt und so automatisch eingelesen. Spätestens eine Minute nach dem Einscannen sind die Dokumente im Dokumentenverwaltungssystem erfasst (und im Optimalfall sogar dem richtigen Absender zugeordnet, der richtigen Dokumentenkategorie zugeordnet und passend verschlagwortet.
- Automatisches Extrahieren von Anhängen aus Mails (geplant): Paperless-ngx kann auch Postfächer überwachen und nach bestimmten Regeln automatisch Anhänge aus E-Mails verarbeiten. Damit kann ich somit bestehende Mailadressen überwachen nach relevanten, abzulegenden Dokumenten als auch ein neues, spezielles Mailkonto einrichten, an welches ich dann abzulegende Dokumente schicken kann (ähnlich wie unsere Hochschule eine entsprechende Mailadresse für eingehende Rechnungen hat).
Was mir gefällt
- Open Source:
- Lokal gehostet: Aus verschiedenen Gründen möchte ich wichtige Daten lokal hosten (Verfügbarkeit bei Internetausfall, digitale Souveränität)
- Dokumente weiterhin als Originale in Ordnern im Dateisystem: paperless-ngx speichert die eingelesenen Dokumente in Ordnern auf dem Dateisystem und nicht in einer Datenbank. Damit kann ich die Dokumente wieder aus dem System herausnehmen, wenn paperless-ngx nicht mehr meinen Bedürfnissen entsprechen sollte (oder weil es nicht mehr supported wird...). Die automatisch gemachte Ordnerstruktur (deren Regeln ich bestimmen kann) ist ordentlicher als was ich bisher von Hand gemacht habe und funktioniert im Idealfall bei richtiger Zuordnung von paperless-ngx vollautomatisch.
Was ich gelernt habe
- Leistungsfähigkeit von Hardware: Ich muss meine Vorstellungen immer mal wieder neu eichen, was auf einem Raspberry Pi 5 in der Grösse einer Zigarettenschachtel so alles läuft
- Leistungsfähigkeit von Machine Learning: Auch wenn es noch nicht perfekt läuft, staune ich, wie paperless-ngx schon nach wenigen Dokumenten Zuordnungen vornehmen kann.
- Viele produktspezifische Details...
Weiterführende Links