Warum die Dateisuche im Unternehmen ein gelöstes Problem ist – und wie man es angeht

·5 Min. Lesezeit

von Vito Cudemo, Founder & IT Specialist

Das Problem, das niemand zählt

Unternehmen, die seit Jahrzehnten aktiv sind, haben eines gemeinsam: eine gewachsene Dokumentenablage. PDFs, Pläne, Tabellen, Bilder, Berichte – über Jahre angesammelt, strukturiert abgelegt, aber mit der Zeit kaum mehr gezielt auffindbar.

Das eigentliche Problem ist oft nicht die fehlende Struktur. Die Ablage ist durchdacht. Das Problem ist die schiere Menge und die Zeit: Wer weiss noch, in welchem Ordner eine bestimmte Unterlage aus dem Jahr 2008 liegt? Wer kennt noch die Namenskonvention, die damals galt?

Dazu kommt eine zweite Dimension, die weniger offensichtlich ist: Wissenstransfer. Mit wachsender Mitarbeiterzahl, mehr Teilzeitpensen und Homeoffice fehlen die informellen Momente, in denen Erfahrung weitergegeben wird. Der spontane Austausch am Kaffeetisch funktioniert nicht mehr, wenn das Team verteilt ist. Das firmeninterne Fachwissen – aufgebaut über Jahre oder Jahrzehnte – steckt in Dokumenten, die niemand mehr gezielt findet.

Laut IDC verbringen Mitarbeitende in Unternehmen durchschnittlich 1.8 Stunden pro Tag mit der Suche nach Informationen und Dokumenten – und finden sie im schlechtesten Fall trotzdem nicht. Das entspricht bei 10 Mitarbeitenden rund 18 verlorenen Stunden täglich.

Das Problem ist technisch längst gelöst. Trotzdem sehen wir es in fast jedem mittleren KMU, das wir begleiten.

Warum Windows-Suche und Finder nicht ausreichen

Die Standard-Suche, die auf jedem Rechner installiert ist, durchsucht Dateinamen und – je nach Konfiguration – einige Metadaten. Was sie in der Regel nicht tut: den Inhalt von Dokumenten indexieren.

Das heisst in der Praxis: Wer weiss, wie die Datei heisst, findet sie. Wer den Inhalt sucht – eine Klausel in einem Vertrag, eine Produktnummer in einer alten Offerte, den Namen eines Lieferanten in irgendeinem Korrespondenzordner – sucht vergeblich.

Dazu kommt: Die Dateiablage auf einem NAS oder Netzlaufwerk wächst über Jahre und wird von verschiedenen Personen befüllt. Benennungskonventionen werden nicht eingehalten, Ordnerstrukturen veralten, Mitarbeitende kommen und gehen. Wer das Unternehmen verlässt, nimmt das implizite Wissen über die Ablage mit.

Wie Volltextsuche das löst

Volltextsuche ist keine neue Technologie. Suchmaschinen wie ElasticSearch und OpenSearch werden seit über zehn Jahren in grossen Unternehmen eingesetzt – dieselbe Technologie, die Google für Web-Ergebnisse oder Amazon für Produktsuchen nutzt.

Das Prinzip ist einfach: Ein Indexer durchsucht alle Dokumente auf den definierten Quellen, extrahiert den Text und schreibt ihn in einen Suchindex. Danach können Mitarbeitende über ein Web-Interface beliebige Begriffe suchen – und die Suche findet die relevanten Passagen in Sekunden, unabhängig vom Dateinamen oder dem Speicherort.

Was dabei oft unterschätzt wird: Auch gescannte Dokumente lassen sich einschliessen. Per OCR (Optical Character Recognition) wird aus einem Foto eines Papierdokuments lesbarer Text. Verträge, die vor zehn Jahren eingescannt wurden und als Bilddatei auf dem NAS liegen, sind danach genauso durchsuchbar wie ein aktuelles Word-Dokument.

Was ein Indexer im Hintergrund tut

Der Prozess läuft vollständig automatisiert. Einmal konfiguriert, prüft der Indexer in regelmässigen Abständen, ob neue oder geänderte Dokumente aufgetaucht sind, verarbeitet diese und aktualisiert den Suchindex. Gelöschte Dateien werden entfernt. Das System hält sich selbst aktuell, ohne manuellen Eingriff.

Die Verarbeitung ist dabei ressourcenschonend: Für die reine Volltextsuche ist keine leistungsstarke Hardware nötig. Ein vorhandener Server oder eine virtuelle Maschine reicht in den meisten Fällen aus. OCR für gescannte Dokumente ist rechenintensiver, läuft aber ebenfalls auf Standardhardware.

Das Zusammenspiel mit KI

Volltextsuche und KI sind keine Alternativen, sondern ergänzen sich sinnvoll.

Volltextsuche liefert Treffer: Sie gibt alle Dokumente zurück, in denen ein bestimmter Begriff vorkommt, hebt die relevanten Passagen hervor und liefert direkte Links zum Originaldokument. Das ist schnell, zuverlässig und braucht kein Sprachmodell.

KI geht einen Schritt weiter: Sie kann die Suchergebnisse lesen, verstehen und eine Antwort in natürlicher Sprache zusammenfassen. Statt «Zeig mir alle Dokumente, in denen Lieferant X erwähnt wird» beantwortet die KI: «Die letzte Vereinbarung mit Lieferant X datiert vom März 2023. Darin wurde ein Rabatt von 8 % vereinbart, gültig bis Dezember 2025.»

Was dabei technisch passiert: Die KI durchsucht nicht alle Dokumente direkt, sondern greift auf den Suchindex zu. Das ist der Grund, warum Volltextsuche als Basis entscheidend ist – sie macht den Zugriff effizient, ohne dass jedes Dokument als Vektor-Embedding im RAM vorliegen muss.

Warum nicht einfach nur RAG?

RAG (Retrieval Augmented Generation) ist die Technik, bei der Dokumente direkt in die KI-Wissensdatenbank geladen werden. Das funktioniert hervorragend für überschaubare, häufig genutzte Dokumentensammlungen – Handbücher, Reglemente, Produktdatenblätter.

Für die gesamte Unternehmensablage stösst RAG an Grenzen: Der Speicherbedarf für Vektor-Embeddings skaliert schlecht mit der Dokumentenmenge. Zehntausende Dateien über mehrere Jahre bedeuten erheblichen Ressourcenaufwand. Dazu kommt, dass jedes neue oder geänderte Dokument neu eingebettet werden muss – ein kontinuierlicher Prozess mit messbaren Kosten.

Volltextsuche + gezieltes RAG für Kerndokumente ist deshalb in der Praxis die wirtschaftlichere Kombination. Der Suchindex übernimmt die Breite, RAG übernimmt die Tiefe für kritische Wissensquellen.

Was es in der Praxis braucht

Der technische Aufwand für eine funktionierende Dokumentensuche ist überschaubar. Was in der Praxis beachtet werden sollte:

Quellen definieren. Welche Netzlaufwerke und NAS-Pfade sollen indexiert werden? Nicht jeder Ordner muss durchsuchbar sein – Sensitivität und Berechtigung spielen eine Rolle. Die Zugriffskontrolle auf Suchergebnisse kann separat konfiguriert werden.

Formate klären. Welche Dateitypen dominieren in der Ablage? Sind viele gescannte PDFs dabei, die OCR benötigen? Das beeinflusst die Ressourcenanforderungen und die Indexierungszeit beim initialen Lauf.

Indexierungsintervall festlegen. Wie zeitkritisch ist die Aktualität? Für die meisten KMU reicht ein Intervall von wenigen Stunden. Wer täglich neue Dokumente mit hoher Relevanz ablegt, kann kürzere Intervalle wählen.

Berechtigungen. Die Suche sollte nur Dokumente zurückgeben, auf die die suchende Person ohnehin Zugriff hätte. Das ist konfigurierbar, muss aber von Anfang an mitgedacht werden.

Was die Einführung einfacher macht als gedacht

Der Zeitaufwand ist überschaubar. Mit modernen Container-basierten Tools ist eine Basis-Installation in einem halben Tag aufgesetzt. Die erste Indexierung läuft automatisch im Hintergrund, danach ist das System selbstverwaltend – kein manueller Betrieb, keine laufende Pflege.

Die Kosten sind gering. Für ein KMU mit einem vorhandenen Server fallen keine Lizenzkosten für die Suchmaschine selbst an – OpenSearch ist Open Source. Kein SaaS-Abonnement, keine Cloud-Gebühren. Der Aufwand liegt primär in der einmaligen Einrichtung.

Und: Es braucht keine Änderung an der bestehenden Ablage. Die Ordnerstruktur bleibt unverändert. Dokumente müssen weder umbenannt noch verschoben werden. Der Indexer nimmt die Ablage so, wie sie ist.

Fazit

Dokumentensuche gehört zu den Problemen, die im Alltag kaum auffallen, aber messbar Zeit und Geld kosten. Die technologische Grundlage ist stabil, erprobt und funktioniert unabhängig von Cloud-Diensten oder KI-Trends.

Wer jetzt eine saubere Volltextsuche implementiert, legt gleichzeitig die Basis für eine spätere KI-Anbindung – ohne die Ablagestruktur anfassen oder Dokumente umziehen zu müssen.


Wir haben dazu eine eigene Lösung gebaut, die wir in Schweizer Unternehmen einsetzen: Intelligente Dokumentensuche. Wenn Sie wissen möchten, wie das bei Ihrer Ablage aussehen würde – wir zeigen es Ihnen in 20 Minuten.

Weitere Beiträge

Warum 0 % Datenabfluss für CH-Unternehmen wichtig ist

Mitarbeitende laden Kundendaten auf ChatGPT hoch – und machen das Unternehmen verklagbar. Warum das kaum zu verhindern ist, welche Optionen es gibt und wie Schweizer KMU sich absichern.

Read more

KI verändert gerade alles – und die meisten schauen noch zu

Die neuesten KI-Modelle erledigen komplexe Aufgaben selbständig. Softwareentwicklung wird in 12 Monaten grundlegend anders aussehen. Was das für KMU bedeutet – und warum wir unsere Kunden aktiv darauf vorbereiten.

Read more

Ein Gespräch, das Klarheit bringt.

Wir zeigen Ihnen, wie moderne IT und smarte Automatisierung Ihr Unternehmen entlasten können.