Mit der Mailbox sprechen — Wissensmanagement auf vorhandenen Inhalten

Wo Wissen in Wirklichkeit liegt

In jedem Mittelstandsbetrieb existieren zwei Wissensbestände: der offizielle (Wiki, Sharepoint, Handbücher) und der eigentliche — und der liegt in Mailbox-Threads, Gesprächsverläufen, Notizen, halbfertigen Dokumenten. Das offizielle Wiki ist meist veraltet, weil niemand Zeit hat, es zu pflegen. Das echte Wissen ist im Alltag entstanden, aber nirgends zentral abgelegt.

Klassisches Wissensmanagement versucht, diesen Bestand zu “kuratieren”: jemand schreibt aus dem informellen Wissen formelle Artikel. Das funktioniert selten. Wer Zeit hat, schreibt nicht; wer schreibt, hat nicht das aktuelle Wissen.

Was sich heute anders denken lässt

Retrieval-Augmented Generation (RAG) ändert die Spielregel. Statt Wissen vorher zu kuratieren, wird der vorhandene Bestand direkt durchsuchbar — semantisch, nicht stichwortbasiert. Wenn jemand eine Frage stellt, sucht das System in den vorhandenen Inhalten nach relevanten Stellen, schickt diese Stellen zusammen mit der Frage an ein Sprachmodell, und das antwortet mit einer formulierten Antwort plus Quellenangabe.

Das Entscheidende: Es wird nichts erfunden. Die Antwort stammt aus dem realen Inhalt. Die Quellen sind nachvollziehbar.

Ein konkreter Fall

Mittelständischer Spezialist für technische Dienstleistungen, ~80 Mitarbeitende, davon 30 im Innendienst. Kundenanfragen kommen täglich rein, viele davon zu Themen, zu denen es schon hundertfach Antworten in alten Mailthreads gab. Aber niemand findet sie. Mitarbeitende stellen dieselbe Frage an Kollegen, die wiederum in ihren Postfächern suchen.

Ziel: Einen Assistenten, der auf den vorhandenen Mailverläufen und Dokumenten Antworten gibt, mit klarer Quellenangabe — damit erfahrene Mitarbeitende ihr Wissen weitergeben können, ohne es manuell aufschreiben zu müssen.

Wie wir das gelöst haben

Vier Bausteine:

1. Inhalte erfassen. Wir spiegeln (lesend, nicht löschend) die relevanten Quellen in einen Index: das zentrale Service-Postfach, das interne Wiki, der Vertragsordner, das technische Dokumentenarchiv. Berechtigungen werden mitübernommen — was vorher nur bestimmte Personen sehen durften, ist auch im Assistenten nur diesen Personen zugänglich.

2. Embedding & Indexierung. Die Inhalte werden in Sinneinheiten zerlegt (“Chunks”, ein Absatz oder ein Mail-Turn) und in einen Vektorraum gemappt. Ähnliche Inhalte liegen im Raum nahe beieinander — egal, ob sie dieselben Wörter benutzen oder nicht.

3. Suche und Generierung. Bei einer Anfrage werden die ähnlichsten Inhalte aus dem Index gezogen und zusammen mit der Frage an ein Sprachmodell geschickt. Das Modell formuliert eine Antwort auf Basis dieser Inhalte — und zitiert die Quellen.

4. Feedback-Schleife. Mitarbeitende können Antworten als “passt” oder “passt nicht” markieren. Aus diesem Feedback lernt das System, welche Quellen verlässlich sind und welche nicht. So wird die Qualität über die Zeit besser, ohne dass jemand explizit pflegt.

Was technisch dahintersteckt (intuitiv)

Stellen Sie sich Embedding als eine Karte vor: Jeder Inhalt bekommt eine Position. Inhalte, die sich inhaltlich ähneln, landen nah beieinander — auch wenn sie unterschiedliche Wörter verwenden. Eine Frage bekommt ebenfalls eine Position auf dieser Karte. Was in der Nähe liegt, ist relevant.

Das Sprachmodell formuliert dann eine Antwort, die strikt auf den gefundenen Inhalten basiert. Wenn die Quellen nichts hergeben, gibt das System das auch zu — “dazu habe ich in den Quellen nichts gefunden” — statt eine Antwort zu erfinden. Das ist ein bewusstes Designprinzip und unterscheidet RAG-Systeme von generischen Chatbots.

Was an Datenschutz und Governance zu beachten ist

Mailinhalte sind sensibel. Drei Punkte sind entscheidend:

Berechtigungen nicht umgehen. Die Suche im Assistenten respektiert die Originalberechtigungen. Wenn Sie auf einen Vertrag nicht zugreifen dürfen, taucht er auch in der Antwort nicht auf. Das muss technisch sauber abgebildet werden — sonst entsteht ein Sicherheitsleck.

Datenresidenz. Sensible Inhalte verlassen das eigene Netz nicht. Embedding und Sprachmodell laufen entweder On-Premise oder im EU-Hosting mit AVV. Bei Bedarf nutzen wir ausschließlich Open-Source-Modelle, die lokal betrieben werden.

Audit-Trail. Jede Anfrage und Antwort wird protokolliert. Bei rechtlich relevanten Fragen muss später nachvollziehbar sein, was der Assistent geantwortet hat und auf welchen Quellen.

Was sich für die Mitarbeitenden ändert

Drei Effekte:

Erstens: Wiederkehrende Fragen verschwinden. Mitarbeitende stellen die Frage zuerst dem Assistenten — der hat in 70 bis 80 Prozent der Fälle eine brauchbare Antwort. Erst wenn der Assistent passt, eskaliert der Mensch zum erfahrenen Kollegen.

Zweitens: Neue Mitarbeitende werden schneller produktiv. Statt drei Monate Einarbeitung braucht es spürbar weniger — weil Fragen sofort beantwortet werden, ohne dass jemand stören muss.

Drittens: Erfahrene Mitarbeitende werden zur Wissensquelle, ohne explizit zu dokumentieren. Ihre alten Antworten in Mails leben weiter — und werden auffindbar.

Was es konkret gebracht hat

Im beschriebenen Fall nach vier Monaten:

Anfragen pro Tag an den Innendienst (von Kollegen aus dem Außendienst): von ~120 auf ~45 reduziert.
Antwortzeit auf einfache Fragen: von durchschnittlich 4 Stunden auf “binnen Minuten”, weil der Assistent direkt antwortet.
Onboarding-Zeit neuer Mitarbeitender bis zur produktiven Selbständigkeit: gefühlt deutlich schneller, harte Zahlen schwer messbar, weil “produktiv” subjektiv ist.
Akzeptanz im Team: hoch, sobald die ersten Tage gezeigt haben, dass das System tatsächlich brauchbare Antworten gibt — und nicht halluziniert.

Was sich nicht eignet

Wenn Ihr Inhaltsbestand sehr klein ist (weniger als ~500 Dokumente plus Mailverläufe), lohnt sich ein RAG-Aufbau selten — eine gute Suchfunktion reicht meistens. Wenn der Inhalt sehr unstrukturiert ist (handschriftliche Notizen, Audio ohne Transkript), muss vor dem Indexieren erst aufgeräumt werden — was den Aufwand hochtreibt.

Wenn das nach Ihrer Situation klingt

Wenn Sie das Gefühl haben, dass viel Wissen bei Ihnen in Mailboxen und Köpfen schlummert und nicht ankommt, wo es gebraucht wird — lohnt sich ein Blick. Im Erstgespräch klären wir, welche Quellen sich für einen ersten Pilot eignen würden und wie wir mit Datenschutz und Berechtigungen sauber umgehen.