Steuerberater in Deutschland stehen vor einem Dilemma: Diktiersoftware spart Zeit, aber Cloud-Dienste verstoßen gegen Schweigepflicht und DSGVO. Lokale KI-Diktierlösungen lösen diesen Konflikt.
Stell dir vor, du diktierst eine ausführliche Memo zu den Einkünften eines Mandanten, seinen Beteiligungsstrukturen und dem laufenden Betriebsprüfungsverfahren. Die Spracherkennung transkribiert alles zuverlässig. Was du da aber vielleicht nicht siehst: Die Audiodatei hat soeben deinen Rechner verlassen, ist über das Internet zu einem Server irgendwo in Virginia gereist und wurde dort von einem Modell verarbeitet, das einem US-amerikanischen Unternehmen gehört. Dein Mandant weiß davon nichts. Und du hattest nie die Absicht, das so zu handhaben.
Genau hier liegt das Problem, über das in vielen Steuerkanzleien noch zu wenig offen gesprochen wird.
Steuerberater unterliegen nach § 203 StGB der beruflichen Schweigepflicht. Das ist keine Formalie, das ist ein echtes Strafbarkeitsrisiko. Wer Informationen über Mandanten an unbefugte Dritte weitergibt, macht sich strafbar. Und ja: Ein Cloud-Dienst, der Audiodateien auf fremden Servern verarbeitet, kann als unbefugter Dritter eingestuft werden. Jedenfalls dann, wenn keine ausdrückliche Einwilligung des Mandanten vorliegt und keine ordentliche Auftragsverarbeitungsvereinbarung nach DSGVO abgeschlossen wurde.
Dazu kommt, dass Sprachdaten nach Art. 9 DSGVO als biometrische Daten besonders schützenswert sind. Wer also via Mikrofon diktiert und dabei Cloud-Software nutzt, verarbeitet möglicherweise besonders sensible personenbezogene Daten auf Infrastruktur, über die er keine Kontrolle hat. Die meisten gängigen Diktierlösungen auf dem Markt, darunter bekannte Produkte aus dem US-amerikanischen Raum, funktionieren genau so. Die Verarbeitung findet in der Cloud statt, weil die Modelle zu groß und zu rechenintensiv für lokale Hardware sind.
Das war lange Zeit eine technische Notwendigkeit. Es ist heute keine mehr.
Seit Apple Silicon auf den Mac gebracht hat, steckt in jedem MacBook und Mac Mini eine sogenannte Neural Engine, ein spezialisierter Chip, der Machine Learning Modelle lokal ausführt. Mit schneller Geschwindigkeit und ohne Internet.
sprich.ai nutzt genau diese Architektur. Die App basiert auf dem Sprachmodell Parakeet, das über CoreML direkt auf der Apple Neural Engine läuft. Das bedeutet, die Verarbeitung findet ausschließlich auf dem Gerät statt. Keine Audiodaten verlassen den Computer, kein Server empfängt die Spracheingabe, kein Drittanbieter hat Zugriff auf das Gesprochene. Alles läuft rein lokal. Was in der Kanzlei bleibt, bleibt wirklich in der Kanzlei.
Für Steuerberater ist das kein Nice-to-have. Es ist die einzige Konfiguration, die sich mit der Schweigepflicht verträgt, ohne juristisches Glatteis zu betreten.
Außerdem wird im Praxisalttag oft unterschätzt, das Modell ist speziell auf die deutsche Sprache optimiert. Nicht ein generisches mehrsprachiges System, das Deutsch "irgendwie auch kann", sondern eine Lösung, die auf deutsche Ausdrucksweise, Satzstruktur und Fachvokabular ausgerichtet ist. Auch "Denglish", also das übernehmen von Redewendungen in deutsche Sätze und das verwenden von englischen Verben ist perfekt. Die Fehlerrate liegt bei etwa 4 bis 5 Prozent, was für spontane Sprachaufnahmen im Alltag einen bedeutenden Unterschied macht.
Datenschutz ist der entscheidende Grund, warum Cloud-Diktat für Steuerberater ausscheidet. Aber er ist nicht der einzige Grund, über Spracherkennung nachzudenken.
Ein durchschnittlicher Schreiber tippt etwa 40 Wörter pro Minute. Wer spricht, produziert rund 200 Wörter pro Minute. Der Unterschied ist nicht marginal, er ist ein Faktor von vier bis fünf. Ein Steuerberater, der täglich zwei Stunden mit Schreiben verbringt, also mit Mandantenkorrespondenz, Aktennotizen, internen Memos und der Dokumentation von Beratungsgesprächen, könnte diese Zeit auf etwa 30 bis 35 Minuten reduzieren. Das sind täglich 85 bis 90 Minuten, die wieder für Mandantengespräche, strategische Arbeit oder schlicht für früher Feierabend zur Verfügung stehen würden.
Das klingt nach einer simplen Rechenaufgabe. Tatsächlich sitzt das Problem tiefer. Tippen kostet nicht nur Zeit, es kostet auch Konzentration und physische Ermüdung. Wer nach einem komplexen Beratungsgespräch die wichtigsten Punkte schriftlich festhalten will, muss den Gedankenfluss unterbrechen, sich an den Rechner setzen, korrekt formulieren und dabei auf Tippfehler achten. Diktieren erlaubt es, im Denkmodus zu bleiben. Der Gedanke wird direkt zur Aufzeichnung, ohne den Umweg über die Tastatur.
sprich.ai funktioniert per Shortcut in jeder beliebigen Anwendung. Das bedeutet, dass in der in der Kanzleisoftware, im E-Mail-Programm, in Textverarbeitungsprogrammen oder direkt im Browser. Es gibt keine proprietäre Oberfläche, in die erst alles exportiert werden müsste. Die Diktierfunktion liegt immer eine Tastenkombination entfernt, egal wo gerade gearbeitet wird.
Der praktische Einstieg ist bewusst niedrigschwellig gehalten. sprich.ai bietet ein kostenloses Kontingent von 2.000 Wörtern pro Woche, was für erste Erfahrungen mit der Technologie ausreicht. Wer danach überzeugt ist, zahlt 8 Euro im Monat oder 6 Euro monatlich bei Jahreszahlung. Für Kanzleien, die langfristig planen, gibt es auch eine Lifetime-Option für einmalig 150 Euro.
Vor dem Hintergrund, was eine Stunde Steuerberaterzeit kostet, rechnet sich das in den ersten Wochen.
Wichtig ist dabei die Grundsatzentscheidung: Cloud-Diktat und berufliche Schweigepflicht lassen sich nicht einfach durch guten Willen versöhnen. Es braucht eine technische Lösung, die das Problem strukturell ausschließt. Lokale Verarbeitung auf dem eigenen Gerät ist diese Lösung.
Wer als Steuerberater in Deutschland Diktiertechnologie einsetzen will, ohne Kompromisse bei Compliance und Mandatenschutz einzugehen, findet unter sprich.ai einen Startpunkt. 2.000 Wörter pro Woche kostenlos, keine Daten in der Cloud, keine Einrichtung eines Servers. Nur ein Mac, ein Mikrofon und ein Shortcut.
Sprich.ai kostenlos testen — 2.000 Wörter pro Woche gratis, keine Kreditkarte nötig.
Kostenlos herunterladen →