Welche Diktiersoftware für den Mac ist 2026 wirklich DSGVO-konform? Ein ehrlicher Vergleich von fünf Tools mit konkreten Angaben zu Serverstandorten, Compliance-Risiken und Preisen.
Cornelia B. ist niedergelassene Steuerberaterin in Nürnberg. Vor einigen Monaten hat sie damit begonnen, ihre Mandantenkorrespondenz per Diktat zu verfassen. Schneller schreiben, weniger Tipparbeit, mehr Zeit für tatsächliche Beratung. Bis ihr Datenschutzbeauftragter sie darauf hinwies, dass das Tool, das sie nutzte, Audiodaten an einen Server in den USA sendete. Unklar blieb, ob die Daten dort gespeichert wurden, wer Zugriff hatte und ob ein rechtssicherer Auftragsverarbeitungsvertrag überhaupt möglich war. Der Nürnberger Datenschutzbeauftragte formuliert es deutlich: Finanz- und Mandantendaten gehören nicht auf US-Server.
Was Cornelia erlebt hat, ist kein Einzelfall. Das Thema DSGVO-konforme Diktiersoftware auf dem Mac ist 2026 unübersichtlicher geworden, nicht einfacher. Viele Anbieter behaupten, datenschutzkonform zu arbeiten. Wer genauer hinschaut, findet Standardvertragsklauseln mit US-Unternehmen, die unter dem Cloud Act oder FISA Section 702 stehen, Audiodaten die in Rechenzentren auf der anderen Seite des Atlantiks verarbeitet werden, und AGBs, in denen Trainingsdaten-Klauseln so formuliert sind, dass sie erst auf den zweiten Blick auffallen.
Dieser Artikel zeigt, wo die populärsten Mac-Diktierlösungen die Daten wirklich verarbeiten, was das rechtlich bedeutet und welche Option für professionelle Nutzer in Deutschland tatsächlich bedenkenlos einsetzbar ist.
Sprachaufnahmen sind keine gewöhnlichen Daten. Nach Artikel 9 der DSGVO gelten biometrische Daten, die der eindeutigen Identifizierung einer natürlichen Person dienen, als besonders schützenswert. Stimmdaten fallen darunter. Das bedeutet: Wer Audiodaten an einen Drittanbieter überträgt, braucht eine Rechtsgrundlage, einen rechtssicheren Auftragsverarbeitungsvertrag und muss sicherstellen, dass dieser Drittanbieter die europäischen Datenschutzanforderungen tatsächlich erfüllt.
Das ist mit US-Unternehmen strukturell schwierig. Der Cloud Act erlaubt US-Behörden den Zugriff auf Daten, die auf Servern US-amerikanischer Anbieter liegen, unabhängig davon, ob diese Server physisch in Europa stehen. Ein AVV mit einem US-Anbieter schützt vor diesem Zugriff nicht. Der Europäische Gerichtshof hat mit den Schrems-I- und Schrems-II-Entscheidungen klargemacht, dass US-Standardvertragsklauseln keine ausreichende Garantie bieten, wenn das zugrundeliegende US-Recht den Schutz unterläuft.
Für Anwälte, Ärzte, Therapeuten und Steuerberater kommt noch eine weitere Ebene hinzu: § 203 StGB schützt das Berufsgeheimnis strafrechtlich. Wer Mandanten-, Patienten- oder Klientendaten in eine US-amerikanische Cloud-API spricht, bewegt sich in einem Bereich, den Strafrechtsexperten als rechtliches Graugebiet bezeichnen. Die einzige wirklich saubere Lösung ist, dass Audiodaten das Gerät nie verlassen.
Apple Diktat (macOS eingebaut)
Das eingebaute macOS-Diktat ist für viele der erste Berührungspunkt mit Spracherkennung. Es ist kostenlos, direkt verfügbar und funktioniert in fast jeder App. Wer es nutzt, sendet Sprachaufnahmen an Apple-Server in den USA. Apple hat zwar einen EU-Datenschutzrahmen unterzeichnet und ist nach dem EU-US Data Privacy Framework zertifiziert, aber das Framework ist seit der Schrems-II-Entscheidung dauerhaft umstritten. Ein vollständiger Offline-Modus ist nicht dokumentiert, das Opt-out in den Systemeinstellungen ist technisch komplex und für den professionellen Einsatz mit sensiblen Daten nicht ausreichend transparent. Für den Privatbenutzer reicht Apple Diktat für gelegentliche Kurznotizen. Für professionelle Anwender mit Schweigepflicht oder Vertraulichkeitspflicht ist es keine tragfähige Lösung.
Preis: kostenlos. DSGVO-Einschätzung: eingeschränkt, US-Server, kein vollständiger Offline-Modus.
Wispr Flow
Wispr Flow ist eines der beliebtesten KI-gestützten Diktiertools auf dem Mac. Die Oberfläche ist durchdacht, die Qualität hoch. Technisch sendet Wispr Flow Audiodaten direkt an die OpenAI Whisper API. Verarbeitungsort: OpenAI Inc., San Francisco, Rechenzentren in den USA. Ein rechtssicherer AVV mit OpenAI ist für EU-Unternehmen nach aktuellem Stand nicht herstellbar, weil OpenAI dem Cloud Act unterliegt. Die AGB enthalten Trainingsklauseln, die zumindest ausgelegt werden können, als würden Sprachdaten zur Modellverbesserung genutzt. Für Anwender, die sensible Daten verarbeiten, ist das eine klare Absage. Preis: ca. 15 bis 20 Dollar pro Monat. DSGVO-Einschätzung: nicht konform für professionellen Einsatz mit vertraulichen Daten.
SuperWhisper
SuperWhisper bewirbt einen lokalen Modus, der auf Whisper-Modellen basiert. Diese Option existiert, ist aber mit Einschränkungen verbunden: Die Modellqualität für Deutsch liegt bei den älteren Whisper-Varianten deutlich unter dem aktuellen Stand der Technik. Komposita, Fachvokabular und Umlaute bereiten regelmäßig Probleme. Der Standard-Modus läuft über Cloud-APIs. Für deutschsprachige professionelle Nutzer, die sowohl Datenschutz als auch Erkennungsqualität brauchen, ist SuperWhisper damit nur bedingt geeignet. Preis: ca. 10 bis 15 Dollar pro Monat. DSGVO-Einschätzung: bedingt, wenn ausschließlich lokaler Modus genutzt wird, aber Qualitätsabstriche bei Deutsch.
Otter.ai
Otter.ai ist primär für Meeting-Transkription konzipiert. Der Anbieter ist ein US-Unternehmen, die Server laufen auf AWS US-East-1 in Virginia. Es gibt keine EU-Serverstandorte, keinen rechtssicheren AVV für Deutschland. Mehrere deutsche Datenschutzbehörden haben öffentlich von der Nutzung für vertrauliche Daten abgeraten. Für Diktat im beruflichen Alltag ist Otter.ai ohnehin nicht die erste Wahl, für Compliance-sensible Umgebungen ist es keine Option. Preis: ab ca. 10 Dollar pro Monat. DSGVO-Einschätzung: nicht konform.
Dragon (Nuance/Microsoft)
Dragon hatte über Jahrzehnte eine starke Position bei professioneller Diktiersoftware. Seit der Übernahme durch Microsoft 2021 und der Einstellung des macOS-Clients 2023 ist es für Mac-Nutzer schlicht nicht mehr relevant. Dragon Professional läuft nur noch auf Windows, die Preise beginnen bei über 500 Euro Einmalzahlung, Cloud-Sync-Funktionen sind integriert. Für den Mac ist Dragon 2026 keine ernsthafte Option mehr. DSGVO-Einschätzung: entfällt für Mac.
| Tool | Verarbeitung | DSGVO-konform | Preis |
|---|---|---|---|
| Apple Diktat | Cloud (Apple-Server USA) | Eingeschränkt | Kostenlos |
| Wispr Flow | Cloud (OpenAI, USA) | Nein | ca. 15-20 $/Monat |
| SuperWhisper | Cloud (Standard) / lokal (ältere Modelle) | Bedingt (nur lokal) | ca. 10-15 $/Monat |
| Otter.ai | Cloud (AWS Virginia, USA) | Nein | ab ca. 10 $/Monat |
| Dragon | Eingestellt für macOS | Entfällt | 500+ € (Windows only) |
| sprich.ai | Lokal auf Apple Silicon, kein Netzwerk-Request | Ja | ab 6 €/Monat |
sprich.ai wurde von einem deutschen Entwicklerteam mit einem klar definierten Ansatz gebaut: Audiodaten verlassen das Gerät nicht. Nicht teilweise, nicht unter bestimmten Bedingungen. Die Transkription läuft direkt auf dem Apple Neural Engine, dem spezialisierten KI-Chip in jedem M1-, M2-, M3- und M4-Mac. Das zugrunde liegende Modell ist FluidAudio Parakeet TDT 0.6B v3, laufend über CoreML, ergänzt durch ein lokal ausgeführtes Nachbearbeitungsmodell (Qwen MLX, LoRA-feinabgestummt für deutsche Sprachkorrektur). Kein Netzwerk-Request, kein Serverstandort, keine rechtliche Einheit, die Audiodaten empfängt.
Das macht einen wesentlichen Unterschied: Es gibt keinen AVV, der geprüft werden müsste, keine US-Behörde, die theoretisch Zugriff anfordern könnte, kein Compliance-Risiko nach § 203 StGB. Für Coaches und andere Fachleute, die täglich mit vertraulichen Inhalten arbeiten, ist das keine Randnotiz, sondern die entscheidende Eigenschaft.
Was dabei ehrlich kommuniziert werden sollte: Lokale Verarbeitung auf dem Apple Neural Engine braucht zwei bis drei Sekunden mehr als ein Cloud-API-Aufruf. Das ist eine bewusste Entscheidung für Datensouveränität gegenüber maximaler Geschwindigkeit. Wer mit sprich.ai täglich diktiert und dabei von 40 Wörtern pro Minute beim Tippen auf 200 Wörter pro Minute beim Sprechen kommt, gewinnt täglich mehr als 90 Minuten zurück. In diesem Verhältnis fallen zwei Sekunden Latenz nicht mehr ins Gewicht.
Die Nutzung ist bewusst einfach gehalten: Shortcut gedrückt halten, sprechen, loslassen. Der Text erscheint per Cmd+V direkt im aktiven Textfeld, egal ob in Notion, Slack, einer Mail, im Browser oder im Code-Editor. Das System funktioniert überall, wo man tippen kann, ohne App-Wechsel, ohne Ladefenster, ohne Kontext-Verlust.
Voraussetzung ist ein Mac mit Apple Silicon und macOS 14 oder neuer. Wer noch einen Intel-Mac nutzt, kann sprich.ai nicht einsetzen. Das ist die Kehrseite des lokalen Ansatzes: Der Apple Neural Engine ist die technische Grundlage, auf der alles aufbaut.
Preislich liegt sprich.ai bei 8 Euro pro Monat oder 6 Euro pro Monat bei Jahreszahlung. Wer es zunächst ohne Kreditkarte ausprobieren möchte, kann mit 2.000 kostenlosen Wörtern pro Woche starten.
Wer gelegentlich eine kurze Notiz diktiert und keine vertraulichen Daten verarbeitet, kann Apple Diktat nutzen und damit leben, dass Sprachaufnahmen Apple-Server erreichen. Für die meisten professionellen Anwendungen in Deutschland, besonders mit Schweigepflicht oder Mandatsgeheimnissen, sieht die Rechtslage anders aus.
Die einzige Diktierlösung in diesem Vergleich, die ohne jeden Netzwerk-Request auskommt und dabei eine Wortfehlerrate von rund vier bis fünf Prozent für Deutsch erreicht, ist sprich.ai. Das ist kein Marketing-Versprechen, sondern eine direkte Folge der Architekturentscheidung. Wer auf dem Mac diktiert, deutschen Fachvokabular spricht und dabei sichergehen will, dass kein einziges Byte Audiodaten das Gerät verlässt, findet damit eine klare Antwort auf die Frage, die dieser Vergleich zu beantworten versucht.
Einen Einstieg ohne Risiko gibt es unter sprich.ai, 2.000 Wörter pro Woche kostenlos, ohne Kreditkarte.
Sprich.ai kostenlos testen — 2.000 Wörter pro Woche gratis, keine Kreditkarte nötig.
Kostenlos herunterladen →