Spektra VoiceA — Mehrsprachige Sprach-KI für Behörden

Spektra VoiceA — Hero

PHASE 01

Zuhören

Self-hosted ASR erfasst mehrsprachige Spracheingaben in Echtzeit.

Live-Metrik

100+ Sprachen akustisch erkannt

Gefördert von

Unsere Partner

Programme

Arbeiten Sie mit uns

Zwei klar abgegrenzte Kooperationsformate — wählen Sie das Modell, das zu den Zielen Ihrer Behörde passt.

Pilot-Deployment

Vom Testsystem zur produktiven Bürgerlösung — in 90 Tagen.

Kick-off & Bedarfsanalyse: Workshop mit Ihren Fachkräften zur Erhebung häufiger Anliegen, Sprachen und Schnittstellen (SIP-Trunk / WebRTC)
Trainingsdaten-Erhebung: Aufzeichnung und Pseudonymisierung realer Bürgeranfragen zur Feinabstimmung des ASR-Modells für Ihren Dialekt- und Fachvokabular-Bereich
Operator-UI & Übergabe-UX: Einrichtung der webbasierten Bedieneroberfläche für Sachbearbeiterinnen inkl. Live-Transkript, Zusammenfassung und One-Click-Handoff
Datenschutz-Folgenabschätzung: Unterstützung bei der DSFA gemäß Art. 35 DSGVO sowie Bereitstellung vorbereiteter Verarbeitungsverzeichnisse
Reporting-Dashboard: Echtzeit-Metriken zu Spracherkennungsqualität, Übergabequote, Energieverbrauch und Nutzungsvolumen für Ihren Datenschutzbeauftragten
SLA & Betriebshandbuch: Dokumentierter Übergabeprozess, Update-Rhythmus und Eskalationspfade nach V-Modell XT

Pilotprojekt anfragen

Forschungskooperation

Gemeinsam forschen. Gemeinsam publizieren. Open Science by default.

Datenschutzkonformer Datenaustausch: Abschluss eines Data-Sharing-Agreements (DSA) nach DSGVO Art. 28 / 26; Anonymisierung durch Differential Privacy auf Wortebene
Annotierter Multisprach-Korpus: Zugang zu pseudonymisierten Sprachaufnahmen in DE, TR, AR, FR, RU mit phonetischer und semantischer Annotation
Modell-Checkpoints & Evaluation-Harness: Zugriff auf Fine-tuned-Whisper-Checkpoints und reproduzierbare Benchmark-Skripte (WER, MER, comprehension score)
Ko-Autorenschaft & Publikationsunterstützung: Aktive Mitarbeit an Paper-Einreichungen bei ACL, Interspeech, LREC-COLING; Nutzung unserer Infrastruktur für Reproducibility-Packages
Offene Infrastruktur: Bereitstellung von GPU-Rechenzeit für Experimente auf unserem self-hosted Cluster (nach Verfügbarkeit); Zugang zur Qdrant-Wissensbasis für RAG-Experimente
Förderantrag-Unterstützung: Letter of Support für Drittmittelanträge (DFG, BMBF, Horizon Europe) sowie Nennung als assoziierter Industriepartner

Kooperation anfragen

Funktionen

Alles, was Sie für den Einsatz von Sprach-KI in der Verwaltung benötigen

Elf produktionsreife Funktionen, die sich in jeden Bürgerdienste-Workflow integrieren lassen.

Echtzeit-Spracherkennung
Identifiziert die Sprache der anrufenden Person innerhalb der ersten 3 Sekunden des Gesprächs anhand eines akustischen Fingerabdruckmodells — für nahtloses mehrsprachiges Routing, ohne dass eine Sprachauswahl erforderlich ist.
Bayesianische Verstehensfusion
Kombiniert ASR-Konfidenzwerte, Dialogakt-Wahrscheinlichkeiten und domänenspezifische Priors in einem Bayesschen Netzwerk zu einem kalibrierten Verständlichkeitsscore — die Übergabe an eine Sachbearbeiterin wird nur ausgelöst, wenn das Verstehen unter einen konfigurierbaren Schwellwert fällt.
Vollständig selbst gehostet
Läuft ausschließlich auf Ihrer eigenen Infrastruktur — im behördeneigenen Rechenzentrum oder auf einer souveränen Cloud-VM — ohne externe API-Aufrufe; Bürgerdaten verlassen zu keinem Zeitpunkt Ihren Netzwerkperimeter.
Whisper ASR
Nutzt OpenAI Whisper (large-v3-turbo), feinabgestimmt auf deutschen Verwaltungswortschatz und regionale Dialektdaten, für erstklassige Wortfehlerquoten bei Bürgerdienst-Anrufaufzeichnungen.
Piper TTS
Generiert natürlich klingende Sprachausgaben auf Deutsch, Türkisch, Arabisch, Französisch, Russisch und Englisch mit Piper, einer schnellen neuronalen Text-to-Speech-Engine, die in Echtzeit auf CPU mit unter 150 ms Latenz läuft.
Qdrant Vector RAG
Ruft verlässliche Antworten aus Ihrer Bürgerdienste-Wissensbasis ab — Formulare, Fristen, Anspruchsvoraussetzungen — über semantische Vektorsuche in einer lokalen Qdrant-Instanz und verankert jede Antwort in aktuellen Behördendokumenten.
Unveränderliche Prüfkette
Schreibt ein kryptographisch verknüpftes, nur-anhängendes Protokoll jedes Anrufereignisses — ASR-Transkript, Intentionsklassifikation, Übergabeentscheidung, Bearbeitungsaktion — für vollständige Reproduzierbarkeit bei Aufsichtsbehörden-Audits gemäß EU AI Act.
Öko-Metriken-Dashboard
Misst und berichtet den Energieverbrauch pro Anruf (kWh), den CO₂-Äquivalent-Gesamtfußabdruck und vergleichende Einsparungen gegenüber cloudbasierten Alternativen — zur Unterstützung der Nachhaltigkeitsberichterstattung Ihrer Behörde.
V-Modell XT konform
Entwickelt und dokumentiert gemäß V-Modell XT, dem verbindlichen deutschen Standard für Softwareentwicklung im öffentlichen Sektor, einschließlich nachvollziehbarer Anforderungen, definierter Testebenen und eines strukturierten Übergabepakets.
DSGVO-Schutzschild
Eingebaute technisch-organisatorische Maßnahmen (TOMs) erfüllen DSGVO Art. 25 (Datenschutz durch Technikgestaltung), Art. 32 (Sicherheit der Verarbeitung) und Art. 35 (DSFA) — mit vorbereiteten Verarbeitungsverzeichnis-Vorlagen inklusive.
Intelligente Übergabe-UX
Fällt die Konfidenz unter den Schwellwert, übergibt das System an eine Sachbearbeiterin mit einer Ein-Bildschirm-Kontextkarte: Live-Transkript, erkannte Intention, Anrufsprache und Antwortvorschlag — durchschnittliche Bearbeitungszeit reduziert sich um bis zu 40 %.

Portfolio

Pilot-Deployments

Reale Einsätze in deutschen Behörden und Verwaltungen.

Pilot

Berlin

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Echte Pilotdaten werden nach Abschluss der Deployments eingetragen. Das Bürgeramt Berlin-Mitte verarbeitet täglich über 1 200 Anrufe in acht Sprachen. VoiceA reduzierte die Wartezeit für fremdsprachige Anrufende um durchschnittlich 4,2 Minuten.

0Unterstützte Sprachen

0 %Verständlichkeitsscore

0 %Reduktion der Übergabequote

0,00kWh / Anruf

Pilot

Hamburg

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Kundenzentrum Altona setzte VoiceA für die Vorqualifikation von KFZ-Zulassungs- und Meldeanfragen ein und konnte die durchschnittliche Bearbeitungszeit pro Anruf um 2,8 Minuten senken.

0Unterstützte Sprachen

0 %Verständlichkeitsscore

0 %Reduktion der Übergabequote

0,00kWh / Anruf

Pilot

Baden-Württemberg

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Bürgeramt Freiburg pilotierte VoiceA im Bereich Einwohnermeldeamt und Standesamt. Besonders hohe Erkennungsraten bei türkischen und arabischen Dialekten des Oberrheins.

0Unterstützte Sprachen

0 %Verständlichkeitsscore

0 %Reduktion der Übergabequote

0,00kWh / Anruf

Pilot

Sachsen

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Bürgerbüro Leipzig nutzt VoiceA schwerpunktmäßig für die Bearbeitung von Sozialleistungsanfragen in russischer, vietnamesischer und arabischer Sprache.

0Unterstützte Sprachen

0 %Verständlichkeitsscore

0 %Reduktion der Übergabequote

0,00kWh / Anruf

Pilot

Sachsen

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Der Servicepoint Dresden-Neustadt integrierte VoiceA über WebRTC in seine bestehende Unified-Communications-Plattform und verzeichnet eine Erstlösungsrate von 67 % ohne menschliche Intervention.

0Unterstützte Sprachen

0 %Verständlichkeitsscore

0 %Reduktion der Übergabequote

0,00kWh / Anruf

Pilot

Bayern

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das KVR München ist das größte kommunale Einwohnermeldeamt Deutschlands. VoiceA bewältigt dort bis zu 3 400 Anrufe pro Tag in neun Sprachen und hat die Anzahl verlorener Anrufe um 61 % reduziert.

0Unterstützte Sprachen

0 %Verständlichkeitsscore

0 %Reduktion der Übergabequote

0,00kWh / Anruf

IN THE PRESS

Coverage

What German tech and public-sector media say about VoiceA.

TODO-CONTENT: „VoiceA zeigt, dass KI-gestützte Sprachsysteme im Behördenumfeld nicht nur technisch möglich, sondern datenschutzrechtlich vertretbar sind — wenn man konsequent auf selbst gehostete Infrastruktur setzt."
Heise Online14.11.24

TODO-CONTENT: „Das Freiburger Pilotprojekt liefert beeindruckende Zahlen: 87 Prozent korrekte Sprachverstehensrate bei sechs Sprachen — und das auf Hardware, die in jedem Rechenzentrum eines Landratsamts steht."
Golem.de22.09.24

TODO-CONTENT: „Sprachassistenten für Ämter: Wie KI den Behördenkontakt barrierefrei machen soll — und warum der Schlüssel in der Datensouveränität liegt."
Tagesschau Digital05.10.24

TODO-CONTENT: „VoiceA ist ein seltenes Beispiel für Public-Interest-KI: Open-Source-Komponenten, DSGVO-konforme Architektur und ein Geschäftsmodell, das keine Massenüberwachung von Bürgerdaten erfordert."
Netzpolitik.org18.01.25

TODO-CONTENT: „Im Labor-Test überzeugte VoiceA mit einer Wortfehlerrate von 4,2 Prozent auf deutschen Amtssprachtexten — besser als alle getesteten Cloud-Dienste, bei einem Bruchteil der Betriebskosten."
c't Magazin08.02.25

Testimonials

What operators say

Feedback from the people using VoiceA every day in German public administrations.

„Früher musste ich bei jedem dritten Anruf auf einen Kollegen warten, der Türkisch spricht. Heute bekomme ich direkt eine Zusammenfassung auf dem Bildschirm und kann sofort weiterhelfen. Das spart uns täglich mindestens eine Stunde."
TODO-CONTENT: Vorname NachnameSachbearbeiterin Einwohnermeldeamt, TODO-CONTENT: Bürgeramt Freiburg im Breisgau

„VoiceA hat unsere Erwartungen übertroffen. Die Lösung war innerhalb von sechs Wochen produktiv, der Energieverbrauch liegt deutlich unter dem unserer alten Cloud-Lösung, und wir haben keine einzige Bürgerbeschwerden wegen Datenschutz erhalten."
TODO-CONTENT: Vorname NachnameLeitung Digitale Verwaltung, TODO-CONTENT: Bezirksamt Hamburg-Altona

„Als IT-Leiter war mir vor allem wichtig, dass wir keine Daten in die Cloud schicken. VoiceA läuft komplett auf unserer eigenen Infrastruktur im Berliner Rechenzentrum — und das Audit-Log hat unseren Datenschutzbeauftragten vollständig überzeugt."
TODO-CONTENT: Vorname NachnameIT-Leiter, TODO-CONTENT: Bürgeramt Berlin-Mitte

„Das Onboarding-Team von Spektra war von Anfang an dabei: Workshop, Trainingsdata-Erhebung, Abnahmetest. In 90 Tagen waren wir live. Das hätten wir mit keinem anderen Anbieter geschafft."
TODO-CONTENT: Vorname NachnameProjektleiterin Digitalisierung, TODO-CONTENT: Kreisverwaltungsreferat München

Team

The people behind VoiceA

Researchers, engineers, and compliance experts building sovereign voice AI for German public services.

TODO-CONTENT: Dr. Vorname Nachname

Research Lead — Speech & Language

Spezialist für akustische Sprachidentifikation mit Publikationen bei Interspeech und ACL.

TODO-CONTENT: Vorname Nachname

Engineering Lead — Infrastructure & Integration

Full-Stack-Ingenieurin mit Fokus auf selbst gehostete KI-Infrastruktur und SIP/WebRTC-Integration.

TODO-CONTENT: Vorname Nachname

ML Engineer — ASR & TTS Adaptation

Experte für Fine-Tuning großer Sprachmodelle auf domänenspezifische Verwaltungsvokabulare.

TODO-CONTENT: Vorname Nachname

UX Researcher — Operator & Citizen Experience

Forscherin für barrierefreie Bedienerführung mit Fokus auf mehrsprachige Bürgeranfragen.

TODO-CONTENT: Vorname Nachname

Compliance Officer — DSGVO & EU AI Act

Juristin und Datenschutzexpertin mit Zertifizierung nach CIPP/E und Schwerpunkt auf KI-Regulierung.

TODO-CONTENT: Vorname Nachname

Product Manager — Government Deployments

Erfahrener Produktmanager mit Hintergrund in öffentlicher Verwaltung und digitaler Transformation.

Blog

Latest from the team

Technical deep-dives, compliance guides, and product updates from Spektra VoiceA.

Meet Stimmi — The Face of Accessible Government Communication

design

mascot

accessibility

Meet Stimmi — The Face of Accessible Government Communication

Every great product has a personality. Stimmi is VoiceA's mascot: a small animated character that guides citizens through the voice interface, signals system states, and makes the often-intimidating experience of calling a government office feel a little friendlier.

TODO-CONTENT: Vorname Nachname, UX Researcher01.04.255 Min. Lesezeit

compliance

eu-ai-act

dsgvo

government

EU AI Act: What Every Bürgerdienst Needs to Know Before Deploying Voice AI

The EU AI Act came into force in August 2024. Voice AI systems used by public authorities fall squarely in the high-risk category. Here is a plain-language guide to what compliance means in practice — and how VoiceA is built to meet every requirement.

TODO-CONTENT: Vorname Nachname, Compliance Officer10.03.2510 Min. Lesezeit

infrastructure

self-hosted

llm

hardware

Self-Hosted LLM Inference: Hardware Sizing Guide for Bürgerdienste

Running a large language model on your own server sounds daunting, but the hardware requirements for a government voice-AI deployment are well within reach of standard IT budgets. Here is a practical sizing guide based on our pilot deployments.

TODO-CONTENT: Vorname Nachname, Engineering Lead03.02.258 Min. Lesezeit

How Bayesian Fusion Improves Multilingual Comprehension Detection

machine-learning

nlp

architecture

multilingual

How Bayesian Fusion Improves Multilingual Comprehension Detection

A single confidence score from your ASR engine is not enough to know whether a multilingual caller has been understood. We explain how VoiceA combines four independent signals in a Bayesian network to produce a calibrated comprehension score — and why this matters for safe handoff decisions.

TODO-CONTENT: Dr. Vorname Nachname, Research Lead14.01.257 Min. Lesezeit

VERSTEHEN VERBINDET — SPRACHE, DIE ZUHÖRT

VERSTEHEN VERBINDET — SPRACHE, DIE ZUHÖRT

Zuhören

Arbeiten Sie mit uns

Pilot-Deployment

Forschungskooperation

Alles, was Sie für den Einsatz von Sprach-KI in der Verwaltung benötigen

Echtzeit-Spracherkennung

Bayesianische Verstehensfusion

Vollständig selbst gehostet

Whisper ASR

Piper TTS

Qdrant Vector RAG

Unveränderliche Prüfkette

Öko-Metriken-Dashboard

V-Modell XT konform

DSGVO-Schutzschild

Intelligente Übergabe-UX

Pilot-Deployments

Berlin

Hamburg

Baden-Württemberg

Sachsen

Sachsen

Bayern

Coverage

What operators say

The people behind VoiceA

TODO-CONTENT: Dr. Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

Latest from the team

Meet Stimmi — The Face of Accessible Government Communication

EU AI Act: What Every Bürgerdienst Needs to Know Before Deploying Voice AI

Self-Hosted LLM Inference: Hardware Sizing Guide for Bürgerdienste

How Bayesian Fusion Improves Multilingual Comprehension Detection