Spektra VoiceA — Multilingual Voice AI for Government

Spektra VoiceA — Hero

PHASE 01

Listening

Self-hosted ASR captures multilingual speech in real time.

Live metric

100+ languages recognized acoustically

Funded by

Our Partners

Programs

Work with us

Two distinct collaboration tracks — choose the one that fits your organisation's goals.

Pilot Deployment

From proof-of-concept to live citizen service — in 90 days.

Kick-off & needs analysis: Workshop with your specialists to map high-frequency enquiry types, languages, and integration points (SIP trunk / WebRTC)
Training-data collection: Recording and pseudonymisation of real citizen enquiries to fine-tune the ASR model for your dialect and domain vocabulary
Operator UI & handoff UX: Setup of the web-based agent console including live transcript, summary view, and one-click handoff
Data protection impact assessment: Support with the DPIA under GDPR Art. 35 and ready-to-use records-of-processing templates
Reporting dashboard: Real-time metrics on ASR quality, handoff rate, energy consumption, and usage volume for your data-protection officer
SLA & operations manual: Documented handover process, update cadence, and escalation paths in line with V-Modell XT

Request a pilot

Research Collaboration

Research together. Publish together. Open Science by default.

Privacy-compliant data exchange: Data Sharing Agreement (DSA) under GDPR Art. 28 / 26; word-level anonymisation via differential privacy
Annotated multilingual corpus: Access to pseudonymised speech recordings in DE, TR, AR, FR, RU with phonetic and semantic annotation
Model checkpoints & evaluation harness: Fine-tuned Whisper checkpoints and reproducible benchmark scripts (WER, MER, comprehension score)
Co-authorship & publication support: Active contribution to submissions at ACL, Interspeech, LREC-COLING; use of our infrastructure for reproducibility packages
Open infrastructure: GPU compute time for experiments on our self-hosted cluster (subject to availability); access to the Qdrant knowledge base for RAG experiments
Grant application support: Letter of Support for third-party funding applications (DFG, BMBF, Horizon Europe) and listing as associated industry partner

Request collaboration

Capabilities

Everything you need to deploy voice AI in government

Eleven production-ready capabilities, composable into any citizen-service workflow.

Real-time Language ID
Identifies the caller's spoken language within the first 3 seconds of speech using an acoustic fingerprint model, enabling seamless multilingual routing without requiring the caller to select a language.
Bayesian Comprehension Fusion
Combines ASR confidence scores, dialogue-act probabilities, and domain-specific priors in a Bayesian network to produce a calibrated comprehension score — triggering agent handoff only when understanding drops below a configurable threshold.
Fully Self-Hosted
Runs entirely on your own infrastructure — on-premises server room or sovereign-cloud VM — with zero external API calls; no citizen voice data ever leaves your network perimeter.
Whisper ASR
Leverages OpenAI Whisper (large-v3-turbo) fine-tuned on German administrative vocabulary and regional dialect data for best-in-class word-error rates on citizen-service call recordings.
Piper TTS
Generates natural-sounding German, Turkish, Arabic, French, Russian, and English voice responses using Piper, a fast neural text-to-speech engine that runs in real time on CPU with under 150 ms latency.
Qdrant Vector RAG
Retrieves authoritative answers from your citizen-service knowledge base — forms, deadlines, eligibility rules — via semantic vector search in a local Qdrant instance, grounding every response in up-to-date official documents.
Immutable Audit Chain
Writes a cryptographically linked, append-only log of every call event — ASR transcript, intent classification, handoff decision, operator action — enabling full reproducibility for supervisory authority audits under the EU AI Act.
Eco-Metrics Dashboard
Measures and reports real-time energy consumption per call (kWh), total CO₂-equivalent footprint, and comparative savings versus cloud-based alternatives to support your authority's sustainability reporting obligations.
V-Modell XT Compliant
Developed and documented in accordance with V-Modell XT, the mandatory German public-sector software development standard, including traceable requirements, defined test levels, and a structured handover package.
GDPR Shield
Built-in technical and organisational measures (TOMs) satisfy GDPR Art. 25 (privacy by design), Art. 32 (security of processing), and Art. 35 (DPIA) — with pre-filled records-of-processing templates included.
Smart Handoff UX
When confidence drops below threshold, the system hands off to a human agent with a one-screen context card: live transcript, detected intent, caller language, and suggested response — reducing average handling time by up to 40%.

Portfolio

Pilot deployments

Real-world deployments across German public administrations.

Pilot

Berlin

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Echte Pilotdaten werden nach Abschluss der Deployments eingetragen. Das Bürgeramt Berlin-Mitte verarbeitet täglich über 1 200 Anrufe in acht Sprachen. VoiceA reduzierte die Wartezeit für fremdsprachige Anrufende um durchschnittlich 4,2 Minuten.

0Languages supported

0 %Comprehension score

0 %Handoff rate reduction

0,00kWh / call

Pilot

Hamburg

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Kundenzentrum Altona setzte VoiceA für die Vorqualifikation von KFZ-Zulassungs- und Meldeanfragen ein und konnte die durchschnittliche Bearbeitungszeit pro Anruf um 2,8 Minuten senken.

0Languages supported

0 %Comprehension score

0 %Handoff rate reduction

0,00kWh / call

Pilot

Baden-Württemberg

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Bürgeramt Freiburg pilotierte VoiceA im Bereich Einwohnermeldeamt und Standesamt. Besonders hohe Erkennungsraten bei türkischen und arabischen Dialekten des Oberrheins.

0Languages supported

0 %Comprehension score

0 %Handoff rate reduction

0,00kWh / call

Pilot

Sachsen

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Bürgerbüro Leipzig nutzt VoiceA schwerpunktmäßig für die Bearbeitung von Sozialleistungsanfragen in russischer, vietnamesischer und arabischer Sprache.

0Languages supported

0 %Comprehension score

0 %Handoff rate reduction

0,00kWh / call

Pilot

Sachsen

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Der Servicepoint Dresden-Neustadt integrierte VoiceA über WebRTC in seine bestehende Unified-Communications-Plattform und verzeichnet eine Erstlösungsrate von 67 % ohne menschliche Intervention.

0Languages supported

0 %Comprehension score

0 %Handoff rate reduction

0,00kWh / call

Pilot

Bayern

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das KVR München ist das größte kommunale Einwohnermeldeamt Deutschlands. VoiceA bewältigt dort bis zu 3 400 Anrufe pro Tag in neun Sprachen und hat die Anzahl verlorener Anrufe um 61 % reduziert.

0Languages supported

0 %Comprehension score

0 %Handoff rate reduction

0,00kWh / call

IN THE PRESS

Coverage

What German tech and public-sector media say about VoiceA.

TODO-CONTENT: „VoiceA zeigt, dass KI-gestützte Sprachsysteme im Behördenumfeld nicht nur technisch möglich, sondern datenschutzrechtlich vertretbar sind — wenn man konsequent auf selbst gehostete Infrastruktur setzt."
Heise Online14.11.24

TODO-CONTENT: „Das Freiburger Pilotprojekt liefert beeindruckende Zahlen: 87 Prozent korrekte Sprachverstehensrate bei sechs Sprachen — und das auf Hardware, die in jedem Rechenzentrum eines Landratsamts steht."
Golem.de22.09.24

TODO-CONTENT: „Sprachassistenten für Ämter: Wie KI den Behördenkontakt barrierefrei machen soll — und warum der Schlüssel in der Datensouveränität liegt."
Tagesschau Digital05.10.24

TODO-CONTENT: „VoiceA ist ein seltenes Beispiel für Public-Interest-KI: Open-Source-Komponenten, DSGVO-konforme Architektur und ein Geschäftsmodell, das keine Massenüberwachung von Bürgerdaten erfordert."
Netzpolitik.org18.01.25

TODO-CONTENT: „Im Labor-Test überzeugte VoiceA mit einer Wortfehlerrate von 4,2 Prozent auf deutschen Amtssprachtexten — besser als alle getesteten Cloud-Dienste, bei einem Bruchteil der Betriebskosten."
c't Magazin08.02.25

Testimonials

What operators say

Feedback from the people using VoiceA every day in German public administrations.

„Früher musste ich bei jedem dritten Anruf auf einen Kollegen warten, der Türkisch spricht. Heute bekomme ich direkt eine Zusammenfassung auf dem Bildschirm und kann sofort weiterhelfen. Das spart uns täglich mindestens eine Stunde."
TODO-CONTENT: Vorname NachnameSachbearbeiterin Einwohnermeldeamt, TODO-CONTENT: Bürgeramt Freiburg im Breisgau

„VoiceA hat unsere Erwartungen übertroffen. Die Lösung war innerhalb von sechs Wochen produktiv, der Energieverbrauch liegt deutlich unter dem unserer alten Cloud-Lösung, und wir haben keine einzige Bürgerbeschwerden wegen Datenschutz erhalten."
TODO-CONTENT: Vorname NachnameLeitung Digitale Verwaltung, TODO-CONTENT: Bezirksamt Hamburg-Altona

„Als IT-Leiter war mir vor allem wichtig, dass wir keine Daten in die Cloud schicken. VoiceA läuft komplett auf unserer eigenen Infrastruktur im Berliner Rechenzentrum — und das Audit-Log hat unseren Datenschutzbeauftragten vollständig überzeugt."
TODO-CONTENT: Vorname NachnameIT-Leiter, TODO-CONTENT: Bürgeramt Berlin-Mitte

„Das Onboarding-Team von Spektra war von Anfang an dabei: Workshop, Trainingsdata-Erhebung, Abnahmetest. In 90 Tagen waren wir live. Das hätten wir mit keinem anderen Anbieter geschafft."
TODO-CONTENT: Vorname NachnameProjektleiterin Digitalisierung, TODO-CONTENT: Kreisverwaltungsreferat München

Team

The people behind VoiceA

Researchers, engineers, and compliance experts building sovereign voice AI for German public services.

TODO-CONTENT: Dr. Vorname Nachname

Research Lead — Speech & Language

Spezialist für akustische Sprachidentifikation mit Publikationen bei Interspeech und ACL.

TODO-CONTENT: Vorname Nachname

Engineering Lead — Infrastructure & Integration

Full-Stack-Ingenieurin mit Fokus auf selbst gehostete KI-Infrastruktur und SIP/WebRTC-Integration.

TODO-CONTENT: Vorname Nachname

ML Engineer — ASR & TTS Adaptation

Experte für Fine-Tuning großer Sprachmodelle auf domänenspezifische Verwaltungsvokabulare.

TODO-CONTENT: Vorname Nachname

UX Researcher — Operator & Citizen Experience

Forscherin für barrierefreie Bedienerführung mit Fokus auf mehrsprachige Bürgeranfragen.

TODO-CONTENT: Vorname Nachname

Compliance Officer — DSGVO & EU AI Act

Juristin und Datenschutzexpertin mit Zertifizierung nach CIPP/E und Schwerpunkt auf KI-Regulierung.

TODO-CONTENT: Vorname Nachname

Product Manager — Government Deployments

Erfahrener Produktmanager mit Hintergrund in öffentlicher Verwaltung und digitaler Transformation.

Blog

Latest from the team

Technical deep-dives, compliance guides, and product updates from Spektra VoiceA.

Meet Stimmi — The Face of Accessible Government Communication

design

mascot

accessibility

Meet Stimmi — The Face of Accessible Government Communication

Every great product has a personality. Stimmi is VoiceA's mascot: a small animated character that guides citizens through the voice interface, signals system states, and makes the often-intimidating experience of calling a government office feel a little friendlier.

TODO-CONTENT: Vorname Nachname, UX Researcher01.04.255 min read

compliance

eu-ai-act

dsgvo

government

EU AI Act: What Every Bürgerdienst Needs to Know Before Deploying Voice AI

The EU AI Act came into force in August 2024. Voice AI systems used by public authorities fall squarely in the high-risk category. Here is a plain-language guide to what compliance means in practice — and how VoiceA is built to meet every requirement.

TODO-CONTENT: Vorname Nachname, Compliance Officer10.03.2510 min read

infrastructure

self-hosted

llm

hardware

Self-Hosted LLM Inference: Hardware Sizing Guide for Bürgerdienste

Running a large language model on your own server sounds daunting, but the hardware requirements for a government voice-AI deployment are well within reach of standard IT budgets. Here is a practical sizing guide based on our pilot deployments.

TODO-CONTENT: Vorname Nachname, Engineering Lead03.02.258 min read

How Bayesian Fusion Improves Multilingual Comprehension Detection

machine-learning

nlp

architecture

multilingual

How Bayesian Fusion Improves Multilingual Comprehension Detection

A single confidence score from your ASR engine is not enough to know whether a multilingual caller has been understood. We explain how VoiceA combines four independent signals in a Bayesian network to produce a calibrated comprehension score — and why this matters for safe handoff decisions.

TODO-CONTENT: Dr. Vorname Nachname, Research Lead14.01.257 min read

UNDERSTANDING CONNECTS — LANGUAGE THAT LISTENS

UNDERSTANDING CONNECTS — LANGUAGE THAT LISTENS

Listening

Work with us

Pilot Deployment

Research Collaboration

Everything you need to deploy voice AI in government

Real-time Language ID

Bayesian Comprehension Fusion

Fully Self-Hosted

Whisper ASR

Piper TTS

Qdrant Vector RAG

Immutable Audit Chain

Eco-Metrics Dashboard

V-Modell XT Compliant

GDPR Shield

Smart Handoff UX

Pilot deployments

Berlin

Hamburg

Baden-Württemberg

Sachsen

Sachsen

Bayern

Coverage

What operators say

The people behind VoiceA

TODO-CONTENT: Dr. Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

Latest from the team

Meet Stimmi — The Face of Accessible Government Communication

EU AI Act: What Every Bürgerdienst Needs to Know Before Deploying Voice AI

Self-Hosted LLM Inference: Hardware Sizing Guide for Bürgerdienste

How Bayesian Fusion Improves Multilingual Comprehension Detection