Produkt

Ein Sprachassistent, den Sie selbst betreiben

VoiceA verarbeitet telefonische und WebRTC-Bürgeranfragen in Echtzeit auf Ihrer Infrastruktur, erkennt die Sprachkompetenz der anrufenden Person, beantwortet Standardfragen aus Ihrer Wissensbasis und übergibt an Ihre Sachbearbeiterinnen, sobald das automatische Verstehen nicht mehr ausreicht. Alle Modelle laufen im behördeneigenen Rechenzentrum oder auf einer souveränen Cloud-VM — ohne externe API-Aufrufe.

Fünf-Phasen-Architektur

Jeder Bürgeranruf durchläuft dieselben fünf Phasen — Zuhören, Verstehen, Entscheiden, Schützen, Verbinden. Detaillierte Phasenbeschreibungen finden Sie auf der Startseite im Hero-Abschnitt.

Phasen im Detail

Kernfunktionen

Elf produktionsreife Bausteine — kombinierbar je nach Anwendungsfall:

Echtzeit-Spracherkennung
Identifiziert die Sprache der anrufenden Person innerhalb der ersten 3 Sekunden des Gesprächs anhand eines akustischen Fingerabdruckmodells — für nahtloses mehrsprachiges Routing, ohne dass eine Sprachauswahl erforderlich ist.
Bayesianische Verstehensfusion
Kombiniert ASR-Konfidenzwerte, Dialogakt-Wahrscheinlichkeiten und domänenspezifische Priors in einem Bayesschen Netzwerk zu einem kalibrierten Verständlichkeitsscore — die Übergabe an eine Sachbearbeiterin wird nur ausgelöst, wenn das Verstehen unter einen konfigurierbaren Schwellwert fällt.
Vollständig selbst gehostet
Läuft ausschließlich auf Ihrer eigenen Infrastruktur — im behördeneigenen Rechenzentrum oder auf einer souveränen Cloud-VM — ohne externe API-Aufrufe; Bürgerdaten verlassen zu keinem Zeitpunkt Ihren Netzwerkperimeter.
Whisper ASR
Nutzt OpenAI Whisper (large-v3-turbo), feinabgestimmt auf deutschen Verwaltungswortschatz und regionale Dialektdaten, für erstklassige Wortfehlerquoten bei Bürgerdienst-Anrufaufzeichnungen.
Piper TTS
Generiert natürlich klingende Sprachausgaben auf Deutsch, Türkisch, Arabisch, Französisch, Russisch und Englisch mit Piper, einer schnellen neuronalen Text-to-Speech-Engine, die in Echtzeit auf CPU mit unter 150 ms Latenz läuft.
Qdrant Vector RAG
Ruft verlässliche Antworten aus Ihrer Bürgerdienste-Wissensbasis ab — Formulare, Fristen, Anspruchsvoraussetzungen — über semantische Vektorsuche in einer lokalen Qdrant-Instanz und verankert jede Antwort in aktuellen Behördendokumenten.
Unveränderliche Prüfkette
Schreibt ein kryptographisch verknüpftes, nur-anhängendes Protokoll jedes Anrufereignisses — ASR-Transkript, Intentionsklassifikation, Übergabeentscheidung, Bearbeitungsaktion — für vollständige Reproduzierbarkeit bei Aufsichtsbehörden-Audits gemäß EU AI Act.
Öko-Metriken-Dashboard
Misst und berichtet den Energieverbrauch pro Anruf (kWh), den CO₂-Äquivalent-Gesamtfußabdruck und vergleichende Einsparungen gegenüber cloudbasierten Alternativen — zur Unterstützung der Nachhaltigkeitsberichterstattung Ihrer Behörde.
V-Modell XT konform
Entwickelt und dokumentiert gemäß V-Modell XT, dem verbindlichen deutschen Standard für Softwareentwicklung im öffentlichen Sektor, einschließlich nachvollziehbarer Anforderungen, definierter Testebenen und eines strukturierten Übergabepakets.
DSGVO-Schutzschild
Eingebaute technisch-organisatorische Maßnahmen (TOMs) erfüllen DSGVO Art. 25 (Datenschutz durch Technikgestaltung), Art. 32 (Sicherheit der Verarbeitung) und Art. 35 (DSFA) — mit vorbereiteten Verarbeitungsverzeichnis-Vorlagen inklusive.
Intelligente Übergabe-UX
Fällt die Konfidenz unter den Schwellwert, übergibt das System an eine Sachbearbeiterin mit einer Ein-Bildschirm-Kontextkarte: Live-Transkript, erkannte Intention, Anrufsprache und Antwortvorschlag — durchschnittliche Bearbeitungszeit reduziert sich um bis zu 40 %.

Alle Funktionen

Konformität

DSGVO Art. 25 — Datenschutz durch Technikgestaltung, keine externen Datenflüsse
DSGVO Art. 32 — Sicherheit der Verarbeitung, Ende-zu-Ende-Verschlüsselung der Operator-Sessions
DSGVO Art. 35 — DSFA-Vorlage als Bestandteil des Auslieferungspakets
EU AI Act — Hochrisiko-Einordnung (Anhang III Abs. 5), vollständige technische Dokumentation
V-Modell XT — nachvollziehbare Anforderungen, definierte Testebenen, strukturierter Übergabeprozess
EN 301 549 / WCAG 2.1 AA — Operator-UI erfüllt die Barrierefreiheitsanforderungen des öffentlichen Sektors

Integration

VoiceA bindet sich über SIP-Trunk oder WebRTC an Ihre bestehende Telefonie an und kann Wissensbasen in gängigen Formaten (Markdown, PDF, DOCX) sowie aus Fachverfahren (z. B. über ELAK, meldewesenspezifische Schnittstellen) indizieren.

Pilotprojekt ansetzen

Wir zeigen Ihnen VoiceA gerne anhand Ihrer eigenen Fragetypen, Sprachen und Fachvokabulare. Ein erstes, unverbindliches Gespräch dauert typischerweise 30 Minuten.

Pilot anfragen

Fünf-Phasen-Architektur

Kernfunktionen

Echtzeit-Spracherkennung

Bayesianische Verstehensfusion

Vollständig selbst gehostet

Whisper ASR

Piper TTS

Qdrant Vector RAG

Unveränderliche Prüfkette

Öko-Metriken-Dashboard

V-Modell XT konform

DSGVO-Schutzschild

Intelligente Übergabe-UX

Konformität

Integration

Pilotprojekt ansetzen