Produkt

Ein Sprachassistent, den Sie selbst betreiben

VoiceA verarbeitet telefonische und WebRTC-Bürgeranfragen in Echtzeit auf Ihrer Infrastruktur, erkennt die Sprachkompetenz der anrufenden Person, beantwortet Standardfragen aus Ihrer Wissensbasis und übergibt an Ihre Sachbearbeiterinnen, sobald das automatische Verstehen nicht mehr ausreicht. Alle Modelle laufen im behördeneigenen Rechenzentrum oder auf einer souveränen Cloud-VM — ohne externe API-Aufrufe.

Fünf-Phasen-Architektur

Jeder Bürgeranruf durchläuft dieselben fünf Phasen — Zuhören, Verstehen, Entscheiden, Schützen, Verbinden. Detaillierte Phasenbeschreibungen finden Sie auf der Startseite im Hero-Abschnitt.

Phasen im Detail

Kernfunktionen

Elf produktionsreife Bausteine — kombinierbar je nach Anwendungsfall:

  • Echtzeit-Spracherkennung

    Identifiziert die Sprache der anrufenden Person innerhalb der ersten 3 Sekunden des Gesprächs anhand eines akustischen Fingerabdruckmodells — für nahtloses mehrsprachiges Routing, ohne dass eine Sprachauswahl erforderlich ist.

  • Bayesianische Verstehensfusion

    Kombiniert ASR-Konfidenzwerte, Dialogakt-Wahrscheinlichkeiten und domänenspezifische Priors in einem Bayesschen Netzwerk zu einem kalibrierten Verständlichkeitsscore — die Übergabe an eine Sachbearbeiterin wird nur ausgelöst, wenn das Verstehen unter einen konfigurierbaren Schwellwert fällt.

  • Vollständig selbst gehostet

    Läuft ausschließlich auf Ihrer eigenen Infrastruktur — im behördeneigenen Rechenzentrum oder auf einer souveränen Cloud-VM — ohne externe API-Aufrufe; Bürgerdaten verlassen zu keinem Zeitpunkt Ihren Netzwerkperimeter.

  • Whisper ASR

    Nutzt OpenAI Whisper (large-v3-turbo), feinabgestimmt auf deutschen Verwaltungswortschatz und regionale Dialektdaten, für erstklassige Wortfehlerquoten bei Bürgerdienst-Anrufaufzeichnungen.

  • Piper TTS

    Generiert natürlich klingende Sprachausgaben auf Deutsch, Türkisch, Arabisch, Französisch, Russisch und Englisch mit Piper, einer schnellen neuronalen Text-to-Speech-Engine, die in Echtzeit auf CPU mit unter 150 ms Latenz läuft.

  • Qdrant Vector RAG

    Ruft verlässliche Antworten aus Ihrer Bürgerdienste-Wissensbasis ab — Formulare, Fristen, Anspruchsvoraussetzungen — über semantische Vektorsuche in einer lokalen Qdrant-Instanz und verankert jede Antwort in aktuellen Behördendokumenten.

  • Unveränderliche Prüfkette

    Schreibt ein kryptographisch verknüpftes, nur-anhängendes Protokoll jedes Anrufereignisses — ASR-Transkript, Intentionsklassifikation, Übergabeentscheidung, Bearbeitungsaktion — für vollständige Reproduzierbarkeit bei Aufsichtsbehörden-Audits gemäß EU AI Act.

  • Öko-Metriken-Dashboard

    Misst und berichtet den Energieverbrauch pro Anruf (kWh), den CO₂-Äquivalent-Gesamtfußabdruck und vergleichende Einsparungen gegenüber cloudbasierten Alternativen — zur Unterstützung der Nachhaltigkeitsberichterstattung Ihrer Behörde.

  • V-Modell XT konform

    Entwickelt und dokumentiert gemäß V-Modell XT, dem verbindlichen deutschen Standard für Softwareentwicklung im öffentlichen Sektor, einschließlich nachvollziehbarer Anforderungen, definierter Testebenen und eines strukturierten Übergabepakets.

  • DSGVO-Schutzschild

    Eingebaute technisch-organisatorische Maßnahmen (TOMs) erfüllen DSGVO Art. 25 (Datenschutz durch Technikgestaltung), Art. 32 (Sicherheit der Verarbeitung) und Art. 35 (DSFA) — mit vorbereiteten Verarbeitungsverzeichnis-Vorlagen inklusive.

  • Intelligente Übergabe-UX

    Fällt die Konfidenz unter den Schwellwert, übergibt das System an eine Sachbearbeiterin mit einer Ein-Bildschirm-Kontextkarte: Live-Transkript, erkannte Intention, Anrufsprache und Antwortvorschlag — durchschnittliche Bearbeitungszeit reduziert sich um bis zu 40 %.

Konformität

  • DSGVO Art. 25 — Datenschutz durch Technikgestaltung, keine externen Datenflüsse
  • DSGVO Art. 32 — Sicherheit der Verarbeitung, Ende-zu-Ende-Verschlüsselung der Operator-Sessions
  • DSGVO Art. 35 — DSFA-Vorlage als Bestandteil des Auslieferungspakets
  • EU AI Act — Hochrisiko-Einordnung (Anhang III Abs. 5), vollständige technische Dokumentation
  • V-Modell XT — nachvollziehbare Anforderungen, definierte Testebenen, strukturierter Übergabeprozess
  • EN 301 549 / WCAG 2.1 AA — Operator-UI erfüllt die Barrierefreiheitsanforderungen des öffentlichen Sektors

Integration

VoiceA bindet sich über SIP-Trunk oder WebRTC an Ihre bestehende Telefonie an und kann Wissensbasen in gängigen Formaten (Markdown, PDF, DOCX) sowie aus Fachverfahren (z. B. über ELAK, meldewesenspezifische Schnittstellen) indizieren.

Pilotprojekt ansetzen

Wir zeigen Ihnen VoiceA gerne anhand Ihrer eigenen Fragetypen, Sprachen und Fachvokabulare. Ein erstes, unverbindliches Gespräch dauert typischerweise 30 Minuten.

Pilot anfragen