Spektra VoiceA — IA vocale multilingue pour les administrations

Spektra VoiceA — Hero

PHASE 01

Écoute

L'ASR auto-hébergé capture la parole multilingue en temps réel.

Métrique en direct

Plus de 100 langues reconnues acoustiquement

Financé par

Nos partenaires

Programmes

Travaillez avec nous

Deux modalités de collaboration distinctes — choisissez celle qui correspond aux objectifs de votre organisation.

Déploiement pilote

De la preuve de concept au service citoyen en production — en 90 jours.

Lancement et analyse des besoins : atelier avec vos spécialistes pour cartographier les types de demandes fréquentes, les langues et les points d'intégration (trunk SIP / WebRTC)
Collecte des données d'entraînement : enregistrement et pseudonymisation des demandes citoyennes réelles pour affiner le modèle ASR selon votre dialecte et votre vocabulaire métier
Interface opérateur et UX de transfert : mise en place de la console agent web avec transcription en direct, vue synthétique et transfert en un clic
Analyse d'impact sur la protection des données : accompagnement pour l'AIPD au titre de l'article 35 du RGPD et modèles de registres de traitement prêts à l'emploi
Tableau de bord de reporting : métriques en temps réel sur la qualité ASR, le taux de transfert, la consommation énergétique et les volumes d'usage — pour votre délégué à la protection des données
SLA et manuel d'exploitation : processus de transfert documenté, calendrier de mises à jour et chemins d'escalade conformes au V-Modell XT

Demander un pilote

Collaboration de recherche

Recherchez ensemble. Publiez ensemble. La science ouverte par défaut.

Échange de données conforme à la vie privée : accord de partage de données (DSA) en vertu des articles 28 et 26 du RGPD ; anonymisation au niveau du mot par confidentialité différentielle
Corpus multilingue annoté : accès à des enregistrements vocaux pseudonymisés en DE, TR, AR, FR, RU avec annotation phonétique et sémantique
Points de contrôle de modèles et harnais d'évaluation : points de contrôle Whisper affinés et scripts de benchmark reproductibles (WER, MER, score de compréhension)
Co-signature et soutien à la publication : contribution active aux soumissions à ACL, Interspeech, LREC-COLING ; utilisation de notre infrastructure pour les packages de reproductibilité
Infrastructure ouverte : temps de calcul GPU pour les expériences sur notre cluster auto-hébergé (selon disponibilité) ; accès à la base de connaissances Qdrant pour les expériences RAG
Soutien aux demandes de financement : lettre de soutien pour les dossiers de financement tiers (DFG, BMBF, Horizon Europe) et mention comme partenaire industriel associé

Demander une collaboration

Fonctionnalités

Tout ce qu'il faut pour déployer l'IA vocale dans le service public

Onze fonctionnalités prêtes pour la production, intégrables dans tout flux de travail de services aux citoyens.

Identification de la langue en temps réel
Identifie la langue parlée par l'appelant dans les 3 premières secondes de parole grâce à un modèle d'empreinte acoustique, permettant un routage multilingue fluide sans que l'appelant n'ait à sélectionner une langue.
Fusion bayésienne de la compréhension
Combine les scores de confiance ASR, les probabilités d'actes de dialogue et les a priori spécifiques au domaine dans un réseau bayésien pour produire un score de compréhension calibré — déclenchant le transfert vers un agent uniquement lorsque la compréhension descend sous un seuil configurable.
Entièrement auto-hébergé
Fonctionne entièrement sur votre propre infrastructure — salle serveur sur site ou VM en cloud souverain — sans aucun appel API externe ; aucune donnée vocale de citoyen ne quitte jamais votre périmètre réseau.
Whisper ASR
S'appuie sur OpenAI Whisper (large-v3-turbo) affiné sur le vocabulaire administratif allemand et les données de dialectes régionaux pour des taux d'erreur sur les mots parmi les meilleurs de sa catégorie sur les enregistrements d'appels de services publics.
Piper TTS
Génère des réponses vocales au son naturel en allemand, turc, arabe, français, russe et anglais avec Piper, un moteur de synthèse vocale neuronale rapide fonctionnant en temps réel sur CPU avec une latence inférieure à 150 ms.
Qdrant Vector RAG
Récupère des réponses faisant autorité depuis votre base de connaissances des services aux citoyens — formulaires, délais, conditions d'éligibilité — via une recherche sémantique vectorielle dans une instance Qdrant locale, ancrant chaque réponse dans des documents officiels à jour.
Chaîne d'audit immuable
Écrit un journal cryptographiquement lié, en ajout seulement, de chaque événement d'appel — transcription ASR, classification d'intention, décision de transfert, action de l'opérateur — permettant une reproductibilité complète pour les audits des autorités de contrôle au titre de l'EU AI Act.
Tableau de bord Éco-Métriques
Mesure et rapporte la consommation énergétique en temps réel par appel (kWh), l'empreinte totale équivalente CO₂ et les économies comparatives par rapport aux alternatives cloud pour soutenir les obligations de reporting développement durable de votre administration.
Conforme V-Modell XT
Développé et documenté conformément au V-Modell XT, le standard obligatoire de développement logiciel du secteur public allemand, incluant des exigences traçables, des niveaux de test définis et un package de transfert structuré.
Bouclier RGPD
Les mesures techniques et organisationnelles (MTO) intégrées satisfont les articles 25 (protection des données dès la conception), 32 (sécurité du traitement) et 35 (AIPD) du RGPD — avec des modèles de registres de traitement pré-remplis inclus.
UX de transfert intelligent
Quand la confiance passe sous le seuil, le système transfère vers un agent humain avec une fiche de contexte sur un seul écran : transcription en direct, intention détectée, langue de l'appelant et réponse suggérée — réduisant la durée moyenne de traitement jusqu'à 40 %.

Portfolio

Déploiements pilotes

Déploiements réels dans les administrations publiques allemandes.

Pilote

Berlin

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Echte Pilotdaten werden nach Abschluss der Deployments eingetragen. Das Bürgeramt Berlin-Mitte verarbeitet täglich über 1 200 Anrufe in acht Sprachen. VoiceA reduzierte die Wartezeit für fremdsprachige Anrufende um durchschnittlich 4,2 Minuten.

0Langues prises en charge

0 %Score de compréhension

0 %Réduction du taux de transfert

0,00kWh / appel

Pilote

Hamburg

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Kundenzentrum Altona setzte VoiceA für die Vorqualifikation von KFZ-Zulassungs- und Meldeanfragen ein und konnte die durchschnittliche Bearbeitungszeit pro Anruf um 2,8 Minuten senken.

0Langues prises en charge

0 %Score de compréhension

0 %Réduction du taux de transfert

0,00kWh / appel

Pilote

Baden-Württemberg

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Bürgeramt Freiburg pilotierte VoiceA im Bereich Einwohnermeldeamt und Standesamt. Besonders hohe Erkennungsraten bei türkischen und arabischen Dialekten des Oberrheins.

0Langues prises en charge

0 %Score de compréhension

0 %Réduction du taux de transfert

0,00kWh / appel

Pilote

Sachsen

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Bürgerbüro Leipzig nutzt VoiceA schwerpunktmäßig für die Bearbeitung von Sozialleistungsanfragen in russischer, vietnamesischer und arabischer Sprache.

0Langues prises en charge

0 %Score de compréhension

0 %Réduction du taux de transfert

0,00kWh / appel

Pilote

Sachsen

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Der Servicepoint Dresden-Neustadt integrierte VoiceA über WebRTC in seine bestehende Unified-Communications-Plattform und verzeichnet eine Erstlösungsrate von 67 % ohne menschliche Intervention.

0Langues prises en charge

0 %Score de compréhension

0 %Réduction du taux de transfert

0,00kWh / appel

Pilote

Bayern

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das KVR München ist das größte kommunale Einwohnermeldeamt Deutschlands. VoiceA bewältigt dort bis zu 3 400 Anrufe pro Tag in neun Sprachen und hat die Anzahl verlorener Anrufe um 61 % reduziert.

0Langues prises en charge

0 %Score de compréhension

0 %Réduction du taux de transfert

0,00kWh / appel

DANS LA PRESSE

Couverture médiatique

Ce que la presse technologique et du secteur public allemand dit de VoiceA.

TODO-CONTENT: „VoiceA zeigt, dass KI-gestützte Sprachsysteme im Behördenumfeld nicht nur technisch möglich, sondern datenschutzrechtlich vertretbar sind — wenn man konsequent auf selbst gehostete Infrastruktur setzt."
Heise Online14.11.24

TODO-CONTENT: „Das Freiburger Pilotprojekt liefert beeindruckende Zahlen: 87 Prozent korrekte Sprachverstehensrate bei sechs Sprachen — und das auf Hardware, die in jedem Rechenzentrum eines Landratsamts steht."
Golem.de22.09.24

TODO-CONTENT: „Sprachassistenten für Ämter: Wie KI den Behördenkontakt barrierefrei machen soll — und warum der Schlüssel in der Datensouveränität liegt."
Tagesschau Digital05.10.24

TODO-CONTENT: „VoiceA ist ein seltenes Beispiel für Public-Interest-KI: Open-Source-Komponenten, DSGVO-konforme Architektur und ein Geschäftsmodell, das keine Massenüberwachung von Bürgerdaten erfordert."
Netzpolitik.org18.01.25

TODO-CONTENT: „Im Labor-Test überzeugte VoiceA mit einer Wortfehlerrate von 4,2 Prozent auf deutschen Amtssprachtexten — besser als alle getesteten Cloud-Dienste, bei einem Bruchteil der Betriebskosten."
c't Magazin08.02.25

Témoignages

Ce que disent les opérateurs

Retours des personnes utilisant VoiceA au quotidien dans les administrations publiques allemandes.

„Früher musste ich bei jedem dritten Anruf auf einen Kollegen warten, der Türkisch spricht. Heute bekomme ich direkt eine Zusammenfassung auf dem Bildschirm und kann sofort weiterhelfen. Das spart uns täglich mindestens eine Stunde."
TODO-CONTENT: Vorname NachnameSachbearbeiterin Einwohnermeldeamt, TODO-CONTENT: Bürgeramt Freiburg im Breisgau

„VoiceA hat unsere Erwartungen übertroffen. Die Lösung war innerhalb von sechs Wochen produktiv, der Energieverbrauch liegt deutlich unter dem unserer alten Cloud-Lösung, und wir haben keine einzige Bürgerbeschwerden wegen Datenschutz erhalten."
TODO-CONTENT: Vorname NachnameLeitung Digitale Verwaltung, TODO-CONTENT: Bezirksamt Hamburg-Altona

„Als IT-Leiter war mir vor allem wichtig, dass wir keine Daten in die Cloud schicken. VoiceA läuft komplett auf unserer eigenen Infrastruktur im Berliner Rechenzentrum — und das Audit-Log hat unseren Datenschutzbeauftragten vollständig überzeugt."
TODO-CONTENT: Vorname NachnameIT-Leiter, TODO-CONTENT: Bürgeramt Berlin-Mitte

„Das Onboarding-Team von Spektra war von Anfang an dabei: Workshop, Trainingsdata-Erhebung, Abnahmetest. In 90 Tagen waren wir live. Das hätten wir mit keinem anderen Anbieter geschafft."
TODO-CONTENT: Vorname NachnameProjektleiterin Digitalisierung, TODO-CONTENT: Kreisverwaltungsreferat München

Équipe

Les personnes derrière VoiceA

Chercheurs, ingénieurs et experts en conformité qui développent une IA vocale souveraine pour les services publics allemands.

TODO-CONTENT: Dr. Vorname Nachname

Research Lead — Speech & Language

Spezialist für akustische Sprachidentifikation mit Publikationen bei Interspeech und ACL.

TODO-CONTENT: Vorname Nachname

Engineering Lead — Infrastructure & Integration

Full-Stack-Ingenieurin mit Fokus auf selbst gehostete KI-Infrastruktur und SIP/WebRTC-Integration.

TODO-CONTENT: Vorname Nachname

ML Engineer — ASR & TTS Adaptation

Experte für Fine-Tuning großer Sprachmodelle auf domänenspezifische Verwaltungsvokabulare.

TODO-CONTENT: Vorname Nachname

UX Researcher — Operator & Citizen Experience

Forscherin für barrierefreie Bedienerführung mit Fokus auf mehrsprachige Bürgeranfragen.

TODO-CONTENT: Vorname Nachname

Compliance Officer — DSGVO & EU AI Act

Juristin und Datenschutzexpertin mit Zertifizierung nach CIPP/E und Schwerpunkt auf KI-Regulierung.

TODO-CONTENT: Vorname Nachname

Product Manager — Government Deployments

Erfahrener Produktmanager mit Hintergrund in öffentlicher Verwaltung und digitaler Transformation.

Blog

Dernières nouvelles de l'équipe

Analyses techniques approfondies, guides de conformité et mises à jour produit de Spektra VoiceA.

Meet Stimmi — The Face of Accessible Government Communication

design

mascot

accessibility

Meet Stimmi — The Face of Accessible Government Communication

Every great product has a personality. Stimmi is VoiceA's mascot: a small animated character that guides citizens through the voice interface, signals system states, and makes the often-intimidating experience of calling a government office feel a little friendlier.

TODO-CONTENT: Vorname Nachname, UX Researcher01.04.255 min de lecture

compliance

eu-ai-act

dsgvo

government

EU AI Act: What Every Bürgerdienst Needs to Know Before Deploying Voice AI

The EU AI Act came into force in August 2024. Voice AI systems used by public authorities fall squarely in the high-risk category. Here is a plain-language guide to what compliance means in practice — and how VoiceA is built to meet every requirement.

TODO-CONTENT: Vorname Nachname, Compliance Officer10.03.2510 min de lecture

infrastructure

self-hosted

llm

hardware

Self-Hosted LLM Inference: Hardware Sizing Guide for Bürgerdienste

Running a large language model on your own server sounds daunting, but the hardware requirements for a government voice-AI deployment are well within reach of standard IT budgets. Here is a practical sizing guide based on our pilot deployments.

TODO-CONTENT: Vorname Nachname, Engineering Lead03.02.258 min de lecture

How Bayesian Fusion Improves Multilingual Comprehension Detection

machine-learning

nlp

architecture

multilingual

How Bayesian Fusion Improves Multilingual Comprehension Detection

A single confidence score from your ASR engine is not enough to know whether a multilingual caller has been understood. We explain how VoiceA combines four independent signals in a Bayesian network to produce a calibrated comprehension score — and why this matters for safe handoff decisions.

TODO-CONTENT: Dr. Vorname Nachname, Research Lead14.01.257 min de lecture

COMPRENDRE RELIE — UNE LANGUE QUI ÉCOUTE

COMPRENDRE RELIE — UNE LANGUE QUI ÉCOUTE

Écoute

Travaillez avec nous

Déploiement pilote

Collaboration de recherche

Tout ce qu'il faut pour déployer l'IA vocale dans le service public

Identification de la langue en temps réel

Fusion bayésienne de la compréhension

Entièrement auto-hébergé

Whisper ASR

Piper TTS

Qdrant Vector RAG

Chaîne d'audit immuable

Tableau de bord Éco-Métriques

Conforme V-Modell XT

Bouclier RGPD

UX de transfert intelligent

Déploiements pilotes

Berlin

Hamburg

Baden-Württemberg

Sachsen

Sachsen

Bayern

Couverture médiatique

Ce que disent les opérateurs

Les personnes derrière VoiceA

TODO-CONTENT: Dr. Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

Dernières nouvelles de l'équipe

Meet Stimmi — The Face of Accessible Government Communication

EU AI Act: What Every Bürgerdienst Needs to Know Before Deploying Voice AI

Self-Hosted LLM Inference: Hardware Sizing Guide for Bürgerdienste

How Bayesian Fusion Improves Multilingual Comprehension Detection