Architecture

Comment VoiceA est construit techniquement

VoiceA se compose de cinq services qui s'exécutent en conteneurs sur votre infrastructure : un service ASR (Whisper large-v3-turbo), un service TTS (Piper), un service LLM (Ollama plus modèles affinés), un service de récupération vectorielle (Qdrant) et une API opérateur. Une couche de fusion bayésienne concilie les signaux de tous les services pour produire un score de compréhension calibré. Chaque événement est persisté dans un journal d'audit chaîné en SHA-256.

Vue d'ensemble du système

Les composants communiquent via gRPC interne ; à l'extérieur, VoiceA n'expose que deux points d'accès — trunk SIP / WebRTC pour la couche audio et une interface HTTPS sécurisée pour l'interface opérateur. Aucun service n'a besoin d'accès Internet ; les mises à jour sont livrées sous forme d'images OCI signées via un registre appartenant à l'administration.

ASR & TTS

Le service ASR utilise Whisper large-v3-turbo, affiné sur le vocabulaire administratif allemand, les variantes dialectales saxonne, autrichienne et alémanique, ainsi que les langues de migration (turc, arabe, russe, français). Le taux d'erreur de mots est inférieur à 6 pour cent sur la téléphonie typique de mairie dans nos benchmarks internes. Le service TTS utilise Piper et fournit des réponses avec une latence inférieure à 150 ms sur du matériel CPU grand public.

LLM & RAG

Le service LLM s'exécute sur Ollama avec un modèle germanophone affiné à 8 milliards de paramètres. Le récupérateur (Qdrant) indexe la base de connaissances de votre administration — formulaires, calculateurs d'échéance, conditions d'éligibilité, instructions internes — et enrichit sémantiquement chaque requête. Le LLM ne génère que des réponses adossées à au moins un document indexé ; sinon la demande est transférée à un·e spécialiste humain·e.

Intégrations

VoiceA s'intègre via les interfaces suivantes : trunk SIP pour la téléphonie classique (Asterisk, FreeSWITCH), WebRTC pour les appels via navigateur et application, REST pour les connexions aux systèmes métier (ELAK, EVA, ePostfach). L'interface opérateur est une progressive web app qui fonctionne aussi hors-ligne sur le réseau de l'administration. Normes : OAuth 2.1 / OIDC pour la connexion, SAML 2.0 pour les identités fédérées, journalisation sécurisée pour l'audit conforme à BSI TR-03107.

Posture de sécurité

Chaque appel est documenté dans un journal d'événements chaîné en SHA-256 (transcription ASR, classification d'intention, décision de transfert, action opérateur). La chaîne est en écriture seulement ; les sommes de contrôle sont miroir toutes les heures sur un volume en lecture seule. La session entière est chiffrée (TLS 1.3 à l'extérieur, mTLS à l'intérieur du cluster). Modèle de rôles : opérateur·rices, superviseur·es, délégué·es à la protection des données, administration système — chacun·e avec des privilèges minimaux.