Архитектура

Как VoiceA устроен технически

VoiceA состоит из пяти сервисов, работающих как контейнеры на вашей инфраструктуре: сервис ASR (Whisper large-v3-turbo), сервис TTS (Piper), сервис LLM (Ollama плюс дообученные модели), сервис векторного поиска (Qdrant) и операторский API. Слой байесовской фузии согласует сигналы всех сервисов в калиброванную оценку понимания. Каждое событие фиксируется в журнале аудита, сцепленном SHA-256.

Обзор системы

Компоненты взаимодействуют по внутреннему gRPC; наружу VoiceA открывает только две точки — SIP-транк / WebRTC для аудиотракта и защищённый HTTPS-интерфейс для операторского UI. Ни один сервис не требует доступа в интернет; обновления распространяются как подписанные OCI-образы в реестре, принадлежащем ведомству.

ASR & TTS

Сервис ASR использует Whisper large-v3-turbo, дообученный на немецкой административной лексике, диалектных вариантах Саксонии, Австрии и алеманнского региона, а также на языках миграции (турецкий, арабский, русский, французский). В наших внутренних бенчмарках показатель ошибок на словах на типичной телефонии бюро граждан — менее 6 процентов. Сервис TTS использует Piper и выдаёт ответы с задержкой менее 150 мс на серийных CPU.

LLM & RAG

Сервис LLM запускается на Ollama с дообученной моделью для немецкого языка на 8 миллиардов параметров. Ретривер (Qdrant) индексирует базу знаний вашего ведомства — формы, калькуляторы сроков, условия предоставления услуг, внутренние инструкции — и семантически обогащает каждый запрос. LLM генерирует ответы только в том случае, если они опираются хотя бы на один индексированный документ; в противном случае запрос передаётся оператору.

Интеграции

VoiceA интегрируется через следующие интерфейсы: SIP-транк для классической телефонии (Asterisk, FreeSWITCH), WebRTC для браузера и приложений, REST для подключения к предметным системам (ELAK, EVA, ePostfach). Операторский UI — прогрессивное веб-приложение, работающее и офлайн в сети ведомства. Стандарты: OAuth 2.1 / OIDC для входа, SAML 2.0 для федеративных идентичностей, аудит-безопасное логирование по BSI TR-03107.

Профиль безопасности

Каждый звонок фиксируется в журнале событий, сцепленном SHA-256 (транскрипт ASR, классификация намерения, решение о передаче, действие оператора). Цепочка работает только на добавление; контрольные суммы ежечасно зеркалируются на раздел только для чтения. Вся сессия шифруется (TLS 1.3 наружу, mTLS внутри кластера). Ролевая модель: операторы, супервайзеры, ответственные за защиту данных, системные администраторы — каждый с минимальными привилегиями.