Spektra VoiceA — многоязычный голосовой ИИ для государственных органов

Spektra VoiceA — Hero

PHASE 01

Слушание

Self-hosted ASR захватывает многоязычную речь в режиме реального времени.

Метрика в реальном времени

Акустическое распознавание более 100 языков

При поддержке

Наши партнёры

Программы

Сотрудничайте с нами

Два формата взаимодействия на выбор — выберите тот, который отвечает целям вашей организации.

Пилотное внедрение

От доказательства концепции до работающего гражданского сервиса — за 90 дней.

Запуск и анализ потребностей: воркшоп с вашими специалистами для выявления наиболее частых обращений, языков и точек интеграции (SIP-транк / WebRTC)
Сбор обучающих данных: запись и псевдонимизация реальных обращений граждан для донастройки модели ASR под ваш диалект и профессиональную лексику
Интерфейс оператора и UX передачи: настройка веб-консоли агента с живой транскрипцией, сводкой и передачей в один клик
Оценка воздействия на защиту данных: содействие в проведении DPIA по статье 35 GDPR и готовые шаблоны реестров обработки
Панель отчётности: метрики качества ASR, частоты передач, энергопотребления и объёма использования в реальном времени — для вашего сотрудника по защите данных
SLA и руководство по эксплуатации: задокументированный процесс передачи, график обновлений и пути эскалации в соответствии с V-Modell XT

Запросить пилот

Научное сотрудничество

Исследуйте вместе. Публикуйте вместе. Открытая наука по умолчанию.

Обмен данными с соблюдением конфиденциальности: соглашение об обмене данными по статьям 28 и 26 GDPR; анонимизация на уровне слова с применением дифференциальной приватности
Аннотированный многоязычный корпус: доступ к псевдонимизированным записям речи на DE, TR, AR, FR, RU с фонетической и семантической разметкой
Контрольные точки моделей и тестовая среда: тонко настроенные контрольные точки Whisper и воспроизводимые бенчмарк-скрипты (WER, MER, показатель понимания)
Соавторство и поддержка публикаций: активное участие в подаче материалов на ACL, Interspeech, LREC-COLING; использование нашей инфраструктуры для пакетов воспроизводимости
Открытая инфраструктура: вычислительное время GPU для экспериментов на нашем self-hosted кластере (по доступности); доступ к базе знаний Qdrant для экспериментов с RAG
Поддержка грантовых заявок: письмо поддержки для заявок на финансирование (DFG, BMBF, Horizon Europe) и упоминание в качестве ассоциированного промышленного партнёра

Запросить сотрудничество

Возможности

Всё необходимое для внедрения голосового ИИ в государственном секторе

Одиннадцать готовых к работе возможностей, интегрируемых в любой рабочий процесс гражданских услуг.

Распознавание языка в реальном времени
Определяет язык речи звонящего в течение первых 3 секунд разговора с использованием модели акустических отпечатков, обеспечивая бесшовную многоязычную маршрутизацию без необходимости выбора языка.
Байесовская интеграция понимания
Объединяет оценки уверенности ASR, вероятности диалоговых актов и специфические для предметной области приоры в байесовской сети для получения откалиброванного показателя понимания — передача оператору запускается только при снижении понимания ниже настраиваемого порога.
Полностью на собственной инфраструктуре
Работает исключительно на вашей инфраструктуре — в серверном зале или на суверенной облачной VM — без внешних API-вызовов; голосовые данные граждан никогда не покидают периметр вашей сети.
Whisper ASR
Использует OpenAI Whisper (large-v3-turbo), дообученный на немецкой административной лексике и данных региональных диалектов, обеспечивая наилучшие в своём классе показатели ошибок слов на записях звонков в службы по работе с гражданами.
Piper TTS
Генерирует естественно звучащие голосовые ответы на немецком, турецком, арабском, французском, русском и английском языках с помощью Piper — быстрого нейросетевого движка синтеза речи, работающего в реальном времени на CPU с задержкой менее 150 мс.
Qdrant Vector RAG
Извлекает авторитетные ответы из базы знаний ваших гражданских сервисов — формы, сроки, условия получения услуг — с помощью семантического векторного поиска в локальном экземпляре Qdrant, привязывая каждый ответ к актуальным официальным документам.
Неизменяемая цепочка аудита
Ведёт криптографически связанный журнал только для добавления по каждому событию звонка — транскрипт ASR, классификация намерения, решение о передаче, действие оператора — обеспечивая полную воспроизводимость для аудитов надзорных органов в соответствии с EU AI Act.
Панель эко-метрик
Измеряет и отображает энергопотребление на звонок (кВт·ч) в реальном времени, общий углеродный след в CO₂-эквиваленте и сравнительную экономию по отношению к облачным альтернативам для поддержки обязательств вашего ведомства по отчётности в области устойчивого развития.
Соответствие V-Modell XT
Разработан и задокументирован в соответствии с V-Modell XT — обязательным стандартом разработки программного обеспечения для немецкого публичного сектора, включая прослеживаемые требования, определённые уровни тестирования и структурированный пакет передачи.
Защита GDPR
Встроенные технические и организационные меры (ТОМ) удовлетворяют требованиям статей 25 (конфиденциальность по замыслу), 32 (безопасность обработки) и 35 (DPIA) GDPR — с предзаполненными шаблонами реестров обработки.
Интеллектуальная UX передачи
При снижении уверенности ниже порога система передаёт вызов оператору-человеку с контекстной карточкой на одном экране: живая транскрипция, определённое намерение, язык звонящего и предложенный ответ — снижая среднее время обработки до 40%.

Портфолио

Пилотные внедрения

Реальные внедрения в немецких государственных администрациях.

Пилот

Berlin

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Echte Pilotdaten werden nach Abschluss der Deployments eingetragen. Das Bürgeramt Berlin-Mitte verarbeitet täglich über 1 200 Anrufe in acht Sprachen. VoiceA reduzierte die Wartezeit für fremdsprachige Anrufende um durchschnittlich 4,2 Minuten.

0Поддерживаемые языки

0 %Показатель понимания

0 %Снижение частоты передач

0,00кВт·ч / звонок

Пилот

Hamburg

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Kundenzentrum Altona setzte VoiceA für die Vorqualifikation von KFZ-Zulassungs- und Meldeanfragen ein und konnte die durchschnittliche Bearbeitungszeit pro Anruf um 2,8 Minuten senken.

0Поддерживаемые языки

0 %Показатель понимания

0 %Снижение частоты передач

0,00кВт·ч / звонок

Пилот

Baden-Württemberg

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Bürgeramt Freiburg pilotierte VoiceA im Bereich Einwohnermeldeamt und Standesamt. Besonders hohe Erkennungsraten bei türkischen und arabischen Dialekten des Oberrheins.

0Поддерживаемые языки

0 %Показатель понимания

0 %Снижение частоты передач

0,00кВт·ч / звонок

Пилот

Sachsen

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Bürgerbüro Leipzig nutzt VoiceA schwerpunktmäßig für die Bearbeitung von Sozialleistungsanfragen in russischer, vietnamesischer und arabischer Sprache.

0Поддерживаемые языки

0 %Показатель понимания

0 %Снижение частоты передач

0,00кВт·ч / звонок

Пилот

Sachsen

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Der Servicepoint Dresden-Neustadt integrierte VoiceA über WebRTC in seine bestehende Unified-Communications-Plattform und verzeichnet eine Erstlösungsrate von 67 % ohne menschliche Intervention.

0Поддерживаемые языки

0 %Показатель понимания

0 %Снижение частоты передач

0,00кВт·ч / звонок

Пилот

Bayern

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das KVR München ist das größte kommunale Einwohnermeldeamt Deutschlands. VoiceA bewältigt dort bis zu 3 400 Anrufe pro Tag in neun Sprachen und hat die Anzahl verlorener Anrufe um 61 % reduziert.

0Поддерживаемые языки

0 %Показатель понимания

0 %Снижение частоты передач

0,00кВт·ч / звонок

В ПРЕССЕ

Освещение в СМИ

Что немецкие технологические и государственные СМИ говорят о VoiceA.

TODO-CONTENT: „VoiceA zeigt, dass KI-gestützte Sprachsysteme im Behördenumfeld nicht nur technisch möglich, sondern datenschutzrechtlich vertretbar sind — wenn man konsequent auf selbst gehostete Infrastruktur setzt."
Heise Online14.11.24

TODO-CONTENT: „Das Freiburger Pilotprojekt liefert beeindruckende Zahlen: 87 Prozent korrekte Sprachverstehensrate bei sechs Sprachen — und das auf Hardware, die in jedem Rechenzentrum eines Landratsamts steht."
Golem.de22.09.24

TODO-CONTENT: „Sprachassistenten für Ämter: Wie KI den Behördenkontakt barrierefrei machen soll — und warum der Schlüssel in der Datensouveränität liegt."
Tagesschau Digital05.10.24

TODO-CONTENT: „VoiceA ist ein seltenes Beispiel für Public-Interest-KI: Open-Source-Komponenten, DSGVO-konforme Architektur und ein Geschäftsmodell, das keine Massenüberwachung von Bürgerdaten erfordert."
Netzpolitik.org18.01.25

TODO-CONTENT: „Im Labor-Test überzeugte VoiceA mit einer Wortfehlerrate von 4,2 Prozent auf deutschen Amtssprachtexten — besser als alle getesteten Cloud-Dienste, bei einem Bruchteil der Betriebskosten."
c't Magazin08.02.25

Отзывы

Что говорят операторы

Отзывы людей, использующих VoiceA ежедневно в немецких государственных администрациях.

„Früher musste ich bei jedem dritten Anruf auf einen Kollegen warten, der Türkisch spricht. Heute bekomme ich direkt eine Zusammenfassung auf dem Bildschirm und kann sofort weiterhelfen. Das spart uns täglich mindestens eine Stunde."
TODO-CONTENT: Vorname NachnameSachbearbeiterin Einwohnermeldeamt, TODO-CONTENT: Bürgeramt Freiburg im Breisgau

„VoiceA hat unsere Erwartungen übertroffen. Die Lösung war innerhalb von sechs Wochen produktiv, der Energieverbrauch liegt deutlich unter dem unserer alten Cloud-Lösung, und wir haben keine einzige Bürgerbeschwerden wegen Datenschutz erhalten."
TODO-CONTENT: Vorname NachnameLeitung Digitale Verwaltung, TODO-CONTENT: Bezirksamt Hamburg-Altona

„Als IT-Leiter war mir vor allem wichtig, dass wir keine Daten in die Cloud schicken. VoiceA läuft komplett auf unserer eigenen Infrastruktur im Berliner Rechenzentrum — und das Audit-Log hat unseren Datenschutzbeauftragten vollständig überzeugt."
TODO-CONTENT: Vorname NachnameIT-Leiter, TODO-CONTENT: Bürgeramt Berlin-Mitte

„Das Onboarding-Team von Spektra war von Anfang an dabei: Workshop, Trainingsdata-Erhebung, Abnahmetest. In 90 Tagen waren wir live. Das hätten wir mit keinem anderen Anbieter geschafft."
TODO-CONTENT: Vorname NachnameProjektleiterin Digitalisierung, TODO-CONTENT: Kreisverwaltungsreferat München

Команда

Люди за VoiceA

Исследователи, инженеры и эксперты по соответствию, создающие суверенный голосовой ИИ для немецких государственных услуг.

TODO-CONTENT: Dr. Vorname Nachname

Research Lead — Speech & Language

Spezialist für akustische Sprachidentifikation mit Publikationen bei Interspeech und ACL.

TODO-CONTENT: Vorname Nachname

Engineering Lead — Infrastructure & Integration

Full-Stack-Ingenieurin mit Fokus auf selbst gehostete KI-Infrastruktur und SIP/WebRTC-Integration.

TODO-CONTENT: Vorname Nachname

ML Engineer — ASR & TTS Adaptation

Experte für Fine-Tuning großer Sprachmodelle auf domänenspezifische Verwaltungsvokabulare.

TODO-CONTENT: Vorname Nachname

UX Researcher — Operator & Citizen Experience

Forscherin für barrierefreie Bedienerführung mit Fokus auf mehrsprachige Bürgeranfragen.

TODO-CONTENT: Vorname Nachname

Compliance Officer — DSGVO & EU AI Act

Juristin und Datenschutzexpertin mit Zertifizierung nach CIPP/E und Schwerpunkt auf KI-Regulierung.

TODO-CONTENT: Vorname Nachname

Product Manager — Government Deployments

Erfahrener Produktmanager mit Hintergrund in öffentlicher Verwaltung und digitaler Transformation.

Блог

Последнее от команды

Технические разборы, руководства по соответствию и обновления продукта от Spektra VoiceA.

Meet Stimmi — The Face of Accessible Government Communication

design

mascot

accessibility

Meet Stimmi — The Face of Accessible Government Communication

Every great product has a personality. Stimmi is VoiceA's mascot: a small animated character that guides citizens through the voice interface, signals system states, and makes the often-intimidating experience of calling a government office feel a little friendlier.

TODO-CONTENT: Vorname Nachname, UX Researcher01.04.255 мин чтения

compliance

eu-ai-act

dsgvo

government

EU AI Act: What Every Bürgerdienst Needs to Know Before Deploying Voice AI

The EU AI Act came into force in August 2024. Voice AI systems used by public authorities fall squarely in the high-risk category. Here is a plain-language guide to what compliance means in practice — and how VoiceA is built to meet every requirement.

TODO-CONTENT: Vorname Nachname, Compliance Officer10.03.2510 мин чтения

infrastructure

self-hosted

llm

hardware

Self-Hosted LLM Inference: Hardware Sizing Guide for Bürgerdienste

Running a large language model on your own server sounds daunting, but the hardware requirements for a government voice-AI deployment are well within reach of standard IT budgets. Here is a practical sizing guide based on our pilot deployments.

TODO-CONTENT: Vorname Nachname, Engineering Lead03.02.258 мин чтения

How Bayesian Fusion Improves Multilingual Comprehension Detection

machine-learning

nlp

architecture

multilingual

How Bayesian Fusion Improves Multilingual Comprehension Detection

A single confidence score from your ASR engine is not enough to know whether a multilingual caller has been understood. We explain how VoiceA combines four independent signals in a Bayesian network to produce a calibrated comprehension score — and why this matters for safe handoff decisions.

TODO-CONTENT: Dr. Vorname Nachname, Research Lead14.01.257 мин чтения

ПОНИМАНИЕ ОБЪЕДИНЯЕТ — ЯЗЫК, КОТОРЫЙ СЛУШАЕТ

ПОНИМАНИЕ ОБЪЕДИНЯЕТ — ЯЗЫК, КОТОРЫЙ СЛУШАЕТ

Слушание

Сотрудничайте с нами

Пилотное внедрение

Научное сотрудничество

Всё необходимое для внедрения голосового ИИ в государственном секторе

Распознавание языка в реальном времени

Байесовская интеграция понимания

Полностью на собственной инфраструктуре

Whisper ASR

Piper TTS

Qdrant Vector RAG

Неизменяемая цепочка аудита

Панель эко-метрик

Соответствие V-Modell XT

Защита GDPR

Интеллектуальная UX передачи

Пилотные внедрения

Berlin

Hamburg

Baden-Württemberg

Sachsen

Sachsen

Bayern

Освещение в СМИ

Что говорят операторы

Люди за VoiceA

TODO-CONTENT: Dr. Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

Последнее от команды

Meet Stimmi — The Face of Accessible Government Communication

EU AI Act: What Every Bürgerdienst Needs to Know Before Deploying Voice AI

Self-Hosted LLM Inference: Hardware Sizing Guide for Bürgerdienste

How Bayesian Fusion Improves Multilingual Comprehension Detection