انتقل إلى المحتوى

Spektra VoiceA — Hero

الفهم يوحّد — لغة تُصغي

الفهم يوحّد — لغة تُصغي

بتمويل من
  • Spektra Innovations­fonds
  • Bundesministerium für Wirtschaft und Klimaschutz
  • European Commission — Horizon Europe

شركاؤنا

البرامج

تعاونوا معنا

مساران متمايزان للتعاون — اختاروا ما يلائم أهداف مؤسستكم.

01

النشر التجريبي

من إثبات المفهوم إلى خدمة مواطنين حية — في 90 يوماً.

  • الانطلاق وتحليل الاحتياجات: ورشة عمل مع متخصصيكم لرسم أنواع الاستفسارات الأكثر تكراراً واللغات ونقاط التكامل (SIP trunk / WebRTC)
  • جمع بيانات التدريب: تسجيل استفسارات المواطنين الفعلية وإخفاء هويتها لضبط نموذج ASR وفق لهجتكم ومفرداتكم التخصصية
  • واجهة المشغّل وتجربة التسليم: إعداد وحدة تحكم الوكيل المستندة إلى الويب بما فيها النص الفوري والملخص وزر التسليم بنقرة واحدة
  • تقييم أثر حماية البيانات: دعم إجراء DPIA بموجب GDPR المادة 35 وقوالب سجلات المعالجة الجاهزة للاستخدام
  • لوحة التقارير: مقاييس فورية لجودة ASR ومعدل التسليم واستهلاك الطاقة وحجم الاستخدام — لمسؤول حماية البيانات لديكم
  • اتفاقية مستوى الخدمة ودليل التشغيل: عملية تسليم موثقة وجدول تحديث ومسارات تصعيد وفق V-Modell XT
02

التعاون البحثي

ابحثوا معاً. انشروا معاً. العلم المفتوح هو الأصل.

  • تبادل بيانات متوافق مع الخصوصية: اتفاقية مشاركة البيانات بموجب GDPR المادتين 28 و26 مع إخفاء الهوية على مستوى الكلمة عبر الخصوصية التفاضلية
  • مجموعة بيانات متعددة اللغات مُوسَّمة: وصول إلى تسجيلات صوتية مجهولة الهوية بلغات DE وTR وAR وFR وRU مع توصيف صوتي ودلالي
  • نقاط تفتيش النماذج وبيئة التقييم: نقاط تفتيش Whisper المضبوطة بدقة وسكريبتات قياسية قابلة للإعادة (WER وMER ودرجة الفهم)
  • الشراكة في التأليف ودعم النشر: مساهمة فاعلة في التقديم لمؤتمرات ACL وInterspeech وLREC-COLING؛ استخدام بنيتنا التحتية لحزم قابلية الإعادة
  • البنية التحتية المفتوحة: وقت حوسبة GPU للتجارب على مجموعتنا المستضافة ذاتياً (حسب التوافر)؛ الوصول إلى قاعدة معرفة Qdrant لتجارب RAG
  • دعم طلبات المنح: خطاب دعم لطلبات التمويل الخارجي (DFG وBMBF وHorizon Europe) والإدراج كشريك صناعي مشارك

الإمكانيات

كل ما تحتاجه لنشر الذكاء الاصطناعي الصوتي في القطاع الحكومي

أحد عشر إمكانية جاهزة للإنتاج، قابلة للتكوين في أي سير عمل لخدمات المواطنين.

  • التعرف على اللغة في الوقت الفعلي

    يحدد لغة المتصل المنطوقة خلال أول 3 ثوانٍ من الكلام باستخدام نموذج البصمة الصوتية، مما يتيح توجيهاً متعدد اللغات سلساً دون الحاجة إلى اختيار اللغة.

  • الدمج البايزي للفهم

    يجمع درجات ثقة ASR واحتمالات فعل الحوار والأولويات الخاصة بالمجال في شبكة بايزية لإنتاج درجة فهم معايرة — تُطلق تسليم الوكيل فقط عند انخفاض الفهم دون العتبة القابلة للتهيئة.

  • مستضاف ذاتياً بالكامل

    يعمل بالكامل على بنيتكم التحتية الخاصة — غرفة خوادم داخلية أو VM سحابية سيادية — بدون استدعاءات API خارجية؛ لا تغادر بيانات صوت المواطنين محيط شبكتكم أبداً.

  • Whisper ASR

    يستخدم OpenAI Whisper (large-v3-turbo) المضبوط دقيقاً على المفردات الإدارية الألمانية وبيانات اللهجات الإقليمية لتحقيق أفضل معدلات خطأ في الكلمات على تسجيلات مكالمات خدمات المواطنين.

  • Piper TTS

    يولد ردوداً صوتية طبيعية باللغات الألمانية والتركية والعربية والفرنسية والروسية والإنجليزية باستخدام Piper، محرك تحويل نص إلى كلام عصبي سريع يعمل في الوقت الفعلي على المعالج المركزي بكمون أقل من 150 ميلي ثانية.

  • Qdrant Vector RAG

    يسترجع إجابات موثوقة من قاعدة معرفة خدمات المواطنين لديكم — نماذج ومواعيد نهائية وقواعد الأهلية — عبر البحث الدلالي المتجه في مثيل Qdrant محلي، مما يُرسّخ كل رد في الوثائق الرسمية المحدّثة.

  • سلسلة التدقيق غير القابلة للتغيير

    تكتب سجلاً مرتبطاً تشفيرياً للإلحاق فقط لكل حدث في المكالمة — نص ASR وتصنيف النية وقرار التسليم وإجراء المشغّل — مما يتيح إمكانية الإعادة الكاملة لعمليات تدقيق السلطة الإشرافية بموجب EU AI Act.

  • لوحة المقاييس البيئية

    تقيس وتُبلّغ عن استهلاك الطاقة في الوقت الفعلي لكل مكالمة (كيلوواط ساعة)، والبصمة الكربونية الإجمالية المكافئة لـ CO₂، والمدخرات المقارنة مقابل البدائل السحابية لدعم التزامات جهتكم بتقارير الاستدامة.

  • متوافق مع V-Modell XT

    مطوَّر وموثَّق وفقاً لـ V-Modell XT، معيار تطوير البرمجيات الإلزامي للقطاع العام الألماني، بما يشمل متطلبات قابلة للتتبع ومستويات اختبار محددة وحزمة تسليم منظمة.

  • درع GDPR

    تفي التدابير التقنية والتنظيمية المدمجة (TOMs) بمتطلبات GDPR المادة 25 (الخصوصية بالتصميم) والمادة 32 (أمن المعالجة) والمادة 35 (DPIA) — مع قوالب سجلات المعالجة الجاهزة للملء.

  • تجربة التسليم الذكي

    عند انخفاض الثقة دون العتبة، يُسلّم النظام إلى وكيل بشري ببطاقة سياق على شاشة واحدة: النص الفوري والنية المكتشفة ولغة المتصل والرد المقترح — مما يقلل متوسط وقت المعالجة بنسبة تصل إلى 40٪.

المحفظة

عمليات النشر التجريبية

عمليات نشر في العالم الحقيقي عبر الإدارات العامة الألمانية.

تجريبي

Berlin

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Echte Pilotdaten werden nach Abschluss der Deployments eingetragen. Das Bürgeramt Berlin-Mitte verarbeitet täglich über 1 200 Anrufe in acht Sprachen. VoiceA reduzierte die Wartezeit für fremdsprachige Anrufende um durchschnittlich 4,2 Minuten.

0اللغات المدعومة
0 %نقاط الفهم
0 %تخفيض معدل التحويل
0,00كيلوواط ساعة / مكالمة
تجريبي

Hamburg

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Kundenzentrum Altona setzte VoiceA für die Vorqualifikation von KFZ-Zulassungs- und Meldeanfragen ein und konnte die durchschnittliche Bearbeitungszeit pro Anruf um 2,8 Minuten senken.

0اللغات المدعومة
0 %نقاط الفهم
0 %تخفيض معدل التحويل
0,00كيلوواط ساعة / مكالمة
تجريبي

Baden-Württemberg

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Bürgeramt Freiburg pilotierte VoiceA im Bereich Einwohnermeldeamt und Standesamt. Besonders hohe Erkennungsraten bei türkischen und arabischen Dialekten des Oberrheins.

0اللغات المدعومة
0 %نقاط الفهم
0 %تخفيض معدل التحويل
0,00كيلوواط ساعة / مكالمة
تجريبي

Sachsen

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das Bürgerbüro Leipzig nutzt VoiceA schwerpunktmäßig für die Bearbeitung von Sozialleistungsanfragen in russischer, vietnamesischer und arabischer Sprache.

0اللغات المدعومة
0 %نقاط الفهم
0 %تخفيض معدل التحويل
0,00كيلوواط ساعة / مكالمة
تجريبي

Sachsen

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Der Servicepoint Dresden-Neustadt integrierte VoiceA über WebRTC in seine bestehende Unified-Communications-Plattform und verzeichnet eine Erstlösungsrate von 67 % ohne menschliche Intervention.

0اللغات المدعومة
0 %نقاط الفهم
0 %تخفيض معدل التحويل
0,00كيلوواط ساعة / مكالمة
تجريبي

Bayern

TODO-CONTENT: Dies ist ein Referenz- / Demo-Eintrag. Das KVR München ist das größte kommunale Einwohnermeldeamt Deutschlands. VoiceA bewältigt dort bis zu 3 400 Anrufe pro Tag in neun Sprachen und hat die Anzahl verlorener Anrufe um 61 % reduziert.

0اللغات المدعومة
0 %نقاط الفهم
0 %تخفيض معدل التحويل
0,00كيلوواط ساعة / مكالمة

في الصحافة

التغطية الإعلامية

ما تقوله وسائل الإعلام التقنية وقطاع الخدمات العامة الألمانية عن VoiceA.

Heise OnlineGolem.deTagesschau DigitalNetzpolitik.orgc't Magazin

TODO-CONTENT: „VoiceA zeigt, dass KI-gestützte Sprachsysteme im Behördenumfeld nicht nur technisch möglich, sondern datenschutzrechtlich vertretbar sind — wenn man konsequent auf selbst gehostete Infrastruktur setzt."

Heise Online

TODO-CONTENT: „Das Freiburger Pilotprojekt liefert beeindruckende Zahlen: 87 Prozent korrekte Sprachverstehensrate bei sechs Sprachen — und das auf Hardware, die in jedem Rechenzentrum eines Landratsamts steht."

Golem.de

TODO-CONTENT: „Sprachassistenten für Ämter: Wie KI den Behördenkontakt barrierefrei machen soll — und warum der Schlüssel in der Datensouveränität liegt."

Tagesschau Digital

TODO-CONTENT: „VoiceA ist ein seltenes Beispiel für Public-Interest-KI: Open-Source-Komponenten, DSGVO-konforme Architektur und ein Geschäftsmodell, das keine Massenüberwachung von Bürgerdaten erfordert."

Netzpolitik.org

TODO-CONTENT: „Im Labor-Test überzeugte VoiceA mit einer Wortfehlerrate von 4,2 Prozent auf deutschen Amtssprachtexten — besser als alle getesteten Cloud-Dienste, bei einem Bruchteil der Betriebskosten."

c't Magazin

شهادات

ما يقوله المشغّلون

تعليقات من الأشخاص الذين يستخدمون VoiceA يومياً في الإدارات العامة الألمانية.

„Früher musste ich bei jedem dritten Anruf auf einen Kollegen warten, der Türkisch spricht. Heute bekomme ich direkt eine Zusammenfassung auf dem Bildschirm und kann sofort weiterhelfen. Das spart uns täglich mindestens eine Stunde."

TODO-CONTENT: Vorname Nachname
TODO-CONTENT: Vorname NachnameSachbearbeiterin Einwohnermeldeamt, TODO-CONTENT: Bürgeramt Freiburg im Breisgau

„VoiceA hat unsere Erwartungen übertroffen. Die Lösung war innerhalb von sechs Wochen produktiv, der Energieverbrauch liegt deutlich unter dem unserer alten Cloud-Lösung, und wir haben keine einzige Bürgerbeschwerden wegen Datenschutz erhalten."

TODO-CONTENT: Vorname Nachname
TODO-CONTENT: Vorname NachnameLeitung Digitale Verwaltung, TODO-CONTENT: Bezirksamt Hamburg-Altona

„Als IT-Leiter war mir vor allem wichtig, dass wir keine Daten in die Cloud schicken. VoiceA läuft komplett auf unserer eigenen Infrastruktur im Berliner Rechenzentrum — und das Audit-Log hat unseren Datenschutzbeauftragten vollständig überzeugt."

TODO-CONTENT: Vorname Nachname
TODO-CONTENT: Vorname NachnameIT-Leiter, TODO-CONTENT: Bürgeramt Berlin-Mitte

„Das Onboarding-Team von Spektra war von Anfang an dabei: Workshop, Trainingsdata-Erhebung, Abnahmetest. In 90 Tagen waren wir live. Das hätten wir mit keinem anderen Anbieter geschafft."

TODO-CONTENT: Vorname Nachname
TODO-CONTENT: Vorname NachnameProjektleiterin Digitalisierung, TODO-CONTENT: Kreisverwaltungsreferat München

الفريق

الأشخاص وراء VoiceA

باحثون ومهندسون وخبراء امتثال يبنون ذكاءً اصطناعياً صوتياً سيادياً للخدمات العامة الألمانية.

TODO-CONTENT: Dr. Vorname Nachname

TODO-CONTENT: Dr. Vorname Nachname

Research Lead — Speech & Language

Spezialist für akustische Sprachidentifikation mit Publikationen bei Interspeech und ACL.

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

Engineering Lead — Infrastructure & Integration

Full-Stack-Ingenieurin mit Fokus auf selbst gehostete KI-Infrastruktur und SIP/WebRTC-Integration.

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

ML Engineer — ASR & TTS Adaptation

Experte für Fine-Tuning großer Sprachmodelle auf domänenspezifische Verwaltungsvokabulare.

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

UX Researcher — Operator & Citizen Experience

Forscherin für barrierefreie Bedienerführung mit Fokus auf mehrsprachige Bürgeranfragen.

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

Compliance Officer — DSGVO & EU AI Act

Juristin und Datenschutzexpertin mit Zertifizierung nach CIPP/E und Schwerpunkt auf KI-Regulierung.

TODO-CONTENT: Vorname Nachname

TODO-CONTENT: Vorname Nachname

Product Manager — Government Deployments

Erfahrener Produktmanager mit Hintergrund in öffentlicher Verwaltung und digitaler Transformation.

المدونة

آخر أخبار الفريق

تحليلات تقنية معمّقة وأدلة الامتثال وتحديثات المنتج من Spektra VoiceA.

Meet Stimmi — The Face of Accessible Government Communication
design
ux
mascot
accessibility

Meet Stimmi — The Face of Accessible Government Communication

Every great product has a personality. Stimmi is VoiceA's mascot: a small animated character that guides citizens through the voice interface, signals system states, and makes the often-intimidating experience of calling a government office feel a little friendlier.

TODO-CONTENT: Vorname Nachname, UX Researcher5 دقيقة قراءة
EU AI Act: What Every Bürgerdienst Needs to Know Before Deploying Voice AI
compliance
eu-ai-act
dsgvo
government

EU AI Act: What Every Bürgerdienst Needs to Know Before Deploying Voice AI

The EU AI Act came into force in August 2024. Voice AI systems used by public authorities fall squarely in the high-risk category. Here is a plain-language guide to what compliance means in practice — and how VoiceA is built to meet every requirement.

TODO-CONTENT: Vorname Nachname, Compliance Officer10 دقيقة قراءة
Self-Hosted LLM Inference: Hardware Sizing Guide for Bürgerdienste
infrastructure
self-hosted
llm
hardware

Self-Hosted LLM Inference: Hardware Sizing Guide for Bürgerdienste

Running a large language model on your own server sounds daunting, but the hardware requirements for a government voice-AI deployment are well within reach of standard IT budgets. Here is a practical sizing guide based on our pilot deployments.

TODO-CONTENT: Vorname Nachname, Engineering Lead8 دقيقة قراءة
How Bayesian Fusion Improves Multilingual Comprehension Detection
machine-learning
nlp
architecture
multilingual

How Bayesian Fusion Improves Multilingual Comprehension Detection

A single confidence score from your ASR engine is not enough to know whether a multilingual caller has been understood. We explain how VoiceA combines four independent signals in a Bayesian network to produce a calibrated comprehension score — and why this matters for safe handoff decisions.

TODO-CONTENT: Dr. Vorname Nachname, Research Lead7 دقيقة قراءة