Zum Inhalt springen
senqo

Sprache & Voice mit senqo

Meetings automatisch protokollieren. Kundenanrufe automatisch beantworten. Sprache wird produktiv.

senqo · voice

100%

der Meetings automatisch dokumentiert

Sprache wird produktiv: protokolliert, beantwortet, durchsuchbar

Gesprochenes Wissen geht verloren. Und Anrufe bleiben unbeantwortet.

Zwei Probleme, eine Ursache: Sprache ist flüchtig. Meetings werden besprochen, aber nicht dokumentiert. Kunden rufen an, aber niemand hat Zeit. senqo Voice löst beides: Spracherkennung wandelt Gesprochenes in Text um, Sprachausgabe macht Texte hörbar, und Voice Agents verbinden beides zu einem automatischen Gesprächspartner.

Bei lokalem Betrieb verlassen keine Audiodaten Ihr Netzwerk.

Spracherkennung (Speech-to-Text)

senqo nutzt whisper.cpp auf macOS und faster-whisper auf Linux für die Transkription. Beide laufen lokal und liefern eine OpenAI-kompatible API.

Einsatzgebiete:

  • Meeting-Protokolle: Besprechungen aufzeichnen und automatisch als durchsuchbares Protokoll erhalten
  • Sprachnotizen: Ideen, Aufgaben oder Beobachtungen unterwegs per Sprache erfassen
  • Diktate: Berichte, E-Mails oder Dokumentation diktieren statt tippen
  • Kundengespräche: Beratungsgespräche dokumentieren und Kernpunkte extrahieren
  • Baustellendokumentation: Vor Ort gesprochene Notizen direkt in strukturierte Berichte umwandeln

Was senqo dabei kann:

  • Hochwertige Transkription mit zuverlässiger Erkennung deutscher Sprache, auch bei Fachbegriffen
  • Sprechererkennung: unterscheidet verschiedene Sprecher im Gespräch
  • Zusammenfassungen und Aufgabenextraktion aus langen Meetings
  • Komplett lokal: Audiodaten verlassen nie Ihre Infrastruktur

Sprachausgabe (Text-to-Speech)

senqo nutzt Qwen3-TTS mit mlx-audio für natürliche Sprachausgabe. Neun verschiedene Stimmen stehen zur Verfügung, optimiert für deutsche Aussprache.

Einsatzgebiete:

  • Dokumente vorlesen: Berichte, E-Mails oder Zusammenfassungen als Audio abspielen
  • Barrierefreiheit: Inhalte für sehbehinderte Mitarbeitende zugänglich machen
  • Benachrichtigungen: Wichtige Statusmeldungen oder Warnungen als Sprachausgabe
  • Voice Agents: Antworten in natürlicher Sprache am Telefon oder im Chat

Was senqo dabei kann:

  • Natürlich klingende deutsche Stimmen
  • Neun Stimmen zur Auswahl, weitere trainierbar
  • OpenAI-kompatible API (funktioniert mit Open WebUI und anderen Tools)
  • Komplett lokal auf Apple Silicon (MLX) oder Linux (NVIDIA GPU)

Voice Agents: KI am Telefon

Ein Voice Agent nimmt Anrufe entgegen, versteht die Frage und antwortet in natürlicher Sprache. Trainiert auf Ihre Inhalte, rund um die Uhr verfügbar. Die komplette Pipeline läuft lokal.

Wie es funktioniert:

  1. Der Anrufer spricht seine Frage
  2. Spracherkennung (whisper.cpp) wandelt das Gesagte in Text um
  3. Die KI versteht die Frage und generiert eine Antwort auf Basis Ihrer Inhalte
  4. Sprachausgabe (Qwen3-TTS) liest die Antwort in natürlicher Stimme vor

Gut geeignet für:

  • Telefonische Auskunft zu Leistungen, Zuständigkeiten und Abläufen
  • Erste Anlaufstelle im Kundenservice mit Weiterleitung an Mitarbeitende
  • Statusabfragen zu Bestellungen, Aufträgen oder Vorgängen
  • Bürgerservice und Verwaltungsauskunft

Besser beim Menschen:

  • Beschwerden und emotionale Anliegen
  • Komplexe Beratungsgespräche
  • Verhandlungen und individuelle Angebote

Wie es in der Praxis aussieht

Vorher: Ein Produktionsunternehmen bekommt täglich Anrufe zu Lieferzeiten, technischen Spezifikationen und Auftragsstatus. Das Innendienst-Team ist ständig am Telefon statt bei der Auftragsbearbeitung. Gleichzeitig gehen Besprechungsinhalte aus Projektmeetings verloren, weil niemand mitschreibt.

Nachher: Der Voice Agent beantwortet Standardfragen am Telefon sofort. Komplexe Anfragen werden mit Kontext an den zuständigen Mitarbeitenden weitergeleitet. Interne Besprechungen werden transkribiert und als durchsuchbare Protokolle im Wissensmanagement abgelegt. Das Team hat mehr Kapazität für Auftragsbearbeitung und Kundenbetreuung.

Zusammenspiel mit senqo

Sprache wird Teil des Unternehmenswissens:

  • Wissensmanagement: Transkriptionen werden indexiert und über die Suche zugänglich. Voice Agents greifen auf dieselbe Wissensbasis zu.
  • Automatisierung: Aus Sprachnotizen automatisch Aufgaben oder Tickets erstellen
  • Chat: “Was wurde im letzten Projektmeeting zu Thema X besprochen?”

Lösung anfragen

Sie möchten wissen, wie das für Ihr Unternehmen aussehen könnte? Schreiben Sie uns, wir melden uns innerhalb von 24 Stunden.