text2speech Dokumentation¶

Willkommen zur Dokumentation des text2speech-Moduls. Dieses Modul bietet Text-to-Speech-Funktionalität (TTS) unter Verwendung des Kokoro-82M-Modells mit einem fortschrittlichen, thread-sicheren Audio-Queue-Management.

Übersicht¶

Das text2speech-Modul wurde entwickelt, um eine robuste und einfach zu bedienende Sprachsynthese für Robotik-Anwendungen und andere Python-Projekte bereitzustellen.

Hauptmerkmale¶

✅ Thread-sichere Audio-Queue - Verhindert ALSA/PortAudio-Konflikte durch serialisierte Wiedergabe.
✅ Hochwertige Synthese - Verwendet das Kokoro-82M-Modell für natürlich klingende Stimmen.
✅ Prioritätsbasierte Steuerung - Dringende Nachrichten unterbrechen normale Nachrichten.
✅ Duplikaterkennung - Vermeidet die Wiederholung identischer Nachrichten in kurzen Abständen.
✅ Flexibles Konfigurationssystem - YAML-basierte Einstellungen für Audio, Stimmen und Leistung.
✅ Mehrsprachig - Unterstützung für verschiedene Akzente und Sprachen.

Schnellzugriff¶

Bereich	Beschreibung
🚀 Erste Schritte	Schneller Einstieg in die Nutzung
📦 Installation	Systemanforderungen und Setup
⚙️ Konfiguration	Anpassung der Bibliothek
📚 API-Referenz	Detaillierte technische Dokumentation
🏗️ Architektur	Einblick in die interne Funktionsweise

Lizenz¶

Dieses Projekt ist unter der MIT-Lizenz lizenziert. Weitere Details finden Sie in der LICENSE-Datei.