text2speech Dokumentation¶
Willkommen zur Dokumentation des text2speech-Moduls. Dieses Modul bietet Text-to-Speech-Funktionalität (TTS) unter Verwendung des Kokoro-82M-Modells mit einem fortschrittlichen, thread-sicheren Audio-Queue-Management.
Übersicht¶
Das text2speech-Modul wurde entwickelt, um eine robuste und einfach zu bedienende Sprachsynthese für Robotik-Anwendungen und andere Python-Projekte bereitzustellen.
Hauptmerkmale¶
- ✅ Thread-sichere Audio-Queue - Verhindert ALSA/PortAudio-Konflikte durch serialisierte Wiedergabe.
- ✅ Hochwertige Synthese - Verwendet das Kokoro-82M-Modell für natürlich klingende Stimmen.
- ✅ Prioritätsbasierte Steuerung - Dringende Nachrichten unterbrechen normale Nachrichten.
- ✅ Duplikaterkennung - Vermeidet die Wiederholung identischer Nachrichten in kurzen Abständen.
- ✅ Flexibles Konfigurationssystem - YAML-basierte Einstellungen für Audio, Stimmen und Leistung.
- ✅ Mehrsprachig - Unterstützung für verschiedene Akzente und Sprachen.
Schnellzugriff¶
| Bereich | Beschreibung |
|---|---|
| 🚀 Erste Schritte | Schneller Einstieg in die Nutzung |
| 📦 Installation | Systemanforderungen und Setup |
| ⚙️ Konfiguration | Anpassung der Bibliothek |
| 📚 API-Referenz | Detaillierte technische Dokumentation |
| 🏗️ Architektur | Einblick in die interne Funktionsweise |
Lizenz¶
Dieses Projekt ist unter der MIT-Lizenz lizenziert. Weitere Details finden Sie in der LICENSE-Datei.