RAG Chatbot mit Groq API und Text-to-Speech (TTS)¶
- Überblick über Retrieval-Augmented Generation (RAG)
- 🚀 Inhalt des Notebooks
- 🔑 Erforderliche API Keys
- 🦮 Hugging Face Access Token erstellen
- ⚡️ Groq API Key erstellen
- 🔮 OpenAI API Key erstellen
- Google Gemini API Key erstellen
- ☁️ API Keys als Secrets in Google Colab hinterlegen
- ⚙️ Nutzung von LLMClient im Notebook
- Ressourcen zu RAG
- 🧩 Lizenz
Das Notebook RAGChatbot_groq_API_t2s.ipynb zeigt, wie man mit der Klasse LLMClient einen Retrieval-Augmented-Generation (RAG)-Chatbot erstellt, der zusätzlich über eine Text-to-Speech (TTS)-Funktion verfügt. Zur Sprachsynthese wird das Modell Kokoro verwendet.

Überblick über Retrieval-Augmented Generation (RAG)¶
Retrieval-Augmented Generation (RAG) kombiniert Wissen aus eigenen Dokumenten mit der Sprachkompetenz großer KI-Modelle wie ChatGPT. Statt dass das Modell nur auf sein internes (und begrenztes) Trainingswissen zugreift, sucht RAG zuerst gezielt in einer Wissensdatenbank oder Dokumentsammlung nach relevanten Textstellen („Retrieval“) und übergibt diese dann zusammen mit der Nutzerfrage an das Large Language Model („Generation“).
Zusätzlich integriert dieses Tutorial Text-to-Speech (TTS), um die generierten Antworten direkt in Sprache umzuwandeln. Dies ermöglicht eine natürlichere Interaktion mit dem Chatbot.
Das folgende Schaubild zeigt den grundlegenden Aufbau eines RAG-Systems:

Abbildung: „High-level overview of the Retrieval Augmented Generation System“ von Maanjunath S Naragund, entnommen aus diesem Blogbeitrag auf Medium. Icons von Flaticon. Verwendung im Rahmen des Zitatrechts (§ 51 UrhG). Diese Abbildung steht nicht unter der MIT-Lizenz dieses Repositories.
🚀 Inhalt des Notebooks¶
Das Notebook demonstriert:
- Installation der benötigten Packages in Google Colab (einschließlich
kokorofür TTS) - Nutzung der
LLMClient-Klasse zur Textgenerierung - Aufbau eines RAG-Workflows mit PDF-Dokumenten und ChromaDB
- Integration von Text-to-Speech (TTS) mit dem Kokoro-Modell zur Sprachausgabe der Antworten
🔑 Erforderliche API Keys¶
| Dienst | Pflicht | Zweck |
|---|---|---|
| Hugging Face Access Token | ✅ erforderlich | Herunterladen des Embedding-Modells und des Kokoro-TTS-Modells |
| Groq API Key | optional | Nutzung der Groq LLM-API |
| OpenAI API Key | optional | Nutzung der OpenAI LLM-API |
🦮 Hugging Face Access Token erstellen¶
Der Hugging Face Access Token wird benötigt, um auf Embedding-Modelle und andere KI-Modelle aus der Hugging Face Model Hub zuzugreifen, die zur Berechnung der Satz-Embeddings verwendet werden. Diese werden von dem Model Hub heruntergeladen und lokal ausgeführt.
-
Erstelle kostenlosen Account bei https://huggingface.co/ oder logge dich ein (falls nötig).

- Klicke auf die Schaltfläche „Create new token“

- Gib einen Namen ein (z. B.
colab-rag) und wähle Type: Write

- Kopiere den angezeigten Token (beginnt meist mit
hf_...).
⚡️ Groq API Key erstellen¶
Der Groq API Key ermöglicht den Zugriff auf öffentlich verfügbare LLMs, die für besonders schnelle Textgenerierung und Beantwortung von Fragen im RAG-Workflow eingesetzt werden können. Diese LLMs werden in der GroqCloud ausgeführt.
- Erstelle kostenlosen Account bei https://groq.com/ oder logge dich ein (falls nötig).
- Besuche https://console.groq.com/keys
- Klicke auf „Create API Key“

- Kopiere den Schlüssel (beginnt meist mit
groq_...).
🔮 OpenAI API Key erstellen¶
Der OpenAI API Key erlaubt die Nutzung von OpenAI-Modellen (z. B. GPT-4 oder GPT-4o), um kontextbezogene Antworten im Retrieval-Augmented-Generation-System zu erzeugen.
- Melde dich bei https://platform.openai.com/account/api-keys an

- Klicke auf „Create new secret key“

- Kopiere den Key (beginnt meist mit
sk-...).
Google Gemini API Key erstellen¶
- Besuche Google AI Studio
- Klicke auf "Get API Key" oder "Create API Key"
- Wähle ein Google Cloud Projekt oder erstelle ein neues
- Kopiere den generierten API Key (beginnt mit
AIzaSy...)
Hinweis: Die Gemini API wird über den OpenAI-Kompatibilitätsmodus angesprochen, benötigt deshalb nur das openai Python-Package.
☁️ API Keys als Secrets in Google Colab hinterlegen¶
- Klicke im Menü links auf das Schlüssel-Symbol 🔑

- Lege folgende Secrets an:
| Name | Wert |
|---|---|
API_KEY |
(empfohlen) dein API Key für OpenAI, Groq oder Gemini (automatische Erkennung) |
HF_TOKEN |
dein Hugging Face Access Token |
GROQ_API_KEY |
(optional) dein Groq API Key |
OPENAI_API_KEY |
(optional) dein OpenAI API Key |
⚙️ Nutzung von LLMClient im Notebook¶
from llm_client import LLMClient
# LLMClient erkennt automatisch, welche Keys gesetzt sind
client = LLMClient()
print("Verwendete API:", client.api_choice)
print("Modell:", client.llm)
Ressourcen zu RAG¶
Coursera Kurs zu Retrieval Augmented Generation (RAG) von DeepLearning.AI
🧩 Lizenz¶
Dieses Notebook ist Teil des Repositories dgaida/llm_client. © 2025 – Daniel Gaida, Technische Hochschule. Lizenziert unter der MIT License.