RAG Chatbot mit Groq API und Text-to-Speech (TTS)¶

Überblick über Retrieval-Augmented Generation (RAG)
🚀 Inhalt des Notebooks
🔑 Erforderliche API Keys
🦮 Hugging Face Access Token erstellen
⚡️ Groq API Key erstellen
🔮 OpenAI API Key erstellen
Google Gemini API Key erstellen
☁️ API Keys als Secrets in Google Colab hinterlegen
⚙️ Nutzung von LLMClient im Notebook
Ressourcen zu RAG
🧩 Lizenz

Das Notebook RAGChatbot_groq_API_t2s.ipynb zeigt, wie man mit der Klasse LLMClient einen Retrieval-Augmented-Generation (RAG)-Chatbot erstellt, der zusätzlich über eine Text-to-Speech (TTS)-Funktion verfügt. Zur Sprachsynthese wird das Modell Kokoro verwendet.

RAG-Chatbot GUI

Überblick über Retrieval-Augmented Generation (RAG)¶

Retrieval-Augmented Generation (RAG) kombiniert Wissen aus eigenen Dokumenten mit der Sprachkompetenz großer KI-Modelle wie ChatGPT. Statt dass das Modell nur auf sein internes (und begrenztes) Trainingswissen zugreift, sucht RAG zuerst gezielt in einer Wissensdatenbank oder Dokumentsammlung nach relevanten Textstellen („Retrieval“) und übergibt diese dann zusammen mit der Nutzerfrage an das Large Language Model („Generation“).

Zusätzlich integriert dieses Tutorial Text-to-Speech (TTS), um die generierten Antworten direkt in Sprache umzuwandeln. Dies ermöglicht eine natürlichere Interaktion mit dem Chatbot.

Das folgende Schaubild zeigt den grundlegenden Aufbau eines RAG-Systems:

High-level overview of the Retrieval Augmented Generation System

Abbildung: „High-level overview of the Retrieval Augmented Generation System“ von Maanjunath S Naragund, entnommen aus diesem Blogbeitrag auf Medium. Icons von Flaticon. Verwendung im Rahmen des Zitatrechts (§ 51 UrhG). Diese Abbildung steht nicht unter der MIT-Lizenz dieses Repositories.

🚀 Inhalt des Notebooks¶

Das Notebook demonstriert:

Installation der benötigten Packages in Google Colab (einschließlich kokoro für TTS)
Nutzung der LLMClient-Klasse zur Textgenerierung
Aufbau eines RAG-Workflows mit PDF-Dokumenten und ChromaDB
Integration von Text-to-Speech (TTS) mit dem Kokoro-Modell zur Sprachausgabe der Antworten

🔑 Erforderliche API Keys¶

Dienst	Pflicht	Zweck
Hugging Face Access Token	✅ erforderlich	Herunterladen des Embedding-Modells und des Kokoro-TTS-Modells
Groq API Key	optional	Nutzung der `Groq` LLM-API
OpenAI API Key	optional	Nutzung der OpenAI LLM-API

🦮 Hugging Face Access Token erstellen¶

Der Hugging Face Access Token wird benötigt, um auf Embedding-Modelle und andere KI-Modelle aus der Hugging Face Model Hub zuzugreifen, die zur Berechnung der Satz-Embeddings verwendet werden. Diese werden von dem Model Hub heruntergeladen und lokal ausgeführt.

Erstelle kostenlosen Account bei https://huggingface.co/ oder logge dich ein (falls nötig).
Gehe zu https://huggingface.co/settings/tokens

Hugging Face – Settings Menu

Klicke auf die Schaltfläche „Create new token“

Hugging Face – User Access Tokens

Gib einen Namen ein (z. B. colab-rag) und wähle Type: Write

Hugging Face – Create New Write Token

Kopiere den angezeigten Token (beginnt meist mit hf_...).

⚡️ Groq API Key erstellen¶

Der Groq API Key ermöglicht den Zugriff auf öffentlich verfügbare LLMs, die für besonders schnelle Textgenerierung und Beantwortung von Fragen im RAG-Workflow eingesetzt werden können. Diese LLMs werden in der GroqCloud ausgeführt.

Erstelle kostenlosen Account bei https://groq.com/ oder logge dich ein (falls nötig).
Besuche https://console.groq.com/keys
Klicke auf „Create API Key“

Groq API Keys – Create API Key

Kopiere den Schlüssel (beginnt meist mit groq_...).

🔮 OpenAI API Key erstellen¶

Der OpenAI API Key erlaubt die Nutzung von OpenAI-Modellen (z. B. GPT-4 oder GPT-4o), um kontextbezogene Antworten im Retrieval-Augmented-Generation-System zu erzeugen.

Melde dich bei https://platform.openai.com/account/api-keys an

OpenAI API – API Keys

Klicke auf „Create new secret key“

OpenAI API – Create New Secret Key

Kopiere den Key (beginnt meist mit sk-...).

Google Gemini API Key erstellen¶

Besuche Google AI Studio
Klicke auf "Get API Key" oder "Create API Key"
Wähle ein Google Cloud Projekt oder erstelle ein neues
Kopiere den generierten API Key (beginnt mit AIzaSy...)

Hinweis: Die Gemini API wird über den OpenAI-Kompatibilitätsmodus angesprochen, benötigt deshalb nur das openai Python-Package.

☁️ API Keys als Secrets in Google Colab hinterlegen¶

Klicke im Menü links auf das Schlüssel-Symbol 🔑

Google Colab – Secrets – API Keys

Lege folgende Secrets an:

Name	Wert
`API_KEY`	(empfohlen) dein API Key für OpenAI, Groq oder Gemini (automatische Erkennung)
`HF_TOKEN`	dein Hugging Face Access Token
`GROQ_API_KEY`	(optional) dein Groq API Key
`OPENAI_API_KEY`	(optional) dein OpenAI API Key

⚙️ Nutzung von LLMClient im Notebook¶

from llm_client import LLMClient

# LLMClient erkennt automatisch, welche Keys gesetzt sind
client = LLMClient()

print("Verwendete API:", client.api_choice)
print("Modell:", client.llm)

Ressourcen zu RAG¶

Coursera Kurs zu Retrieval Augmented Generation (RAG) von DeepLearning.AI