Zum Inhalt

Aufbau des Datensatzes

Der Datensatz ist wie ein Aufgabenheft aufgebaut: Es gibt mehrere Anlagen, und zu jeder Anlage mehrere Aufgaben-Varianten.

Anlagen als Bausteine

Jede Anlage liegt in einem eigenen Ordner. Das sind zum Beispiel die ersten 3 Beispielanlagen:

Anlage Kurzbeschreibung
BGA1 Große Anlage: zwei Fermenter, Nachgärer, Gärrestlager, Biogasaufbereitung, Separator
BGA2 Kleine Anlage: ein Fermenter, Nachgärer, Gärrestlager, Blockheizkraftwerk
BGA3 Mittlere Anlage: zwei Fermenter, Nachgärer, Gärrestlager, Blockheizkraftwerk

BGA = Biogasanlage

„BGA" steht für Biogasanlage. Die Nummer unterscheidet die drei Beispiele.

Varianten

Pro Anlage gibt es unterschiedliche Beschreibungen, welche diselbe Biogasanlage beschreiben. So lässt sich prüfen, ob die KI robust ist egal ob die Beschreibung lang, kurz, auf Englisch oder als Skizze vorliegt.

Zwei Eigenschaften werden dabei kombiniert:

1. Die Form der Beschreibung

  • ausführlicher Text – ein erklärender Fließtext
  • knapper Text (terse) – nur die wichtigsten Eckdaten
  • englischer Text – dieselbe Anlage auf Englisch
  • Skizze – eine Zeichnung der Anlage (Bild)

2. Die Vollständigkeit der Angaben

  • vollständig: Alle nötigen Angaben stehen in der Beschreibung.
    Die KI muss nichts nachfragen.
  • unvollständig: Es fehlen Angaben (z. B. die Betriebstemperatur). Die KI muss
    diese erfragen oder sinnvoll ergänzen.

Die Musterlösung („Gold")

Zu jeder Anlage gehört eine Musterlösung. Sie beschreibt die korrekt aufgebaute Anlage und dient als Maßstab, an dem das Ergebnis der KI gemessen wird. Alle Varianten einer Anlage teilen sich dieselbe Musterlösung, weil es ja immer dieselbe Anlage ist.

Wie die Ordner aussehen

Vereinfacht sieht die Ablage so aus:

Datensatz/
  BGA1/                     ← Anlage 1 (ein Ordner pro Anlage)
    BGA1_text_de.json         ausführlicher Text (Deutsch), unvollständig
    BGA1_text_de_full.json    ausführlicher Text (Deutsch), vollständig
    BGA1_text_en.json         englischer Text
    BGA1_terse_de.json        knappe Beschreibung
    BGA1_sketch.json          nur Skizze
    BGA1_sketch.png           das Skizzen-Bild
    gold.py                   die gemeinsame Musterlösung
  BGA2/  …                   ← Anlage 2 (gleicher Aufbau)
  BGA3/  …                   ← Anlage 3 (gleicher Aufbau)

Was ist eine .json-Datei?

Eine .json-Datei ist eine Textdatei in einem festen Format, die der Computer leicht lesen kann. Man kann sie sich wie ein ausgefülltes Formular mit klar benannten Feldern vorstellen. Was genau in so einem Formular steht, erklärt die Seite Ein Datenpunkt im Detail.