BPE-Animation – LLM Explorer

BPE-Algorithmus Schritt für Schritt

Geschwindigkeit:

Tastatur: Space Play/Pause · → Nächster Schritt · R Reset

Schritt 0 von 0 Merges

Initialisierung Starte mit einzelnen Zeichen als Basis-Tokens

Token Display

Paar-Häufigkeiten (aktuell)

Vokabular (0 Tokens)

Aktuelle Tokens

Merges durchgeführt

1.0×

Kompression

💡 So funktioniert BPE

Byte Pair Encoding startet mit einzelnen Zeichen und fusioniert iterativ die häufigsten benachbarten Paare zu neuen Tokens. Im Beispiel aaabdaaabac wird zuerst aa → Z, dann ab → Y, usw. fusioniert, bis die gewünschte Vokabulargröße erreicht ist.

Verwandte Visualisierungen