BPE-Algorithmus Schritt für Schritt
Geschwindigkeit:
Tastatur: Space Play/Pause · Nächster Schritt · R Reset
Schritt 0 von 0 Merges
Initialisierung Starte mit einzelnen Zeichen als Basis-Tokens
Token Display
Paar-Häufigkeiten (aktuell)
Vokabular (0 Tokens)
0
Aktuelle Tokens
0
Merges durchgeführt
1.0×
Kompression
💡 So funktioniert BPE

Byte Pair Encoding startet mit einzelnen Zeichen und fusioniert iterativ die häufigsten benachbarten Paare zu neuen Tokens. Im Beispiel aaabdaaabac wird zuerst aaZ, dann abY, usw. fusioniert, bis die gewünschte Vokabulargröße erreicht ist.