Wörter als Punkte im semantischen Raum – ähnliche Bedeutungen liegen nahe beieinander. Diese t-SNE-Projektion reduziert ~8.000 Dimensionen auf 2D.
Jedes Wort in einem LLM wird durch einen hochdimensionalen Vektor repräsentiert
(z.B. d = 8.192 bei Llama 3 70B). Diese Vektoren erfassen semantische
Beziehungen: Wörter mit ähnlicher Bedeutung haben ähnliche Vektoren und liegen
im Raum nahe beieinander. Die t-SNE-Projektion macht diese Struktur in 2D sichtbar –
beachten Sie die klaren Cluster für Tiere, Länder, Verben und Adjektive.