BM25 (Sparse/Keyword)

Latenz
1-5ms
Precision@5
72%
Storage
100MB

Dense (Embedding-basiert)

Latenz
50-200ms
Precision@5
88%
Storage
5GB

BM25: Schnell und einfach

Keyword-basierter Ansatz, der auf Wort-Häufigkeiten und Positionen basiert. Keine ML-Training nötig, extrem schnell.

Dense: Semantisch intelligent

Embedding-basiert, versteht Bedeutung. Besser bei Paraphrasen und semantisch ähnlichen Dokumenten.

Trade-off: Speed vs Quality

BM25 ist 10-100× schneller, aber Dense hat bessere semantische Qualität. Wahl je nach Anwendungsfall.

Hybrid Approach

Kombination: 30% BM25 + 70% Dense. Beste Balance zwischen Geschwindigkeit und Genauigkeit in Production.

Skalierung

BM25 skaliert linear, Dense benötigt Vector-DB (FAISS, Milvus). Für große Corpora: Hybrid oder nur Dense.

Real-World Einsatz

Google Search: BM25 als Filter, dann Ranker. RAG-Systeme: Dense Retrieval, BM25 als Fallback.