Back

Embeddings

Numerische Repräsentationen für semantische Suche und KI-Anwendungen.


title: "Embeddings & Vektorsuche" slug: "embeddings" category: "AI & Data" description: "Wie Vektoren Text in Bedeutung übersetzen – Grundlagen, Kosinus-Ähnlichkeit und RAG-Architektur." tags: ["LLM", "RAG", "Gemini", "Vektoren", "Semantische Suche"] navigation_path: "/tiles/embeddings"

Was sind Embeddings?

Embeddings sind das Herzstück modernem Machine Learnings. Sie wandeln Texte, Bilder oder Audio in Zahlenfolgen (Vektoren) um, die von Computern verstanden werden können. So entsteht ein mathematischer Raum, in dem ähnliche Konzepte nah beieinander liegen.

🧠Wie das menschliche Gehirn?

Stell dir Embeddings wie die Art und Weise vor, wie wir Menschen Konzepte verknüpfen. „König“ und „Königin“ sind stark verwandt, genau wie „Hund“ und „Katze“. Embeddings visualisieren diese Beziehungen in dutzenden oder hunderten von Dimensionen!

Wie vergleicht man Texte?

Wenn wir zwei Sätze in Zahlen umwandeln, müssen wir messen, wie "nah" sie sich sind. Hier kommen zwei extrem wichtige mathematische Distanzmaße ins Spiel:

Kosinus-Ähnlichkeit

Misst den Winkel zwischen zwei Vektoren, egal wie lang sie sind. Perfekt für Texte: Ein kurzes und ein langes Dokument können inhaltlich identisch sein, solange sie in die gleiche „Richtung“ zeigen.

Euklidische Distanz

Misst die direkte Luftlinie zwischen zwei Punkten im Raum (wie wenn man ein Maßband anlegt). Gelingt besonders gut, wenn die exakte Länge der Vektoren relevant ist, z. B. bei bestimmten Bilderkennungen.

Probiere es selbst aus!

Tippe unten zwei Sätze in das Suchfeld und beobachte live, wie ihr Vektorwert in Echtzeit ausgelesen wird. Experimentiere mit Synonymen und schau, wie sich die Werte und Ahnlichkeit verändern!

Embedding Playground

Texte eingeben

3072 / 3072

Reduziere die Dimensionen, um zu sehen, wie sich die Abstände verändern. Neuere Modelle konzentrieren wichtige Infos oft auf die ersten Dimensionen.

Kosinus-Ähnlichkeit (höher = ähnlicher)

Distanzmatrix

Text12345678
Apfel1.0000.7940.7170.6180.6880.5710.7420.687
Apple0.7941.0000.5880.6580.5230.6240.5880.512
Banane0.7170.5881.0000.6410.6760.6030.7300.711
Pizza0.6180.6580.6411.0000.6210.7470.6260.633
Eis0.6880.5230.6760.6211.0000.5540.7090.714
Spaghetti0.5710.6240.6030.7470.5541.0000.5930.586
Erdbeere0.7420.5880.7300.6260.7090.5931.0000.735
Schokolade0.6870.5120.7110.6330.7140.5860.7351.000

Embedding Informationen (Vektor-Vorschau)

Text 1

"Apfel"

Dimensionen: 3072Magnitude: 1.000
...
[+0.007, -0.011, +0.013, +0.013, -0.016, +0.010, +0.008, -0.017, -0.005, -0.039, ... (3062 weitere)]

Text 2

"Apple"

Dimensionen: 3072Magnitude: 1.000
...
[+0.003, +0.005, +0.001, +0.010, -0.002, -0.009, -0.014, -0.019, -0.013, -0.071, ... (3062 weitere)]

Text 3

"Banane"

Dimensionen: 3072Magnitude: 1.000
...
[+0.021, -0.010, +0.008, +0.021, +0.004, -0.010, +0.008, +0.005, -0.003, -0.043, ... (3062 weitere)]

Text 4

"Pizza"

Dimensionen: 3072Magnitude: 1.000
...
[-0.006, +0.017, +0.013, -0.012, +0.009, -0.001, +0.018, -0.000, -0.009, -0.075, ... (3062 weitere)]

Text 5

"Eis"

Dimensionen: 3072Magnitude: 1.000
...
[-0.008, -0.010, +0.020, +0.025, +0.002, +0.005, +0.020, -0.001, -0.019, -0.040, ... (3062 weitere)]

Text 6

"Spaghetti"

Dimensionen: 3072Magnitude: 1.000
...
[-0.012, +0.022, +0.012, -0.013, +0.015, -0.015, -0.003, +0.007, -0.006, -0.066, ... (3062 weitere)]

Text 7

"Erdbeere"

Dimensionen: 3072Magnitude: 1.000
...
[+0.007, -0.005, +0.004, +0.018, -0.018, +0.008, -0.012, +0.013, -0.005, -0.024, ... (3062 weitere)]

Text 8

"Schokolade"

Dimensionen: 3072Magnitude: 1.000
...
[+0.009, +0.008, +0.007, +0.001, -0.023, +0.001, +0.009, -0.003, +0.017, -0.038, ... (3062 weitere)]