llm-marketing.de

Federated Learning

Federated Learning – Dezentralisiertes Modelltraining

Was ist Federated Learning? Federated Learning (auch: föderiertes Lernen oder verteiltes maschinelles Lernen) ist ein Ansatz im Bereich Machine Learning, bei dem ein KI-Modell dezentral trainiert wird – also direkt auf den Geräten oder Servern, auf denen die Trainingsdaten liegen – ohne dass diese Rohdaten an einen zentralen Ort übertragen werden müssen. Statt die Daten […]

Data Annotation

Data Annotation – Kennzeichnung von Trainingsdaten

Was ist Data Annotation? Data Annotation – auch Datenbeschriftung oder Datenannotation genannt – bezeichnet den Prozess, bei dem Rohdaten mit strukturierten Metadaten, Labels oder Markierungen versehen werden, damit maschinelle Lernmodelle diese Daten interpretieren und daraus lernen können. Die annotierten Daten dienen als Trainingsbasis für KI-Systeme und Large Language Models (LLMs), die ohne solche vorbereiteten Beispiele […]

Edge AI

Edge AI – KI-Verarbeitung am Netzwerkrand

Was ist Edge AI? Edge AI bezeichnet die Ausführung von KI- bzw. Künstliche-Intelligenz-Modellen direkt auf lokalen Geräten – sogenannten Edge Devices – anstatt auf zentralen Cloud-Servern. Dabei werden Inferenz und teils auch Training von Modellen auf Endgeräten wie Smartphones, Industrierobotern, Kameras oder IoT-Sensoren durchgeführt. Synonyme Begriffe sind On-Device AI oder lokale KI-Verarbeitung. Der wesentliche Unterschied […]

Learning Rate

Learning Rate – Schrittgröße bei der Optimierung eines Modells

Was ist Learning Rate? Die Learning Rate (deutsch: Lernrate) ist ein zentraler Hyperparameter beim Training von maschinellen Lernmodellen und neuronalen Netzen. Sie bestimmt, wie stark ein Modell seine internen Gewichte bei jedem Trainingsschritt anpasst, wenn es aus Fehlern lernt. Die Lernrate ist kein erlernter Parameter, sondern wird vor dem Training manuell oder durch automatisierte Verfahren […]

Data Pipeline

Data Pipeline – Datenverarbeitungskette

Was ist eine Data Pipeline? Eine Data Pipeline (deutsch: Datenpipeline) ist ein strukturierter Prozess, der Daten automatisiert von einer oder mehreren Quellen erfasst, transformiert und in ein Zielsystem überträgt. Der Begriff beschreibt sowohl die technische Infrastruktur als auch den logischen Ablauf, durch den Rohdaten in verwertbare, verarbeitungsfertige Informationen umgewandelt werden. In modernen KI- und Machine-Learning-Systemen […]

Cloud AI

Cloud AI – KI-Dienste aus der Cloud

Was ist Cloud AI? Cloud AI bezeichnet den Einsatz von Künstlicher Intelligenz (KI / Artificial Intelligence) über cloudbasierte Infrastrukturen, bei dem Rechenleistung, Modelle und Dienste nicht lokal betrieben, sondern über das Internet bereitgestellt werden. Anbieter wie Google Cloud AI, Microsoft Azure AI oder Amazon AWS AI stellen dabei vorgefertigte Modelle, Trainingspipelines und Inferenz-Dienste als skalierbare […]

On-Premise AI

On-Premise AI – Lokale KI-Infrastruktur

Was ist On-Premise AI? On-Premise AI bezeichnet den Betrieb von Künstlicher Intelligenz (KI) auf eigener, lokal verwalteter Infrastruktur – also auf Servern, die sich physisch im Unternehmen oder in einem selbst kontrollierten Rechenzentrum befinden. Im Gegensatz zu cloudbasierten KI-Diensten verlassen bei On-Premise-Lösungen weder Trainingsdaten noch Inferenzanfragen das eigene Netzwerk. Der Begriff wird auch als „On-Prem […]

Chunking

Chunking – Aufteilung von Text in kleinere Einheiten

Was ist Chunking? Chunking bezeichnet im Kontext von KI und Large Language Models (LLMs) die Methode, größere Textmengen in kleinere, semantisch zusammenhängende Einheiten – sogenannte Chunks – aufzuteilen. Diese Segmentierung ist ein zentraler Schritt in Retrieval-Augmented-Generation-Systemen (RAG) sowie in der Vektorsuche, da LLMs und Einbettungsmodelle nur begrenzte Kontextfenster verarbeiten können. Synonyme oder verwandte Bezeichnungen sind […]

Approximate Nearest Neighbor (ANN)

Approximate Nearest Neighbor – Näherungssuche im Vektorraum

Was ist Approximate Nearest Neighbor (ANN)? Approximate Nearest Neighbor (ANN), auf Deutsch näherungsweiser nächster Nachbar, bezeichnet eine Klasse von Algorithmen, die in hochdimensionalen Datenräumen schnell ähnliche Datenpunkte zu einem gegebenen Anfragepunkt finden – ohne dabei eine exakte, erschöpfende Suche durchzuführen. Im Unterschied zur exakten Nearest-Neighbor-Suche akzeptiert ANN eine geringe, kontrollierbare Ungenauigkeit, um die Suchgeschwindigkeit erheblich […]

Euclidean Distance

Euclidean Distance – Euklidischer Abstand zwischen Punkten

Was ist Euclidean Distance? Die Euclidean Distance (deutsch: euklidische Distanz) ist ein mathematisches Maß zur Berechnung des direkten geometrischen Abstands zwischen zwei Punkten in einem mehrdimensionalen Raum. In der KI- und Machine-Learning-Forschung wird sie häufig als euklidischer Abstand oder L2-Distanz bezeichnet und dient dazu, die Ähnlichkeit oder Unähnlichkeit zwischen Datenpunkten, Vektoren oder Embeddings zu quantifizieren. […]