Glossar Homelab Hardware Homelab — Server zuhause — KI, Storage, Backups, alles in eigener Hand. Beispiel Ein Homelab-Setup hat oft Proxmox, eine NAS, eine GPU für KI und Docker-Container. Verwandt: Self-Hosting · NAS Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Mini-PC Hardware Mini-PC — Kleiner Computer (z. B. Mac Mini, GMKtec) — taugt für mittlere KI-Modelle. Beispiel Mac Mini M4 mit 32 GB Unified Memory schafft Modelle bis ~32B in Q4-Quantisierung. Verwandt: GPU · Lokale KI · NPU Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar CUDA Hardware CUDA — NVIDIAs Software-Schicht — Standard für GPU-beschleunigte KI. Beispiel Fast alle KI-Bibliotheken sind primär für CUDA optimiert. AMD und Apple haben Alternativen, oft noch klobiger. Verwandt: GPU Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar GPU Hardware GPU — Grafikkarte — das wichtigste Bauteil für KI-Inferenz und -Training. Beispiel Für lokale KI brauchst du eine NVIDIA-GPU mit viel VRAM. Eine RTX 4090 ist der Sweet Spot für Enthusiasten. Verwandt: VRAM · CUDA · Cloud-GPU Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar DeepSeek Lokale KI & Self-Hosting DeepSeek — Chinesisches Modell mit starkem Code/Reasoning-Fokus. Beispiel DeepSeek hat 2025 mit niedrigen Trainingskosten für Aufsehen gesorgt — gute lokale Wahl für Code-Tasks. Verwandt: Qwen · Llama Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Qwen Lokale KI & Self-Hosting Qwen — Alibabas Modell-Familie — in 2026 oft die DACH-Empfehlung für Code und Multilingual. Beispiel Qwen 3 32B läuft auf einer 24-GB-GPU und ist auf Deutsch sehr stark. Verwandt: Llama · DeepSeek Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Mistral Lokale KI & Self-Hosting Mistral — Französisches Open-Weights-Modell, sehr effizient — EU-Heimspiel. Beispiel Mistral Small ist sehr effizient für seine Größe und EU-konform hosted. Verwandt: Llama · Qwen Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Llama Lokale KI & Self-Hosting Llama — Metas offene Modell-Familie — Grundlage für viele lokale Setups. Beispiel Llama 3.3 70B ist 2026 oft die Standard-Empfehlung für mittlere bis große lokale Setups. Verwandt: Mistral · Qwen · Open Source / Open Weights Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Parameter Lokale KI & Self-Hosting Parameter — Die Gewichte eines Modells — 7B = 7 Milliarden Parameter. Beispiel Kleine Modelle: 1–3B (Edge-Geräte). Mittel: 7–13B (Laptop). Groß: 32–70B (Workstation). Sehr groß: 200B+ (Server-Cluster). Verwandt: LLM (Large Language Model) · Quantisierung · VRAM Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar VRAM Lokale KI & Self-Hosting VRAM — Speicher der Grafikkarte — der Engpass beim lokalen Modell-Betrieb. Beispiel RTX 4090 hat 24 GB VRAM. Damit läuft ein 32B-Modell in Q4-Quantisierung ordentlich. Verwandt: GPU · Quantisierung Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Quantisierung Lokale KI & Self-Hosting Quantisierung — Modell-Größe reduzieren durch weniger genaue Zahlen — schneller, weniger RAM. Beispiel Ein 70B-Modell braucht in voller Präzision 140 GB VRAM. In Q4-Quantisierung nur ~40 GB. Verwandt: VRAM · GGUF · GPU Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar GGUF Lokale KI & Self-Hosting GGUF — Dateiformat für quantisierte Modelle — der Standard für Ollama, LM Studio und Co. Beispiel Llama-3.3-70B-Q4_K_M.gguf — das ist ein 70-Milliarden-Parameter-Modell, auf 4-Bit-Genauigkeit komprimiert. Verwandt: Quantisierung · Ollama Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Self-Hosting Lokale KI & Self-Hosting Self-Hosting — Software auf eigener Infrastruktur betreiben statt bei einem Anbieter. Beispiel n8n self-hosted statt n8n Cloud — du behältst alle Daten und zahlst nur Server. Verwandt: Lokale KI · Souveränität (digitale) Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Lokale KI Lokale KI & Self-Hosting Lokale KI — Modelle, die auf eigener Hardware laufen — keine Cloud, keine Datenabflüsse. Für KMU mit DSGVO-Anforderungen die ehrlichste Antwort. Was lokale KI 2026 wirklich kann Lokale KI heißt: das Sprachmodell läuft auf deiner Hardware. Daten gehen nicht in eine Cloud. Drei Jahre nach dem ersten Llama-Release
Glossar Chain-of-Thought Agenten & Fortgeschrittenes Chain-of-Thought — Technik, bei der die KI laut denkt — bessere Antworten bei Logik-Aufgaben. Beispiel Statt Antworte direkt fragst du Denke Schritt für Schritt, dann antworte. Bei Mathe und Logik macht das enormen Unterschied. Verwandt: Prompt Engineering · LLM (Large Language Model) Mehr im Glossar Alle Begriffe auf einen Blick
Glossar System Prompt Agenten & Fortgeschrittenes System Prompt — Die unsichtbare Anweisung, die das Verhalten eines KI-Assistenten festlegt. Beispiel Ein Customer-Service-Bot hat einen System Prompt wie: Du bist freundlich, antwortest in 2 Sätzen, nennst keine Konkurrenzprodukte. Verwandt: Prompt · Prompt Engineering Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Prompt Engineering Agenten & Fortgeschrittenes Prompt Engineering — Die Kunst, KI-Anweisungen so zu formulieren, dass gute Antworten rauskommen. Beispiel Strukturierte Prompts mit Rolle, Aufgabe, Beispielen und Ausgabeformat liefern messbar bessere Ergebnisse. Verwandt: Prompt · System Prompt Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Fine-Tuning Agenten & Fortgeschrittenes Fine-Tuning — Ein bestehendes Modell mit eigenen Daten nachtrainieren. Beispiel Aus Llama 3.3 wird durch Fine-Tuning ein Modell, das deinen Schreibstil oder Fachjargon kennt. Verwandt: LLM (Large Language Model) · Lokale KI Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar MCP (Model Context Protocol) Agenten & Fortgeschrittenes MCP (Model Context Protocol) — Standard, mit dem KI-Tools auf externe Daten und Aktionen zugreifen. Beispiel Claude Desktop kann via MCP auf dein Dateisystem, dein Git-Repo oder deine Datenbank zugreifen. Verwandt: KI-Agent · Function Calling / Tool Use Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Function Calling / Tool Use Agenten & Fortgeschrittenes Function Calling / Tool Use — KI ruft Programme auf (z. B. Suche, Rechner, Datenbank) während sie antwortet. Beispiel Wie ist das Wetter in Wien? — die KI ruft eine Wetter-API auf und antwortet mit echten Daten. Verwandt: KI-Agent · MCP (Model Context Protocol) · API Mehr im Glossar Alle Begriffe auf
Glossar RAG (Retrieval-Augmented Generation) Agenten & Fortgeschrittenes RAG (Retrieval-Augmented Generation) — KI, die zuerst in deinen eigenen Dokumenten sucht und dann antwortet. Die Antwort kommt mit Belegstellen aus deiner Wissensbasis. Was RAG technisch macht Ein normales LLM wie ChatGPT oder Claude kennt nur, was im Training drin war. Frag es nach deinem letzten Vertrag oder
Glossar KI-Agent Agenten & Fortgeschrittenes KI-Agent — KI, die mehrschrittige Aufgaben selbständig plant und ausführt — nicht nur antwortet, sondern handelt. Mit Function Calling, externen APIs und manchmal eigenständigen Browsing-Sessions. Was einen KI-Agenten von einem Chatbot unterscheidet Ein klassischer Chatbot antwortet auf Fragen. Ein KI-Agent plant und führt aus. Drei Bauteile machen den Unterschied:
Glossar API Automatisierung API — Schnittstelle, über die Systeme automatisiert miteinander reden. Beispiel Die OpenAI-API erlaubt es, ChatGPT-Antworten in eigene Software einzubauen. Verwandt: Webhook · Function Calling / Tool Use Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Webhook Automatisierung Webhook — Eine URL, die auf Ereignisse wartet — der häufigste Trigger. Beispiel Stripe ruft eine Webhook-URL auf, wenn eine Zahlung eingeht — und dein Workflow startet. Verwandt: Trigger · API Mehr im Glossar Alle Begriffe auf einen Blick →
Glossar Trigger Automatisierung Trigger — Das Ereignis, das einen Workflow startet (neue Mail, neues Formular, Zeitplan). Beispiel Wenn ein neuer Kontakt im CRM angelegt wird ist ein Trigger. Verwandt: Workflow · Webhook Mehr im Glossar Alle Begriffe auf einen Blick →