Florian - KI Rundschau (Page 2)

Anmelden Abonnieren

Florian

Homelab

Hardware Homelab — Server zuhause — KI, Storage, Backups, alles in eigener Hand. Beispiel Ein Homelab-Setup hat oft Proxmox, eine NAS, eine GPU für KI und Docker-Container. Verwandt: Self-Hosting · NAS Mehr im Glossar Alle Begriffe auf einen Blick →

Mini-PC

Hardware Mini-PC — Kleiner Computer (z. B. Mac Mini, GMKtec) — taugt für mittlere KI-Modelle. Beispiel Mac Mini M4 mit 32 GB Unified Memory schafft Modelle bis ~32B in Q4-Quantisierung. Verwandt: GPU · Lokale KI · NPU Mehr im Glossar Alle Begriffe auf einen Blick →

CUDA

Hardware CUDA — NVIDIAs Software-Schicht — Standard für GPU-beschleunigte KI. Beispiel Fast alle KI-Bibliotheken sind primär für CUDA optimiert. AMD und Apple haben Alternativen, oft noch klobiger. Verwandt: GPU Mehr im Glossar Alle Begriffe auf einen Blick →

GPU

Hardware GPU — Grafikkarte — das wichtigste Bauteil für KI-Inferenz und -Training. Beispiel Für lokale KI brauchst du eine NVIDIA-GPU mit viel VRAM. Eine RTX 4090 ist der Sweet Spot für Enthusiasten. Verwandt: VRAM · CUDA · Cloud-GPU Mehr im Glossar Alle Begriffe auf einen Blick →

DeepSeek

Lokale KI & Self-Hosting DeepSeek — Chinesisches Modell mit starkem Code/Reasoning-Fokus. Beispiel DeepSeek hat 2025 mit niedrigen Trainingskosten für Aufsehen gesorgt — gute lokale Wahl für Code-Tasks. Verwandt: Qwen · Llama Mehr im Glossar Alle Begriffe auf einen Blick →

Qwen

Lokale KI & Self-Hosting Qwen — Alibabas Modell-Familie — in 2026 oft die DACH-Empfehlung für Code und Multilingual. Beispiel Qwen 3 32B läuft auf einer 24-GB-GPU und ist auf Deutsch sehr stark. Verwandt: Llama · DeepSeek Mehr im Glossar Alle Begriffe auf einen Blick →

Mistral

Lokale KI & Self-Hosting Mistral — Französisches Open-Weights-Modell, sehr effizient — EU-Heimspiel. Beispiel Mistral Small ist sehr effizient für seine Größe und EU-konform hosted. Verwandt: Llama · Qwen Mehr im Glossar Alle Begriffe auf einen Blick →

Llama

Lokale KI & Self-Hosting Llama — Metas offene Modell-Familie — Grundlage für viele lokale Setups. Beispiel Llama 3.3 70B ist 2026 oft die Standard-Empfehlung für mittlere bis große lokale Setups. Verwandt: Mistral · Qwen · Open Source / Open Weights Mehr im Glossar Alle Begriffe auf einen Blick →

Parameter

Lokale KI & Self-Hosting Parameter — Die Gewichte eines Modells — 7B = 7 Milliarden Parameter. Beispiel Kleine Modelle: 1–3B (Edge-Geräte). Mittel: 7–13B (Laptop). Groß: 32–70B (Workstation). Sehr groß: 200B+ (Server-Cluster). Verwandt: LLM (Large Language Model) · Quantisierung · VRAM Mehr im Glossar Alle Begriffe auf einen Blick →

VRAM

Lokale KI & Self-Hosting VRAM — Speicher der Grafikkarte — der Engpass beim lokalen Modell-Betrieb. Beispiel RTX 4090 hat 24 GB VRAM. Damit läuft ein 32B-Modell in Q4-Quantisierung ordentlich. Verwandt: GPU · Quantisierung Mehr im Glossar Alle Begriffe auf einen Blick →

Quantisierung

Lokale KI & Self-Hosting Quantisierung — Modell-Größe reduzieren durch weniger genaue Zahlen — schneller, weniger RAM. Beispiel Ein 70B-Modell braucht in voller Präzision 140 GB VRAM. In Q4-Quantisierung nur ~40 GB. Verwandt: VRAM · GGUF · GPU Mehr im Glossar Alle Begriffe auf einen Blick →

GGUF

Lokale KI & Self-Hosting GGUF — Dateiformat für quantisierte Modelle — der Standard für Ollama, LM Studio und Co. Beispiel Llama-3.3-70B-Q4_K_M.gguf — das ist ein 70-Milliarden-Parameter-Modell, auf 4-Bit-Genauigkeit komprimiert. Verwandt: Quantisierung · Ollama Mehr im Glossar Alle Begriffe auf einen Blick →

Self-Hosting

Lokale KI & Self-Hosting Self-Hosting — Software auf eigener Infrastruktur betreiben statt bei einem Anbieter. Beispiel n8n self-hosted statt n8n Cloud — du behältst alle Daten und zahlst nur Server. Verwandt: Lokale KI · Souveränität (digitale) Mehr im Glossar Alle Begriffe auf einen Blick →

Lokale KI

Lokale KI & Self-Hosting Lokale KI — Modelle, die auf eigener Hardware laufen — keine Cloud, keine Datenabflüsse. Für KMU mit DSGVO-Anforderungen die ehrlichste Antwort. Was lokale KI 2026 wirklich kann Lokale KI heißt: das Sprachmodell läuft auf deiner Hardware. Daten gehen nicht in eine Cloud. Drei Jahre nach dem ersten Llama-Release

Chain-of-Thought

Agenten & Fortgeschrittenes Chain-of-Thought — Technik, bei der die KI laut denkt — bessere Antworten bei Logik-Aufgaben. Beispiel Statt Antworte direkt fragst du Denke Schritt für Schritt, dann antworte. Bei Mathe und Logik macht das enormen Unterschied. Verwandt: Prompt Engineering · LLM (Large Language Model) Mehr im Glossar Alle Begriffe auf einen Blick

System Prompt

Agenten & Fortgeschrittenes System Prompt — Die unsichtbare Anweisung, die das Verhalten eines KI-Assistenten festlegt. Beispiel Ein Customer-Service-Bot hat einen System Prompt wie: Du bist freundlich, antwortest in 2 Sätzen, nennst keine Konkurrenzprodukte. Verwandt: Prompt · Prompt Engineering Mehr im Glossar Alle Begriffe auf einen Blick →

Prompt Engineering

Agenten & Fortgeschrittenes Prompt Engineering — Die Kunst, KI-Anweisungen so zu formulieren, dass gute Antworten rauskommen. Beispiel Strukturierte Prompts mit Rolle, Aufgabe, Beispielen und Ausgabeformat liefern messbar bessere Ergebnisse. Verwandt: Prompt · System Prompt Mehr im Glossar Alle Begriffe auf einen Blick →

Fine-Tuning

Agenten & Fortgeschrittenes Fine-Tuning — Ein bestehendes Modell mit eigenen Daten nachtrainieren. Beispiel Aus Llama 3.3 wird durch Fine-Tuning ein Modell, das deinen Schreibstil oder Fachjargon kennt. Verwandt: LLM (Large Language Model) · Lokale KI Mehr im Glossar Alle Begriffe auf einen Blick →

MCP (Model Context Protocol)

Agenten & Fortgeschrittenes MCP (Model Context Protocol) — Standard, mit dem KI-Tools auf externe Daten und Aktionen zugreifen. Beispiel Claude Desktop kann via MCP auf dein Dateisystem, dein Git-Repo oder deine Datenbank zugreifen. Verwandt: KI-Agent · Function Calling / Tool Use Mehr im Glossar Alle Begriffe auf einen Blick →

Function Calling / Tool Use

Agenten & Fortgeschrittenes Function Calling / Tool Use — KI ruft Programme auf (z. B. Suche, Rechner, Datenbank) während sie antwortet. Beispiel Wie ist das Wetter in Wien? — die KI ruft eine Wetter-API auf und antwortet mit echten Daten. Verwandt: KI-Agent · MCP (Model Context Protocol) · API Mehr im Glossar Alle Begriffe auf

RAG (Retrieval-Augmented Generation)

Agenten & Fortgeschrittenes RAG (Retrieval-Augmented Generation) — KI, die zuerst in deinen eigenen Dokumenten sucht und dann antwortet. Die Antwort kommt mit Belegstellen aus deiner Wissensbasis. Was RAG technisch macht Ein normales LLM wie ChatGPT oder Claude kennt nur, was im Training drin war. Frag es nach deinem letzten Vertrag oder

KI-Agent

Agenten & Fortgeschrittenes KI-Agent — KI, die mehrschrittige Aufgaben selbständig plant und ausführt — nicht nur antwortet, sondern handelt. Mit Function Calling, externen APIs und manchmal eigenständigen Browsing-Sessions. Was einen KI-Agenten von einem Chatbot unterscheidet Ein klassischer Chatbot antwortet auf Fragen. Ein KI-Agent plant und führt aus. Drei Bauteile machen den Unterschied:

API

Automatisierung API — Schnittstelle, über die Systeme automatisiert miteinander reden. Beispiel Die OpenAI-API erlaubt es, ChatGPT-Antworten in eigene Software einzubauen. Verwandt: Webhook · Function Calling / Tool Use Mehr im Glossar Alle Begriffe auf einen Blick →

Webhook

Automatisierung Webhook — Eine URL, die auf Ereignisse wartet — der häufigste Trigger. Beispiel Stripe ruft eine Webhook-URL auf, wenn eine Zahlung eingeht — und dein Workflow startet. Verwandt: Trigger · API Mehr im Glossar Alle Begriffe auf einen Blick →

Trigger

Automatisierung Trigger — Das Ereignis, das einen Workflow startet (neue Mail, neues Formular, Zeitplan). Beispiel Wenn ein neuer Kontakt im CRM angelegt wird ist ein Trigger. Verwandt: Workflow · Webhook Mehr im Glossar Alle Begriffe auf einen Blick →