{"id":3204,"date":"2026-04-07T22:29:00","date_gmt":"2026-04-07T20:29:00","guid":{"rendered":"https:\/\/g7itchme.wordpress.com\/?p=3204"},"modified":"2026-04-07T22:29:00","modified_gmt":"2026-04-07T20:29:00","slug":"eigene-ki-fur-unterwegs-wie-google-mit-gemma-4-den-lokalen-ki-markt-aufmischt","status":"publish","type":"post","link":"https:\/\/technodidact.de\/en\/eigene-ki-fur-unterwegs-wie-google-mit-gemma-4-den-lokalen-ki-markt-aufmischt\/","title":{"rendered":"Eigene KI f\u00fcr unterwegs: Wie Google mit Gemma 4 den lokalen KI-Markt aufmischt"},"content":{"rendered":"<p class=\"wp-block-paragraph\">von DerSchneider<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Einleitung: Der KI-Klopapier-Vergleich<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Wir erinnern uns: Vor wenigen Jahren war der Gang in die Cloud f\u00fcr jede KI-Abfrage noch alternativlos. Die Modelle waren riesig, die Rechenanforderungen gewaltig, und ohne stabile Internetverbindung war man aufgeschmissen. Heute, im Jahr 2026, hat sich das Blatt gewendet. Google hat mit&nbsp;<strong>Gemma 4<\/strong>&nbsp;eine Familie von vier Open-Source-KI-Modellen vorgestellt, die nicht nur auf leistungsstarken Workstations laufen, sondern auch auf dem Smartphone in der Hosentasche \u2013 offline, privat und mit einer Intelligenz, die selbst Giganten wie Llama 405B oder Qwen 397B hinter sich l\u00e4sst.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Dieser Artikel beleuchtet, wie dieser Paradigmenwechsel zustande kam, welche technischen Details hinter den neuen Modellen stecken, wie offen sie wirklich sind \u2013 und was das f\u00fcr Entwickler, Unternehmen und Privatanwender bedeutet.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Von der Cloud an den Rand: Ein technikhistorischer Abriss<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Die Entwicklung lokaler KI-Modelle ist ein Lehrst\u00fcck in Effizienzsteigerung. Vor f\u00fcnf, sechs Jahren dominierte das Paradigma &#8222;mehr Parameter = mehr Intelligenz&#8220;. Gigantische Modelle wie GPT-4 (angeblich \u00fcber eine Billion Parameter) und Llama 405B trieben die Parameterinflation voran, banden aber auch immense Cloud-Ressourcen.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Das Problem: Diese Modelle waren f\u00fcr den Einsatz auf mobilen Ger\u00e4ten oder gar Offline-Szenarien v\u00f6llig ungeeignet.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Die Wende kam mit dem Aufkommen effizienterer Architekturen. Modelle wie DeepSeek und Qwen zeigten, dass intelligentes Design Parametergrenzen sprengen kann. Google reagierte mit der Gemma-Reihe \u2013 zun\u00e4chst unter einer restriktiven Eigenlizenz. Jetzt, mit Gemma 4, geht der Suchmaschinenriese den n\u00e4chsten Schritt: vollst\u00e4ndige Transparenz und Kommerzialisierungsfreiheit unter der&nbsp;<strong>Apache 2.0<\/strong>-Lizenz. Das ist ein klarer Kurswechsel, der die Branche nachhaltig ver\u00e4ndern wird.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p class=\"wp-block-paragraph\"><strong>Wichtiger Einschub zur Begriffsgenauigkeit:<\/strong>&nbsp;Wir m\u00fcssen zwischen &#8222;Open Source&#8220; im Sinne von verf\u00fcgbaren Gewichten und echter Quelloffenheit unterscheiden. Gemma 4 ist ein&nbsp;<strong>Open-Weight<\/strong>-Modell \u2013 die vortrainierten Gewichte sind frei herunterlad- und nutzbar. Das vollst\u00e4ndige Trainingsset oder die genauen Trainingsdetails sind jedoch nicht immer vollst\u00e4ndig offengelegt. Trotzdem: Die Apache-2.0-Lizenz ist ein gewaltiger Schritt in Richtung echter Offenheit und stellt fr\u00fchere, restriktivere Lizenzen in den Schatten.<\/p>\n<\/blockquote>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Die vier Modelle im \u00dcberblick: F\u00fcr jedes Ger\u00e4t das passende Werkzeug<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Google DeepMind hat Gemma 4 in vier Varianten konzipiert, die vom einfachen IoT-Sensor bis zur Hochleistungsworkstation reichen. Die folgende Tabelle fasst die wichtigsten Unterschiede zusammen:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><thead><tr><th class=\"has-text-align-left\" data-align=\"left\">Modell<\/th><th class=\"has-text-align-left\" data-align=\"left\">Aktive Parameter<\/th><th class=\"has-text-align-left\" data-align=\"left\">Gesamtparameter<\/th><th class=\"has-text-align-left\" data-align=\"left\">Kontextfenster<\/th><th class=\"has-text-align-left\" data-align=\"left\">Zielhardware<\/th><th class=\"has-text-align-left\" data-align=\"left\">Besonderheiten<\/th><\/tr><\/thead><tbody><tr><td><strong>E2B<\/strong><\/td><td>2,3 Mrd. (effektiv)<\/td><td>5,1 Mrd.<\/td><td>128.000 Token<\/td><td>Smartphones, Raspberry Pi, Jetson Orin Nano<\/td><td>Maximale Effizienz, Audio-Input, 3x schneller als E4B<\/td><\/tr><tr><td><strong>E4B<\/strong><\/td><td>4,5 Mrd. (effektiv)<\/td><td>8 Mrd.<\/td><td>128.000 Token<\/td><td>Laptops, leistungsf\u00e4higere Edge-Ger\u00e4te<\/td><td>H\u00f6here Reasoning-Kraft als E2B, Audio-Input<\/td><\/tr><tr><td><strong>26B A4B (MoE)<\/strong><\/td><td>3,8 Mrd. (aktiv)<\/td><td>25,2 Mrd.<\/td><td><strong>256.000 Token<\/strong><\/td><td>Workstations, Consumer-GPUs<\/td><td>MoE-Architektur: 128 Experten, 8 aktiv pro Token<\/td><\/tr><tr><td><strong>31B Dense<\/strong><\/td><td>30,7 Mrd.<\/td><td>30,7 Mrd.<\/td><td><strong>256.000 Token<\/strong><\/td><td>High-End-Workstations, Server<\/td><td>Maximale Qualit\u00e4t, beste Code- und Reasoning-F\u00e4higkeiten<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Erl\u00e4uterung der Fachbegriffe:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Effektive Parameter (E2B\/E4B):<\/strong>\u00a0Diese Modelle nutzen eine Technik namens\u00a0<em>Per-Layer Embeddings<\/em>\u00a0(PLE). Jede Decoderschicht besitzt ihre eigene, kleine Einbettung f\u00fcr jedes Token. Das klingt aufwendig, ist aber rechnerisch sehr g\u00fcnstig \u2013 wie ein gut organisierter Spickzettel, der sofort griffbereit ist.<\/li>\n\n\n\n<li><strong>MoE (Mixture of Experts):<\/strong>\u00a0Das 26B-Modell ist kein dichter Block, sondern besteht aus vielen kleinen &#8222;Experten&#8220;. Pro Rechenschritt werden nur 8 der 128 Experten aktiviert. So erreicht es nahezu die Qualit\u00e4t des 31B-Modells, ist aber fast so schnell wie ein 4B-Modell.<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Alle Modelle beherrschen natives&nbsp;<strong>Function Calling<\/strong>, strukturierten JSON-Output und System-Prompts \u2013 Grundvoraussetzungen f\u00fcr den Bau autonomer KI-Agenten.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Leistungsdaten: Ein Quantensprung in der Intelligenz pro Parameter<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Die reinen Leistungszahlen von Gemma 4 lesen sich wie ein Science-Fiction-Roman. Im Vergleich zur Vorg\u00e4ngergeneration (Gemma 3 27B) hat sich die Leistungsf\u00e4higkeit in Schl\u00fcsselbereichen nahezu vervierfacht. Die folgende Tabelle zeigt den beeindruckenden Sprung:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><thead><tr><th class=\"has-text-align-left\" data-align=\"left\">Benchmark<\/th><th class=\"has-text-align-left\" data-align=\"left\">Gemma 3 27B<\/th><th class=\"has-text-align-left\" data-align=\"left\">Gemma 4 31B<\/th><th class=\"has-text-align-left\" data-align=\"left\">Ver\u00e4nderung<\/th><\/tr><\/thead><tbody><tr><td><strong>AIME 2026<\/strong>&nbsp;(Mathematik)<\/td><td>20,8 %<\/td><td><strong>89,2 %<\/strong><\/td><td>+68,4 Prozentpunkte<\/td><\/tr><tr><td><strong>LiveCodeBench v6<\/strong>&nbsp;(Code)<\/td><td>29,1 %<\/td><td><strong>80,0 %<\/strong><\/td><td>+50,9 Prozentpunkte<\/td><\/tr><tr><td><strong>GPQA Diamond<\/strong>&nbsp;(Wissenschaft)<\/td><td>42,4 %<\/td><td><strong>84,3 %<\/strong><\/td><td>+41,9 Prozentpunkte<\/td><\/tr><tr><td><strong>Codeforces ELO<\/strong>&nbsp;(Wettbewerbsprogrammierung)<\/td><td>110<\/td><td><strong>2.150<\/strong><\/td><td>&#8222;Von kaum funktional zu Expertenniveau&#8220;<\/td><\/tr><tr><td><strong>MMMU Pro<\/strong>&nbsp;(visuelles Reasoning)<\/td><td>49,7 %<\/td><td><strong>76,9 %<\/strong><\/td><td>+27,2 Prozentpunkte<\/td><\/tr><tr><td><strong>t2-bench<\/strong>&nbsp;(Agenten)<\/td><td>6,6 %<\/td><td><strong>86,4 %<\/strong><\/td><td>+79,8 Prozentpunkte<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\"><em>Quellen: Eigene Darstellung nach verschiedenen Quellen; die absoluten Zahlen k\u00f6nnen je nach Testbedingungen leicht variieren.<\/em><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Diese Zahlen sind nicht nur beeindruckend \u2013 sie sind ein&nbsp;<strong>Paradigmenwechsel<\/strong>. Ein Modell mit 31 Milliarden Parametern schl\u00e4gt hier Konkurrenten mit der&nbsp;<strong>20-fachen<\/strong>&nbsp;Parameteranzahl. Der Wettbewerb verschiebt sich weg von der reinen Skalierung hin zur intelligenten Architektur.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Apache 2.0: Googles radikale Kehrtwende<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Die Lizenzierung von KI-Modellen ist oft ein untersch\u00e4tzter, aber entscheidender Faktor f\u00fcr deren Verbreitung. Fr\u00fchere Gemma-Versionen standen unter einer restriktiven Google-eigenen Lizenz, die selbst die Nutzung von mit dem Modell generierten Daten f\u00fcr andere Projekte einschr\u00e4nken konnte. Das war f\u00fcr viele Unternehmen ein No-Go.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Mit Gemma 4 vollzieht Google eine radikale Kehrtwende: Die Modelle stehen unter der&nbsp;<strong>Apache 2.0<\/strong>-Lizenz. Das bedeutet:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Kommerzielle Nutzung ohne Einschr\u00e4nkungen<\/strong><\/li>\n\n\n\n<li><strong>Modifikation und Weiterverbreitung erlaubt<\/strong><\/li>\n\n\n\n<li><strong>Keine versteckten Klauseln<\/strong>, die die Nutzung anderer Modelle beeintr\u00e4chtigen<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Die Entscheidung f\u00fcr diese permissive Lizenz ist nicht nur technischer Natur, sondern auch strategisch. Angesichts des rasanten Aufstiegs chinesischer Open-Source-Modelle (insbesondere Qwen, die Llama als meistgenutztes Selbsthosting-Modell abgel\u00f6st haben) musste Google handeln, um im Wettbewerb um die Gunst der Entwickler nicht den Anschluss zu verlieren.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p class=\"wp-block-paragraph\"><strong>Achtung, Unsch\u00e4rfe:<\/strong>&nbsp;Die Apache-2.0-Lizenz gilt f\u00fcr die Modelle&nbsp;<em>selbst<\/em>. Sie bezieht sich nicht automatisch auf die von Google verwendeten Trainingsdaten. Diese bleiben weiterhin Googles Eigentum. F\u00fcr die meisten praktischen Anwendungen (Feintuning, kommerzielle Nutzung, eigene Produkte) ist dies jedoch irrelevant.<\/p>\n<\/blockquote>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Anpassbarkeit: Ihr Modell, Ihre Regeln<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Einer der gr\u00f6\u00dften Vorteile von Open-Source-Modellen ist die M\u00f6glichkeit, sie an eigene Bed\u00fcrfnisse anzupassen. Gemma 4 bildet hier keine Ausnahme. Die Anpassbarkeit ist auf mehreren Ebenen gegeben:<\/p>\n\n\n\n<ol start=\"1\" class=\"wp-block-list\">\n<li><strong>Feintuning:<\/strong>\u00a0Dank der offenen Lizenz k\u00f6nnen Sie die Modelle mit Ihren eigenen Daten nachtrainieren. Tools wie\u00a0<strong>Unsloth<\/strong>\u00a0und\u00a0<strong>LoRA<\/strong>\u00a0erm\u00f6glichen ein effizientes Feintuning sogar auf einer einzelnen Consumer-GPU (z.\u202fB. RTX 3090\/4090) in wenigen Minuten.<\/li>\n\n\n\n<li><strong>Quantisierung:<\/strong>\u00a0F\u00fcr den Einsatz auf ressourcenbeschr\u00e4nkter Hardware k\u00f6nnen die Modelle in niedrigeren Pr\u00e4zisionen (z.\u202fB. 4-Bit) betrieben werden. Dies reduziert den Speicherbedarf drastisch (z.\u202fB. von 62 GB auf 17-20 GB f\u00fcr das 31B-Modell).<\/li>\n\n\n\n<li><strong>System-Prompts:<\/strong>\u00a0Die native Unterst\u00fctzung von System-Prompts erlaubt eine pr\u00e4zise Steuerung des Modellverhaltens, ohne dass das Kernmodell ver\u00e4ndert werden muss.<\/li>\n<\/ol>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p class=\"wp-block-paragraph\"><strong>Realistische Einsch\u00e4tzung:<\/strong>&nbsp;Feintuning ist kein Zaubertrick. Es kann die Modellleistung in spezifischen Dom\u00e4nen (z.\u202fB. Kundenservice, medizinische Dokumentation, Firmen-Stil) deutlich verbessern. Es wird jedoch kein schlecht trainiertes Modell retten und ben\u00f6tigt saubere, repr\u00e4sentative Trainingsdaten.<\/p>\n<\/blockquote>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Lokale Ausf\u00fchrung: So kommen Sie an Ihr eigenes KI-Modell<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Die Installation von Gemma 4 ist \u00fcberraschend einfach geworden. Hier eine kurze \u00dcbersicht der g\u00e4ngigsten Methoden:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><thead><tr><th class=\"has-text-align-left\" data-align=\"left\">Methode<\/th><th class=\"has-text-align-left\" data-align=\"left\">Plattform<\/th><th class=\"has-text-align-left\" data-align=\"left\">Hardware-Anforderung (4-Bit quantisiert)<\/th><th class=\"has-text-align-left\" data-align=\"left\">Komplexit\u00e4t<\/th><\/tr><\/thead><tbody><tr><td><strong>Ollama<\/strong><\/td><td>Windows, macOS, Linux<\/td><td>E2B: 4-6 GB VRAM<br>E4B: 6-8 GB VRAM<br>26B: 16-18 GB VRAM<br>31B: 17-20 GB VRAM<\/td><td>Gering (Einzeiler)<\/td><\/tr><tr><td><strong>llama.cpp<\/strong><\/td><td>Plattformunabh\u00e4ngig<\/td><td>Wie oben, plus CPU-Fallback<\/td><td>Mittel<\/td><\/tr><tr><td><strong>MLX<\/strong><\/td><td>macOS (Apple Silicon)<\/td><td>Optimiert f\u00fcr Apple Silicon<\/td><td>Mittel<\/td><\/tr><tr><td><strong>AICore (Android)<\/strong><\/td><td>Android (Pixel-Ger\u00e4te)<\/td><td>Integriert im System<\/td><td>Gering (f\u00fcr Entwickler)<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Beispiel mit Ollama (empfohlen f\u00fcr Einsteiger):<\/strong><\/p>\n\n\n\n<p class=\"wp-block-paragraph\">bash<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\"><em># Ollama installieren (macOS\/Linux)<\/em>\ncurl -fsSL https:\/\/ollama.com\/install.sh | sh\n\n<em># Gemma 4 E4B starten (ca. 6-8 GB VRAM)<\/em>\nollama run gemma4:4b\n\n<em># F\u00fcr das 31B-Modell (ben\u00f6tigt leistungsstarke GPU)<\/em>\nollama run gemma4:31b<\/pre>\n\n\n\n<p class=\"wp-block-paragraph\">Die Modelle laufen komplett offline. Keine Internetverbindung, kein API-Key, keine Kosten. Die Antwortgeschwindigkeit h\u00e4ngt von Ihrer Hardware ab \u2013 auf einem aktuellen Smartphone erhalten Sie Antworten in Sekundenbruchteilen.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Fazit und Ausblick: Die lokale KI-Revolution ist da<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Gemma 4 markiert einen Wendepunkt in der Geschichte der k\u00fcnstlichen Intelligenz. Zum ersten Mal steht eine KI mit Spitzenleistung der \u00d6ffentlichkeit zur Verf\u00fcgung \u2013 nicht als teurer Cloud-Dienst, sondern als lokale, private, anpassbare L\u00f6sung.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Was bedeutet das f\u00fcr wen?<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>F\u00fcr Privatanwender:<\/strong>\u00a0Ihre pers\u00f6nliche KI-Assistentin auf dem Smartphone, die ohne Cloud funktioniert. Datenschutz ist nicht l\u00e4nger ein Feature, sondern der Standard.<\/li>\n\n\n\n<li><strong>F\u00fcr Entwickler:<\/strong>\u00a0Die Freiheit, KI-Anwendungen zu bauen, ohne sich um API-Kosten, Ratenbegrenzungen oder Vendor Lock-in sorgen zu m\u00fcssen. Feintuning und individuelle Anpassung sind keine Hexenwerke mehr.<\/li>\n\n\n\n<li><strong>F\u00fcr Unternehmen:<\/strong>\u00a0Volle Kontrolle \u00fcber die KI-Infrastruktur, Compliance mit Datenschutzbestimmungen und die M\u00f6glichkeit, eigene, spezialisierte Modelle auf Standardhardware zu betreiben.<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Die Zukunft der KI liegt nicht l\u00e4nger ausschlie\u00dflich in der Cloud \u2013 sie liegt in Ihrer Hosentasche, auf Ihrem Schreibtisch und in Ihren H\u00e4nden. Google hat mit Gemma 4 den Grundstein daf\u00fcr gelegt. Jetzt liegt es an der Community, das volle Potenzial zu heben.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Quellen<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Google DeepMind (2026).<\/strong>\u00a0<em>Gemma 4: Byte for byte, the most capable open models.<\/em>\u00a0Google AI Blog. Verf\u00fcgbar unter:\u00a0<a href=\"https:\/\/blog.google\/innovation-and-ai\/technology\/developers-tools\/gemma-4\/\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/blog.google\/innovation-and-ai\/technology\/developers-tools\/gemma-4\/<\/a>\u00a0(Abgerufen: 07.04.2026).<\/li>\n\n\n\n<li><strong>Google DeepMind (2026).<\/strong>\u00a0<em>Gemma 4 \u2013 Model Overview.<\/em>\u00a0Verf\u00fcgbar unter:\u00a0<a href=\"https:\/\/deepmind.google\/models\/gemma\/gemma-4\/\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/deepmind.google\/models\/gemma\/gemma-4\/<\/a>\u00a0(Abgerufen: 07.04.2026).<\/li>\n\n\n\n<li><strong>Google AI for Developers (2026).<\/strong>\u00a0*Gemma 4-Modelle \u2013 \u00dcbersicht.*\u00a0Verf\u00fcgbar unter:\u00a0<a href=\"https:\/\/ai.google.dev\/gemma\/docs\/core?hl=de\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/ai.google.dev\/gemma\/docs\/core?hl=de<\/a>\u00a0(Abgerufen: 07.04.2026).<\/li>\n\n\n\n<li><strong>IT Brief Australia (2026).<\/strong>\u00a0<em>Google launches Gemma 4 open AI models for devices.<\/em>\u00a0Verf\u00fcgbar unter:\u00a0<a href=\"https:\/\/itbrief.com.au\/story\/google-launches-gemma-4-open-ai-models-for-devices\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/itbrief.com.au\/story\/google-launches-gemma-4-open-ai-models-for-devices<\/a>\u00a0(Abgerufen: 07.04.2026).<\/li>\n\n\n\n<li><strong>Frandroid (2026).<\/strong>\u00a0<em>Multimodal, surpuissant et 100 % gratuit : voici Google Gemma 4.<\/em>\u00a0Verf\u00fcgbar unter:\u00a0<a href=\"https:\/\/www.frandroid.com\/culture-tech\/intelligence-artificielle\/google-gemini\/3051319_google-lance-gemma-4-un-modele-open-source-voici-comment-lessayer-sur-votre-pc-ou-votre-mac\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/www.frandroid.com\/culture-tech\/intelligence-artificielle\/google-gemini\/3051319_google-lance-gemma-4-un-modele-open-source-voici-comment-lessayer-sur-votre-pc-ou-votre-mac<\/a>\u00a0(Abgerufen: 07.04.2026).<\/li>\n\n\n\n<li><strong>Hugging Face (2026).<\/strong>\u00a0*google\/gemma-4-26B-A4B \u2013 Model Card.*\u00a0Verf\u00fcgbar unter:\u00a0<a href=\"https:\/\/huggingface.co\/google\/gemma-4-26B-A4B\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/huggingface.co\/google\/gemma-4-26B-A4B<\/a>\u00a0(Abgerufen: 07.04.2026).<\/li>\n\n\n\n<li><strong>Unsloth AI (2026).<\/strong>\u00a0<em>Gemma 4 \u2013 How to Run Locally.<\/em>\u00a0Verf\u00fcgbar unter:\u00a0<a href=\"https:\/\/unsloth.ai\/docs\/models\/gemma-4\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/unsloth.ai\/docs\/models\/gemma-4<\/a>\u00a0(Abgerufen: 07.04.2026).<\/li>\n\n\n\n<li><strong>DataCamp (2026).<\/strong>\u00a0*How to Fine-Tune Gemma 4: A Full Walkthrough.*\u00a0Verf\u00fcgbar unter:\u00a0<a href=\"https:\/\/www.datacamp.com\/tutorial\/fine-tune-gemma-4\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/www.datacamp.com\/tutorial\/fine-tune-gemma-4<\/a>\u00a0(Abgerufen: 07.04.2026).<\/li>\n\n\n\n<li><strong>Mashable (2026).<\/strong>\u00a0*Google launches open-source model Gemma 4: How to try it.*\u00a0Verf\u00fcgbar unter:\u00a0<a href=\"https:\/\/mashable.com\/article\/google-releases-gemma-4-open-ai-model-now-open-source-how-to-try-it\" target=\"_blank\" rel=\"noreferrer noopener\">https:\/\/mashable.com\/article\/google-releases-gemma-4-open-ai-model-now-open-source-how-to-try-it<\/a>\u00a0(Abgerufen: 07.04.2026).<\/li>\n<\/ul>","protected":false},"excerpt":{"rendered":"<p>von DerSchneider Einleitung: Der KI-Klopapier-Vergleich Wir erinnern uns: Vor wenigen Jahren war der Gang in die Cloud f\u00fcr jede KI-Abfrage noch alternativlos. Die Modelle waren riesig, die Rechenanforderungen gewaltig, und ohne stabile Internetverbindung war man aufgeschmissen. Heute, im Jahr 2026, hat sich das Blatt gewendet. Google hat mit&nbsp;Gemma 4&nbsp;eine Familie von vier Open-Source-KI-Modellen vorgestellt, die [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[19,46,26,32],"tags":[265,475,1889,2683,4199,5107,5755],"class_list":["post-3204","post","type-post","status-publish","format-standard","hentry","category-im-ruckspiegel","category-industrie-4-0","category-mit-den-handen","category-techarchaologie","tag-agentic-workflows","tag-apache-2-0","tag-edge-ai","tag-gemma-4","tag-lokale-ki","tag-open-source","tag-reasoning"],"_links":{"self":[{"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/posts\/3204","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/comments?post=3204"}],"version-history":[{"count":0,"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/posts\/3204\/revisions"}],"wp:attachment":[{"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/media?parent=3204"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/categories?post=3204"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/tags?post=3204"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}