{"id":4486,"date":"2026-05-04T15:07:22","date_gmt":"2026-05-04T13:07:22","guid":{"rendered":"https:\/\/g7itchme.wordpress.com\/?p=4486"},"modified":"2026-05-04T15:07:22","modified_gmt":"2026-05-04T13:07:22","slug":"sieben-zwerge-ein-assistent-wie-verteilte-esp32-systeme-die-personliche-ki-neu-definieren","status":"publish","type":"post","link":"https:\/\/technodidact.de\/en\/sieben-zwerge-ein-assistent-wie-verteilte-esp32-systeme-die-personliche-ki-neu-definieren\/","title":{"rendered":"Sieben Zwerge, ein Assistent: Wie verteilte ESP32-Systeme die pers\u00f6nliche KI neu definieren"},"content":{"rendered":"<p class=\"wp-block-paragraph\"><strong>Autor:<\/strong>&nbsp;DerSchneider<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Einleitung<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Es klingt nach dem Beginn eines M\u00e4rchens: Sieben Mikrocontroller, ein Mikrofon, ein Lautsprecher, ein Drehgeber und ein kleines Display \u2013 zusammengesteckt zu einem Sprachassistenten, der nicht nur auf \u201eHey Zwergi\u201c h\u00f6rt, sondern auch die Stimmung seines Gegen\u00fcbers erkennt. Was auf den ersten Blick wie ein Bastelprojekt f\u00fcr Elektronik-Enthusiasten wirkt, ber\u00fchrt tiefgreifende Fragen der modernen Digitalkultur: Wie viel Intelligenz braucht ein Ger\u00e4t wirklich? Wo liegt die Grenze zwischen hilfreicher Personalisierung und manipulativer Emotionerkennung? Und ist ein dezentrales System aus sieben g\u00fcnstigen Mikrocontrollern nicht vielleicht die nachhaltigere Alternative zu den monolithischen Cloud-Assistenten der gro\u00dfen Tech-Konzerne?<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Dieser Artikel beleuchtet ein konkretes Projekt \u2013 den Bau eines verteilten, sprachgesteuerten KI-Assistenten auf Basis von sieben ESP32-Boards \u2013 und zieht daraus weiterf\u00fchrende Schl\u00fcsse f\u00fcr die Entwicklungsgeschichte der Mensch-Maschine-Interaktion, die technischen Herausforderungen von TinyML und die ethischen Implikationen emotionserkennender Algorithmen.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Hauptteil<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">1. Historische Entwicklung: Von der Zentralmaschine zum Schwarm<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Die ersten kommerziellen Sprachassistenten \u2013 Amazons Alexa (2014), Google Assistant (2016) \u2013 waren Kind ihrer Zeit: Sie verlagerten die gesamte Sprachverarbeitung in die Cloud. Das Endger\u00e4t diente nur als akustisches Ein-\/Ausgabetor. Diese Architektur brachte enorme Rechenleistung, aber auch Abh\u00e4ngigkeiten von Internetverbindungen, Latenzen und zentralen Datenkraken mit sich.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Mit dem Aufkommen von Mikrocontrollern wie dem ESP32 (Espressif Systems, 2016), der neben WLAN und Bluetooth auch ausreichend Rechenleistung f\u00fcr einfache neuronale Netze bietet, entstand die M\u00f6glichkeit,&nbsp;<strong>Edge AI<\/strong>&nbsp;\u2013 also die Verarbeitung direkt auf dem Ger\u00e4t \u2013 zu realisieren. TensorFlow Lite Micro, erstmals 2019 von Google vorgestellt, erm\u00f6glicht es, Modelle mit wenigen hundert Kilobyte auf Mikrocontrollern laufen zu lassen. Gleichzeitig er\u00f6ffnete die extreme Kostenreduktion (ein ESP32 kostet unter 5 \u20ac) den Weg zu&nbsp;<strong>verteilten Systemen<\/strong>: Mehrere spezialisierte Einheiten arbeiten zusammen, statt alles in einem leistungsstarken, teuren Chip zu b\u00fcndeln.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Das hier vorgestellte System mit sieben Boards f\u00fchrt diesen Gedanken radikal zu Ende. Es erinnert an die fr\u00fchen Mehrrechner-Systeme der 1970er Jahre, allerdings mit einem entscheidenden Unterschied: Heute kommunizieren die Einheiten \u00fcber einfache Zweidraht-Busse (I\u00b2C) und k\u00f6nnen individuell trainiert werden.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">2. Architektur des 7\u2011Board-Systems \u2013 Arbeitsteilung nach dem Schwarmprinzip<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Jedes der sieben ESP32-Boards \u00fcbernimmt eine klar abgegrenzte Aufgabe. Dies reduziert die Komplexit\u00e4t des Einzelcodes, erh\u00f6ht die Ausfallsicherheit und erm\u00f6glicht einen modularen Aufbau. Die folgende Tabelle fasst die Verteilung zusammen:<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table class=\"has-fixed-layout\"><thead><tr><th class=\"has-text-align-left\" data-align=\"left\">Board<\/th><th class=\"has-text-align-left\" data-align=\"left\">Funktion<\/th><th class=\"has-text-align-left\" data-align=\"left\">Hardware<\/th><th class=\"has-text-align-left\" data-align=\"left\">I\u00b2C-Adresse<\/th><\/tr><\/thead><tbody><tr><td>1<\/td><td>Wake\u2011Word\u2011Erkennung<\/td><td>I\u00b2S\u2011Mikrofon (INMP441)<\/td><td>0x10<\/td><\/tr><tr><td>2<\/td><td>Emotionserkennung<\/td><td>\u2013 (Audio\u2011Daten von Board 1)<\/td><td>0x11<\/td><\/tr><tr><td>3<\/td><td>Cloud\u2011Kommunikation<\/td><td>WiFi<\/td><td>0x12<\/td><\/tr><tr><td>4<\/td><td>KI\u2011Interaktion (Prompt + API)<\/td><td>\u2013<\/td><td>0x13<\/td><\/tr><tr><td>5<\/td><td>Sprachausgabe (TTS)<\/td><td>I\u00b2S\u2011Verst\u00e4rker + Lautsprecher<\/td><td>0x14<\/td><\/tr><tr><td>6<\/td><td>Display &amp; Encoder\u2011UI<\/td><td>OLED (SSD1306), Drehencoder<\/td><td>0x15<\/td><\/tr><tr><td>7<\/td><td>Datenmanagement<\/td><td>SPI\u2011Flash, SD\u2011Karte<\/td><td>0x16<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Vorteile dieser Aufteilung:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Fehlertoleranz:<\/strong>\u00a0F\u00e4llt Board 3 aus, k\u00f6nnen zumindest Offline\u2011Befehle weiterverarbeitet werden.<\/li>\n\n\n\n<li><strong>Skalierbarkeit:<\/strong>\u00a0Weitere Sensoren (z.\u202fB. Temperatur, Luftfeuchte) lassen sich als zus\u00e4tzliche Boards anbinden.<\/li>\n\n\n\n<li><strong>Wartbarkeit:<\/strong>\u00a0Ein Software\u2011Update f\u00fcr die Emotionserkennung ber\u00fchrt nicht den Wake\u2011Word\u2011Code.<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Herausforderung:<\/strong>&nbsp;Die Kommunikation \u00fcber den gemeinsamen I\u00b2C\u2011Bus (Standard: 100 kHz, maximal 3,4 MHz) kann bei gleichzeitigen Anfragen zum Flaschenhals werden. Im Projekt werden daher kurze Steuerbefehle (wenige Bytes) \u00fcber I\u00b2C gesendet, w\u00e4hrend Audio\u2011Rohdaten (z.\u202fB. f\u00fcr die Emotionserkennung) besser \u00fcber einen separaten SPI\u2011Bus oder per UART \u00fcbertragen werden. Eine echte Echtzeit\u2011Sprachverarbeitung \u00fcber reinen I\u00b2C w\u00e4re nicht m\u00f6glich.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">3. Funktion 1: Wake\u2011Word\u2011Erkennung mit TensorFlow Lite Micro<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Das \u201eAufwecken\u201c des Assistenten ohne st\u00e4ndige Cloud\u2011Verbindung ist ein klassischer Anwendungsfall f\u00fcr lokal laufende neuronale Netze auf Mikrocontrollern. Das Trainieren eines eigenen Wake\u2011Worts wie \u201eHey Zwergi\u201c erfolgt typischerweise mit&nbsp;<strong>Edge Impulse<\/strong>&nbsp;oder dem&nbsp;<strong>TensorFlow Wake\u2011Word Dataset<\/strong>&nbsp;(eine Sammlung von zw\u00f6lf Schl\u00fcsselw\u00f6rtern). Das resultierende Modell ist ein konvolutionales neuronales Netz (CNN) mit wenigen Layern, das auf einem ESP32 in weniger als 50 ms eine Inferenz durchf\u00fchrt.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Technische Kenndaten:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Modellgr\u00f6\u00dfe: ca. 30\u202fkB (quantisiert, int8)<\/li>\n\n\n\n<li>RAM\u2011Bedarf: ~10\u202fkB<\/li>\n\n\n\n<li>Erkennungsrate: &gt;90\u202f% bei ruhiger Umgebung, sinkt auf ~70\u202f% bei hohem St\u00f6rger\u00e4usch<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Die Schwelle f\u00fcr eine Ausl\u00f6sung (klassisch 0,8) l\u00e4sst sich \u00fcber das Drehencoder\u2011Men\u00fc (Board 6) dynamisch anpassen \u2013 ein Feature, das bei kommerziellen Produkten oft fehlt. Kritisch zu sehen ist die&nbsp;<strong>unvermeidbare False\u2011Positive\u2011Rate<\/strong>: Ungef\u00e4hr alle 20 Minuten l\u00f6st ein Hintergrundger\u00e4usch (z.\u202fB. ein Husten) f\u00e4lschlich das Wake\u2011Word aus. Im Projekt wird deshalb eine zus\u00e4tzliche \u201eAbklingzeit\u201c von drei Sekunden eingef\u00fchrt \u2013 ein pragmatischer Kompromiss.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">4. Funktion 2: Multimodale Interaktion \u2013 Der Wert haptischer R\u00fcckmeldung<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Warum ein Drehencoder und Taster, wo man doch einfach sprechen kann? Die Antwort liegt in der&nbsp;<strong>redundanten Bedienbarkeit<\/strong>. In lauten Umgebungen (K\u00fcche, Werkstatt) oder bei akuten Sprachproblemen (Heiserkeit, soziale Hemmung) bieten physische Eingaben eine robuste Alternative. Zudem erlaubt ein Encoder eine&nbsp;<strong>pr\u00e4zise, stufenlose Regelung<\/strong>&nbsp;(z.\u202fB. Lautst\u00e4rke, Kontext-Men\u00fcs) \u2013 etwas, das Sprachbefehle nur mit mehreren aufeinanderfolgenden Kommandos erreichen.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Die Implementierung auf Board 6 nutzt eine ESP32Encoder\u2011Bibliothek, die die beiden Phasensignale des EC11\u2011Drehencoders auswertet. Das OLED\u2011Display zeigt dabei nicht nur den Status (\u201eWake\u2011Word erkannt\u201c, \u201eEmotion = fr\u00f6hlich\u201c), sondern auch ein einfaches Einstellungsmen\u00fc:<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">text<\/p>\n\n\n\n<pre class=\"wp-block-preformatted\">&gt; Lautst\u00e4rke: 70%\n   Empfindlichkeit: 0,8\n   Prompt \u00e4ndern\n   Chatverlauf l\u00f6schen<\/pre>\n\n\n\n<p class=\"wp-block-paragraph\">Diese&nbsp;<strong>asynchrone Steuerung<\/strong>&nbsp;entkoppelt die Interaktion von der Sprach\u2011KI \u2013 ein gro\u00dfer Gewinn an Benutzerfreundlichkeit.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">5. Funktion 3: Emotionserkennung in der Sprache \u2013 Segen oder \u00dcbergriff?<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Die dritte Erweiterung ist die ambitionierteste und zugleich fragw\u00fcrdigste: Das System analysiert prosodische Merkmale der Stimme (Tonh\u00f6he, Sprechgeschwindigkeit, Energieverteilung) und ordnet sie einer von vier Grundemotionen zu: neutral, fr\u00f6hlich, traurig, w\u00fctend. Technisch wird dies typischerweise mit&nbsp;<strong>MFCC\u2011Features<\/strong>&nbsp;(Mel Frequency Cepstral Coefficients) und einem kleinen Random\u2011Forest\u2011 oder neuronalen Netz realisiert. Die Genauigkeit liegt in kontrollierten Tests (z.\u202fB. mit dem Berliner EMODB-Datensatz, 2007) bei etwa 75\u202f%, in freier Wildbahn oft unter 60\u202f%.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Damit verbundene Probleme:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Kulturelle Abh\u00e4ngigkeit:<\/strong>\u00a0Tonlage und Ausdrucksweise variieren stark zwischen Sprachen und sozialen Gruppen. Ein auf deutsche Standardsprache trainiertes Modell versagt bei Dialekten oder Menschen mit Sprechst\u00f6rungen.<\/li>\n\n\n\n<li><strong>Datenschutz:<\/strong>\u00a0Emotionen gelten als besonders sch\u00fctzenswerte biometrische Daten (Art. 9 DSGVO). Das Speichern von Emotionslabels auf Board 7 (zusammen mit der Chat\u2011Historie) k\u00f6nnte rechtswidrig sein, wenn keine explizite Einwilligung vorliegt.<\/li>\n\n\n\n<li><strong>Selbsterf\u00fcllende Prophezeiung:<\/strong>\u00a0Ein System, das \u201eWut\u201c erkennt, k\u00f6nnte defensiv oder unterw\u00fcrfig antworten \u2013 und so die emotionale Lage des Nutzers weiter verschlechtern.<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Die Entwickler des hier beschriebenen Projekts sehen die Emotionserkennung daher weniger als diagnostisches Werkzeug, sondern als&nbsp;<strong>experimentelle Spielwiese<\/strong>, um \u00fcber die ethischen Grenzen von KI zu reflektieren. Ein differenzierter Ansatz w\u00e4re, die erkannte Emotion lediglich als nichtspeicherbaren Hinweis f\u00fcr die Prompt\u2011Generierung zu nutzen, ohne sie jemals aufzuzeichnen.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">6. Kommunikation \u00fcber I\u00b2C \u2013 Der Bus als zentraler Nerv<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Die sieben Boards tauschen sich \u00fcber einen gemeinsamen I\u00b2C\u2011Bus aus. Jedes Board hat eine feste Adresse (0x10 \u2026 0x16). Das Protokoll ist minimalistisch: Ein Byte Befehlscode, gefolgt von bis zu 32 Datenbytes. Diese Schlichtheit macht den Bus robust, aber auch langsam. F\u00fcr den hier vorgesehenen Datenaustausch \u2013 Steuerbefehle, kurze Textstrings, Emotions\u2011Labels \u2013 ist das v\u00f6llig ausreichend. Die \u00dcbertragung eines zwanzigstelligen Satzes (20 Byte) dauert bei 100 kHz etwa 2\u202fms \u2013 vernachl\u00e4ssigbar im Vergleich zu den 200\u202fms Latenz einer Cloud\u2011KI.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Kritische Betrachtung:<\/strong>&nbsp;Sobald man jedoch Audio\u2011Rohdaten (z.\u202fB. f\u00fcr eine direkte Wake\u2011Word\u2011Weitergabe an Board 2) \u00fcber I\u00b2C schicken wollte, w\u00e4re die Bandbreite (max. 400\u202fkBit\/s im Fast\u2011Mode) schnell ersch\u00f6pft. Aus diesem Grund bleibt die Audio\u2011Erfassung ausschlie\u00dflich Board 1 vorbehalten; Board 2 erh\u00e4lt nur bereits extrahierte Merkmalsvektoren (z.\u202fB. 20 MFCCs pro Frame). Das ist ein gutes Beispiel f\u00fcr&nbsp;<strong>Signaltransformation an der Quelle<\/strong>&nbsp;\u2013 ein wichtiges Prinzip verteilter Systeme.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">7. Kontroversen und ethische Abw\u00e4gungen<\/h3>\n\n\n\n<p class=\"wp-block-paragraph\">Das Projekt wirft drei zentrale Kontroversen auf:<\/p>\n\n\n\n<ol start=\"1\" class=\"wp-block-list\">\n<li><strong>Cloud\u2011Abh\u00e4ngigkeit vs. Offline\u2011F\u00e4higkeit<\/strong><br>Die Cloud\u2011Kommunikation (Board 3) ist f\u00fcr die Nutzung gro\u00dfer Sprachmodelle (wie DeepSeek-V3 oder GPT) unerl\u00e4sslich. Allein die Auslagerung von Sprachdaten in fremde Rechenzentren ist datenschutzrechtlich bedenklich. Ein echter Offline\u2011Betrieb ist nur f\u00fcr triviale Antworten (\u201eUhrzeit\u201c, \u201eLicht an\u201c) mit winzigen TinyML\u2011Modellen m\u00f6glich. Der Kompromiss: nur die finale Textanfrage \u2013 nicht die Rohaufnahme \u2013 wird in die Cloud gesendet.<\/li>\n\n\n\n<li><strong>Hardware\u2011Overkill?<\/strong><br>Sieben separate ESP32 verbrauchen mehr Energie (pro Board ~80\u202fmA im aktiven Modus) und Platz als ein einzelner leistungsf\u00e4higerer Chip (z.\u202fB. Raspberry Pi Zero 2 W). Der Vorteil ist die\u00a0<strong>didaktische Klarheit<\/strong>: Jede Funktion ist physisch getrennt, Studenten und Hobbyisten k\u00f6nnen einzelne Module austauschen oder verbessern, ohne das Gesamtsystem zu gef\u00e4hrden.<\/li>\n\n\n\n<li><strong>Emotionserkennung als manipulatives Werkzeug<\/strong><br>Selbst eine fehlerhafte Erkennung kann schwerwiegende Folgen haben. Ein Kind, dessen Traurigkeit nicht erkannt wird, f\u00fchlt sich m\u00f6glicherweise noch unverstandener. Ein System, das auf \u201efr\u00f6hlich\u201c trainiert ist, k\u00f6nnte unangemessen heitere Antworten auf ernste Fragen geben. Die Entwickler betonen daher: Die Emotionserkennung dient ausschlie\u00dflich der\u00a0<strong>Forschung und Selbstreflexion<\/strong>, nicht als Produktmerkmal.<\/li>\n<\/ol>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Fazit und Ausblick<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Die sieben ESP32\u2011Boards, verbunden durch einen einfachen I\u00b2C\u2011Draht, demonstrieren eindrucksvoll, dass leistungsf\u00e4hige, personalisierte Sprachassistenten nicht nur in den H\u00e4nden gro\u00dfer Konzerne liegen m\u00fcssen. Die gezeigten Funktionen \u2013 Wake\u2011Word, multimodale Bedienung und Emotionserkennung \u2013 sind mit \u00fcberschaubarem Aufwand realisierbar und bieten gleichzeitig reichhaltiges Material f\u00fcr technikethische Diskussionen.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><strong>Zuk\u00fcnftige Entwicklungen k\u00f6nnten sein:<\/strong><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Verwendung von ESP\u2011Now<\/strong>\u00a0(einem peering\u2011f\u00e4higen Protokoll) f\u00fcr eine latenz\u00e4rmere Kommunikation zwischen den Boards.<\/li>\n\n\n\n<li><strong>Integration von On\u2011Device\u2011Transkription<\/strong>\u00a0(Whisper.cpp f\u00fcr ESP32 \u2013 ein hei\u00dfes Forschungsfeld, derzeit noch zu rechenintensiv).<\/li>\n\n\n\n<li><strong>Erweiterung um ein federated learning<\/strong>\u00a0\u2013 jedes Board trainiert sein Wake\u2011Word lokal, nur die Gewichtsaktualisierungen werden gelegentlich geb\u00fcndelt abgeglichen.<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Das Projekt lebt von seinem&nbsp;<strong>Prototyp\u2011Charakter<\/strong>. Es ist nicht daf\u00fcr gedacht, Alexa zu besiegen, sondern zu zeigen, wie offene Hardware, TinyML und ein bisschen Improvisationsgeist zusammenwirken k\u00f6nnen. Gerade in Zeiten zunehmender \u201eBlack\u2011Box\u201c-Assistenten ist es erfrischend, die Dr\u00e4hte selbst zu ziehen und die Entscheidungslogik des Zwergen\u2011Teams nachvollziehen zu k\u00f6nnen.<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" \/>\n\n\n\n<h2 class=\"wp-block-heading\">Quellen<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Espressif Systems (2024).\u00a0<em>ESP32\u2011Series Technical Reference Manual<\/em>. Online abrufbar.<\/li>\n\n\n\n<li>Google (2019).\u00a0<em>TensorFlow Lite Micro for Microcontrollers<\/em>. Dokumentation.<\/li>\n\n\n\n<li>Edge Impulse (2022).\u00a0<em>Wake\u2011Word Spotting with Edge Impulse<\/em>. Dokumentation.<\/li>\n\n\n\n<li>Burkhardt, F., Paeschke, A., Rolfes, M., Sendlmeier, W. &amp; Weiss, B. (2007).\u00a0<em>A Database of German Emotional Speech<\/em>. In: Proc. Interspeech, S. 1517\u20131520. (EMO\u2011DB)<\/li>\n\n\n\n<li>Schuller, B., Batliner, A., Bergler, C. &amp; Messner, E. (2018).\u00a0<em>Paralinguistic Speech Processing: An Overview<\/em>. IEEE Signal Processing Magazine, 35(1), 19\u201331.<\/li>\n\n\n\n<li>Verordnung (EU) 2016\/679 (DSGVO), Art. 9 \u2013 Verarbeitung besonderer Kategorien personenbezogener Daten.<\/li>\n<\/ul>","protected":false},"excerpt":{"rendered":"<p>Autor:&nbsp;DerSchneider Einleitung Es klingt nach dem Beginn eines M\u00e4rchens: Sieben Mikrocontroller, ein Mikrofon, ein Lautsprecher, ein Drehgeber und ein kleines Display \u2013 zusammengesteckt zu einem Sprachassistenten, der nicht nur auf \u201eHey Zwergi\u201c h\u00f6rt, sondern auch die Stimmung seines Gegen\u00fcbers erkennt. Was auf den ersten Blick wie ein Bastelprojekt f\u00fcr Elektronik-Enthusiasten wirkt, ber\u00fchrt tiefgreifende Fragen der [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[41,42,17,26],"tags":[2084,2225,4743,6561,7033,7431,7553],"class_list":["post-4486","post","type-post","status-publish","format-standard","hentry","category-digitalkultur","category-elektrotechnik","category-im-herz","category-mit-den-handen","tag-emotionserkennung","tag-esp32","tag-multimodale-interaktion","tag-sprachassistent","tag-tinyml","tag-verteiltes-system","tag-wake-word-erkennung"],"_links":{"self":[{"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/posts\/4486","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/comments?post=4486"}],"version-history":[{"count":0,"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/posts\/4486\/revisions"}],"wp:attachment":[{"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/media?parent=4486"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/categories?post=4486"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/technodidact.de\/en\/wp-json\/wp\/v2\/tags?post=4486"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}