CODEXME – Ein forensischer Bildanalyzer für die digitale Wahrheitssuche – TechnoDidact

Autor: DerSchneider

Einleitung

Wir leben in einer Zeit, in der Bilder nicht mehr glauben, was sie zeigen. Künstlich generierte Deepfakes, KI-manipulierte Porträts und subtil veränderte Beweisfotos stellen Journalisten, Ermittler und Privatpersonen vor nie dagewesene Herausforderungen. Während große Tech-Konzerne an proprietären Lösungen arbeiten, entstehen im Schatten auch kleine, unabhängige Werkzeuge – eines davon heißt CODEXME.

Dieser Artikel stellt das Projekt „CODEXME Forensischer Bild Analyzer“ vor, analysiert seine technischen Grundlagen, zeigt seine Stärken und Grenzen auf und erweitert die ursprüngliche Idee zu einem umfassenderen Konzept für eine offene, lokale Bildforensik-Plattform. Denn eines ist klar: Die Fähigkeit, die Authentizität von Bildern zu prüfen, wird zur Schlüsselkompetenz des digitalen Zeitalters.

1. Was ist CODEXME?

CODEXME ist ein reines Browser-Tool zur forensischen Analyse von Bilddateien. Es wurde als singuläre HTML-Datei entwickelt, die alle benötigten Funktionen (Upload, Analyse, Visualisierung) in einem geschlossenen Frontend bündelt. Der Quellcode ist offen, die Analyse läuft vollständig lokal – kein Bild verlässt den Rechner des Nutzers.

Die aktuelle Version (v4.2) unterstützt folgende Kernfunktionen:

EXIF-Daten-Extraktion (mittels exif-js)
Error Level Analysis (ELA) zur Manipulationserkennung
Heuristische KI-Erkennung (basierend auf Metadaten, Dateinamen und Header-Signaturen)
Hexadezimal-Viewer mit farblicher Markierung von JPEG-Markern, EXIF-Bereichen und Null-Bytes
Schnellanalyse mit Risikobewertung (niedrig/mittel/hoch/kritisch)
Responsive Benutzeroberfläche mit Dark-Theme

Das Projekt versteht sich als nicht-kommerzielle, öffentlich zugängliche Plattform unter der MIT-Lizenz. Es richtet sich an Journalisten, Whistleblower, Aktivisten, aber auch an Privatpersonen, die verdächtige Bilder aus Messengern oder sozialen Netzwerken prüfen möchten.

„Alle Analysen erfolgen 100% lokal im Browser – keine Daten werden an Server übertragen.“
– Aus der Projektbeschreibung von CODEXME

2. Technische Grundlagen und Funktionsweise

Um die Bedeutung des Projekts einzuordnen, ist ein kurzer technischer Exkurs notwendig.

2.1 EXIF – Die digitale Visitenkarte jedes Fotos

Seit den 1990er Jahren speichern Digitalkameras und Smartphones zusätzliche Metadaten in Bilddateien – das Exchangeable Image File Format (EXIF). Darin finden sich Informationen wie Kamera-Modell, Belichtungszeit, Blende, ISO, aber auch GPS-Koordinaten und das genaue Aufnahmedatum.

Fehlen diese Daten oder sind sie inkonsistent, kann das ein Indiz für spätere Bearbeitung oder KI-Generierung sein. Viele KI-Bildgeneratoren (DALL‑E, Midjourney, Stable Diffusion) schreiben standardmäßig keine EXIF-Informationen – ein wichtiger Anhaltspunkt, den CODEXME nutzt.

2.2 Error Level Analysis (ELA) – Sichtbarmachen von Kompressionsunterschieden

Die ELA ist eine bekannte forensische Technik, die ursprünglich von der Wissenschaftlerin Dr. Neal Krawetz (Autor von „Hacker Diet“) populär gemacht wurde. Das Bild wird mit einer festen Qualitätsstufe (z. B. 85 %) neu komprimiert und mit dem Original pixelweise verglichen. Unterschiede werden verstärkt dargestellt.

Dunkle Bereiche → kaum Differenz → wahrscheinlich original
Helle Bereiche → starke Differenz → mögliche Manipulation (z. B. eingefügte Objekte, Retuschen)

CODEXME implementiert eine vereinfachte ELA im Canvas-Element, die auf eine maximale Breite von 800 px skaliert wird – aus Performancegründen, ohne die Aussagekraft wesentlich zu mindern.

2.3 Heuristische KI-Erkennung

Da echte neuronale Netze (wie TensorFlow.js) den Rahmen eines schlanken Browser-Tools sprengen würden, setzt CODEXME auf eine mehrstufige Heuristik:

Fehlende EXIF-Daten – Gewichtung ca. 0,3
Verdächtige Dateinamen (z. B. ai_, generated, dalle) – Gewichtung ca. 0,2
Standard-Seitenverhältnisse (16:9, 3:2, 4:3) – Gewichtung ca. 0,1
String-Matching im Datei-Header (z. B. "stable diffusion") – zusätzliche Gewichtung

Ab einem Schwellwert von 0,5 wird das Bild als „wahrscheinlich KI-generiert“ klassifiziert. Das Verfahren ist nicht perfekt, aber für eine erste, datenschutzfreundliche Einschätzung durchaus brauchbar.

3. Stärken und Schwächen des aktuellen Projekts

Stärken	Schwächen
100% lokal – kein Datentransfer	Keine echte Deep-Learning-basierte Detektion
Open Source (MIT)	ELA nur mit simuliertem Weichzeichnen, nicht echter Rekompression
Einfache Bedienung per Drag & Drop	Heuristische KI-Erkennung kann fehlschlagen
Funktioniert offline (nach einmaligem Laden)	Keine Batch-Verarbeitung
Plattformunabhängig (Browser)	Keine Reverse-Image-Suche

Trotz der Einschränkungen ist CODEXME ein wertvoller Prototyp, der zeigt, wie lokale Forensik ohne Cloud-Zwang aussehen kann.

4. Erweiterung der Idee – Vorschläge für CODEXME 5.0

Aus dem bestehenden Code und den diskutierten Problemen lassen sich mehrere strategische Erweiterungen ableiten, die das Tool zu einer echten professionellen Alternative machen könnten.

4.1 Integration von TensorFlow.js für echte KI-Modelle

Leichte vortrainierte Modelle wie MesoNet (für Deepfake-Gesichtserkennung) oder DCT-based Detectors (für JPEG-Double-Compression) lassen sich mit TensorFlow.js in der Browser-Umgebung ausführen. Der Performance-Aufwand ist tragbar, wenn man die Modelle auf 224×224 Pixel skaliert.

4.2 Erweiterte ELA mit echter JPEG-Rekompression

Statt eines einfachen Weichzeichners könnte man ein temporäres Canvas erzeugen, das Bild als JPEG mit definierter Qualität exportieren und wieder einlesen – das ist der eigentliche ELA-Algorithmus. Dies ist in JavaScript umsetzbar, allerdings rechenintensiv. Ein Web Worker würde die UI nicht blockieren.

4.3 Verbundene Suche (Reverse Image Search) über APIs

Optional könnte man eine anonymisierte Suchfunktion anbieten, die einen Hash des Bildes (z. B. Perceptual Hash) an öffentliche Dienste wie TinEye oder Google Reverse Image Search sendet – selbstverständlich nur nach ausdrücklicher Zustimmung des Nutzers. Datenschutzrechtlich heikel, aber für Investigativ-Journalisten oft unverzichtbar.

4.4 Batch-Analyse und Berichtsgenerierung

Ein oft geäußerter Wunsch aus der Community: das gleichzeitige Untersuchen mehrerer Bilder (z. B. ein ganzer WhatsApp-Chat-Export). Dazu könnte CODEXME eine Stapelverarbeitung mit Fortschrittsbalken und einem zusammenfassenden CSV/PDF-Report erhalten.

4.5 Erweiterte Metadaten-Analyse

Neben EXIF sollten auch XMP (Adobe erweiterte Metadaten), IPTC (Presse-Standard) und ICC-Profile ausgelesen werden. Die Bibliothek exifr kann dies besser als das veraltete exif-js. Ein Wechsel wäre sinnvoll.

4.6 Add-on-System für Community-Entwickler

Um das Projekt lebendig zu halten, könnte man ein einfaches Plugin-System schaffen: Jeder kann eigene Detektoren (z. B. für spezifische Kamera-Rauschprofile) in JavaScript schreiben und über einen „Community-Marktplatz“ integrieren.

5. Gesellschaftliche Einordnung – Warum solche Tools notwendig sind

Die Manipulation von Bildern ist kein Phänomen der digitalen Moderne. Bereits im 19. Jahrhundert wurden Fotografien retuschiert – Stalin ließ aus politischen Gründen Menschen aus Porträts entfernen. Der Unterschied heute liegt in der Skalierbarkeit: Mit KI können in Sekunden tausende täuschend echte Bilder erzeugt werden.

„Wir nähern uns dem Punkt, an dem kein Bild mehr als Beweis taugt, ohne dass seine Herkunft kryptografisch gesichert ist.“
– Hany Farid, Professor für digitale Forensik an der UC Berkeley

Die Content Authenticity Initiative (CAI) von Adobe, Microsoft und Twitter versucht, mit kryptografischen Signaturen Abhilfe zu schaffen. Doch die Verbreitung dieser Standards ist schleppend. Bis sie flächendeckend wirken, bleiben Werkzeuge wie CODEXME eine wichtige Bastion der Infodemie-Bekämpfung.

6. Fazit und Ausblick

CODEXME ist mehr als ein weiteres Forensik-Tool. Es ist ein Statement für digitale Souveränität – ein funktionierendes, transparentes und kostenloses Gegenmittel gegen die Flut ungeprüfter Bildbehauptungen. In seiner aktuellen Form ist es ein exzellenter Einstieg für Laien und ein brauchbares Vorab-Werkzeug für Profis.

Mit den vorgeschlagenen Erweiterungen (TensorFlow.js-Modelle, echte ELA, Batch-Modus) könnte CODEXME sogar mit kommerziellen Lösungen wie Forensically (von 29a.ch) oder FotoForensics konkurrieren – ohne dabei Abhängigkeiten von zentralen Servern zu schaffen.

Die Entwickler des Projekts haben angekündigt, die Plattform weiterzuentwickeln. Wer mitwirken möchte, findet den Quellcode auf GitHub (unter codexme/forensic-analyzer). Denn eines steht fest: In einer Welt, die von KI-generierten Bildern überschwemmt wird, ist jede gut gemachte, offene Forensik-Software ein Gewinn für die demokratische Öffentlichkeit.

Quellen

Krawetz, N. (2007). Error Level Analysis. Hacker Factor Blog.
https://www.hackerfactor.com/blog/index.php?/archives/244-Error-Level-Analysis.html
Farid, H. (2022). Digital Forensics for the 21st Century. UC Berkeley School of Information.
https://www.icsi.berkeley.edu/icsi/node/12461
ExifTool von Phil Harvey (Dokumentation zu EXIF-Standards).
https://exiftool.org/TagNames/EXIF.html
Afchar, D., Nozick, V., Yamagishi, J., Echizen, I. (2018). MesoNet: a Compact Facial Video Forgery Detection Network. IEEE Workshop on Information Forensics and Security (WIFS).
https://arxiv.org/abs/1809.00888
Content Authenticity Initiative (CAI) – Adobe, Microsoft, Twitter.
https://contentauthenticity.org
29a.ch – Forensically (Referenz für ELA-Implementierung).
https://29a.ch/photo-forensics/

neustes