PhotoDNA

Allgemeines

PhotoDNA wurde entwickelt, um Bilder mit gleichen inhaltlichen Darstellung zu erkennen, auch wenn das gespeicherte Exemplar und die Abfrage unterschiedliche Dateien sind. Hierbei wird die Darstellungsähnlichkeit verglichen. Microsoft und das Darthmouth College haben die zugrundeliegende Technik bereits 2009 entwickelt und einer ausgewählten Klientel zur Verfügung gestellt. Es wird kein Machine Learning eingesetzt, die Methodik ist vergleichsweise simpel.

Bei herkömmlichen Hashfunktionen ist gewünscht, dass geringfügige Änderungen der Quelle zu einer starken Veränderung im Hashwert führen. Dieses Verfahren eignet sich entsprechend nur zur Feststellung von identischen Eingabedaten.
PhotoDNA beabsichtigt jedoch das genaue Gegenteil: Bereits geringfügige Änderungen wie eine andere Auflösung/Skalierung, Bildformat, Dateityp oder Kompression würden eine Erkennung des Bildes sonst unmöglich machen. Aus diesem Grund baut PhotoDNA auf einem robusten Fingerabdrucksystem, das keinen herkömmlichen Hashwert einsetzt, sondern das Bild mit einem mehrschrittigen System aufarbeitet:

Funktionsweise

Zunächst wird das Bild in eine Schwarz-Weiß-Darstellung umgewandelt, verkleinert und mittels Raster in eine Vielzahl an Zellen zerlegt. Von jeder Zelle werden die Intensitätsgradienten berechnet. Aus diesen Berechnungen wird die Signatur, genannt Photo DNA, berechnet. Diese Signatur kann in einer Hashdatenbank verwaltet und für Abgleiche verwendet werden. Dieser Vorgang ist in der folgenden Abbildung bildlich veranschaulicht.

Schematische angewandte Darstellung von PhotoDNA auf ein Beispielbild.

Herkunft der Bildersignaturen

Die Meldestelle National Center for Missing & Exploited Children (kurz: NCMEC) erhält über die CyberTipline Berichte über sexuelle Ausbeutung von Kindern, auch von Kinderpornografie. Das entsprechend qualifizierte Material wird wie zuvor im Abschnitt Funktionsweise beschrieben berechnet. Es entsteht auf diese Weise eine Hashdatenbank, gegen die neue Bilder abgeglichen werden können.

Anwendung

PhotoDNA wird Unternehmen, Organisationen und Strafverfolgungsbehörden kostenlos zur Verfügung gestellt. In vielen Auswerte- uns Forensiktools wie Axiom, x-ways etc. kann die Hashdatenbank zum automatischen Abgleich angebunden werden. Auf diese Weise können Plagiate, gestohlene Firmeninterna und auch Straftaten aufgedeckt und zur Ermittlung genutzt werden.

Weiterentwicklung

PhotoDNA wurde weiter entwickelt und auch für die Analyse von Videodaten eingeführt. Dieses Produkt heißt dann PhotoDNA Video Solution. Die grundsätzliche Funktionsweise wird dabei nicht verändert. Videos werden in Schlüsselbilder zerlegt, die wiederum mittels PhotoDNA zu Hashes berechnet werden und dann in einer Hashdatenbank abgelegt und verglichen werden. Dieses Vorgehen stellt die folgende Abbildung schematisch dar.

Schematische Darstellung der Funktionsweise von PhotoDNA Video Solution.