Was ist ein 'Kreuztreffer'?

Kreuztreffer spielen eine Rolle beim automatischen Abgleich von Datensätzen.Ein Kreuztreffer liegt dann vor, wenn gleichartige Begriffe gefunden werden, die in den untersuchten Datensätzen in unterschiedlichen Merkmalskategorien vorkommen (wie Begriffe in Personen-Identifikationsmalen, wie Vorname, Nachname, Geburtsname, Geburtsdatum,, Geburtsort usw.)

Kreuztreffer werden nicht durch die intellektuelle Suche eines Benutzers aufgespürt, sondern durch „Algorithmen“, die im Hintergrund arbeiten – und deren Aktivität dem Benutzer häufig gar nicht bewusst ist.

Mit solchen Kreuztreffer-Algorithmen (von „KI“ – künstlicher Intelligenz würde ich dabei noch längst nicht sprechen …) sollen Datensätze miteinander abgeglichen werden, wenn zu unterstellen ist, dass identifizierende Merkmale – insbesondere über Personen –

bei der Erfassung nicht exakt bekannt waren

oder dass Erfassungsvarianten – auch Schreibfehler und unterschiedliche Schreibweisen von gleich klingenden Begriffen (Homonymen, wie z.B. Schmidt/Schmitt oder Maier/Meyer/Mayer… – unterstellt werden müssen,

oder dass Informationen aus verschiedenen Informationssystemen miteinander abgeglichen werden und im jeweiligen Informationssystem unterschiedliche Erfassungsregeln galten. Das ist z.B. der Fall beim Abgleich zwischen Fluggastdaten und polizeilichen Informationssystemen.

Kreuztreffer – daher der Name! – vergleichen Begriffe, die in unterschiedlichen Merkmalskategorien vorkommen: Also z.B. den Begriff ‚Otto‘, der sowohl als Vorname, wie auch als Nachname oder Geburtsname vorkommen kann. Oder, um ein aktuelles Beispiel zu wählen, den Begriff ‚Amed‘ oder ‚Ahmed‘, der ebenfalls als Vorname oder Familienname oder Geburtsname vorkommen kann.

Vorteile, die sich Betreiber von Informationssystemen von der „Kreuztrefferei“ versprechen: Der Glaube, dass dem suchenden Nutzer mit der Kreuztrefferei auch mehr potenzielle Treffer angeboten werden: Für den Fall, dass ‚Otto‘ oder ‚Amed‘ nicht als Familienname, sondern als Geburtsname erfasst wurden oder als Vornamen vorkommen …

Nachteile für den Benutzer: Ein Benutzer, der SUCHFRAGEN in einem Informationssystem formuliert, will damit die Menge der möglichen Treffer EINGRENZEN auf die, die ihn wirklich interessieren. Mit der Kreuztrefferei wird die Menge dagegen ausgeweitet. Es erscheinen auch solche vermeintlichen ‚Treffer“, die mit dem an sich gesuchten Objekt tatsächlich nur zufällig in einem bestimmten Merkmalsbegriff (Otto / Amed / Ahmed) übereinstimmen. Wobei in der wirklichen Welt zwischen den so ausgewiesenen ‚Treffern‘ keinerlei Übereinstimmung bestehen muss.

Wenn dann noch hinzukommt, dass dem Benutzer eines solchen Informationssystems gar nicht bewusst ist, dass er/sie nicht nur Ergebnisse der eigenen Suchfragen präsentiert bekommt, sondern auch von einem Algorithmus im Hintergrundproduzierte Kreuztreffer, dann wird das Fundament, auf dem weitere „Erkenntnisse“ gewonnen und polizeiliche Entscheidungen getroffen werden, extrem brüchig!

Zahl der übereinstimmenden Merkmalsbegriffe: Damit überhaupt eine Wahrscheinlichkeit der Übereinstimmung von Personen angenommen werden kann, die in unterschiedlichen Datensätzen dargestellt sind, muss es übereinstimmende Begriffe in einer SIGNIFIKANTEN ANZAHL von unterschiedlichen Merkmalskategorien geben. Die singuläre Übereinstimmung von, sagen wir ‚Otto‘ oder ‚Amed‘ oder ‚Ahmed‘ ist unzureichend.

Signifikanz der übereinstimmenden Merkmale: Neben den Namensbestandteilen wurde, z.B. im System ViVA (NRW) auch noch das Geburtsdatum für die Kreuztrefferei herangezogen. Das war fatal nach 2015/2016, also den Jahren, in denen sehr viele Asylbewerber nach Deutschland kamen und erfasst wurden. Bei sehr vielen war das genaue Geburtsdatum nicht bekannt. Daher wurde als „Standardwert“ 01011992″, also der 1. Januar 1992 eingesetzt. Dieses Datum kommt als Geburtsdatum also in tausenden von Datensätzen vor und hat daher keinerlei Signifikanz, um eine einzelne Person eindeutig zu identifizieren. Gleiches gilt für die Geschlechtsmerkmal, also ‚M‘ für Männer.

Das Standarddatum für Asylbewerber = 01011992 für einen Kreuztreffer-Abgleich heranzuziehen, ist geradezu fahrlässig. In Kombination mit häufig vorkommenden Namensbestandteilen, wie ‚Amed‘ oder ‚Mohammed‘, ‚Ali‘ oder ‚Mehmed‘ ergeben sich vor allem eine Menge von irrelevanten Kombinationen, die für eine Eingrenzung auf bestimmte Personen völlig ungeeignet sind. Vielmehr werden bei diesem Vorgehen zahlreiche potenzielle ‚Treffer‘ ausgewiesen, die es dem Polizisten nur schwerer machen zu bestimmen, welcher von den zahlreichen ausgewiesenen potenziellen Kandidaten = Kreuztreffer nun tatsächlich IN DER WIRKLICHKEIT Übereinstimmungen mit der hier näher betrachteten Person aufweist.

Möglichkeit zur Hypothesenbildung – ganz anderer Art …: Allerdings – auch das muss erwähnt werden – sieht der Polizist bei diesem Vorgehen u.U. natürlich auch einen „Strauß“ von potenziell identischen Personen (mit seiner Zielperson) und damit auch die gesamte polizeiliche Historie solcher Personen – einschließlich offener Haftbefehle und Fahndungsnotierungen.