Kurzbeschreibung:

Im Rahmen des Projektes wird ein Ansatz zur Deduplizierung von Adressmassendaten konzipiert und mit Hilfe der Teradata Aster Big Analytics Appliance implementiert.

Ergänzung:

Einsatz der Teradata Aster Analyseplattform am Beispiel eines Big Data Problems

Fachbeschreibung:

Auf Grundlage nicht normierter, teilweise unvollständiger Adressdaten wird ein Matchingverfahren zur Deduplizierung von Adressen entwickelt. Die Literatur kennt derartige Probleme unter dem Begriff Duplikaterkennung/Objektidentifizierung (engl. Record Linkage). Ziel ist es u.a. die Leistungsfähigkeit der Teradata Aster Analyseplattform am Beispiel eines Big Data Problems zu erproben. Es wird nachgewiesen, dass mit dem Funktionsumfang der Teradata Aster ein Adressmatching realisiert werden kann. Durch die Implementation eigener Funktionen kann die Qualität des Matching nochmal verbessert werden.