Wenn man verschiedene Personen die Frage stellt: "Was ist eine Dublette?",
bekommt man unterschiedliche Antworten. Oft unterscheiden sich auch die Meinungen,
wenn man ganz konkrete Beispiele heranzieht. Sehen wir uns zwei Beispiele an.
Martin Meyer, Adalbert Stifter Straße 12, 1200 Wien
M. Meyer, A. Stifter-Str. 12, 1140 Wien
Martin Meyer, Adalbert Stifter Straße 12, 1200 Wien
Martina Meyer, Adalbert Stifter Gasse 12, 1200 Wien
Die Frage, ob es sich bei diesen Beispielen um Dubletten handelt, würde von
verschiedenen Personen unterschiedlich beantwortet werden.
Analysieren wir diese Beispiele kurz.
Viele Personen würden im ersten Fall wohl der Meinung sein, dass es sich
um eine Dublette handelt.
Was jedoch, wenn M. nicht für Martin sondern einen anderen
Vornamen steht?
Es könnte trotzdem eine Dublette sein, da diese Personen offensichtlich in
einem Haus / Haushalt wohnen. Es könnte jedoch auch keine Dublette sein,
da es sich um zwei verschiedene Personen handelt. Hier zeigt sich deutlich, dass
die subjektive Meinung einen Unterschied macht.
Für die selbe Person kann das selbe Datensatzpaar - Beispiel Martin
und Martina - einmal eine Dublette sein und einmal nicht. Hier kann die
Situation, in der ein solches Paar bewertet werden sol,l eine wesentliche Rolle
spielen. Wird etwa ein Katalog verschickt, soll dieser natürlich nur einmal
an diesen Haushalt geschickt werden. Handelt es sich hingegen um eine Einladung
zu einem Event und beide Personen wären aktive Kunden, so könnte es
sein, dass jeder der beiden eine Einladung erhalten soll.
Die Bewertung, ob es sich um Dubletten handeln soll ist also subjektiv und situationsbezogen.
So entstehen Dubletten
Es gibt unzählige Wege, wie es zu Dubletten kommen kann.
Doppelte Eingabe in eine Datenbank, weil das Programm keinen
Dublettencheck, bei der Eingabe vornimmt.
Ein Mitarbeiter versteht den Namen oder die Adresse nicht
richtig und legt einen neuen Datensatz an.
Mehrere Datenbanken (Dateien) werden zusammen gelegt und
dabei entstehen Dubletten.
Kunden schicken absichtlich mehrere Gewinnspielkarten und
verändern die Schreibweise ihres Namens, in der Hoffnung ihre Gewinnchance
zu erhöhen.
Schlecht aufgebaute Datenbanken fordern den Benutzer immer
wieder auf den Kundennamen einzugeben.
Der Mitarbeiter denkt, er weiß wie der Name eines Kunden
geschrieben wird (Bsp.: Maier, Meier, Mayr, Meyer) und schreibt ihn falsch.
Es entsteht ein zweiter Datensatz zur selben Person.
Response-Elemente sind schlampig ausgefüllt und eine Datenerfasserin
schreibt ihn falsch.
In vielen dieser und anderer Fälle können die Technik oder bessere Organisation
helfen Dubletten zu vermeiden, aber leider nicht immer. Im letzten Fall zum Beispiel
kann immer eine Dublette entstehen, die oft, selbst von einer realen Person, nicht
als solche erkannt werden kann. Wie man noch eine Chance hat auch diese Dubletten
aus seiner Datenbank zu bekommen, wird im letzten Teil dieses Artikel erklärt.
Deshalb sind Dubletten teuer
Es ist uns oft nicht bewußt, aber Dubletten können sehr teuer werden.
Die Produktionskosten erhöhen sich, da man für mehr Adressen
produziert als es tatsächlich wären.
Die Portokosten erhöhen sich, da man mehr verschickt als
nötig wäre.
Das Image eines Unternehmens kann bei den Kunden leiden,
die mehrere Sendungen erhalten. Jeder ärgert sich, wenn er ein Mailing mehr
als einmal erhält, es macht uns irgendwie bewußt, dass wir nicht mehr als
eine Nummer (in diesem Fall nicht mehr als eine Adresse) sind, für dieses
Unternehmen.
Kunden beschweren sich manchmal bei den Unternehmen, die
ihnen doppelte Mailings schicken. Dies kostet den Unternehmen Zeit und Geld.
Diese Kosten und Probleme können durch einen Dubletten-Abgleich leicht verhindert
werden. Selbst die best gepflegtesten Datenbanken enthalten erfahrungsgemäß einen
gewissen Prozentsatz an Dubletten, deshalb ist der abschließende Abgleich immer
zu empfehlen.
So kann man Dubletten vermeiden und los werden
Hier geht es um zwei verschiedene Möglichkeiten mit Dubletten fertig zu werden,
die jedoch nur in der Kombination, den besten Schutz gegen Dubletten bilden.
Bei der Vermeidung von Dubletten, setzt man Programme ein und organisiert die
notwendigen Abläufe so, dass die Möglichkeiten der Entstehung von Dubletten
drastisch verringert werden.
Wir analysieren etwa bei Datenbank-Projekten, die wir für Kunden entwickeln
und umsetzen, wo diese Gefahrenquellen liegen und wie man sie ausschalten kann.
Wir inkludieren unsere Dublettencheck-Software in Benutzerschnittstellen (Masken
und Formulare) und in Schnittstellen für den Datenimport und -export.
Unser Datenerfassungspersonal wird auf diese Problematiken geschult und kann so
bessere Ergebnisse bei der Dateneingabe liefern.
Das entfernen von Dubletten geschieht in der Praxis meistens kurz vor einer Aussendung
und zwar durch einen Abgleich der Adressen. Das Problem für das jeweilige
Unternehmen liegt eigentlich darin, dass die gefundenen Dubletten nicht aus den
Ursprungsdatenbanken entfernt werden und so friedlich in der Datenbank schlummern,
bis es ihnen eines Tages doch noch gelingt, die weite Welt zu sehen.
Sollten Sie weitere Fragen zu diesem Thema haben, schicken Sie uns einfach ein
E-Mail an: office@zmg.at