In der Datenbankwelt gilt Amazon stets als leuchtendes Beispiel, was mit „Data Mining“ möglich ist: Mit automatischen Werkzeugen innerhalb großer Datenbestände Trends und Zusammenhänge erkennen. Die Funktion „Kunden, die XY gekauft haben, haben auch YZ gekauft“ ist eine recht simple Anwendung davon.
Trotzdem scheint auch Amazon vor Problemen im Ungang mit der eigenen Datenbank nicht gefeit. Nehmen wir ein kürzlich erschienenes Buch – zufällig mein eigenes -, bei dem Amazon erst fünf Tage gebraucht hat, um festzustellen, dass es verfügbar war; vorher hieß es unzutreffenderweise fast eine Woche lang, das Buch sei noch nicht erschienen. Dann aber bemerkte Amazon, dass es das Buch eben doch hatte. Die Exemplare im Lager waren dann noch am selben Tag fast ausverkauft – es hatte eine Reihe Vorbestellungen gegeben. Das ist ja durchaus erfreulich.
Bereits am Folgetag war der Vorrat alle. Entgegen seinen sonstigen Gepflogenheiten behauptete nun Amazons Webseite: „Dieser Artikel ist noch nicht erschienen. Reservieren Sie sich Ihr Exemplar pünktlich zum Erscheinungstermin.“
Erstaunlich ist dabei aber der Eintrag etwas weiter unten: „Kunden, die dieses Buch gekauft haben, haben auch diese Bücher gekauft:“
Soso. Das Buch ist noch nicht erschienen, aber trotzdem haben Kunden es bereits gekauft – und dabei gleich noch was anderes mitgenommen?! Da muss wohl mal jemand an seinen Prozessen und an seiner Data-Mining-Engine arbeiten …