XING ist ein soziales Netzwerk, in dem die Mitglieder vorrangig ihre Business Kontakte verwalten. Das Unternehmen mit Sitz in Hamburg hat etwa 19 Millionen Nutzer in der DACH-Region. XING nutzt intelligente Datenanalyse, um gezielt Networking- und Recruiting-Informationen für seine Mitgliedsunternehmen zu liefern, die direkt auf der Plattform inserieren.
XING ist schnell gewachsen – und mit ihm die Datenmenge, die wiederum immer komplexere Business Intelligence-Aufgaben möglich machten, jedoch die Kapazität der früher eingesetzten Lösung sprengte. Teilweise überschritt die Zeit der Datenverarbeitung die 24 Stunden-Marke. Es wurde eine skalierbare Lösung für die komplexe Analyse einiger zehn Milliarden Datensätzen pro Jahr, Clustering für mehr Geschwindigkeit und geringere Verwaltungskosten benötigt.
In nur vier Wochen integrierte XING nach einem Benchmarking-Test die Exasol-Datenbank in die bestehende Infrastruktur. Die bestehenden ETL (Extract, Transform, Load)-Prozesse wurden sukzessive auf das neue Datenbank-Managementsystem umgestellt.
„Anfragen, die früher undenkbar waren, sind nun möglich.“
Dr. Ulrich Fricke, Teamleiter Datawarehouse und Reporting bei der XING AGInnerhalb von zwei Jahren nach der Umstellung auf das Data Warehouse von Exasol hat sich das Datenvolumen von XING verfünffacht. Dank der verbesserten Performance sind Auswertungen von Datensätzen, die zuvor unmöglich waren, nun alltäglich.
Die verteilte Datenspeicherung ist bei Exasol schon integriert, ein teures Storage Area Network (SAN) als externe Speicherlösung entfällt. Cluster-Komprimierungsalgorithmen ermöglichen eine effiziente Hauptspeichernutzung und halten die Systemkosten niedrig.
Indizes werden automatisch angelegt, Daten komprimiert und SQL-Anweisungen vom Query-Optimizer getunt. XING kann Millionen Queries pro Monat problemlos verarbeiten, die sich aus dem täglich durchgeführten höchst parallelisierten und komplexen Lade- und Transformationsprozess sowie den interaktiven Nutzerabfragen zusammensetzen.
und Kompressionsalgorithmen ermöglichen es XING große Datenvolumen in Sekundenschnelle zu verarbeiten. Bei lesenden Anfragen erfolgt die Verarbeitung vollständig im RAM, so dass der langsame Zugriff auf Festplatten entfällt.
Mehrere Knoten enthalten jeweils zwei Prozessoren, wobei die einzelnen Server zu einem Cluster zusammengeschlossen sind, in dem die Daten automatisch verteilt werden.