Success Story Webtrekk GmbH


Webanalyse in Echtzeit

Die Webtrekk GmbH analysiert das Benutzerverhalten auf Webseiten. Mit Hilfe von Intel®Xeon®X5460er-Prozessoren kann das Unternehmen große Datenmengen in Echtzeit auswerten und grafisch aufbereiten.

Wie verhalten sich die Benutzer auf einer Webseite? Wie gelingt es, die Webseite so zu optimieren, damit Besucher länger dort verweilen und zu Käufern werden? Fragen wie diese beantwortet die Webtrekk GmbH. Bei der Webanalyse fallen große Datenmengen an, da für jeden Besuch auf der Webseite ein eigener Datensatz angelegt wird. Weil die bisherige Datenbank an ihre Grenzen gelangte, entschied sich Webtrekk für eine Data Warehouse-Lösung von EXASOL auf Basis von Intel® Xeon® Quadcore X5460er-Prozessoren. Wegen der höheren Rechenleistung ist das Unternehmen jetzt mit seinem neu entwickelten Tool Webtrekk Q3 erstmals in der Lage, Teilmengen aus einer größeren Datenmenge in Echtzeit zu berechnen und grafisch darzustellen. Zudem hat sich die Administration des Systems erheblich vereinfacht.

 Ausgangssituation

Bei der Analyse des Benutzerverhaltens von Webseiten fallen sehr große  
   Datenmengen an. Das bisherige Datenbank-System von Webtrekk war nicht
   mehr leistungsfähig genug, diese Daten in angemessener Zeit auszuwerten
   und grafisch darzustellen
Die neue Lösung sollte in der Lage sein, die kompletten Rohdaten der
   Webanalyse für die Segmentierung der Webseiten-Besucher zu verwenden,
   ohne diese vorher zu bearbeiten
Ziel ist es, die Daten über das Verhalten der Besucher von Webseiten in
   Echtzeit auszuwerten

Lösung

Die Webtrekk GmbH setzt zur Webanalyse Tools wie das selbst entwickelte
   Q3 ein. Die zugrunde liegenden Daten sammelt und analysiert das
   Unternehmen in der Data Warehouse-Lösung EXASolution von EXASOL
Diese Plattform läuft auf Servern mit energieeffizienten 45nm- Intel Xeon
   Quadcore X5460er-Prozessoren, die mit einer Taktrate von 3,16 GHz arbeiten
Tools wie Intel® C++ Compiler oder Intel® VTune Performance Analyzer
   
sorgen dafür, dass das Datenbank-Managementsystem EXASolution die
   größtmögliche Leistung auf den Quadcore-Prozessoren erzielt 

Die Situation

Die Berliner Webtrekk GmbH hat sich mit ihren 17 Mitarbeitern auf den Bereich Webanalyse spezialisiert, das heißt sie untersucht mit Tools wie Webtrekk Q3 das Verhalten von Besuchern auf kommerziellen Webseiten. Webtrekk verwendet hierzu das so genannte Pixel-Verfahren, bei dem der Zählimpuls über das Laden eines unsichtbaren Pixels erfolgt. Das Pixel-Verfahren gilt als genaueste Methode zur Usererfassung auf einer Internetseite.
Der Fokus liegt dabei auf Online-Marketing, der Verbesserung der Konversionsrate (Besucher wird zum Käufer) und dem Behavioral Targeting. Bei letzterem werden die einzelnen Nutzer identifiziert (zum Beispiel „Neukunde aus Berlin“) sowie ihr Klickverhalten auf der Website gesammelt und analysiert. Auf dieser Basis können die Betreiber der Webseite dem entsprechenden Nutzer künftig individualisierte Inhalte oder Werbung anbieten. Zudem unterstützt Webtrekk Unternehmen dabei, ihre Webseiten und Online-Shops zu optimieren. Kunden der Webtrekk GmbH sind beispielsweise Esprit, Map 24, Heinrich Bauer Verlag und DIE ZEIT. 

 „Bei der Analyse von Webseiten verarbeiten wir derzeit pro Jahr rund 50 Milliarden Datensätze. Für diese Vielzahl an Daten benötigen wir ein leistungsfähiges Datenbank-Management- System“, erläutert Christian Sauer, Geschäftsführer der Webtrekk GmbH. Doch die bestehende MYSQL-Datenbank gelangte bei der Auswertung der großen Datenmenge zunehmend an ihre Grenzen. Das Unternehmen konnte für die Segmentierung der Kunden nach bestimmten Eigenschaften, beispielsweise Besucher aus Berlin mit DSL-Zugang, Erstbesucher etc., nicht die gesamten verfügbaren Rohdaten nutzen, sondern musste diese bereits in einem Schritt vorher zusammenfassen, um sie bearbeiten zu können. Auch mit der Leistung beziehungsweise Antwortzeit war Webtrekk nicht mehr zufrieden. „Unser Ziel war daher eine Data Warehouse-Lösung, die eine so komplexe Datenmenge in Echtzeit analysieren, segmentieren und grafisch darstellen kann“, so Christian Sauer.

Die Lösung

Seit September 2008 setzt Webtrekk als Grundlage für die Webanalyse auf das Datenbank-Managementsystem EXASolution von EXASOL. Dieses nutzt die so genannte In-Memory Cluster-Technologie und kombiniert sie mit effizienten Kompressions-Algorithmen, um die jährlich rund 50 Milliarden Datensätze zu verarbeiten. Das Cluster besteht aus fünf Knoten, die jeweils mit zwei Intel Xeon Quadcore X5460- Prozessoren bestückt sind.
Diese arbeiten mit einer Taktrate von 3,16 GHz und sind mit einer Strukturbreite von 45 Nanometern gefertigt. Aufgrund der winzigen Strukturen passen mehr Transistoren auf einen Chip und es ist weniger Ladung (Strom) notwendig, um den Schaltvorgang im Transistor auszulösen (Strom fließt oder Strom fließt nicht). Gleiche Rechenoperationen lassen sich daher schneller und mit erheblich weniger Energieaufwand (bis zu 40 Prozent) ausführen.
Vier weitere Trackserver nehmen die Datensätze der einzelnen Webseiten auf und übertragen sie zyklisch in das Data Warehouse System EXASolution. Ein eigener Reportserver holt die Daten dort ab und visualisiert sie. Die Anfragen auf das Data Warehouse System steuert ein Zugriffsserver.
„Wir haben uns nach einem ausgiebigen Benchmark-Test für die Lösung von EXASOL mit Intel Xeon Prozessoren entschieden. Die hohe Performance des Systems, das Preis-/Leistungs-Verhältnis und der Service von EXASOL haben uns vollauf überzeugt“, erklärt Christian Sauer.
In nur acht Wochen stellte Webtrekk mit Hilfe von EXASOL-Experten sein Datenbank-Managementsystem um. Neben dem Komplettaustausch der Datenbank musste das Unternehmen alle Queries und Anwendungen, die auf der Datenbank arbeiten, an die EXASOL-Lösung anpassen. Dazu der Webtrekk Geschäftsführer: „Wir konnten viele Queries vereinfachen, mussten diese aber teilweise komplett anders aufbauen, da EXASolution einige klassische Indices nicht unterstützte. Fehlende Funktionen hat EXASOL dann aber sehr schnell implementiert.“ Auch die Webtrekk Q3-Applikation, die auf der Datenbank arbeitet, passte Webtrekk an die neue Lese- und Schreib-Performance der EXASOL-Lösung an.

Höhere Performance, mehr Daten

Die neue Data Warehouse-Lösung bringt Webtrekk einige Vorteile. So ist es jetzt aufgrund der besseren Performance des Systems möglich, die kompletten Rohdaten für die Segmentierung zu verarbeiten. Eine Vorberechnung und Zusammenfassung ist nicht mehr notwendig. Damit sind nun nicht nur qualifizierte Aussagen zum Nutzerverhalten auf Websites möglich, sondern auch der Funktionsumfang steigt.
Darüber hinaus ist Webtrekk mit der optimierten Leistung der zugrunde liegenden Datenbank in der Lage, mit seinem neuen Tool Q3 jetzt auch so genannte multivariate Tests zur Optimierung von Webseiten durchführen. Hier erhält die Webseite in Teilen eine andere Gestalt, beispielsweise eine andere Farbe oder Navigation, um zu testen, wie die User auf die jeweilige Variante reagieren. Dem Klickverhalten der User gemäß lässt sich das Layout der Seite dann entsprechend anpassen.
Um die Leistung der anspruchsvollen Data Warehouse- Lösung zu verbessern, stellt Intel spezielle Tools zur Verfügung. Intel C++ Compiler optimiert und parallelisiert Software automatisch, um die größtmögliche Leistung auf den Multicore Prozessoren von Intel zu erzielen. Intel VTune Performance Analyzer spürt Leistungsengpässe in Programmen auf, indem er die exakten Antwortzeiten beim Aufrufen einer Funktion ermittelt. Webtrekk profitiert davon erheblich.
„Die Auswertung der Datensätze ist mit der EXASOL/ Intel-Lösung wegen der besseren Performance jetzt auch in Echtzeit möglich“, betont Christian Sauer. Damit lassen sich schnell Teilmengen herausfiltern und grafisch aufbereiten, die wichtige Fragen der Webseiten-Betreiber beantworten wie: Wo kommen unsere Besucher her? Wie navigieren sie durch die Seite? Wie lange bleiben sie? Wer wird zum Käufer? Wann wird welches Produkt gekauft? Wann machen wir den größten Umsatz?
Die Parameter für die Auswertung sind praktisch unbegrenzt. Sind die wichtigen Fragen beantwortet, lässt sich mit Hilfe von Webtrekk Q3 die Website optimieren und personalisieren. Behavioral Targeting lautet das Schlüsselwort. Sind die einzelnen Nutzer identifiziert und ist ihr Klickverhalten auf der Website analysiert, kann der Website-Betreiber ihnen auf der Grundlage der segmentierten Daten individualisierte Inhalte oder Werbeplattformen anbieten. 

Performantes System verarbeitet rund 50 Milliarden Datensätze pro Jahr

Fazit

Webtrekk-Geschäftsführer Christian Sauer ist mit dem neuen Datenbank- Managementsystem auf Basis der Intel Xeon Quadcore X5460er-Prozessoren überaus zufrieden. „Wir haben alle unsere Ziele erreicht. Auf Basis des leistungsstarken Systems können wir mit unserem Tool Q3 jetzt die Masse an Rohdaten verarbeiten sowie Teilmengen dieser Daten in Echtzeit berechnen und grafisch darstellen. Ein weiteres Plus ist die einfachere Administration.“ Im Unterschied zur Vorgängerlösung erfolgt die Verwaltung des Datenbank-Clusters jetzt zentral über ein Webinterface. Darüber lassen sich bequem neue Datenbanken anlegen oder Backups ausführen.