サクセスストーリー: Webtrekk


リアルタイムWeb解析

Webtrekk GmbH(以下、Webtれkk)は、Webサイトの訪問者の行動解析サービスを提供しています。Webtrekkは、Intel® Xeon® X5460プロセッサを活用することにより、大量のアクセスデータをリアルタイムに分析し、グラフィック表示することが可能となりました。

Webサイト内で訪問者はどのような行動をとっているでしょうか? 訪問者がより長くサイト内にとどまり、顧客となるには、Webサイトをどのように最適化すれば良いでしょうか? そのような質問にWebtrekkは答えを提供しています。Web解析では、個々のデータセットがサイトへの訪問者毎に作成されるため、分析対象となるデータ量が大きくなることが特徴です。従来使用していたデータベースは性能限界に達していたため、Webtrekkは、今回クアッドコア Intel® Xeon® プロセッサ X5460を活用した、EXASOLのデータウェアハウス・ソリューションを選択しました。 結果として、高速処理性能により、より大きなデータ量をリアルタイムで解析し、視覚化できるようになり、Webtrekk Q3と呼ばれる解析ツールを開発することに成功しました。 さらに、システム管理も驚くほど容易になりました。

チャレンジ

  • Webサイト訪問者の行動解析には、大量のデータ分析が必要となります。Webtrekkが以前使用していたデータベースシステムは、もはや適切な時間内にデータを分析し、グラフィック表示できなくなっていました。
  • 新しいソリューションは、Webサイト訪問者データを分析する際、データ集約処理なしに生データをそのまま利用できるようになることが期待されました。
  • 目標は、Webサイト訪問者の行動をリアルタイムに解析できることでした。

ソリューション

  • Webtrekkは、独自のWeb解析ツールQ3を開発しましたが、その際、データを収集し、解析するための基盤に、EXASOLのデータウェアハウス・システムEXASolutionを起用しました。
  • EXASolutionは、画期的なパフォーマンスと電力効率の良い45nm製造プロセス技術による、クアッドコア Intel Xeonプロセッサ X5460(3.16GHz)のサーバ群上で稼動します。
  • Intel® C++コンパイラやIntel® VTuneパフォーマンスアナライザは、クアッドコア・プロセッサと共に、データベース管理システムEXASolutionの最高性能を引き出します。

 背景

Webtrekkは、独ベルリンに本社を置き、社員17名のWeb解析に特化した企業で、そのサービスには、Webサイト訪問者の行動を分析するためにWebtrekk Q3のような解析ツールも含まれます。その際、Webtrekkは、Web解析に「pixel method」とよばれる手法を使用しており、見えない「counter pixel」を訪問者の画面にロードすることによって行動を把握します。この「pixel method」は、Webサイトの訪問者の情報を最も詳細に収集する方法と考えられています。 
このサービスは、オンラインマーケティング、(訪問者が顧客になる)コンバージョン率改善、行動ターゲティングに焦点を当てていますが、実際には、個々の訪問者を認識したり(例、'Berlinの新規顧客')、サイト内でのクリック行動の 記録および分析を行います。この情報を基に、Webサイトは、動的にパーソナル化したコンテンツの提供や将来の見込み顧客に対してレコメンデーションを実施することができます。このように、Webtrekkは、企業のWebサイトやオンラインショップの最適化支援を提供しています。Webtrekkの顧客には、Esprit、Map 24、Heinrich Bauer Verlag、DIE ZEITが含まれます。

「Webサイト解析では、我々は、現在年間約500億件のデーターセットの処理を行っています。このような巨大なデータ量に対して、我々は強力なデータベース管理システムが必要でした。」とWebtrekk社CEOのChristian Sauer氏が語ります。しかし大規模なデータを処理にするには、既存のMySQLデータベースの性能が日に日に限界に近づいていることは明らかでした。例えば、「ベルリンからDSLアクセスによるサイト訪問者、もしくははじめての訪問者」のようなプロフィールで顧客のセグメント化を実施したい場合、それまでは、全ての過去のデータを利用して分析することが出来ない上、事前に一旦データ集約を行う必要がありました。Webtrekkは、応答時間に関しても、不満を抱えていました。 「よって、我々のゴールは、そのような複雑で膨大なデータをリアルタイムで分析、セグメント化、グラフィック表示が可能なデータウェアハウス・ソリューションを見つけることでした。」とChristian Sauer氏は語ります。

プロジェクト

2008年9月から、Webtrekkは、Webアクセス解析のシステム基盤にデータベース管理システム EXASolutionを起用しました。EXASolutionは、いわゆる「インメモリ&クラスタ」技術を使用しており、さらに効率的なデータ圧縮アルゴリズムを組み合わせ、年間約500億件のデータセットの処理を可能としました。ハードウェアは、5台のクラスタ構成で、各ノードは、クアッドコア Intel Xeonプロセッサ X5460 x 2を搭載し、クロック数は、3.16GHzです。同プロセッサは、45nmプロセス技術を採用しているため、その小さな構造のからトランジスタ密度を大幅に高め、トランジスタスイッチング電力も少なくなっています。よって、計算処理性能も格段に向上し、消費電量も少なくなりました(最大40%の削減)。
その他の4台のトラッキングサーバは、個別のWebサイトのデータセットをストアし、順次データウェアハウスシステムEXASolutionに転送します。さらに1台のレポート専用のサーバが解析データを受け取り、視覚化していきます。データウェアハウスシステムへのリクエストは、アクセスサーバによりコントロールされます。
「一連のベンチマークテストの結果、我々はIntel XeonプロセッサとEXASOLのソリューションを採用しました。システムの高速性、高いコストパフォーマンス、EXASOL社の提供するサービスが我々を確信させました。」とChristian Sauer氏が語ります。
丁度8週間で、Webtrekkは、EXASOLエンジニアのサポートの下、データベース管理システムの移行を完了できました。その際、データベースシステムの完全リプレースが発生したため、既存の全てのクエリとアプリケーションをEXASolutionに適応させる必要がありましたが、「我々は、多くのクエリを単純化できましたが、EXASolutionでは必要としない、従来のインデックスが数多く存在したため、一部のクエリは完全に書き直す必要がありました。また、 EXASOLは不足していた機能群を迅速に追加してくれました。その一方で、Webtrekk Q3のアプリケーションも、EXASolutionの提供する高速なリード・ライト性能に適応していきました。」とChristian Sauer氏は補足しています。

より高速に、より大量データの解析を

刷新されたデータウェアハウス・ソリューションは、Webtrekkに多くの恩恵もたらしました。例えば、 高速性により、セグメンテーションを行う際、全ての生データを分析できる可能性ができたこと。事前のデータ集約作業が必要なくなったこと。よって、高品質のWebサイトの訪問者行動分析が可能となったばかりでなく、機能が増加しました。さらに、新しいQ3ツールの高速性能により、Webtrekkは、Webサイトを最適化するための多変量解析を行うことができるようになりました。これには、Webサイトのパーツの再設計も含まれ、関連する変数に対してどのように訪問者が反応するかをみるために、例えば異なる色彩やナビゲーション方法のテストを含みます。そして、訪問者のクリック行動に応じてサイトのレイアウトを改善していきます。
Intelから提供された特別なツールは、精巧なデータウェアハウスの性能を向上させるのに役立ちました。IntelのC++コンパイラは、マルチコアIntelプロセッサの性能を最大限引き出すために、自動的にソフトウェアを最適化し、並列処理化します。IntelのVTuneパフォーマンスアナライザは、プログラム内で各関数が呼ばれる正確なレスポンス時間を特定して性能上のボトルネックを検知します。
「EXASOLとIntelのソリューションにより、高速処理が可能となり、今では、リアルタイムの解析が実現できました」とChristian Sauer氏は指摘します。データのサブセットは、このように素早くフィルタリング、グラフィック表示され、「訪問者はどこからアクセスしているのか?」「どのようにサイト内を行動しているか?」「どれくらいサイト内にとどまっているか?」「誰が顧客となったか?」「いつどの商品を購入したか?」「いつ最大の最大の取引高を記録したか?」のようなWebサイト管理者の質問に答えます。
解析のための変数は実際限りがありません。サイト訪問者が一度重要な質問に対して答えると、Webtrekk Q3によりWebサイトは最適化され、パーソナル化されます。ここでのキーワードは、「行動ターゲティング」です。一旦個別の訪問者が認識されたら、サイト内での彼らのクリック行動が解析され、そのセグメント結果を基に、Webサイト管理者が個別コンテンツや宣伝プラットフォームを表示できます。

 

高速化した解析ツールが年間500億件の処理を可能に

成果

Webtrekk CEO Christian Sauerha氏は、クアッドコア Intel Xeonプロセッサ X5460をベースとした新しいデータベース管理システムに大変満足しています。「我々は、全ての目標を達成した。 強力なシステムをベースに、我々は、Q3ツールを利用して大量の生データを処理できるようになり、さらに、そのサブセットのデータをリアルタイムに解析、グラフィック表示することが出来るようになりました。簡略化されたシステム管理は、予想していなかったボーナスです。」 以前のシステムではできなかったデータベース・クラスタの管理は、新規データベースの構築やバックアップも含め、webコンソールからできるようになりました。