Deutsch   |   English
   
 digg.com  del.icio.us 

Shared Nothing

Die leistungsstärkste MPP-Architektur, ohne typische Engpässe!

Massiv parallele Datenverarbeitung

EXASolution wurde als paralleles System entwickelt und ist nach dem "Shared Nothing"-Prinzip aufgebaut. Die Daten werden dabei über alle Knoten eines Clusters verteilt. Bei Abfragen arbeiten alle Knoten zusammen, wobei spezielle parallele Algorithmen dafür sorgen, dass die Berechnung der Daten lokal im Arbeitsspeicher der einzelnen Knoten erfolgt.

Wird eine Anfrage an das System gestellt, nimmt sie zunächst der Knoten an, der die Verbindung zum Client hält.

EXASolution: Products Technology parallel data processing 1

Anschließend wird die Anfrage auf alle Knoten verteilt. Intelligente Algorithmen optimieren die Abfrage, bestimmen den bestmöglichen Ausführungsplan und erzeugen Indices on the fly. Dabei entscheidet der EXASOL-Optimizer selbständig, ob die Daten für das konkrete Nutzungsprofil im Cluster reorganisiert werden sollen.

EXASolution: Products Technology parallel data processing 2

Das System berechnet im Anschluss daran die Teilergebnisse auf den lokalen Daten. Dieses Verarbeitungsparadigma wird auch SPMD (Single Program Multiple Data) genannt. Auf allen Knoten läuft das gleiche Programm, sie sind gleichberechtigt. Es gibt keinen Masterknoten.

EXASolution: Products Technology parallel data processing 3

Die Abfrage-Ergebnisse werden durch entsprechende Verbindungsknoten an den Anwender geliefert.

EXASolution: Products Technology parallel data processing 4

 

Beispiel der Join-Berechnung im parallelen Umfeld

  1. SELECT 
  2.      customer.last_name, city.name FROM customer, city
  3. WHERE
  4.      customer.city_id = city.id AND city.name LIKE 'New%';
  5.  

Die 2 Tabellen im Beispiel sind über die Knoten gleichmäßig verteilt:

Schritt 1: Filtering

Zunächst wird die kleinere Tabelle CITIES gefiltert. Nur die Städte, die mit 'New' anfangen, werden durchgelassen:

Join Example

Schritt 2: Matches suchen

Im zweiten Schritt werden für jede verblieben Stadt die Kunden herausgesucht, die in der Stadt wohnen. Dies erfolgt Knotenübergreifend, wenn die Tabellen so verteilt sind, dass die Matches nicht nur lokal zu finden sind:

Join Example 2

Schritt 3: Das Ergebnis zusammenstellen

Das Ergebnis der Queryberechnung bleibt lokal auf den jeweiligen Knoten. Wenn die Query z.B. ein Teil von einem Multipath SQL ist, ist damit der Teil der Berechnung abgeschlossen. Soll das Ergebnis an den Nutzer verschickt werden, geschiet dies in Portionen, die das Front-End anfordert. Das Ergebnis wird somit nie auf einem Knoten gesammelt:

Join Example 3
Sie kommen nicht weiter?
Skalierbarkeit ohne Einschränkungen.
  • SPMD = Single Program Multiple Data
  • Jeder Server erledigt gleiche Aufgaben
  • Shared Nothing Architektur
  • Nutzer können Verbindung zu beliebigem Knoten herstellen
Referenzen
  • AHOOLY
  • COOP
  • „Mit EXASolution sind wir für zukünftiges Datenwachstum bestens gerüstet. Dadurch, dass wir jetzt Geodaten verarbeiten, sprich die Dimension des Raumbezugs mit auswerten können, bieten wir unseren Kunden ganz neue Analysemöglichkeiten und noch umfassendere Marktübersichten. Wir sind sehr zufrieden mit der neuen Lösung, können flexibel auf zukünftige Anforderungen reagieren und trotzdem unsere Total Cost of Ownership reduzieren, da der so gewählte BI-Stack unsere Vision eines „Lean-BI“ in vollem Umfang unsterstützt.“

    Guido Niermann, IT-Leiter, Dataforce GmbH

    Dataforce
  • "Durch die Einbindung von EXASOL können wir unseren Kunden ein ganz neues Erlebnis bezüglich der explorativen Datenanalyse bieten… Neben der Technologie waren wir vor allem mit der Pre-Sales Beratung und dem Support während der Integration äußerst zufrieden."

     Martin Heink
    Geschäftsführer und Inhaber, econda GmbH 

    Econda
  • "Entscheidend für die IMS Health war insbesondere, dass wir uns durch einen sehr schnell aufgesetzten Proof of Concept von der Leistungsfähigkeit von EXASolution direkt überzeugen konnten."

     Michael Kempke
    Director Data Collection Global Operations, IMS Health GmbH & Co. OHG

    IMS
  • "Mit der innovativen Datenbank von EXASOL können wir komplexe Berechnungen genauer und umfangreicher durchführen. Das gibt uns einen signifikanten Technologievorsprung gegenüber der Konkurrenz."

     Tobias Kiessling
    CTO, intelliAd 

    Intelliad
  • "Die durchgängig hohe Leistung und die Möglichkeit, Echtzeitanalysen fahren zu können, waren für uns ausschlaggebend bei der Wahl von EXASolution."

     Tobias Kroha, Geschäftsführer der für das m-pathy-Projekt verantwortlichen seto GmbH

    m-pathy
  • Media Control
  • Olympus
  • "Wir haben uns für EXASolution entschieden, da die Hochleistungsdatenbank mit den zu erwartenden großen Datenmengen sehr gut umgehen kann und optimale Flexibilität bietet."

     Dr. Michael Röbbecke
    (ehem.) Geschäftsführer, RatePAY 

    RatePAY
  • "Mit EXASolution können wir unsere Geschäftsprozesse deutlich optimieren." 

     Gerhard Zapf
    Projektleiter, Semikron 

    Semikron
  • "Ein zuverlässiger und schneller Support, eine bessere Kundenbetreuung sowie eine bewiesene Fachkompetenz…"

     David Hodge
    IT Director, Sony Music Entertainment Germany 

    Sony Music
  • SOQUERO
  • SponsorPay
  • Stayfriends
  • "Die Datenbank von EXASOL ist Technik made in Germany, auf die wir uns langfristig verlassen können. Da sie bei steigendem Datenvolumen selbstständig skaliert und auch physisch beliebig erweitert werden kann, wächst unsere Datenbank mit unserem Unternehmen, und wir können auch in Zukunft flexibel und schnell auf neue Anforderungen reagieren."

     Heinrich Zetlmayer
    Geschäftsführer, Turtle Entertainment 

    Turtle Entertainment
  • United Internet Dialog
  • "Mit EXASolution haben wir eine Lösung erworben, die unsere hohen Leistungsansprüche komplexer Analysen bei steigenden Datenmengen für unsere Kunden optimal erfüllt." 

     Christian Sauer
    Geschäftsführer, Webtrekk GmbH 

    Webtrekk
  • "Wir haben uns nach einem ausgiebigen Benchmark-Test für die Lösung von EXASOL entschieden. Die hohe Performance des Systems, das Preis-/Leistungs-Verhältnis und der Service haben uns vollauf überzeugt"

    Dr. Ulrich Fricke
    Leiter Business Intelligence, XING AG 

    Xing
  • "Neben Wirtschaftlichkeit, Geschwindigkeit und hoher Leistungsfähigkeit war Flexibilität eines der entscheidenden Kriterien bei der Wahl unserer Datenbank… Die neue Datenbank bietet uns diese Skalierbarkeit bei reduzierten Total Cost of Ownership. So können wir auch in Zukunft immer die optimale Analyseleistung für unsere Kunden erbringen…"

     Sebastian Hoop
    Head of Operations, xplosion interactive gmbh 

    Xplosion
  • Zalando