Massiv paralleles Arbeiten mit der Programmiersprache „R“ in EXASolution ermöglicht prädiktive Analysen in Echtzeit

Nürnberg, 16. April 2013 – Die EXASOL AG, Spezialist für Loading...In-Memory-Datenbanken, unterstützt mit EXASolution künftig die Programmiersprache R für statistische Berechnungen. Durch die Kombination aus R – der führenden Programmiersprache für Datenwissenschaftler und Geschäftsanalysen – und EXASolution ergeben sich für Data Scientists und andere Analysespezialisten unter anderem aus den Branchen Handel, Produktion und Marktforschung erhebliche Vorteile: Es werden keine teuren Rechnerressourcen für Analysen benötigt, die Daten von einem ins andere System transferieren. Da EXASolution linear skalieren kann, laufen Analysen auch auf sehr großen Datenmengen in nur einem Bruchteil der bisher benötigten Zeit ab. Nicht zuletzt ermöglicht die parallele Ausführung des R-Codes in EXASolution eine extrem hohe Performance von Abfragen.

Einsatzszenarien zum parallelen Arbeiten mit R

Steffen Weissbarth, CEO der EXASOL nennt einige markante Beispiele, die die Anwendungsbereiche von EXASolution in Kombination mit R verdeutlichen: „Ob diverse Kundenklassifikationen, Warenkorb-, Churn-, oder Sentimentanalysen – überall, wo es darum geht, Stimmungen von Kunden auszuwerten, kann unsere Lösung im Höchstmaß punkten. Ein Verlag, der wissen möchte, welches Buch seine Kunden am meisten kaufen werden, kann sämtliche Kundenrezessionen analysieren und so auf den vermeintlichen Bestseller des Jahres schließen“, sagt Weissbarth abschließend. EXASOL nutzt den Funktionsumfang und die Flexibilität der Open Source Programmiersprache R und kombiniert diese beiden Bereiche geschickt mit dem Datenbankturbo EXASolution. Das Ergebnis: leistungsstarke Datenanalysen auch bei schnell wachsenden Datenmengen. Hersteller vergleichbarer Datenbanken sind oft gezwungen, sämtliche Daten erst in die „R“-Umgebung zu übertragen, was Zeit und nicht unerhebliche Kosten verursacht. EXASolution integriert „R“ bereits auf jeden laufenden Clusterknoten, so dass ankommende Anfragen auf jeden Knoten verteilt werden. Anschließend können diese massiv parallel bearbeitet werden, da auf jedem einzelnen Knoten ein „eigenes“ R läuft.

R – „die mächtigste Programmiersprache zur Datenanalyse”

R ist eine Software zur Datenanalyse und Visualisierung. 1993 an der Universität von Auckland in Neuseeland entwickelt, steht R für einen völlig neuartigen Ansatz, mit Daten aller Art umzugehen. R bietet eine Vielzahl von statistischen Methoden (lineare und nichtlineare Modellierung, klassische statistische Testverfahren, Zeitreihenanalyse, Clusteranalysen etc.) und Werkzeuge zur grafischen Visualisierung. Dabei ist R in höchstem Maße erweiterbar. Eine der Stärken von R ist die Flexibilität: R-Experten können mit dem gleichen Code, den gleichen Tools und dem gleichen Know-how sowohl Loading...Big Data als auch kleinere Studien analysieren, Text-Mining wie auch Regressionsanalysen durchführen. Standardeinstellungen liefern schon sehr gute Ergebnisse, sämtliche Algorithmen bleiben dem Benutzer jederzeit erhalten. R wird weltweit von schätzungsweise 2 Millionen Nutzern in Unternehmen und Wissenschaft genutzt. Die Community hat mehr als 2.500 Pakete entwickelt, die Bausteine zur Erstellung analytischer Modelle darstellen.

Die EXASOL AG mit Sitz in Nürnberg entwickelt und vertreibt die auf In-Memory-Technologie basierende Hochleistungsdatenbank EXASolution, die speziell für Enterprise-Warehouse-Anwendungen und Business-Intelligence-Lösungen konzipiert wurde. Sie ermöglicht es, auch sehr große Datenmengen in kürzester Zeit zu analysieren und auszuwerten. Dank hoher Leistungsfähigkeit und geringem administrativen Aufwand unterstützt EXASolution Unternehmen nicht nur darin, wertvolle Entscheidungsgrundlagen aus ihren Daten zu gewinnen, sondern auch darin, ihre Total Cost of Ownership zu reduzieren. Im April 2011 wurde die EXASOL AG von Gartner als „Cool Vendor“ in der Kategorie Data Management und Integration 2011 ausgezeichnet. 2012 und 2013 wurde die Lösung in den Magic Quadrant „Data Warehouse Datenbank-Management-Systeme“ aufgenommen.

Über die EXASOL AG

Die EXASOL AG entwickelt ein Datenbank-Management-System (EXASolution), mit dem Daten sehr schnell analysiert und ausgewertet werden können. Durch den Einsatz der branchenunabhängigen Lösung, die selbst große Datenmengen (Big Data bzw. Value Data) analysiert, optimieren Unternehmen Geschäftsprozesse, generieren sichere Entscheidungsgrundlagen für ihre tägliche Arbeit und verschaffen sich somit einen nachhaltigen Wettbewerbsvorsprung. EXASolution ist eine relationale Hochleistungsdatenbank, die speziell für Data-Warehouse-Anwendungen und Business-Intelligence-Lösungen entwickelt wurde. Die auf In-Memory-Technologie basierende Datenbank wird für zeitkritische komplexe Analysen, umfangreiche Datenrecherchen, Planungen oder Reportings eingesetzt. Durch die Integration von Geodaten und polystrukturierten Daten – die auch aus Loading...Hadoop-Systemen angebunden werden können –, eröffnet EXASolution, u.a. mit dem Modul EXAPowerlytics, zusätzliche Auswertungsdimensionen, die noch effizientere Analysen zulassen. Die Easy-to-manage-Datenbank lässt sich einfach in bestehende IT-Infrastrukturen integrieren und erfordert geringen Administrationsaufwand bei niedrigen Investitions- und Betriebs-kosten (TCO). EXASolution wird auch als Appliance-Lösung und als Datawarehousing as a Service unter dem Namen EXACloud angeboten. Unternehmen wie XING, Sony Music, Olympus, media control, Zalando, stayfriends, Coop, IMS Health, Semikron, Webtrekk, econda und xplosion setzen auf die Technologie Made in Germany.