Als Advanced Technology Partner im AWS Partner Network verfolgen wir das Ziel, Exasol Anwendern über unsere nativen Konnektoren Zugang zu sämtlichen Möglichkeiten des Portfolios von Amazon zu ermöglichen. Deshalb enthält unsere High-Performance Datenbank jetzt eine Erweiterung für Amazon SageMaker, mit der Anwender ihre Daten effizient in AWS SageMaker Autopilot laden können, um dessen voll integrierte Loading...Machine Learning-Entwicklungsumgebung zu nutzen.
Indem wir die SageMaker Erweiterung mit unseren bereits verfügbaren Konnektoren zu AWS Kinesis und DynamoDB kombinieren, führen wir KI/ML und BI zusammen. Damit bietet Exasol jetzt Analytics Performance auf neuem Niveau.
Was leistet die Exasol SageMaker Erweiterung?
Anwender, die Exasol mit AWS verbinden, können ihre Daten mit der ExaLoader Funktion effizient in SageMaker laden. Auf diese Weise lassen sich Machine Learning-Modelle für verlässliche Vorhersagen in einer Reihe von Geschäftsszenarien trainieren. Wir haben sichergestellt, dass Endanwender die Erweiterung intuitiv bedienen und problemlos auf die Machine Learning-Fähigkeiten in der Exasol Umgebung zugreifen können.
Modelle können mit allen Standardformen des überwachten Lernens entwickelt werden. Dazu zählen Klassifikationsmodelle für die Datenkategorisierung, Regressionsmodelle zur Überprüfung der Beziehungen zwischen abhängigen und sich verändernden Geschäftsvariablen sowie die Erstellung von Prognosen, die Trends in den Daten sichtbar machen und helfen, den Geschäftsbetrieb schneller zu optimieren.
Data Engineers, Datenanalysten und BI-Analysten, die bereits mit Exasol vertraut sind, können die Erweiterung nutzen, um umfassendere Analysen innerhalb der Datenbank durchzuführen. Mit Hilfe von SageMaker Endpoints können problemlos mehrere Endpoint-Instanzen für Vorhersagen mit minimalem Aufwand gestartet und über User Defined Functions (Loading...UDFs) genutzt werden. Nach Abschluss der Trainingsphase lassen sich die Endpoint-Instanzen via der UDFs für das BI-Reporting in SQL-Abfragen einbinden.
Die Integration mit SageMaker Autopilot bietet Anwendern außerdem eine intuitive Schnittstelle, die automatisch wesentliche Operationen beim Training von Modellen ausführen kann. Damit lassen sich Daten vor der Verarbeitung bereinigen und transformieren, Entscheidungen über Hyperparameter treffen, mit denen vorgegeben wird, wie Modelle geeignet trainiert werden können, und die für die benötigten Voraussagen passenden Modelltypen festlegen.
Solche Modelle lassen sich für alle üblichen ML-Use Cases entwickeln. Das können Voraussagen zum Lagerbestand sein, mit denen sich bei Lieferanten zu bestellende Mengen prognostizieren lassen, Nachfrageschwankungen bei Produkten, die Identifikation unsicherer Kunden zur Reduktion der Kundenabwanderung, Erkennung von Extremwerten zur Betrugserkennung oder auch Voraussagen zur Wartung, mit denen sich die Instandhaltung von Anlagen planen lässt.
Was ist Amazon SageMaker?
Amazon SageMaker ist ein Public Cloud-Service, der Entwicklern hilft, zuverlässige Machine Learning-Modelle für Vorhersagen von Geschäftsergebnissen zu trainieren. Nach der Anbindung an die Datenquellen können Entwickler den SageMaker Data Wrangler einsetzen, um Rohdaten zu vereinfachten Features zu konvertieren, zu transformieren und zu kombinieren, die das Training optimieren. Datensätze können dann mit dem SageMaker Autopilot Service untersucht werden. So können Anwender verschiedene Machine Learning-Modelle gleichzeitig erstellen, trainieren und tunen.
Mit Feature Engineering können Entwickler Rohdaten in für spezifische Geschäftsszenarien relevante, integrierte Dimensionen überführen. Daraus entstehen dann präzisere Modelle. Im SageMaker Feature Store, zu dem auch ML-Entwickler Zugang haben, die an ähnlichen Projekten arbeiten, können vorhandene Features gespeichert und verwaltet werden. Mit dem Abruf von Features lassen sich Projekte für Vorhersagen mit niedriger Latenz optimieren. Damit können Anwender ihre Arbeitsabläufe beschleunigen.
Mit SageMaker Clarify können Anwender sicherstellen, dass Werte in den Features in den Datensätzen kohärent und gut repräsentiert werden. Das bedeutet, dass Modelle für verschiedene Anwendungsfälle generalisiert werden können und nicht spezifisch auf einzelne Unterkategorien von Daten ausgerichtet werden. Modelle können auch überprüft werden, um zu verstehen, welche Features für spezifische Vorhersagen benötigt werden. Das hilft Entwicklern, systematische Fehler zu eliminieren.
Mit dem SageMaker Debugger werden Modelle überarbeitet, das heißt Fehler eliminiert und der Trainingsprozess beschleunigt. Und mit SageMaker Pipelines lassen sich die Integration und die Installation automatisieren. Verbesserte Modelle können mit nur einem Klick neu trainiert werden.
Interaktion mit SageMaker
Anwender können mit SageMaker über die AWS Konsole für API-basierte Navigation oder durch Programmieren in – mit Jupyter gemanagten – SageMaker Notebook Servern interagieren. Eine Reihe von Programmiersprachen und Software Development Kits (SDKs) werden unterstützt, auch ML-spezifische Bibliotheken wie TensorFlow, PyTorch und scikit-learn, zusätzlich zu dem SageMaker-spezifischen Development-Kit. Diese Notebooks können mit anderen Entwicklern geteilt werden und ermöglichen eine effektive Zusammenarbeit. Es stehen auch Tutorial Notebooks zur Verfügung, die Anweisungen und Code enthalten und alle Phasen eines auch für Live-Projekte hilfreichen Trainings abdecken.
SageMaker Studio ist als eine in einer Jupyter Umgebung modellierte, integrierte Entwicklungsumgebung enthalten und bietet ein zentrales, Web-basiertes Interface, mit dem sich alle Entwicklungsphasen managen und die Produktivität steigern lassen. SageMaker Studio enthält zudem Add-ons und Erweiterungen, die eine noch engere Integration in die SageMaker Plattform ermöglichen.