Definition von Hadoop

Was bedeutet es und wie wird es verwendet?

Hadoop ist ein freies in Java geschriebenes System zum Speichern und Verarbeiten großer Datensätze quer durch Cluster von Computern unter Verwendung von handelsüblicher Hardware. Hadoop wird oft verwendet, um Ökosysteme verschiedener Module zu beschreiben und ist quasi ein Synonym für den Begriff „Big Data“.

Wozu ist das gut?

Hadoop spart Zeit indem es Ihnen eine einzige Analyse-Plattform bietet, mit der Sie wertvolle Datenanalysen aus jeder Form von Daten erhalten können. Es verfügt auch über vielfältige Funktionen wie z.B. Warehousing, Fehlererkennung und Marktkampagnenanalyse. Es ist relativ preiswert zu installieren und man kann damit ganz einfach Daten mehrfach kopieren.

Andererseits können Echtzeit-Datenanalysen sehr langsam sein – insbesondere, wenn Ihre Daten mehr werden, denn all diese Kopien verlangsamen Ihr System. Und vielleicht wollen Sie entsprechend der DSGVO für Sicherheit sorgen – Java ist zwar eine gebräuchliche Programmiersprache, aber wenn Sie all Ihre sensiblen Daten in dieser Sprache haben, können diese durch Cyberangriffe leicht gehackt werden.

Wussten Sie schon?

Doug Cutting, einer der beiden Erfinder von Hadoop, hat es nach dem Stofftier-Elefanten seines Sohnes benannt.

Hadoop basiert auf einer Forschungsarbeit, die Google Ende 2004 veröffentlicht hat. Darin wird das MapReduce-Modell beschrieben, das damals intern für ihre Suchmaschine genutzt wurde.  

Wollen Sie mehr erfahren?

Egal, ob Sie weitere Informationen über unsere schnelle In-Memory-Datenbank suchen, oder unsere neuesten Erkenntnisse, Fallstudien, Videoinhalte und Blogs entdecken möchten, um Sie in die Zukunft der Daten zu führen.