Big Data mit der kostenlosen Sandbox von Talend ausprobieren

    Die Big Data Sandbox von Talend packt Hadoop und Co. in Docker-Container.Big Data ist nicht nur für Großfirmen ein Thema, sondern auch für Mittel­ständler. Mit der Big Data Sandbox von Talend können Nutzer mit weniger ausgefeilten Big-Data- und Hadoop-Kenntnissen Big-Data-Anwendungen ausprobieren – ohne Risiko für die IT-Infrastruktur.

    Die Big Data Sandbox besteht aus einem Docker-Container mit einer Hadoop-Distribution "an Bord". Hadoop ist eine Open-Source-Software, mit der sich große Daten­bestände mithilfe von Clustern analysieren lassen. Als Virtualisierungs­plattform empfiehlt Talend entweder VMware oder VirtualBox auf Windows-, Linux- oder macOS-Rechnern.

    Vergleich von Hadoop-Distributionen

    Mithilfe der Sandbox können IT-Fachleute und Entwickler unter­schiedliche Hadoop-Distributionen miteinander vergleichen. Außerdem haben sie die Möglichkeit, einen Blick auf alternative Datenbank-Technologien wie NoSQL-Databases zu werfen. Dasselbe gilt für Machine-Learning-Produkte.

    Besonders interessant dürfte ein Vergleich von Hadoop und Apache Spark sein. Spark ist ein Open-Source-Framework, das, ähnlich wie Hadoop, für die Datenanalyse in Cluster-Umgebungen eingesetzt werden kann. Während Hadoop über ein eigenes File-System (HDFS – Hadoop Distributed File System) verfügt, arbeitet Spark mit unter­schiedlichen Dateisystemen zusammen, auch mit HDFS. Als Vorteil von Spark gilt die hohe Verarbeitungs­geschwindigkeit, die angeblich um bis zu zehn Mal höher liegt als die von MapReduce, der Datenver­arbeitungs-Engine von Hadoop.

    Hilfe durch ein "Kochbuch"

    Aber zurück zur Big Data Sandbox. Ein Bestandteil der Sandbox ist eine Art "Kochbuch". Es enthält eine Anleitung, wie sich typische Big-Data-Anwendungsszenarien implementieren und einsetzen lassen. Dies sind:

    • Die Echtzeitanalyse von Daten aus mehreren Streaming-Quellen.
    • Personalisierte Angebots­empfehlungen auf Grundlage des Kunden­verhaltens. Die Aktionen von Kunden beziehungs­weise Nutzern werden dabei in Echtzeit erfasst. Solche Analysen und darauf aufbauende Empfehlungen sind beispielsweise im Online-Handel wichtig.
    • Eine Clickstream-Analyse, inklusive einer Heatmap.
    • Ein Beispiel, wie sich mithilfe von Apache-Weblogs ein Monitoring von IT-Umgebungen durchführen lässt.
    • Die Analyse von ETL-Aktionen (Extract, Transform, Load), um die Verarbeitung komplexer Workloads zu beschleunigen.

    Testversion mit 30 Tagen Laufzeit

    Talend Big Data Sandbox - Ein Einsatzbeispiel aus dem "Kochbuch" mit MapReduce.Durch Experimentieren in dieser virtuellen Umgebung können IT-Manager laut Talend Budgets kalkulieren und die Roll-out-Zeiten von Big-Data-Lösungen abschätzen. Unter dem Strich soll die Sandbox eine valide Abschätzung des Aufwands und des Nutzes eines Big-Data-Projekts für ein Unternehmen ermöglichen.Hinzu kommt der "Lerneffekt" für Administratoren und IT-Verantwortliche, die solche Projekte planen und umsetzen.

    Interessenten können von dieser Web-Seite eine Testversion der Big Data Sandbox herunterladen. Die "Bezahlung" erfolgt in Form der Adressdaten. Auf einer anderen Web-Seite steht eine weitere Testausgabe der Sandbox für die Hadoop-Distribution von MapR zur Verfügung. Laut Talend dauert es rund 20 Minuten, bis eine Testumgebung einsatzbereit ist. Auch IT-Fachleute, die noch keine Erfahrung mit Big Data, Hadoop, Spark und Co. haben, sollen dies in besagtem Zeitrahmen "hinbekommen".

    Weitere Informationen

    Laut Talend dauert es rund 20 Minuten, bis eine Testumgebung einsatzbereit ist. Auch IT-Fachleute, die noch keine Erfahrung mit Big Data, Hadoop, Spark und Co. haben, sollen dies in besagtem Zeitrahmen "hinbekommen".

    Das Talend Big Data Sandbox Cookbook ist auf dieser Web-Seite verfügbar. Hochgradig nervig ist, dass selbst Produktunterlagen erst nach Registrierung verfügbar sind. Das ist denn doch des Guten zu viel, was das Generieren von Adressdaten betrifft. Aber für solche Fälle gibt es bekanntlich "Workarounds" ...

    Keine Kommentare