
Fassen Sie diesen Blogbeitrag wie folgt zusammen:
Wenn Ihre Geschäftsprozesse durch hohe Verzögerungskosten beeinträchtigt werden, wissen Sie bereits um die Bedeutung von Echtzeit-Datenstreaming und dessen Analyse für wertvolle Geschäftseinblicke. Doch in einem Umfeld, in dem Agilität ebenso wichtig ist wie Innovation, findet Echtzeit-Stream-Analytics immer breitere und bewährte Anwendung.
Was ist Streaming Analytics?
Streaming Analytics bezeichnet die Verarbeitung und Analyse großer Mengen von Echtzeitdaten, d. h. die Durchführung von Aktionen auf Basis von Echtzeitdaten mittels kontinuierlicher Abfragen. Im Gegensatz zur stapelweisen Datenverarbeitung, die mitunter veraltete Informationen liefert, ermöglicht Streaming Analytics Unternehmen, von den Daten in Bewegung zu profitieren, um verpasste Chancen zu nutzen und neue zu erschließen.
Bevor wir die traditionelle und moderne Architektur von Stream Analytics sowie die Top 5 Plattformen oder Tools zur Durchführung von Data Stream Analytics kennenlernen, müssen wir die Anwendungsfälle von Streaming Analytics zur Durchführung von Big-Data-Echtzeitanalysen verstehen.
- Erkennung und Vorhersage von Störungen bei Maschinen oder Fahrzeugen jeglicher Art auf Basis der von IoT-Sensoren und -Geräten übermittelten Daten.
- Echtzeit-Empfehlungen, angereichert mit geografischen Präferenzen, für einen Nutzer, der über die mobile oder Web-Oberfläche eines E-Commerce-, Streaming-Video- oder Reiseportals surft.
- Online-Gaming-Unternehmen bieten realitätsnahe und fesselnde Erlebnisse in einer virtuellen Welt.
- Finanzportfoliomanager passen ihre Bestände auf Basis von Echtzeit-Risikoanalysen anhand von Börsendatenströmen an.
- Soziale Medien und andere Plattformen zur Interaktion mit Nutzern durchsuchen täglich generierte Datenmengen in der Größenordnung von Quintillionen, um die Nutzer vor Inhalten zu schützen, die als betrügerisch, mobbend, gewalttätig oder in irgendeiner Weise anstößig eingestuft werden könnten.
- Die kontinuierliche Überwachung des Gesundheitszustands des Patienten soll eine rechtzeitige Behandlung gewährleisten.
- Unternehmen aus dem Einzelhandel und dem Gastgewerbe können schnell auf Kundenanfragen wie Nachbestellungen, Artikel im Warenkorb, Rückgabeanfragen oder Beschwerden reagieren.
Der traditionelle Ansatz besteht darin, mehrere Tools zu kombinieren, um den gewünschten Zweck zu erfüllen. Dies umfasst typischerweise vier Schritte. Zunächst müssen die Daten sequenziell und ohne Unterbrechung von der Quelle gestreamt werden; dies übernimmt ein Stream-Prozessor.
Zweitens müssen die Daten aus diesen verschiedenen Streamprozessoren extrahiert und anschließend transformiert und geladen werden – dies geschieht mithilfe eines ETL-Tools.
Drittens werden die Daten in einen Streaming-Datenspeicher geladen, typischerweise in einen Data Lake, da dieser im Vergleich zu anderen Optionen kostengünstig und flexibel ist.
Schließlich der vielleicht wichtigste Schritt: ein Analysesystem, um diese riesigen Datenmengen sinnvoll auszuwerten. Geschäftsanwender benötigen Erkenntnisse nach der Durchführung analytischer/statistischer Operationen wie Stichproben, Clustering, Korrelationen und mehr.
Dieser Ansatz erfordert die ständige Überwachung der Server, die Suche nach Software-Updates oder -Installationen sowie die Verwaltung der Skalierungsanforderungen. Ein erheblicher Zeitaufwand wird für die Einrichtung der Grundlagen und den Empfang der Datenströme benötigt.
Sie möchten Echtzeitdaten optimal nutzen?
Nutzen Sie Stream-Analytics-Lösungen, um Daten vom Moment ihrer Entstehung an besser zu organisieren, nützlicher zu machen und zugänglicher zu gestalten.
SPRECHEN SIE MIT UNSEREN EXPERTEN
Der moderne Ansatz zur Datenstromanalyse ist besser auf die Geschäftswerte ausgerichtet, schnelle und selbstbedienbare Funktionen bereitzustellen und gleichzeitig die Abhängigkeit von den IT-Abteilungen für jede kleine oder alltägliche Tätigkeit zu verringern.
Diese Plattformen bieten eine Komplettlösung zur Verarbeitung, Speicherung und Umwandlung von Ereignisströmen in analysereife Daten und anschließende Geschäftseinblicke. Diese leistungsstarken In-Memory-Engines sind als PaaS-Angebote verfügbar, sodass Sie sich nicht um die Bereitstellung von Hardware oder die Serververwaltung kümmern müssen.
In puncto Sicherheit punkten diese Plattformen, da sie keine Daten speichern, weil die Verarbeitung größtenteils im Arbeitsspeicher erfolgt und die Daten selbst dann verschlüsselt sind. Auch hinsichtlich der Flexibilität bieten sie Nutzern die Möglichkeit, die Funktionalität ihrer Umgebung mit Open-Source- und Drittanbieter-Tools zu erweitern.
Was die Leistungsfähigkeit angeht, bieten die führenden Streaming-Datenplattformen unbegrenzte Skalierbarkeit, um Millionen von Streams oder Ereignissen pro Sekunde mit extrem niedrigen Latenzzeiten zu verarbeiten.
Azure Stream Analytics:
Dieses Angebot von Microsoft, dem führenden Anbieter von Unternehmenssoftware, ist eine der leistungsstärksten Streaming-Analytics-Plattformen. Azure Stream Analytics kombiniert die Leistungsfähigkeit von SQL, C# und JavaScript mit integrierten Machine-Learning-Funktionen und ermöglicht Unternehmen so die parallele und effiziente Analyse von Multi-Stream-Daten.
Hier ist die Architektur, die der Funktionsweise von Microsoft Azure Stream Analytics zugrunde liegt:
Quelle: Microsoft Docs Vereinfacht ausgedrückt umfasst es: 1) Eingaben aus Azure Event Hub, Azure IoT Hub oder Azure Blob Storage. 2) Eine SQL-Abfrage, mit der die eingehenden Datenströme über einen bestimmten Zeitraum einfach gefiltert, verknüpft, sortiert und aggregiert werden können. 3) Die Ausgabe – ein oder mehrere Ausgaben – der verarbeiteten Daten, die für verschiedene Anwendungen genutzt werden können.
Amazon Kinesis
Amazon Kinesis ist eine Plattform, die sich nahtlos in die führende Cloud-Plattform AWS integriert und auch andere Cloud-Plattformen unterstützt. Sie ermöglicht das reibungslose Streaming von Big Data mit AWS. Besonders hervorzuheben ist die Unterstützung für Open-Source-Java-Bibliotheken und einen SQL-Editor.
Die Flexibilität von Amazon Kinesis ermöglicht es Unternehmen, zunächst einige grundlegende Erkenntnisse und Berichte einzurichten und diese später je nach Expertise zu erweitern, um Modelle des maschinellen Lernens zur Mustererkennung und Automatisierung von Erkenntnissen einzusetzen.
Hier ist eine typische Architektur für Datenstromanalysen mit Amazon Kinesis.
Quelle: AWS Google Cloud Dataflow
Dies ist eine neue Erweiterung von Googles Stream Analytics. Die Plattform nutzt Python 3 und das Open-Source-SDK Apache Beam, um sowohl Streams als auch Batch-Daten zu verarbeiten. Die Kombination aus 1) Apache Beam und Python 3 zur Definition von Datenpipelines und zum Extrahieren von Daten aus verschiedenen Edge-Quellen, 2) Pub/Sub-basierter Datenerfassung und 3) Google BigQuery zur Gewinnung aussagekräftiger Erkenntnisse in Echtzeit macht sie zu einem der besten Stream-Analytics-Tools. Diese fragmentierte Bereitstellung vereinfacht den Datenzugriff und stellt die Daten sowohl Dateningenieuren als auch Analysten zur Verfügung.
Hier ist eine typische Architektur für Datenstromanalysen mit Google Cloud DataFlow.
Quelle: Google Cloud Apache Kafka
Apache Kafka lässt sich sowohl lokal als auch in der Cloud einsetzen. Es handelt sich um eine Kette verteilter Server und Clients, die über das TCP-Netzwerkprotokoll kommunizieren. Die Plattform ist relativ neu, wird aber aufgrund ihrer Fähigkeit, Daten an andere Datenanalyse- oder BI-Plattformen zu senden, immer wieder als leistungsstarkes Tool für Stream-Analytics genannt. Sie wird primär im Backend zur Integration von Microservices und allen wichtigen Echtzeit-Streaming-Datenplattformen verwendet.
Es läuft als Cluster mit mehreren Servern, die über verschiedene Rechenzentren verteilt sind. Die Datenströme dieser Server werden kategorisiert und als „Themen“ gespeichert, die durch eindeutige Kennungen gekennzeichnet sind, welche aus einem Schlüssel, einem Wert und dem Zeitstempel des Datenstroms bestehen.
Es gibt vier Kern-APIs; diese Abbildung hebt jede einzelne hervor:
Quelle: Apache Kafka Die Producer API dient dazu, den Datenstrom in einem oder mehreren Kafka-'Topics' zu veröffentlichen.
Die Consumer-API ermöglicht es den Apps, eine Reihe von „Themen“ zu abonnieren und den ihnen zugestellten Datensatzstrom zu verarbeiten.
Die Streams API ermöglicht es Apps, als Stream-Prozessor zu fungieren und Eingabestreams in Ausgabethemen oder Ergebnisse umzuwandeln.
Connector API erstellt wiederverwendbare Produzenten oder Konsumenten, die „Topics“ mit bestehenden Apps und Datensystemen verbinden.
Schneeflocken-Schneepfeife:
Das letzte Angebot auf unserer Liste stammt von einer Plattform, die kürzlich mit ihrem bisher größten Tech-IPO für Furore sorgte – und das völlig zu Recht: Snowflake . Die Plattform bietet leistungsstarke, einzigartige Funktionen sowie erhebliche Kostenvorteile.
Snowflake Snowpipe automatisiert das Laden von Datenströmen in den S3-Staging-Bereich und anschließend in Snowflake. Es erstellt zudem separate Server für die eingehenden Datenströme aus der Kundenumgebung, um die Arbeitslast zu isolieren. Sie zahlen nur für die tatsächlich genutzte Serverzeit.
Hier ist eine typische Architektur für Datenstromanalysen mit Snowflake Snowpipe.

Transformieren Sie Ihre Streaming-Daten
Gewinnen Sie in Echtzeit umsetzbare Geschäftseinblicke aus Streaming-Daten und automatisieren Sie Aktionen, um die agilen Geschäftsprozesse von heute voranzutreiben.
KONTAKT AUFNEHMEN
Es gibt zahlreiche weitere Plattformen wie IBM Stream Analytics, Apache Storm und Apache Flink, die leistungsstarke Architekturen für die Echtzeit-Erfassung, -Transformation und -Analyse eingehender Datenströme bieten. Entscheidend ist hierbei der Mehrwert, den Stream Analytics für Unternehmen jeder Größe generiert – egal ob es sich um ein komplexes, international verteiltes Netzwerk handelt oder um ein junges Technologie-Startup, das schnell auf Kundenanfragen reagieren muss.
Wenn Sie Hilfe bei der Auswahl des optimalen Stream-Analytics-Tech-Stacks für Ihr Unternehmen benötigen oder Unterstützung bei dessen Einrichtung brauchen, buchen Sie eine kostenlose Beratung mit unseren Lösungsarchitekten, um den Prozess zu beschleunigen.