x
    Glossary

    Einführung

    Mit Azure Synapse Analytics lassen sich Datenintegration, Datenexploration, Data Warehouse und Big-Data-Analysen zu einem unbegrenzten Analysedienst vereinen. Über eine einzige Plattform können Anwender ihre Anforderungen an Data Engineering, Data Science und Machine Learning bündeln, ohne separate Tools und Prozesse verwalten zu müssen.

    Welche Funktionen bietet Azure Synapse?

    Azure Synapse nutzt die vertraute SQL-Sprache und ermöglicht so die Abfrage relationaler und nicht-relationaler Daten. Die Datenanalyse und -exploration kann entweder serverlos mittels bedarfsgesteuerter Abfragen für Ad-hoc-Analysen oder mithilfe bereitgestellter Ressourcen (dedizierter SQL-Pool) für vorhersehbare und anspruchsvolle Data-Warehouse-Anforderungen erfolgen.

    • Ein serverloser SQL-Pool ermöglicht den Zugriff auf externe Dateien in Azure Storage, ohne dass Daten per T-SQL kopiert oder an einen anderen Speicherort geladen werden müssen. Synapse-Arbeitsbereiche beinhalten diesen Dienst standardmäßig, sodass Benutzer ihn direkt nach der Erstellung ihres Arbeitsbereichs nutzen können. Dadurch entfällt die Wartung der Infrastruktur und es entstehen keine Betriebskosten. Die Abrechnung erfolgt nutzungsbasiert, die Kosten richten sich also ausschließlich nach den durch Abfragen verarbeiteten Daten. Mithilfe von Datenbudgets (TB) lassen sich die Kosten für die täglich, wöchentlich oder monatlich genutzten Daten kontrollieren.

    • Ein Enterprise Data Warehouse profitiert von einem dedizierten SQL-Pool. Die Daten werden in Tabellen mit spaltenorientierter Speicherung abgelegt, was die Performance verbessert und Kosten senkt. Für die Ausführung von Abfragen wird zudem eine Architektur für massiv parallele Verarbeitung genutzt. Diese Funktion ist in Azure Synapse Analytics nicht standardmäßig aktiviert. Es ist erforderlich, einen Pool zu erstellen und die gewünschten Leistungsstufen auszuwählen, die später angepasst werden können. Die Kosten eines dedizierten Pools werden pro Stunde berechnet, lassen sich aber durch bedarfsgerechtes Skalieren des Dienstes steuern. Pools können bei Nichtgebrauch pausiert werden.

    Welche Funktionen bietet Azure Synapse Analytics?

    Neben all diesen Kernfunktionen bietet Azure Synapse Analytics auch die folgenden Features:

    Erkundung von Datenseen

    Die Datenanalyse war bei manchen Dateiformaten nicht immer einfach und erforderte zusätzliche Tools. Eine Parquet-Datei beispielsweise eignet sich zwar hervorragend zum Speichern, ist aber aufgrund der starken Komprimierung umständlich zu lesen. Mit Synapse können wir per Rechtsklick auf eine Datei diese mit einem SQL-Skript öffnen.

    Sprachwahl

    Je nach Präferenz können die Nutzer zwischen T-SQL, Python, Scala, Spark SQL oder .Net für serverlose oder dedizierte Ressourcen wählen.

    Ressourcen verwalten und überwachen

    Bietet branchenführende Compliance- und Sicherheitsfunktionen. Single Sign-On mit Azure Active Directory-Integration.

    Unterstützung für Delta Lake

    Diese Plattform ist mit Delta Lake von der Linux Foundation kompatibel. Delta Lake ist eine Open-Source-Speicherschicht, die ACID-Transaktionen (Atomarität, Konsistenz, Isolation, Dauerhaftigkeit) für Apache Spark-Workloads und Big-Data-Workloads bereitstellt. Zusätzlich bietet sie Time Travel (Datenversionierung) und unterstützt skalierbare Metadaten.

    Synaptischer Pfad für Azure

    Dieses Tool vereinfacht und beschleunigt die Migration von lokalen und Cloud-basierten Data Warehouses zu Azure Synapse Analytics. Durch die Verbindung zum Quellsystem analysiert es Details zu Datenbankobjekten und erstellt einen Bewertungsbericht.

    Die Azure Synapse Analytics-Plattform ermöglicht schnellere Erkenntnisse durch eine einheitliche Analyseumgebung, die kostensparende Analysen erlaubt. Dank ihrer intelligenten Architektur, die Speicher- und Rechenressourcen trennt, ist sie ein kosteneffizienter Dienst. Dies bietet Unternehmen hohe Flexibilität. Die Plattform lässt sich problemlos von kleinen Proof-of-Concept-Projekten bis hin zu Produktionsumgebungen skalieren. Bei Bedarf können Ressourcen pausiert werden, um Kosten zu begrenzen. Alle von Data Engineers und Data Scientists benötigten Tools sind in dieser einheitlichen Umgebung zentral verfügbar.

    Mehr dazu – Azure Synapse Analytics: Die ursprüngliche Architektur und Vorteile