Der Fall für moderne Data Warehouses in der Cloud

share

Data-Warehouses sind Business-Intelligence-Systeme, die sowohl für die Berichterstattung als auch für die Datenanalyse eingesetzt werden. Als solche können sie jedem datengesteuerten Unternehmen helfen, sein Geschäftsmodell zu verstehen und zu verbessern.

Im Kern ist ein Data Warehouse ein Speicher für eingehende Daten aus verschiedenen Quellen, der Daten integriert, Berichte erstellt, Analysen liefert und einen umfassenden Überblick darüber bietet, wie sich das Geschäft verbessern lässt. Data Warehouses sind kein neues Konzept, da sie bereits seit vielen Jahren existieren und weit verbreitet sind.

Die Data-Warehouse-Technologielandschaft durchläuft jedoch eine rasante Entwicklung, die in erster Linie von Anwendern vorangetrieben wird, die nach neueren Lösungen suchen, um den Herausforderungen des „Datenzeitalters“ zu begegnen und gleichzeitig die Nachteile älterer Data-Warehouses zu beheben.

Die Herausforderungen mit Legacy Data Warehouses

Viele Unternehmen haben Data Warehouses eingesetzt, um ihre Geschäfte und Unternehmen voranzutreiben. Doch im Laufe der Zeit hat die Effizienz dieser Systeme aus folgenden Gründen abgenommen:

  • Die Wartungs- und Gemeinkosten der bestehenden Data-Warehouse-Systeme sind gestiegen.
  • Die Datenmengen haben zugenommen, was zu Leistungsengpässen geführt hat.
  • Die Daten sind vielfältiger und komplexer geworden, so dass die Integration neuer Datenquellen in die Data Warehouses schwieriger geworden ist.

Legacy-Data-Warehouses verursachen außerdem hohe Lizenzkosten für die verwendeten Server und Knoten, die aufgrund der explosionsartigen Zunahme der Datenmenge gestiegen sind.

Bei älteren Data Warehouses wurden Datenwürfel als primäre Datenmodellierungsstrategie verwendet. Datenwürfel beinhalten von Natur aus die Erstellung von Dimensionen und Fakten für die Datenmodellierung. Mit der explosionsartigen Zunahme des Datenvolumens haben die Beschränkungen von Datenwürfeln zu komplexeren ETL-Pipelines geführt.

Gemäß dem Gesetz von Moore sind Rechenleistung und Speicherplatz aufgrund neuer Verarbeitungsmöglichkeiten billiger geworden, während moderne Data Warehouses aufgrund der höheren Leistung und der besseren Ausnutzung der Rechenleistung immer besser optimiert wurden. Dies ermöglicht es Unternehmen, zusätzliche Optionen für die Verarbeitung, Speicherung und Umwandlung von Daten mit säulenförmigen Architekturen und massiv paralleler Verarbeitung einzubeziehen.

Vor diesem Hintergrund wünschen sich die Anwender Lösungen, die diese Kernpunkte angehen und Leistungsengpässe beseitigen, Skalierbarkeit ermöglichen, Flexibilität bieten und eine bessere Kontrolle über die Abrechnungsgebühren ermöglichen.

Modernes Data Warehousing

Mit der zunehmenden Nutzung von Cloud-Technologien wurden Data-Warehouses in die Cloud integriert und bieten eine überzeugende Alternative. Dies ist besonders nützlich, da sie auch in Data Lakes integriert werden können, was mehr Flexibilität für die Unterstützung großer Datenmengen und die Aufnahme neuerer Datenformate schafft.

Moderne Data Warehouses sind besonders gut geeignet für:

  • skalierbare Workloads
  • neuere Datenquellen
  • strukturierte und halbstrukturierte Daten
  • analytische Berichte und Dashboards
  • entwickelte Datenmodelle
  • Modellierung von Daten
  • optimierte Leistung
  • geringe Gemeinkosten

Mit modernen Data Warehouses können Unternehmen große Datenmengen in einer Vielzahl von Datenformaten ohne Leistungseinbußen aufgrund skalierbarer Dienste und massiv paralleler Verarbeitung in der Cloud verarbeiten und analysieren.

Ein weiterer Vorteil ist die erhöhte Flexibilität bei der Aufnahme neuer Quellen und Datenformate. Dies hat die Verwaltungsaufgaben vereinfacht und spart Zeit und Mühe, verringert die Gemeinkosten und eliminiert Fixkosten und Wartungsaktivitäten.

Moderne Data Warehouses in der Cloud ermöglichen es Unternehmen, die neuesten Innovationen im Bereich der Datenverarbeitung zu nutzen und gleichzeitig die Leistung zu optimieren. Da die Data Warehouses in der Cloud betrieben werden, lassen sie sich auch skalieren, um eine steigende Arbeitslast zu bewältigen, während sie gleichzeitig wieder heruntergefahren werden können, sobald die Arbeitslast erledigt ist. Mit Berechnungs-Engines, die auf modernen Entwurfsmustern und Technologien basieren, wird die Leistung der Datenverarbeitungs-Workloads optimiert.

Darüber hinaus verstehen sich moderne Data Warehouses als Enabler, da sie multifunktional sind und die Fähigkeit besitzen, andere Datenspeicher zu integrieren sowie als Data Lakes und Data Warehouses mit logischen Datenzonen innerhalb ihres Systems zu dienen.

All dies ist entweder auf Basis von Nutzungsgebühren oder Festpreisen verfügbar, was den Anwendern mehr Flexibilität bietet.

Technologische Optionen

Im Folgenden finden Sie die für Cloud-Data-Warehouses verfügbaren Tools und Technologien:

  • AWS Redshift
  • Snowflake
  • Azure Synapse
  • GCP Big Query
  • AWS Athena mit AWS S3
  • Delta Lake

Jeder, der seine bestehenden Legacy Data Warehouses modernisieren möchte, sollte die oben genannten Optionen prüfen, um die beste Lösung für seine Anforderungen zu finden.

Den eigenen „Best Fit“ ermitteln

Wenn Unternehmen eine neue Technologie in Erwägung ziehen, sind viele Faktoren zu berücksichtigen, darunter die Anforderungen, die Leistung, die Kosten und die architektonischen Aspekte.

Daneben gibt es auch verschiedene Komplexitäten, Wartbarkeit und Erweiterbarkeit, die berücksichtigt werden müssen, um die am besten geeignete Technologie für das Unternehmen zu bestimmen.

Moderne Data Warehouses erforschen

Wir bei GlobalLogic haben vielen Unternehmen geholfen, ihre Legacy-Data-Warehouses auf moderne Cloud-Data-Warehouses umzustellen, um die Leistung zu verbessern, Wartungs- und Gemeinkosten zu reduzieren und die Kosten zu optimieren. Wir freuen uns darauf, unsere Partner bei der Bewertung der Eignung moderner Cloud Data Warehouses zu unterstützen, indem wir ihre Bedürfnisse mit ihren Bedürfnisse mit ihren Visionen abgleichen. Wenden Sie sich bitte an unseren Bereich Big Data & Analytics bei GlobalLogic. Wir würden uns freuen, Sie bei solchen Initiativen unterstützen zu können. Kontaktieren Sie uns um mehr zu erfahren.

 

Warehouse robotics thumbnail2

Author

Rahul Barik

Senior Solution Architect, Technology

View all Articles

Blog category

Blog Categories

Top Authors

Mohammad Ashfaque

Mohammad Ashfaque

Senior Lead, Engineering

Rahul Barik

Rahul Barik

Senior Solution Architect, Technology

Julian Groll

Julian Groll

Senior Designer

Werner Nintzel

Werner Nintzel

Senior Software Engineer