Data Warehouse vs. Data Lake

22. April 2017 Initiativen/Trends

Data Warehouses sind eine bewährte Methode, große Datenmengen zu speichern und verwalten. Seit einiger Zeit ist aber immer öfter auch von Data Lakes die Rede. Gerade im Umgang mit Big Data taucht die Technologie immer wieder auf. Im Grunde sind beide Technologien ein Repository für die Speicherung großer Datenmengen. Was unterscheidet also einen Data Lake von einem Data Warehouse? 

  1. Speicherung von Daten: In einem Data Warehouse werden nur bereits strukturierte Daten abgelegt, die vor ihrer Speicherung einer ausführlichen Analyse unterzogen wurden. Dabei handelt es sich um Daten, die zur Beantwortung spezifischer Fragen dienen oder in einem definierten Bericht verwendet werden. Im Data Lake hingegen werden alle Daten gespeichert – unabhängig von Relevanz, Struktur und Bedarf. Unternehmen können dadurch jederzeit auf alle jemals generierten Daten zugreifen und haben diese stets zur Verfügung. Denn Daten, die heute noch nicht relevant sind, könnten es morgen sein.  Details