Post

LI : Data Lakehouse


Lors de notre proposition d’architecture pour notre client CIMO, nous avions mentionné le concept de data lakehouse qui promettait de combiner les avantages des data lakes et data warehouses sans leurs inconvénients. J’ai donc été approfondir la thématique pour examiner cette possibilité.

Data Lakehouse Diagram d’un data lakehouse

Malheureusement cette solution ne parait pas faite pour eux car le concept est encore très jeune et vise principalement les entreprises ayant énormément de données. De plus, la description théorique du concept de correspond pas toujours à la réalité. En effet, un des fournisseurs de service “data lakehouse” les plus connus, Databricks, ne propose aucun stockage. Toutes les données doivent être stockées chez d’autres fournisseurs comme Azure ou Amazon, alors que Databricks fournit l’interface qui va faciliter le querying des data lakes et data warehouses.

Selon moi ce concept nécessite encore quelques années afin de mûrir.

Le document est disponible ici.

This post is licensed under CC BY 4.0 by the author.