📘 Data Lake
Un Data Lake stocke toutes les données brutes d'une organisation, quel que soit leur format ou leur structure, sans schéma prédéfini, en vue d'analyses futures et exploratoires.
| Caractéristique | Data Lake | Data Warehouse |
|---|---|---|
| Type de données | Data Lake Brutes, non structurées, semi-structurées, structurées | Data Warehouse Structurées, nettoyées, transformées |
| Schéma | Data Lake Schema-on-read (appliqué à la lecture) | Data Warehouse Schema-on-write (appliqué à l'écriture) |
| Objectif principal | Data Lake Exploration, science des données, IA, apprentissage automatique | Data Warehouse Reporting, Business Intelligence, analyses prédéfinies |
| Flexibilité | Data Lake Très élevée (pas de structure imposée) | Data Warehouse Plus faible (structure rigide et prédéfinie) |
| Coût d'ingestion | Data Lake Généralement plus faible (stockage brut) | Data Warehouse Généralement plus élevé (transformation, nettoyage) |
| Performance | Data Lake Variable, dépend de l'outil et de la complexité de la requête | Data Warehouse Optimisée pour les requêtes structurées et rapides |
Un Data Lake stocke toutes les données brutes d'une organisation, quel que soit leur format ou leur structure, sans schéma prédéfini, en vue d'analyses futures et exploratoires.
Un Data Warehouse stocke des données structurées, nettoyées et transformées, optimisées pour le reporting, l'analyse métier (BI) et les requêtes prédéfinies.
Pour le Data Lake, pense à un grand lac naturel : l'eau est brute, abondante, non traitée, et son usage futur n'est pas encore défini (pêche, baignade, irrigation). C'est le royaume de l'exploration et de la découverte. Pour le Data Warehouse, visualise un entrepôt commercial : tout est classé, organisé méticuleusement par catégories spécifiques et étiqueté, prêt à être livré pour des besoins précis et bien connus (produits de consommation courante). C'est la clarté et la structure pour une utilisation immédiate.