Définitions

Data warehouse

Le data warehouse (ou entrepôt de données ou DW ou DWH), également appelé entrepôt de données d'entreprise (EDW), est un système utilisé pour la création de rapports et l'analyse de données . Il concerne donc la partie analytique de l’intelligence artificielle (celle qui ne sert ni automatiser, ni à augmenter, ni à simuler des comportements humains, mais à interpréter les données).

Les data warehouses sont des référentiels centraux de données intégrées provenant d'une ou de plusieurs sources disparates. Ils stockent les données actuelles et historiques dans un seul endroit qui sont utilisés pour la création de rapports analytiques pour les travailleurs tout au long de l'entrep hausse.

Les données stockées dans l'entrepôt sont téléchargées à partir des systèmes opérationnels (tels que le marketing ou les ventes). Les données peuvent passer par un magasin de données opérationnel et peuvent nécessiter un nettoyage des données  pour des opérations supplémentaires afin de garantir la qualité des données avant leur utilisation dans le data warehouse pour la génération de rapports.

Le datawarehouse ETL (extraction, transformation, chargement) typique utilise le staging, l’intégration des données et des couches d'accès pour héberger ses principales fonctions. La couche intermédiaire ou la base de données intermédiaire stocke les données brutes extraites de chacun des systèmes de données sources disparates. La couche d'intégration intègre les ensembles de données disparates en transformant les données de la couche intermédiaire en stockant souvent ces données transformées dans une base de données de stockage de données opérationnelles (ODS). Les données intégrées sont ensuite déplacées vers une autre base de données, souvent appelée base de données datawarehouse, dans laquelle les données sont classées en groupes hiérarchiques (dimensions) et en faits et faits agrégés. La combinaison de faits et de dimensions est parfois appelée schéma en étoile . La couche d’accès aide l’utilisateur à récupérer les données.

La source principale des données est nettoyée, transformée, cataloguée et mise à la disposition des managers pour le data mining, le traitement analytique, les études de marché et l’aide à la décision. Cependant, les moyens pour récupérer et analyser des données, extraire, transformer et de charger des données et de gérer le dictionnaire de données sont également considérés comme des composants essentiels d’un système d’entreposage de données. De nombreuses références au data warehouse s’inscrivent dans ce contexte plus large et on associe au data warehouse des outils d' aide à la décision, des outils pour extraire, transformer et charger des données dans le référentiel, ainsi que des outils pour gérer et récupérer des métadonnées (alors que cela releverait plutôt du champs du data mining).

Recevez des exclus !

Contenus liés

Abonnez-vous et recevez des infos en exclu

24pm academy
17 rue etex 75018 Paris
O6 62 55 OO 1O

Search