Concevoir
Adaptez les domaines de conception conceptuelle de l’entreposage de données aux exigences spécifiques en matière de rapports et d’analyse de chaque unité commerciale.
Lorsque vous tentez de créer un entrepôt de données pour des performances optimales, vous devez prendre en compte quelques domaines clés : la configuration matérielle, les modèles de données logiques et physiques et la gestion de la charge de travail. L’environnement de Business Intelligence comprendra des outils d’analyse, de reporting et ETL (extraction, transformation et chargement) ainsi qu’un entrepôt de données avec un ou plusieurs data marts pour créer un système de business intelligence fonctionnel.
La conception conceptuelle consiste à faire en sorte que chaque unité commerciale ait son propre domaine adapté à ses exigences en matière de rapports et d’analyse. Le schéma simple ci-dessous montre la conception de base de la manière dont les données sources sont extraites, transformées et chargées quotidiennement dans l’entrepôt de données via un processus ETL.
Chaque domaine est mis à jour avec les données récemment chargées et mis à la disposition des utilisateurs. Les rapports qui ont été programmés pour être distribués et livrés selon un calendrier prédéfini sont publiés, et enfin, les utilisateurs peuvent effectuer des rapports ad hoc et des analyses personnalisées à l’aide de l’outil frontal.
L’une des grandes fonctions qu’offre un entrepôt de données est de développer des rapports qui sont utilisés mensuellement, hebdomadairement, trimestriellement et annuellement et de les envoyer automatiquement dans votre boîte de réception à une heure planifiée. Il n’est plus nécessaire de recréer ou de réexécuter en permanence ces types de rapports standard.
Le schéma ci-dessous fournit également un exemple de la manière dont l’architecture conceptuelle doit être construite.
L’entrepôt de données est construit sur une architecture à trois niveaux. Chaque niveau peut être géré et mis à l’échelle indépendamment, ce qui augmente la flexibilité. Par conséquent, les composants individuels peuvent évoluer et être rendus hautement disponibles en toute simplicité.
L’architecture à trois niveaux est composée des couches suivantes :
Niveau de données
o Stocke les données de l’entrepôt de données
o Gère le processus ETL de l’entrepôt de données où toutes les données source sont extraites, nettoyées, transformées et chargées dans l’entrepôt de données.
Niveau d’application
o C’est là que toute l’intelligence d’affaires est construite.
o Traite toutes les demandes des utilisateurs.
Niveau de présentation
o Interface utilisateur graphique permettant :
– Rapports
– Une analyse
– Requête
– Cartes de pointage
– Embarquement de tableau de bord
– Gestion d’événements
– Administration des utilisateurs
Le diagramme ci-dessous illustre la conception du niveau d’application, du niveau de présentation et du niveau de données. Les trois couches nécessaires à la construction de l’entrepôt de données sont destinées à montrer non seulement comment construire l’infrastructure, mais également à montrer le flux. L’utilisateur métier ou « analyste » est la personne qui doit effectuer des requêtes, exécuter des rapports et afficher des tableaux de bord qui afficheront les données statistiques nécessaires pour prendre des décisions commerciales. Tout cela est affiché dans le « Niveau de présentation ».
Le «niveau d’application» est destiné à montrer où résident les outils et le matériel de Business Intelligence. Les outils de Business Intelligence se composent d’outils de reporting frontaux tels que Cognos, les outils d’entreposage de données Microsoft, Microstrategy ou d’autres outils.
Le « niveau de données » est destiné à montrer où résident les sources de données. Il peut s’agir de sources internes ou externes qui sont introduites dans l’entrepôt de données. Les serveurs de base de données et les serveurs ETL sont également situés dans ce niveau. Les outils ETL sont utilisés pour prendre les données qui sont introduites dans le système et transformer les données en informations significatives. Il est important de comprendre le volume de données qui seront traitées ainsi que le pourcentage de croissance des données par an, car tout cela aura un impact sur les performances du système.
Laura Paoletti est titulaire d’un baccalauréat ès sciences en systèmes informatiques et a été vice-présidente des technologies de l’information chez NBC-Universal et Disney ABC Television. Elle a également occupé des postes chez Ernst & Young LLP dans la pratique de la technologie. Dans son rôle, elle a été responsable des applications, de l’infrastructure et des médias numériques. Certaines de ses réalisations notables incluent la mise en œuvre d’applications pour les médias numériques, le marketing, les finances, la fabrication (chaîne d’approvisionnement), les ventes et les produits de consommation ; Mise en œuvre de systèmes d’entreposage de données d’entreprise/intelligence d’affaires ; Gestion du centre de données, y compris le matériel, les stratégies de stockage, les bibliothèques numériques et l’expansion du centre de données ; Mise en place d’un bureau de gestion de projet ; et Transformation de l’entreprise d’un environnement sur bande à un environnement sans bande (médias numériques).