samedi, octobre 20, 2012

Choix de l’outil d’extraction « ETL »

Dans le cadre d’une approche de type entrepôt de données, comme la solution proposée ci-dessus, un automate d’alimentation évolué permet de gérer de façon automatique et simple les flux d’information depuis les différents systèmes opérationnels vers l’entrepôt de données :
extraction
filtrage/nettoyage
transformations
chargement
gestion d’un référentiel
suivi d’exploitation

Cet automate permet de :
référencer les structures de données sources et/ou cibles
centraliser les règles de gestion
modéliser l’ensemble des agrégats
définir toutes les règles de transformation
programmer les processus d’alimentation
maintenir les développements

Il permet également de :
planifier les exécutions de chaque processus d’alimentation
ordonnancer les processus d’exploitation
répartir, paralléliser et synchroniser les exécutions.

Choix de la base de données SGBDR

La base de données choisie est Oracle sous Unix. A la vue de la première estimation du volume de la base de données décisionnelle qui est calculée, ce choix me paraît tout à fait approprié et adapté à l’outil décisionnel à mettre en place.

J’émets donc une expression de besoin, pour que le centre de compétences des serveurs centralisé, me dédit un espace disque sur un serveur de production dédié pour la conception du Datawarehouse.


Choix de l’outil de restitution

Parmi les outils d'analyse et de restitution, certains s'adressent à un petit nombre d'utilisateurs, qui sont des décideurs à haut niveau. Leur besoin se tourne vers une analyse poussée, qu'il est possible d'affiner en reformulant différemment la requête. Ces logiciels, qui constituent la spécialité d'éditeurs comme Business Objects, sont regroupés derrière le vocable "applications analytiques". A l'inverse, ceux qui permettent de diffuser les indicateurs vers un périmètre très large d'utilisateurs dans l'entreprise entrent dans le cadre du reporting de masse. Le plus souvent, les requêtes sont pré-paramétrées et ne peuvent pas être affinées, l'objectif étant de réduire au maximum la charge des machines et des réseaux informatiques.

2 commentaires:

Christophe Thiry a dit…

Vous connaissez quels ETL et lesquels vous semblent les plus intéressants ?
Merci
http://urba-si.blogspot.com

Anonyme a dit…

ETL est Genio de open text
Slts