Amadea 3
simplifie l'ETL
Par Olivier BIBARD, Décision Micro
Le 29/04/2002.
http://www.01net.com/rdn?oid=186478
Le logiciel d'ETL d'ISoft se caractérise par sa facilité d'emploi
ainsi que par ses multiples options de paramétrage.
Longtemps réservés aux grands comptes disposant d'équipes
de développeurs expérimentés, les ETL (outils d'extraction et
de transformation de données) se démocratisent. Amadea 3 d'ISoft
en est l'illustration. Destiné autant à l'alimentation des bases
de données d'un data warehouse qu'à l'agrégation de données
pour l'analyse décisionnelle, ce logiciel est composé d'un module
d'exécution et d'un studio de conception des processus. Si le
premier, installé sur un serveur Windows 2000, se déclenche
par une simple commande de script, le second, fonctionnant sur
PC avec Windows 2000 ou NT, constitue le coeur du logiciel.
Entièrement graphique, il permet, à l'aide de la souris, de
définir les enchaînements de tâches nécessaires à l'extraction
et à la transformation des données. Nous l'avons testé sur un
Pentium 4 à 2 GHz, doté d'1 Go de RAM et nous avons créé les
opérations pour analyser l'impact de campagnes marketing.
Une interface conçue pour travailler avec la
souris
Au premier abord, l'interface d'Amadea 3 surprend par sa
concision. Tout a été conçu pour une utilisation à la souris.
À gauche de l'écran, des icônes symbolisent les connecteurs
d'accès aux bases sources. Un glisser-déplacer sur le plan de
travail central donne accès aux données de fichiers texte, Excel,
de tables Oracle, Microsoft SQL Server, IBM DB2 (en mode standard)
et à des fichiers d'événements de serveurs web. Dans notre test,
la base d'origine réunissait 20 000 clients et leur historique
d'achats selon les dates, les numéros de produits et les quantités
vendues. Celles-ci sont d'ailleurs aussi stockées dans les tables
de notre base et représentent un total de 5 millions de transactions.
Amadea propose, préalablement à toute opération, des fonctions
de prévisualisation des tables avec leurs statistiques descriptives.
Il offre également la possibilité de mettre en forme les
enregistrements. Fait saillant, le logiciel effectue une copie
partielle ou intégrale des données dans sa mémoire cache et
ne travaille pas directement sur les tables ou les fichiers
originaux. Il nécessite ainsi un espace disque important, mais
n'est pas dépendant d'un moteur de base de données particulier.
L'étape suivante consiste à paramétrer les transformations
à l'aide d'opérateurs symbolisés eux aussi sous forme d'icônes.
Une trentaine d'opérateurs permettent d'effectuer diverses opérations
sur les données ou les métadonnées stockées dans les tables
(création de champs, union, tableau croisé...). Ainsi, nous
avons pu réaliser facilement une agrégation de données intervenant
dans le processus global de transformation. Cette agrégation
regroupe des clients sur une période définie afin de calculer
un chiffre d'affaires.
Autre option, Amadea permet de relier des tables différentes
par le biais de jointures. Comme avec l'agrégation, il suffit
alors de relier les icônes des bases d'origine par un trait,
et de saisir, dans les fenêtres d'un assistant, le type de jointure
et les champs communs entre les tables qui serviront de base
à l'opération. Par ailleurs, des fonctions mathématiques autorisent
des traitements précis, comme la manipulation de dates. Il ne
reste ensuite qu'à définir le format de sortie des résultats
par le choix du symbole correspondant au logiciel choisi : fichier
Excel, CSV, ou XML. Chaque opération fait l'objet d'un retour
de la part du logiciel, celui-ci signalant si le traitement
est possible. Une fois réalisé, l'ensemble du processus est
stocké par Amadea sous forme de fichier XML réutilisable. Il
sera lu ensuite par le module d'exécution du serveur de production.
|
|
|
|
Amadea 3 d'ISoft : logiciel d'extraction et de
transformation de données pour Windows NT et 2000. Il
possède également un module web fonctionnant aussi bien
sur Apache que Microsoft IIS et donnant accès aux processus
de modélisation à distance.
Prix : 53 357 euros ht par serveur (module
web compris).
Amadea est destiné à toutes les entreprises manipulant
de vastes quantités de données. Les grands comptes sont
bien sûr les plus concernés par ce type de logiciel.
Le marché des ETL est assez réduit. Amadea côtoie ainsi
DataStage XE 2 d'Ascential, qui présente des fonctions
similaires pour 60 679 euros ht. De même, PowerCenter
5.1 d'Informatica travaille quasiment en temps réel, comme
ses concurrents.
- Manipulations simples.
- Interface très claire.
- Commentaires sur chaque opération de
transformation modélisée.
- Nécessite beaucoup d'espace
disque.
|
|
|
|
|
|