L'ETL : un champ d'application étendu
Par Olivier Bibard, Décision Micro
Le 17/06/2002.

http://www.01net.com/rdn?oid=189119

De l'alimentation d'un data warehouse ou d'un progiciel à partir de sources hétérogènes à l'interface entre PGI, les logiciels d'ETL offrent de multiples fonctions.

Longtemps réservés aux grands comptes, les outils d'extraction traînent une réputation de complexité largement usurpée. Les utilisateurs rencontrés sont unanimes : les ETL (Extract, Transform and Load) sont des logiciels « comme les autres ». En revanche, ils surprennent par l'étendue de leur champ d'application. Alain Chapelet, directeur de l'informatique de gestion des éditions du Juris-Classeur, énumère les utilisations d'Amadea, le logiciel d'ETL du français ISoft : « Il nous sert aussi bien à alimenter notre nouveau progiciel de gestion intégré qu'à approvisionner notre entrepôt de données ou encore à réaliser du reporting sur les données de production. »

Choisir le bon outil

Pour Hervé Reibel, responsable des études et des développements informatiques de Bellini-Gutenberg, l'ETL est un moyen de faire dialoguer entre eux plusieurs progiciels différents et d'alimenter des entrepôts de données. Autre avantage de l'ETL, comme le détaille Hervé Reibel, utilisateur de DataStage, d'Ascential : « Les outils de développement classiques, liés à des bases de données comme FoxPro ou Access, n'ont pas les performances des ETL. De plus, ils constituent plusieurs applications à administrer. » Un point de vue partagé par Éric Bouillet, responsable de l'informatique de MPO France : « Nous avons décidé de développer toutes les interfaces avec un seul outil, Sunopsis. » Quant aux résultats, ils semblent à la hauteur. Chez Bellini-Gutenberg, les temps d'alimentation des entrepôts de données ont été divisés par quatre. « Nous avons été surpris par les performances du système, s'exclame Alain Afios responsable développement des systèmes d'information pour le département clinique d'Aventis. Nous utilisons PowerCenter d'Informatica pour donner aux utilisateurs, par le web, l'accès aux informations contenues dans des systèmes hétérogènes. Tout s'effectue de manière dynamique et l'extraction, la transformation et l'alimentation de la base cible avec 2,5 Go de données ne demandent que quatre heures. »

Avec un tel potentiel d'utilisation, la sélection d'un logiciel d'ETL apparaît dépendante de nombreux paramètres. Parmi ceux-ci, les compétences internes à l'entreprise, notamment pour choisir entre un ETL orienté SQL, qui demandera une certaine connaissance de ce langage, et un ETL fonctionnant à l'aide d'un langage propriétaire. « ActaWorks, d'Acta, est un outil très graphique mais demande de connaître un minimum de SQL, illustre Franck Zecchin, expert en décisionnel chez Pechiney. En revanche, avec lui, une application de transformation peut être reprise par quelqu'un d'autre que son concepteur. » A contrario, Alain Chapelet désirait un outil sans besoin de programmation SQL : « Un ETL orienté SQL demande un débogage des procédures. »

Une prise en main facile

Mais l'utilisation d'un outil d'ETL n'est pas si complexe, car la majorité des fonctions restent standards, presque intuitives. Alain Chapelet le reconnaît bien volontiers : « Pour nous, insérer un opérateur de transformation consiste à faire glisser une icône à l'écran ! Nous visualisons le résultat en temps quasi réel. Au final, la construction d'un processus demande moins d'une journée. » Quelques jours de formation suffisent pour découvrir l'outil. Quant à la mise en oeuvre du logiciel d'ETL, tous les témoignages concordent sur sa relative facilité. « Pour réaliser la connexion entre nos progiciels et nos entrepôts de données, nous avons été opérationnels au bout d'un mois , témoigne Hervé Reibel. C'est un outil qui s'installe en une heure », reconnaît Franck Zecchin qui souligne cependant la nécessité de réaliser plusieurs transformations afin d'acquérir de l'expérience. Car la manipulation des opérateurs de transformation n'est pas si simple. Franck Zecchin se souvient du manque de compétences des intégrateurs. « Nous avons utilisé ActaWorks en 1998 et, à l'époque, il nous a été difficile de trouver des partenaires extérieurs qui connaissent bien le produit. Nous avons fini par former du personnel en interne. » Une mauvaise expérience que n'a pas vécue Éric Bouillet : « Le recours à un prestataire de services externe pour la mise en oeuvre, nous a permis de nous concentrer sur les besoins fonctionnels. » Agréablement surpris de la stabilité de Sunopsis, le responsable informatique de MPO France n'a rencontré qu'un seul bug, très vite corrigé.

Des coûts importants

Mais le coût du logiciel d'ETL est à la hauteur de ses capacités. Les licences constituent l'essentiel des dépenses. « Un projet ETL à moins de 46 000 euros n'est pas concevable, souligne Alain Chapelet. Cela se mène un peu comme un projet d'EAI. Il y a des produits peu coûteux mais dont les connecteurs vers des logiciels spécialisés se paient très cher. Il faut penser dès le début à toutes les connexions dont on pourra avoir besoin par la suite. » Pour Hervé Reibel, la facture a été de l'ordre de « quelques dizaines de milliers d'euros. Des chiffres à rapporter aux journées de développements si nous avions choisi de tout faire nous-même. Nous avons tout rentabilisé en un an. »


« L'ETL est plus réactif quant aux changements qu'on nous demande d'apporter au système d'information. »

Franck Zecchin, expert en décisionnel.

Pechiney

- Activité : aluminium et emballages.
- Siège : Paris.
- Effectif : 34 500 salariés.
- Chiffre d'affaires : 11 milliards d'euros en 2001.



« Les capacités d'un ETL sont immenses ! »

Alain Chapelet, directeur de l'informatique de gestion.

Éditions du Juris- Classeur, groupe Lexis Nexis

- Activité : éditions juridiques.
- Siège : Paris.
- Effectif : 680 salariés.
- Chiffre d'affaires : 93,5 millions d'euros en 2001.



Des coûts d'achat assez élevés

- Un projet ETL revient assez cher, de l'ordre de 46 000 euros au minimum.
- Les licences représentent une part non négligeable du coût global d'une solution.
- Les compétences externes peuvent être difficiles à trouver lors de l'achat d'un logiciel d'ETL.
- Des séances de conseil de la part de l'éditeur ou de sociétés de services spécialisées permettent de gagner du temps dans les déploiements mais occasionnent des frais supplémentaires.



Des formations nécessaires

- Les manipulations des opérateurs de transformation se révèlent complexes et nécessitent une formation préalable.
- Leur déploiement est complexe car ils constituent l'épine dorsale d'un système d'information hétérogène.
- Certains possèdent des langages de programmation propriétaires qu'il faut maîtriser.
- Ils demandent une administration soutenue.



Des performances exceptionnelles

- Les ETL remplacent tous les moyens précédents mis en oeuvre, principalement des programmes développés en Cobol ou à l'aide d'outils de développement de type FoxPro, Visual Basic... qui réalisent des transferts trop lents.
- Outre l'extraction et l'insertion d'informations d'une base à une autre, les ETL assurent aussi le dédoublonnage des données, ou leur transformation d'une syntaxe applicative à une autre.
- Les ETL possèdent des journaux d'événements permettant de suivre le déroulement des opérations. Certains présentent même les résultats du processus pendant la phase de programmation.
- Certains ETL disposent d'alertes pour prévenir l'administrateur par mail en cas de problème.



Une interface simple

- Les interfaces graphiques sont présentes partout et simplifient la programmation des processus de transformation et d'extraction.
- Plusieurs logiciels d'ETL ont des langages de scripts pour accéder aux fonctions complexes.
- Les champs d'application des logiciels d'ETL sont très larges et couvrent aussi bien l'alimentation des data warehouse que la migration des systèmes.





   © 1999-2001, 01net.