Les outils ETL – Extract Transform Load

Les bases de données opérationnelles (bases de données de la production) sont collectées, transformées et chargées dans le datawarehouse via l’outil ETL qui siginifie Extract Transform Load.

 

Introduction

La business intelligence est l’ensembles des moyens, outils et méthodes permettant de collecter, d’intégrer, de distribuer et de restituer les informations en vue d’offrir une aide de prise à la décision.

Le but de la BI est de récupérer les données brutes depuis les bases de données opérationnelles, fichiers bureautiques, fichiers XML etc. de les transformer et de les diffuser sous forme de tableau de bord ou de reporting.

En effet, Le processus de la BI assurer quatre fonctions qui sont :

  • La collecte
  • La consolidation ou l’intégration
  • La diffusion
  • La restitution

Les deux premières fonctions, la collecte et la consolidation, sont les phases les plus importantes d’un projet BI. Elles représentent les 3 / 4   du projet.

Les outils ETL, acronyme de Extract Transform Load, ont en charge de ces deux fonctions essentielles. Il s’agit en effet de toutes les étapes de la collecte et de la préparation des données.

Alors qu’est-ce qu’un ETL ?

L’ETL est un outil qui accède à de multiples sources de données hétérogènes, en vue d’une extraction, de manipulation et de chargement des données dans un référentiel commun, appelé entrepôt de données ou datawarehouse.

L’ETL remplit 3 fonctions :

  • Extract ou en français extraction.
  • Transform  ou en français transformation.
  • Load ou chargement.

Extraction des données

L’ETL se charge de récupérer toutes les données nécessaires depuis les différentes sources de stockage (SGBD, ERP, fichiers à plat…).

Transformation

Toutes les données ne sont pas utilisables telles quelles. L’ETL procède à un nettoyage, à une conversion et à une structuration des données en vue de les intégrer dans un datawarehouse.

Chargement

L’ETL insère les données dans l’entrepôt de données, le datawarehouse.

Solutions ETL

Voici une liste non exhaustive des principaux outils ETL Open source :

  • Talend
  • Pentaho
  • Spagobi
  • Clover ETL