Objectif :Acquérir des compétences en croisement de données issues de plusieurs sources hétérogènes (modèles, formats et outils différents) afin de constituer une base de données plus riche.
Public visé : Architectures, Chefs de projets, Data scientists et toute personne souhaitant travailler sur de grands volumétries de données
Prérequis : Connaissance des bases de données, programmation Java (niveau confirmé)
Durée : 3 jours (formation courte), 5 jours (formation longue)
Contenu du cours :
● Intégration classique en mode ETL :
○ Cours : définition et enjeux, architectures d’intégration
○ TP sur Talend Data Integration
● Intégration en mode ELT dans un SGBD :
○ Concepts et architecture
○ TP sur Talend ELT et SGBD Oracle, MySQL ou PostgreSQL
● Intégration de données dans le Big Data en mode ELT sous Hadoop :
○ Concepts et architecture
○ Rappels de HDFS, Hive, Pig et HBase
○ TP sur Talend Big Data et Hadoop (distribution Cloudera ou Hortonworks)