Objectif :Connaître et savoir utiliser la plateforme Spark et ses différentes API
Public visé : Développeur, Ingénieur d’études, Architecte technique
Prérequis : Notions de systèmes distribués, d’architecture distribuée et en programmation objet et fonctionnelle. (optionnel : Hadoop)
Durée : 3 jours (formation courte), 5 jours (formation longue)
Contenu du cours :
● Architecture générale de SPARK : bénéfices et contraintes
● Aperçus de la technologie à travers des projets Open Source
● Parallélisme et distribution de traitement à grande échelle avec Spark.
● Gestion de flux temps réels avec Spark Streaming
● Requêtage de données avec Spark SQL
● Interfaçage avec Hbase ou Cassandra
● Travaux pratiques porteront sur la création d’une mini application Spark s’exécutant sur un mini-cluster.