Toutes nos formations sont désormais disponibles en "Live Virtual classes". Contactez-nous pour plus d’informations : formation@oxiane.luToutes nos formations sont désormais disponibles en "Live Virtual classes". Contactez-nous pour plus d’informations : formation@oxiane.lu

Hadoop l'écosystème

Accueil » Formations » Hadoop l’écosystème
700 € HT 1 jour DB-HDE

Programme

Introduction

  • Rappels sur NoSQL
  • Le théorème CAP
  • Historique du projet hadoop
  • Fonctionnalités : stockage, outils d’extraction, de conversion, ETL, analyse, …
  • Exemples de cas d’utilisation sur des grands projets
  • Les principaux composants : HDFS pour le stockage et YARN pour les calculs
  • Les distributions et leurs caractéristiques (HortonWorks, Cloudera, MapR, EMR, Apache, …)

L’architecture

  • Terminologie : NameNode, DataNode, ResourceManager
  • Rôle et interactions des différents composants
  • Présentation des outils d’infrastructure : ambari, avro, zookeeper
  • Présentation des outils de gestion des données : pig, oozie, tez, falcon, sqoop, flume
  • Présentation des outils d’interfaçage avec les applications GIS
  • Présentation des outils de restitution et requêtage : webhdfs, hive, hawq, impala, drill, stinger, tajo, mahout, lucene, elasticSearch, kibana
  • Les architectures connexes : spark, cassandra

Exemples interactifs

  • Démonstrations sur une architecture Hadoop multi-nœuds
  • Mise à disposition d’un environnement pour des exemples de calcul

Travaux pratiques

  • Intégration de données avec Flume
  • Calculs map/reduce avec Pig
  • Hive
  • Impala

Applications

  • Cas d’usages de hadoop
  • Calculs distribués sur des clusters hadoop