Formation : Découvrir relations et clusters dans les grands ensembles de données


EPSILON expert Data Science vous propose une formation dispensée par ses experts pour mettre en œuvre les techniques de statistiques exploratoires adaptées à l'analyse de tableaux multidimensionnels.

Comment analyser et résumer les jeux de données possédant plus de 2 dimensions ?
Les techniques statistiques d'analyse de données multivariées y répondent en proposant des outils de projection dans un espace réduit ainsi que des outils de regroupements des individus partageant des caractéristiques communes.
Ces techniques font partie de l'apprentissage dit non supervisé et sont souvent utilisés pour découvrir les thématiques principales et constituer des segmentations.

datadockNous sommes fiers d'être centre de formation Datadock, pour diffuser en continu le meilleur de la Data et de la Technologie auprès des professionnels de la Data Science, de la Dataviz et de l'Activation Marketing Adtech et Martech. 
Enregistré sous le numéro 11754361075. Cet enregistrement ne vaut pas agrément de l'Etat.

OBJECTIFS DE LA FORMATION ET COMPÉTENCES VISÉES


L’objectif de la formation est mettre en oeuvre sous R (possible en python) :

  • Mettre en œuvre les techniques de réduction pour projeter les individus dans un espace réduit pertinent
  • Regrouper statistiquement les individus par clustering
  • Décrire et interpréter les axes et les clusters

PUBLIC CONCERNÉ

  • Data Analyst / Scientist / Data Miner
  • Statisticien, chargé d'études,
  • Analyste
  • Ingénieur, développeur

PRÉREQUIS

  • Maîtriser l'environnement R (librairies, langages, Rstudio)
  • Avoir des connaissances en statistiques descriptives et mathématiques (moyenne / variance, matrices...)

MÉTHODES PÉDAGOGIQUES

  • Alternance des modalités pédagogiques : exposé, démonstration pratique, échanges collectifs, exercices pratiques et remise du support de formation.
  • Questionnaire d’évaluation administré à l’issue de la formation.
  • Durée
    2 jours / 14h
    9h - 17h30

  • Dates des sessions :
    contactez-nous

  • PRIX
    1 450 €HT
    (1 740 €TTC)

INTRODUCTION ET FONDAMENTAUX :


  • Analyse de données multidimensionnelles
  • Les applications
  • Panorama des librairies et fonctions R
  • Statistiques univariées et bivariées : analyser les relations entre variables (chi2, pearson...)

 

MODULE 1 : RÉDUCTION DE DIMENSION ET ANALYSE FACTORIELLE


  • Pourquoi réduire les dimensions : démonstration sur la compression d'une image
  • Analyse des correspondances
  • Analyse en composantes principales
  • Choisir et interpréter les axes
  • TP : interpréter et mettre en avant des axes qui structurent un jeu de données

 

MODULE 2 : CLUSTERING ET SEGMENTATION


  • Inertie inter et intra classes
  • Les techniques de clustering : kmeans, dbscan, classification ascendante hiérarchique
  • La classification mixte : complémentarité des méthodes
  • Caractérisation des clusters
  • TP construction d'une segmentation

Votre formateur



Damien
Senior Manager Data Science

20 ans d'expérience en traitement, analyse et science des données.
Expert sur les techniques statistiques usuelles ainsi que sur les méthodologies et technologies à la pointe de la Data Science.

Adresse

Lieu de la formation :

55 quai de Grenelle 75015 PARIS

Je souhaite être recontacté