24 au 26 mars 2020

Formation Python pour Data Scientists


Python est un langage et un environnement de développement qui aujourd’hui est massivement utilisé par la communauté des Data Ingénieurs et Data Scientists pour ses fonctionnalités statistiques-mathématiques, ses API et ses capacités à traiter, analyser et représenter les données :
  • Il est libre de droit et simple d’installation
  • Il est utilisé en local, en serveur et ou en environnement Big Data
  • Il est actuellement utilisé pour mettre en production des solutions s’appuyant sur la Data Science
  • Il donne accès aux fonctionnalités de Data Science les plus innovantes : NLP, Deep Learning, IA as a service

OBJECTIFS DE LA FORMATION ET COMPÉTENCES VISÉES


L’objectif de la formation est d’apprendre à programmer en Python dans le but de :

  • Manipuler et explorer ses données 
  • Réaliser des modèles prédictifs basés sur des algorithmes de Machine Learning
  • Mettre en oeuvre des méthodologies de clustering dans un objectif de segmentation

PUBLIC CONCERNÉ

  • Data Scientist / Data Miner
  • Débutant en Python
  • Statisticien
  • Marketer spécialiste de la Data
  • Utilisateur de bases de données intéressé par l’analyse

PRÉREQUIS

  • Connaissances en statistiques
  • Maîtrise d’un autre langage de programmation SAS/VBA/ MatLab/R/C

MÉTHODES PÉDAGOGIQUES

  • Alternance des modalités pédagogiques : exposé, démonstration pratique, échanges collectifs, exercices pratiques et remise du support de formation.
  • Questionnaire d’évaluation administré à l’issue de la formation. 
  • Durée
    3 jours / 21h

  • 9h - 17h30

  • PRIX
    1900 €HT (2280 €TTC)

MODULE 1 : LES FONDAMENTAUX
Panorama des fonctionnalités Data


  • Comment situer Python, à quels usages Data répond-il ?
  • Les environnements de travail, bonnes pratiques
  • Langage : généralités, librairies : dataviz, apprentissage
  • Langage et spécificités sur Numpy - Pandas - Maplotlib
  • Data management : importer, auditer, croiser, manipuler les données 
     

MODULE 2 : ANALYSE PRÉDICTIVE
Créer un modèle prédictif


  • Métriques
  • Le Machine Learning
  • Feature engineering
  • Algorithmes supervisés
  • Performance des modèles
  • Applications
     

MODULE 3 : CLUSTERING
Construire une segmentation


  • Analyse factorielle et réduction des dimensions
  • Algorithmes non supervisés
  • Clustering, caractérisation
  • Réaffectation des segments par look-alike
     

Votre formateur



Damien
Senior Manager Data Science

18 ans d'expérience en traitement, analyse et science des données.
Expert sur les techniques statistiques usuelles ainsi que sur les méthodologies et technologies à la pointe de la Data Science.

Adresse

Lieu de la formation :

55, quai de Grenelle 75015 PARIS

Je souhaite être recontacté