22 au 24 septembre 2020

Formation : Python pour Data Scientists


Python est un langage et un environnement de développement qui aujourd’hui est massivement utilisé par la communauté des Data Ingénieurs et Data Scientists pour ses fonctionnalités statistiques-mathématiques, ses API et ses capacités à traiter, analyser et représenter les données :
  • Il est libre de droit et simple d’installation
  • Il est utilisé en local, en serveur et/ou en environnement Big Data
  • Il est actuellement utilisé pour mettre en production des solutions s’appuyant sur la Data Science
  • Il donne accès aux fonctionnalités de Data Science les plus innovantes : NLP, Deep Learning, IA as a service

datadockNous sommes fiers d'être centre de formation Datadock, pour diffuser en continu le meilleur de la Data et de la Technologie auprès des professionnels de la Data Science, de la Dataviz et de l'Activation Marketing Adtech et Martech. 
Enregistré sous le numéro 11754361075. Cet enregistrement ne vaut pas agrément de l'Etat.

OBJECTIFS DE LA FORMATION ET COMPÉTENCES VISÉES


L’objectif de la formation est d’apprendre à programmer en Python dans le but de :

  • Manipuler et explorer ses données 
  • Réaliser des modèles prédictifs basés sur des algorithmes de Machine Learning
  • Mettre en oeuvre des méthodologies de clustering dans un objectif de segmentation

PUBLIC CONCERNÉ

  • Data Scientist / Data Miner
  • Débutant en Python
  • Statisticien
  • Marketer spécialiste de la Data
  • Utilisateur de bases de données intéressé par l’analyse

PRÉREQUIS

  • Connaissances en statistiques
  • Maîtrise d’un autre langage de programmation SAS/VBA/ MatLab/R/C

MÉTHODES PÉDAGOGIQUES

  • Alternance des modalités pédagogiques : exposé, démonstration pratique, échanges collectifs, exercices pratiques et remise du support de formation.
  • Questionnaire d’évaluation administré à l’issue de la formation.

 

  • Durée
    3 jours / 21h
    9h - 17h30

  • Dates de la session :
    22 au 24
    septembre 2020

  • PRIX
    1 900 €HT (2 280 €TTC)

MODULE 1 : LES FONDAMENTAUX
Panorama des fonctionnalités Data


  • Comment situer Python, à quels usages Data répond-il ?
  • Les environnements de travail, bonnes pratiques
  • Langage : généralités, librairies : dataviz, apprentissage
  • Langage et spécificités sur Numpy - Pandas - Maplotlib
  • Data management : importer, auditer, croiser, manipuler les données 
     

MODULE 2 : ANALYSE PRÉDICTIVE
Créer un modèle prédictif


  • Métriques
  • Le Machine Learning
  • Feature engineering
  • Algorithmes supervisés
  • Performance des modèles
  • Applications
     

MODULE 3 : CLUSTERING
Construire une segmentation


  • Analyse factorielle et réduction des dimensions
  • Algorithmes non supervisés
  • Clustering, caractérisation
  • Réaffectation des segments par look-alike
     

Votre formateur



Damien
Senior Manager Data Science

20 ans d'expérience en traitement, analyse et science des données.
Expert sur les techniques statistiques usuelles ainsi que sur les méthodologies et technologies à la pointe de la Data Science.

Adresse

Lieu de la formation :

55 quai de Grenelle 75015 PARIS

Je souhaite être recontacté