24 au 25 septembre 2020

Formation : Analyser vos données textuelles avec le NLP


Epsilon développe des solutions utilisant le traitement automatique du langage et propose dans cette formation, une synthèse illustrée et argumentée des bonnes pratiques.

Traitement automatique du langage naturel, natural langage processing, natural langage understanding, text mining constituent un ensemble de fonctionnalités accessibles à travers des librairies Python.
Ces fonctionnalités permettent d'automatiser, simplifier et accélérer de nombreuses tâches : traduction, analyse de thèmes, sentiments, catégorisation, détection d'entités. Il est donc courant aujourd'hui d'incorporer dans de nombreuses solution d'intelligence artificielle ce type de features.

datadockNous sommes fiers d'être centre de formation Datadock, pour diffuser en continu le meilleur de la Data et de la Technologie auprès des professionnels de la Data Science, de la Dataviz et de l'Activation Marketing Adtech et Martech. 
Enregistré sous le numéro 11754361075. Cet enregistrement ne vaut pas agrément de l'Etat.

OBJECTIFS DE LA FORMATION ET COMPÉTENCES VISÉES


L’objectif de la formation est de :

  • Connaitre les concepts, les nombreuses applications, les librairies python adéquates
  • Savoir appliquer sur des documents des traitements de transformation d'analyse lexicale et syntaxique
  • Mettre en oeuvre sur différents cas comme analyse de sentiments, découvertes de topic ou détection d'entités

PUBLIC CONCERNÉ

  • Data Scientist, Data analyst, Data Miner, Chargé d'études
  • Spécialiste en traitement de données
  • Ingénierie data
  • Ingénierie décisionnelle ou BI

PRÉREQUIS

  • Bases Python ou R
  • Appétence data, statistiques, mathématiques
  • Aptitude à la programmation

MÉTHODES PÉDAGOGIQUES

  • Alternance des modalités pédagogiques : exposé, démonstration pratique, échanges collectifs, exercices pratiques et remise du support de formation.
  • Questionnaire d’évaluation administré à l’issue de la formation.
  • Durée
    2 jours / 14h
    9h - 17h30

  • Dates de la session :
    24 au 25
    septembre 2020

  • PRIX
    2 100 €HT
    (2 520 €TTC)

MODULE 1 : INTRODUCTION


  • Définitions, applications : entités, intentions, sentiment, chatbot, traduction
  • Typologie des données : email, conversations, documents
  • Différentes écoles : linguistique, statistique, neuronale
  • Typologies des outils : framework, logiciels, services sur étagère
  • Python : re, nltk, spacy, sklearn, keras

 

MODULE 2 : APPROCHE STATISTIQUE MACHINE LEARNING


  • Importance de l'annotation
  • Normalisation, analyse lexicale, syntaxique
  • Statistiques : tf.idf, matrice Term x Document, co-occurrence
  • Classificateur de machine learning
  • TP classification supervisée analyse de sentiments
  • TP non supervisé topic modeling (LDA/NMF)

 

MODULE 3 : APPROCHE DEEP LEARNING


  • Boite à outil apprentissage : train/test, métrics, epoch, loss,
  • Architecture deep : embeddings, réseaux récurrents, dense
  • Embeddings : préentrainés vs. ré-entraînés Glove, W2V
  • TP classification supervisé avec embeddings et LSTM
  • TP reconnaissance d'entités nommées, exemple nom prénom
  • Modèle pré entrainés, innovations récentes BERT like

Votre formateur



Anaël
Senior Manager Data Science

Expert datascience et NLP, il dispose d'une expérience multi projets de mise en œuvre de fonctionnalités NLP à travers Python dans le but de construire des solutions automatisées.

Adresse

Lieu de la formation :

55 quai de Grenelle 75015 PARIS

Je souhaite être recontacté