11 au 12 mars 2021
Formation : Analyser vos données textuelles avec le NLP
Traitement automatique du langage naturel, natural langage processing, natural langage understanding, text mining constituent un ensemble de fonctionnalités accessibles à travers des librairies Python.
Ces fonctionnalités permettent d'automatiser, simplifier et accélérer de nombreuses tâches : traduction, analyse de thèmes, sentiments, catégorisation, détection d'entités. Il est donc courant aujourd'hui d'incorporer dans de nombreuses solution d'intelligence artificielle ce type de features.
Nous sommes fiers d'être centre de formation Datadock, pour diffuser en continu le meilleur de la Data et de la Technologie auprès des professionnels de la Data Science, de la Dataviz et de l'Activation Marketing Adtech et Martech.
Enregistré sous le numéro 11754361075. Cet enregistrement ne vaut pas agrément de l'Etat.
OBJECTIFS DE LA FORMATION ET COMPÉTENCES VISÉES
L’objectif de la formation est de :
- Connaitre les concepts, les nombreuses applications, les librairies python adéquates
- Savoir appliquer sur des documents des traitements de transformation d'analyse lexicale et syntaxique
- Mettre en oeuvre sur différents cas comme analyse de sentiments, découvertes de topic ou détection d'entités
PUBLIC CONCERNÉ
- Data Scientist, Data analyst, Data Miner, Chargé d'études
- Spécialiste en traitement de données
- Ingénierie data
- Ingénierie décisionnelle ou BI
PRÉREQUIS
- Bases Python ou R
- Appétence data, statistiques, mathématiques
- Aptitude à la programmation
MÉTHODES PÉDAGOGIQUES
- Alternance des modalités pédagogiques : exposé, démonstration pratique, échanges collectifs, exercices pratiques et remise du support de formation.
- Questionnaire d’évaluation administré à l’issue de la formation.
-
Durée
2 jours / 14h
9h - 17h30 -
Dates de la session :
25 au 26 mars 2021 -
PRIX
2 100 €HT
(2 520 €TTC)
MODULE 1 : INTRODUCTION
- Définitions, applications : entités, intentions, sentiment, chatbot, traduction
- Typologie des données : email, conversations, documents
- Différentes écoles : linguistique, statistique, neuronale
- Typologies des outils : framework, logiciels, services sur étagère
- Python : re, nltk, spacy, sklearn, keras
MODULE 2 : APPROCHE STATISTIQUE MACHINE LEARNING
- Importance de l'annotation
- Normalisation, analyse lexicale, syntaxique
- Statistiques : tf.idf, matrice Term x Document, co-occurrence
- Classificateur de machine learning
- TP classification supervisée analyse de sentiments
- TP non supervisé topic modeling (LDA/NMF)
MODULE 3 : APPROCHE DEEP LEARNING
- Boite à outil apprentissage : train/test, métrics, epoch, loss,
- Architecture deep : embeddings, réseaux récurrents, dense
- Embeddings : préentrainés vs. ré-entraînés Glove, W2V
- TP classification supervisé avec embeddings et LSTM
- TP reconnaissance d'entités nommées, exemple nom prénom
- Modèle pré entrainés, innovations récentes BERT like
Votre formateur
Anaël
Manager Data Science
Expert Data Science et NLP, il dispose d'une expérience multi projets de mise en œuvre de fonctionnalités NLP à travers Python dans le but de construire des solutions automatisées.
Adresse
Lieu de la formation : à distance.