Data-science : analyser, comprendre et prédire

Objectifs

  • Connaître les cas d’usage de data-science
  • Comprendre les étapes clés d’un projet de machine Learning
  • Identifier les analyses à mener en amont de la modélisation
  • Pouvoir proposer des modèles simples

Prérequis

  • Aucun prérequis nécessaire

Agenda de la formation

Introduction : démystifier le machine-learning

  • Concepts statistiques
  • Quand est-il utile de faire du machine learning ?

Analyse exploratoire

  • Audit des données et nettoyage
  • Explorer et décrire ses données : bonnes pratiques de la data viz
Cas pratique:Tableaux, Data Studio, R ou Python 

Utiliser les insights de l’analyse pour la construction d’un modèle prédictif

Les grandes classes de modèles de machine learning

  • Apprentissage supervisé – Régression et Classification
  • Présentation des algorithmes classiques : régression linéaire, régression logistique, SVM, arbres de décision

Cas pratique régression: prédiction des ventes (Python ou R)

Cas pratique classification: score de churn (Pythonou R)

Apprentissage non-supervisé - Clustering

  • Présentation des algorithmes de classification : méthodes basées sur des centroides, sur la densité, clustering hiérarchique

Cas pratique clustering: segmentation (Python ou R)

Revue des cas avancés

  • Les modèles de classification d’image par deep learning
  • Les modèles d’analyse sémantique par le NLP
  • Les modèles de recommandation
  • Les modèles de séries temporelles

Cas pratique: usage des modèles entraînés par Google

Amélioration du modèle

  • Trop ou trop peu de variables : feature engineering et feature selection:
  • Réduction de dimension
  • La construction de variables : one hot encoding, standardisation
  • Cas pratique : usage des modèles entraînés par Google
  • Optimisation du modèle
  • Éviter le surapprentissage : régularisation, validation croisée
  • Choix des hyperparamètres de l’algorithme

Conclusion

  • Retour sur les grands cas d’application
  • Retour d’expérience et échange sur les écueils à éviter

Infos pratiques

7h de formation sur une journée

Visioconférence ou présentiel

Jusqu'à 8 participants

4500€ HT pour le groupe

Cette formation vous intéresse ?
Demandez un devis !

Contactez-nous

Nos références