À propos du livre

Ce livre accompagne le cours d’analyse de données que j’enseigne au Département de mathématiques et de statistique de l’Université Laval à l’automne 2018. Il couvre les principales méthodes d’analyse de données et fournit les codes pour les effectuer avec le logiciel R. La première partie porte sur l’apprentissage non supervisé et la seconde partie porte sur l’apprentissage supervisé. Les chapitres seront ajoutés et les notes seront mises à jour au fur et à mesure que la session avancera.

La plupart des exemples et des volets pratiques sont tirés de mon expérience personnelle notamment dans le domaine de l’assurance, de la recherche marketing et de l’environnement (voir mon profil).

Les sections théoriques sont tirées des notes de cours rédigées par Thierry Duchesne, elles-mêmes issues des notes préparées au fil des ans pour ce cours par Anne-Sophie Charest, David Émond, Christian Genest, et Nadia Ghazzali. Certaines sections ont toutefois été bonifiées en se basant, notamment, sur l’ouvrage de Tufféry (2017). Quelques ajouts ont été faits en s’inspirant des notes préparées par François Bellavance et Jean-François Plante pour le cours de Techniques d’exploitation de données de HEC Montréal.

N’hésitez pas à me signaler les coquilles, les passages nébuleux ou les erreurs de notations. Vos suggestions sont les bienvenues.

Références

Tufféry, Stéphane. 2017. Data Mining et Statistique Décisionnelle: La Science Des Données. 5e ed. Éditions Technip.