EXPLORATION DE DONNÉES ET MÉTHODES STATISTIQUES. DATA ANALYSIS &
Data analysis & Data mining avec le logiciel R
La statistique envahit pratiquement tous les domaines d'application, aucun n'en est exclu; elle permet d'explorer et d'analyser des corpus de données de plus en plus volumineux: l'ère des big data et du data mining s'ouvre à nous! Cette omniprésence s'accompagne bien souvent de l'absence de regard critique tant sur l'origine des données que sur la manière de les traiter.
Description
La statistique envahit pratiquement tous les domaines d'application, aucun n'en est exclu; elle permet d'explorer et d'analyser des corpus de données de plus en plus volumineux: l'ère des big data et du data mining s'ouvre à nous! Cette omniprésence s'accompagne bien souvent de l'absence de regard critique tant sur l'origine des données que sur la manière de les traiter. La facilité d'utilisation des logiciels de traitement statistique permet de fournir quasi instantanément des graphiques et des résultats numériques. Le risque est donc grand d'une acceptation aveugle des conclusions qui découlent de son emploi, comme simple citoyen ou comme homme politique. Les auteurs insistent sur les concepts sans négliger la rigueur, ils décrivent les outils de décryptage des données. L'ouvrage couvre un large spectre de méthodes allant du pré-traitement des données aux méthodes de prévision, en passant par celles permettant leur visualisation et leur synthèse. De nombreux exemples issus de champs d'application variés sont traités à l'aide du logiciel libre R, dont les commandes sont commentées. Au sommaire: - Partie 1: Préalables à un traitement statistique: Chapitre 1: Une démarche scientifique; Chapitre 2: Les outils de représentation d'un échantillon; Chapitre 3: Pratiques utiles avant traitement. - Partie 2: Étude d'un échantillon: Chapitre 4: Représentation d'un échantillon par des cartes: ACP; Chapitre 5: Représentation d'un échantillon par des cartes: AFC et AFCM; Chapitre 6: Analyse factorielle: le modèle factoriel; Chapitre 7: Représentation d'un échantillon par des classes. - Partie 3: Étude de deux groupes de variables: Chapitre 8: Régression: les bases et les limites; Chapitre 9: La colinearite: du diagnostic aux remèdes; Chapitre 10: Relations entre deux groupes de variables. - Partie 4: Étude de plusieurs échantillons: Chapitre 11: Discrimination et classement; Chapitre 12: Discrimination et classement. - Partie 5: Autres méthodes: Chapitre 13: Arbres binaires; Chapitre 14: Conclusions et perspectives.
Renseignements sur l'ouvrage
Ouvrages similaires