SEP0931 - Analyse des données et data mining

Retour aux MCC Retour à la liste des EC
  • Équipe pédagogique

    • Responsables

    • GAUTHERAT Emmanuelle (Responsable)
      Département : Economie et sciences sociales (UFR LSH)
  • Volume horaire

  • Nature CMTD Total
    Durée 20h30h50h
  • Modalités de contrôle des connaissances (MCC)

  • Epreuves Nature IECREOT Total
    Durée
    Cas général 1ère session 5050 100%
    2nd session 100 100%
    Dispense contrôle continu 1ère session 100 100%
    2nd session 100 100%
  • Modalités de contrôle des connaissances (MCC)

  • Cas général

  • Nature Durée 1ère session 2ème session
    IE 50% 0%
    CR 50% 0%
    EOT 0% 100%
  • Dispense contrôle continu

  • Nature Durée 1ère session 2ème session
    CR 100% 0%
    EOT 0% 100%
  • Objectifs

  • Ce cours se déroule en trois parties. La première porte sur les méthodes d?analyse descriptives multidimensionnelles, la seconde présente de manière approfondie le logiciel spécialisé SPSS permettant de mettre en ?uvre ces méthodes, tandis que la dernière partie conjuguera les acquis théoriques d?analyse multidimensionnelle avec leur mise en ?uvre pour construire une méthode d?exploration de données (fouille de données, datanmining) avec des outils dédiés au data mining.L?analyse des données (ADD) permet d?étudier un ensemble d?individus décrits selon plusieurs variables afin d?extraire une typologie des variables ou/et des individus.Le logiciel SPSS (Statistical Package for the Social Science) et son langage de syntaxe est un logiciel de traitement de données et de modélisation statistique. Il possède différents niveaux de manipulation : à l?aide de boîtes de dialogues, de langage de syntaxe (surcouches, équivalente aux procédures de SAS) et de scripts (programmation directe, proche de VB). Il peut également intégrer des programmes R et python. Des séances en salle machine visent à acquérir une pratique avancée de ce logiciel, tant dans son aspect « boîte noire » qu?en utilisant les possibilités de programmation (syntaxe / R/Python).Le data mining est une discipline se situant à la confluence de la statistique, de l'intelligence artificielle et des bases de données. Son objectif est la découverte de connaissances dirigée ou non dirigée et la structuration des données. En puisant dans des bases de données volumineuses, souvent disséminées et non standardisées les méthodes de datamining présentent à l'utilisateur une information fiable, interprétable et utile à la prise de décision.
  • Compétences spécifiques visées

  • Savoir mener une analyse des données : démarche structurée ;Etre capable de présenter des informations utiles aux décideurs non statisticiens ;Maîtrise des manipulations de fichiers sous SPSS ;Savoir mettre en ?uvre le data mining de manière immédiate face à des problématiques réelles.
  • Connaissances requises

  • Statistique niveau Master 1 d?économie, mathématiques ou informatique.
  • Programme

  • Champs de l?ADDEtude uni et bidimensionnelle, ANOVA à un facteur Méthodes multidimensionnelles : ACP, AFC, ACMBase de données : création de base, importation, exportation dans différents formats, concaténation de baseManipulation des bases de données, utilisation des barres d?outils et des fenêtres de syntaxe, graphiquesPersonnalisation de SPSS : création de boutons et macro personnelles dans la barre d?outils.Méthodes d?exploration de donnéesScoring, Segmentation