Entreposage et fouille de données

Code UE : STA211

  • Cours
  • 9 crédits

Responsable national

Responsable opérationnel

Public et conditions d'accès

être admis en M2 du master STIC, mention statistique ou être agréé : pour obtenir l'agrément, les auditeurs adresseront par courrier électronique à l'enseignant responsable : ndeye.niang_keita@cnam.fr, un CV détaillé et une lettre de motivation indiquant les raisons de  la demande et le projet pédagogique dans lequel elle s'inscrit .
Niveau requis : NFA.008 (bases de données) et STA101 (analyse des données, méthodes descriptives). Ces prérequis sont indispensables pour obtenir l'agrément. Vérifier avant d'envoyer une demande d'agrément.

Contenu

Modèles prévisionnels et systèmes de gestion de l'entreprise
- structures spécifiques des bases de données de Data warehouse (star schema)
- OLAP
Méthodologies générales
- Méthodologies de Data Mining
Pré-traitement des données
- Analyses de la qualité des données,
- Techniques d'appréhension des valeurs manquantes ou aberrantes
- Techniques de construction de bases de travail (agrégations, etc. . . )
Données et techniques de fouille
Méthodes non supervisées :
- Cartes de Kohonen,
- Règles d'association 
Méthodes supervisées :
- Rappels de théorie de l'apprentissage
- Arbres de décision,
- Réseaux de neurones, deep learning
- Méta-algorithmes :
- boosting, bagging
Fouille dans de nouveaux types de données et méthodes associées :
- Données textuelles - Données multivues - Images et Multimedia
-Réseaux sociaux
Outils :
- Environnements freeware : Weka, Tanagra, R, Python
- Outils spécifiques : SAS-EM,  SPAD
- Data Mining et bases de données : OLAP Business Object
   

Bibliographie

  • M.BARDOS : Analyse discriminante (Dunod, 2001)
  • G.SAPORTA : Probabilités, analyse des données et statistique (Technip, 2006)
  • S.TUFFERY : Data mining et statistique décisionnelle (Technip, 2005)
  • S.TUFFERY : Etude de cas en statistique décisionnelle (Technip, 2009)
  • T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI : Elements of Statistical Learning (Springer, 2009)
  • G.GOVAERT (ed) : Analyse des données (Hermes,2003)
  • L. LEBART, A. MORINEAU, M. PIRON : Statistique exploratoire multidimensionnelle (1995)
  • J.P.NAKACHE, J.CONFAIS : Statistique explicative appliquée (Technip, 2003)
  • James, Witten, Hastie, & Tibshirani : An Introduction to Statistical Learning (2013) Téléchargeable ici:http://web.stanford.edu/~hastie/local.ftp/Springer/ISLR_print1.pdf

Cette UE apparaît dans les diplômes et certificats suivants

Chargement du résultat...
Patientez
Type
Intitulé
Equipe pédagogique
Lieu / Modalités
Code
Equipe pédagogique Mathématique et statistique
Lieu / Modalités
  • Enseignée en formation présentielle ou partiellement à distance : Paris
  • Equipe pédagogique Informatique
    Lieu / Modalités
  • Enseignée en formation présentielle ou partiellement à distance : Bretagne, Paris, Île-de-France (sans Paris)
  • Equipe pédagogique Mathématique et statistique
    Lieu / Modalités
  • Enseignée en formation présentielle ou partiellement à distance : Paris
  • Type Intitulé Equipe pédagogique Lieu / Modalités Code

    Contact

    EPN06 Mathématiques et statistiques
    2 rue conté Accès 35 3 ème étage porte 19
    75003 Paris
    Sabine Glodkowski
    Voir les sites

    Voir les dates et horaires, les lieux d'enseignement et les modes d'inscription sur les sites internet des centres régionaux qui proposent cette formation

    UE

      • Paris
        • Paris
          • 2017-2018 1er semestre : Présentiel
          • 2017-2018 2nd semestre : Fod accessible nationalement
          • 2018-2019 1er semestre : Présentiel
          • 2018-2019 2nd semestre : Fod accessible nationalement
          • 2019-2020 1er semestre : Présentiel
          • 2019-2020 2nd semestre : Fod accessible nationalement
          Comment est organisée cette formation à distance ?

          Planning

          Date limite d'incription : 26/03/2018
          Date de démarrage : 19/02/2018
          Date de la première session d'examen :00/00/0000
          Date de la deuxième session d'examen :00/00/0000

          Accompagnement collectif

          Rendez-vous :
          Chat :
          Forum par UE :oui
          Webconférence :

          Accompagnement individuel

          Echange par mails : oui
          Accompagnement téléphonique :

          Regroupement

          Séances de regroupement : non

          Modalités de validation

          Examen sur table :oui
          Projet : non
          Contrôle continu : non
          Examen partiel : non
          :