Accès direct au contenu

  • Répertoire des centres Cnam en région
  • Accès à l'espace numérique de formation
  • Application mobile
  • Musée des arts et métiers
  • Accès réservé à l'intranet

Entreposage et fouille de données

Public et conditions d'accès

être admis en M2 du master STIC, mention statistique ou être agréé : pour obtenir l'agrément, les auditeurs adresseront par courrier électronique à l'enseignant responsable : ndeye.niang_keita@cnam.fr, un CV détaillé et une lettre de motivation indiquant les raisons de  la demande et le projet pédagogique dans lequel elle s'inscrit .
Niveau requis : NFA. 008 (bases de données) et STA. 101 (analyse des données, méthodes descriptives).

Contenu

Modèles prévisionnels et systèmes de gestion de l'entreprise
structures spécifiques des bases de données de Data warehouse (star schema)
OLAP
Méthodologies générales
Normes de Data Mining : PMML (Prediction Modelling Markup Language), JDM (Java Data Mining), SQL-MM (multimedia)
Méthodologies de Data Mining : SEMMA (SAS), CRISP-DM
Pré-traitement des données
Analyses de la qualité des données,
Techniques d'appréhension des valeurs manquantes ou aberrantes
Techniques de construction de bases de travail (agrégations, etc. . . )
Données et techniques de fouille
Méthodes non supervisées :
Cartes de Kohonen,
Règles d'association 
Méthodes supervisées :
Rappels de théorie de l'apprentissage
Arbres de décision,
Réseaux de neurones
Méta-algorithmes :
boosting, bagging
Fouille dans de nouveaux types de données et méthodes associées :
Données textuelles
Images et Multimedia
Données symboliques
Réseaux sociaux
Outils :
Environnements freeware : Weka, Tanagra, Sodas
Outils spécifiques : SAS-EM, SAP-Analytics, SPAD
Data Mining et bases de données : OLAP Business Object
   

Modalités de l'évaluation

Mémoire

Bibliographie

  • M.BARDOS : Analyse discriminante (Dunod, 2001)
  • G.SAPORTA : Probabilités, analyse des données et statistique (Technip, 2006)
  • S.TUFFERY : Data mining et statistique décisionnelle (Technip, 2005)
  • : Etude de cas en statistique décisionnelle (Technip, 2009)
  • T.HASTIE, J.FRIEDMAN, F.TIBSHIRANI : Elements of Statistical Learning (Springer, 2009)
  • G.GOVAERT (ed) : Analyse des données (Hermes,2003)
  • L. LEBART, A. MORINEAU, M. PIRON : Statistique exploratoire multidimensionnelle (1995)
  • J.P.NAKACHE, J.CONFAIS : Statistique explicative appliquée (Technip, 2003)

Contact national

Secrétariat Service de modélisation statistique du risque et statistique appliquée
Case 2D5000, Accés 17 0 12, 292 Rue Saint Martin
Paris
Tél : 01 40 27 27 54
Fax : 01 40 27 27 46
Sabine Glodkowski

Voir le site maths.cnam.fr/

Voir les dates et horaires, les lieux d'enseignement et les modes d'inscription sur les sites internet des centres régionaux qui proposent cette formation

  • Paris
    Présentiel - premier et second semestre 2014/2015

Code UE : STA211

9

Responsable national

Aurélien LATOUCHE

Responsable opérationnel

N'deye NIANG-KEITA