Certificat de spécialisation Analyste de données massives

Code diplôme/certificat: CS5900A

27 crédits

Niveau d'entrée

  • Sans niveau spécifique

Niveau de sortie

  • Sans niveau spécifique

Responsable national

Responsable opérationnel

Publics / conditions d'accès

Prérequis :
Informaticiens, mathématiciens, ou statisticiens ayant un niveau ingénieur ou master et exerçant en entreprise.
Formation supérieure en mathématique (algèbre linéaire, analyse). Connaissances  en bases de données, en programmation, en statistique et analyse des données.
L'inscription à l'UA de projet se fait après avoir validé toutes les UE.
Pour obtenir le certificat, il faut valider l'ensemble des unités d'enseignement le composant. Il n'y a? pas une inscription spécifique au certificat. Pour s'inscrire aux UE consulter les sites associés. Les inscriptions ont lieu en septembre pour le semestre 1 et en février pour le semestre 2.

Objectifs

Ce certificat offre la possibilité à des informaticiens, mathématiciens, statisticiens de suivre une formation professionnelle pluridisciplinaire pour acquérir les compétences propres à l'exercice du métier émergent de data scientist également appelé "analyste big data".
Alliant des compétences en mathématiques, statistique, informatique, visualisation de données ; il est capable de stocker, rechercher, capter, partager, interroger et donner du sens à d'énormes volumes de données structurées et non structurées, produites en temps réel et provenant de sources diverses.

Mentions officielles

Intitulé officiel figurant sur le diplôme : Certificat de spécialisation Analyste de données massives

Inscrit RNCP : Non-inscrit

Codes NSF : -

Code ROME : -

Projet / mémoire

L'auditeur doit réaliser un projet en fin de cycle choisi au préalable avec un enseignant.Ce projet donnera lieu à un rapport écrit ainsi qu'une soutenance orale.Le projet consistera à mettre en œuvre une méthode d'analyse particulière avec des techniques présentées dans les unités d'enseignement. Il pourra être réalisé dans le cadre de son activité professionnelle avec les environnements informatiques auxquels il/elle est susceptible d'être confronté(e).Le travail à faire inclut : l'exploitation d'un jeu de données, le choix d'une méthode analytique applicable à ce jeu de données, le choix d'un environnement de stockage et d'exécution d'algorithmes de fouille de données et l'interprétation des résultats.Si le cadre de l'activité professionnelle ne permet pas (ou pas totalement) d'accéder à un environnement complet, il est possible de recourir à des jeux de données publics (par exemple ceux proposés à http://webscope.sandbox.yahoo.com/ ou http://commoncrawl.org/data/).

Modalités d'évaluation

Le certificat de spécialisation s'acquiert en obtenant une note supérieure ou égale à 10 à toutes les UE proposées ainsi qu'au projet professionnel.

Description

Cliquez sur l'intitulé d'un enseignement ou sur Centre(s) d'enseignement pour en savoir plus.

Centre(s) d'enseignement
  • Paris
    • 1er semestre : présentiel
    • 2nd semestre : FOD nationale
 
Centre(s) d'enseignement
  • Paris
    • 1er semestre : présentiel
    • 2nd semestre : FOD nationale
 
Centre(s) d'enseignement
  • Paris
    • 1er et 2nd semestre : présentiel
    • 1er semestre : présentiel, FOD nationale
 
 

Compétences

Donner du sens à d'énormes volumes de données structurées et non structurées, produites en temps réel et provenant de sources diverses.
Maitriser les technologies Hadoop et Map Reduce, de passage à l'échelle et le traitement de données d'un nouveau type (textes, images, vidéos, etc...) à l'aide de méthodes de data mining et d'apprentissage.

Voir aussi

Les diplomes et les stages préparant aux métiers :

Les UE, les diplomes et les stages dans les domaines :

Contact

EPN Mathématique et statistique
EPN06, 35.3.19, 2, rue Conté
75003 Paris
Tel :01 40 27 27 54
Sabine Glodkowski

Voir les dates et horaires, les lieux d'enseignement et les modes d'inscription sur les sites internet des centres régionaux qui proposent cette formation

Diplôme ou certificat