Formation Data Mining, synthèse

Présentation

DTS
2 jours ( 14 heures )
Présentation

Apprendre à installer, configurer un cluster Hadoop.

Objectifs du cours
Ce cours vous aoortera  des solutions pour l'extraction de connaissances à partir de données brutes.
Pré-requis

Connaissances de base en analyse décisionnelle et en statistiques.

Programme

 

Le Système d'Information Décisionnel (SID)

Les enjeux du SID : besoins, domaines d'application.
Architecture type d'un SID, état de l'art.
Elaboration des informations décisionnelles.
Conception d'un SID : étapes, optimisation, organisation des données, dictionnaires.

Comprendre le Data Mining (DM)

Définition et finalité du Data Mining (DM).
Quel lien entre le DM et les statistiques, quelle dépendance entre le DM et l'informatique ?
Différence entre DM et OLAP ?
Les attentes des entreprises, les réponses du DM.

Les techniques du Data Mining

Les différentes familles du DM.
Les méthodes prédictives et les méthodes descriptives.
Analyse factorielle, typologique. La classification...
Les arbres de décisions, les réseaux de neurones...
Classification des techniques de DM.

 

LA MÉTHODE DESCRIPTIVE DU CLUSTERING

Définition et méthodologie.
Les critères pour structurer les données à classer.
Evaluation et validation des classes obtenues.
Les différentes sous-familles du Clustering.

EXEMPLES D'APPLICATION DU DM

Le scoring : définition, finalité, méthodologie.
Le géomarketing : définition, finalité, méthodologie.

LES DONNÉES DE L'ENTREPRISE

Rappel de la problématique des données du SI.
Qualité des données et administration des données.
Processus de collecte et d'exploration.
Création d'agrégats et de nouvelles données.
Transformation des données.

MÉTHODOLOGIE DE PROJET DATA MINING

Définition du problème métier à résoudre et des objectifs à atteindre.
Inventorier, décrire et classer les données.
Concevoir et alimenter la base Data Mining.
Explorer, segmenter des entités analysées.
Etablir et appliquer les modèles d'analyse.
Itérer, déployer auprès des utilisateurs.
Maintenir le modèle et le logiciel associé.

PANORAMA DES OUTILS

Principaux outils du marché : SAS, R, IBM SPSS...
Zoom sur l'outil SAS et sur l'ETL Powercenter.
Quels critères de choix pour ce type d'outils ?

Partager cette formation

 

Contactez-nous

contactez logware

Vous êtes intéressé par cette formation ou souhaitez simplement obtenir des informations complémentaires ?

+33 1 53 94 71 20

Écrivez-nous on vous rappelle

  1. Nom*
    Merci de saisir un nom valide
  2. Prénom*
    Merci de saisir un prénom valide
  3. E-mail*
    Merci de saisir une adresse email valide
  4. Téléphone*
    Numéro de téléphone invalide
  5. Entreprise
    Donnée invalide

Parce que nous comprenons la nécessité d'obtenir un enseignement qui permettra à votre équipe d'atteindre vos objectifs, nous restons flexibles et sommes capables d'adapter nos programmes de formation à vos besoins.

> En savoir plus