Nouvelle formation

Formation GED, optimiser la recherche et l'indexation des contenus non structurés

Maîtriser la GED

Téléchargez le pdf de la formation

Présentation

SRGED01
2 jours ( 14 heures )
Présentation

Cette formation GED vous permettra d'organiser et optimiser l'exploitation de ressources textuelles non structurées.Vous apprendrez à les catégoriser, à les marquer automatiquement ou à les rendre visibles des moteurs de recherche en utilisant des outils comme Apache Solr ou Mahout.



  Vous apprendrez à les catégoriser, à les marquer automatiquement ou à les rendre visibles des moteurs de recherche en utilisant des outils comme Apache Solr ou Mahout.

Objectifs du cours

Organiser et optimiser l'exploitation de ressources textuelles non structurées.
Vous apprendrez à les catégoriser, à les marquer automatiquement ou à les rendre visibles des moteurs de recherche en utilisant des outils comme Apache Solr ou Mahout.

Pré-requis
 Avoir des connaissances de base en gestion de contenu

Programme

 

Les enjeux de l’exploitation des contenus non structurés
Pourquoi le traitement des ressources
textuelles est un enjeu stratégique ?
Les particularités du traitement des contenus
non structurés.
Exploiter les ressources textuelles : créer de la
valeur à partir du chaos.
Présentation de la plateforme logicielle utilisée
pendant la formation.

Composants et étapes du cycle de traitement 

des contenus nonstructurés

Les catégories grammaticales de base.
Le système morphologique : racine, préfixe,
suffixe.
L’identification des unités lexicales
(tokenization).
La détection des limites de phrase.
Classifier, catégoriser, marquer
automatiquement les contenus
Regrouper les résultats de recherche avec
Carrot2.
Regrouper des collections de documents avec
Apache Mahout.
Catégoriser des documents avec Apache
Lucene.
Rechercher des contenus sémantiques à l’aide
de Falcons.

 

Opérations avancées sur les contenus
Accéder aux contenus des différents formats
de fichier.
Extraire du contenu de différents formats de
fichier à l’aide d’Apache Tika.
Analyser les contextes pour résoudre des
ambiguïtés.
Utiliser les graphes pour modéliser
l’information syntaxique et sémantique des
contenus non structurés.

Préparer les ressources non
structurées pour les moteurs de
recherche
Les différentes techniques de recherche.
Les concepts associés à la recherche
: indexation, interface, classement des
résultats, présentation des résultats.
Exemple de recherche par facettes : Amazon.
com.
Exemple d’utilisation du serveur de recherche
Apache So

Partager cette formation

 

Contactez-nous

contactez logware

Vous êtes intéressé par cette formation ou souhaitez simplement obtenir des informations complémentaires ?

+33 1 53 94 71 20

Écrivez-nous on vous rappelle

  1. Nom*
    Merci de saisir un nom valide
  2. Prénom*
    Merci de saisir un prénom valide
  3. E-mail*
    Merci de saisir une adresse email valide
  4. Téléphone*
    Numéro de téléphone invalide
  5. Entreprise
    Donnée invalide

Parce que nous comprenons la nécessité d'obtenir un enseignement qui permettra à votre équipe d'atteindre vos objectifs, nous restons flexibles et sommes capables d'adapter nos programmes de formation à vos besoins.

> En savoir plus