Apprentissage à base de noyaux sémantiques pour le traitement de données textuelles

Sujeevan Aseervatham

Note moyenne 
Sujeevan Aseervatham - Apprentissage à base de noyaux sémantiques pour le traitement de données textuelles.
Depuis le début des années 80, les méthodes d'apprentissage automatique appliquées au traitement de données textuelles connaissent un intérêt grandissant.... Lire la suite
28,00 € Neuf
Expédié sous 2 à 4 semaines
Livré chez vous entre le 3 août et le 20 août
En magasin

Résumé

Depuis le début des années 80, les méthodes d'apprentissage automatique appliquées au traitement de données textuelles connaissent un intérêt grandissant. Cette tendance est principalement due au fait que la taille des corpus est en perpétuelle croissance. Ainsi, les méthodes utilisant le travail d'experts sont devenues coûteuses perdant peu à peu de leur popularité au profit des systèmes d'apprentissage.
Dans cette thèse, nous nous intéressons à deux axes. Le premier axe porte sur l'étude des problématiques liées au traitement de données textuelles structurées par des approches à noyaux. Nous présentons un noyau sémantique pour les documents structurés au format XML. Le noyau tire ses informations sémantiques d'une source de connaissances externe, à savoir un thésaurus. Ce noyau a été testé sur un corpus de documents médicaux avec le thésaurus médical UMLS.
Il a été classé, lors d'un challenge international de catégorisation de documents, parmi les 10 méthodes les plus performantes sur 44. Le second axe porte sur l'étude des concepts latents extraits par des méthodes statistiques telles que l'Analyse Sémantique Latente (LSA). Nous présentons, dans une première partie, des noyaux exploitant des concepts linguistiques provenant d'une source externe et des concepts statistiques issus de la LSA.
Nous montrons qu'un noyau intégrant les deux types de concepts permet d'améliorer les performances. Puis, dans une deuxième partie, nous présentons un noyau utilisant des LSA locaux afin d'extraire des concepts latents permettant d'obtenir une représentation plus fine des documents.

Caractéristiques

  • Date de parution
    10/07/2008
  • Editeur
  • Collection
  • ISBN
    978-2-35607-643-4
  • EAN
    9782356076434
  • Présentation
    Broché
  • Nb. de pages
    220 pages
  • Poids
    0.319 Kg
  • Dimensions
    21,0 cm × 29,7 cm × 1,2 cm

Avis libraires et clients

Avis audio

Écoutez ce qu'en disent nos libraires !

Vous aimerez aussi

Derniers produits consultés

Apprentissage à base de noyaux sémantiques pour le traitement de données textuelles est également présent dans les rayons

28,00 €