La majorité des textes créés étant à présent disponibles sur support magnétique, leur traitement et leur archivage appellent de nouvelles méthodes...
Lire la suite
La majorité des textes créés étant à présent disponibles sur support magnétique, leur traitement et leur archivage appellent de nouvelles méthodes informatiques, plus performantes. Répondant à cette demande, l'ouvrage décrit les travaux de linguistes et d'informaticiens en analyse automatique de textes.
Après avoir rappelé succinctement les outils informatiques dont dispose le professionnel, l'auteur étudie les problèmes liés à l'analyse lexicale automatique, étape indispensable dans le traitement des textes. il décrit, d'une part, le système de dictionnaires électroniques du laboratoire d'Automatique Documentaire et Linguistique (université de Paris-VII), et, d'autre part, les programmes d'analyse lexicale conçus pour fournir les données nécessaires à tout traitement linguistique plus élaboré. Ce double ensemble forme la base du système INTEX.
Trois applications sont présentées et appliquées au texte même de l'ouvrage : le vérificateur orthographique, le programme d'indexation automatique, les programmes de traitement du corpus permettant de rechercher des structures morpho-syntaxiques données et de les présenter sous forme de concordances.
L'ouvrage intéressera les étudiants en 3e cycle d'informatique et de linguistique, les chercheurs en informatique linguistique, ainsi que les chercheurs en intelligence artificielle et les cogniticiens.
Sommaire
Outils informatiques
Le système de dictionnaires électroniques Delac
Construction d'un dictionnaire électronique : le Delac