Aujourd'hui les recherches documentaires dans des collections numérisées sont devenues incontournables et quotidiennes pour qui doit s'informer, étudier ou se former. Si l'utilisation des outils et des moteurs est familière, les mécanismes qu'ils emploient ne sont eux pas forcément connus.Cet ouvrage est consacré aux connaissances fondamentales, à savoir, les bases de la linguistique et de la logique informatique pour comprendre les traitements auxquels les requêtes et les textes sont soumis. Il réserve unepart importante aux techniques existantes comme la recherche sur la proximité phonétique, syntaxique ou sémantique, étendue au multilinguisme. Desnotions apparemment banales comme mot vide, terme, synonyme, lemmatisation sont expliquées dans ce contexte.Des exercices ...
Lire la suite
Chapitre 11 : Indexation de documents et de rubriques
Chapitre 12 : Extraction de données à partir detextes
Bibliographie
Conclusion
Aujourd'hui les recherches documentaires dans des collections numérisées sont devenues incontournables et quotidiennes pour qui doit s'informer, étudier ou se former. Si l'utilisation des outils et des moteurs est familière, les mécanismes qu'ils emploient ne sont eux pas forcément connus.Cet ouvrage est consacré aux connaissances fondamentales, à savoir, les bases de la linguistique et de la logique informatique pour comprendre les traitements auxquels les requêtes et les textes sont soumis. Il réserve unepart importante aux techniques existantes comme la recherche sur la proximité phonétique, syntaxique ou sémantique, étendue au multilinguisme. Desnotions apparemment banales comme mot vide, terme, synonyme, lemmatisation sont expliquées dans ce contexte.Des exercices corrigés et des exemples issus d'applications diverses comme les pages jaunes de l'annuaire, les bases de brevets, et même la Toile appuient les apports théoriques.