Un modèle sémantique pour la recherche d’information en langue arabe

DILEKH, Tahar (2019) Un modèle sémantique pour la recherche d’information en langue arabe. Doctoral thesis, Université de Batna 2.

[img]
Preview
Text
THESE DOCTORAT-Tahar DILEKH-UN MODELE SEMANTIQUE POUR LA RECHERCHE D’INFORMATION EN LANGUE ARABE.pdf

Download (3MB) | Preview

Abstract

Les systèmes de recherche d'information textuelle (SRI) sont conçus pour faciliter l'accès aux informations stockées et l’une des tâches principales d’un SRI est l’indexation, qui consiste à construire des représentations simplifiées (descripteurs) décrivant le contenu informationnel des documents et requêtes en vue de faciliter la recherche. Les systèmes de recherche d’informations classiques reposent sur des approches qui représentent les documents (respectivement requêtes) par des descripteurs extraits à partir de leurs textes. Or, les fréquences de ces descripteurs ne sont pas suffisantes pour identifier les relations exprimées et localiser les informations utiles pour une requête d’utilisateur. Comment alors introduire « plus de sémantique » dans la recherche d’informations et la fouille textuelle ? Quelle sémantique ? Dans cette thèse, nous présenterons des méthodes pour introduire l’aspect sémantique dans la recherche d'information en langue Arabe. L'hypothèse principale est que l'inclusion de connaissances telles que les dictionnaires, les thesaurus et les ontologies dans le processus de recherche d'information peut contribuer à la résolution de problèmes majeurs actuellement rencontrés dans la recherche d'information. Dans ce présent travail, nous proposons un modèle de recherche d’information sémantique dans les documents textuels arabes. Nous étudions des différents algorithmes de lemmatisation qui ont été développés pour la langue Arabe et nous proposons un nouvel algorithme qui peut aider à déterminer le bon lemme avant de faire la désambiguïsation, s'il y aurait une possibilité d'ambiguïté. Nous présentons, également, les éléments fondamentaux qui se trouvent normalement dans les ressources de connaissances pour les SRI sémantique, et nous implémentons une méthode d'indexation sémantique pour la recherche d'information où nous utilisons « le dictionnaire de la langue arabe contemporaine » comme ressource lexicale pour explorer l'impact du passage d'une indexation classique à une indexation sémantique

Item Type: Thesis (Doctoral)
Uncontrolled Keywords: Recherche d'information sémantique, lemmatisation, indexation, désambiguïsation sémantique, traitement automatique de la langue arabe.
Subjects: Informatique
Divisions: Faculté des mathématiques et de l'informatique > Département d'informatique
Date Deposited: 22 Sep 2019 10:41
Last Modified: 22 Sep 2019 10:41
URI: http://eprints.univ-batna2.dz/id/eprint/1714

Actions (login required)

View Item View Item