MEZZOUDJ, Saliha (2020) "Approches de classification des images à grande échelle sur des architectures massivement parallèles.". Doctoral thesis, Université de Batna 2.
|
Text
saliha_thesis(43).pdf Download (4MB) | Preview |
Abstract
Actuellement, l’énorme volume de données structurées et non structurées provenant de sources diverses, produites en temps réel et dépassent la capacité de stockage d‘une seule machine. En effet, ces données sont difficilement traitées avec les systèmes de recherche d‘information classique. Ce challenge nous a motivés pour élaborer un nouveau système de recherche et de classification des images permettant le stockage, la gestion et le traitement des grandes quantités d’images (Big Data) et qui imposent une parallélisation des calculs pour obtenir des résultats en temps raisonnable et avec une précision optimale. Cette thèse est organisée en deux parties. La première partie représente un état de l‘art sur le domaine de la vision par ordinateur et ces concepts de base, les technologies de Big Data spécialement les plateformes de stockage et de calcul, elles présentent aussi l’infrastructure distribuée nécessaire pour rendre ces plateformes faciles à utiliser. Dans la deuxième partie un nouveau système de recherche d’images par le contenu rapide basé sur la plateforme Spark (CBIR-S) est présenté comme une première proposition tout en ciblant les bases d’images à grande échelle (Big Data). Dans ce système nous utilisons lemodèle distribuéMapReduce sous la plateforme Spark pour traiter de grands volumes de données en parallèle en divisant le travail en un ensemble de tâches indépendantes, et afin d’accélérer le processus d’indexation nous avons utilisé également un système de stockage distribué, qui s’appelle Tachyon; et afin d’accélérer le processus de recherche nous utilisons l’algorithme parallèle de K-plus proches voisins (k-NN) de classification basée sur le modèle MapReduce implémenté sous Apache Spark.De plus, nous exploitons la méthode de cache de spark. Notre approche proposée permet d’accélérer les temps d’indexation, et de classification, tout en gardant les précisions des méthodes. Les tests effectués sur une base d’images ImageCLEFphoto 2008 montrent les avantages de système proposé. Comme une deuxième proposition, nous introduisons une nouvelle méthode de classification des races dans des base d’images faces à grande échelle basée sur la méthode Local Binary Pattern (LBP) et la méthode de régression logistique (LR) sous la plateforme Spark pour traiter d’une manière parallèle une grande échelle des faces. L’évaluation de notre méthode proposée a été effectuée sur la combinaison de deux grandes bases d’images de visage CAS-PEAL (partie de pose) et Color FERET. Deux races ont été considérées pour ce travail, y compris les races asiatiques et non asiatiques. Par comparaison, notre méthode avec les classificateurs SVM linéaires, bayésiens naïfs (NB), forêts aléatoires (RF) et arbres de décision (DT) de Spark, nous avons obtenu une précision moyenne de 99,99%, les résultats montrent que notreméthode est très compétitive. Mots clés : Big Data; système de recherche d’images; classification; les technologies de Big Data; k-NN parallèle ; spark, Tachon; cache; classification des races; LR; NB; RF; DT.
Item Type: | Thesis (Doctoral) |
---|---|
Subjects: | Informatique |
Divisions: | Faculté des mathématiques et de l'informatique > Département d'informatique |
Date Deposited: | 22 Feb 2021 10:50 |
Last Modified: | 22 Feb 2021 10:50 |
URI: | http://eprints.univ-batna2.dz/id/eprint/1898 |
Actions (login required)
View Item |