KHELALEF, Aziz (2021) Reconnaissance d’activités humaines en utilisant les descripteurs spatio-temporels 2D/3D. Doctoral thesis, Université de Batna 2.
|
Other
these_PhD_khelalef_Aziz_VF_Corrected.PDF Download (9MB) | Preview |
Abstract
cette thèse, nous nous sommes intéressés principalement au problème de la reconnaissance d’activités humaines en utilisant les descripteurs spatio-temporels 2D/3D. Ce domaine est un axe de recherche très actif dont le but est de doter les machines du pouvoir d’analyse et d’interprétation des mouvements réalisés par des humains dans une séquence vidéo. Nous avons présenté le domaine de reconnaissance d’activités humaines, les problématiques posées, ainsi que les solutions présentées dans la littérature. De plus, nous avons réalisé une étude détaillée sur les réseaux de neurones artificiels et l’apprentissage profond (deep learning) ainsi que les techniques proposées dans l’état de l’art basées sur ce dernier. Nous avons contribué dans ce domaine par la proposition de quatre techniques de reconnaissance d’activités humaines. La première technique présentée pour la reconnaissance des activités dans les séquences vidéo est basée sur l’extraction des skeletons et la transformée en cosinus discrète DCT pour l’extraction des caractéristiques et la SVM pour la classification des activités. Nous avons présenté aussi une variante de cette technique pour la reconnaissance des activités image par image en temps réel, cette dernière est basée sur l’extraction des silhouettes et la DCT pour l’extraction des caractéristiques et les réseaux de neurones artificiels RBF pour la classification des activités. Les deux techniques proposées ont donné des résultats très satisfaisants et très performants, cependant, elles présentent un point faible commun qui est l’algorithme de classification. Pour pallier à ce problème, nous avons proposé une nouvelle méthode basée sur un nouveau descripteur appelé BSTM et les réseaux de neurones à convolution CNN pour la reconnaissance. Cette approche a donné des résultats très performants, en surpassant les techniques conventionnelles et en donnant des résultats comparables aux nouvelles techniques basées sur l’apprentissage profond. Malgré cela, notre méthode s’est révélée incapable de faire la reconnaissance des activités image par image en temps réel à cause de la technique d’extraction du descripteur BSTM, pour cela, nous avons proposé une quatrième technique de reconnaissance d’activités humaines totalement automatisée en utilisant l’apprentissage par transfert du modèle YOLO (You Only Look Once) conçu à la base pour la reconnaissance d’objet. Nous avons proposé aussi un protocole de fusion pour adapter notre technique pour la reconnaissance des activités dans les séquences vidéo. Les résultats expérimentaux ont montré que l’approche proposée a donné des résultats très encourageants lors de la reconnaissance des activités image par image, et a surpassé toutes les techniques présentées dans la littérature lors de l’utilisation du protocole de fusion pour la reconnaissance des activités dans les séquences vidéo.
Item Type: | Thesis (Doctoral) |
---|---|
Subjects: | Technologie > Electronique |
Divisions: | Faculté de technologie > Département d'électronique |
Date Deposited: | 08 Apr 2021 11:23 |
Last Modified: | 08 Apr 2021 11:23 |
URI: | http://eprints.univ-batna2.dz/id/eprint/1909 |
Actions (login required)
View Item |