Présentation de mon thème de recherche de thèse

Une étape primordiale pour l’interprétation d’une image est la segmentation. La segmentation d’une image consiste à isoler et classer les pixels d’une image en catégories. Une multitude de méthodes de segmentation existe, mais aucune n’est absolue et optimale. En effet, la complexité des images à traiter (texture, détails fins, ...) rend difficile la conception d’une méthode générale. De plus, il est difficile de dire si une méthode de segmentation est meilleure qu’une autre dans un contexte donné. Pour évaluer ces méthodes, des critères d’évaluation ont été développés dans la littérature. Ils peuvent utiliser ou non une information a priori sur les données à segmenter. Cependant, rien ne nous garantit la fiabilité des critères dans une situation donnée. Pour palier ce manque, une étude des méthodes d’évaluation de résultats de segmentation a été réalisée comprenant un état de l’art ainsi qu’une étude comparative des meilleurs critères de la littérature.

Il existe deux types de critères d’évaluation pour quantifier la qualité d’un résultat de segmentation.

Les critères d’évaluation supervisée

Un résultat de segmentation peut être évalué par un critère supervisé en prenant en compte des connaissances qui sont le plus souvent des vérités terrains (segmentations de référence). Celles-ci peuvent être obtenues grāce à des experts ou par l’utilisation d’images de synthèse. Dans le cas d’images synthétiques, les données terrain sont objectives et connues avec une extrême précision. A l’inverse, un tracé expert est subjectif et la confiance que l’on peut accorder doit être connue ou estimée.


Les critère d’évaluation non supervisée

Les critères d’évaluation non supervisée reposent sur des facteurs de qualité calculés à partir de l’image segmentée. La plupart de ces mesures de qualité sont établies en accord avec l’intuition humaine sur les conditions à remplir par une segmentation pour qu’elle soit considérée comme bonne.

Par la suite, les critères qui se sont avérés les plus performants ont fait l’objet d’une autre étude visant à les améliorer, en les combinant et en y apportant des modifications.

Une fois cette étude menée à terme, l’objectif est d’appliquer ces résultats à des cas concrets. On peut alors citer diverses applications comme :

  • la comparaison et l’évaluation de divers résultats de segmentations d’un nouvel algorithme de segmentation,
  • la définition de nouvelles méthodes de segmentation par optimisation du critère d’évaluation,
  • la détermination des meilleurs paramètres d’un algorithme de segmentation pour le traitement d’une image,
  • la généralisation au cas des images multi-composantes (SPOT ou CASI par exemple).

1 Les enjeux scientifiques

1.1 Contexte scientifique

La segmentation est une étape essentielle en traitement d’images dans la mesure où elle conditionne l’interprétation de ces images. De nombreux algorithmes ont ainsi été proposés durant les dernières décennies ([1], [2], [3],...). Ils sont basés sur différentes approches : contour, région, texture,... Devant la multitude des méthodes proposées, l’évaluation de la qualité de la segmentation devient primordiale. Habituellement, l’efficacité d’un nouvel algorithme est illustrée par la présentation de quelques résultats de segmentation, ce qui n’autorise que des conclusions subjectives et qualitatives sur les performances de cet algorithme. Un critère d’évaluation de la qualité d’un résultat de segmentation peut alors présenter de nombreux intérêts. Par exemple, il peut permettre de faciliter le choix du paramétrage d’une méthode de segmentation, ou encore autoriser la comparaison de différentes méthodes de segmentation, voire même, de définir de nouvelles méthodes de segmentation (par optimisation du critère). Il pourrait aussi permettre de fusionner des résultats de segmentation en prenant en compte les valeurs des critères comme indice de confiance. Cependant, il n’existe pas à l’heure actuelle de critère absolu et générique pour effectuer cette tâche d’évaluation.

Nous considérons qu’il existe deux grandes classes de critères d’évaluation :

  • l’approche non supervisée qui rassemble les critères d’évaluation ne nécessitant aucune connaissance sur les résultats de segmentation à évaluer. Leur principe consiste à estimer la qualité d’un résultat de segmentation à partir de statistiques calculées sur chaque région, contour ou texture détectés,
  • l’approche supervisée qui regroupe les critères qui évaluent la qualité d’un résultat de segmentation en exploitant des connaissances a priori. Ces connaissances consistent le plus souvent en une comparaison par rapport à une image segmentée de référence appelée vérité terrain (V T).

Actuellement, aucun critère d’évaluation de résultat de segmentation ne se révèle satisfaisant dans tous les cas de figure. Comme le montre Brendan McCane [4], pour évaluer correctement des algorithmes de segmentation, il est pertinent d’utiliser le maximum de techniques d’évaluation à notre disposition et combiner leurs résultats. C’est donc dans cette optique que nous avons orienté nos recherches.

1.2 Approche effectuées

Un état de l’art des critères d’évaluation de résultats de segmentation a tout d’abord été réalisé afin de cerner les techniques existantes ainsi que les problèmes rencontrés par chacun. Les deux aspects évaluation supervisée et non supervisée ont été testés. Dans le cas supervisé, nous avons utilisé des images synthétiques dont nous connaissions la vérité terrain, ainsi qu’une base d’images réelles dont nous avions une base de résultats de segmentation réalisés par des experts. Dans le cas non supervisé, nous avons utilisé des bases d’images synthétiques, ainsi qu’un critère supervisé, Vinet, calculant le taux de classification d’un résultat de segmentation par rapport à une vérité terrain, nous servant de référence. La figure Fig. 1 présente un exemple d’image de ces bases ainsi que ses résultats de segmentations, et le tableau Table. 1 présente quelques exemples de résultats de critères d’évaluation des résultats de segmentation de cette image.

Figure 1: (a) Photo radar et quelques résultats de segmentation.

FCM PCM EDISON
Intra-Inter 0.5196 0.5214 0.5419
Zeboudj 0.1094 0.1172 0.0432
Inter 0.1401 0.1394 0.2559
Intra 6.2846 7.5824 1.1364
Borsotti 0.1952 0.2793 0.0293
Rosenberger 0.4699 0.4677 0.9074

Table 1: Tableau des différents résultats d’évaluation des résultats de segmentation pour la photo radar.

A la suite de cela, nous avons déterminé que l’évaluation non supervisée constituait le problème le plus difficile à résoudre mais aussi le plus intéressant pour de nombreuses applications. En effet, il est rare d’avoir des informations a priori sur les images à segmenter, l’étape de segmentation permet plutôt de les obtenir. Les critères d’évaluation de résultats de segmentation nous ayant semblés les plus pertinents ont alors fait l’objet d’une étude comparative afin d’évaluer leur efficacité ainsi que leur potentielle complémentarité. Pour ce faire, nous avons implémenté ces critères en matlab et C++, ainsi que divers utilitaires. Dans le cas d’images synthétiques, on peut quantifier la qualité d’un résultat de segmentation par le critère de Vinet. Dans le cas d’une image réelle, nous souhaitons utiliser les critères d’évaluation précédents.

Afin de comparer les différents critères d’évaluation non supervisée, nous avons utilisé le facteur de corrélation linéaire entre les résultats de ces critères et le critère de Vinet qui nous sert de référence. Cette étude nous a alors permis de sélectionner les meilleurs critères en fonction des situations, et de montrer leurs points forts ainsi que leurs faiblesses. Les critères retenus dans le cas non supervisé sont celui de Rosenberger dans les cas texturés et ceux de Zéboudj et de Borsotti dans les cas uniformes.

Le travail suivant consiste alors en une amélioration de ces critères. Plusieurs approches ont alors été envisagées.

  • La première consiste en l’amélioration du critère Rosenberger (celui qui a été retenu par l’étude comparative comme le plus intéressant pour ce travail) sur plusieurs points. Tout d’abord, la détection des régions uniformes et texturées est revue car la méthode utilisée ne donnait pas une détection suffisante. En ce qui concerne l’évaluation de régions uniformes, le critère Rosenberger se montrait moins performant que les critères de Zéboudj et Borsotti. L’amélioration suivante a alors consisté à remplacer son évaluation des régions uniformes par celle de Zéboudj et Borsotti.
  • Afin d’obtenir de meilleurs résultats, une approche est de fusionner les différents critères d’évaluation. Pour ce faire, nous allons identifier par un apprentissage sur une base d’images synthétiques, les critères à combiner pour obtenir une mesure d’évaluation évoluant comme le critère de Vinet. Cette approche permettra d’évaluer le résultat de segmentation d’une image réelle en fusionnant les critères d’évaluation les plus pertinents au vu de l’apprentissage à partir d’une base d’images synthétiques.
    • La deuxième approche consiste alors à effectuer une combinaison linéaire de plusieurs critères sélectionnés lors de l’étude comparative. L’objectif est d’obtenir un facteur de corrélation supérieur au résultat obtenu par rapport au critère de référence, à savoir Vinet. Ces critères n’étant pas exprimables simplement en une formule car représentant de nombreux calculs sur toute une image, il est difficile d’utiliser des méthodes d’optimisation telles que le simplexe pour obtenir le résultat. Nous avons opté pour un outil ayant fait ses preuves dans un tel domaine d’application, à savoir les algorithmes génétiques. Les algorithmes génétiques déterminent les solutions d’une fonction en simulant l’évolution d’une population jusqu’à la survie des individus les plus adaptés. Les survivants sont des individus obtenus par croisement, mutation et sélection d’individus de la génération précédente.
    • La troisième approche consiste en la fusion de plusieurs critères par apprentissage. Pour ce faire, nous utilisons un critère tel que Vinet pour quantifier la qualité des résultats de segmentation d’une base d’images. Ensuite, nous souhaitons apprendre comment fusionner les critères d’évaluation utilisés sur la base d’images synthétiques pour améliorer leur facteur de corrélation avec le critère de Vinet. Une fois cet apprentissage effectué, l’objectif est d’évaluer des résultats de segmentation d’images réelles. Pour effectuer un tel apprentissage, nous utilisons un outil qui a déjà fait ses preuves : un séparateur à vastes marges (SVM). Ceci nous permet d’évaluer un résultat de segmentation d’une image réelle en utilisant l’apprentissage réalisé à partir des images synthétiques.

Comme résultats, la première approche donne un gain de corrélation sur la base complète par rapport au critère de Vinet de l’ordre de 5%, tandis que la deuxième donne un gain de l’ordre de 10% et la troisième un gain de l’ordre de 20%.

Les applications de ces nouveaux critères sont:

  • Comparaison et évaluation de résultats de segmentation,
  • Définition de nouvelles méthodes de segmentation d’images par un algorithme génétique : les critères développés serviront de critères optimiser pour obtenir une bonne segmentation,
  • Détermination des meilleurs paramètres d’un algorithme de segmentation pour le traitement d’une image,
  • Généralisation au cas des images multi-composantes (SPOT ou CASI par exemple).