Article de revue

Modélisation de HMM en contexte avec des arbres de décision pour la reconnaissance de mots manuscrits

Pages 29 à 52

Figure 1
Description de l'image par IA : Lettre manuscrite avec des mots extraits et encadrés.

Exemple de lettre manuscrite de la base Rimes et des mots extraits de cette lettre, traités par notre système

Figure 2
Description de l'image par IA : Illustration montrant l'extraction de caractéristiques géométriques par une fenêtre glissante sur un texte.

Illustration de l’extraction de caractéristiques géométriques par fenêtre glissante

Figure 3
Description de l'image par IA : L'image montre un mot décomposé en ses lettres individuelles, chaque lettre étant représentée par une combinaison de symboles.

Modélisation d’un mot par la concaténation des caractères le composant

Figure 4
Description de l'image par IA : Deux mots écrits avec des lettres "i" et "n" différentes dans "Monsieur" et "distinguée".

Illustration des différentes formes que peut prendre un caractère selon son contexte : "i" et "n" ont une forme différente pour chaque apparition dans les mots ci-dessus

Figure 5
Description de l'image par IA : Diagram de processus avec ré-estimation des paramètres et augmentation des mixtures.

Présentation générale du système à base de HMM de caractères en contexte

Figure 6
Description de l'image par IA : Illustration de clustering d'états pour trigrammes centrés sur la lettre b.

Illustration du clustering d’états pour les trigraphes centrés sur la lettre b

Figure 7
Description de l'image par IA : Arbre de décision avec des questions et des branches menant à différents clusters basés sur des trigrammes.

Exemple d’arbre de décision pour le clustering d’états : l’ordre des questions et les clusters sont associés à un état donné (ici l’état numéro 2) de tous les trigraphes ? ? b + ?

Figure 8
Description de l'image par IA : Arbre décisionnel avec des questions et réponses pour sélectionner un cluster pour l'état 2 du trigraphe de test m-b+e non appris.

Sélection de cluster pour l’état 2 du trigraphe de test m ? b + e non appris (absent du lexique d’apprentissage mais présent dans celui du test)

Tableau 1
Tableau comparatif de paramètres d'extraction pour différents modèles de systèmes génériques.

Comparaison de différents paramètres pour l’extraction des caractéristiques, sur un système générique appris sur la base d’apprentissage de Rimes et testé sur la base de validation

Figure 9
Description de l'image par IA : Graphique montrant l'impact du nombre final d'états (clusters) sur le taux de reconnaissance.

Influence du nombre final d’états (clusters) différents sur le taux de reconnaissance (base de validation ; 8 états/trigraphe ; 10 distributions Gaussiennes/état)

Tableau 2
Tableau comparant les systèmes CI et CD avec différents ensembles d'apprentissage et résultats de test.

Comparaison des systèmes présentés, modélisant les caractères en fonction de leur contexte (CD) ou non (CI). Résultats sur la base de test de Rimes 2009 contenant 7 464 images

Tableau 3
Tableau comparatif des taux de reconnaissance lexicale de différents systèmes à base de HMM, incluant les pourcentages de test et complet.

Comparaison avec l’état de l’art des systèmes à base de HMM uniquement sur la base de test Rimes 2009