Article de revue

Using BLSTM for interpretation of 2-D languages

Case of handwritten mathematical expressions

Pages 135 à 157

Figure 1
Description de l'image par IA : Réseau récurrent unidirectionnel avec couches d'entrée, cachée et de sortie, vecteurs de probabilités et séquences temporelles.

An unfolded single-directional recurrent network

Figure 2
Description de l'image par IA : Bloc de mémoire LSTM avec une cellule, portes d'entrée, sortie et oubli, connexions entre les composants.

LSTM memory block with one cell, figure extracted from (Graves et al., 2012)

Figure 3
Description de l'image par IA : Deux arbres de relations de symboles avec des flèches et des labels "Au-dessus" et "En dessous".

The symbol relation tree (SRT) for (a) and (b)  ’R’ is for left-right relationship

Figure 4
Description de l'image par IA : Deux écritures de "2 2" avec quatre traits, leurs relations et leur SLG.

(a) ’2 + 2’ written with four strokes; (b) the symbol relation tree of ’2 + 2’; (c) the SLG of ’2 + 2’. The four strokes are indicated as s1, s2, s3, s4 in writing order. (ver.) and (hor.) are added to differentiate the vertical and the horizontal strokes for ’+’. ’R’ is for left-right relationship

Figure 5
Description de l'image par IA : Trois diagrammes avec des cercles et des flèches, des étiquettes "ver", "hor", "R", et des chemins temporels en rouge et bleu.

(a) The time path (red) in SLG; (b) the time path; (c) the built SLG of ’2 + 2’, added edges are depicted as bold

Figure 6
Description de l'image par IA : Descriptions de diagrammes de traçage et de SRT pour les caractères Peo et r2h.

(a) Peo written with four strokes; (b) the SRT of Peo; (c) r2h written with three strokes; (d) the SRT of r2h, the red edge cannot be generated by the time sequence of strokes

Figure 7
Description de l'image par IA : Points bleus et rouges en mouvement, numérotés de 1 à 11.

The illustration of on-paper points (blue) and in-air points (red) in time path, a1 + a2 written with 6 strokes

Figure 8
Description de l'image par IA : Le diagramme montre une séquence de points avec des étiquettes et des boucles entre les points "vide" et "fin".

The possible sequences of point labels in one stroke

Figure 9
Description de l'image par IA : Cercle noir étiquettes, blanc vide, flèches transitions autorisées, mise à jour avant-arrière.

Local CTC forward-backward algorithm. Black circles represent labels and white circles represent blanks. Arrows signify allowed transitions. Forward variables are updated in the direction of the arrows, and backward variables are updated in the reverse direction

Figure 10
Description de l'image par IA : Illustration montrant l'étiquetage des traits pour une meilleure lisibilité, chaque trait est étiqueté correctement sauf le trait 6.

Illustration for the decision of the label of stroke. For being more readable, all the strokes are given the correct label except stroke 6

Figure 11
Description de l'image par IA : L'image montre deux schémas avec des points rouges représentant des calculs de caractéristiques à pi, étiquetés θi, φi et ψi.

The illustration of (a) θi, φi and (b) ψi used in feature description. The points related to feature computation at pi are depicted in red

Figure 12
Description de l'image par IA : x égale r cosinus thêta

A real example from CROHME 2014 data set (sample from the data set 1)

Table 1
Résultats d'évaluation du niveau de symbole sur l'ensemble de test CROHME 2014.

The symbol level evaluation results on CROHME 2014 test set, including the experiment results in this work and CROHME 2014 participant results (Top 4 by recall of Segments)

Table 2
Table résultats évaluation niveaux d'expression CROHME 2014.

The expression level evaluation results on CROHME 2014 test set, including the experiment results in this work and CROHME 2014 participant results (Top 4)

Figure 13
Description de l'image par IA : Diagram (a) montre une écriture en quatre traits ; (b) montre un schéma SLG avec des étiquettes correctes.

(a) a ≥ b written with four strokes; (b) the built SLG of a ≥ b according to the recognition result, all labels are correct

Figure 14
Description de l'image par IA : L'image montre trois schémas : (a) écriture en six traits, (b) SLG de référence, (c) SLG reconstruite avec quatre erreurs de liaison.

(a) written with six strokes; (b) the ground-truth SLG; (c) the 44 rebuilt SLG according to the recognition result. Three edge errors occurred: the Right relation between stroke 2 and 4 was missed because there is no edge from stroke 2 to 4 in the time path; the edge from stroke 4 to 3 was missed for the same reason; the edge from stroke 2 to 3 was wrongly recognized and it should be labeled as NoRelation

Table 3
Table de résultats d'évaluation à différents niveaux symboliques.

The symbol level evaluation results on CROHME 2014 test set with different training and decoding methods, features