Numéro de revue

Varia

Document numérique
2006/1 Vol. 9


108 pages

Figure 1
Description de l'image par IA : Le diagramme montre les trois vues d'un document structuré : sémantique, logique et présentation, avec des formats propriétaires et XML.

Les trois vues d’un document structuré

Figure 2
Description de l'image par IA : Description en français : Exemple de conversion de données en XML pour l'accès aux informations de formation et de compétences.

Un exemple de conversion

Figure 3
Description de l'image par IA : Arbre représentant un exemple de curriculum avec des nœuds pour compétences, formation, années, titres et affiliations.

Représentation arborescente de l’exemple

Figure 4
Tableau des attributs XML pour l'accessibilité des livres.

Les principaux attributs utilisés par le classifieur

Figure 5
Description de l'image par IA : Diagram triangulaire avec une branche étiquetée "d" et des cases en bas avec des paires (x, y).

Arbre de dérivation d pour le couple (x, y)

Tableau 1
Tableau comparatif des résultats d'évaluation pour différentes méthodes et outils (TechDoc, Shakespeare) avec des scores PET et PEN.

Résultats de l’évaluation

Figure
Description de l'image par IA :
Figure
Texte en français avec des termes techniques et des abréviations. Contient des mots comme UTC, est, comprend, UT(i), et UT(N).
Figure
Texte XML avec balises et descriptions en français.
Figure
Texte en français sur fond blanc avec police standard. Contient des phrases sur des interventions sociales et des projets de formation.
Figure
Code XML pour description d'accessibilité, incluant balises <FOCUS>, <BREAK>, <PROSODY>, et attributs comme type, strength, pitch.
Figure 1
Description de l'image par IA : Deux graphiques montrant des variations de proximité floue : (a) trois occurrences et (b) un terme.

(a) les proximités floues aux trois occurrences, (b) la proximité floue au terme

Figure 2
Description de l'image par IA : Ligne de cases avec A et B, suivies de graphiques en forme de triangles.

Document 1 – Représentation de pd1A, pd1B, pd1A ou B et pd1A et B

Figure 3
Description de l'image par IA :

Document 2 – Représentation de pd2A, pd2B, pd2A ou B et pd2A et B

Figure 4
Description de l'image par IA : Graphique avec une fonction d'influence limitée à une zone étroite.

Fonction d’influence avec un zone d’influence très limitée

Figure 5
Description de l'image par IA : L'image montre un graphique avec un rectangle sur l'axe des y allant de 0 à 1/2k, centré autour de l'axe des x passant par -k, 0 et +k.

Fonction d’influence rectangulaire

Figure 6
Description de l'image par IA : Une ligne avec des points et des segments, étiquetée de 0 à 1/2k, avec des positions marquées n-k, u, v-k, n+k, v, et y+k.

La surface de l’intersection entre les rectangles représente le score du document. Les deux occurrences des termes sont à la position u et à la position v

Figure
Description de l'image par IA : Code numérique C249. Titre : "Championne du 10.000 mètres féminin".
Figure
Texte en français avec descriptions accessibles pour malvoyants.
Figure 7
Description de l'image par IA : Courbe montrant différentes méthodes de rappel et précision avec des requêtes disjonctives automatiques.

Courbe Rappel/Précision avec des requêtes disjonctives automatiques

Figure 8
Description de l'image par IA : Courbe montrant la précision de requêtes conjonctives automatiques avec divers termes de titre.

Courbe Rappel/Précision avec des requêtes conjonctives automatiques construites avec les termes du champs titre

Figure 9
Description de l'image par IA : Courbe montrant plusieurs lignes de précision en fonction de pourcentages, avec des légendes pour différentes méthodes.

Courbe Rappel/Précision avec des requêtes construites manuellement à partir des champs titre et description

Tableau 1
Tableau avec descriptions des variables du discours scientifique : ABR, CON, FGW, NUM, LS, PON, VER, SIG, SYM.

Principaux traits caractéristiques du discours scientifique

Tableau 2
Description de l'image par IA : Tableau avec trois catégories: Articles, Présentations de revues, Comptes rendus, et leurs nombres en Linguistique et Mécanique.

Présentation du corpus utilisé

Figure 1
Description de l'image par IA : Courbe montrant % de documents bien classés vs nombre de variables.

Classification en domaines avec SVM sur corpus local (ART-Corpus)

Figure 2
Description de l'image par IA : Courbe montrant % documents bien classés vs nombre de variables.

Classification en domaines avec SVM sur corpus global

Figure 3
Description de l'image par IA : Courbe montrant % documents bien classés vs nombre de variables.

Classification en genres avec SVM sur corpus local (LING-Corpus)

Figure 4
Description de l'image par IA : Courbe montrant % de classification correcte en fonction du nombre de variables.

Classification en genres avec SVM sur corpus global

Figure 5
Description de l'image par IA : Graphique montrant % documents bien classés vs nombre de variables.

Classification en genre avec AD sur corpus local (LING-Corpus)

Figure 6
Description de l'image par IA : Graphique montrant la classification en genre avec AD sur corpus global.

Classification en genre avec AD sur corpus global

Tableau 3
Tableau comparatif des précisions micro et macro pour la classification en domaine et genre avec pourcentages.

Micro et macro-précisions sur le corpus global avec C4.5

Tableau 4
Tableau des descripteurs morphosyntaxiques et lexicaux avec exemples de mots.

Descripteurs morphosyntaxiques et lexicaux discriminants en matière de classification en domaines

Figure 7
Description de l'image par IA : Arbre décisionnel avec descripteurs pour classification en domaines.

Arbre représentatif pour la classification en domaines avec l’ensemble de descripteurs

Tableau 5
Tableau des descripteurs morphosyntaxiques et lexicaux avec exemples pour classification en genres.

Descripteurs morphosyntaxiques et lexicaux discriminants en matière de classification en genres

Figure 8
Description de l'image par IA : Arbre de classification avec descripteurs pour genres, incluant articles, chapitres, et présentations de revues.

Arbre représentatif pour la classification en genres avec l’ensemble de descripteurs

Figure 1
Description d'une espèce botanique avec texte et illustrations en noir et blanc.

Description d’une espèce. Les pages des volumes papier fournis par l’IRD ont été numérisées en TIFF, puis le texte a été extrait par un logiciel d’OCR. C’est sur le texte ainsi extrait que portent les travaux d’analyse structurelle et linguistique menés dans le projet BIOTIM

Figure 2
Code XML avec annotations morpho-syntaxiques pour des mots en français.

Exemple d’annotations morpho-syntaxiques au format MAF

Figure 3
Description de l'image par IA : Diagramme montrant la conversion de texte en XML, puis en OWL et MAF, avec des étapes d'analyse et d'extraction.

La structure XML, obtenue par rétroconversion à partir du texte, sert d’une part à construire une hiérarchie de classes OWL reflétant la taxinomie botanique traditionnelle et d’autre part à mieux cibler des traitements linguistiques permettant d’extraire les informations relatives aux organes constitutifs des plantes

Figure 4
Code XML représentant les relations entre genres et espèces dans un volume de la Flore du Cameroun.

Aperçu général de la représentation des relations entre genres et espèces dans un volume de la Flore du Cameroun après conversion en XML

Figure 5
Code XML représentant la hiérarchie de classes OWL pour la taxonomie des plantes.

Représentation OWL de la hiérarchie de classes

Figure 6
Texte XML décrivant une espèce botanique avec détails physiques.

Représentation XML de la structure logique d’une fiche décrivant une espèce. Les paragraphes situés dans l’élément description contiennent une description physique détaillée de l’espèce

Figure 7
Tige courte, feuilles lancéolées, fleurs blanches et vertes, bractées florales, pédicelle, sépales et pétales décrits en détail.

Description des caractéristiques physiques d’une espèce

Figure
Description de l'image par IA :
Figure 8
Description de l'image par IA : Code XML avec des annotations lexicographiques pour des termes botaniques comme sépale, dorsal, ovale-lancéolé, etc.

Début des annotations liées à la description d’un sépale dorsal