Construction incrémentale d'une ontologie par analyse du texte et de la structure des documents
- Par François Role
- et Guillaume Rousse
Pages 77 à 91
Citer cet article
- ROLE, François
- et ROUSSE, Guillaume,
- Role, François.
- et al.
- Role, F.
- et Rousse, G.
Description d’une espèce. Les pages des volumes papier fournis par l’IRD ont été numérisées en TIFF, puis le texte a été extrait par un logiciel d’OCR. C’est sur le texte ainsi extrait que portent les travaux d’analyse structurelle et linguistique menés dans le projet BIOTIM
La structure XML, obtenue par rétroconversion à partir du texte, sert d’une part à construire une hiérarchie de classes OWL reflétant la taxinomie botanique traditionnelle et d’autre part à mieux cibler des traitements linguistiques permettant d’extraire les informations relatives aux organes constitutifs des plantes
Aperçu général de la représentation des relations entre genres et espèces dans un volume de la Flore du Cameroun après conversion en XML