Proust, Kolb, Kolb-Proust : emboîtement d'écritures autour de l'écriture
Pages 135 à 154
Citer cet article
- SZYLOWICZ, Caroline,
- Szylowicz, Caroline.
- Szylowicz, C.
Citer cet article
- Szylowicz, C.
- Szylowicz, Caroline.
- SZYLOWICZ, Caroline,
Notes
- [1]
-
[2]
Voir par exemple les sites du centre Flaubert de l’université de Rouen (http:// www. univ-rouen. fr/ flaubert), le projet HyperNietzsche de l’ITEM (D’Iorio, 2000, [DIO 00]), Gallica à la Bibliothèque nationale de France (http:// gallica. bnf. fr), ou les travaux d’E. Vanhoutte sur les correspondances d’auteurs et compositeurs flamands des XIXe et XXe siècles (Vanhoutte 1999, [VAN 99]) et ceux d’O. Eide sur la correspondance d’Ibsen (Eide 2001, [EID 01]).
-
[3]
Cette image m’a été suggérée par le professeur Leleu-Merviel au congrès H2PTM’01.
-
[4]
ITEM/équipe Proust :http:// www. item. ens. fr/ equiprojet/ EQPaccueil. htm.
-
[5]
Voir figures 1 à 3.
-
[6]
Guidelines for Electronic Text Encoding and Interchange. Edited by C. M. Sperberg-McQueen and Lou Burnard. Chicago, Oxford : Text Encoding Initiative, 1994.
- [7]
-
[8]
Des négociations sont en cours avec l’éditeur Plon pour fixer les conditions de numérisation et de diffusion.
1 – Introduction
1Le centre de recherche Kolb-Proust de la bibliothèque de l’Université d’Illinois procède depuis 1994 à la constitution d’une base de connaissances sur la vie intellectuelle, mondaine, culturelle et artistique en France pour la période 1870-1925, sous forme d’un outil hypertexte [1]. Le centre, établi en 1993, est basé dans le cabinet de travail du professeur Philip Kolb (1907-1992), un chercheur américain qui a établi l’édition de la correspondance générale de Marcel Proust (1871-1922). La base trouve son point de départ dans un vaste système de fichiers élaboré par Kolb pour gérer les masses d’informations nécessaires à l’édition critique des lettres de Proust.
2Ce projet se distingue des nombreuses ressources littéraires qui se sont développées avec les hypermedias depuis plusieurs années. A la différence d’autres projets [2] dont l’objectif est de transférer sur de nouveaux supports des textes et des documents déjà existants tels que des œuvres complètes et leur appareil critique, des manuscrits ou des correspondances d’auteurs, ou encore des documents historiques, le projet Kolb-Proust consiste en un travail de réécriture et d’amplification des sources et des notes de recherche personnelles d’un chercheur, elles-mêmes centrées autour de la correspondance d’un auteur, structure qu’on peut comparer à des matriochkas, ces poupées russes en bois de taille croissante qui s’emboîtent les unes dans les autres [3]. Chaque nouveau niveau d’écriture vient se superposer au précédent, en cercles concentriques, tout en gardant un rapport direct aux niveaux antérieurs.
2 – Les différentes couches d’écriture
3On peut distinguer trois, voire quatre couches successives d’écriture qui s’accumulent de façon quasiment ininterrompue depuis maintenant plus d’un siècle. La correspondance de Marcel Proust représente la première, ou les deux premières couches d’écriture, si l’on considère comme une couche distincte la citation littéraire dont Proust émaille ses lettres tout au long de sa vie. La couche suivante est constituée par les travaux de Philip Kolb, qui enveloppent et éclairent la correspondance et dépassent par leur ampleur le statut de simple appareil critique, mais qui ne trouvent véritablement leur cohérence qu’en relation avec les lettres dont elles découlent. Les diverses opérations suscitées par la transformation de ce matériau critique en un nouveau document primaire apportent la dernière couche (en date !), par la numérisation, le reformatage des contenus et l’élargissement du sujet visé.
2.1 – Ecriture de Marcel Proust
4Le nombre des lettres de Proust publiées à ce jour s’élève environ à 5 500, si l’on compte l’édition générale, quelques recueils séparés comme la correspondance avec Gaston Gallimard ou les lettres à Lucien Daudet, et des publications récentes en revues. Se référant aux diverses mentions de lettres écrites mais jamais retrouvées, conservées dans des collections privées ou tout simplement jamais expédiées ou détruites, Philip Kolb situait le nombre total de lettres écrites par Proust aux alentours de 20 000. De nouvelles lettres apparaissent régulièrement dans les catalogues de ventes aux enchères et de marchands d’autographes et viennent petit à petit combler les vides de ce grand puzzle.
5La correspondance de Proust a largement été utilisée comme source de renseignements sur l’élaboration de l’œuvre proustienne et la vie de son auteur par les critiques littéraires et les généticiens mais elle a été encore peu étudiée pour elle-même, en tant que corpus à part entière. Cela tient sans doute en partie au fait que l’édition générale de Kolb n’a été achevée que relativement récemment (le vingt et unième volume est paru fin 1993). Si la fonction première de la correspondance de Proust est de servir de lien entre le monde extérieur et son auteur, certains critiques voient en elle d’autres rôles, parmi eux celui de « cordon sanitaire » pour tenir le monde extérieur à distance et préserver sa solitude, ou de terrain d’essai pour l’élaboration du style de A la recherche du temps perdu [ROB 96]. Ce corpus est composé de très nombreux éléments autonomes, qui au contraire des chapitres d’un livre, ne s’enchaînent pas selon un ordre préétabli par son auteur, mais s’accumulent tout au long de sa vie.
6On peut aussi distinguer dans ce corpus deux niveaux d’écritures, le premier composé des lettres, le second sous la forme de nombreuses citations littéraires serties dans le texte de ces missives. Proust en fait un usage très fréquent, dans sa correspondance encore plus que dans ses œuvres. Le fichier des citations littéraires constitué par Kolb sur la base des 5 000 lettres éditées contient environ 1 100 fiches, qui correspondent chacune à une citation différente, plus une liste d’une cinquantaine de citations pas encore identifiées. C’est d’autant plus considérable que certaines citations se retrouvent dans plusieurs lettres. Les auteurs représentés vont des classiques grecs et latins aux auteurs traditionnels, à ses contemporains. Un projet lancé en 1998 par l’équipe Proust de l’Institut des textes et manuscrits modernes (ITEM) du CNRS [4] cherche à retracer les lectures de Proust, à reconstituer en quelque sorte sa bibliothèque, grâce à un relevé systématique de toutes les notations de lecture présentes dans la correspondance, dont les citations littéraires. Une étude préliminaire du relevé jusqu’à l’année 1904 montre que la citation littéraire joue des rôles différents suivant les lettres : simple citation pour illustrer ou commenter, pastiche, déformation et morcellement des textes cités pour en adapter le sens à ses besoins et s’en approprier les termes, procédé qui devient un travail de réécriture de la part de l’écrivain, « il s’agit bien pour Proust de chercher, avec les mots des autres, à composer sa propre voix » [LAM 99].
2.2 – Ecriture de Philip Kolb
7Philip Kolb a consacré toute sa carrière à l’édition de la correspondance de Marcel Proust, depuis son doctorat entamé en 1935 jusqu’à son décès. Après sa thèse, qui propose des principes généraux d’édition et une redatation systématique des lettres de Proust déjà publiées à l’époque [KOL 49], Philip Kolb entreprend une édition générale organisée de façon chronologique, en accord avec la nièce de l’écrivain. Défi de taille, quand on sait que l’écrivain ne datait que très rarement ses lettres.
8Très tôt, Kolb élabore un système de fichiers croisés pour enregistrer et classer la masse des informations dont il se sert pour la datation et l’annotation de la correspondance. Ces informations proviennent des lettres elles-mêmes, d’échanges avec des contemporains de Proust, ou résultent de recherches incessantes, véritables travaux de détective privé, dans les journaux et revues de l’époque, les biographies et mémoires de contemporains, les annuaires mondains et professionnels, les encyclopédies, les répertoires accumulés au fil des années dans le cabinet de travail alloué par la bibliothèque universitaire. Chaque bribe, nom de personne, titre, lieu, date, événement, est reporté manuellement sur une fiche bristol de 3 x 5 pouces (7 x 12,5 cm), immédiatement classée dans l’un des fichiers suivants :
- fichier bio-bibliographique des personnes réelles ou imaginaires citées dans la correspondance (11 300 fiches) ;
- fichier biographique complémentaire de personnes n’apparaissant pas dans la correspondance : homonymes ou parents de personnes citées, personnalités dont Kolb pensait qu’elles pourraient apparaître dans des lettres restant à découvrir (4 800 fiches) ;
- chronologie des petits et grands événements qui jalonnent la vie de Proust et fournissent une trame de référence pour la datation des lettres (9 500 fiches) ;
- fichier d’identification des lettres, qui permettait à Kolb de classer et reclasser les lettres au fur et à mesure de ses découvertes (6 900 fiches) ;
- fichier toponymique de la correspondance (2 100 fiches) ;
- bibliographie de tous les écrits publiés par Proust et de tous les écrits à son sujet jusqu’à sa mort en 1922 (1 380 fiches) ;
- index des périodiques de l’époque (400 fiches) ;
- fichier des citations littéraires trouvées dans la correspondance, dans la/les version(s) de Proust et dans leur version originale (1 100 fiches).
9Ces fiches sont par nature des documents inachevés parce qu’elles sont essentiellement des listes de renseignements divers glanés au cours de nombreuses années de travail. Au contraire de la structure des fichiers, très bien définie, la structure interne de chaque fiche est beaucoup plus floue. Mis à part un en-tête qui permet de retrouver et de reclasser la fiche, les informations sont reportées dans l’ordre de leur découverte, parfois classées par catégories, mais le critère principal est souvent l’espace blanc restant sur la fiche. Les fichiers représentent un ensemble documentaire de structure très fragmentaire où l’on n’accède pas de façon linéaire, suivant un plan préétabli, mais où chaque fiche est un point d’entrée potentiel, suivant les besoins de l’utilisateur.
10Après le décès de Philip Kolb, on recense dans son cabinet transformé en véritable laboratoire proustien plus de 40 000 de ces fiches, ainsi que 2 000 volumes et microfilms, et 400 dossiers dans lesquels il conservait, triées par correspondant, les reproductions et les transcriptions des lettres et une multitude de documents tels qu’extraits d’actes de naissance ou de décès, notes de lecture, extraits de périodiques, etc. L’ensemble documente la vie et l’œuvre de Marcel Proust dans ses moindres détails, présente un panorama de la vie intellectuelle, artistique, et mondaine de l’époque et fixe les progrès des recherches de Kolb, dont l’état le plus abouti est fixé dans les parties liminaires et les notes de la correspondance éditée [PRO 70].
2.3 – Ecriture de l’équipe Kolb-Proust
11Conscients de la valeur documentaire de ce fonds, les héritières de Philip Kolb, la bibliothèque et le département de français de l’université décident d’en mettre le contenu à la disposition du public. Les ouvrages qui appartenaient à Philip Kolb et ceux extraits des magasins généraux constituent désormais une collection à part entière au sein de la bibliothèque.
12Les fichiers, trop fragiles pour être communiqués en l’état, sont en cours de numérisation. A ce premier projet viendront se greffer d’autres corpus comme le texte intégral de la correspondance éditée par Kolb, qui est au cœur de cette entreprise, les images numérisées des lettres originales, dont la bibliothèque possède une importante collection, ou d’autres matériaux comme des correspondances entre des tiers, des documents visuels ou sonores, etc.
13La mise en ligne des matériaux de recherche de Philip Kolb fait basculer la fonction de ces documents. Ils passent ainsi d’un statut de note de recherche ou d’aide-mémoire rédigé par et pour un seul individu à celui de notice documentaire à l’usage d’un public varié composé de chercheurs et d’étudiants, pas forcément spécialistes de Proust, d’amateurs plus ou moins éclairés, de journalistes, d’auteurs de jeux télévisés, etc.
14Cette nouvelle fonction amène des modifications dans la structure et le contenu des documents, comme une structuration plus homogène des données dans chaque fichier, le développement des notes de Kolb en langage clair pour plus de lisibilité, l’ajout de métadonnées qui multiplie les possibilités de consultation ou la mise à jour régulière du contenu des fiches au fur et à mesure de la découverte de nouvelles informations pour préserver l’utilité de ces données et élargir le point de vue au-delà de Proust.
3 – Processus d’écriture du document Kolb-Proust
3.1 – Choix informatiques
15Plutôt que de s’embarquer dans la construction d’une base de données qui s’annonçait très complexe, les informaticiens de la bibliothèque ont recommandé en 1994 l’emploi du métalangage SGML (Standard Generalized Mark-up Language) et de la DTD TEI (Text Encoding Initiative [6]) qui possèdent tous les éléments nécessaires pour une représentation détaillée des données.
16SGML est un langage libre de droit et multiplate-forme, ce qui facilite les transferts d’un logiciel à l’autre au fur et à mesure des progrès techniques, détail non négligeable pour un projet de longue haleine.
17Jusqu’à présent, l’exploitation des fichiers SGML s’est faite grâce au logiciel Livelink de la société Opentext. La bibliothèque universitaire ayant récemment abandonné ce logiciel pour l’exploitation de ses autres produits documentaires numériques au profit d’outils XML, une transition similaire est prévue pour le centre Proust dans un futur proche.
3.2 – Balisage structurel
18Le langage SGML requiert une analyse distincte de la forme et du contenu des documents auxquels il s’applique. Les fiches de Kolb ne correspondant pas à l’un des types de documents prévus par la DTD TEI, il a fallu créer une structure type pour chaque fichier. Le résultat est une série de formulaires vierges dans les catégories desquels sont triées les données de chaque fiche.
19Trois fichiers ont été sélectionnés pour la première phase de numérisation :
- la bibliographie des écrits de et sur Proust, entièrement disponible en ligne ;
- la chronologie, en cours d’achèvement, disponible en ligne jusqu’à l’année 1913 (à l’automne 2001) ;
- le fichier bio-bibliographique, en cours de traitement.
20Un échantillonnage a permis de repérer les différents types de données présents dans chacun de ces fichiers. Les deux premiers fichiers sont constitués d’un nombre limité d’éléments clairement structurés :
- Bibliographie :
- Date
- Citation bibliographique détaillée
- Extraits/commentaires de Kolb
- Chronologie :
- Date
- Evénement(s)
- Source(s)/citation(s) bibliographiques(s)
Exemple de fiche bibliographique
Exemple de fiche bibliographique
Exemple de fiche chronologique
Exemple de fiche chronologique
21Le fichier biographique est plus complexe. Mis à part l’en-tête de la fiche qui contient le nom et les dates de naissance et de décès, le contenu est très varié et sa disposition dépend entièrement de l’ordre dans lequel les informations ont été obtenues et de l’espace vierge disponible sur la fiche, puisque Kolb faisait tenir sur une seule fiche la totalité de ses renseignements concernant une personne, quelle qu’en soit la quantité :
- Biographie :
- Nom/dates de naissance et de décès
- Sans ordre apparent : éducation, carrière, décorations, œuvres, portraits, adresses, faits marquants ou se rapportant à Marcel Proust, citations chez Proust et autres auteurs, existence de correspondance avec Proust, etc.
Exemple de fiche biographique
Exemple de fiche biographique
22A partir de cet échantillonnage, des formulaires ont été construits à l’aide de l’éditeur SGML Author/Editor (sociétés Softquad puis Interleaf) pour fixer la structure élémentaire des documents numériques et faciliter la saisie des données.
Formulaire de saisie pour le fichier bibliographique
Formulaire de saisie pour le fichier bibliographique
Formulaire de saisie pour le fichier chronologique
Formulaire de saisie pour le fichier chronologique
23La préparation du document électronique s’effectue en plusieurs étapes. La saisie consiste à déchiffrer l’écriture manuscrite de Philip Kolb et à classer les différents éléments à l’aide d’un des formulaires prédéfinis.
24Une fois ce premier tri établi, un gros travail éditorial est nécessaire pour rendre le contenu des fiches intelligible : il faut développer les nombreux symboles et abréviations, rendre à chaque citation la source qui lui correspond, éliminer les doublons, remplacer les références bibliographiques d’anciens volumes de lettres de Proust par la référence équivalente dans l’édition générale de Kolb, devenue la référence dans le domaine (celle-ci fournit pour chaque lettre la liste des publications précédentes : il n’y a donc pas de perte d’information).
25Il est souvent nécessaire de retourner aux documents d’origine pour confirmer le rapport entre une note et une source, ou pour étoffer une citation obscure parce que Kolb n’en a extrait que trois ou quatre mots en guise d’aide-mémoire.
26Le texte ainsi établi est pris en charge par une personne différente pour la suite des opérations, ce qui permet une relecture par des yeux « non avertis », plus susceptibles de repérer les coquilles et les passages confus.
Formulaire de saisie pour le fichier biographique
Formulaire de saisie pour le fichier biographique
Texte de la figure 1 après saisie dans le formulaire chronologique
Texte de la figure 1 après saisie dans le formulaire chronologique
3.3 – Balisage du contenu
27Des éléments du contenu déterminés à l’avance sont codés de façon systématique avec différentes balises et attributs SGML, qui permettent de valoriser certains aspects du fichier qui étaient pratiquement inaccessibles dans sa version papier et qui multiplient les critères de recherche proposés aux utilisateurs.
28Ce procédé a d’abord été testé sur le fichier bibliographique, mais il est aujourd’hui mis en œuvre à plus grande échelle dans le fichier chronologique, en cours d’édition. Il sera ensuite adapté au fichier biographique, actuellement en cours de saisie, puis aux fichiers restants. Dans la chronologie, les éléments suivants font l’objet d’un codage particulier : dates, titres, personnes, renvois et/ou corrélats.
3.3.1 – Dates
29La date d’en-tête reçoit la balise <DATE> </DATE>.
30Chaque date est composée en théorie d’un jour, d’un mois et d’une année. Ces trois éléments sont convertis en une valeur numérique de modèle « AAAAMMJJ » qui est utilisée comme attribut pour permettre des recherches ultérieures sur des dates ou des périodes.
Ex
3.3.1.1 – Dates incomplètes
31Lorsque le jour et/ou le mois manquent, ils sont remplacés par le jour et/ou le mois « 00 ». Cette substitution permet au moteur de recherche de prendre en compte la totalité des fiches dans les recherches chronologiques.
Ex
3.3.1.2 – Dates imprécises
32Il n’est malheureusement pas encore possible de traduire toutes les hésitations et les nuances du langage naturel en valeurs numériques. Lorsqu’une date complète est nuancée par une expression telle que « vers », « peu avant », « quelques jours après », la date est codée comme une date normale.
Ex
Ex
« 1904 début août » devient « 19040801 » (« fin août » serait noté « 19040831 »)
33Les indications de saison ne sont pas prises en compte, après de longs débats qu’il ne convient pas de reprendre ici. Les dates concernées sont traitées comme des dates incomplètes qui ne contiendraient que l’année.
34Les dates multiples sont décomposées et codées date par date.
Ex
3.3.2 – Titres
35Les titres reçoivent la balise <TITLE> </TITLE>.
36Les œuvres littéraires, musicales ou artistiques citées dans le corps de la fiche reçoivent un code de deux lettres associé à l’attribut « TYPE », qui précise leur genre.
37Les catégories suivantes ont été retenues : arts graphiques (ag), danse (ds), essai (es), musique (mu), opéra (op), poésie (po), récit (re), sculpture (sc), spectacle (sp), théâtre (th). Ce travail d’indexation nécessite l’identification d’une grande partie des œuvres citées à l’aide de divers ouvrages de référence, mais il ouvre de nouvelles possibilités dans l’utilisation du.
Ex
« […] <TITLE TYPE=“ds”>l’Après-midi d’un faune</TITLE> où Nijinsky dansait avec un génie qui rejoignait celui de Debussy ! »
3.3.3 – Personnes/personnages
38Toutes les personnes, réelles ou fictives, reçoivent la balise <NAME> </NAME> et un code alphanumérique unique, généralement composé des six premières lettres du nom de famille et d’un ou plusieurs chiffres, associé à l’attribut « KEY ».
Ex
<NAME KEY=“proust2”>Jeanne Weil, Mme Adrien Proust</NAME> (mère de M. Proust)
39L’attribution d’un code unique à chaque personne identifiée a nécessité la mise en place d’une base de données afin d’éviter qu’un même code soit attribué à deux personnes différentes ou qu’une même personne reçoive deux codes différents, et pour permettre à plusieurs encodeurs de travailler simultanément.
40La base consistait au départ en une simple liste d’autorités de noms et de codes. Très vite, il est devenu nécessaire d’ajouter des informations supplémentaires pour distinguer les homonymes, particulièrement fréquents à cause de la présence de nombreux titres de noblesse. Au nom complet (incluant les surnoms et les pseudonymes) viennent s’ajouter, chaque fois que c’est possible, les années de naissance et de décès, de mariage(s) et de divorce(s) pour les femmes, la profession, le lien de parenté avec d’autres personnes recensées, la date de changement de titre de noblesse, ou si rien de tout ceci n’est connu, au moins l’année et les circonstances dans lesquelles la personne est citée : compte rendu mondain, témoin à un mariage ou un duel, etc. Parfois l’incertitude demeure : Mme Trousseau aperçue en 1894 à Trouville est-elle la même personne que Mme Trousseau rendant visite à Mme Aubernon en 1897 ? Dans de tels cas, deux identifications distinctes sont maintenues par prudence.
41Les titres de noblesse requièrent un gros travail de prosopographie : le titre de duc de Noailles est-il porté par la même personne en 1896 et en 1909, ou bien a-t-on affaire au père et à son fils ? Quelques chiffres : du début du fichier à l’année 1913, soit environ 6 800 fiches, on recense dans la chronologie plus de 6 400 personnes différentes. Des vérifications minutieuses s’imposent pour éviter les erreurs d’identification. Pour faciliter les requêtes, les informations associées à chaque personne sont accessibles au public dans le module « recherche de personne » du moteur de recherche.
3.4 – Renvois et/ou corrélats
42Chaque fiche bristol est traitée comme un document séparé, même si les fiches numérisées sont regroupées par série de trente ou quarante dans des fichiers SGML pour faciliter les manipulations informatiques. Chaque fiche, représentée par l’élément structurel <DIV0>, reçoit un numéro d’identification attribué automatiquement grâce à un petit programme PERL. Au cours du balisage, les fiches qui traitent d’un même sujet ou qui contiennent des renvois et des corrélats sont connectées par des liens hypertextes insérés manuellement avec la balise <XREF> </XREF>.
43Au fur et à mesure que l’édition du fichier chronologique progresse, des liens transversaux se tissent à l’intérieur du fichier pour mettre en valeur des sous-ensembles chronologiques ou thématiques.
Ex
Emmanuel Bibesco invite Proust à une promenade en automobile à Champlâtreux et dans la vallée de Chevreuse, en compagnie de la comtesse Thérèse Murat
à Emmanuel Bibesco, Cor XII, p. 118, n. 49 [Fin mars ou début avril 1913]
Cf. peu après le 27 mars 1913 [<XREF>c67980</XREF>]
Cf. vers le début d’avril 1913 [<XREF>c67990</XREF>] </DIV0>
44En revanche, le balisage du contenu est une tâche très minutieuse, impossible à automatiser. Si le codage des dates va relativement vite, une fois les conventions établies, l’identification des genres d’œuvres et surtout des personnes est sans conteste l’étape qui demande le plus de temps et de familiarité avec le sujet traité et les sources disponibles pour la période. C’est aussi celle qui accroît le plus la valeur du fichier chronologique et qui en étend l’utilité au-delà du seul domaine proustien.
45Le balisage des personnes citées décrit plus haut a donné lieu à la création « fortuite » d’un nouvel ensemble de données biographiques à partir d’un corpus existant. Ce fichier d’autorités qui, pour l’instant, constitue essentiellement l’index onomastique de la chronologie, englobera ultérieurement le fichier biographique de Philip Kolb, puisque les mêmes identifiants seront réutilisés pour son balisage.
46Nouvellement créé par l’extraction de ressources déjà présentes mais inaccessibles dans la version papier, il servira d’index biographique général pour toute la base de connaissances au fur et à mesure que celle-ci se développera. Un utilisateur pourra alors naviguer entre les différents documents pertinents pour sa recherche à partir d’une notice centrale.
Texte de la figure 1 après balisage et conversion en SGML
Texte de la figure 1 après balisage et conversion en SGML
4 – Edition dynamique du document Kolb-Proust
4.1 – Mise à jour et extension des fichiers
47Afin de conserver toute leur valeur aux fichiers de Philip Kolb, qui représentent l’état de ses connaissances au moment de son décès, il est nécessaire d’effectuer une mise à jour constante des notices en incorporant des données nouvelles au fur et à mesure de la numérisation des fiches ou de la publication de nouveaux travaux. Cela revient à maintenir les principes de recherche et de classement établis par Kolb, même si les supports et l’environnement de travail ont complètement changé. En plus du balisage décrit précédemment, les encodeurs ont la possibilité d’introduire des annotations signées pour approfondir certains éléments, fournir des informations supplémentaires ou rectifier des faits inexacts.
48Le travail d’identification des personnes nécessité par le balisage du contenu des fiches et décrit plus haut fournit déjà l’occasion de mettre au jour des informations que Kolb n’avait pas recherchées ou pas trouvées. Un effort est fait pour retrouver le nom complet et les dates de naissance, de décès, et de mariage dans des répertoires biographiques généraux imprimés ou en ligne, des biographies, des avis mondains ou des rubriques nécrologiques de journaux, et enfin, en dernier recours, auprès des bureaux d’état civil, quand un lieu et une date approximative sont déjà connus. Les résultats sont ajoutés à la base de données des noms ainsi que sur des fiches annexes dans le fichier biographique, en prévision de sa numérisation prochaine.
49Il est également prévu que les notices d’autorité qui n’auront pas trouvé leur équivalent dans le fichier biographique, une fois celui-ci édité, seront étoffées. Ce travail aura pour effet de contrebalancer le point de vue majoritairement proustien qui existe pour l’instant dans les fichiers. En effet, Kolb par économie de temps et d’espace, omettait des informations importantes pour la connaissance générale de la période, mais superflues pour la tâche déjà considérable qu’il s’était fixée.
50Aujourd’hui, la technologie employée permet de restituer ces omissions tout en conservant la séparation entre le travail de Philip Kolb et les additions plus récentes. Le support informatique de cet outil hypertexte en pleine croissance réduit considérablement le délai nécessaire à la diffusion de nouveaux savoirs. Des liens peuvent être insérés pour diriger l’utilisateur vers d’autres ressources, internes ou externes, sur le même sujet ou des sujets apparentés. Les utilisateurs ont aussi la possibilité de participer à l’élaboration de cet outil qui leur est destiné en signalant des publications, des manifestations, ou en proposant des nouvelles données, des commentaires et des interprétations variées, qui peuvent être incorporés en regard des notices concernées. Ce procédé n’est pas sans risque et demande un travail de vérification soigné. Néanmoins, ce nouveau mode d’édition dynamique est particulièrement intéressant pour des projets futurs envisagés par le centre Kolb-Proust.
4.2 – Addition de nouveaux corpus, collaboration à d’autres projets
51Si la première phase de numérisation se distingue quelque peu d’autres projets littéraires, la seconde bénéficiera sans aucun doute de leur expérience et des principes qui ne manqueront pas de s’en dégager. Il s’agit en effet de la numérisation du texte intégral de la correspondance de Marcel Proust [8]. Philip Kolb en a publié les vingt et un volumes de 1970 à 1993 [PRO 70]. Durant ces deux décennies, la découverte de nouvelles lettres et de nouvelles données l’ont amené à corriger les volumes déjà parus, à redater des lettres et à publier des lettres d’années antérieures en appendice des nouveaux volumes. Aujourd’hui, nombre de proustiens réclament une édition révisée et refondue pour intégrer ces nombreuses corrections et additions, mais il est peu probable que l’éditeur accepte de s’engager à nouveau dans un projet de cette envergure. Par contre, on peut parfaitement envisager une édition électronique qui, à partir du texte imprimé, incorporerait les lettres parues depuis 1993, toutes les modifications indiquées par Philip Kolb ainsi que celles suggérées par d’autres chercheurs. On peut imaginer qu’en cas de désaccord sur une date ou sur l’interprétation d’une allusion, la version électronique présenterait le texte disputé et les commentaires contradictoires, comme une glose moderne. Une telle édition aurait l’avantage d’être mise régulièrement à jour, offrirait des possibilités de manipulation des textes qui n’existent pas dans les éditions imprimées et serait présentée au sein d’une large collection où l’utilisateur trouverait à la fois son document primaire et les sources nécessaires à sa recherche. Par d’autres aspects, ce projet remet également en question la notion d’une édition dite définitive et la notion de pérennité de l’héritage écrit, sujets débattus depuis maintenant plusieurs années par diverses professions comme les chercheurs, les auteurs et les professionnels de l’information.
5 – Conclusion
52Philip Kolb s’était donné pour mission de restituer aussi exactement que possible le portrait de Proust tel que celui-ci apparaît à travers ses lettres. Le centre Kolb-Proust poursuit aujourd’hui cette mission et l’étend au travail de Philip Kolb, en restituant aussi exactement que possible le contenu des notes du chercheur. L’entreprise de préservation de ces deux écritures tente d’intégrer en un même ensemble documents primaires et appareil critique, avec la situation curieuse que la correspondance de Proust était pour Kolb le matériau primaire, tandis que les notes de Kolb deviennent le matériau primaire pour l’équipe Kolb-Proust, au même titre que la correspondance de Proust. Chaque couche d’écriture possède une fonction particulière : la correspondance de Marcel Proust est un outil de communication entre un homme et son environnement ; les travaux d’érudition de Philip Kolb permettent de reconstituer cette correspondance, de la replacer avec son auteur dans son contexte historique, littéraire et social et de la rendre compréhensible du public ; le travail de l’équipe Kolb-Proust enfin reprend les matériaux accumulés par Kolb dans les coulisses de son édition et les fait également passer du domaine privé au domaine public grâce à toutes les transformations décrites plus haut, et ce faisant, passe d’une écriture individuelle à une écriture collective effectuée par les différents acteurs du centre, sa bibliothécaire, ses assistants de recherche aussi bien que les utilisateurs du site qui contribuent volontiers en mettant à disposition ceux de leurs résultats qui peuvent présenter un intérêt pour le développement de la base de connaissances.
53Cette entreprise fonctionne comme une série de poupées russes où chaque poupée peut s’ouvrir pour laisser apparaître une poupée de dimension inférieure, jusqu’à la plus petite, qui garde malgré tout son apparence de poupée. Dans le cas du projet Kolb-Proust, le plus petit élément serait la lettre de Proust, ou si l’on veut distinguer entre l’écriture de Proust et les emprunts, la citation littéraire sertie dans le texte de la lettre. Elle fonctionne également comme une mosaïque au motif concentrique dans laquelle chaque cercle est composé par la juxtaposition de multiples petits éléments autonomes : une lettre au sein de la correspondance, un renseignement sur une fiche, ou une fiche dans l’ensemble documentaire. Le motif peut être amplifié par l’ajout d’éléments supplémentaires autour du dernier cercle, mais chaque élément ne prend sa signification complète que par sa position dans le motif général.
6. Bibliographie
- [DIO 00] d’Iorio P., HyperNietzsche. Modèle d’un hypertexte savant sur Internet pour la recherche en sciences humaines, Presses Universitaires de France, 2000.
- [EID 01] Eide O., « Putting the Dialog Back Together : Re-creating Structure in letter publishing », ACH/ALLC conference, New York City, 13-17 juin 2001.
- [GID 02] Gidding J., « HyperProust : The Recherche as Hypertext », Proust in Perspective : Visions and Revisions, The University of Illinois Press, Urbana, [à paraître en 2002].
- [KOL 49] Kolb P., La correspondance de Marcel Proust : Chronologie et commentaire critique, The University of Illinois Press, Urbana, 1949.
- [LAM 99] Lambilliotte J., « La Bibliothèque de Marcel Proust. De la lecture à l’écriture », Bulletin d’informations proustiennes n° 30, p. 81-89, 1999.
- [PRO 70] Proust M., Correspondance. Texte établi, présenté et annoté par Philip Kolb, [21 volumes], Plon, Paris, 1970-1993.
- [ROB 96] Robitaille M., « Etudes sur la correspondance de Marcel Proust : une synthèse », Bulletin Marcel Proust n° 46, p. 109-126, 1996.
- [VAN 99] Vanhoutte E., « Ruling the screen : compromising decisions and decisive compromises », Digital Resources for the Humanities Conference, London, 14 septembre 1999.
Mots-clés éditeurs : culture française, écriture hypertextuelle, Marcel Proust, métadonnées
Date de mise en ligne : 01/03/2001