Hagio-historiographie médiévale: Statistique lexicale assistée par ordinateur : Quelques réflexions d’un chercheur en hagiologie

Il nous a semblé pertinent, dans le cadre d’une réflexion plus large sur l’emprise du chiffre dans les sociétés développées, de nous interroger sur la manière dont la statistique lexicale assistée par ordinateur (SLAPO) pouvait contribuer à l’approfondissement de nos recherches sur la production hagiographique latine en Bretagne continentale au Moyen Âge et à l’exploitation de ce matériau dans une perspective historienne.

Si le terme stylométrie, à l’instar de ce qu’il recouvre, est assez largement méconnu du grand public[1], certaines de ses applications, notamment la reconnaissance ou l’attribution d’auteur (AA), connaissent un incontestable succès médiatique, en particulier dans les domaines des études littéraires et de l’enquête policière : s’agissant de ce dernier, on peut évoquer la réouverture récente en France de l’affaire Grégory sous l’égide des nouvelles technologies, notamment la stylométrie pour tenter de déterminer l’identité du (ou des) « corbeau(x) », dont les messages ont largement contribué à rendre plus délétère encore un climat déjà empoisonné par la sordidité des circonstances. Dans le domaine des études littéraires, on assiste à la floraison régulière de quelques beaux « marronniers » avec, par exemple, les discussions sur la paternité des œuvres de Shakespeare en Angleterre et de celles de Molière en France. On peut effectivement parler de « marronniers » car, bien avant les travaux de SLAPO, ces questions déchaînaient déjà les passions : depuis le milieu du XIX^e siècle s’agissant de Shakespeare et depuis plus d’un siècle s’agissant de Molière ; mais c’était moins les textes qui étaient alors à l’origine de ces interrogations que des considérations d’histoire littéraire entretenues, souvent sur fond de polémique, par des propos plus ou moins fondés, avant tout marqués au coin de la rhétorique. Etonnamment, cette approche n’a pas véritablement changé depuis l’introduction, à partir des années 1960, de la SLAPO : c’est que le traitement informatique d’un échantillon de données textuelles peut connaître de nombreux biais[2]. A la moindre occasion, on voit la polémique reprendre et le débat se faire plus âpre encore qu’il ne l’a jamais été : la « Réponse à Florian Cafiero and Jean-Baptiste Camps. Why Molière most likely did write his plays. Published in Science Advances. 5. 27 November 2019 », sous la plume de Dominique Labbé[3] témoigne que ces questions continuent de générer des « échanges » vifs, dont le moins qu’on puisse dire est qu’ils ne se font pas à fleuret moucheté [4]. Gageons en conséquence que d’autres types d’approches, résolument ascientifiques, continueront d’exister et, à vrai dire, leur légitimité n’apparaît pas moins fondée, à condition que leurs résultats soient clairement présentés pour ce qu’ils sont : tel est le cas du livre d’Eve de Castro, L’Autre Molière, sorti tout récemment, dont l’éditeur indique sans détours qu’il s’agit d’un « roman »^{^[5]}. Au reste, le potentiel heuristique de la littérature romanesque n’est pas négligeable du point de vue de l’historiographie, au risque (assumé) de voir celle-ci être subvertie par l’imagination ; mais au fait, l’historien peut-il lui-même prétendre à écrire autre chose qu’une manière de récit dont les ruptures correspondent au déficit des sources ? Dans le très bel ouvrage Imagination et histoire : enjeux contemporains^{^[6]}, qu’elles ont codirigé avec deux autres chercheurs, Pascale Mounier et Marie Panter soulignent, à propos d’Alain Le Ninèze, auteur d’un roman historique, très documenté, qui met en scène l’humaniste Guillaume Postel^{^[7]} , que le romancier

« fait ici plus que ce que s’autorisent les historiens dans le cas présent : il propose, par le discours légitimant du narrateur, une approche synthétique et cohérente de Guillaume Postel. Le romancier produit une trame d’intelligibilité sinon vraie, du moins vraisemblable, pour les actions et les écrits en apparence si disparates du personnage, en invitant le lecteur à participer par l’imaginaire et par l’émotion au comblement des blancs de l’histoire »^{^[8]}.

Si la SLAPO, précieux outil au service de la stylométrie, génère des interrogations légitimes sur son efficacité et induit des critiques à l’endroit de ses résultats, il n’est pas question cependant de remettre en cause son intérêt, du moins pour autant qu’elle soit utilisée à seule fin d’éprouver une hypothèse. En effet, sauf à s’abuser sur ses résultats, la SLAPO, à l’instar des autres statistiques, ne procure jamais autre chose que des tendances, des indications, et celles-ci doivent conséquemment faire l’objet d’une analyse approfondie par les chercheurs. Malheureusement, une telle approche se révèle de plus en plus rare :

« Les statistiques offrent le moyen de fonder une ‘’cohérence interne’’ suffisante parce que les comparaisons statistiques renvoient les unes aux autres selon une cohérence paramétrique, et non en vertu de l’unité ou de l’identité de l’objet qu’elles mesurent. Mais la cohérence interne s’apparente à un effet de persuasion.

(…)…

Les autorités scientifiques font confiance aux données statistiques. La scientificité de ces travaux n’est plus vérifiée, c’est la ‘’statisticité’’ qui l’est. Il y a une cohérence interne propre aux normes statistiques qui est indépendante des hypothèses à vérifier par les outils statistiques. On se contentera en règle générale de vérifier si les procédures statistiques prescrites ont été utilisées, mais peu de chercheurs songeront à interroger leur sens » [9].

Il également possible de pointer deux autres critiques qui sont faites aux résultats des travaux de SLAPO.

La première tient au talent de certains individus, en particulier dans le domaine des affaires criminelles, d’offusquer leur style en le déguisant, obligeant les utilisateurs de la SLAPO à concevoir de nouveaux programmes plus élaborés ; mais, – outre que les résultats de ces derniers se révèlent en général décevants, de l’aveu même de leurs promoteurs, – on doit envisager la possibilité, dans les rares cas de demi-réussite, que les auteurs concernés s’ingénient à inventer en retour de nouveaux travestissements, et ainsi de suite : à aucun moment, dans ces conditions, la validité des résultats ne peut être assurée.

La seconde critique, plus large et très largement supportée par la précédente, tient au fait que certains utilisateurs de la SLAPO ont démontré, comme nous venons de le rappeler à propos de l’affaire Molière, qu’il leur était possible d’invalider les résultats de travaux antérieurs, en ayant recours aux mêmes outils et aux mêmes techniques que ceux utilisés par leurs prédécesseurs. Il s’agit là d’une illustration du « paradoxe de Vauban », mis en évidence par Choderlos de Laclos [10] : Vauban ne fut jamais fort que des seuls « succès qu’il remporta contre lui-même », c’est-à-dire en reprenant à l’ennemi des places qu’il avait jadis fortifiées, réputées en conséquence imprenables, et qui cependant furent donc prises au moins deux fois [11].

Dès 1989 Alain Guerreau, constatant que « l'accès généralisé à l'informatique offre à présent la possibilité d'exécuter des manipulations de fichiers et des calculs qui, il y a quelques années encore, relevaient, comme on dit, de la pure théorie », expliquait aux historiens pourquoi et comment compter les mots[12] ; mais, au-delà de cette injonction lexicométrique généraliste, renouvelée depuis, plusieurs questions demeurent : faut-il compter tous les mots du texte ? Ou bien les seuls mots pleins, voire les mots rares qui témoignent de la richesse du vocabulaire de l’auteur ? Ou au contraire les mots-outils, en apparence si banals, mais qui marquent le style de l’écrivain à son insu ? Par ailleurs, le questionnaire destiné à exploiter les résultats du traitement de texte doit être établi en rapport non seulement avec les thématiques propres au chercheur, mais également avec la « nature » et l’« objet » du texte concerné, dont il convient en outre de reconnaître le « projet » qui le sous-tend, afin de mieux en extraire le contenu informationnel.

Il faut aussi prendre en compte la quantité de mots du texte, et, dans le cas d’une comparaison avec d’autres textes, la quantité de mots de chacun d’entre eux. Si plusieurs dizaines, plusieurs centaines même, de milliers de mots n’apparaissent plus guère comme un obstacle aux travaux de SLAPO, puisque les programmes informatiques mis en œuvre à cette occasion voient leurs limites sans cesse repoussées en termes d’ingestion de données textuelles, en revanche des analyses appliquées, dans le cadre d’AA, à des textes de 3000, voire 5000 mots, peuvent se révéler, aux dires des spécialistes, « nettement moins fiables »[13]. Tout le monde s’accorde à reconnaître que

« The question of minimal sample size is one of the most important issues in stylometry and non traditional authorship attribution. In the last decade or so, a few studies concerning different aspects of scalability in stylometry have been published (…), but the question has not been answered comprehensively »[14].

Pour résumer les résultats des travaux sur le sujet, si la taille minimum de l’échantillon se situe généralement autour du chiffre-pivot de 5000 mots, il apparait que

« The results of the experiments suggest that a sufficient amount of textual data may be as little as 2,000 words in many cases. However, sometimes the authorial fingerprint is so vague, that one needs to use substantially longer samples to make the attribution feasible. A question of some importance is to which category an unknown (disputed) text belongs » [15].

On s’attachera donc à disposer, pour l’analyse d’un échantillon, de données textuelles comprenant plus que moins de mots, afin que le repérage du style de son auteur s’en trouve facilité : où comment la SLAPO finit par retrouver la prudence et le bon sens. En outre, on veillera à ce que la manière dont cet échantillon est déterminé ne constitue pas l’expression d’une forme de subjectivité, ou, au contraire, d’une recherche vaine d’objectivité, qui, dans les deux cas, aurait surtout pour effet de nous priver d’une partie de sa matière, et ce, au détriment de sa « statisticité », pour reprendre le néologisme forgé par Emmanuel Delille et Marc Kirsch ; mais, comme l’ont indiqué ces derniers, si cette « statisticité », est essentielle pour permettre de tirer le maximum du traitement statistique du ou des textes concernés, elle ne saurait dispenser d’une vérification de la « scientificité » de l’ensemble du processus dans lequel elle s’intègre. D’ailleurs, au nombre des points à vérifier, figurera justement le respect des seuils de « statisticité » en dessous desquels on ne peut enclencher sans risque le traitement d’un échantillon de données textuelles.

Ce dernier point doit faire l’objet d’une vigilance particulière, s’agissant notamment du domaine de la criminalistique, afin d’éviter au maximum de potentielles dérives.

Le premier risque tient à la « marchandisation » de la SLAPO : celle-ci a fait son entrée en criminalistique par le biais du recours par la police et/ou la justice à des cabinets privés, dont les méthodes et les techniques, pour des raisons de protection de leur savoir-faire, ne font pas l’objet d’une évaluation scientifique indépendante ; or, bien naturellement, – et même fort légitimement d’un point de vue marketing et commercial, – ces cabinets ont vocation à se saisir d’affaires dans lesquelles les laboratoires publics, quant à eux, hésitent, voire refusent, de recourir à la SLAPO, attendu, par exemple, le seuil jugé trop bas de « statisticité » d’un échantillon de données textuelles à analyser, dans un contexte où il n’existe pas, comme nous l’avons dit, de véritable définition d’un tel seuil. C’est l’un des principaux arguments avancés, brutalement, mais efficacement, par le défenseur des parties mises en cause dans l’affaire Grégory, à la suite du rapport remis par le cabinet suisse OrphAnalytics sur l’identité du (ou des) « corbeau(x) ». En l’agrémentant de termes assez peu amènes (« foutaise, charlatanerie, fumisterie, approximations ») M^e Frédéric Brana a qualifié « totalement bidon » le rapport produit par OrphAnalytics :

« On compare les lettres du corbeau avec une pauvre carte postale d’une quinzaine de mots envoyée naguère par ma cliente. C’est encore pire que ce que je pensais »[16].

Même si la diatribe n’est pas exempte elle aussi d’approximations, une telle exécution médiatique pourrait bien jeter le discrédit sur l’ensemble de la démarche stylométrique, car les propos en question ont plus de chance d’être entendus et compris du grand public, surtout quand on les compare à la réponse pour le moins ambiguë d’OrphAnalytics[17] : celle-ci, apparemment destinée avant tout à se protéger d’un point de vue juridique[18], manque singulièrement de vigueur et surtout de relief[19]. Pourtant, sans déroger à leurs règles déontologiques[20], les experts de ce cabinet auraient pu expliquer, – sans avoir à dévoiler un seul aspect de leur rapport et sans évidemment donner les « clés » qui ferment la « boite noire » de leurs algorithmes, – comment il leur avait été possible pour eux de travailler sur un échantillon particulièrement limité : outre montrer à cette occasion leur savoir-faire, ils auraient ainsi contribué à enrichir le débat sur la possibilité d’identifier les auteurs de textes courts par le recours aux n-grammes de caractères[21]. D’autant que, dans le cadre d’une présentation de son entreprise, le 4 octobre 2021, le dirigeant d’OrphAnalytics a finalement indiqué :

« Par exemple, pour l'affaire Gregory en France, une affaire classée d'un enfant assassiné en 1984, nous avons pu déterminer qui écrit dans un style similaire à celui de la lettre affirmant que le crime a été commis. La transcription de cette lettre criminelle anonyme est composée de moins de 130 caractères »[22].

Déclaration qui, non content d’aller à l’encontre de la décision rapportée dans le communiqué d’avril 2021[23], s’apparente à une forme de teasing, probablement destinée à souligner l’efficacité des outils dont dispose l’entreprise : une fois de plus, rien à dire sur le plan marketing et commercial ; mais le biais que nous avons souligné demeure[24].

Le risque existe également que certains chercheurs, en fonction de considérations personnelles, – relative notamment à l’évolution souhaitée de leur carrière professionnelle, – se départissent de leur neutralité scientifique pour faire allégeance à tel spécialiste plutôt qu’à tel autre, comme il s’aperçoit à l’occasion de la publication d’articles récents, contribuant ainsi au « bruit de fond » en faveur de l’utilisation de la SLAPO dans le domaine de la criminalistique :

« In his article and critique of stylometry, Rudman (2012) argues that the setbacks and risks of computational AA may outweigh its benefits. Exploring the state-of-the-art of AA, Juola (2008) takes a more optimistic approach, suggesting that computational AA is possible, given that the examiner is competent and aware of all of its possible limitations. The findings of this study support the latter proposition. Statistical techniques and computational tools can be employed to support a forensic examiner in the search for stylistic links in an extensive collection of texts. There is still considerable scope for research concerning the use of lexicogrammar in computational AA »[25].

Cette approche vient tangenter certaines pratiques destinées à mettre en avant la SLAPO dans le domaine des études littéraires, en insistant sur l’aspect le plus spectaculaire de ses résultats : on peut supposer que les chercheurs concernés espèrent ainsi montrer, par le truchement des médias[26], l’utilité sociale de leurs travaux afin d’en justifier le financement.

En deçà de l’AA, c’est d’abord de « style » dont devrait s’occuper la stylométrie ; mais cette dimension stylistique, de même que ses implications quant au sens et à la compréhension du texte, continuent d’être largement abandonnées à la critique littéraire. En conséquence, les aspects de notre démarche qui sont empruntés à la SLAPO s’avèrent plus lexicométriques que stylométriques ; ils tendent en outre à s’inscrire dans une perspective textométrique autorisant « le passage des observations chiffrées à leur interprétation qualitative, orientée vers le dévoilement du sens du texte »[27]. Cette approche du matériau hagiographique privilégie les mots du texte, appréhendés dans leur contexte lexical. Pour cette raison, quand bien même il paraîtrait que, « since Kjell (1994), character n-grams have proven to be the best performing feature type in state-of-the-art authorship attribution »[28], il n’est pas question pour nous de procéder au découpage des mots en caractères et au regroupement de ces dernier en bi-grammes, tri-grammes, etc., à l’exception bien sûr des mots qui sont constitués de la sorte (ex. : « un », « le », « mot », « qui », « sûr », « sur », etc.) ; d’autant que, lors d’une recherche en paternité d’auteur[29], la différence entre les n-grammes de caractères et les n-grammes de mots ne semble pas toujours très significative, du moins avant qu’il ne soit procédé à un opportun « lissage algorithmique » des données recueillies[30]. Or, comme c’est souvent le cas avec le recours aux algorithmes, cette dernière opération ne fait l’objet d’aucune question, d’aucune interrogation, pas même, « lorsqu’il s’agit d’interpréter les analyses faites sur des données lissées », quant à la difficulté « de dissocier les corrélations dues au lissage des corrélations dues aux données initiales » [31].

Nous partons du postulat qu’un certain « niveau d’écriture » s’impose à tout auteur en fonction de ce qu’il écrit, de pourquoi et de pour qui il écrit : ces différents « niveaux » apparaissent, de notre point de vue, comme les lointains héritiers des trois genera que les auteurs antiques avaient empruntés à la rhétorique (genus humile, genus medium, genus sublime) et qui, par la suite, ont été inlassablement repris, détaillés, affinés[32] ; mais, quel que soit le « niveau d’écriture », le style demeure. Si donc l’on souhaite identifier un auteur, il faut, en bonne méthode, rechercher, distinguer et compter, d’une part les mots qui transcendent ces « niveaux », c’est-à-dire les mots qui constituent en quelque sorte la « trame » du texte et qui sont aussi les plus fréquents ; d’autre part, les mots qui en forment la « chaine » et qui composent le lexique approprié à son « niveau d’écriture ». L’opération consiste donc à

« … mesurer la fréquence et le volume des mots, qui sont dans un rapport exactement inverse : plus les mots sont courts (monosyllabiques), plus ils sont fréquents dans un texte, plus ils sont longs, plus ils sont rares. D’autre part, le produit rang x fréquence est constant ; cette loi, dite de Zipf, se vérifie aussi bien pour la littérature que pour n’importe quel texte descriptif, explicatif ou documentaire. Des relevés systématiques ont permis de comparer le lexique d’écrivains contemporains, et de préciser la richesse lexicale et la qualité stylistique de tel ou tel d’entre eux : écrivains « nominaux, adjectivaux, verbaux », etc. On peut également comparer le vocabulaire d’un même écrivain, d’une de ses œuvres à l’autre. Précieuse base pour les commentaires et explications de textes, qui évite de s’égarer dans l’appréciation totalement subjective »^{^[33]}.

La démarche cependant ne va pas de soi :

« Suivant une hypothèse forte – et largement contre-intuitive – la signature d’un texte réside non pas dans ses mots lexicaux, pleins, rares, par exemple ses hapax, mais dans ses mots outils, les déterminants (articles, possessifs, démonstratifs) et les pronoms, les coordonnants et les subordonnants. Les mots syntaxiques, par opposition aux mots sémantiques, seraient ceux qui permettraient le mieux d’attribuer un texte, c’est-à-dire d’identifier un auteur, un style individuel. Dans leur banalité, ces mots outils forment la trame insignifiante du texte, un réseau de chevilles auxquelles nous ne prêtons pas garde quand nous lisons pour le sens, mais que la machine compte. Suivant une autre image, le style individuel tient au liant, à l’empois linguistique, que la lecture linéaire traverse sans s’y arrêter quand elle procède en quête du singulier, de l’original, voire de l’unique »[34].

Nous désignons « mots de trame » et « mots de chaine » les deux catégories respectivement appelées « mots outils » et « mots pleins ». Il ne s’agit pas de chercher à tout prix une forme d’originalité : nous pensons qu’il peut y avoir un intérêt à utiliser nos expressions, en ce qu’elles se prêtent sans doute mieux à l’analyse de mots dont le statut, au « point de liage », peut se révéler à l’occasion plus ambigu, comme c’est par exemple le cas de nombreux adverbes ^{^[35]}.

Notre démarche, on l’a dit, concerne principalement la production hagiographique latine en Bretagne continentale au Moyen Âge : ce « type de littérature »^{^[36]}, ses différentes dimensions et facettes, la variété des différents « projets » dont ses auteurs étaient porteurs, les filtres qu’imposent à notre approche le cadre territorial et chronologique considéré, – sans parler des déperditions, abrègements, interpolations, réécritures dont les ouvrages concernés ont fait l’objet au cours des siècles, – sont peut-être de nature à rendre nos investigations plus difficilement compatibles avec les conditions habituelles d’utilisation de la SLAPO, où l’on observe que le matériau de base est majoritairement constitué de textes écrits en anglais et qui sont plus ou moins empreints de global culture contemporaine[37]. Par ailleurs, il est apparaît, à l’examen de la question de la paternité des œuvres de Molière que, – du fait de la distance avec le français du XVII^e siècle et avec les pratiques d’écriture théâtrale de l’époque, – les difficultés inhérentes à la détermination de l’échantillon de données textuelles à analyser, ainsi qu’à l’interprétation des résultats de ce traitement, réduisent souvent le débat à une assommante querelle de statistiques, nouvelle démonstration de l’emprise du chiffre qui caractérise nos sociétés^{^[38]}, bien éloignée en tout cas des réels enjeux d’histoire littéraire. Ce pourrait donc être a fortiori le cas s’agissant du matériau que nous examinons ; mais nous nous efforçons de nous préserver de ce risque en privilégiant, comme nous l’avons préconisé en d’autres circonstances,

« Une approche fondée sur une confrontation équilibrée entre les données quantitatives et les données qualitatives, approche dans laquelle ce sont avant tout l’intuition et l’érudition du chercheur qui doivent jouer le rôle d’arbitre » [39].

André-Yves Bourgès

***

Annexe : autour de l’adverbe

« Depuis deux ans, je refuse de répondre à des questions oiseuses. Du style : […] auquel de tes personnages t’identifies-tu ? Mon Dieu, mais à qui s’identifie un auteur ? Aux adverbes, bien sûr »

Umberto Eco^{^[40]}

La portée du propos de l’auteur du Nom de la rose (ici traduit par Myriem Bouzaher) nous semble aller plus loin que la simple boutade, en particulier quand on le rapporte à un autre des ouvrages d’Umberto Eco, Dire presque la même chose. Expériences de traductions^{^[41]}, où, comme le souligne avec finesse Lila Azam Zanganeh, l’adverbe presque « subrepticement glissé dans le titre » se révèle « pourtant si crucial »^{^[42]}.

Ces considérations sont d’autant plus importantes que l’adverbite s’apparente aujourd’hui à une véritable pandémie ; l’adverbe, – particulièrement, sinon principalement, celui en -ment, – est même qualifié par certains de pire mal qu’il en fut oncques^{^[43]}. C’est sur le Nouveau Continent (et donc à l’endroit des adverbes anglais en -ly) que les critiques se sont radicalisées, dans une sorte d’état d’esprit woke avant la lettre : « I believe the road to hell is paved with adverbs », écrit Stephen King, dans un credo puritain prolongeant l’opinion de Mark Twain, qui considérait que « Adverbs are the tool of the lazy writer ». Du moins, Twain et King peuvent-ils exciper d’un talent littéraire incontestable, même si leurs déclarations ressemblent furieusement aux avis figurant dans les publications du genre Comment écrire un best-seller qui fleurissent plus particulièrement outre Atlantique : produits par des officines spécialisées en marketing littéraire, ces traités sont remplis de conseils aux apprentis-écrivains où figurent quasi-invariablement les deux citations ci-dessus. Au nombre de ces moralisateurs du style, Charles Harrington Elster, « inventeur » du terme adverbiage par lequel il désigne « the over-use or awkward use of adverbs »^{^[44]} : déclaration qui ne manque pas de sel dans un ouvrage sous-titré Good advice on how not to write badly ! Certes, de nombreux auteurs ratés ont produit des textes qui se caractérisaient par un recours abusif à l’adverbe ; mais on oublie de signaler le nombre tout aussi élevé d’auteurs ratés dont les textes avaient pourtant été expurgés de presque tous les adverbes : le talent littéraire d’un auteur ou plutôt l’ascendant que son texte exerce sur son lecteur ne sont pas proportionnels à l’emploi de telle ou telle catégorie de mots.

Prenons l’exemple de deux écrivains œuvrant dans un genre longtemps considéré comme « mineur », à savoir le roman policier : Georges Simenon, le créateur de Maigret, et Frédéric Dard, celui de San Antonio (encore conviendrait-il plutôt, à propos de ce dernier, de parler de roman « patapolicier ») ; tous deux reconnus depuis grands auteurs, désormais étudiés et même célébrés au sein de l’Alma Mater. Si Simenon se montre avare d’effets, sinon de moyens, au point d’en faire sa marque de fabrique, Dard se révèle profusant, garrulitatif et le revendique avec éclat. Or, la question et le rôle de l’adverbe sont au cœur de cette opposition : dans une interview de 1955 en anglais, par la suite traduite et intégrée à son Art d’écrire, Simenon déclare mettre en pratique le conseil qu’il avait reçu à ses débuts de Colette et purge son texte des « Adjectives, adverbs, and every word which is there just to make an effect »^{^[45]} ; tandis que Dard ne laisse pas passer une occasion de rappeler son appétence pour l’adverbe ^{^[46]}, et, dans une moindre mesure, pour l’adjectif^{^[47]}, recourant aussi bien à la célébration directe^{^[48]} qu’au contre-éloge paradoxal^{^[49]}. Simenon écrit sec, Dard écrit gras et, sans qu’il soit nécessaire de procéder à une analyse stylométrique, il est assez facile de déterminer lequel est l’auteur de quoi, au-delà même des trouvailles lexicales qui caractérisent le récit san antoniesque.

Les auteurs de textes médiévaux en latin, pour des raisons qui tiennent tout autant à leur volonté d’efficacité qu’à leur recherche du (beau) style, ne semblent pas avoir partagé la prévention de leurs successeurs des époques moderne et contemporaine à l’endroit de ce qui est aujourd’hui devenu « la classe poubelle, celle où l'on relègue les invariables que l'on ne sait plus où caser » (se désole André Chervel^{^[50]}) : parmi les différentes catégories adverbiales auxquelles ils ont fait des emprunts importants et dont nous allons dire quelques mots, il y a notamment celle des « adverbes de liaison », qui renforcent la structure du récit en palliant une ponctuation inexistante ou défaillante, et celle des « adverbes qualifiants » en -ter qui, par leur allure classique, authentique ou néologique, contribuent à l’ornementation du discours.

1°) Le latin, sans ignorer la ponctuation, n’en fit qu’un usage modéré jusqu’à la fin du Moyen Âge, et encore, presque exclusivement sous la seule plume des copistes, parcimonieuse au reste, car les supports coûtaient cher. De plus, quand nous disposons de manuscrits autographes, on constate que les auteurs, sans doute pour les mêmes considérations matérielles, se montraient aussi économes que les « professionnels de la copie »^{^[51]}, comme c’est par exemple le cas avec Thomas d’Aquin étudié par le R.P. Maurice Hubert^{^[52]} :

« Il va très peu à la ligne. Il use rarement de la majuscule, qu'il n'emploie, ni pour les noms propres, ni pour les débuts de phrases. Il la réserve aux articulations que nous marquerions par des paragraphes, comme des sortes de lettrines réduites. Au-delà, au moins dans les plus anciens de ses autographes, il ne dispose que du point dont il est assez prodigue et qui équivaut donc à tous nos signes : virgule, point et virgule, deux points, point »^{^[53]}.

Pour obvier à cette pauvreté ponctuationnelle, qu’elle fût « blanche » ou « noire », les auteurs médiévaux étaient dès lors enclins à utiliser, outre les conjonctions, des « adverbes de liaison » : Hubert a dressé la liste de ceux qui figurent chez Thomas d’Aquin ^{^[54]}, en s’efforçant de les classer « selon nos catégories modernes de ponctuation tout en indiquant leur valeur sémantique avec une insistance sur les particularités susceptibles de dérouter les lecteurs habitués aux textes classiques ou aux manuels et dictionnaires introduisant à iceux »^{^[55]}; démarche qu’il conviendrait de systématiser lors des travaux d’édition de textes médiévaux^{^[56]}. En plus de donner de précieuses indications sur ces « mots de trame », on comprend aisément que la mesure de leur fréquence d’utilisation permettrait de différencier les auteurs concernés. Ainsi, par exemple,dans le cas de la vita et translatio Gildae [BHL 5341][57], le texte qui nous est parvenu comprend deux parties assez nettement distinctes l’une de l’autre, même si elles partagent la même « nature » hagiographique. La première partie consiste dans la vita du saint proprement dite, la seconde est une sorte d’hagio-chronique de l’abbaye de Rhuys[58] ; mais, au-delà de cette différence d’« objet » et de « projet », on peut noter l’emploi exclusif, dans la première partie du texte, des adverbes de liaison suivants : denique (« finalement »), etenim (« et en effet », « et de fait »), – une mention est constituée par un emprunt au De Excidio Britanniae, dont la lecture a peut-être en conséquence influencé l’hagiographe, – tamen (« cependant »), videlicet (« à savoir ») et, par-dessus tout, l’écrasante majorité des enim (« en effet »). A l’inverse, sans qu’il soit cette fois question d’exclusivité, il est intéressant de noter, dans la seconde partie, la surreprésentation des etiam (« aussi ») et des nam (« en effet »)[59].

2°) A l’instar de ce qui s’est passé s’agissant d’autres sources médiévales^{^[60]}, on constate dans la production hagiographique bretonne que les écrivains, au cours du temps, ont eu tendance à employer de plus en plus d’adverbes en -ter ; au début du XII^e siècle, qui semble marquer l’acmé du phénomène, on constate, sous sous la plume de l’hagiographe de Ronan et Corentin, par exemple, que cet emploi constitue un véritable marqueur de style^{^[61]}: peut-être même un « truc d’auteur » auquel aura recours, un siècle plus tard, Guillaume le Breton en édifiant son œuvre hagiographique^{^[62]}. Les « adverbes qualifiants » en -ter relevaient-ils durant l’Antiquité du genus sublime ? Ce qui expliquerait l’engouement d’auteurs qui, en dépit de leurs protestations de modestie, ne renoncent jamais à leurs ambitions littéraires : ainsi, l’auteur anonyme de la vita longior de Malo, vers, qui « se pique d’écrire elegantius (chap. 20) … (…) multiplie les adverbes en -ter : 78 occurrences au lieu de 31 dans la brevior »^{^[63]}.

« Truc d’auteur » ou simple tic littéraire ? Les perspectives ouvertes par la seule approche d’une seule sous-catégorie d’« adverbes qualifiants » se révèlent insoupçonnées comme on peut le voir, par exemple, avec « l’adverbe amusant unanimiter »^{^[64]} : commun, nous venons de le dire, à la vita de Ronan et au recueil des miracula de Corentin, il est déjà présent chez Wrdisten, l’hagiographe de Guénolé, et chez Bili, l’hagiographe de Malo (vers 860-870) ; également employé dans les vitae de Tugdual (version moyenne), Lunaire et Patern (XI^e siècle), on le retrouve sous la plume de deux des trois auteurs de l’ouvrage composite consacré à Hervé^{^[65]}, à savoir A (XI^e-XII^e siècles) et C (XIII^e-XIV^e siècles) ; et s’il n’est pas utilisé par l’écrivain que nous avons désigné B (XII^e-XIII^e siècle) et que nous avons rapproché de l’hagiographe de Goulven ^{^[66]}, il figure dans la vita de ce dernier, ce qui vient renforcer notre hypothèse d’une identité d’auteur^{^[67]} .

Unanimiter avait été forgé/utilisé par les auteurs chrétiens d’Afrique (de Tertullien à Arnobe, en passant bien sûr par Augustin d’Hippone) : faut-il le ranger en conséquence parmi les marqueurs d’une supposée langue latino-africaine ? Aujourd’hui, on considère que l’africitas n’a existé qu’en « surface », qu’elle n’a rien à voir avec « cette fantomatique africitas stylistique que les philologues se sont longtemps évertués à débusquer chez ceux qu’on appelait autrefois les ‘’lettrés de l’Atlas’’ »^{^[68]}. L’emploi d’unanimiter chez les auteurs latino-celtiques, avec un glissement de sens précoce dont témoigne l’Historia Britonum^{^[69]}, nous encouragerait plutôt, sous réserve de vérifications plus poussées, à le considérer, selon les principes de l’école tautologique^{^[70]}, comme un exemple de britonicitas bretonne. Encore faut-il évidemment que cette britonicitas ne s’avère pas elle aussi une sorte de fantasme philologique…

AYB

[1] Nous ne partageons pas l’enthousiasme de Florian Cafiero, twittant le 17 décembre 2020 à propos de la stylométrie (https://twitter.com/F_Cafiero/status/1339479811815854080, consulté le 8 janvier 2022) : « 12) la méthode serait "méconnue" ! Après l'encre qu'ont fait couler, dans les mêmes médias, l'article de Petr Plechac sur #Shakespeare et sa co-écriture d'Henri VIII, ou notre papier avec @Jbcamps sur Molière, il est étonnant d'avancer un pareil argument ». Cafiero fait notamment référence à l’article qu’il a cosigné avec un autre spécialiste, Jean-Baptiste Camps (https://www.chartes.psl.eu/fr/actualite/jean-baptiste-camps-florian-cafiero-confirment-paternite-oeuvres-moliere, consulté le 8 janvier 2022). De notre point de vue, c’est confondre la popularité de la méthode avec l’impact de ses résultats dans les médias.

[2] Dans un autre domaine où le traitement informatique des données règne désormais en maître, on a pu observer, depuis les débuts de la crise liée au COVID-19, une incroyable multiplication de biais, dont témoignent certains arguments échangés à l’emporte-pièce sur des plateaux de télévision ou sur les réseaux sociaux, par des scientifiques de renom, au mépris de toute déontologie. Nous laisserons de côté le scandale du « bidonnage » de certains Big data, dont l’affaire du « LancetGate » est emblématique : voir à ce propos le commentaire du Comité d’éthique du CNRS dans son « Avis » intitulé « Communication scientifique en situation de crise sanitaire : profusion, richesse et dérives » (25 juin 2021), p. 10-11, https://comite-ethique.cnrs.fr/avis-2021-42 (consulté le 8 janvier 2022).

[3] https://hal.archives-ouvertes.fr/halshs-02383640 (consulté le 8 janvier 2022).

[4] Ainsi Labbé, en préambule de sa « Réponse… », critique-t-il avec vigueur le média choisi par Cafiero et Camps pour publier leur étude : ce travail en effet « est paru dans un magazine généraliste en ‘’open access’’ (accès libre) qui n’est pas reconnu dans les milieux scientifiques. Quoi qu’en dise la direction de ce magazine, les articles ne sont pas révisés par des pairs spécialisés dans le domaine. Ce serait d’ailleurs impossible puisque ce magazine publie de tout sur n’importe quel sujet. Les auteurs paient cher pour être publiés (4500 $), procédé condamné par les scientifiques. Autrement dit, ce faux journal scientifique est un prédateur qui vit de la crédulité d’universitaires en mal de publications, notamment dans le tiers monde. Aucun chercheur chevronné ne soumet à ce genre de revue et, dans la communauté scientifique, personne ne perd son temps à lire les articles qui y paraissent. Cependant, le CNRS, l’École des Chartes, l’Université de Paris, l’AFP… et même l’Université de Neuchâtel ont annoncé cette publication par des communiqués triomphalistes. La grande presse, les médias s’en sont fait largement écho. Certains ont fait passer ce ‘’junk journal’’ pour une ‘’revue prestigieuse’’. Il a donc fallu lire… »

[5] Eve de Castro, L’Autre Molière, Paris, 2022, https://editions-iconoclaste.fr/livres/lautre-moliere (consulté le 8 janvier 2022). Voir également l’interview de l’auteur dans La Vie, n°3984 (jeudi 6 janvier 2022), https://www.lavie.fr/ma-vie/culture/corneille-et-moliere-mapparaissent-comme-les-deux-faces-dune-meme-medaille-79928.php (consulté le 8 janvier 2022).

[6] Marie Panter, Pascale Mounier, Monica Martinat et Matthieu Devigne (dir.), Imagination et histoire : enjeux contemporains, Rennes, 2014.

[7] Alain Le Ninèze, Agla. Le Premier Évangile, Paris, 2012. A titre anecdotique, nous avons fait remarquer naguère que la curiosité de Guillaume Postel s’était étendue au sanctuaire marial du Folgoët, que l’humaniste situait pour sa part en Cornouaille, ce qui n’est pas tout à fait un détail pour les études hagiologiques bretonnes : voir André-Yves Bourgès, « Un témoignage sur l'existence en Cornouaille au XVI^e siècle d'une tradition locale relative à Salaün et au miracle du Folgoët », Hagio-historiographie médiévale (mai 2009), https://www.academia.edu/6660339.

[8] Imagination et histoire : enjeux contemporains, p. 110.

[9] Emmanuel Delille et Marc Kirsch, « Natural or interactive kinds ? Les maladies mentales transitoires dans les cours de Ian Hacking au collège de France (2000-2006) », Revue de synthèse, vol. 137 (2016), n°1-2, p. 110-111. On notera que l’approche épidémiologique du Covid-19, particulièrement en France, correspond au schéma décrit dans cette étude : « La mesure statistique peut modifier un type de maladie en la rendant plus visible ou plus inquiétante auprès de l’opinion publique » (Ibidem, p. 109).

[10] Pierre-Ambroise Choderlos de Laclos, Lettre à MM. de l'Académie françoise, sur l'éloge de M. le maréchal de Vauban, proposé pour sujet du prix d'éloquence de l'année 1787, Amsterdam-Paris-La Rochelle, 1786, p. 32 : « Enfin, Messieurs, ne perdez pas de vue que M. de Vauban a triomphé de ses propres fortifications, aussi facilement que de toutes les autres ».

[11] Ibidem, p. 21-22 : « Tout le monde sait qu'il avoit fortifié la Ville d'Ath avec le plus grand soin ; qu'il se trouva depuis dans le cas de faire le siège de cette place ; et qu'elle ne pût tenir que treize jours de tranchée ouverte. Ce succès, qu'il remporta contre lui-même en 1697, il dût le prévoir dès l'année 1673, époque de l'invention de ses parallèles à Mastricht : car le ricochet dont il fit usage pour la première fois, à ce siège d'Ath, a rendu son attaque plus prompte et plus facile, sans la rendre plus sûre. Cependant M. de Vauban n'a cessé de construire des fortifications, et toujours sur les mêmes principes, jusqu'à sa mort arrivée en 1707 ».

[12] Alain Guerreau, « Pourquoi (et comment) l'historien doit-il compter les mots ? » Histoire & Mesure, vol. 4 (1989) n°1-2, p. 81-105.

[13] Propos de J.-B. Camps rapportés par France Info (12 janvier 2021) https://www.francetvinfo.fr/faits-divers/affaire-du-petit-gregory/36-ans-apres-la-mort-du-petit-gregory-la-stylometrie-peut-elle-permettre-didentifier-le-corbeau_4252033.html (consulté le 8 janvier 2022).

[14] Maciej Eder, « Short samples in authorship attribution: a new approach », Digital Humanities 2017, Montreal, Canada, August 8-11, 2017 (abstracts) : « La question de la taille minimale de l’échantillon est l’une des questions les plus importantes de la stylométrie et de l’attribution d’auteur. Au cours de la dernière décennie ou environ, quelques études concernant différents aspects de l’échelonnabilité en stylométrie ont été publiées (…), mais la question n’a pas reçu de réponse complète » (notre traduction). L’absence de définition véritable de la taille minimum de l’échantillon, au prétexte de son « échelonnabilité » (scability), plus ou moins manifeste selon les expérimentations, apparaît de notre point de vue comme un biais potentiel, d’autant qu’elle suscite des affirmations non vérifiées, comme celles rapportées par les médias généralistes.

[15] Ibidem : « Les résultats des expérimentations suggèrent que, dans de nombreux cas, 2000 mots seulement peuvent constituer une quantité suffisante de données textuelles. Cependant, l’empreinte digitale de l’auteur est parfois si vague, qu’il faut utiliser des échantillons beaucoup plus longs pour rendre leur attribution possible. Une question d’importance est la suivante : à quelle catégorie appartient un texte inconnu (débattu) ? » (notre traduction).

[16]Christian Rappaz, « Affaire Grégory : ‘’On cherche à nous éliminer’’ », L’Illustré (20 mai 2021), https://www.illustre.ch/magazine/affaire-gregory-on-cherche-a-nous-eliminer (consulté le 8 janvier 2022).

[17] Communiqué de OrphAnalytics SA concernant l'affaire Grégory (24 avril 2021), https://www.orphanalytics.com/fr/news/statement-2021-04 (consulté le 8 janvier 2022).

[18] Ibidem : « Nous ne voulons en aucun cas être associés à une prise de risque similaire à celle qui a été fatale pour un mis-en-cause dans cette affaire ».

[19] F. Cafiero a twitté les principaux éléments d’une explication rapide destinée au grand public (https://twitter.com/F_Cafiero/status/1385577448100741123, consulté le 8 janvier 2022) Sa conclusion reste prudente et équilibrée : « 13) Tout cela suffira-t-il à obtenir des expertises fiables sur tous les textes ? Sans lecture détaillée du dossier, difficile à dire. Et encore une fois, de pareilles affaires doivent être traitées avec la plus plus (sic) grande prudence. 14) Mais la traiter comme un objet risible, comme une "charlatanerie"... Disons que c'est un brin audacieux (euphémisme, quand tu nous tiens ! ».

[20] Communiqué de OrphAnalytics SA (24 avril 2021) : « Nos expertises, leurs résultats et leurs conclusions, sont réservées à nos mandants ».

[21] F. Cafiero : « Pour permettre l'analyse de textes courts, l'expertise a dû chercher (cf. leur étude QANon) à récupérer le maximum d'information contenue dans chacun des textes, en considérant le texte comme une série de séquences de caractères – une méthode éprouvée depuis les années 70 ».

[22] Présentation de Claude-Alain Roten, PDG d'OrphAnalytics, le 4 octobre 2021, à Tech4Trust, le programme suisse d'accélération de startups dans le domaine de la cybersécurité, https://www.orphanalytics.com/fr/news/pitch2021-10-4 (consulté le 8 janvier 2022).

[23] Communiqué de OrphAnalytics SA (24 avril 2021) : « Nous ne commenterons pas d’avantage cette expertise ».

[24] Voir supra n. 14.

[25] Alesia Locker, « “Because the computer said so!” Can computational authorship analysis be trusted ? », Journal of Language Works, 4 (2019), n°1, p. 34 : « Dans son article et critique de la stylométrie, Rudman (2012) soutient que les échecs et les risques de l’AA computationnelle peuvent l’emporter sur ses avantages. Explorant l’état de l’art de l’AA, Juola (2008) adopte une approche plus optimiste, suggérant que l’AA computationnelle est possible pour autant que l’examinateur est compétent et conscient de toutes ses limites. Les résultats de la présente étude viennent au soutien de cette dernière proposition. Des techniques statistiques et des outils informatiques peuvent être utilisés pour aider un légiste à rechercher des liens stylistiques dans une vaste collection de textes. Les possibilités de recherche concernant l’utilisation de lexicogrammaire dans l’AA computationnelle sont encore considérables » (notre traduction). Ce passage évoque d’une part les positions de Joseph Rudman, Carnegie Mellon University de Pittsburgh (Pennsylvanie), d’autre part celles de Patrick Juloa, fondateur et CEO du cabinet Juloa & Associates (« more than 30 years of combined experience in the field of stylometry and forensic linguistics »), auxquelles, comme on le voit, se rallie l’autrice de l’article.

[26] Voir supra n. 1.

[27] Véronique Magri-Mourgues, « Analyse textométrique et interprétation littéraire – Hyperbase, Rousseau et les Lumières », Travaux neuchâtelois de linguistique, vol. 55 (2011), p. 78.

[28] Mike Kestemont, « Function Words in Authorship Attribution. From Black Magic to Theory ? », Anna Feldman, Anna Kazantseva, Stan Szpakowicz (éd.), Proceedings of the 3rd Workshop on Computational Linguistics for Literature, Gothenburg, 2014, p. 62 : « depuis Kjell (1994), les n-grammes de caractères se sont avérés être le type de fonctionnalité le plus performant pour une attribution d’auteur à la pointe » (notre traduction). Le travail cité en référence est celui de Bradley Kjell, W. Addison Woods et Ophir Frieder « Discrimination of authorship using Visualization », Information Processing & Management, vol. 30 (1994), n°1, p. 141-150.

[29] Michèle Jardino, « Identification des auteurs de textes courts avec des n-grammes de caractères », JADT 2006 : 8es Journées internationales d’Analyse statistique des Données Textuelles, Besançon, 19-21 avril 2006, Besançon, 2006, p. 543-549.

[30] Ibidem, p. 545-547.

[31] Franck Varenne, Théories et modèles en sciences humaines. Le cas de la géographie, Paris, 2017, p. L’auteur fait ici expressément référence aux critiques émises par Peter Haggett, Andrew D. Cliff et Allan Frey, Locational analysis in human geography, London, 1977 : aussi éloigné de notre propos soit le domaine qui fait l’objet de ces critiques, la formulation employée nous semble de nature à faire réfléchir sur l’utilisation d’outils dont la transparence n’est pas la qualité première.

[32] On voit ainsi le genus humile décliné en tenue, subtile, summissum, gracile, le genus medium en modicum, mediocre, moderatum, floridum, le genus sublime en grande, robustum, vehemens, amplum, validum, grandiloquum, altum, supremum.

[33] Jean-Paul Colin, Des mots… à l’œuvre, Limoges, 2009, p. 80.

[34] Antoine Compagnon, « La forme littéraire », La lettre du Collège de France, 33 (2012), 14, en ligne http://journals.openedition.org/lettre-cdf/2511 (consulté le 8 janvier 2022).

[35] Voir en annexe.

[36] La formule figure sous la plume de nombreux spécialistes parmi lesquels André Vauchez, « Saints admirables et saints imitables : les fonctions de l'hagiographie ont-elles changé aux derniers siècles du Moyen Âge? », Les fonctions des saints dans le monde occidental (III^e-XIII^e siècle) Actes du colloque de Rome (27-29 octobre 1988), Rome, 1991 (Publications de l'École française de Rome, 149), p. 167 ; Francesco Scorza Barcellona, « Les études hagiographiques au 20^e siècle: bilan et perspectives », Revue d'histoire ecclésiastique, t. 95 (2000), n°3, p. 19 ; François Dolbeau « Un domaine négligé de la littérature médiolatine : les textes hagiographiques en vers », Cahiers de civilisation médiévale, 45^e année, n°178, avril-juin 2002), p. 132 ; Eric Limouzin, Le monde byzantin (du milieu du VIIIe siècle à 1204), économie et société, 2007, p. 27-28.

[37] Sur ce concept, voir Tanner Mirrlees, « 7. Global Culture », Michael Filimowicz, Veronika Tzankova (éd.), Reimagining Communication: Meaning, New-York, 2020, p. 117-133, https://www.researchgate.net/publication/341887384 (consulté le 8 janvier 2022).

[38] Alphonse de Lamartine, dans la seconde préface de ses Méditations poétiques, décrit déjà le chiffre comme un « merveilleux instrument passif de tyrannie qui ne demande jamais à quoi on l’emploie, qui n’examine nullement si on le fait servir à l’oppression du genre humain ou à sa délivrance, au meurtre de l’esprit ou à son émancipation »

[39] A.-Y. Bourgès, « Épidémies, pandémies et endémies en Bretagne au Moyen Âge : des sources hagiographiques très discrètes », Mémoires de la Société d’histoire et d’archéologie de Bretagne, t. 99 (2020), p. 34.

[40] Umberto Eco, Postille a “Il nome della rosa”, Milano 1984, p. 41 : « Da due anni evito di rispondere a questioni oziose. Del tipo: […] con quale dei tuoi personaggi ti identifichi? Dio mio, ma con chi si identifica un autore? Con gli avverbi, è ovvio ».

[41] Idem, Dire quasi la stessa cosa. Esperienze di traduzione, Milano, 2003.

[42] Lila Azam Zanganeh « Dire presque la même chose : traduire sans trahir », Le Monde (13 septembre 2007), https://www.lemonde.fr/livres/article/2007/09/13/dire-presque-la-meme-chose-traduire-sans-trahir_954546_3260.html (consulté le 8 janvier 2022).

[43] Jean-Joseph Julaud, Le français correct pour les Nuls, 2011, p. 151 : « Certains auteurs ou lecteurs développent une allergie chronique aux adverbes. Si on s'autorise un néologisme, on peut nommer cette allergie l'adverbite. En voici les symptômes : dès qu'il lit une page de roman ou d'essai, l'auteur ou le lecteur atteint d'adverbite se met à compter les adverbes en ...ment. Son ire naît en général à partir du deuxième. S'il en rencontre plus de cinq, il frise l'attaque d'apoplexie. L'auteur fait disparaître de sa page, sans regrets, tous les adverbes en ...ment ; le lecteur déclare plus nul que nul celui qui les y a laissés. L'origine de l'adverbite est inconnue. Son traitement se révèle difficile. Des séances de psychologie de groupe où ne seraient utilisés que des adverbes en ...ment peuvent être imaginées. Ou bien il faut remonter à la petite enfance. Un bon psychanalyste y découvrira l'origine de cette phobie. Probablement ».

[44] Charles Harrington Elster, The Accidents of Style, New York, 2010, p. 33.

[45]https://www.theparisreview.org/interviews/5020/the-art-of-fiction-no-9-georges-simenon (consulté le 8 janvier 2022).

[46] Par exemple : « Le serveur nous apporte des cinzano plus jauno que bianco. Elle cueille son verre délicatement (ah, que l’adverbe est donc la prise de conscience de la langue !) et le porte à ses lèvres avec une grâce infinie » (Remets ton slip, gondolier, 1976) ; « Pour moi, seules les propositions sont pleinement, authentiquement coordonnées, conjonction ou adverbe, surtout adverbe, ma raffolance » (La pute enchantée, 1981).

[47] « Minute ! Bouscule pas le mataf ! Laisse-moi accumuler mes adjectifs qualificatifs, mes épithètes, adverbes, le chenil complet » (T'assieds pas sur le compte-gouttes, 1996).

[48] « Je ne peux participer à une émission littéraire sans entendre baver sur l’adverbe. Hier encore, un docte disait, parlant d’un livre, qu’il était écrit dans une langue très pure : sans adverbes ! Tu connais la définition du mot ? ‘’Adverbe : mot invariable qui modifie le sens d’un verbe, d’un adjectif ou d’un autre adverbe.’’ Pourtant, l’adverbe c’est la poésie de la phrase. Je suis éperdument adverbiste car, pour moi, une littérature sans adverbe, est une cuisine sans sauce ou une femme sans poils ! » (Y en avait dans les pâtes, 1992).

[49] « L’expression se disperse. Elle perd de sa précision ou de son émotion. Va falloir revenir à la danse, à Charlot, au geste quoi ! Ou alors, côté écriture, à la phrase super-brève, de deux mots au plus. Faut qu’on s’y colle sans tarder, c’est l’avenir de la littérature, croyez-moi z’en ! (…) Allons, les jeunes, au boulot ! On attend, quoi, merde ! On en a classe de piétiner dans l’adverbe jusqu’aux chevilles ! Mort aux attributs ! Suce aux adjectifs ! Un jour ne restera que le nom, cet os de la langue » (T’es beau, tu sais !, 1972).

[50] André Chervel, ... et il fallut apprendre à écrire à tous les petits Français. Histoire de la grammaire scolaire, Paris, 1977, p. 251.

[51] La formule qui désigne le monde des copistes est empruntée à René Antoine Gauthier (éd.), Sancti Thomae de Aquino Opera Omnia, t. 1*, 1 : Expositio libri Peryermenias. Editio altera retractata, Roma-Paris, 1989, p. 19.

[52] Maurice Hubert, « Notes de lexicologie thomiste. V. Présentation, ponctuation et mots-outils », Archivum Latinitatis Medii Aevi (ALMA), t. 36 (1969), p. 59-108.

[53] M. Hubert, « Notes de lexicologie thomiste… », p. 87.

[54] Idem, « Eléments provisoires de linguistique thomiste. Mots outils et ponctuation dans les écrits de saint Thomas », ALMA, t. 43 (1981-1982), p. 57-63.

[55] Ibidem, p. 57.

[56] Cette démarche est reprise dans notre étude (en cours) intitulée Portrait du chroniqueur-poète en hagiographe : L’œuvre inconnue de Guillaume le Breton, où sont examinés les dossiers littéraires de plusieurs saints de Bretagne, notamment ceux de Goëznou, Mélar et Ténénan, édités par nos soins, mais également ceux d’Armel, Goulven et Hervé, ainsi que la vita de Maurice de Carnoët.

[57] L’édition de référence demeure celle donnée par Ferdinand Lot, Mélanges d’histoire bretonne (VI^e-XI^e siècle), Paris, 1907, p. 433-473. Lot est à l’origine de la désignation Gildae vita et translatio (Ibidem, p. 433, note a de l’apparat critique : « Ce titre est de nous ») ; mais si la première partie de l’ouvrage mérite effectivement d’être appelée vita, car l’histoire de Gildas y est rapportée tout au long, l’intitulé de la seconde partie (translatio) nous semble d’autant plus trompeur que le récit de la translation des reliques du saint et de leur redécouverte occupe seulement la fin du chapitre XXXII, ainsi que les quelques lignes ad hoc qui forment le chapitre XXXIII. Au reste, ce dernier présente tous les caractères d’une interpolation, ou du moins d’un remaniement, de l’avis même de Lot (Ibid., p. 461, n. 4), qui fournit à cette occasion de nombreux éléments permettant de supposer l’existence d’un récit de translation distinct, véritable « mode d’emploi » des reliques conservées à l’abbaye Saint-Sauveur-et-Saint-Gildas de Déols (ibid., p. 224-229) ; mais si un tel ouvrage a jamais existé, il a disparu, à l’instar du monastère pour lequel il aurait été écrit.

[58] Nous avons forgé le terme hagio-chronique pour désigner ce texte, parce que son auteur a surtout mis en avant le relèvement de l’abbaye de Rhuys par Félix, ainsi que les événements relatifs à la vie du monastère, qui témoignent de la présence sur place, dans la première moitié du XI^e siècle, d’une véritable « fabrique de saints ». Cette dimension de chronique a frappé Guy Devailly, « Tentatives de réforme de l’abbaye Saint-Gildas-de-Rhuys (XI^e-XII^e siècles) », Mémoires de la Société d’histoire et d’archéologie de Bretagne, t. (1986), p. 130, qui souligne son intérêt pour les historiens ; en revanche, le Chronicon Ruyense publié par Dom Morice lui paraît usurper son titre : « malgré son intitulé, il s’agit en fait de simples annales et non d’une véritable chronique » (Ibidem, p. 129).

[59] Ces aspects lexicométriques de l’emploi de l’adverbe dans le texte concerné seront examinés de manière plus approfondie à l’occasion d’un prochain travail intitulé « La vita et translatio Gildae [BHL 3541] : Éléments de critique du texte ».

[60] Monique Goullet, Les drames de Hrosvita de Gandersheim. Edition critique avec introduction, traduction et notes (thèse de doctorat, Université de Metz, 1993), listant « les mots latins formés par dérivation », souligne à propos des adverbes (p. 154) : « Les faits les plus remarquables sont I'accroissement du nombre des adverbes en -ter formés notamment à partir des adjectifs en -lis ou -biIis (ex. honorabiliter, irremediabiliter, indesinenter, fiducialiter) ».

[61] René Largillière, « Saint Corentin et ses Vies latines. A propos d’une publication récente », Bulletin de la Société archéologique du Finistère, t. 52 (1925), p. 107 : « (…) l'adverbe amusant unanimiter (cf. Chor., § XV, p. 50), qui fait partie de la série des adverbes en -ter de la vita Chorentini (cognoscibiliter, compassibiliter, lugubriter, lacrimabiliter, incunctanter, immisericorditer, etc.) ».

[62] Voir supra n. 56.

[63] Joseph Claude Poulin, L’hagiographie bretonne du Haut Moyen Âge. Répertoire raisonné, Ostfildern, 2009, p. 182 : « L’Anonyme long multiplie les adverbes en -ter : 78 occurrences au lieu de 31 dans la brevior ».

[64] Voir supra n. 62.

[65] A.-Y. Bourgès, « Le bestiaire hagiographique de saint Hervé », Britannia monastica, 7 (2003), p. 75-97.

[66] Ibidem, p. 85.

[67] Ce rapide relevé ne prétend pas à l’exhaustivité.

[68] Serge Lancel, « Entre africanité et romanité », Pierre-Yves Fux, Jean-Michel Roessli et Otto Wermelinger (éd.), Saint Augustin : africanité et universalité. Actes du colloque international Alger-Annaba, 1-7 avril 2001, Fribourg, 2003, p. 55.

[69] David N. Dumville, The textual history of the Welsh-Latin Historia Brittonum (thèse de doctorat, University of Edinburgh, 1975), p. 401 : Scotti autem de occidente et Picti de aquilone unanimiter pugnabant contra Bryttones et uno actu indesinenter quia sine armis Bryttones commorabantur ; p. 405 : Propterea iussit feeri inter Bryttones et Pictos et Scottos (quod Scotti ab occidente et Picti ab aquilone unanimiter pugnabant contra Bryttones) ; p. 634 : Scite autem, qui sunt in occidente, et Picti de aquilone, pugnabant unanimiter et uno impetu contra Britones indesinenter.

[70] Ces principes ont fait l’objet d’une présentation concise par U. Eco, « Il Pensiero di Brachamutanda », Il secondo diario minimo (texte tradapté en français sous le titre « La pensée de Benar el-Falouz », Comment voyager avec un saumon) : Swami Brachamutanda, alias Benar el-Falouz (Bora Bora 1818-Baden Baden 1919) fut en effet le fondateur de l’école tautologique.

Hagio-historiographie médiévale

12 janvier 2022

Statistique lexicale assistée par ordinateur : Quelques réflexions d’un chercheur en hagiologie

Aucun commentaire:

Printfriendly