Garfielddgate et anonymisation des données
Quiconque a consulté la blogosphère française depuis une semaine n’a pas pu rater le Garfielddgate, c’est-à-dire la révocation d’un proviseur de lycée ayant mal anonymisé son blog [archive] où il parlait de son travail mais également de sexualité. Aux dernières nouvelles, le proviseur a émis un ultime recours auprès du ministère de l’Éducation nationale.
Cette affaire en rappelle d’autres. Elle fait écho au sort de plusieurs bloggueurs en entreprise ayant perdu leur emploi suite à la découverte de leur blog par leurs collègues et/ou leur direction. À plusieurs égards, elle rappelle aussi l’universitaire et bloggueur américain Daniel Drezner, qui contre toute attente n’avait pas obtenu sa tenure à l’université de Chicago [cf. sa note et celle de Crooked Timber]. À l’époque, la blogosphère académique anglo-américaine a été très prolixe sur le sujet, tout comme la blogosphère française actuellement, sauf que dans le cas présent, le lien de cause à effet ne fait aucun doute.
Il faut aussi se souvenir de Pierre Jourde, agressé par les villageois de son hameau familial qui s’étaient reconnus dans son roman Pays perdu [à lire chez Pierre Assouline ou dans Le Nouvel Observateur].
Il faut aussi retenir de l’affaire en cours que les prédictions de versac s’avèrent toujours exactes, à condition d’utiliser la bonne grille de lecture et de les lire en diagonale :
- Quelqu’un dévoilera l’identité d’un blogueur […] Cela créera une polémique autour de l’usage anonyme des blogs […] ;
- Un scoop ou un scandale enflera sur les blogs et sera repris dans les media classiques. La blogosphère y verra son rathergate, mais ce sera sans doute sur un sujet insignifiant ;
- La blogosphère des producteurs d’idées s’élargira et s’incluera dans la conversation en ligne, et permettra, sur certains sujets-clefs, de corriger leur traitement médiatique ou politique. […]
versac,
Sociologie des blogs politiques : 4, un peu de prospective, 24 décembre 2005
Plus sérieusement, le problème posé par le blog de Garfieldd se rapproche de celui qu’affronte régulièrement le chercheur lorsqu’il doit travaille sur des entretiens ou qu’il rédige son carnet de terrain : la protection de l’anonymat. Ce problème est commun à toutes les disciplines qui se basent sur l’observation des individus : sociologie, ethnologie et autres. Stéphane Beaud et Florence Weber posent le problème très simplement, sans y répondre par la suite :
Il vous fait aussi livrer vos
sources, tout en respectant l’anonymat des enquêtés. Vous êtes dans une situation particulièrement inconfortable, il faut bien le reconnaître.Stéphane Beaud et Florence Weber, Guide de l’enquête de terrain, Paris, La Découverte, coll.
Repères, p. 282
Le problème se pose de manière récurrente parce qu’il n’existe pas, à ma connaissance, de technique absolue, irréfutable et irréductible pour anonymiser des données. Ceci dit, on peut essayer de définir la condition sine qua none de l’anonymat. Intuitivement, on pourrait par exemple penser que l’anonymat correspond à une situation où la personne dont on reprend les propos ne se reconnaît pas en les lisant dans la version anonymisée. J’ai peu d’expérience en la matière mais j’ai écouté et lu suffisamment de sociologues et de politistes pour savoir que cette situation n’existe pas, et que les individus qui tiennent à s’identifier ou à en identifier d’autres y parviennent ou y parviendront s’ils le souhaitent.
Rien n’empêche, ceci dit, d’appliquer quelques techniques de base pour brouiller les pistes. Ces techniques sont régulièrement utilisées par les journalistes comme par les chercheurs. Les noms des personnes ont été changés
est une consigne de base lorsque l’on travaille, par exemple, avec des publics qui enfreignent la loi : prostitué(e)s, toxicomanes, et ainsi de suite. N’utiliser que les prénoms ou les initiales, ne citer que les statuts administratifs ou les grades… L’ensemble de ces techniques ne vise pas à rendre les individus méconnaissables à leurs propres yeux, mais à les rendre anonymes de l’extérieur : un observateur qui ne sera pas issu du milieu d’interconnaissance étudié doit être incapable de reconstituer le fil de l’enquête et d’en remonter aux personnes impliquées.
Jeter un voile d’anonymat est évidemment beaucoup plus simple si l’on travaille sur des populations déjà anonymes
à plusieurs égards. Un exemple typique serait une usine de plusieurs centaines d’ouvriers, ou si vous préférez la version plus moderne et tertiarisée, une entreprise où se côtoient des dizaines de professions, et à l’intérieur de chaque profession, des dizaines d’employés. L’exemple inverse serait une caserne de pompiers, où les individus sont systématiquement gradés et hiérarchiquement situés dans la chaîne de commandement. En dernière instance, on peut citer le cas contre-exemplaire de Garfieldd : on a affaire à une personne qui est insérée dans une hiérarchie, à un échelon qui compte peu de personnel, et dont on connaît la situation géographique : c’est beaucoup trop d’information.
Pour résumer, et en simplifiant, on dispose sur chaque personne de descripteurs très discriminants, cités au cours de cette note : nom et prénom, profession, situation géographique. Comme dans un triangle en géométrie euclidienne, il suffit généralement de détenir deux de ces propriétés pour en déduire toutes les autres. Les noms et prénoms sont des données ayant peu d’incidence qui peuvent être remplacés par d’autres. La profession, elle, est beaucoup plus sensible : mieux vaut ne pas y toucher. Enfin, la situation géographique peut être élevée à un niveau de flou suffisant pour noyer la personne dans un groupe assez large : un chercheur qui aurait souhaité citer Garfieldd aurait probablement parlé d’un proviseur de la région lozérienne.
En substance, n’avoir pas su appliquer correctement cette formule est le seul reproche que l’on peut légitimement, à mon sens, faire à Garfieldd. L’interview d’un directeur de l’encadrement à l’Education nationale dans Libération laisse à croire que, contrairement aux insinuations d’un autre article de Libération évoquant le contenu du blog, c’est également la seule erreur pour laquelle Garfieldd a été sanctionné :
[C]e monsieur précisait qu’il était proviseur de lycée dans une ville qui ne compte que deux lycées et 12.000 habitants. Des éléments qui font qu’il a été aisément identifié par des enseignants de l’autre lycée de Mende qui ont découvert son blog et fait remonter l’affaire. Ce sont des fautes professionnelles graves que l’administration ne peut pas ignorer.
La nature de ce blog était incompatible avec ses fonctions, interview de Paul Desneuf, Libération, 17 janvier 2006
Mon avis personnel sur ces faits s’est construit lors de la discussion chez Éconoclaste : Garfieldd aurait dû suivre les consignes d’anonymisation dont j’ai tenté de donner ici un bref panorama. N’étant pas astreint aux mêmes consignes que le sociologue, il aurait également pu mentir sur sa ville, en choisissant une commune imaginaire comme Mufflins. La pratique de se situer dans un lieu imaginaire pour parler de lieux réels est une longue tradition de la littérature utopiste, dont la blogosphère gagnerait beaucoup à s’inspirer.
Mise à jour, 4 février 2006 : la sanction contre Garfieldd a été ramenée à sa portion congrue, c’est-à-dire à une suspension temporaire qui lui permettra de reprendre des fonctions de proviseur d’ici septembre 2006. L’écart entre les deux sanctions illustre nettement l’erreur commise initialement par le ministère, c’est en tout cas ma lecture personnelle de ce réajustement spectaculaire.