S'identifier / Créer un compte
  • Actualités
  • Dossiers
  • Tests
  • Commentaires
  • INpactiens
Publicité

Dans les coulisses du dépôt légal de l’Internet

Xavier Berne le 14 juin 2012
Grande nouveauté de la campagne de collecte des sites électoraux de l’année 2012, les réseaux sociaux font eux aussi partie des sites capturés. Même si la BNF est en théorie en mesure d’archiver tous les comptes publics, il s’avère qu’en pratique elle se concentre uniquement sur certains utilisateurs.

Entre le 23 janvier et le 23 juillet 2012, Facebook, Twitter, Google+, Pinterest et Flickr sont régulièrement passés en revue par les robots de la BNF, qui collectent plus particulièrement « les comptes des utilisateurs impliqués dans la campagne ». Rentrent ainsi dans cette catégorie les « comptes officiels, soutiens importants, médias, militants particulièrement actifs, etc. ».

Toutefois, comme l’explique Clément Oury, la BNF « n’est pas là pour violer la vie privée des gens », et les correspondances privées échappent de ce fait à l’opération de collecte de certains comptes. En réalité, ce sont 916 fils Twitter et 839 pages Facebook qui sont collectés durant l'opération de cette année, uniquement dans le cadre de la campagne d’archivage des sites électoraux.

En dehors de cette opération ponctuelle, la BNF s’intéresse à des comptes plus variés, alternant une fois de plus collecte large et opérations ciblées. Il s'avère ainsi que les différents comptes officiels, tels que celui de l’Élysée ou du ministère de l'Intérieur, font plus particulièrement l'objet d'archivages réguliers. L’enjeu est de pouvoir conserver une trace de la communication de l’administration ou du Gouvernement, qui s’opère au travers de ces outils en ligne.

Dans la pratique, les robots sont parfois confrontés à des problèmes techniques. « Ce qui est compliqué pour nous, c’est que Twitter et Facebook ont tendance à changer leur modèle de publication très vite, tout le temps, sans prévenir personne », explique Clément Oury. Le responsable du dépôt légal de l’internet se veut toutefois rassurant, dans la mesure où la Bibliothèque du Congrès des États-Unis dispose d’un accord avec Twitter, qui lui permet d’accéder à l’ensemble des archives du site de micro-blogging. « On sait qu’on a au minimum un miroir de tous les tweets français quelque part à Washington ».

Le fil Twitter et le compte Facebook de PC INpact ont par exemple été archivés :

twitter archive pcinpact bnf 
 
compte facebook archive bnf pcinpact