Souriez, vous êtes archivés
La Bibliothèque Nationnale de France développe et expérimente depuis 1999 ...
La Bibliothèque Nationnale de France développe et expérimente depuis 1999 une technique d'archivage des pages INternet. Le but est de garder une trace de ce média éphémère pour les générations futures.
En effet, INternet permet de diffuser tout type de données numériques d'une façon extrêmement aisée. Toute médaille à son revers : les pages, souvent dynamiques, évoluent rapidement et sont régulièrement mises à jour. Petite modification par petite modification, les versions précédentes disparaissent imperceptiblement du serveur et donc de la toile.
La BNF permettra de lutter contre l'oubli en archivant et en triant les sites les plus populaires. Ces copies seront librement consultables, au moins pour nos 20 000 chercheurs français. Un classement par thème est prévu.
Des expériences similaires ont déjà eu lieu dans différents pays (Suède, Canada, les États-Unis, etc.).
Ces sites seront sauvegardés avec leurs médias (images, son, vidéo) et leurs liens. Ceux qui évoluent le plus seront archivés sous forme numérique et avec quelques impressions d'écran.
On compte 250 000 DNS en avec une extension .fr enregistrés avec une adresse en France. Ce nombre passe à 500 000 en y ajoutant les extensions génériques (.com, .org, .edu et .net). On compte également 4 millions de sites personnels hébergés chez les différents FAI et 100 millions de pages.
Les webmasters auront la possibilité d'envoyer eux même leur création (n'est-ce pas teuf ;p).
La BNF stocke déjà tous les sites relatifs aux élections depuis 2002 : pour les élections présidentielles et législatives, la BNF a récupéré 1900 sites entre le 15 février et le 15 juin.
La technique utilisée est simple : exploration des pages par des robots, exploration du contenu récupération des liens avec prise en compte de la notoriété (nombre de liens pointant sur le site - méthode "Google").
« Dans ce cas, pour le repérage des sites, nous prenons en considération leur indice de notoriété (mesuré d'après le nombre de liens pointant vers eux), et l'analyse automatique des contenus par des outils linguistiques capables de traiter de grands volumes », explique Catherine Lupovici, directrice de la Bibliothèque numérique de la BNF.
Par ailleurs, un projet de loi relatif au « droit d'auteur et droits voisins dans la Société de l'information » sera examiné en automne 2004 pour étendre l'obligation aux personnes qui éditent et produisent les sites Internet ». Cette loi est déjà en vigueur dans le domaine de l'édition par exemple et oblige les responsables à effectuer le dépôt de leurs documents auprès des organismes reconnus. Ceci aura pour effet de rendre obligatoire le dépôt légal de tous les sites à la BNF.
La BNF aura ainsi accès aussi aux pages protégées, en accès restreint (là ou les robots ne peuvent pas aller : .htacces, mot de passe, php, etc.).
La BNF pourra alors proposer la consultation de tous les sites « sans avoir à requérir d'autorisation préalable, ni à verser de rémunération ».
L'IIPC (Consortium international pour la préservation d'internet) a été créé en 2003. Il regroupe la Bibliothèque du Congrès (États-Unis), la British Library et les bibliothèques nationales de France, Australie, Canada, Danemark, Finlande, Islande, Italie, Norvège et Suède à laquelle s'est jointe la fondation américaine Internet Archive.
L’objectif du consortium, aujourd’hui, est d’assurer la collaboration de ses membres, sur un plan technologique et de sensibiliser d’autres pays, non membres, à l’importance d’un archivage du Web.
Je vous invite à aller lire la page de la BNF (la source de l'article), c'est un peu long, mais très INtéressant :
Source :
La BNF
theocrite
le 25 juin 2004 à 10:54
(4 574
lectures)
Actualités et brèves relatives
- 01 / 04 / 2004 : Souriez, vous êtes... identifié !
- 01 / 03 / 2004 : Verisign s'échine pour filtrer le Net
- 28 / 01 / 2004 : "é" "ê" "è" "ç" : Verisign persiste et signe
- 18 / 01 / 2004 : Le code-barre du futur : Big brother ?!
- 28 / 11 / 2003 : Une carte de crédit sous votre peau ! Arf !
- 18 / 09 / 2003 : Pourquoi faut-il avoir peur de Verisign ?
- 17 / 09 / 2003 : VeriSign, maître de l'INternet ???
- 25 / 05 / 2003 : Le grand Big Brother américain s'organise!
- 01 / 06 / 2002 : Europe: Souriez, vous êtes surveillés






