L'Archive d'Anna est un moteur de recherche de bibliothèques clandestines créé par le pseudonyme Anna[1]. Elle a été fondée en réponse directe aux efforts des autorités pour fermer la Z-Library en 2022[2],[3],[4],[5]. Elle se décrit comme un projet visant à « cataloguer tous les livres existants » et à « suivre les progrès de l'humanité pour rendre tous les livres facilement disponibles sous forme numérique »[6],[7].
Au , les Archives d'Anna contenaient 37 666 367 livres et 105 835 081 articles.
Site Web
Le code et les données de l'Archive d'Anna sont totalement open source[11]. Les collections sont préservées en masse à l'aide de BitTorrent afin de rendre le site résistant aux pertes de données et aux censures. Le site propose deux manières pour télécharger les fichiers. Une disponible seulement pour les membres avec un abonnement actif qui permet de télécharger plus rapidement. Tandis que la seconde manière, disponible pour tous sans compte est plus lente et requiert la vérification du navigateur avec un CAPTCHA pour éviter le scraping[12].
Le , Anna's Archive aurait moissonné la plus grande base de données de métadonnées de livres au monde WorldCat. L'Archive d'Anna affirme que ce web scraping « marque une étape majeure dans le recensement de tous les livres du monde » et qu'elle leur permet de « travailler à la création d'une liste de tous les livres qui doivent encore être préservés »[14]. En réponse à ce web scraping le site a été poursuivi en justice le par OCLC, l'un des gestionnaires de WorldCat[15]. OCLC affirme que ce web scraping était le résultat de cyberattaques sur ses serveurs et que l'Archive d'Anna permet le téléchargement public des données récupérées. Lors du procès le seul défendeur connu nie toute implication de l'Archive d'Anna dans le moissonnage des données ou dans le piratage de WorldCat.
Le , Anna indique sur son blog qu'elle avait acquis une copie de Duxiu, une base de données de livres chinois numérisés[16]. Les données ont été publiées sans sanction le [17].
Le , le miroir .org a commencé à rediriger vers le miroir .gs[20]. Le , Anna a signalé sur son sous-reddit que le miroir .gs ne fonctionnait pas[21],[22], et qu'il fallait utiliser le miroir .se ou le nouveau miroir .li en remplacement. Le miroir .org a également stoppé de rediriger.