2 [Blanc] : alignement des données bibliographiques avec la BnF - transition-bibliographique/bibliostratus GitHub Wiki

Formulaire d'alignement des données avec la BnF (fichier Python correspondant noticesbib2arkBnF)

Ce formulaire prend en entrée un fichier tabulé contenant des informations bibliographiques, généralement :

  • des identifiants (ARK BnF, FRBNF, ISBN, EAN, etc)
  • des chaînes de caractères (titre, auteur, date)

A partir de ces informations, le programme réalise :

  1. un nettoyage des données
  2. un ordre de priorité entre les informations en entrée pour identifier la notice BnF correspondante
  3. une interrogation systématique du catalogue BnF (via son web service SRU) jusqu'à trouver au moins une notice (ou pas...)
  4. un contrôle de validité de la notice trouvée

et il génère en sortie

  1. un ou plusieurs fichiers proposant un alignement entre notices en entrée et notices BnF
  2. un rapport statistique
  3. un rapport explicitant, pour chaque notice, sur quelle source d'information (ISBN, Titre/Auteur/Date) il s'est appuyé pour trouver l'ARK

Problèmes les plus fréquents

Erreur d'encodage dans le fichier en entrée

Le logiciel attend un fichier tabulé, encodé en UTF-8 sans BOM. Si un message d'erreur vous indique que ce n'est pas le cas, vous pouvez par exemple utiliser le logiciel Notepad++ (existe aussi en version portable pour Windows) :

  1. ouvrir le fichier avec Notepad++
  2. aller dans le menu Encodage
  3. Choisir "Convertir en UTF-8"

Colonnes mal formées

Selon l'option retenue (donc selon le type de document à aligner), le logiciel attend certaines colonnes.

  • S'il y en a au moins le même nombre que de colonnes attendues, Bibliostratus ne verra pas qu'elles ne sont pas conformes : il ira chercher l'ISBN dans la colonne 4 (par exemple), même si vous y avez mis par erreur des titres...
  • S'il y en a moins, Bibliostratus va afficher un messager d'erreur.

De manière générale, si vous avez généré vous-mêmes vos tableaux, sans passer par le module 1, vérifiez bien dans un logiciel de type Excel ou LibreOffice Calc, que les colonnes du fichier en entrée sont bien celles attendues par Bibliostratus.

Exploiter les rapports

Voir la page spécifique