2 [Blanc] : Exploiter les rapports d'alignement - transition-bibliographique/bibliostratus GitHub Wiki
Le programme génère plusieurs fichiers :
- Le ou les tableaux contenant les alignements
- Les statistiques globales du processus
- La liste des numéro de notices pour lesquels un identifiant ARK ou PPN a été trouvé, avec la manière dont l'ARK a été trouvé. Cette info se retrouve aussi dans le fichier global
Tous ces fichiers sont nommés avec comme préfixe l'identifiant indiqué comme ID du programme dans le formulaire en entrée
Le ou les tableaux contenant les alignements
Si on a sélectionné dans le formulaire l'option "1 fichier", il n'y a qu'un seul fichier. Si on a sélectionné l'option "Plusieurs fichiers", il y en aura 3 :
- Les alignements uniques (un ARK ou PPN trouvé)
- Les alignements multiples
- Aucun alignement trouvé
Il peut être intéressant de produire plusieurs fichiers, si on souhaite par exemple corriger les données en entrée en identifiant des types de problèmes (données mal structurées) qui ont généré du silence (0 résultat) ou du bruit : le numéro de volume ou l'auteur dans la colonne de titre, des mots abrégés, etc.
Ces tableaux reprennent toutes les métadonnées en entrée, et les colonnes complémentaires :
- Le nombre d'ARK trouvés
- Une colonne "ARK trouvé" avec l'information
- les métadonnées BnF de base récupérées des ARK, si vous avez coché la case du formulaire
Les statistiques globales du processus
Ce fichier contient tout d'abord le nombre de notices pour lesquels X ARK a été trouvé, sous la forme :
Par ailleurs, ce fichier contient aussi un certain nombre de problèmes rencontrés lors de l'alignement :
- les cas de FRBNF non valides (si la colonne FRBNF a été renseignée en entrée)
- les requêtes d'API qui ont planté
Le fichier type_conversion : Les types d'alignement
Pour chaque notice, on peut rapidement se référer à ce tableau pour voir d'où peut venir l'alignement (si jamais on constate un résultat déroutant