2 [Blanc] : Exploiter les rapports d'alignement - transition-bibliographique/bibliostratus GitHub Wiki

Le programme génère plusieurs fichiers :

Le ou les tableaux contenant les alignements
Les statistiques globales du processus
La liste des numéro de notices pour lesquels un identifiant ARK ou PPN a été trouvé, avec la manière dont l'ARK a été trouvé. Cette info se retrouve aussi dans le fichier global

Tous ces fichiers sont nommés avec comme préfixe l'identifiant indiqué comme ID du programme dans le formulaire en entrée

Le ou les tableaux contenant les alignements

Si on a sélectionné dans le formulaire l'option "1 fichier", il n'y a qu'un seul fichier. Si on a sélectionné l'option "Plusieurs fichiers", il y en aura 3 :

Les alignements uniques (un ARK ou PPN trouvé)
Les alignements multiples
Aucun alignement trouvé

Option 1 fichier / Plusieurs fichiers

Il peut être intéressant de produire plusieurs fichiers, si on souhaite par exemple corriger les données en entrée en identifiant des types de problèmes (données mal structurées) qui ont généré du silence (0 résultat) ou du bruit : le numéro de volume ou l'auteur dans la colonne de titre, des mots abrégés, etc.

Ces tableaux reprennent toutes les métadonnées en entrée, et les colonnes complémentaires :

Le nombre d'ARK trouvés
Une colonne "ARK trouvé" avec l'information
les métadonnées BnF de base récupérées des ARK, si vous avez coché la case du formulaire

Les statistiques globales du processus

Ce fichier contient tout d'abord le nombre de notices pour lesquels X ARK a été trouvé, sous la forme :

Exemple de rapport stat

Par ailleurs, ce fichier contient aussi un certain nombre de problèmes rencontrés lors de l'alignement :

les cas de FRBNF non valides (si la colonne FRBNF a été renseignée en entrée)
les requêtes d'API qui ont planté

Le fichier type_conversion : Les types d'alignement

Pour chaque notice, on peut rapidement se référer à ce tableau pour voir d'où peut venir l'alignement (si jamais on constate un résultat déroutant