DAISY - hackathonBnF/FichesFormat GitHub Wiki

DAISY Digital Talking Book Statut

Description

DAISY Digital Talking Book (ou « DAISY DTB ») est un standard développé et maintenu par le Consortium Daisy pour la production de contenus numériques accessibles pour les personnes en situation de handicap. Il met l'accent sur la description structurelle des contenus, les fonctions de navigation, l'association d'une transcription sonore au texte et la description des éléments visuels.

À ses débuts en Suède en 1994, DAISY (Digital Accessible Information SYstem) était un standard propriétaire. Depuis 1997 c’est une norme ouverte recourant à des formats de fichiers standardisés (XML notamment).

Un livre numérique produit selon le standard DAISY est appelé Digital Talking Book (DTB) dans les spécifications NISO (ANSI/NISO Z39.86-2005 (R2012) Specifications for the Digital Talking Book). On rencontre aussi l'appellation DAISY XML ou même DAISY.

DTBook (aussi appelé « XML DTBook » ou « DAISY XML ») désigne le formalisme XML défini par le standard pour encoder les contenus textuels des livres numériques produit selon le standard DAISY. Il est défini par une DTD XML (« DTBook Element Set », dtbook.dtd), également décrite dans les spécifications ANSI/NISO Z39.86-2005.

DAISY DTB est principalement utilisé selon trois déclinaisons :

  • audio avec navigation : le contenu audio est fourni, ainsi qu'une structure de navigation au sein du contenu (peut être appelé « DAISY audio ») ;
  • audio et texte synchronisé, avec navigation : le texte complet est fourni, et il est synchronisé avec sa transcription audio (« full DAISY ») ;
  • texte seul, avec navigation : le texte complet est fourni, sans transcription audio (dans ce cas, il est courant de parler de format « DAISY texte »).

Sociabilité

Le standard DAISY DTB est largement employé pour la création de contenus numériques accessibles sous la forme de livres audio synchronisés avec le plein texte.

Relations à d’autres formats

DAISY et EPUB sont historiquement liés.

  • Le Consortium DAISY a participé à la création du format EPUB au sein de l'IDPF (désormais au sein du W3C). DTBook est un format de contenu accepté par EPUB 2.0.
  • Le Consortium DAISY est fortement impliqué dans la création et la maintenance du format EPUB 3, nativement accessible. Il s’est maintenant engagé à utiliser EPUB 3 comme son format principal de distribution ; le standard DTBook n'a donc pas été inclus dans l'EPUB 3.

Versions

Le format est utilisé en versions 2 (2002) et 3 (2005). Il n'est pas prévu de version 4.

Contenu

Le standard DAISY définit un ensemble de composants formant un livre numérique DAISY :

  • un manifeste au format OEBPS (Open eBook Publication Structure) 1.2, maintenu par l'IDPF ;
  • des contenus audio et images ;
  • des contenus textuels conformes à la DTD XML dtbook.dtd ;
  • une table de navigation au format NCX (Navigation Control file for XML), format également maintenu par le consortium DAISY. La table est généralement dérivée de façon automatique à partir des contenus XML ;
  • un mécanisme de synchronisation audio/texte basé sur le langage SMIL (Synchronized Multimedia Integration Language) 2.0.

Organisme de maintenance et documentation de référence

Le consortium DAISY est l'organisme de maintenance. DAISY DTB est un standard NISO (ANSI/NISO Z39.86-2005 (R2012) Specifications for the Digital Talking Book).

Identifiants

Registre Identifiant
Wikidata Q1155804 (le format XML DTBook), Q1151676 (le livre DAISY)
Bibliothèque du Congrès fdd000053 (version Digital Talking Book. ANSI/NISO Z39.86-2002), fdd000275 (version Digital Talking Book. ANSI/NISO Z39.86-2005)

Caractéristiques techniques

Outre les points évoqués supra, mentionnons :

  • le support des formats audio MPEG-4 AAC, MPEG-1/2 Layer III (MP3), Linear PCM ;
  • le support des formats image JPEG, PNG, SVG ;
  • le standard ne prévoit pas de méthode de création d'un paquet numérique (telle la restriction ZIP du format EPUB).

Métadonnées internes

Des métadonnées descriptives peuvent être embarquées dans l'élément metadata du manifeste, selon le formalisme Dublin Core.

Outils connus par la BnF

Les contenus XML au format DTBook sont validés conformément à la DTD dtbook 2005-3.

L’outil Pipeline, via le script DTBookValidator.taskScript, vérifie la conformité du fichier DTBook à la DTD et sa cohérence (fichiers images, notes non référencées, liens sans cible, etc.).

pipeline.bat scripts\verify\DTBookValidator.taskScript --input=fichier_a_valider.xml

Pipeline permet également de procéder à des transformations de format (XML DTBook vers HTML ou EPUB).

La caractérisation de Daisy Digital Talking Book, comme celle des autres formats XML, est réalisée par le module XML de l'outil Jhove. L'option withTextMD permet de produire une sortie au format textMD.

Usage ou présence dans les collections de la BnF

La BnF utilise le format DTBook, sans manifeste OEBPS ni table de navigation NCX, pour diffuser sur Gallica, sous une forme accessible, les contenus textuels des livres numériques produits au format EPUB 3. Cette production s'appuie sur un référentiel de numérisation (Référentiel DAISY).

Ces formats sont téléchargeables dans la bibliothèque numérique Gallica, en complément des livres numériques EPUB 3.

Le dispositif PLATON (PLAteforme de Transfert d'Ouvrages Numériques) accueille les fichiers d'oeuvres adaptées par les organismes transcripteurs dans le cadre de l'exception handicap au droit d'auteur. Ces fichiers sont destinés à l'usage d'un public empêché de lire.  Dans ce cadre, la BnF conserve et communique aux organismes habilités, par le biais de PLATON, des fichiers de type XML DTBook (3 980 en 2020), des fichiers DAISY audio en voix humaine et voix de synthèse (38 en 2020), et des fichiers dits "Full DAISY" (texte et audio, voix humaine ou voix de synthèse, 1 en 2020).