EBU TT - hackathonBnF/FichesFormat GitHub Wiki
Description
Le format EBU-TT est un format textuel basé sur XML qui fournit le contenu des sous-titres et leur positionnement temporel vis-à-vis d'une vidéo. Il est maintenu par l'EBU (European Broadcasting Union).
Basé sur XML, il prend totalement en charge l'encodage des caractères (généralement en UTF-8) et offre un large éventail d'éléments pour définir le style, le positionnement et la langue des sous-titres. Il peut même embarquer plusieurs langues dans le même fichier.
Sa grande stabilité, sa transparence et sa standardisation en font un bon candidat pour la préservation.
Sociabilité
Le format EBU-TT est largement utilisé dans des environnements web, des applications multimédias et des services de streaming. Son formalisme XML lui permet d'intégrer des workflows de production (validation, contrôle qualité, caractérisation, etc.).
Relations à d’autres formats
Ce format est une spécialisation du format TTML v1 développé par le W3C.
Il est conçu pour remplacer le format binaire EBU-STL.
Versions
Le format EBU-TT ne dispose pas de version particulière.
Conteneur
Le format EBU TT se présente toujours dans un fichier dédié, séparé du contenu vidéo associé.
Contenu
Un fichier EBU-TT utilise la syntaxe XML et comprend des balises pour décrire différentes composantes des sous-titres. La balise <tt>
englobe tout le document, et les balises <p>
définissent les paragraphes de texte avec des attributs de temps (begin
et end
) pour spécifier la synchronisation.
Par ailleurs, des espaces de noms séparés permettent de prendre en charge les différents aspects : paramètres, styles, métadonnées (langue, par exemple).
Organisme de maintenance et documentation de référence
Ce format est maintenu par l'EBU (European Broadcasting Union).
Le standard est défini dans une série de notes sur le format EBU-TT, en particulier :
- La partie 1 de la note technique 3350 : Part 1: EBU-TT Subtitling format definition de mai 2017 ;
- Les spécificités de distribution dans la note technique 3380 : EBU-TT-D: Subtitling Distribution Format de mai 2018.
Identifiants
Extension : .ttml
Type MIME : application/ttml+xml
Espace de noms principal : http://www.w3.org/ns/ttml
Registre | Identifiant |
---|---|
Wikidata | Q27979371 |
Just Solve the File Format Problem | EBU_Timed_Text |
Caractéristiques techniques
Le format est assez complexe puisqu'il est basé sur XML et utilise de nombreux espaces de nom (CPO-SIM) mais il reste transparent (CPO-TRA).
S'agissant d'un format basé sur XML, le format est verbeux (CPO-COM), mais assez robuste (CPO-ROB) du fait de la redondance d'information et du caractère textuel du flux qui permet de le contrôler et potentiellement de le corriger.
Il n'inclut pas de mécanismes de protection (CPO-PRO).
Métadonnées internes
Le format prévoit un espace de nom complet permettant de fournir de nombreuses informations de langue, de titre, d'auteur, d'éditeur et de traducteur, le cas échéant. Une note technique 3390, Part M: Metadata Definitions est dédiée à cet aspect.
Outils connus par la BnF
Le format est identifié par les outils DROID et Unix file comme du format TTML v1.
Tous les outils permettant de contrôler ou manipuler le XML sont utilisables directement.
L'outil d'analyse et d'extraction de métadonnées techniques pour la BnF est MediaInfo
.
Usage ou présence dans les collections de la BnF
Ce format est utilisé à la BnF comme l'un des formats possibles de fourniture des sous-titres pour le dépôt légal de l'image animée.