EBU TT - hackathonBnF/FichesFormat GitHub Wiki

EBU-TT Statut

Description

Le format EBU-TT est un format textuel basé sur XML qui fournit le contenu des sous-titres et leur positionnement temporel vis-à-vis d'une vidéo. Il est maintenu par l'EBU (European Broadcasting Union).

Basé sur XML, il prend totalement en charge l'encodage des caractères (généralement en UTF-8) et offre un large éventail d'éléments pour définir le style, le positionnement et la langue des sous-titres. Il peut même embarquer plusieurs langues dans le même fichier.

Sa grande stabilité, sa transparence et sa standardisation en font un bon candidat pour la préservation.

Sociabilité

Le format EBU-TT est largement utilisé dans des environnements web, des applications multimédias et des services de streaming. Son formalisme XML lui permet d'intégrer des workflows de production (validation, contrôle qualité, caractérisation, etc.).

Relations à d’autres formats

Ce format est une spécialisation du format TTML v1 développé par le W3C.

Il est conçu pour remplacer le format binaire EBU-STL.

Versions

Le format EBU-TT ne dispose pas de version particulière.

Conteneur

Le format EBU TT se présente toujours dans un fichier dédié, séparé du contenu vidéo associé.

Contenu

Un fichier EBU-TT utilise la syntaxe XML et comprend des balises pour décrire différentes composantes des sous-titres. La balise <tt> englobe tout le document, et les balises <p> définissent les paragraphes de texte avec des attributs de temps (begin et end) pour spécifier la synchronisation.

Par ailleurs, des espaces de noms séparés permettent de prendre en charge les différents aspects : paramètres, styles, métadonnées (langue, par exemple).

Organisme de maintenance et documentation de référence

Ce format est maintenu par l'EBU (European Broadcasting Union).

Le standard est défini dans une série de notes sur le format EBU-TT, en particulier :

Identifiants

Extension : .ttml

Type MIME : application/ttml+xml

Espace de noms principal : http://www.w3.org/ns/ttml

Registre Identifiant
Wikidata Q27979371
Just Solve the File Format Problem EBU_Timed_Text

Caractéristiques techniques

Le format est assez complexe puisqu'il est basé sur XML et utilise de nombreux espaces de nom (CPO-SIM) mais il reste transparent (CPO-TRA).

S'agissant d'un format basé sur XML, le format est verbeux (CPO-COM), mais assez robuste (CPO-ROB) du fait de la redondance d'information et du caractère textuel du flux qui permet de le contrôler et potentiellement de le corriger.

Il n'inclut pas de mécanismes de protection (CPO-PRO).

Métadonnées internes

Le format prévoit un espace de nom complet permettant de fournir de nombreuses informations de langue, de titre, d'auteur, d'éditeur et de traducteur, le cas échéant. Une note technique 3390, Part M: Metadata Definitions est dédiée à cet aspect.

Outils connus par la BnF

Le format est identifié par les outils DROID et Unix file comme du format TTML v1.

Tous les outils permettant de contrôler ou manipuler le XML sont utilisables directement.

L'outil d'analyse et d'extraction de métadonnées techniques pour la BnF est MediaInfo.

Usage ou présence dans les collections de la BnF

Ce format est utilisé à la BnF comme l'un des formats possibles de fourniture des sous-titres pour le dépôt légal de l'image animée.