ODT - hackathonBnF/FichesFormat GitHub Wiki
Description
OpenDocument (ODF) est un format de données pour les applications bureautiques : traitement de texte, tableur, logiciel de présentation, de diagramme, de dessin et base de données bureautique. OpenDocument Text en est la variante dédiée au texte formaté. Il s'agit d'un format ouvert (CPO-DOC, CPO-LIB) : les entreprises Sun Microsystems et IBM, qui ont contribué au format, se sont engagées à ne pas restreindre par brevet l'utilisation du format.
Sociabilité
Ce format est reconnu par la plupart des logiciels libres d'édition bureautique (OpenOffice, LibreOffice, AbiWord, KWord, …). Certains logiciels propriétaires assurent une compatibilité partielle (Microsoft Office 2007 et versions suivantes, Lotus Symphony, Google Docs, etc.).
En France, le format OpenDocument est le seul format recommandé comme format bureautique par le référentiel général d'interopérabilité depuis sa version 2.0 validée le 2 décembre 2015.
Un très grand nombre d'institutions de conservation (Bibliothèque et Archives Canada, National Archives and Records Administration aux États-Unis, etc.) le mentionnent comme format préféré pour le contenu textuel.
Relations à d’autres formats
Attention de ne pas confondre les formats OpenDocument avec le format bureautique de Microsoft : Office Open XML, tous les deux étant des normes ISO.
Le format OpenDocument s'inspire largement du format créé pour le logiciel OpenOffice.org développé à l'origine par Sun. Il se base essentiellement sur XML pour le contenu, ce qui le rend relativement lisible par l'humain, et ZIP pour le conteneur. Il est possible d'embarquer des images dans le document. Dans ce cas la norme recommande (mais n'oblige pas) d'utiliser les formats PNG pour les images matricielles et SVG pour les images vectorielles.
Organisme de maintenance, documentation de référence et versions
Il s'agit d'un format ouvert et normalisé par OASIS (Organization for the Advancement of Structured Information Standards) depuis mai 2005 et par l'ISO depuis 2006 sous l'identifiant ISO/IEC 26300.
Version | Date OASIS | Date ISO |
---|---|---|
1.0 | 01/05/2005 | 19/07/2006 |
1.1 | 02/02/2007 | 11/07/2013 |
1.2 | 29/09/2011 | 19/06/2015 |
1.3 | en cours | N/A |
La British Library a réalisé une évaluation de ce format pour la préservation à long terme, accessible sur https://wiki.dpconline.org/images/c/c6/ODT_Assessment-v1.pdf.
Contenu
Un document au format OpenDocument peut exister sous deux formes :
- généralement, un conteneur au format ZIP embarquant plusieurs fichiers XML et éventuellement du contenu binaire tel que des images ;
- plus rarement, un simple fichier XML dit « à plat », signalé par l'extension
.fodt
. Cette forme n'est pas toujours reconnue par les logiciels d'édition (tels que Microsoft Office 2007 à 2013).
Un fichier ODT présente obligatoirement un fichier XML : META-INF/manifest.xml
qui contient la liste de fichiers contenus dans le conteneur, avec leur type MIME et éventuellement l'information nécessaire à leur décompression ou leur déchiffrement.
Un fichier ODT comporte optionnellement (mais sa présence est fortement conseillée) un fichier mimetype
qui contient le type MIME du document (pour ODT : application/vnd.oasis.opendocument.text
).
Le contenu est réparti dans les fichiers :
- content.xml : le contenu à proprement parler du document ;
- meta.xml : les métadonnées associées au document ;
- settings.xml : des paramètres destinés à l'application pour éditer le document ;
- style.xml : la partie « présentation » du document.
On peut trouver également :
- Thumbnails/thumbnail.png : une imagette enregistrée en PNG ;
- éventuellement des images dans Pictures/ : ce répertoire ne fait pas partie de la norme mais relève d'une pratique généralisée ; les images contenues dans ce répertoire devraient être au format PNG ou SVG bien qu'il soit possible d'utiliser tout autre format.
Identifiants
Extensions : .odt
, .fodt
(version sous forme d'XML seul), .ott
(modèle de document).
Types MIME : application/vnd.oasis.opendocument.text
, application/vnd.oasis.opendocument.text-template
(modèle de document).
Registre | Identifiant |
---|---|
Wikidata | Q27203100 (v. 1.0) Q27203404 (v. 1.1) Q27203601 (v. 1.2) |
Bibliothèque du Congrès | fdd000427 (v. 1.1) fdd000428 (v. 1.2) |
PRONOM | fmt/136 (v. 1.0) fmt/290 (v. 1.1) fmt/291 (v. 1.2) |
Just Solve the File Format Problem | OpenDocument_Text |
Caractéristiques techniques
Le format ODF gère les marques de révision et la signature numérique à partir de sa version ODF 1.2.
Fondé sur le conteneur ZIP, le format ODT bénéficie des mécanismes de gestion d'intégrité de ZIP. Sa robustesse (CPO-ROB) est donc considérée comme satisfaisante. Seule la méthode de compression sans perte Deflate est autorisée.
Dépendances (CPO-AUT) :
- Un document ODT peut inclure les polices utilisées dans le texte afin de le rendre autonome, mais tous les outils, par exemple Apache OpenOffice, n'autorisent pas cette opération.
- Les fichiers complémentaires (de type images ou autres) peuvent être inclus dans le conteneur ZIP ou simplement référencés. Selon la version de l'outil utilisée, un copier-coller d'une image dans un document ODT peut ne résulter qu'en une référence à l'URI de l'image, et non à l'inclusion de l'image elle-même.
Mécanismes de protection (CPO-PRO) : les fichiers ODF peuvent être aisément chiffrés en sélectionnant une option d'enregistrement dans OpenOffice.org et LibreOffice. Les fichiers ainsi chiffrés ne sont plus lisibles par les outils d'analyse cités plus bas qui renverront donc une erreur plus ou moins explicite. À partir de la version 1.2 d'ODF, plusieurs méthodes de chiffrement sont autorisées ; le fichier META-INF/manifest.xml doit indiquer laquelle a été utilisée.
Métadonnées internes
Le format ODF permet d'embarquer des métadonnées internes dans le fichier meta.xml. Le formalisme adopte Dublin Core (préfixe « dc: ») et l'étend avec un jeu de métadonnées spécifique (préfixe « meta: »). Le format accepte également des métadonnées définies par l'utilisateur, qui suivent le formalisme RDF à partir de la version 1.2 d'ODF.
Outils connus par la BnF
- De multiples outils d'édition existent, mais le formatage peut différer de l'un à l'autre (ainsi, Microsoft signale que « Le formatage peut être perdu lorsque les utilisateurs enregistrent et ouvrent des fichiers .odt »).
- La conversion de ou vers ODT est une opération délicate ; il arrive que certaines fonctionnalités soient perdues ou mal rendues (les marques de révision notamment sont souvent mal traitées).
- L'outil ODF Validator, développé par The Document Foundation, valide les fichiers ODF et dispose d'une version en ligne. Il en existe d'autres, mais aucun ne propose une couverture complète du format.
- Tika permet une extraction des métadonnées internes au format XMP et du contenu textuel.
Usage ou présence dans les collections de la BnF
À la date du 16 mars 2021, le format ODT est peu représenté dans les collections de la BnF. Il est néanmoins susceptible de les intégrer par le biais de dons numériques natifs.