DSD - hackathonBnF/FichesFormat GitHub Wiki

DSD Statut

Description

Cette fiche décrit à la fois :

  • le format de flux audio DSD (Direct Stream Digital) et sa variante compressée, DST (Direct Stream Transfer) ;
  • le format de fichier conteneur DSDIFF (DSD Interchange File Format) ;
  • le format de fichier conteneur DSF (DSD Stream File).

Le DSD est une marque et un procédé de stockage numérique des signaux audio commercialisé par Philips et Sony à partir de 1999. Il est utilisé sur les Super Audio CD (SA-CD) et dans le monde de la production, de l'archivage et de l'édition audio dématérialisée de très haute qualité. Développé par des entreprises privées, le format est propriétaire (CPO-LIB) mais sa spécification est publiée par Philips (CPO-DOC). Le DSD utilise une méthode d'encodage des signaux analogiques en signaux numériques appelée modulation Sigma Delta (SDM) sur un bit à une fréquence très élevée, concurrente de la méthode PCM (Pulse-code modulation).

Le format conteneur DSDIFF (Direct Stream Digital Interchange File Format, extension : .dff), mis au point par Philips en 2000, est utilisé dans le monde de la production musicale. Le format conteneur DSF (DSD Stream File, extension : .dsf) mis au point par Sony apparaît en 2005. Il est très similaire au précédent mais est optimisé pour l'échange par streaming et inclut des métadonnées au format ID3v2 permettant notamment d'embarquer des visuels.

Sociabilité

Originellement conçu pour encoder du son sur le Super Audio CD (SA-CD), le DSD était dans la décennie 2000 échangé dans un conteneur DSDIFF exclusivement à l'étape de production. Il est désormais également utilisé pour l'échange de son nativement dématérialisé, souvent embarqué dans un conteneur DSF. Malgré l'élargissement de ces usages, le format reste relativement spécialisé et est destiné aux professionnels ou aux audiophiles.

Relations à d’autres formats

Les formats conteneurs DSDIFF et DSF sont inspirés du format Interchange File Format, dont ils héritent la structure en chunk mais sans les limites de taille.

Afin de permettre l'édition et le mastering, le signal DSD doit être converti en DXD (Digital eXtreme Definition) pour être traité. Le DXD est un flux audio PCM à une profondeur d'au moins 24 bits et à une fréquence d'échantillonnage de 352,8 kHz, embarqué dans un conteneur FLAC ou WAVE.

Versions

Les versions actuelles des formats sont les suivantes (CPO-STA) :

  • DSD : version 2.0, stabilisée depuis mars 2004;
  • DSDIFF : version 1.5, stabilisée depuis 2004 ;
  • DSF : version 1.1, stabilisée depuis novembre 2005.

Contenu

Le DSD utilise une technique de numérisation Sigma-Delta à très haute fréquence d’échantillonnage. Le DSD64 pour 64 fs (« fs » signifiant Frequency Sampling et 1 fs = échantillonnage CD-audio = 44100 Hz). L’échantillonnage du DSD64, quantifié sur un bit unique, est donc de 2 822 400 bits par seconde, ce qui offre une bande passante allant jusqu’à 80 kHz voire 100 kHz et une plage dynamique de 120 dB.

La fréquence d'échantillonnage du DSD peut varier. Le DSD64 est le plus ancien et est utilisé dans le SA-CD, puis est apparu le DSD128 ou double-rate DSD, le DSD256 ou quad-rate DSD, le DSD512 ou octuple-rate DSD et le DSD1024. Leurs noms correspondent respectivement à 64 fois, 128 fois, 256 fois, 512 et 1024 fois la fréquence utilisée pour le CD-audio, avec respectivement des fréquences d’échantillonnage de 2,8 MHz, 5,6 MHz, 11,2 MHz, 22,57 MHz et 45,158 MHz.

Les conteneurs DSDIFF et DSF sont conçus pour embarquer de 1 à 6 canaux (stéréo ou 5.1 le plus souvent).

Le format de flux audio DSD est non compressé. Une variante compressée sans perte, décrite dans les mêmes spécifications que le DSD sous le nom DST (Direct Stream Transfer), permet de réduire de 50 à 70% la taille du flux.

Organisme de maintenance et documentation de référence

La documentation de référence sur les formats utilisant DSD est maintenue par les entreprises Philips et Sony. La spécification IFF, développée initialement par Electronic Arts, est diffusée par différentes tierces personnes.

Identifiants

Extension : .dsf ou .dff selon la variante.

Type MIME : audio/x-dsf ou audio/x-dff selon la variante.

Registre Identifiant
Wikidata Q1227499 pour DSD
Bibliothèque du Congrès fdd000245 pour le format de fichier DSDIFF
fdd000230 pour le format de flux audio DSD
PRONOM fmt/1817 (DSF)
fmt/1818 (DFF)
Just Solve the File Format Problem DSD

Caractéristiques techniques

Les fichiers DSDIFF sont d'une taille importante, même comparés à leur équivalent en WAVE non compressé « HD ». Le format est donc particulièrement adapté dans les cas où l'espace de stockage n'est pas contraint (CPO-COM) et où l’objectif est de conserver un signal de très haute qualité et très proche d'un éventuel original analogique.

Par ailleurs, il est à noter que le signal DSD est plus difficilement manipulable, en ce qui concerne des traitements audionumériques de postproduction. Ces opérations nécessitent le plus souvent une opération de conversion en PCM dans des formats conteneurs DXD ou WAVE.

Comme la plupart des formats destinés à être échangés, le flux audio DSD compressé (DST) comprend un mécanisme interne de contrôle d'intégrité sous la forme d'une empreinte CRC par frame (CPO-ROB).

Pour permettre l'interopérabilité entre les différents systèmes de fichiers qui peuvent imposer des limites de taille (par exemple les systèmes de fichiers FAT32 ou HFS limitent la taille unitaire de chaque fichier à un maximum de 4 Gio), le format conteneur DSDIFF prévoit un mécanisme de fichiers complémentaires repérables à leur extension qui comprend un numéro séquentiel : le premier aura pour extension .df1, le second .df2, etc. (CPO-AUT)

Métadonnées internes

Le format conteneur DSDIFF prévoit deux éléments de métadonnées internes (Artist et Title). En outre, la spécification DFF prévoit que les quelques métadonnées internes, en particulier les marqueurs indiquant des points d'attention dans le flux audio (début et fin de plage, par exemple) puissent être échangés séparément du flux audio afin de faciliter la mise à jour. Ces fichiers DFF ne comportant pas de flux audio sont appelés Time Files et identifiés par leur extension .dft (CPO-AUT).

Le format conteneur DSF, en revanche, est conçu pour embarquer des métadonnées internes au format ID3v2.

Outils

L'outil d'analyse et d'extraction de métadonnées techniques pour la BnF est MediaInfo, qui dispose d'une sortie native dans le format de métadonnées de caractérisation préféré par la BnF, MPEG-7.

Usage ou présence dans les collections de la BnF

En 2018, une opération exceptionnelle de numérisation de bandes « master » audio analogiques originales et de très grande qualité ont conduit à l’utilisation du format DSD256. Dans le même temps, une conversion en WAVE (PCM - 24 bits - 96 kHz) a été réalisée pour des besoins de consultation et de facilité de postproduction.

Par ailleurs sont présents dans les collections des supports SA-CD édités et entrés par dépôt légal. Pour le moment, seule la couche « CD » a été recopiée (PCM - 16 bits - 44,1 kHz) et sauvegardée au format WAVE.

⚠️ **GitHub.com Fallback** ⚠️