GPKG - hackathonBnF/FichesFormat GitHub Wiki

GeoPackage (GPKG) Statut

Description

GeoPackage, OGC GeoPackage ou GPKG est un format cartographique de données vectorielles et maillées, fondé sur SQLite et créé en 2014. Il est maintenu et standardisé par l'Open geospatial consortium (OGC) qui publie ses spécifications. (CPO-LIB, CPO-DOC, CPO-STA).

GeoPackage se prête à la constitution de plusieurs types de documents cartographiques numériques. Il permet, avec ses extensions, l'encodage direct de bases de données géographiques vectorielles, de bases de statistiques géographiques et la conteneurisation de collections d'images et de grilles (à bande unique) matricielles. GeoPackage a été conçu pour dépasser les limitations en polyvalence, performances, expressivité, compacité ou robustesse des formats existants, notamment le Shapefile (CPO-EXP).

Pour la préservation GeoPackage présente de bonnes performances sur tous les critères définis par la BnF. Il a déjà été adopté par des institutions de référence (LoC, NARA). Ses seuls handicaps sont une adoption par les producteurs qui reste à confirmer et une transparence moindre que les formats textuels.

Sociabilité

Le format GeoPackage est d'un usage croissant pour la diffusion des bases de données géographiques vectorielles. Des agences nationales de cartographie comme l'IGN français, Ordnance Survey ou l'OFTS (SwissTopo) l'ont adopté parmi les formats de diffusion de leur base de donnée topographique de référence. L'USGS l'utilise pour diverses bases topographiques. Le site Geofabrik propose désormais ses imports d'OpenStreetMap en Geopackage.

En préservation numérique, le format est le seul qui soit préféré par la Bibliothèque du Congrès pour toutes ses catégories de données. Il figure également parmi les formats géographiques préférés par les Archives nationales des Etats-Unis (CPO-SOC).

Le format est pris en charge par les principaux Systèmes d'information géographique, notamment QGIS et ARCGIS. Il est lu par la bibliothèque GDAL (CPO-OUT).

Relations à d’autres formats

GeoPackage est fondé sur la version 3 de la base de donnée SQLite qui propose des fichiers de bases de données indépendants de leur environnement d'exploitation.

GeoPackage peut contenir des tuiles images PNG, JPEG et WebP ainsi que des grilles dans une version restreinte de TIFF.

L'extension officielle Related tables permet d'inclure dans les GPKG des fichiers multimédia dont le type MIME appartient au répertoire IANA. Les spécifications visent principalement l'adjonction de photographies, sons, vidéos et PDF, par exemple l'image d'un bâtiment lié à l'objet cartographique correspondant dans la base de données.

Les fichiers GeoPDF peuvent contenir des GPKG.

Versions

La dernière version est la version 1.4 de 2024. Toutes les versions des spécifications sont disponibles sur le site du GeoPackage vers lequel renvoient les liens du site de l'OGC.

Contenu

Tables

Deux tables sont obligatoires :

  • gpkg_spatial_ref_sys : renseigne sur les systèmes de référence (CRS) utilisés dans les données. Ils doivent être définis en WKT (Well-Known Text) et une entrée doit obligatoirement porter sur WGS-84, même si les données n'utilisent pas ce système.
  • gpkg_contents : index décrivant les tables de données du fichier GeoPackage. Il indique le nom des tables, leur type de données, les coordonnées de leur rectangle englobant, leur date de dernière modification et leur système de référence.

Types de contenus

Deux types de contenus cartographiques sont possibles dans un GeoPackage standard :

  • Les données géographiques vectorielles : des tables attributaires stockent la sémantique et la géométrie des objets. Un index des géométries de ces tables figure dans une table obligatoire gpkg_geometry_columns.
  • Les collections d'images matricielles : les deux formats acceptés sont le PNG et le JPEG. Les fichiers images élémentaires sont nommés "tuiles", ils forment des "matrices", éventuellement pyramidales, organisées par la table gpkg_tile_matrix_set.

GeoPackage peut aussi contenir des données attributaires, non cartographiques (bases de statistiques géographiques) : tables de données sans géométrie explicitement décrite mais revoyant à un système de référence indirect (adresses, codes etc).

Extensions

Des « extensions » permettent d'exploiter des fonctions supplémentaires. Les extensions approuvées par l'OGC figurent dans les spécifications. Une table gpkg_extensions répertorie les extensions utilisées par un fichier GPKG. Les extensions OGC permettent :

  • l'utilisation de géométries complexes additionnelles,
  • l'utilisation d'index spatiaux R-tree pour améliorer les recherches dans les tables comportant plusieurs milliers de lignes,
  • la création de niveaux de zooms non compris dans la norme principale,
  • l'utilisation de tuiles au format WebP,
  • l'ajout d'une table de métadonnées riches (stockage des styles, généalogie des données, modèle et schéma de données),
  • l'ajout d'un schéma détaillé des tables allant au delà des possibilités permises par SQLite pour décrire sa structure,
  • l'utilisation du standard OGC pour Well known text de 2019 pour les systèmes de référence,
  • la création de bases de données géographiques matricielles à bande unique, pour stocker des grilles régulières, en particulier les modèles d'élévation, dans les formats TIFF (limité) et PNG,
  • l'intégration au fichier GeoPackage (dans un BLOB, Binary Large Object) de fichiers multimédia additionnels liés aux informations géographiques du GPKG.

Les développeurs peuvent créer d'autres extensions pour GeoPackage qui ne portent pas l'extension .gpkg. Le site officiel du GeoPackage les répertorie. Elles permettent notamment de stocker des tuiles vectorielles et de la symbologie.

Organisme de maintenance et documentation de référence

Les spécifications sont maintenues par l'OGC. Tous les états sont disponibles sur le site du GeoPackage qui est archivé (les liens dans les spécifications vers des annexes hébergées sur le site de l'OGC renvoient aussi à des pages archivées).

Identifiants

Extension(s) : .gpkg

Type(s) MIME : application/geopackage+sqlite3

Registre Identifiant
Wikidata Q22908624
Bibliothèque du Congrès fdd000520
PRONOM fmt/1700
Just Solve the File Format Problem GeoPackage

Caractéristiques techniques

GeoPackage est un format compact pour des jeux de données vectoriels dépassant plusieurs Mo. Dans ce rôle il surpasse largement le Shapefile (CPO-COM).

GeoPackage est un format binaire mais il se fonde sur SQLite pour lequel les outils sont répandus et est pris en charge par les SIG. (CPO-TRA) Sa structure en un fichier unique permet de manipuler ou transférer simplement des données souvent éclatées en une multitude de fichiers dans d'autres formats (SHP, collections de rasters) (CPO-SIM).

GeoPackage est autonome grâce à ses possibilités d'autodocumentation et le mécanisme des extensions qui évite de recourir à des fichiers externes pour faire face à de nouveaux besoins (CPO-AUT).

GeoPackage ne dispose pas de fonctionnalité native pour protéger les données (CPO-PRO).

GeoPackage est robuste. Le format a été conçu pour être utilisé dans des environnement où la connectivité est dégradée. Il impose deux tests d'intégrité qui ne sont qu'optionnels pour les bases SQLite. De plus le format applique la norme ISO Well-Known Binary en ajoutant une fonction d'encodage des ensembles de points vides qui évite leur mauvaise interprétation (CPO-ROB).

Métadonnées internes

Trois tables optionnelles du GPKG permettent préciser ou documenter les données :

  • La table gpkg_data_columns : permet de décrire des colonnes spécifiques dans une table GeoPackage (nom, description, contraintes).
  • La table gpkg_metadata : permet de stocker des métadonnées dans des formats compatibles avec des types MIME (text/xml par défaut) qui peuvent suivre n'importe quel schéma de métadonnées standardisé comme ISO 19115 et Dublin Core ou encore des schémas UML et GML.

Son utilisation requiert obligatoirement une table gpkg_metadata_reference qui associe les métadonnées stockées dans gpkg_metadata aux données géographiques du fichier. Les deux tables permettent de mettre en œuvre le modèle hiérarchique de métadonnées de la norme ISO 19115.

Outils connus par la BnF

Usage ou présence dans les collections de la BnF

La BnF envisage de recevoir les bases de données géographiques vectorielles issues du dépôt légal au format GeoPackage.