Visualisation des données de DBpedia - mroylem/archivist GitHub Wiki
Analyse des données importées depuis DBpedia
Introduction
Pour cette dernière étape de notre projet, nous avons créer des visualisations sous forme de graphique à l'aide des données extraites depuis DBpedia.
Pour commencer, nous avons tout d'abord importer dans notre base de donnée intitulé : Import_DBpedia_database.sqlite, la table person ainsi que ses colonnes : name, gender, nationality, death_date.
Cette extraction à été réalisé grâce à la requête suivante :
PREFIX dbr: <http://dbpedia.org/resource/>
PREFIX dbp: <http://dbpedia.org/property/>
PREFIX dbo: <http://dbpedia.org/ontology/>
PREFIX dbc: <http://fr.dbpedia.org/resource/Catégorie:>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>
SELECT DISTINCT (str(?label) AS ?name) ?gender ?death_date ?nationality
WHERE {
{
{?person dbo:wikiPageWikiLink dbc:Archiviste_suisse}
UNION
{?person dbo:wikiPageWikiLink dbc:Archiviste_francais}
UNION
{?person dbo:wikiPageWikiLink dbc:Archiviste_belge}
UNION
{?person dbo:wikiPageWikiLink dbc:Archiviste_canadien}
UNION
{?person dbo:wikiPageWikiLink dbc:Archiviste_paléographe}
}
?person rdfs:label ?label .
?person dbp:deathDate | dbo:deathDate ?deathDate .
?person dbp:citizenship | dbo:citizenship ?citizenship .
OPTIONAL {
?citizenship rdfs:label ?nationality .
FILTER(LANG(?nationality) = "fr")
}
OPTIONAL {
?person dbp:gender | dbo:gender ?gender .
}
BIND(xsd:integer(SUBSTR(STR(?deathDate), 1, 4)) AS ?death_date)
FILTER (?deathDate >= 1820 && LANG(?label) = "fr")
}
ORDER BY ?person
Répartition des années de décès des archivistes au fil des ans
Nous avons un effectif de 91 personnes à étudier.
Pour connaître la distribution des dates des décès de ces personnes, nous avons appliqué un script Python sur ces données.
Ce script est disponible sous : "Répartition sur le temps des années de décès.ipynb".
Nous souhaitons préciser que notre étude se concentre sur la période allant de 1855 à nos jours. De plus, il semble qu’il y ait très peu de décès d’archivistes qui soient survenus après 2010. Par conséquent, nous avons préféré analyser nos données par périodes de trois ans.
Ce graphique révèle une forte augmentation des décès entre 1912 et 1917, comme on pouvait s’y attendre en raison du grand nombre de victimes de la Première Guerre mondiale. Cependant, la Seconde Guerre mondiale semble avoir causé moins de morts que prévu parmi notre population.
Ce graphique met en évidence un fait intéressant : il y a eu plus de décès chez notre groupe d’individus après 1917.
Cette tendance pourrait-elle être attribuable à une augmentation du nombre d’archivistes dans les pays francophones ?