wikidata ‐ introduction - Zenderl/conseil_federal GitHub Wiki

wikidata introduction

conseil_national_diagram

Ce diagramme représente le modèle conceptuel de ma population générée par DBeaver. La table wdt_personnes est le centre de la base de données et fait la jonction avec les autres tables, il s'agit pour la plupart des tables de persistent item. A l'exception des tables wdt_personnes_partis et wdt_personnes_langues qui nécessite une table intermédiaire, de type temporal entity, car un.e individus peut avoir plus langues ou être membres de plusieurs partis. Cette table pivot permet de ne pas créer de doublons dans la base de données et en même temps de prendre en compte les différences qui peuvent subvenir dans la population.

présentation du projet et de la population

Le semestre de printemps 24 propose de faire de l'analyse de données en se basant sur la même population que le semestre d'automne 23. Dans mon cas, la population est trop faible pour que cela fonctionne et je me suis rabattue sur les membres du Conseil national né.e.s entre 1900 et 2000 (suivant les données disponibles). J'ai mis une limite à 1900, car depuis cette date je suis sure d'avoir assez d'informations et propriétés pour mes individus, par exemple l'appartenance à un parti politique n'est pas toujours représenté pour les individus antérieurs à cette date. Pour se faire, je me base sur wikidata, l'exercice devrait aussi se faire avec dbpedia mais je n'ai pas réussi à trouver des résultats pour ma population.

commentaires méthodologique

Ce nouveau projet est basé uniquement sur des données disponible sur wikidata afin de rester dans les limites de l'exercice. Cela a pour effets de limiter les analyses possibles, par exemple il n'y a pas assez d'informations sur l'occupation de mes individus car èrès de 50% n'a que la mention 'politicien.ne'. Et, contrairement au Conseil fédéral, nous n'avons pas pu réaliser d'analyses de réseaux ou sur les autres mandats politiques car c'est derniers ne sont que très rarement référencés sur wikidata. Ce manque dans la base de données en ligne représente la limite de la complexité de ma population et de l'exercice proposé. Il a néanmoins été décidé de rester uniquement sur des données disponibles sur wikidata et de plutôt mettre en avant l'intérêt heuristique de l'exercice par rapport à une analyse plus exhaustive.

Il faut aussi noter qu'aucune date de membership n'est incluse dans ce MCD et dans la base de données de manière générale, pour la simple et bonne raison que ces informations ne sont pas disponible sur wikidata pour une majorité des individus. C'est pourquoi la seule date présente concerne la 'date de naissance' et que pour les analyses de spatialisation ce sont les 'lieu de naissance' qui sont mobilisés.

questions de recherches

Comme pour le précédent projet, nous nous sommes basés sur un certain nombre de questions et d'hypothèses afin de voir quelles données utilisées.

  • est-ce qu'il y a un lien entre le genre et l'orientation politique des individus et est-ce que cela évolue suivant les périodes ? tout en tenant compte que le droit de vote des femmes est acquis en 1971. il est cependant intéressant de voir s'il y a une attraction entre la moyenne d'âge du Conseil national et le genre.
  • est-ce qu'il y a un lien entre les langues et les orientations politiques en fonction des périodes et de la même manière avec les lieux de naissance (ville-campagne) ? a défaut de pouvoir utiliser des données précises sur les régions et cantons de Suisse, ces deux questions permetetent de proposer un début d'analyse.
  • comment les lieux de naissance sont-ils distribués en fonction des effectifs ? l'idée est de pouvoir avoir une représentation spatiale qui peut être mis en lien avec la question précédente.
  • est-ce que la distribution en fonction de périodes pré-définies permet de tirer des conclusions plus pertinentes qu'une distribution ordonnées?

distribution des périodes

Ma population s'étend entre 1901 et 1996 pour les dates de naissances. Dans le cadre du carnet wdt_parti_name_exploration je propose une analyse temporelle des répartitions dans les partis politiques. Pour ce faire, j'ai établis différentes périodes, elles sont basées sur une distribution qualitatives et non sur une distribution ordonnées.

  • 1901-1914 > début du XXe siècle, la première guerre mondiale faisant office de point de rupture
  • 1915-1929 > comprend la 1e guerre mondiale jusqu'au crash boursier de 1929
  • 1930-1945 > comprend la crise économique des annnées 30' ainsi que la montée du faschisme jusqu'à la fin de la seconde guerre mondiale. J'ai souhaité lié ces deux éléments pour d'une part éviter de fragmenter trop mes périodes et d'autres parts car il me semblait y avoir une cohérence comme la montée du faschisme débute justement dans les années 30'
  • 1946-1975 > comprend la période des trentes glorieuses, le choc pétrolier et la crise économique majeure qui s'en est suivie font office de point de rupture
  • 1976-1996 > comprend la période post-trente glorieuses