Lexique - sakura-team/sakura GitHub Wiki

OBJETS

Protocol : Suite d'instructions précises et détaillées mentionnant toutes les opérations à effectuer lors d'une expérimentation. Sur Sakura, les protocoles concernent les opérations à effectuer pour réaliser des expérimentations afin de construire et d'évaluer les outils produits par la recherche en informatique. (définition du TLF : "Instruction précise et détaillée mentionnant toutes les opérations à effectuer dans un certain ordre ainsi que les principes fondamentaux à respecter pour exécuter une opération, réaliser une expérience.")

Datasets : Ces jeux de données sont de deux types :

  1. les projets projet/project décrits avec des métadonnées. Ils contiennent un ou plusieurs jeux de données/dataset présentés sous différents onglets sur l’interface sakura (un onglet pour un jeu de données) stockés sur la database sakura. Deux moyens sont fournis pour spécifier les métadonnées et importer les données de ces datasets :

    • En utilisant l'interface web (métadonnées + import de fichier CSV)
    • En utilisant l'API (métadonnées + envoi de données en temps réel ou non)
  2. les jeux de données existants, qui ont été créés indépendamment du système Sakura (p.ex. geotweets, OSM). Le système Sakura permet d'accéder à ces jeux de données, sans en connaître finement la structure. Les metadata associées à ces jeux de données sont indiqués dans la config du daemon.

Operators : Algorithmes qui vont permettre de traiter les données (management, jointure, stat, visu, ... ). Certains opérateurs seront créés par les membres du projet, d'autres seront créés par les utilisateurs suivant leurs besoins. Un operateur dit "blank operator" permet de développer un operateur en python lors de la construction d'un workflow d'analyse.

Analysis : Processus piloté par l'utilisateur qui met en lien des jeux de données et des opérateurs. Dans le workflow de Sakura l'utilisateur peut ajouter un opérateur à partir d'un "blank operator". La liste des analyses donne accès à la liste des worflow. Les analyses sont décrites par des métadonnées lors de l'enregistrement.

Results : Il s'agit de la sémantique apportée à l'analyse par l'utilisateur. Sur la plateforme Sakura, le producteur d'analyse disposera d'un outil pour apporter de la sémantique à ses résultats. Il pourra documenter son processus d'analyse et l'annoter. La liste des résultats donne accès aux récits annotés. Les récits sont décrits par des métadonnées lors de l'enregistrement.

daemon: Processus s'exécutant sur le serveur sakura ou sur un serveur externe afin d'accéder ou analyser les données localisées à cet endroit, par le biais d'opérateurs.

**A SUPPRIMER ?? **

LIENS OBJETS et TACHES selon les APPLICATIONS

Protocol Data Sakura Data externe (geotweets, OSM) Operator Analyses Results
List web web ou API web web web web
Create web (thedre) web ou API web (worflow) web (worflow) web (hubble)
Modify web (thedre) web ou API web (worflow) web (worflow) web (hubble)
Delete web (thedre) web ou API web (worflow) web (worflow) web (hubble)
Register Config. Daemon