2. Οι αρχές και τα πρότυπα των συνδεμένων δεδομένων - Pavlov123/semantic_indexer GitHub Wiki

Οι κύριες αρχές στις οποίες στηρίζονται τα ανοιχτά συνδεδεμένα δεδομένα είναι:[3]

  • Η κανονικοποίηση της ονομασίας εννοιών και οντοτήτων με τη χρήση ενιαίων αναγνωριστικών (URI).

  • Η διαθεσιμότητα των δεδομένων μέσω του πρωτοκόλλου http.

  • Η παροχή των δεδομένων που αντιστοιχούν σε URI με τη χρήση ανοιχτών πρότυπων.

  • Η αναφορά σε άλλες έννοιες και οντότητες με τη χρήση των ενιαίων αναγνωριστικών τους.

Η υλοποίηση των παραπάνω αρχών από τους παρόχους ανοιχτών συνδεδεμένων δεδομένων, συνεισφέρει στη δημιουργία ενός κανονικοποιημένου, συνεκτίκου και προσβάσιμου μέσου, για την ανταλλαγή, των συνδιασμό, και την ανεύρεση γνώσης.

2.1 Το πρότυπο URI και το πρότυπο IRI

Όπως αναφέρθηκε και παραπάνω η αναφορά σε οντότητες γίνεται με ενιαία αναγνωριστικά (URI). Τα URI είναι δομημένες ακολουθίες χαρακτήρων που προσδιορίζουν μια φυσική ή αφηρημένη οντότητα[5]. Παρακάτω περιγράφεται σύντομα η δομή των URI.

Τα URI αποτελούνται από 5 κύρια μέρη[5]. Αναφορικά είναι το σχήμα(scheme), η αρχή(authority), το μονοπάτι(path), το ερώτημα(query) και το απόσπασμα(fragment).

  • Το πρώτο μέρος(σχήμα) ενός URI είναι το όνομα ενός σχήματος που προσδιορίζει το πρότυπο της σύνταξης των αναγνωριστικών που ανήκουν σε αυτό.

  • Το δεύτερο μέρος(αρχή) ενός URI είναι το κατοχυρωμένο όνομα ή η διεύθυνση ενός εξυπηρετητή μια αρχής που είναι υπεύθυνη για των έλεγχο των ονομάτων που ορίζονται από τα υπόλοιπα μέρη του URI.

  • Το τρίτο μέρος(μονοπάτι) αποτελείται από ιεραρχικά δομημένα δεδομένα τα οποία ταυτοποιούν μια οντότητα εντός του περιβάλλοντος της αρχής και του σχήματος.

  • Το τέταρτο μέρος(ερώτημα) αποτελείται από μη ιεραρχικά τα οποία σε συνδυασμό με το μονοπάτι ταυτοποιούν μια οντότητα.

  • Το πέμπτο μέρος(απόσπασμα) χρησιμοποιείται για να προσδιορίσει μια δευτερεύουσα οντότητα, η οποία μπορεί να είναι μέρος της κύριας οντότητας.

Το πρότυπο IRI

Το πρότυπο IRI(Internationalized Resource Identifier) επεκτείνει το πρότυπο URI με την υποστήριξη χαρακτήρων πέραν του ASCII (American Standard Code for Information Interchange) και έτσι βελτιώνει σημαντικά τη χρηστικότητα για χρήστες με άλλα αλφάβητα.

Παράδειγμα URI

  
    http://www.w3.org/2002/07/owl#sameAs
  

Παράδειγμα IRI

	
	http://www.example.com/παράδειγμα/παράδειγμα
	

2.2 Το πρότυπο RDF

H γνώση στον χώρο των ανοιχτών συνδεδεμένων δεδομένων αναπαρίσταται με το πρότυπο RDF[8]. Το πρότυπο RDF μοντελοποιεί τα δεδομένα με τη μορφή κατευθυνόμενων γράφων, οι οποίοι εκφράζονται ως σύνολα από εκφράσεις με τρία μέρη ένα υποκείμενο, ένα κατηγόρημα, και ένα αντικείμενο. Κάθε τέτοια έκφραση δηλώνει ότι το υποκείμενο και το αντικείμενο συνδέονται μέσω της σχέσης που αναφέρεται από το κατηγόρημα.[8]

Παράδειγμα έκφρασης RDF

  
    http://dbpedia.org/resource/Car
    http://www.w3.org/2002/07/owl#sameAs
    http://rdf.freebase.com/ns/m.0k4j
  

Η παραπάνω έκφραση αναφέρει ότι η οντότητα http://dbpedia.org/resource/Car που έχει οριστεί από τον πάροχο dbpedia.org συνδέεται με την οντότητα http://rdf.freebase.com/ns/m.0k4j που έχει οριστεί από τον πάροχο rdf.freebase.com μέσω της σχέσης που ορίζεται από την οντότητα http://www.w3.org/2002/07/owl#sameAs που ορίζεται

2.3 Η γλώσσα ερωτημάτων SPARQL

Η γλώσσα ερωτημάτων SPARQL χρησιμοποιείται για να εκφράσει ερωτήματα πάνω σε δεδομένα εκφρασμένα με το πρότυπο RDF.

Τα περισσότερα ερωτήματα SPARQL αποτελούνται εν μέρη από πρότυπα εκφράσεων RDF. Ένα πρότυπο έκφρασης RDF είναι αντίστοιχο με μια έκφραση RDF με τη διαφορά ότι οποιοδήποτε μέρος της έκφρασης μπορεί να είναι μεταβλητή. [12]

Παραδείγματα προτύπων έκφρασης RDF

  
      a? b? c?
      a? http://www.w3.org/2002/07/owl#sameAs c?
  

Ο πιο χρήσιμος τύπος ερωτήματος είναι ο τύπος SELECT ο οποίος επιστρέφει τα αποτελέσματα σε μορφή πίνακα. Τα ερωτήματα τύπου SELECT επιδέχονται μεταξύ άλλων υπο-εκφράσεις τύπου WHERE, ORDER BY, και LIMIT.

Παράδειγμα ερωτήματος SPARQL


  SELECT ?subject ?object WHERE {?subject http://www.w3.org/2002/07/owl#sameAs ?object}

Εκτός από ερωτήματα ανάγνωσης η γλώσσα SPARQL περιλαμβάνει εκφράσεις ενημέρωσης δεδομένων. Τα οποία χρησιμοποιούνται για την ενημέρωση του μητρώου backlinks όπως θα αναφερθεί και αργότερα

⚠️ **GitHub.com Fallback** ⚠️