5. Οι δυσκολίες της διασύνδεσης και το μητρώο backlinks - Pavlov123/semantic_indexer GitHub Wiki

5.1 Το πρόβλημα

Οι κύριες δυσκολίες που εμφανίζει η σημερινή εικόνα της διασύνδεσης μεταξύ των συνδεδεμένων δεδομένων είναι:

  1. Η δυσκολία της δημιουργίας συνδέσμων που δημιουργείται λόγο της αδυναμίας ανεύρεσης σχετικών οντοτήτων στο σύνολο των συνδεδεμένων δεδομένων.

  2. Η μονόπλευρη φύση των απλών συνδέσμων η οποία περιορίζει την διάσχιση του γραφήματος των ανοιχτών συνδεδεμένων δεδομένων.

Η ερευνητική κοινότητα έχει δημιουργήσει μια σειρά από λύσεις σε αυτά τα προβλήματα με τη μορφή μηχανών αναζήτησης όπως, το swoogle.umbc.edu[4], το sameas.org, και το sindice.com[11] (πλέον εκτός λειτουργίας) μεταξύ άλλων. Το swoogle.umbc.edu και το sinidice.com είναι γενικές μηχανές αναζήτησης που προσφέρουν αποτελέσματα από το σύνολο των συνδεδεμένων δεδομένων. Ενώ το sameas.org προσφέρει αποκλειστικά μια υπηρεσία ανεύρεσης αντίστοιχων οντοτήτων.

Ο κεντροποιημένος χαρακτήρας των παραπάνω υπηρεσιών δημιουργεί δυσεπίλυτα προβλήματα καθώς η αύξηση του όγκου των δεδομένων αυξάνει το κόστος και την πολυπλοκότητα των συστημάτων που είναι απαραίτητα για την ενημέρωση των δεδομένων τους.

5.2 Το μητρώο backlinks(registry)

Στο [9] παρουσιάζεται μια εναλλακτική προσέγγιση, αντί μιας κεντροποιημένης υπηρεσίας ευρετηρίασης οι συγγραφείς προτείνουν μια αποκεντρωμένη υποδομή ευρετηρίασης, όπου ο κάθε εκδότης συνδεδεμένων δεδομένων διατηρεί ένα ευρετήριο backlinks των δεδομένων του. Πάνω στο οποίο μπορούν να υλοποιηθούν αντίστοιχες υπηρεσίες.


Εικόνα 2. Η αρχιτεκτονική του μητρώου backlinks, πηγή [9].

Το μητρώο backlinks που περιγράφεται εκτενώς στο [9] είναι σχεδιασμένο για να λειτουργεί παράλληλα με την υπηρεσία παροχής των σημασιολογικών δεδομένων ενός παρόχου. Στο μητρώο backlinks αποθηκεύονται δεδομένα διασύνδεσης (πλήθος backlinks ανά τοποθεσία sparql) για κάθε οντότητα που ανήκει στα σημασιολογικά δεδομένα του παρόχου. Η ενημέρωση των δεδομένων βασίζεται στη αποστολή ειδικών μηνυμάτων κατά την εισαγωγή σημασιολογικών δεδομένων από απομακρυσμένους παρόχους.


Εικόνα 3. Ο μηχανισμός ανανέωσης του μητρώου backlinks, πηγή [9].

Παράδειγμα

  1. Ο εξυπηρετητής A διατηρεί μια registry για τα σημασιολογικά δεδομένα που δημοσιεύει.

  2. Ο εξυπηρετητής B δέχεται ένα αίτημα να δημιουργήσει μια νέα έγγραφη (B/resource B/predicate A/resource).

  3. Επειδή η νέα εγγραφή αναφέρει μια οντότητα που ανήκει στον A ο εξυπηρετητής B αποστέλλει μια ειδοποίηση δημιουργίας backlink στο μητρώο backlinks του A.

⚠️ **GitHub.com Fallback** ⚠️