1. Εισαγωγή - Pavlov123/semantic_indexer GitHub Wiki
Ο όρος ανοιχτά συνδεδεμένα δεδομένα, χρησιμοποιείται για την αναφορά σε δομημένα δεδομένα τα οποία δημοσιεύονται ελεύθερα και συνδέονται με άλλα αντιστοίχως δημοσιευμένα δεδομένα.
Η κύρια επιδίωξη της δημοσίευσης ανοιχτών συνδεδεμένων δεδομένων είναι η διευκόλυνση της αυτοματοποίησης της ανταλλαγής δεδομένων και η δημιουργία μιας υποδομής για την επόμενη γενεά εφαρμογών που θα μπορέσουν να αξιοποιήσουν τα ανοιχτά συνδεδεμένα δεδομένα με πρωτότυπους τρόπους [3].
Τα ανοιχτά συνδεδεμένα δεδομένα σήμερα αποτελούνται από χιλιάδες σύνολα δεδομένων (datasets). Στο πυρήνα τις ιδέας των ανοιχτών συνδεδεμένων δεδομένων είναι η διασύνδεση των δεδομένων [3] για την διευκόλυνση της αναζήτησης και ανεύρεσης σχετικών δεδομένων. Η διασύνδεση των δεδομένων γίνεται μέσω της αναφοράς σε απομακρυσμένες οντότητες μέσω των ενιαίων αναγνωριστικών (URI) τους.
Η διατήρηση και δημοσίευση απομακρυσμένων συνδέσμων σε τοπικές οντότητες (backlink) αυξάνει σημαντικά τη διασύνδεση ενός dataset, καθώς γνωστοποιεί στον εκάστοτε χρήστη την ύπαρξη σχετικών δεδομένων σε απομακρυσμένους εξυπηρετητές που διαφορετικά ο χρήστης δεν θα μπορούσε να γνωρίζει. ταυτόχρονα μέσω των backlinks διευκολύνεται σημαντικά η χαρτογράφηση των συνδέσεων των συνδεδεμένων δεδομένων και παρέχεται μια μονάδα για την εκτίμηση της σημαντικότητας των οντοτήτων του dataset.
Δεδομένης της σημασίας της διασύνδεσης των ανοιχτών συνδεδεμένων δεδομένων έχει σχεδιαστεί μια υποδομή καταγραφής backlinks και παροχής υπηρεσιών βασισμένων στα backlinks που περιγράφεται εκτενώς στο [9]. Η παρούσα εργασία, υλοποιεί έναν μηχανισμό ανεύρεσης backlinks που παράγει αποτελέσματα συμβατά με την προαναφερθείσα υποδομή με στόχο να παρέχει αρχικά δεδομένα για την εφαρμογή της.
Στο επόμενο κεφάλαιο γίνεται σύντομη παρουσίαση των αρχών και των προτύπων γύρω από τα ανοιχτά δεδομένα. Μετέπειτα παρουσιάζεται σχετικό έργο, γίνεται αναφορά στην κατάσταση των συνδεδεμένων δεδομένων σήμερα. Μετά από αυτό γίνεται μια παρουσίαση των δυσκολιών της διασύνδεσης των ανοιχτών συνδεδεμένων δεδομένων και της υποδομής που περιγράφεται από το [9]. Ενώ στην υπόλοιπη εργασία περιγράφονται οι λεπτομέρειες της υλοποίησης του συστήματος, η εφαρμογή του συστήματος για την ανεύρεση backlinks για το dataset της dbpedia και τα αποτελέσματα της.