3. Σχετικό Έργο - Pavlov123/semantic_indexer GitHub Wiki
Η αξία των backlinks για τις μηχανές αναζήτησης και ευρετηρίασης[4][1], ως σημαντικό στοιχείο της διασύνδεσης των δεδομένων, έχει οδηγήσει πολλές από αυτές να υλοποιήσουν μηχανισμούς ανεύρεσης backlinks μέσω της διάσχισης του δικτύου (crawling). Περισσότερο σημαντικές είναι οι προσπάθειες να δημιουργηθούν υπηρεσίες backlinking, καθώς τα backlinks που ανευρίσκονται στις διαδικασίες ευρετηρίασης των προαναφερθέντων μηχανών αναζήτησης συνήθως δεν δημοσιεύονται ξεχωριστά. Ενώ τα backlinks έχουν και μεγάλη χρησιμότητα για τους χρήστες καθώς επιτρέπουν την ευκολότερη διάσχιση των δεδομένων και παρουσιάζουν μια πιο συνεκτική εικόνα του δικτύου.
Αναγνωρίζοντας το κενό που δημιουργείται από την απουσία backlinks οι συγγραφείς του [6] παρουσιάζουν μια υπηρεσία ανεύρεσης backlinks και την υλοποιούν πιλοτικά πάνω στα δεδομένα του UK Public Sector Information http://www.nationalarchives.gov.uk/information-management/re-using-public-sector-information/about-psi/. Η υπηρεσία που περιγράφεται υλοποιεί μια διαδικασία περιοδικού crawling σε ένα επιλεγμένο υποσύνολο των ανοιχτών συνδεδεμένων δεδομένων για την ανεύρεση backlinks η οποία ως τελικό αποτέλεσμα παράγει μια λίστα από εγγραφές της μορφής "foreign-uri" rdfs:seeAlso "local-uri". Βασικό μειονέκτημα της προσέγγισης είναι η ανάγκη για διαρκή επανεξέταση του συνόλου των ανοιχτών συνδεδεμένων δεδομένων ή του επιλεγμένου υποσυνόλου για την ανανέωση των backlinks.
Οι συγγραφείς του [10] παρουσιάζουν την πρόταση τους για την επέκταση του μηχανισμού pingback, όπως έχει οριστεί για το web, στο πεδίο των ανοιχτών συνδεδεμένων δεδομένων. Το σύστημα που περιγράφεται αποτελείται από ένα πελάτης και ένα εξυπηρετητή. Κατά τη δημιουργία μια αναφοράς σε ένα ξένο URI ο πελάτης ενημερώνει τον αντίστοιχο εξυπηρετητή ο οποίος καταγράφει το καινούργιο backlink. Αξίζει να σημειωθεί ότι η πρόταση των συγγραφέων χτίζει πάνω στο υπάρχον pingback με αποτέλεσμα να είναι δυνατή η δημιουργία backlinks ακόμα και από σελίδες με ενσωματωμένα rdf δεδομένα (rdf-a) εκτός από αρχεία rdf.
Η προσέγγιση του pingback που περιγράφεται παραπάνω (ενημέρωση κατά την λειτουργία του συστήματος) φέρει αρκετή ομοιότητα με τη διαδικασία backlinking που έχει επιλεχθεί για το μητρώο backlinks ενώ η διαδικασία crawling (ενημέρωση σε ξεχωριστό χρονικό πλαίσιο) είναι αντίστοιχη με την διαδικασία που χρησιμοποιήθηκε για την ανεύρεση των backlinks όπως παρουσιάζεται εδώ.