Концепция - Sergey303/RDF-Store-Polar-DB-Lab GitHub Wiki

Добро пожаловать в проект лаборатории RDF хранилища триплетов. Цель проекта - измерение качества решения задачи исследования технологии и методологии работы с RDF данными порядка миллиарда триплетов.

Задача состоит из нескольких подзадач. Для каждой подзадачи соответствует проект.

  1. измерение производительности трансляции потока триплетов порядка миллиарда из RDF текстовых форматов.

  2. измерения характеристик RDF хранилищ триплетов:

2.1) загрузка потока триплетов порядка миллиарда из транслируемого файла с данными,

2.2) загрузка потока триплетов порядка миллиарда из транслируемого SPARQL запроса.

2.3) множество случайных атомарных запросов каждого типа в отдельности.

2.4) множество атомарных запросов исполняемых при тестировании берлинскими SPARQL запросами из истории.

2.5) небольшие добавления в буфер и удаления, измерения слабой динамики.

  1. измерение характеристик SPARQL машины:

3.1) производительности трансляции SPARQL запросов.

3.2) корректности выполнения известных SPARQL запросов.

3.3) производительности выполнения SPARQL запросов различных типов на случайных параметрах.

  1. Некоторые хранилища используют Таблицу имён, отдельная задача измерения таблицы имён.

  2. Измерение индексов: пересоздание, добавление, поиск.

Подзадачи трансляции 1) и 3.1) требуют экспериментов с различными сгенерированными кодами, которые требуют внешних библиотек.Поэтому лучше вынести их в отдельный проект или даже репозиторий. А для остальных необходима одна и та же трансляция данных или запросов.

Все проекты требуют путь и директорию для хранения фалов баз данных, некоторые ещё и путь и директорию к файлам RDF данных.