Концепция - Sergey303/RDF-Store-Polar-DB-Lab GitHub Wiki
Добро пожаловать в проект лаборатории RDF хранилища триплетов. Цель проекта - измерение качества решения задачи исследования технологии и методологии работы с RDF данными порядка миллиарда триплетов.
Задача состоит из нескольких подзадач. Для каждой подзадачи соответствует проект.
-
измерение производительности трансляции потока триплетов порядка миллиарда из RDF текстовых форматов.
-
измерения характеристик RDF хранилищ триплетов:
2.1) загрузка потока триплетов порядка миллиарда из транслируемого файла с данными,
2.2) загрузка потока триплетов порядка миллиарда из транслируемого SPARQL запроса.
2.3) множество случайных атомарных запросов каждого типа в отдельности.
2.4) множество атомарных запросов исполняемых при тестировании берлинскими SPARQL запросами из истории.
2.5) небольшие добавления в буфер и удаления, измерения слабой динамики.
- измерение характеристик SPARQL машины:
3.1) производительности трансляции SPARQL запросов.
3.2) корректности выполнения известных SPARQL запросов.
3.3) производительности выполнения SPARQL запросов различных типов на случайных параметрах.
-
Некоторые хранилища используют Таблицу имён, отдельная задача измерения таблицы имён.
-
Измерение индексов: пересоздание, добавление, поиск.
Подзадачи трансляции 1) и 3.1) требуют экспериментов с различными сгенерированными кодами, которые требуют внешних библиотек.Поэтому лучше вынести их в отдельный проект или даже репозиторий. А для остальных необходима одна и та же трансляция данных или запросов.
Все проекты требуют путь и директорию для хранения фалов баз данных, некоторые ещё и путь и директорию к файлам RDF данных.