オープンデータプラグイン v0.7.0 - shirasagi/shirasagi GitHub Wiki
シラサギ公式サイト オープンデータプラグイン0.7.0リリース
オープンデータプラグインとは
近年、国内でもオープンデータの取組が進み、日本政府のデータカタログサイト、経済産業省がオープンデータを実践するために設置した試験サイト を初め、政府関連機関の統計情報ページ、各自治体のオープンデータカタログサイトなどが少しずつ立ち上がっています。
SHIRASAGI が持つ機能に加え、オープンデータプラグインは、オープンデータの取り組みを推進する機能として次の機能を提供します。
データカタログ
CSV、XML、PDF などのデータを登録する場として「データカタログ」という機能を提供します。 「データカタログ」では、「データセット」と呼ぶ「箱」を作り、「箱」の中に CSV ファイル、XML ファイルなどをいくつでも登録することが出来ます。 CSV ファイルや XML ファイルを総称して「リソース」と呼びます。
アプリマーケット
データ公開側からは、実際に活用(見える化)できるアプリによって、公開したデータが生きてきます。
アプリ開発側からは、せっかくアプリを作成しても公開する場がないという問題があります。
データ公開側とアプリ開発側の両者が Win-Win となるためには、「データカタログ」だけでなく、アプリ公開の場が必要です。 オープンデータプラグインはアプリ公開の場として「アプリマーケット」という機能を提供します。
アイデアボックス
データ提供者、アプリ開発者、利用者などその他第三者の意見や要望を登録する場として「アイデアボックス」という機能を提供します。 意見や要望を「アイデアボックス」に集約することで、漠然とした話にならず、具体的な事例について議論をすることができ、利用者間のコミュニケーションを推進します。
マイページ
Twitter や Facebook などのソーシャルアカウントを持っている人は、簡単にマイページからオープンデータサイトにログインすることができ、 ログインすることで、データやアプリの登録、アイデアの投稿ができるようになります。
CSV → RDF 変換
リソースに CSV ファイルがあれば、管理画面から RDF 変換を行うことができます。 RDF 変換を行うための画面遷移に従って、語彙などを選択していけば、 RDFファイルに変換され、自動的に「fuseki」に登録されます。
「fuseki」とは、Apache Jena から提供されているオープンソースで、 RDF ファイルを永続化し、RDF クエリ言語で検索することができる RDF データベースサービスです。
語彙管理機能
共通語彙と独自語彙の管理ができます。既に公開されている共通語彙などは、 ウェブ画面から手動で全て登録するのは大変なので、XMLあるいはRDFファイルからインポートする機能があります。
WebAPI
オープンデータプラグインは、日本人に使いやすい独自のオープンデータシステムではありますが、 データカタログサイトとしてガラパゴス化しないように、CKAN 互換APIを提供しています。 これにより、外部からのデータセット一覧、グループ一覧などの取得を可能にします。
SPARQLエンドポイント
外部からRDFクエリを送ることで、RDF形式で登録されているオープンデータに対して複雑な条件でデータを取得できます。データカタログサイトで、RDFファイルを登録しますと、自動的に「fuseki」に登録されるようになっています。
クローリング
インターネット上に公開されているファイルを選択して、オープンデータとして取り込むことができます。 一度取り込んだファイルについては、1日1回タイムスタンプをチェックして、元ファイルが更新されたかを確認します。更新されていた場合に、自動で更新するか、手動で更新するかは、個別に設定できます。
プラットフォーム
- ruby 2.2.2
- rails 4.2.1
- mongodb 3.0
SHIRASAGI 0.7.0 と同じプラットフォームで動作します。