第4回RDF講習会 実習資料(1)

Virtuosoのインストール


RDF データを作って SPARQL による検索を行うためにはトリプルストアにデータをインポートする必要があります。自分の RDF データを検証したりアプリケーション開発するためにも、SPARQL エンドポイントを公開するためにも、トリプルストアの運用方法を理解しておくことは大切です。ここではよく使われている Virtuoso を例にインストール方法を紹介します。Virtuoso のオープンソース版はバイナリパッケージでも提供されているため、これらを使うのが手っ取り早いですが、ソースコードからビルドするのもそれほど難しくはありません。

TL;DR

  • Virtuoso の GitHub にある release からバイナリパッケージをダウンロードしてインストールすればすぐに使えるようになります
  • Virtuoso を起動すると http://localhost:8890/ から管理画面にアクセスでき、ウェブ上で RDF ファイルのロードや SPARQL 検索の実行ができます
  • 本格的に運用するには virtuoso.ini ファイルを編集してパラメータの調整を行うほか、管理画面から CORS や SERVICE などのオプションを有効にすべきです
  • SPARQL エンドポイントの公開にはフロントの httpd の運用に関する一般的な知識があるとよく、SPARQL-proxy の利用も検討するとよいでしょう
  • サーバでの運用(起動・停止、大量データのロード・削除など)には virtuoso.sh を使うと便利です


Docker による Virtuoso の運用

今回は説明しませんが、Docker 環境が使える場合は Virtuoso を仮想環境で動かすこともできます、ということを先にお伝えしておきます。

% docker pull openlink/virtuoso-opensource-7:latest

Docker compose の例:
version: '3'
services:
  virtuoso:
    image: openlink/virtuoso-opensource-7:latest
    container_name: virtuoso-opensource
    environment:
      DBA_PASSWORD: "dba"
      VIRT_Parameters_DirsAllowed: "., ../vad, /database"
    ports:
      - 48890:8890
      - 41111:1111 
    user: ${UID:-0}:${GID:-0}
    volumes:
      - ${PWD}/data:/database


バイナリパッケージのダウンロード


今回は現時点での最新リリース v7.2.5.1 のパッケージを利用します。


  • Linux: virtuoso-opensource.x86_64-generic_glibc25-linux-gnu.tar.gz
  • Mac: virtuoso-opensource-7.2.5-macosx-app.dmg
  • Windows: Virtuoso_OpenSource_Server_7.20.x64.exe
  • Source: v7.5.2.1.tar.gz