リソース集

本章について

本章では、SPARQL・Linked Open Dataの学習をさらに深めるためのリソースをまとめます。主要なSPARQLエンドポイント、学習教材、ツール、コミュニティ情報を紹介するとともに、筆者のこれまでの関連記事を体系的に整理します。

主要なSPARQLエンドポイント一覧

国際的なエンドポイント

データセット	SPARQLエンドポイント	概要
Wikidata	https://query.wikidata.org/sparql	ウィキメディアの自由な知識ベース
DBpedia	https://dbpedia.org/sparql	Wikipediaから抽出した構造化データ
DBpedia Japanese	https://ja.dbpedia.org/sparql	日本語版DBpedia
Europeana	https://sparql.europeana.eu/	欧州デジタル文化遺産ポータル
Getty Vocabularies	http://vocab.getty.edu/sparql	ゲティ美術用語シソーラス
British Museum	https://collection.britishmuseum.org/sparql	大英博物館コレクション
UniProt	https://sparql.uniprot.org/sparql	タンパク質配列データベース

日本国内のエンドポイント

データセット	SPARQLエンドポイント	概要
ジャパンサーチ	https://jpsearch.go.jp/rdf/sparql/	日本の文化資源統合ポータル
国立国会図書館	https://id.ndl.go.jp/auth/ndla	NDL典拠データ
CiNii Research	https://cir.nii.ac.jp/sparql	学術情報データベース
DBpedia Japanese	https://ja.dbpedia.org/sparql	日本語Wikipedia構造化データ

筆者は、これらのエンドポイントの多くを実際に利用してきました。Snorqlを使えば複数のエンドポイントを素早く切り替えて探索できます。詳しくはSnorql — 複数の SPARQL エンドポイントを手軽に探索できるブラウザ UI を公開しましたをご覧ください。

エンドポイントの利用上の注意

SPARQLエンドポイントを利用する際は、以下の点に注意してください。

レート制限: 短時間に大量のクエリを送信するとアクセスが制限される場合がある
タイムアウト: 複雑なクエリはLIMIT を適切に設定する
利用規約: 各エンドポイントの利用規約を事前に確認する
安定性: 実験的に公開されているエンドポイントは予告なく停止する場合がある

ツール

SPARQLエディタ・クライアント

ツール	種別	概要
Wikidata Query Service	Web	Wikidata公式のクエリエディタ。可視化機能が充実
YASGUI	Web/ライブラリ	SPARQLエディタのWebコンポーネント。多くのエンドポイントで採用
Snorql	Web	複数のSPARQLエンドポイントを切り替えて探索できるUI
SPARQLWrapper	Pythonライブラリ	PythonからSPARQLエンドポイントにアクセスするためのライブラリ

筆者は以下の記事でこれらのツールの活用方法を紹介しています。

トリプルストア

ツール	ライセンス	概要
Apache Jena Fuseki	Apache 2.0	Javaベース。入門・中規模に適する
OpenLink Virtuoso	GPLv2（OSE版）	高性能。DBpediaで採用
GraphDB	Free版あり	推論エンジン搭載。企業向け
Dydra	クラウドサービス	サーバ構築不要のクラウド型
AllegroGraph	商用（Free版あり）	大規模データ対応

筆者の各トリプルストアに関する記事は以下のとおりです。

RDFデータ処理ツール

ツール	概要
rdflib（Python）	PythonでRDFデータを操作するための標準ライブラリ
Apache Jena	Javaベースの RDFフレームワーク
EASY RDF	RDFフォーマットの変換ライブラリ
rapper（Raptor）	RDFフォーマットの変換ツール
JSON-LD Playground	JSON-LDの記述をインタラクティブに検証

筆者はEASY RDFを用いてJSON-LDのデータをRDF/XMLやTurtleに変換してみるで、EASY RDFを使った形式変換を紹介しています。

データ変換・作成ツール

ツール/手法	概要
OpenRefine + RDF Extension	CSVやExcelデータをRDFに変換するGUIツール
rdflib + Python	PythonスクリプトでCSV/ExcelからRDFを生成
grlc	SPARQLクエリをGitHub経由でREST APIとして公開
vsdx2rdf	VisioファイルからRDFを生成するライブラリ

筆者の関連記事は以下のとおりです。

可視化ツール

ツール	概要
Wikidata Query Service	組み込みの可視化機能
D3.js	JavaScriptのデータ可視化ライブラリ
Leaflet	JavaScriptの地図ライブラリ
Peripleo	Linked Dataの地理空間可視化
matplotlib / folium	Pythonの可視化ライブラリ

筆者はPeripleoを試すで地理空間データの可視化を、「ARC2によるRDFグラフの視覚化」をPythonで利用するでRDFグラフの構造可視化を紹介しています。

バリデーションツール

ツール	概要
pySHACL	PythonのSHACLバリデーションライブラリ
Apache Jena SHACL	JenaのSHACLバリデーター

筆者は以下の記事でバリデーションに関する知見を共有しています。

語彙・プラットフォーム関連

Omeka S

Omeka Sはデジタルアーカイブ構築プラットフォームであり、RDFの語彙に基づいたメタデータ管理が可能です。筆者は以下の記事でOmeka Sの活用方法を紹介しています。

Wikibase

Wikidataと同じソフトウェア基盤を使って自前のナレッジベースを構築できるWikibaseに関する記事は以下のとおりです。

学習リソース

公式仕様書・ドキュメント

リソース	URL	概要
SPARQL 1.1 Query Language	https://www.w3.org/TR/sparql11-query/	W3C標準SPARQLクエリ言語仕様
RDF 1.1 Concepts	https://www.w3.org/TR/rdf11-concepts/	RDFの概念と抽象構文
RDF 1.1 Turtle	https://www.w3.org/TR/turtle/	Turtle構文の仕様
JSON-LD 1.1	https://www.w3.org/TR/json-ld11/	JSON-LDの仕様
SHACL	https://www.w3.org/TR/shacl/	シェイプ制約言語の仕様
Wikidata SPARQL Tutorial	https://www.wikidata.org/wiki/Wikidata:SPARQL_tutorial	Wikidata公式SPARQLチュートリアル

Wikidata Query Serviceの例題集

Wikidata Query Serviceには、コミュニティが作成した豊富な例題が用意されています。

https://www.wikidata.org/wiki/Wikidata:SPARQL_query_service/queries/examples

主要な語彙・オントロジー一覧

語彙	プレフィックス	URI	用途
RDF	`rdf:`	http://www.w3.org/1999/02/22-rdf-syntax-ns#	RDFの基本語彙
RDFS	`rdfs:`	http://www.w3.org/2000/01/rdf-schema#	RDFスキーマ
OWL	`owl:`	http://www.w3.org/2002/07/owl#	Web Ontology Language
XSD	`xsd:`	http://www.w3.org/2001/XMLSchema#	データ型定義
Dublin Core Terms	`dcterms:`	http://purl.org/dc/terms/	メタデータ記述
FOAF	`foaf:`	http://xmlns.com/foaf/0.1/	人物・関係の記述
Schema.org	`schema:`	http://schema.org/	Web全般の構造化データ
SKOS	`skos:`	http://www.w3.org/2004/02/skos/core#	知識組織化体系
SHACL	`sh:`	http://www.w3.org/ns/shacl#	データバリデーション
VoID	`void:`	http://rdfs.org/ns/void#	データセット記述
PROV-O	`prov:`	http://www.w3.org/ns/prov#	来歴（Provenance）記述
BIBO	`bibo:`	http://purl.org/ontology/bibo/	書誌情報
DCAT	`dcat:`	http://www.w3.org/ns/dcat#	データカタログ

プレフィックスの検索にはprefix.ccを利用するで紹介しているprefix.ccが便利です。

コミュニティ

国際コミュニティ

W3C: Web標準の策定元。RDF、SPARQL、OWL等の仕様を管理
Wikidata コミュニティ: Wikidataのデータ品質向上やツール開発に取り組む国際コミュニティ
LOD Cloud: LODデータセットの登録・管理を行うプロジェクト

日本国内のコミュニティ

LODチャレンジ: 日本のLinked Open Dataの普及・推進を目的としたコンテスト
Code4Lib JAPAN: 図書館とテクノロジーのコミュニティ
デジタルアーカイブ学会: デジタルアーカイブの研究・実践に関する学会
ジャパンサーチ利活用スキーマ: ジャパンサーチのデータ利活用に関する技術情報

筆者の全関連記事一覧

最後に、本書で参照した筆者の記事を分野別に整理します。

SPARQL・クエリ関連

RDF・データ変換関連

Wikidata関連

ジャパンサーチ関連

トリプルストア関連

データモデリング・バリデーション関連

可視化関連

LODデータセット活用

Omeka S関連

おわりに

本書では、Linked Open Dataの概念からRDFのデータモデル、SPARQLクエリの基礎と応用、Wikidataやジャパンサーチの実践的な活用、データモデリングとLOD公開、そしてデータの可視化まで、幅広いトピックを体系的に学んできました。

各章で紹介した筆者の記事は、本書の内容をさらに掘り下げた具体的な手順やトラブルシューティングの知見を提供しています。本書で基礎を身につけた上で、関心のあるトピックについては各記事もぜひ参照してください。

SPARQLとLinked Open Dataは、Web上に分散する膨大なデータを統合的に活用するための強力な基盤技術です。Wikidataだけでも1億を超えるアイテムが登録されており、ジャパンサーチを通じて日本の文化資源にもSPARQLでアクセスできます。

本書で学んだ知識と技術を活用して、データの検索・分析・可視化・公開に取り組んでいただければ幸いです。Linked Open Dataの世界は日々拡大しており、新しいデータセットやツールが次々と登場しています。ぜひコミュニティにも参加し、LODエコシステムの発展に貢献していきましょう。

本章について#

主要なSPARQLエンドポイント一覧#

国際的なエンドポイント#

日本国内のエンドポイント#

エンドポイントの利用上の注意#

ツール#

SPARQLエディタ・クライアント#

トリプルストア#

RDFデータ処理ツール#

データ変換・作成ツール#

可視化ツール#

バリデーションツール#

語彙・プラットフォーム関連#

Omeka S#

Wikibase#

学習リソース#

公式仕様書・ドキュメント#

Wikidata Query Serviceの例題集#

主要な語彙・オントロジー一覧#

コミュニティ#

国際コミュニティ#

日本国内のコミュニティ#

筆者の全関連記事一覧#

SPARQL・クエリ関連#

RDF・データ変換関連#

Wikidata関連#

ジャパンサーチ関連#

トリプルストア関連#

データモデリング・バリデーション関連#

可視化関連#

LODデータセット活用#

Omeka S関連#

おわりに#