メタデータとRDF語彙

Omeka Sのメタデータシステムは、RDF(Resource Description Framework)の語彙に基づいて設計されています。RDFはW3Cが策定したWebリソースの記述フレームワークであり、あらゆる情報を「主語(Subject)- 述語(Predicate)- 目的語(Object)」のトリプルで表現します。

Omeka Sにおけるメタデータ入力とは、実質的にRDFトリプルの作成にほかなりません。たとえば、あるアイテムに「タイトル: 源氏物語」というメタデータを付与することは、以下のRDFトリプルを作成することに対応します。

<http://example.com/items/1>dcterms:title""@ja.

この設計により、Omeka Sに登録されたデータは本質的にLinked Data互換であり、セマンティックWebの文脈で再利用可能な形で蓄積されます。

筆者は、標準語彙の追加方法について【Omeka S Tips】既存の標準語彙の追加方法で詳しく解説しています。また、特定の語彙のプロパティ一覧を取得する方法についてはOmeka Sの特定のvocabularyのプロパティ一覧を取得するで紹介しています。

デフォルトで利用できる語彙

Omeka Sには、インストール直後から以下の語彙が登録されています。

Dublin Core Terms(dcterms)

Dublin Core Metadata Terms は、最も広く使われるメタデータ語彙です。Omeka Sではこの語彙がデフォルトのメタデータフィールドとして使用されます。

プロパティラベル用途
dcterms:titleTitleタイトル、名称
dcterms:creatorCreator作成者、著者
dcterms:subjectSubject主題、キーワード
dcterms:descriptionDescription説明文、概要
dcterms:publisherPublisher出版者、発行者
dcterms:dateDate日付
dcterms:typeType資料種別
dcterms:identifierIdentifier識別子
dcterms:rightsRights権利情報
dcterms:spatialSpatial Coverage地理的範囲
dcterms:isPartOfIs Part Of上位資料

Dublin Core Termsには55のプロパティが定義されていますが、すべてを使う必要はありません。プロジェクトに必要なプロパティだけをリソーステンプレートで選択して使用します。

Bibliographic Ontology(bibo)

学術文献やドキュメントの記述に特化した語彙です。bibo:Documentbibo:Bookbibo:Articlebibo:Thesis などのクラスと、bibo:doibibo:isbn などのプロパティが含まれています。

Friend of a Friend(foaf)

人物や組織の記述に用いる語彙です。foaf:Personfoaf:Organization などのクラスと、foaf:namefoaf:homepage などのプロパティが定義されています。

カスタム語彙のインポート

デフォルトの語彙だけでは不十分な場合、カスタム語彙をRDFファイルからインポートできます。筆者はさまざまな語彙の登録について実践的な記事を執筆しています。

DC-NDL(国立国会図書館ダブリンコアメタデータ記述)の登録

日本のデジタルアーカイブでは、国立国会図書館が定義するDC-NDLメタデータ記述が広く使われています。筆者はOmeka SへのDC-NDL語彙の登録方法についてOmeka SにDC-NDL(国立国会図書館ダブリンコアメタデータ記述)を語彙として登録するで詳しく解説しています。

ICA RiC-Oの登録

アーカイブズ記述の国際標準であるICA RiC-O(Records in Contexts - Ontology)の登録についてはOmeka SにICA RiC-Oの語彙を登録するで解説しています。文書館や歴史資料のプロジェクトでは、この語彙の利用が有用です。

PROV-Oの登録

データの来歴(プロヴェナンス)を記述するためのW3C標準であるPROV-Oの登録についてはOmeka SにPROV-Oオントロジーを登録する方法で解説しています。RDFファイルの形式変換が必要な場合もあり、その際の手順も含めて紹介しています。

RDFデータの変換

語彙のインポートにあたって、RDFデータの形式変換が必要になることがあります。筆者はEASY RDFを用いてJSON-LDのデータをRDF/XMLやTurtleに変換してみるでEASY RDFライブラリを用いた変換方法を紹介しています。

CustomOntologyモジュールによる独自語彙の定義

プロジェクト固有の語彙を定義する場合、CustomOntologyモジュールを使うとOmeka Sの管理画面上から直接クラスやプロパティを作成できます。

筆者はOmeka SのCustomOntologyモジュールを使って、クラスやプロパティを追加するで使い方を詳しく解説しています。また、作成した語彙の更新方法についてはOmeka Sのカスタムオントロジーを用いて作成した語彙を更新するをご覧ください。

Data Type RDFモジュール

メタデータの値としてRDFデータ型を使用するためのモジュールについて、【Omeka S モジュール紹介】Data Type RDFで紹介しています。より厳密なLinked Data対応が必要な場合に有用です。

リソーステンプレート

リソーステンプレートは、アイテム登録時に使用するメタデータ入力フォームのテンプレートです。どのプロパティを、どの順序で、どのデータ型で入力するかを定義します。適切なテンプレートを設計することで、メタデータの一貫性と入力効率を大幅に向上させることができます。

テンプレート設計の例

以下は、古写真コレクション用のリソーステンプレートの設計例です。

プロパティラベルデータ型必須
dcterms:title写真タイトルTextはい
dcterms:creator撮影者Text / URIいいえ
dcterms:date撮影年月日Numeric:Timestampいいえ
dcterms:description内容説明Textいいえ
dcterms:spatial撮影場所Text / URIいいえ
dcterms:rights権利情報Text / URIはい
dcterms:identifier資料番号Textはい

Custom Vocabモジュール

Custom Vocabモジュールを使うと、プルダウンメニューから選択する形式の統制語彙を作成できます。入力の一貫性を確保するのに有効です。筆者は【Omeka S モジュール紹介】Custom Vocabで基本的な使い方を解説しています。

さらに、Custom Vocabを使って他のアイテムを関連づける方法についてはOmeka SのCustom Vocabモジュールを使って、他のアイテムを関連づけるで紹介しています。

Metadata Browseモジュール

メタデータの値からの検索リンクを自動的に付与するMetadata Browseモジュールについて、【Omeka S モジュール紹介】Metadata Browse:同じメタデータを持つアイテムを検索するリンクを付与するで解説しています。同じ作成者や同じ主題のアイテムを簡単に探せるようになります。

Numeric Data Typesモジュール

日付データに対する範囲検索を可能にするNumeric Data Typesモジュールについて、【Omeka S モジュール紹介】Numeric Data Types:日付データに対する範囲検索を可能にする、などで解説しています。日付型のメタデータが多いプロジェクトでは必須のモジュールです。

メタデータ設計のベストプラクティス

1. プロジェクト開始時に設計する

メタデータスキーマ(使用する語彙、プロパティ、テンプレート)は、データ入力を開始する前に設計します。後からスキーマを変更すると、既存データの修正が必要になる場合があります。

2. 既存の標準語彙を優先する

独自の語彙を定義する前に、Dublin Core、BIBO、DC-NDLなどの既存の標準語彙で表現できないか検討します。標準語彙を使うことで、他のシステムとの相互運用性が確保されます。

3. URI値を積極的に使う

作成者名や件名などのメタデータには、可能な限り典拠データベースのURIを使用します。テキスト値だけでは表記揺れが生じますが、URIを使えば一意に同定できます。

4. 言語タグを設定する

テキスト値には言語タグを付与します。多言語コレクションでは、@ja@en などのタグがメタデータの検索・表示の品質に影響します。

まとめ

本章では、Omeka SにおけるRDF語彙の概念、デフォルト語彙の概要、カスタム語彙のインポート方法(DC-NDL、RiC-O、PROV-Oなど)、リソーステンプレートの設計、関連モジュールについて解説しました。

適切な語彙の選択とテンプレートの設計は、デジタルコレクションの品質を大きく左右します。次章では、アイテムをグループ化するための「アイテムセット」について解説します。

関連記事