はじめに
Odeuropa(オデウロパ)は、ヨーロッパの歴史的文献から「匂い」に関する記述を抽出し、Linked Dataとして構造化したユニークなプロジェクトです。本記事では、SPARQLエンドポイントを通じて実際のデータを探索し、その構造と設計思想を明らかにしていきます。
Odeuropaとは
- プロジェクト名 : Odeuropa(Odeurs d’Europe = ヨーロッパの匂い)
- データベースURL : https://data.odeuropa.eu/
- SPARQLエンドポイント : https://data.odeuropa.eu/repositories/odeuropa
- Webインターフェース : https://explorer.odeuropa.eu/
データモデルの全体像
OdeuropaはCIDOC-CRM(文化遺産のための概念参照モデル)をベースに、匂いに特化した拡張オントロジーを使用しています。
主要な概念と関係性
重要なポイント:
- Fragment は直接的にEmission、Smell、Experienceを参照
- Object へはEmission経由でアクセス(Fragment → Emission → Object)
- Emission がObjectとSmellを因果的に接続する中心的な役割
実例で学ぶデータ構造
1810年にドイツで出版された農業書「Grundsätze der rationellen Landwirthschaft」(合理的農業の原理)を例に、データ構造を見ていきましょう。
1. Source(文献)
文献の基本情報を格納するエンティティです。
主要プロパティ:
rdfs:label: タイトルschema:author: 著者(Albrecht Daniel Thaer)schema:dateCreated: 作成年(1810)schema:inLanguage: 言語(de)schema:genre: ジャンル(Household texts & recipes)schema:locationCreated: 作成地P106_is_composed_of: 含まれるフラグメント
2. Fragment(テキスト断片)
匂いに関する記述を含むテキストの一部です。
テキストの意味:
「それら(粘土)は湿らせると滑りやすく、より伸縮性があり、粘土の匂いを発し 、乾燥すると固いが砕けやすい塊になる。」
主要プロパティ:
rdf:value: 実際のテキスト内容schema:position: 文献内の位置(4番目のフラグメント)P106_is_composed_of: 含まれる重要な単語(“Sie”, “Thongeruch”)P67_refers_to: 参照する概念(Emission, Smell, Experience)P165i_is_incorporated_in: 所属する文献(Source)
3. Emission(匂いの放出イベント)
匂いが発生する出来事を表します。EmissionはFragmentから参照され、ObjectとSmellを接続します 。
主要プロパティ:
F3_had_source: 匂いの発生源(Object “Sie”)F1_generated: 生成された匂い(Smell “Thongeruch”)P92_brought_into_existence: 存在させた匂いP12_occurred_in_the_presence_of: イベント時に存在していたもの(ObjectとSmell)time:hasTime: 発生時期(1810年)P67i_is_referred_to_by: このEmissionを参照しているFragment
Emissionの役割:
Emissionは「どのObject(発生源)が、どのSmell(匂い)を、いつ生成したか」という因果関係を表現する中心的なイベントです。
4. Object(匂いの発生源)
匂いを発する物体や物質です。ObjectはEmissionから参照されます 。
この例では、“Sie”(それら)という代名詞で粘土や土壌を指しています。
タイプ:
S10_Material_Substantial: 物質的実体S15_Observable_Entity: 観察可能な実体
主要プロパティ:
rdfs:label: オブジェクト名(“Sie”)P12i_was_present_at: このオブジェクトが存在していたイベント(Emission)
接続経路:
5. Smell(匂い)
匂いそのものを表す中心的な概念です。
主要プロパティ:
rdfs:label: 匂いの名称(Thongeruch = 粘土の匂い)P92i_was_brought_into_existence_by: この匂いを生成したEmissionP140i_was_attributed_by: この匂いを認識したExperience
6. Experience(匂いの体験イベント)
人間が匂いを知覚・体験する出来事です。
主要プロパティ:
F2_perceived: 知覚された匂いO8_observed: 観察された匂いP140_assigned_attribute_to: 属性が割り当てられた対象P14_carried_out_by: 体験者(Actor)
データの流れ:完全なストーリー
データフロー解説:
- Fragment が3つの概念(Emission、Smell、Experience)を直接参照
- Emission が因果関係の中心:
- Object(発生源)から
- Smell(匂い)を生成
- Experience がSmellを知覚
- Object はEmission経由でFragmentと間接的に接続
SPARQLクエリ実例
言語指定での検索
ドイツ語のラベルで検索する場合:
画像付きビジュアルアイテムの取得
複数の画像がある場合に重複を避ける:
0
匂いとその発生源を取得
1
使用されているオントロジー
CIDOC-CRM
E33_Linguistic_Object: 言語的オブジェクト(文献)E36_Visual_Item: 視覚的アイテムE39_Actor: 人物(著者、観察者)E53_Place: 場所E77_Persistent_Item: 持続的アイテムP67_refers_to: 参照するP106_is_composed_of: 構成されるP140_assigned_attribute_to: 属性を割り当てる
CRMsci(科学観察の拡張)
S10_Material_Substantial: 物質的実体S15_Observable_Entity: 観察可能な実体O8_observed: 観察した
Odeuropa独自の拡張
L12_Smell_Emission: 匂いの放出F1_generated: 生成したF2_perceived: 知覚したF3_had_source: 発生源を持つ
Schema.org
schema:author: 著者schema:dateCreated: 作成日schema:inLanguage: 言語schema:genre: ジャンルschema:image: 画像schema:position: 位置
プロジェクトの意義
Odeuropaプロジェクトは以下の点で画期的です:
- 感覚データのデジタル化 : 従来デジタル化が困難だった「匂い」という感覚情報を構造化
- 歴史研究への応用 : 過去の人々が何をどう匂いと感じていたかを分析可能に
- Linked Dataの実践 : CIDOC-CRMを用いた高度なセマンティックWeb技術の実装
- 学際的アプローチ : 歴史学、情報学、感覚研究の融合
まとめ
Odeuropaデータベースは、テキストマイニング、オントロジー設計、Linked Data技術を駆使して、歴史的文献から「匂い」という抽象的な概念を抽出・構造化した野心的なプロジェクトです。
CIDOC-CRMという確立された文化遺産オントロジーをベースにしながら、匂い特有の概念(Emission、Experience)を追加することで、再利用可能で拡張性の高いデータモデルを実現しています。
このようなアプローチは、他の感覚情報(音、味、触感など)のデジタル化にも応用可能であり、デジタルヒューマニティーズの新しい可能性を示しています。
参考リンク
- Odeuropa Explorer: https://explorer.odeuropa.eu/
- SPARQL Endpoint: https://data.odeuropa.eu/repositories/odeuropa
- CIDOC-CRM: http://www.cidoc-crm.org/
- 例として使用した文献: https://www.deutschestextarchiv.de/book/show/thaer_landwirthschaft02_1810