はじめに#
Odeuropa Explorer は、ヨーロッパの嗅覚遺産をデジタル化した興味深いプロジェクトです。EU の Horizon 2020 研究プログラムの助成を受け、歴史的な匂いの体験を横断的に検索・探索できるプラットフォームを提供しています。
このプロジェクトでは、匂いに関連する情報を以下の3つの主要なカテゴリで分類しています:
- Smell sources : 匂いを発する物体や物質
- Fragrant Spaces : 匂いに関連する場所や空間
- Gestures and Allegories : 匂いに関する身振りや寓意的表現
本記事では、これらの語彙がどのような階層構造を持っているのか、Odeuropa vocabularies リポジトリで公開されている SKOS(Simple Knowledge Organization System)形式のデータを調査した結果を報告します。
調査方法#
SKOS階層の可視化スクリプト#
語彙の階層構造を理解するために、Node.js で SKOS Turtle ファイルを解析するスクリプトを作成しました。
このスクリプトの主要な処理:
- RDFグラフの読み込み :
rdflib を使用して Turtle 形式の語彙ファイルをパース - 階層関係の抽出 :
skos:broader と skos:narrower の関係を Map オブジェクトで管理 - トップレベル概念の特定 :
skos:broader を持たない概念を検出 - 再帰的な階層表示 : ツリー構造で視覚的に表現
実行方法#
3つの語彙すべてに対してスクリプトを実行しました:
調査結果#
1. Smell sources(匂いの発生源)#
階層の深さの分布:
- Level 0(トップレベル): 13 概念
- Level 1: 383 概念
- Level 2: 202 概念
- Level 3: 42 概念
- Level 4: 45 概念
トップレベルのカテゴリ:
特徴的な深い階層構造の例:
Being (生物) の階層(クリックで展開)
Flora (植物) の階層(クリックで展開)
興味深い点:
- 最も深い階層構造 : 最大深度4で、3つの語彙の中で最も複雑な階層を持っています
- 13のトップレベルカテゴリ : Abstract、Artefact、Being、Body、Element、Flora、Food、Fragrance/Cosmetic、Fumes、Matter、Nature、Product、Religion という体系的な分類
- 圧倒的な規模 : 685概念は他の2つの語彙(138と36)を大きく上回ります
- 生物分類学的アプローチ : Being(生物)や Flora(植物)は、科学的分類に近い詳細な階層構造を持っています
- 文化と科学の融合 : 宗教的概念から化学物質まで、幅広い知識ドメインをカバーしています
- 人工物の詳細分類 : Artefact カテゴリには香水瓶、宝飾品、喫煙具など、匂いに関連する多様な人工物が含まれます
2. Fragrant Spaces(香りのある場所)#
階層の深さの分布:
- Level 0(トップレベル): 91 概念
- Level 1: 44 概念
- Level 2: 3 概念
全階層構造:
クリックして全138概念を表示
特徴的な階層構造のハイライト:
興味深い点:
- 多言語性 : ドイツ語(Fabrik, Garten, Wald)と英語が混在しており、ヨーロッパ多言語プロジェクトの特性が表れています
- 比較的フラットな構造 : 最大深度が2と浅く、ほとんどの概念がトップレベルまたは1階層下にあります
- 場所の多様性 : 工場、市場、宗教施設、自然環境など、匂いに関連する場所が網羅的にカバーされています
- 産業施設の詳細分類 : 特に工場(Fabrik)は7つの専門的なサブカテゴリを持ち、産業革命期の匂いの重要性を示唆しています
3. Gestures and Allegories(身振りと寓意)#
階層の深さの分布:
- Level 0(トップレベル): 34 概念
- Level 1: 2 概念
全階層構造:
クリックして全36概念を表示
0
階層を持つ概念:
1
主要な概念(カテゴリ別):
- 鼻に関する身振り: Holding one’s nose(鼻をつまむ)、Hand towards the nose(鼻に手を当てる)
- 衛生・清掃行為: Garbage collecting(ゴミ収集)、Street sweeping(道路清掃)、Washing(洗濯)
- 医療行為: Examination of urine(尿検査)、Embalming(防腐処理)、Doctor sniffing cane(医師の嗅ぎ杖)
- 宗教儀式: Burnt offering(燔祭)、Per fumum(薫煙による)
- 日常行為: Eating(食事)、Smoking(喫煙)、Defecation(排泄)
興味深い点:
- ほぼフラットな構造 : 36概念中34がトップレベルで、階層化の必要性が低い語彙セットです
- 身体行為中心 : 多くが身体的なジェスチャーや行為に関連しています
- 医療と衛生 : 尿検査や薫煙消毒など、歴史的な医療・衛生慣習が含まれています
- 文化的多様性 : 宗教儀式から日常的な行為まで、幅広い文化的文脈をカバーしています
技術的考察#
語彙間の比較#
3つの語彙を比較すると、それぞれのドメインの特性が明確に表れています:
| 語彙 | 総概念数 | トップレベル | 最大深度 | 特徴 |
|---|
| Smell sources | 685 | 13 | 4 | 体系的な分類、深い階層 |
| Fragrant Spaces | 138 | 91 | 2 | フラットな構造、場所の多様性 |
| Gestures and Allegories | 36 | 34 | 1 | ほぼフラット、独立した行為 |
規模の違いの意味:
- Smell sources が圧倒的に大きいのは、匂いの発生源が非常に多様であることを示しています
- Fragrant Spaces は中規模で、場所という具体的な概念を扱っています
- Gestures and Allegories は最小ですが、文化的に重要な行為を厳選しています
階層の深さの意味:
- 深い階層(Smell sources) : 自然分類(生物分類)や製品カテゴリなど、本質的に階層的な知識
- 浅い階層(Fragrant Spaces、Gestures) : 場所や行為は比較的独立した概念として存在
SKOS の設計原則との整合性#
今回調査した3つの語彙は、SKOS の設計原則に忠実な構造を持っています:
- 適切な階層の深さ : 最大深度1〜4と、各ドメインの性質に応じた階層の深さを採用
- broader/narrower 関係の明確性 : 各概念の上下関係が明確に定義されています
- トップレベル概念のバランス : Smell sources は13の体系的なカテゴリ、Fragrant Spaces は91の多様な場所、Gestures は34の独立した行為
データモデリングの特徴#
3つの語彙の階層の深さの違いは、それぞれのドメインの性質を反映しています:
- Smell sources(深度4) : 自然分類や製品階層など、本質的に階層的な知識体系
- 例: Being → Tier → Wirbeltiere → Mammal → Lion
- 例: Flora → Bäume → Holz → Sandelholz
- Fragrant Spaces(深度2) : 場所の包含関係による浅い階層
- 例: Building → House → Apartment
- Gestures and Allegories(深度1) : 独立した行為として存在、階層化の必要性が低い
- 例: Smelling → Piss smelling(数少ない階層の1つ)
実装上の工夫#
スクリプト実装で特に重要だった点:
- 循環参照のチェック :
visited Set を使用して無限ループを防止 - ラベルの取得 :
skos:prefLabel がない場合の URI からのフォールバック - ソート : アルファベット順でのソートにより、出力の一貫性を確保
- 統計情報 : 深度分布や子要素数の集計により、語彙の特性を定量的に把握
まとめ#
Odeuropa Explorer の3つの語彙(Smell sources、Fragrant Spaces、Gestures and Allegories)の構造調査を通じて、以下のことがわかりました:
ドメインに応じた設計 :
- 匂いの発生源(685概念、深度4): 体系的な分類と深い階層
- 香りのある場所(138概念、深度2): 適度な階層と多様性
- 身振りと寓意(36概念、深度1): フラットな構造と独立性
文化的・歴史的豊かさ : ヨーロッパの嗅覚文化遺産の多様性が、合計859概念に凝縮されています
多言語性 : ドイツ語、英語、フランス語、ラテン語が混在し、ヨーロッパ横断プロジェクトの特性を体現
階層構造の柔軟性 : 自然分類から場所、行為まで、それぞれのドメインに最適な階層の深さを採用
実用性と学術性の両立 : 検索・探索に適したフラットな構造と、知識の体系化に必要な階層のバランス
このような語彙の階層構造を理解することで、デジタルヒューマニティーズにおける知識組織化の実践例を学ぶことができます。SKOS は学術研究だけでなく、文化遺産のデジタル化プロジェクトにおいても有効なツールであることが、3つの異なる性質を持つ語彙の分析から示されました。
参考リンク#
調査データとコード#
本調査で使用・生成したファイル:
分析対象#
生成ファイル#
visualize-hierarchy.js - SKOS 階層可視化スクリプトolfactory-objects-hierarchy.txt - Smell sources の完全な階層出力(685概念)hierarchy-fragrant-spaces-20251010-231358.txt - Fragrant Spaces の完全な階層出力(138概念)olfactory-gestures-hierarchy.txt - Gestures and Allegories の完全な階層出力(36概念)