はじめに

Odeuropa Explorer は、ヨーロッパの嗅覚遺産をデジタル化した興味深いプロジェクトです。EU の Horizon 2020 研究プログラムの助成を受け、歴史的な匂いの体験を横断的に検索・探索できるプラットフォームを提供しています。

このプロジェクトでは、匂いに関連する情報を以下の3つの主要なカテゴリで分類しています:

  • Smell sources : 匂いを発する物体や物質
  • Fragrant Spaces : 匂いに関連する場所や空間
  • Gestures and Allegories : 匂いに関する身振りや寓意的表現

本記事では、これらの語彙がどのような階層構造を持っているのか、Odeuropa vocabularies リポジトリで公開されている SKOS(Simple Knowledge Organization System)形式のデータを調査した結果を報告します。

調査方法

SKOS階層の可視化スクリプト

語彙の階層構造を理解するために、Node.js で SKOS Turtle ファイルを解析するスクリプトを作成しました。

iica}mmosppnycc$ccccf}f}cf}toosnoorooooouooorrtcnndn$Snnnrcci}ci}nivcccc}nri}pttssfGsrKBsssoofofPcfioooh)FsfLSftt.etdOuttt(nncncbi}nrtsnnniccp;it(te$fKuptfSicsGs(oGs(orfaiiisssloornc(ovrsOnsdac.(lbncotetlnetbnonrnovtttodnnidto!pedSctaraos'draontactrsa(artnielrssnonbLlfftotslnyCornsslbebotd!rosdlceetttapsreCr=iraelcmomarctupaepbraenrwhpi.ah.nHnLtovofooe(e(nadoebrbltrodbraoeirtabil.ipideaenrm$n=dcp'cpewpcjeesLoaerMrwreiedelofsrevcdlcor=aothesretoefl.aadroareMrnddldgoLerdeoeCem'dvftnstpMrLncLslbdesaporaat.(r(rafailnropffi$sacttfaMactaeeer.d.wMprHhc=e`EsirsCcMnt's.sr.,e=p'opabeb=nlrslesea.ciaon$atxcpoeacsr'Nudrp:)rpep=egsererpghesnc{chlnppe.d;aafests/)=ltlst.c=ntM.eyr(co=ih==yact.pffml.atst;b=scthsog=(astacenn((yehtoleigdowrnoooenstspe(rropcnd(iicpoasriszrFrrwoen=fnr>tcthbu.tbecnteaecnshttfs.Ebpeaieewawece(eorbh(rchcUprnhdLios(pa'aHpl,..dwnce.0spr>ojabouyertrtiealpccuc;cihemweMeopm)uteaesrar(piLo}lxsd-=ooshee(S'a3raMwntabs.0dc(odsct)aw$dt,lnnh((r)yht./pac.t{jm)etbaeioU;be{,=e[cc(c'a;ntcon(pMescear.rdrvnrerl=?iv]eecohrcthra)(apuhct{svoe)ecilMai=ne;ppontc(p(gr;)ptb(tc[aar.le)sabn'dlttnctht:n/r;(sjs.h0ld,pyp).pedces.cepyt/u1o))euv(]ueutg.lehnc)sep:(l/l9w;cbas.er[sUreg}xitoupt/tFel9e{tjluo,)]hrete`)ln{bt/tix,9r;eubb))(it(t)d'+cj.=wlla/cejjb;s,uc(;=rees>wFem0rt,eer{uroc>e:ppcuwi,p2e,ccobinnonrttbp.ll/llttajn;cn{.'es.jrwe'e2aSa,.dedeclfvei3)u.2tKbvecepeeiacn.to-iOeSartntpnxltto{frroSlKl).tUtg,u.Hr8gdn(sOu;vrUt'evig'/fs'[Sea=irh;n)ae/)'-hp0(;l)ie)lr2;,sir]'u;)-wua0ype.be'{er0'nsfor),1S)c4ttLbo;;e;h/eaajavty0xxbedi[((2t-eces]vc//nltri;iosts'.'tsnku#)v)eicort,a,dtestylep/lpnun=dtceeueu))o''l)ln))r))l;le;;e;,))w#;;'S)e;t()){

このスクリプトの主要な処理:

  1. RDFグラフの読み込み : rdflib を使用して Turtle 形式の語彙ファイルをパース
  2. 階層関係の抽出 : skos:broaderskos:narrower の関係を Map オブジェクトで管理
  3. トップレベル概念の特定 : skos:broader を持たない概念を検出
  4. 再帰的な階層表示 : ツリー構造で視覚的に表現

実行方法

3つの語彙すべてに対してスクリプトを実行しました:

#n#n#noooSdFdGdmereeeeaslvgvtvliriuisasrssunueuoatasaulllriSiaiczpznzeeaedes-c--hehAhisilieelerreraagarrorccrchhihyyey..s.jjjsssofolrlfafagacrctatonortry-y-s-opgbaejcseetcsut.rste.tstl.ttl>tl>hi>oelrofalarfccathcoytr-oyfr-ryoa-bggjreeascntttus-r-sehpsia-echreiaser-rc2ah0ry2c.5ht1yx0.t1t0x-t231358.txt

調査結果

1. Smell sources(匂いの発生源)

:6:85::41737

階層の深さの分布:

  • Level 0(トップレベル): 13 概念
  • Level 1: 383 概念
  • Level 2: 202 概念
  • Level 3: 42 概念
  • Level 4: 45 概念

トップレベルのカテゴリ:

AABBEFFFFMNPRbreolloruaarestideooamttoltenymrdgetudirfgearserugaa(n(arecicc(t(n(tottc((n)()e((())(/)))))C))o)smetic()

特徴的な深い階層構造の例:

Being (生物) の階層(クリックで展開)
BeingKOPTanei(dyre5acsr5vhoMW(ÄBBDDFFHMMOPSWWZ5eanao(gsiirüeiuouiotiii)rnm1ecbganlsnssstirrb((a3shecglcdcketnbbe(35(n)terchehehlwkeCFGIMRSSSWeAKMRRVt2935rnaer(uReatlrlanuacnpolmaaeeok3794(a(tn7((satliluirssuhairtprmppga)))05n(1(665hteosenecpmidmihkmttet)4d44((9)85i((rstCLgekACDGMMVheeleeiFaaAABBBCDEFFGHHHKLLMMPRRSSSTWZiLSilEHTz1e2)558))r(31araeltnorraoeetr(rbrslnreouaeleouaaeüeioofaaccqioilinlnuae)t876)s185((cannetcaagttl(t(5eiostmaalmeerxiuudhoonuebthhugleezae(thue)1)c07314ebg(ogsghi4e4(4age(iarrlerprnssgepnksrbawiefgak/4enb(r)h2))46au((4(oosov(6r852(4ldelhe(eekeaeedi(ferre(reA6ne4))64n(s4474nnht(e47l82)4(((8oi((n(at5asah(r(yet5ir(n4dm1(n5())4t6719fo5r6)i)654540pl55(5n9eto1d5(0(ne(5b7(p)(1)W1(8e80)0(lp(25n)9726)il18(50t(4plzg90(5((01el51o8(5h59(a039)))5yp65()g)940no441035)ie0(24015)913c)51i741l14)(1e0)3)))a))98)(9g(()5)99803((2)k06b8)9)348(r19(e(1)534(519)91)16)6)i)5()6)4)845)9)(6495)))80()a)599()6(805369)861))15651)1)2)))9()0)8)0)2440))7))7)
Flora (植物) の階層(クリックで展開)
FloraAAAABBBBB(cklläeell(aegourrou5claemgrsm6ieeeABCEEHKLLMNUWaysOeACCEGGHM0ai(kaoiuoaioyilamorngahpaeia))e(6(arncclmnrrtmco(maalrilrbrfn552zkihazpdbtreht6n(plydabiia420ifCelLOSfeeeeo7(g7aasenesgr(3)0e(eey(iuaee(l(55e2nantrcon9))6rd(p4gdnr(r(p6d6)5)tLndhaule1(2a2t7nd22l1e67bhitrusds)25(rC1u6u(e(0(3a)r8)lulhus(i2)3e8s)m3l2124nb)osyem5((a15(d)9h4)3)tesm(966n)8Va(A6o)2es((u(5708a)ir3q)l)(ro55m59)04r5uz4em7895))(g(5i095(1)2iL)l(2(())5)3nea2)2589ibe0356)aa211))n()))o4(n23)65)9()360)

興味深い点:

  1. 最も深い階層構造 : 最大深度4で、3つの語彙の中で最も複雑な階層を持っています
  2. 13のトップレベルカテゴリ : Abstract、Artefact、Being、Body、Element、Flora、Food、Fragrance/Cosmetic、Fumes、Matter、Nature、Product、Religion という体系的な分類
  3. 圧倒的な規模 : 685概念は他の2つの語彙(138と36)を大きく上回ります
  4. 生物分類学的アプローチ : Being(生物)や Flora(植物)は、科学的分類に近い詳細な階層構造を持っています
  5. 文化と科学の融合 : 宗教的概念から化学物質まで、幅広い知識ドメインをカバーしています
  6. 人工物の詳細分類 : Artefact カテゴリには香水瓶、宝飾品、喫煙具など、匂いに関連する多様な人工物が含まれます

2. Fragrant Spaces(香りのある場所)

:1:38::29213

階層の深さの分布:

  • Level 0(トップレベル): 91 概念
  • Level 1: 44 概念
  • Level 2: 3 概念

全階層構造:

クリックして全138概念を表示
AAABBBBBBBBBBCCCDFFFGGGGHHHHHJJKKKKKKLLLLLLLMMMMMMNOPPPPPPPPPRRRRSSSSSSSSSSSSSSTTTTTTVWWWWWnrraaaalrrruuhooiaaiaerraaeooaaaaaerüaaaaiiiaeeiouufalllorruueoouccehllottttttwaehooriaaaaiaacdklueaeoiriaulbcerwaonylttgifnnlacbknubmmradsusrfraaeniibbsopnhhaoauaaäarruaneebwolllrsgtbaeeleauntlgmlnlrtltävcdsl-edlfaalnhoeenrekkditnesiaccadnsltmelopumpdltaedmnraanpldkehoidhrrPcenhdHntFiiCCFPSTVodeBFTcLOeeithlsellekHePRrAdaitAFMochtuecdeeCKMMSsto(iaKBBLRSTrfao(OTgtNlPinSeDpMPSegtciaWmhsmaiay(nohreeio(eWrigkahaauoirnoeehiryrca(oz(eireooial((rrKlniawaaamreihiooyu(n1cua(aeiepoyacl9c(oh(weeeodhtifsaowrrrc(cg(aüohhiau3huierlnu8yayeececsgbnihtnasmaayrc1u(e1h(sns(octc14yyin(isrluiys(oarnsnr1s0rn1ddvfeich3e1kt6o(innorarlayueo1e1lhuooc(s()olniegs)gsln(amttaaeeo(achonrak0s1n3a1a(hp3rhoh30l4mck(fn((e1fpcaqae3h(0Bat1erieil(tt()a0oe2r1g(s(r(trasdmb2(9dlsupa1(1ftgi(eAO(oidHc2oiorrcgss2negangd(f1e3e7u1t1ai7re2)p(n(5aht4ge5(52ehsug3o5)ani7zoncse8of1n7r)k4h6i(5e6mnhep(e(s61()beesl01(0r(8(pl1ndae3crycap7idauae2t()8)s)i2ut)kkym)l99)lmh8an(4p2(1wleteof)p6ttn)iogtet0re0)(s)b3o1)4rdlr61p)27re(9155(yf6(21(ad3e(y)fayforai)crsir(81()(o)saiiia5(9aa)r4)l)1)oega)hemmos)yl4(1ho)n2()o(a(8(0i73a((7t)08)2i)1)26r0(1f(al-fantagdai7)p133(nltt(sc)4)mrld(9a0r((r(ui((mrra(d)51o(us01a6pn(6)92n))n24(0h))5fe799tH)1(2i1ciacffdalae(e7l5343(cc1te2akle1)n8s13y8er1(9(e(oya1(19u8rs)2d0od974)nd117)e)al)))mo118e1tinctaalrn2()a)))6(3whh3')rten8t)h3590521r1ol29())s5ht5)l6))i))5ardeu32)l4onttoccmgd94(c)92aee6s(k)si1)()((69)61m(477e)oa)(d()n()tmns)2d)rdeortti(ae()34e8)rnn)9e((()p)187)))(11())6ol1e4g2r(te)yurryool7rn7)4)dw)t2483894)(31)(dl0r70e(7(siyrrl8d2)(((o667((4)))15563s)w)5)((3(to(yys)e()3(33r()))55)1))1(()o(71801rr(6n81798k2032)11(r8)16)0y55((i1)4))s))))216k38))(5)79n())h366s))(2)108o)))h14))l4po3)a)p)n(d1(s)9c1a)pe(22)

特徴的な階層構造のハイライト:

FGPBaalubrairtcliCCFPSTVeBFTeCKMMSdHkahaauoinoeehiooyiocecsgbntnaoarnsnnu(amttaae(acfpcaqagsoiorrcgnegehsugeAOcrycaidawleteo(pl)fayfor)croeg(adal-faagdr((r(urciacfflaesye))tHtinctaarnhmoonttoccgdi)((eurdeorttae(p))nsyurryoorntesiyrrd((to(yye())((rr(ny(()(()()))))))))))

興味深い点:

  1. 多言語性 : ドイツ語(Fabrik, Garten, Wald)と英語が混在しており、ヨーロッパ多言語プロジェクトの特性が表れています
  2. 比較的フラットな構造 : 最大深度が2と浅く、ほとんどの概念がトップレベルまたは1階層下にあります
  3. 場所の多様性 : 工場、市場、宗教施設、自然環境など、匂いに関連する場所が網羅的にカバーされています
  4. 産業施設の詳細分類 : 特に工場(Fabrik)は7つの専門的なサブカテゴリを持ち、産業革命期の匂いの重要性を示唆しています

3. Gestures and Allegories(身振りと寓意)

:3:6::1324

階層の深さの分布:

  • Level 0(トップレベル): 34 概念
  • Level 1: 2 概念

全階層構造:

クリックして全36概念を表示
#n#n#noooSdFdGdmereeeeaslvgvtvliriuisasrssunueuoatasaulllriSiaiczpznzeeaedes-c--hehAhisilieelerreraagarrorccrchhihyyey..s.jjjsssofolrlfafagacrctatonortry-y-s-opgbaejcseetcsut.rste.tstl.ttl>tl>hi>oelrofalarfccathcoytr-oyfr-ryoa-bggjreeascntttus-r-sehpsia-echreiaser-rc2ah0ry2c.5ht1yx0.t1t0x-t231358.txt

0

階層を持つ概念:

#n#n#noooSdFdGdmereeeeaslvgvtvliriuisasrssunueuoatasaulllriSiaiczpznzeeaedes-c--hehAhisilieelerreraagarrorccrchhihyyey..s.jjjsssofolrlfafagacrctatonortry-y-s-opgbaejcseetcsut.rste.tstl.ttl>tl>hi>oelrofalarfccathcoytr-oyfr-ryoa-bggjreeascntttus-r-sehpsia-echreiaser-rc2ah0ry2c.5ht1yx0.t1t0x-t231358.txt

1

主要な概念(カテゴリ別):

  • 鼻に関する身振り: Holding one’s nose(鼻をつまむ)、Hand towards the nose(鼻に手を当てる)
  • 衛生・清掃行為: Garbage collecting(ゴミ収集)、Street sweeping(道路清掃)、Washing(洗濯)
  • 医療行為: Examination of urine(尿検査)、Embalming(防腐処理)、Doctor sniffing cane(医師の嗅ぎ杖)
  • 宗教儀式: Burnt offering(燔祭)、Per fumum(薫煙による)
  • 日常行為: Eating(食事)、Smoking(喫煙)、Defecation(排泄)

興味深い点:

  1. ほぼフラットな構造 : 36概念中34がトップレベルで、階層化の必要性が低い語彙セットです
  2. 身体行為中心 : 多くが身体的なジェスチャーや行為に関連しています
  3. 医療と衛生 : 尿検査や薫煙消毒など、歴史的な医療・衛生慣習が含まれています
  4. 文化的多様性 : 宗教儀式から日常的な行為まで、幅広い文化的文脈をカバーしています

技術的考察

語彙間の比較

3つの語彙を比較すると、それぞれのドメインの特性が明確に表れています:

語彙総概念数トップレベル最大深度特徴
Smell sources685134体系的な分類、深い階層
Fragrant Spaces138912フラットな構造、場所の多様性
Gestures and Allegories36341ほぼフラット、独立した行為

規模の違いの意味:

  • Smell sources が圧倒的に大きいのは、匂いの発生源が非常に多様であることを示しています
  • Fragrant Spaces は中規模で、場所という具体的な概念を扱っています
  • Gestures and Allegories は最小ですが、文化的に重要な行為を厳選しています

階層の深さの意味:

  • 深い階層(Smell sources) : 自然分類(生物分類)や製品カテゴリなど、本質的に階層的な知識
  • 浅い階層(Fragrant Spaces、Gestures) : 場所や行為は比較的独立した概念として存在

SKOS の設計原則との整合性

今回調査した3つの語彙は、SKOS の設計原則に忠実な構造を持っています:

  1. 適切な階層の深さ : 最大深度1〜4と、各ドメインの性質に応じた階層の深さを採用
  2. broader/narrower 関係の明確性 : 各概念の上下関係が明確に定義されています
  3. トップレベル概念のバランス : Smell sources は13の体系的なカテゴリ、Fragrant Spaces は91の多様な場所、Gestures は34の独立した行為

データモデリングの特徴

3つの語彙の階層の深さの違いは、それぞれのドメインの性質を反映しています:

  • Smell sources(深度4) : 自然分類や製品階層など、本質的に階層的な知識体系
    • 例: Being → Tier → Wirbeltiere → Mammal → Lion
    • 例: Flora → Bäume → Holz → Sandelholz
  • Fragrant Spaces(深度2) : 場所の包含関係による浅い階層
    • 例: Building → House → Apartment
  • Gestures and Allegories(深度1) : 独立した行為として存在、階層化の必要性が低い
    • 例: Smelling → Piss smelling(数少ない階層の1つ)

実装上の工夫

スクリプト実装で特に重要だった点:

  1. 循環参照のチェック : visited Set を使用して無限ループを防止
  2. ラベルの取得 : skos:prefLabel がない場合の URI からのフォールバック
  3. ソート : アルファベット順でのソートにより、出力の一貫性を確保
  4. 統計情報 : 深度分布や子要素数の集計により、語彙の特性を定量的に把握

まとめ

Odeuropa Explorer の3つの語彙(Smell sources、Fragrant Spaces、Gestures and Allegories)の構造調査を通じて、以下のことがわかりました:

  1. ドメインに応じた設計 :

    • 匂いの発生源(685概念、深度4): 体系的な分類と深い階層
    • 香りのある場所(138概念、深度2): 適度な階層と多様性
    • 身振りと寓意(36概念、深度1): フラットな構造と独立性
  2. 文化的・歴史的豊かさ : ヨーロッパの嗅覚文化遺産の多様性が、合計859概念に凝縮されています

  3. 多言語性 : ドイツ語、英語、フランス語、ラテン語が混在し、ヨーロッパ横断プロジェクトの特性を体現

  4. 階層構造の柔軟性 : 自然分類から場所、行為まで、それぞれのドメインに最適な階層の深さを採用

  5. 実用性と学術性の両立 : 検索・探索に適したフラットな構造と、知識の体系化に必要な階層のバランス

このような語彙の階層構造を理解することで、デジタルヒューマニティーズにおける知識組織化の実践例を学ぶことができます。SKOS は学術研究だけでなく、文化遺産のデジタル化プロジェクトにおいても有効なツールであることが、3つの異なる性質を持つ語彙の分析から示されました。

参考リンク

調査データとコード

本調査で使用・生成したファイル:

分析対象

生成ファイル

  • visualize-hierarchy.js - SKOS 階層可視化スクリプト
  • olfactory-objects-hierarchy.txt - Smell sources の完全な階層出力(685概念)
  • hierarchy-fragrant-spaces-20251010-231358.txt - Fragrant Spaces の完全な階層出力(138概念)
  • olfactory-gestures-hierarchy.txt - Gestures and Allegories の完全な階層出力(36概念)