本書の振り返り
本書では、デジタルアーカイブの構築に必要な知識と技術を、筆者の実践経験に基づいて体系的に解説してきました。メタデータの設計(Dublin Core、TEI/XML、RDF)、デジタル化の実践(OCR、IIIF)、長期保存(Archivematica)、検索と発見(SPARQL、OAI-PMH)、システム構築(Omeka S、Docker、AWS)、そして相互運用性(IIIF、DTS、SPARQL)まで、デジタルアーカイブ構築の全体像をカバーしました。
本章では、本書の内容をさらに深めるための参考リソースと、筆者の関連記事のテーマ別リストを提供します。
筆者の関連記事:テーマ別リスト
Omeka S 入門・導入
- Omeka Sの導入に関する参考資料
- Omeka Sに関する記事まとめ
- Omeka ClassicとOmeka S: 機能と違いの比較(GPT-4による解説)
- Omeka S Docker の紹介:デジタルコレクションのための最新かつセキュアなソリューション
- Amazon Lightsailを用いたOmeka Sサイトの構築(独自ドメイン+SSL化を含む)
- Omeka Sの使い方を調べる
Omeka S IIIF関連
- 【Omeka Sモジュール紹介】IIIF Server / Image Server / Universal Viewer
- Omeka Sを用いて、IIIF Presentation API v3のマニフェストファイルを作成する
- 【Omeka S】IIIF対応の複数ビューアを設置する「IIIF Viewers」モジュールの使い方
- Omeka SのIIIF Serverモジュールを使用した階層構造を持つ目次の記述
- 【Omeka S】IIIF Serverモジュールにおけるattributionの設定方法
- Omeka S IIIF Serverモジュールを用いたIIIFコレクションの生成
- mdx.jpのオブジェクトストレージとCantaloupe Image Serverを使ってIIIF画像を配信する
Omeka S メタデータ・語彙
- Omeka SにDC-NDL(国立国会図書館ダブリンコアメタデータ記述)を語彙として登録する
- 【Omeka S Tips】既存の標準語彙の追加方法
- Omeka SにICA RiC-Oの語彙を登録する
- Omeka SにPROV-Oオントロジーを登録する方法
- Omeka SのCustomOntologyモジュールを使って、クラスやプロパティを追加する
Omeka S データ管理
- Omeka Sの一括登録用モジュール: Bulk Importの使い方(2024-02版)
- 【Omeka S モジュール紹介】BulkExport:データの一括エクスポート
- Omeka SのREST APIとやりとりするためのPythonパッケージ
- MCPサーバーを使って、Omeka Sにリソース(アイテムと画像)を登録する
Archivematica
- ArchivematicaをDockerで起動する
- Amazon EC2にArchivematicaを立てる
- ArchivematicaのAPIを用いて、TransferからAIPのダウンロードまでを行う。
- ArchivematicaでAmazon S3を処理対象およびAIPの保存先に設定する
- ArchivematicaのMETSファイルの内容を可視化するPythonライブラリ
TEI/XML
- WordをTEI/XMLに変換する
- TEI Garage APIを使って、DOCX → TEI/XML 変換ツールをブラウザだけで作った
- LEAF-Writerをローカル環境で動かす
- NDL古典籍OCR-Liteを用いて、IIIFマニフェストファイルからTEI/XMLファイルを作成する
- TEI/XMLファイルをGitHubで公開する手順書
- Romaを使ってプロジェクトに応じたタグを限定し、解説を作成する
- TEI ODDによるIIIF対応ファクシミリ記述の制約設計
- TEI Processing Modelで実現する宣言的なマルチフォーマット変換
SPARQL / RDF / Linked Data
- ジャパンサーチのSPARQLエンドポイントをYasguiで使ってみる
- Google Colabを用いたジャパンサーチRDFストアに対するSPARQLの実行例
- Snorql — 複数の SPARQL エンドポイントを手軽に探索できるブラウザ UI を公開しました
- AWS EC2を用いたVirtuoso RDFストアの構築
- Pythonを使ってRDFデータをDydraに登録する
- RDF、TurtleやJSON-LD、およびIIIFマニフェストファイルなどの関係を理解する
- Linked Dataを使ったデータ記述の応用例
OAI-PMH
- OAI-PMHリポジトリからPythonでレコードを全件取得する
- Omeka SのOAI-PMHリポジトリのresumptionTokenの不具合への対応
- ArchivesSpaceのOAI Repositoryを試す
- Access to MemoryのOAI Repositoryを試す
DTS(Distributed Text Services)
- DTS(Distributed Text Services)を使ってみる
- 校異源氏物語テキストDBで公開するTEI/XMLファイルに対するDTS APIを作成する
- DTS Viewerの更新:ページネーションへの対応
- DTSとCTSの関係
主要な仕様書・標準文書
IIIF関連
| 仕様 | URL |
|---|---|
| IIIF Image API 3.0 | https://iiif.io/api/image/3.0/ |
| IIIF Presentation API 3.0 | https://iiif.io/api/presentation/3.0/ |
| IIIF Content Search API 2.0 | https://iiif.io/api/search/2.0/ |
| IIIF Auth API 2.0 | https://iiif.io/api/auth/2.0/ |
| IIIF Change Discovery API 1.0 | https://iiif.io/api/discovery/1.0/ |
| IIIF Cookbook | https://iiif.io/api/cookbook/ |
メタデータ標準
| 標準 | URL |
|---|---|
| Dublin Core Terms | https://www.dublincore.org/specifications/dublin-core/dcmi-terms/ |
| TEI Guidelines | https://tei-c.org/release/doc/tei-p5-doc/en/html/ |
| Schema.org | https://schema.org/ |
| EAD3 | https://www.loc.gov/ead/ |
| PREMIS | https://www.loc.gov/standards/premis/ |
| METS | https://www.loc.gov/standards/mets/ |
Web標準
ソフトウェア・ツール
デジタルアーカイブプラットフォーム
| ソフトウェア | 用途 | URL |
|---|---|---|
| Omeka S | デジタルコレクション管理・公開 | https://omeka.org/s/ |
| ArchivesSpace | アーカイブズ管理 | https://archivesspace.org/ |
| CollectiveAccess | 博物館コレクション管理 | https://collectiveaccess.org/ |
| AtoM | アーカイブズ記述管理 | https://www.accesstomemory.org/ |
| Archivematica | デジタル保存システム | https://www.archivematica.org/ |
IIIF関連ツール
| ツール | 用途 | URL |
|---|---|---|
| Cantaloupe | IIIFイメージサーバ | https://cantaloupe-project.github.io/ |
| Mirador | IIIFビューア | https://projectmirador.org/ |
| Universal Viewer | IIIFビューア | https://universalviewer.io/ |
TEI関連ツール
| ツール | 用途 | URL |
|---|---|---|
| LEAF Writer | TEI/XMLエディタ | https://leaf-writer.lincsproject.ca/ |
| Oxygen XML Editor | XMLエディタ | https://www.oxygenxml.com/ |
| TEI Publisher | TEI/XML出版 | https://teipublisher.com/ |
| CETEIcean | TEI/XMLブラウザ表示 | https://github.com/TEIC/CETEIcean |
| Roma | TEI ODDカスタマイズ | https://roma.tei-c.org/ |
| TEI Garage | TEI変換サービス | https://teigarage.tei-c.org/ |
RDF/SPARQLツール
| ツール | 用途 | URL |
|---|---|---|
| Virtuoso | RDFストア | https://virtuoso.openlinksw.com/ |
| Apache Jena Fuseki | RDFストア | https://jena.apache.org/documentation/fuseki2/ |
| Dydra | クラウドRDFストア | https://dydra.com/ |
| Yasgui | SPARQLクライアント | https://yasgui.triply.cc/ |
コミュニティ
国内コミュニティ
- デジタルアーカイブ学会(JSDA): http://digitalarchivejapan.org/
- Code4Lib JAPAN: https://www.code4lib.jp/
- じんもんこん(人文科学とコンピュータ研究会): http://jinmoncom.jp/
- 日本デジタルヒューマニティーズ学会(JADH): https://www.jadh.org/
- TEI協議会: テキストエンコーディングに関する国際コミュニティ
国際コミュニティ
- IIIF Consortium: https://iiif.io/
- DLF(Digital Library Federation): https://www.diglib.org/
- ADHO(Alliance of Digital Humanities Organizations): https://adho.org/
- iPRES(International Conference on Digital Preservation): https://ipres-conference.org/
参考文献
書籍
- 時実象一『デジタルアーカイブの理論と政策』勁草書房、2022年
- 柳与志夫・田山健二編『デジタルアーカイブ・ベーシックス』勉誠出版、2019-2020年
- 永崎研宣『日本の文化をデジタル世界に伝える』樹村房、2019年
- 橋本雄太・永崎研宣編『デジタルヒューマニティーズ入門』文学通信、2021年
- Trevor Owens, “The Theory and Craft of Digital Preservation”, Johns Hopkins University Press, 2018
ガイドライン
- デジタルアーカイブジャパン推進委員会「デジタルアーカイブの構築・共有・活用ガイドライン」
- 国立国会図書館「資料デジタル化の手引」: https://www.ndl.go.jp/jp/preservation/digitization/
- FADGI(Federal Agencies Digital Guidelines Initiative): http://www.digitizationguidelines.gov/
- NDSA Levels of Digital Preservation: https://ndsa.org/publications/levels-of-digital-preservation/
おわりに
本書では、デジタルアーカイブの構築に必要な知識と技術を、筆者の実践経験に基づいて体系的に解説しました。
デジタルアーカイブの構築は、技術だけの問題ではありません。メタデータの設計には図書館情報学の知見が、テキストの構造化にはTEI/XMLの専門知識が、権利処理には法学の知見が必要です。多様な専門性を持つ人々が協働することで、優れたデジタルアーカイブが実現します。
本書で紹介した筆者の各記事には、本書で触れきれなかった具体的な手順やコード例、トラブルシューティングの情報が含まれています。実際のプロジェクトで困った際には、ぜひ個別の記事も参照してください。
本書が、デジタルアーカイブの構築に携わる皆さんの実践の一助となれば幸いです。デジタルアーカイブを通じて、文化遺産を次世代に伝え、新たな知の創造に貢献していきましょう。