本書の目的

デジタルアーカイブは、文化遺産や学術資料、行政文書などの多様な資料をデジタル形式で記録・保存し、広く社会に公開・活用するための基盤です。近年、国内外でデジタルアーカイブの構築が急速に進んでおり、技術的な知識と実践的なノウハウの需要がかつてないほど高まっています。

筆者はこれまで、Omeka S、Archivematica、IIIF、TEI/XML、SPARQL、RDFなど、デジタルアーカイブに関連する多様な技術について実践的な記事を数多く執筆してきました。本書は、それらの経験と知見を体系的にまとめたものです。各章では、筆者が実際に試し、検証した技術やツールを中心に、デジタルアーカイブ構築の全体像を描きます。

本書は、デジタルアーカイブの設計思想から、メタデータ標準、デジタル化の実践、システム構築、公開、そして持続可能な運用までを一冊で体系的に学べる実践ガイドです。理論的な背景の説明にとどまらず、具体的な技術選定の判断材料や、実装に使えるコード例、設定例を豊富に掲載しています。さらに、各章の末尾には筆者の関連記事へのリンクを掲載していますので、より深い内容を知りたい方はそちらも参照してください。

対象読者

本書は、以下のような方々を主な対象読者として想定しています。

図書館・博物館・文書館の専門職員

所蔵資料のデジタルアーカイブ構築を検討している方、既存のデジタルアーカイブの改善や拡張を考えている方。技術的な背景を理解することで、ベンダーや開発者との協働をより効果的に行えるようになります。筆者が紹介してきたOmeka Sの導入事例やモジュール紹介が参考になるでしょう。

Webエンジニア・システム開発者

デジタルアーカイブシステムの開発・構築に携わる方。文化資料特有の要件や、メタデータ標準、長期保存の考え方を理解することで、適切なシステム設計が可能になります。DockerやAWSを活用した構築手法についても筆者の実践に基づいて解説します。

デジタルヒューマニティーズ研究者

人文学研究においてデジタルアーカイブを構築・活用する方。TEI/XMLによるテキストエンコーディングやIIIFによる画像配信、SPARQLによるLinked Dataの活用など、研究データの公開やデジタルコレクションの構築に必要な知識と技術を体系的に習得できます。

デジタルアーカイブに関心のある学生

図書館情報学、情報学、デジタルヒューマニティーズ、文化資源学などを学ぶ学生の方。デジタルアーカイブの全体像を把握し、卒業研究やプロジェクトに活用できるようになります。

本書で学べること

本書を読み終えた時点で、読者は以下のことができるようになります。

  • デジタルアーカイブの全体像を把握し、プロジェクトの計画を立案できる
  • 適切なメタデータスキーマ(Dublin Core、TEI、RDFなど)を選定・設計できる
  • OCRやIIIFを活用したデジタル化のワークフローを設計できる
  • Archivematicaを用いた長期保存戦略を策定できる
  • システムアーキテクチャを設計し、Omeka Sなどの適切なプラットフォームを選定できる
  • IIIF、OAI-PMH、SPARQLなどの相互運用技術を理解し、活用できる
  • 持続可能な運用体制を設計できる

本書の構成

本書は全12章で構成されており、デジタルアーカイブの構築プロセスに沿って段階的に進む構成になっています。

第I部: 基礎編(第1章〜第2章)

デジタルアーカイブの基本概念と、メタデータ標準の全体像を学びます。

  • 第1章「デジタルアーカイブとは」: 定義、歴史、国内外の動向
  • 第2章「メタデータ標準」: Dublin Core、TEI/XML、RDF、IIIF等の標準規格

第II部: デジタル化と保存編(第3章〜第5章)

資料のデジタル化から長期保存、検索基盤の構築までを学びます。

  • 第3章「デジタル化の実践」: 撮影・スキャン手法、画像フォーマット、OCR、TEI
  • 第4章「保存と長期保存」: OAISモデル、Archivematica、フォーマット戦略
  • 第5章「検索と発見」: 検索エンジン、ファセット検索、SPARQL、横断検索

第III部: 設計・構築編(第6章〜第9章)

システムの設計からプラットフォーム選定、API設計までを学びます。

  • 第6章「権利管理」: ライセンス、著作権、IIIFマニフェストでの権利表示
  • 第7章「システムアーキテクチャ」: Docker、AWS、サーバ構成
  • 第8章「プラットフォーム選定」: Omeka S、ArchivesSpace等の比較
  • 第9章「APIと相互運用性」: IIIF、OAI-PMH、SPARQL、REST API

第IV部: 運用・発展編(第10章〜第11章)

持続可能な運用と、参考リソースを紹介します。

  • 第10章「持続可能性と運用」: 運用体制、コスト管理、コミュニティ
  • 第11章「リソース集」: 筆者の関連記事リスト、参考文献、コミュニティ

前提知識

本書を効果的に読み進めるために、以下の基礎知識があると望ましいです。

  • Webの基礎知識: HTML、URLの構造、HTTPの基本的な仕組みを理解していること
  • JSONの読み書き: メタデータの記述にJSONを多用するため、JSONの構造を理解できること
  • コマンドラインの基本操作: サーバの構築手順でターミナル操作が必要になる場合があること

ただし、すべての技術トピックについて前提知識がなくても読み進められるよう、各章で必要な概念は丁寧に説明しています。

本書の読み方

各章は基本的に独立して読めるように構成していますが、デジタルアーカイブが初めての方は第1章から順に読み進めることをお勧めします。すでに特定の領域に知見がある方は、関心のある章から読み始めても構いません。

本書では、概念の説明だけでなく、具体的なメタデータの記述例やAPI呼び出しの例、設定ファイルの例を豊富に掲載しています。また、各章の末尾にある「関連記事」セクションから、筆者の個別記事にアクセスして、より詳細な手順や検証結果を確認できます。実際のプロジェクトで参照しながら使っていただくことを想定しています。

それでは、デジタルアーカイブの世界を一緒に探求していきましょう。