IIIF Manifestから各巻の冒頭ページを抽出するツールを作成しました

はじめに

IIIF（International Image Interoperability Framework）を利用したデジタルアーカイブでは、複数巻や複数章で構成される資料を1つのManifestにまとめることがあります。このような場合、各巻・各章の冒頭ページへのリンクを作成したいというニーズがあります。

今回、IIIF Manifestから各巻（range/structure）のlabel と最初のCanvas URL を抽出するシンプルなWebツールを作成しました。

ツールURL : https://nakamura196.github.io/iiif-manifest-extractor/

GitHub : https://github.com/nakamura196/iiif-manifest-extractor

機能

複数のManifest URLを一括処理（1行に1つのURL）
各巻・各章のlabelと最初のCanvas URLを一覧表示
CSV/JSON形式でのエクスポート
処理進捗のリアルタイム表示

使い方

ツールを開く
Manifest URLをテキストエリアに入力（複数行可）
「抽出」ボタンをクリック
結果が表形式で表示される
必要に応じてCSV/JSONでダウンロード

サンプル

以下のManifest URLで動作を確認できます。複数URLを入力することで、一括処理の動作も確認できます。

国立国会図書館デジタルコレクション「校異源氏物語」:

これらのManifestは源氏物語の各帖（きりつほ、ははきゝ、うつせみ、わかむらさき…など）がstructuresに定義されており、各帖の冒頭ページを抽出できます。

2つのManifest URLを入力することで、複数のManifestを一括で処理し、結果をまとめてCSV出力できることを確認できます。

技術的な仕組み

IIIF Presentation API v2のstructures

IIIF Presentation API v2では、structuresプロパティを使って論理的な構造（目次）を定義できます。

本ツールでは、structures内の各rangeから：

label（巻名・章名など）
canvases配列の最初の要素（冒頭ページのCanvas URL）

を抽出しています。

フォールバック処理

structuresが存在しない場合は、sequences[0].canvasesの最初の要素を取得するフォールバック処理を実装しています。

制限事項

IIIF Presentation API v2のみ対応 : v3形式のManifest（itemsを使用するもの）には対応していません
CORS制限 : Manifestを提供するサーバーがCORSを許可している必要があります

実装

純粋なHTML/CSS/JavaScriptで構成されており、サーバーサイドの処理は不要です。GitHub Pagesで静的にホスティングしています。

主要な処理の流れ：

おわりに

このツールは、デジタルアーカイブにおける資料へのリンク作成作業を効率化するために作成しました。シンプルな構成のため、必要に応じてカスタマイズも容易です。

ご質問やフィードバックがあれば、GitHubのIssueでお知らせください。

はじめに#

機能#

使い方#

サンプル#

技術的な仕組み#

IIIF Presentation API v2のstructures#

フォールバック処理#

制限事項#

実装#

おわりに#

参考#