IIIFを用いたAudio/Visual資料の記述について、複数のvttファイルを記述する方法に関する備忘録です。
ここでは、以下のように、日英の文字起こしテキストを記述します。
https://ramp.avalonmediasystem.org/?iiif-content=https://nakamura196.github.io/ramp_data/demo/3571280/manifest.json


マニフェストファイルの記述#
以下に例を格納しています。
https://github.com/nakamura196/ramp_data/blob/main/docs/demo/3571280/manifest.json
以下の記事も参考にしてください。
具体的には、以下のように複数のアノテーションとして記述することで、rampビューアによって正しく処理されました。
なお、Cloverでは、2つの文字起こしテキストが連続して表示されました。
https://samvera-labs.github.io/clover-iiif/docs/viewer/demo?iiif-content=https://nakamura196.github.io/ramp_data/demo/3571280/manifest.json

(参考)英語の文字起こしテキストの作成#
英語の文字起こしテキストの作成にあたっては、以下のようなプログラムを使用しました。以下はGitHub版Whisperを使用した例です。
https://github.com/openai/whisper
当初、API版Whisperによる翻訳を以下のように試しましたが、日本語で出力され、うまく英語テキストを作成できませんでした。
まとめ#
複数の文字起こしテキストや字幕ファイルの記述にあたり、参考になりましたら幸いです。