IIIF Audio/Visual: 複数のvttファイルを記述する

概要

IIIFを用いたAudio/Visual資料の記述について、複数のvttファイルを記述する方法に関する備忘録です。

ここでは、以下のように、日英の文字起こしテキストを記述します。

以下に例を格納しています。

以下の記事も参考にしてください。

具体的には、以下のように複数のアノテーションとして記述することで、rampビューアによって正しく処理されました。

なお、Cloverでは、2つの文字起こしテキストが連続して表示されました。

英語の文字起こしテキストの作成にあたっては、以下のようなプログラムを使用しました。以下はGitHub版Whisperを使用した例です。

当初、API版Whisperによる翻訳を以下のように試しましたが、日本語で出力され、うまく英語テキストを作成できませんでした。

複数の文字起こしテキストや字幕ファイルの記述にあたり、参考になりましたら幸いです。