字幕付きの音声ファイルをIIIFビューアで表示する

概要

字幕付きの音声ファイルをIIIFビューアで表示する機会がありましたので、備忘録です。

国立国会図書館歴史的音源で公開されている「日本のアクセントと言葉調子（下）」を対象に、OpenAIのSpeech to textを使用しています。文字起こし結果には誤りが含まれていますので、その点はご注意ください。

以下は、Rampでの表示例です。

以下は、Cloverでの表示例です。

以下は、Aviaryでの表示例です。こちらについては、残念ながら今回使用したマニフェストファイルの形式では、文字起こしテキストは表示できませんでした。

以下、これらのマニフェストファイルの作成方法について紹介します。

以下の記事を参考に、mp4ファイルを取得します。

OpenAIのAPIを使用して、文字起こしを行います。

不完全なコードですが、以下のようなプログラムによって、マニフェストファイルを作成します。

ライブラリとして、iiif-prezi3を使用しています。以下の記事も参考にしてください。

動画や音声へのIIIFの応用にあたり、参考になりましたら幸いです。