概要

字幕付きの音声ファイルをIIIFビューアで表示する機会がありましたので、備忘録です。

国立国会図書館 歴史的音源で公開されている「日本のアクセントと言葉調子(下)」を対象に、OpenAIのSpeech to textを使用しています。文字起こし結果には誤りが含まれていますので、その点はご注意ください。

以下は、Rampでの表示例です。

https://ramp.avalonmediasystem.org/?iiif-content=https://nakamura196.github.io/ramp_data/demo/3571280/manifest.json

以下は、Cloverでの表示例です。

https://samvera-labs.github.io/clover-iiif/docs/viewer/demo?iiif-content=https://nakamura196.github.io/ramp_data/demo/3571280/manifest.json

以下は、Aviaryでの表示例です。こちらについては、残念ながら今回使用したマニフェストファイルの形式では、文字起こしテキストは表示できませんでした。

https://iiif.aviaryplatform.com/player?manifest=https://nakamura196.github.io/ramp_data/demo/3571280/manifest.json

以下、これらのマニフェストファイルの作成方法について紹介します。

mp4ファイルの準備

以下の記事を参考に、mp4ファイルを取得します。

vttファイルの作成

OpenAIのAPIを使用して、文字起こしを行います。

fcatwrlurioidatmeinhnosmfrfot_coieoipfrdlsple=iieepeenlpl=on.aOet=an(wip="usore=wdeuiinohi_ttmApciofpepIels_ou(o(nipfrttra(eeim_rtponrlavaiut-ettnO_t.1,=tspkpa""_ceeuu,vprnytdtaiA=_ittpIomo"htsp.),).4tg_r"epawtan"ets,nhcv,re(in""pcOrtoPbidE"oiN)nnAsgI.=_c"AruPetIaf_t-Ke8E("Y)")a)sfile:

マニフェストファイルの作成

不完全なコードですが、以下のようなプログラムによって、マニフェストファイルを作成します。

ffdcdmcaaaac#vvvvcwrreouaannnnattttaioofnrnnnnnnnVttttntmmfaivoooovT____vhgwitfa___aTbaimbtlaaafimeigiesbp=psondooaannso.iott.osoaa.Udn=tdrbnn.pwiv_hcnt=dgAgaRyofiygeooaerfivro=yenedL"v=el__nni_eiVeng=mn.d=={avtppn(tppditfea==oa_ptt==aaooeryeduitMntdiRAritcggtu(e.oerg_aiRAadteneo_a"eeatmze_onsvnfent_esnfnbnW.tpaiddF[iiesniimooi=ove=aiun3iuiv'dfsooot(utx"dabdotitrliheetutnmbteara}sysVAdn_fioaedeos.ra(ooamnct/u,.Tn_spemrtCel_tmctitdr(neicpiTniaspilopd(aeidiygaoIoapdot=ttoioi.euikIo=v=en_tnnl,Tteh.rmnpdrrdetnfaatnpe(veram[,jtp((usa=_eP"tn=oamamat(vsoffr.tfcma{inc)g(senivt"oMriiaai"a(tfdgpooaei/nsottwnatlltuo{niyouern_n)datcnt_"(neeitnpvdprr(e=bv=nirP_a)iiVnnoo(ra=emaif"oavnniaannfiaan_mesm=atdipdstogpgnnadedmmfpf(p"ti=xay.tt"tenoseseeei4ii4S=of}i,i_a,(o_nto))e_xd_o"n"/ndut(i)pft,F:lp}=uua={ct)rimda:=iada/frnudpailoa=g2Alsstm"lddurnn,ncfe)ne.ha{,"irevg/h"])nCvA)np,oafa"twi{oliuir/tis,yenptidtfemix/pberapeoefpo}pev-etoLsi4n/a=tgfi:atx")cg"teion.},aeT"nxngj/n/e,e}P'scaxr/a]oaantacg.nnsn"taea"v/o,en,u,aptdvtsaaf)aAol"gto"sn_a,eir/nlb"ompoaed)naatnlu"tgag=r,=etla"/i=att2obie"n"eox),jlnta)=/R"dveutsrtoa"ut)ricoenI)tem,config

ライブラリとして、iiif-prezi3を使用しています。以下の記事も参考にしてください。

まとめ

動画や音声へのIIIFの応用にあたり、参考になりましたら幸いです。