概要

IIIFを用いたAudio/Visual資料の記述について、複数のvttファイルを記述する方法に関する備忘録です。

ここでは、以下のように、日英の文字起こしテキストを記述します。

https://ramp.avalonmediasystem.org/?iiif-content=https://nakamura196.github.io/ramp_data/demo/3571280/manifest.json

マニフェストファイルの記述

以下に例を格納しています。

https://github.com/nakamura196/ramp_data/blob/main/docs/demo/3571280/manifest.json

以下の記事も参考にしてください。

具体的には、以下のように複数のアノテーションとして記述することで、rampビューアによって正しく処理されました。

"annota]ti{}on"""]siti"dyt{}{}:"pe,:em"""}""}""""}""}"["sitl,mb,titl,mb,t":"dya"]oo""""}adya"]oo""""}ah:"pbjtditflr"pbjtditflrt":eea"iydyoa"]g:eea"iydyoa"]gtA["l"v""prbje"l"Ev""prbjepn":":a::emea"t":":na::emea"tsnh:t"al""h:gt"al"E":t"[i{":t"::t"[li{":t":n:ttA{(oh":tA{ioh":g/apnmnt":["pnsnt":[l"ntsna"tT{(hsnh"tT{ihai:c:pe"mt::pe"stkothsxtatt(sxthtan/ai":tecp/am":tepmPntns/"xhsntas/"x(suaaieu/,ti:aicu/,tm:rgko-pn/n/kohpn/a/aeangpave/anipavc/1"m"elkt-nm"nlkthn9,u,neatgau,eeatia6remm"ekr-mm"nk.areu,naageu,eag1anrem1enr-mi9ttaru9ntagut6ei1ar6ei1erh.dn9ta.rn9naug)g6e1gag6e1bi"".d9it".r9.t,g)6te,ga6ihi".hdit.outgu)teg/bhib"hdir.ut.u)taibhib"hmo.uo.up/ib/ib_ro.ro.da/ia/iamromrotpa/pa/a_mr_mr/dpadpada_ma_metdptdpmaa_aa_o/td/td/daadaa3e/te/t5mdamda7oe/oe/1/md/md23oe3oe85/m5/m073o73o/15/15/c273273a815815n027027v/81/81ac02c02sa/8a/8/n30n30pv5/v5/aa7ca7cgs1as1ae/2n/2n/a8va8v2n0an0a"n.sn_s,ov"oe"tttnata.t"tvi,itootnn"//,wweebbvvtttt"/,2",

なお、Cloverでは、2つの文字起こしテキストが連続して表示されました。

https://samvera-labs.github.io/clover-iiif/docs/viewer/demo?iiif-content=https://nakamura196.github.io/ramp_data/demo/3571280/manifest.json

(参考)英語の文字起こしテキストの作成

英語の文字起こしテキストの作成にあたっては、以下のようなプログラムを使用しました。以下はGitHub版Whisperを使用した例です。

https://github.com/openai/whisper

dddeeeffff"hmsrwwtmrwro"oieeriroerer"unctitadsitmCruouthneutuaostnreffsllertnedn_oiolt_n_v=ssvplra=vtefteet=triri=="tn.isetfewtemtn{((w,tnei(hm(sestishtfradxliiorus(neoriisrtensdelttstcualtet=.ppestaie(orneeg=wuelummc(nss_(m=frtr.lpeosd:cp"eosi_.tt(nes0raWnfretplr,sidc2itEtomgeaoaenso%}phBram(tanocn:t,Vimtefhdsuosd6{iTna_n",_ctnes0mo'Tttt{mrpdcinwe_i[sooiuso3%n,'nntm'tudbt)n6u)uietatee_:d03tfnmmserpl(ps06eia"eetxtu(ia)0sls)rsat}t'ntt0:eatm'_mpho)0_ftap]peu)2piem(.adta}al(pssti_:tet(ethupf{h:rsgr{,mao6s)aemie'tr0e:ngepnv)hm)csmn(de,aocet)}rtnrn[\bvtdit'noeesp[e{srd:t'nteb0isde=os6ot'xFst.na]taer3[r)}l=if't\svn}s'neeg"e]\)rg)n:b'm"oHe)sHne:t#,MsM'{l:]iaS)nS:+g.um1am}gm\e'n=.""j"a"",task="translate")

当初、API版Whisperによる翻訳を以下のように試しましたが、日本語で出力され、うまく英語テキストを作成できませんでした。

transmfrcoierdlsieeppl=ot=an"us=wdehi_ciofls_oipfreeimnrlat-et.1,=a""u,vdtito".,translations.create(

まとめ

複数の文字起こしテキストや字幕ファイルの記述にあたり、参考になりましたら幸いです。