IIIFマニフェストファイルからOCR結果を含むTEI_XMLファイルを作成するプログラムを作成しました。このプログラムの使用方法について説明します。

仕組み#
IIIFマニフェストファイルのURLを指定して、NDL古典籍OCR-LiteによるOCR結果を含むTEI/XMLファイルを作成します。
https://github.com/ndl-lab/ndlkotenocr-lite
使い方#
以下のノートブックにアクセスしてください。
https://colab.research.google.com/github/nakamura196/000_tools/blob/main/IIIFマニフェストファイルからTEI_XMLファイルを作成するプログラム.ipynb
そして、一つ目の再生ボタンを押します。

完了したら、「実行」という部分のmanifest_urlとoutput_dirの値を更新して、セルを実行します。
output_dirに、OCR結果を含むTEI/XMLファイルが出力されます。

出力例#
以下のように、ページおよび行ごとのOCR結果を含むファイルが作成されます。
まとめ#
不完全な点もあるかと思いますが、参考になりましたら幸いです。