NDL古典籍OCR-Liteを用いたGradio Appを作成しました。

以下でお試しいただけます。
https://huggingface.co/spaces/nakamura196/ndlkotenocr-lite
「NDL古典籍OCR-Lite」ではデスクトップアプリケーションが提供されているため、Gradioのようなウェブアプリがなくても簡単に実行可能な環境が用意されています。
そのため、本ウェブアプリの用途としては、スマホやタブレット等からの利用や、ウェブAPIを介して利用などが考えられます。
作成時の工夫や不具合対応#
サブモジュールの利用#
本家のndlkotenocr-liteをサブモジュールとして導入しました。
そして、ビルド時に以下を実行します。
これにより、ビルド時に、本家のndlkotenocr-liteの最新ファイルを利用できるかと思います。
(誤った理解をしている点もあるかもしれません。)
Dockerfileの利用#
上記のサブモジュールの利用にあたり、Dockerfileを使ってビルドする方式にしました。
sdkをdockerにすることで、Dockerfileに基づいてビルドされました。
Gradioのバージョン4.44.1の利用#
当初のバージョン5.7.1のGradioを使用していましたが、後述するAPI利用の際、以下のエラーが出て利用できませんでした。
そこで、バージョン4.44.1を使用することで、このエラーを回避することができました。
APIの利用#
以下、源氏物語(東京大学総合図書館)を使用した例です。
以下のように、画像、テキスト、XML、JSONデータを得ることができます。
リポジトリにdocker-compose.ymlを含めていますので、開発環境の構築や公開環境へのデプロイなど、HuggingFace Spaces以外でもお使いいただけるかと思います。
まとめ#
「NDL古典籍OCR-Lite」をOSSとして公開いただいたことに感謝いたします。
Dockerを用いた開発などが不慣れで、不正確な点もあるかもしれませんが、参考になりましたら幸いです。