以下の記事で、jingtrangおよびrngファイルを用いたxmlファイルの検証を行いました。
このjingtrangライブラリでは、xmlファイルからrngファイルを作成できるということで、試してみます。
Google Colabのノートブックも用意しました。
https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/jingtrangを試す:作成編.ipynb
rngファイルを作成する#
rngファイルを作成する元ファイルとして、以下を用意しました。
上記のファイルに対して、以下を実行します。
結果、以下のファイルが作成されました。
このrngファイルに対して、以下のようにテストしてみました。
OK:テキストが異なるもの#
NG:titleがない#
NG: 属性がある#
まとめ#
上記のような形で、あるxmlファイルから、rngファイルを作成することができました。rngファイルの記述方法についてはさらなる勉強が必要ですが、今回のような具体例から試行錯誤ができる仕組みは有効かと思います。
rngファイルを勉強する上で、参考になりましたら幸いです。