お知らせ

2026-02-24

!

本ページで提供しているノートブックは今後更新されません。

NDLOCRについては、デスクトップアプリケーションおよびコマンドラインツールとして簡易に利用可能な「NDLOCR-Lite」が公開されました。今後は、こちらをお使いいただけますと幸いです。

https://github.com/ndl-lab/ndlocr-lite

2025-04-02

現在、不具合が発生しています。修正が完了するまで、ご使用をお控えください。

不具合を修正しました。

2025-03-21

NDL古典籍OCRについては、デスクトップアプリケーションとして簡易に利用可能な「NDL古典籍OCR-Lite」が公開されました。今後は、こちらをお使いいただけますと幸いです。

https://github.com/ndl-lab/ndlkotenocr-lite

概要

NDLOCRおよびNDL古典籍OCRのver.2を用いたノートブックを作成しました。

それぞれ以下のリンクからお試しいただけます。

  • NDL OCR

https://colab.research.google.com/github/nakamura196/000_tools/blob/main/NDLOCR_v2の実行例.ipynb

  • NDL古典籍OCR

https://colab.research.google.com/github/nakamura196/000_tools/blob/main/NDL古典籍OCR_v2の実行例.ipynb

最新のノートブックとは異なりますが、ノートブックの使い方については以下の動画をご確認ください。

https://youtu.be/46p7ZZSul0o

以下、詳細について説明します。

背景

NDLOCRとNDL古典籍OCRについて、2023年にver.2が公開されました。ver.1とver.2の違いについては、以下のサイトを参考にしていただきたいですが、特に行単位で認識した文字列の読み順の付与性能が向上しています。

https://lab.ndl.go.jp/data_set/r4ocr/r4_software/

https://lab.ndl.go.jp/data_set/r4_koten/

今回作成したノートブックでは、これらver.2のOCR処理プログラムを採用しています。

入力方法

これまでのノートブックと同様、以下のオプションを提供します。

  • 画像
    • 単一の画像ファイルのURLを指定する場合
    • 単一の画像ファイルをアップロードする場合
    • 複数の既にダウンロード済みの画像ファイルを対象にする場合
  • PDF
    • 単一のPDFファイルのURLを指定する場合
    • 単一のPDFファイルをアップロードする場合
    • 単一の既にダウンロード済みのPDFファイルを対象にする場合
  • IIIF
    • IIIFマニフェストファイルのURLを指定する場合(本記事執筆時点ではPresentation API v2のみ)

実行結果

上記の各オプションを実行後、以下のような画面が表示されます。

具体的には、以下の2種類です。

  • Googleドライブへのリンク(「以下に出力しました。」の部分)
  • 認識結果を確認するビューアへのリンク(「認識結果は以下です。」の部分)

それぞれについて説明します。

Googleドライブへのリンク

以下のように、4つのフォルダが作成されます。

txtおよびxmlはNDLOCRおよびNDL古典籍OCRの一部で出力されるデータです。

pdfは認識結果を透明テキスト付きPDFで出力します。末尾に_textがあるものとないものの2種類が出力されます。_textがついているPDFは、以下のように、確認用にテキストを赤字で表示します。

iiifは後述するビューアで使用するデータです。jsonやxmlファイルが格納されていますが、主に開発者向けの情報になります。

認識結果を確認するビューアへのリンク

以下のようなビューアが表示されます。認識結果のテキストを画像に重ね合わせることで、OCRの精度などを確認できます。

本ビューアについて、技術的な情報については別の記事で紹介できればと思います。

まとめ

ノートブックについて、不具合や不足機能があるかと思いますので、随時ご連絡いただけますと幸いです。

NDLOCRおよびNDL古典籍OCRの活用にあたり、お役に立ちましたら幸いです。