本章の目的
本章では、筆者がこれまでに執筆したTEI関連の120本以上の記事を、トピック別に整理して一覧として提供します。本書で概要を把握した後、各トピックについてより詳細な手順やコード例を参照する際にご活用ください。あわせて、TEIの学習に役立つ外部リソースも紹介します。
TEI/XMLの基本
TEI/XMLの作成方法、基本的な操作に関する記事です。
- ExcelからTEI/XMLを作成するフローの一例を作成しました。
- WordをTEI/XMLに変換する
- WordファイルをTEI XMLに変換する方法:TEIgarage APIの活用ガイ
- vttファイルからTEI/XMLを作成する
- TEI/XMLファイルをGitHubで公開する手順書
- TEI/XMLファイルをS3互換のオブジェクトストレージでホストする
- Pythonを用いたTEI/XMLファイルの分析サンプルプログラムを作成しました。
- (機械翻訳)The TEI Archive
- DHCフォーマットの中身を確認する
- DHConvalidatorにおける’ref’に関する不具合への対応
XML処理
XMLの処理・変換に関する記事です。
- PythonでXML文字列を整形する
- XMLファイルで文字列のみを抽出して処理する方法
- Node.jsでXML文字列をパースする
- BeautifulSoupでxml:id属性を与える方法
- JavaScriptのquerySelector()でxml:idに特定の値を持つ要素を取得する方法
- Nuxt3でXMLをフォーマットしてシンタックスハイライト表示する
XSLT
XSLT変換に関する記事です。
- VSCodeとXSLTを用いたTEI/XMLのリアルタイムプレビュー
- XSLTを使いながらTEI/XMLファイルを編集する
- Node.js で XSLT を実行するサンプルリポジトリを作成しました。
- XSLTを使ってIIIFとTEIの対照表示を実現する
スキーマ・ODD
Relax NG、Schematron、ODDに関する記事です。
- Romaを使ってプロジェクトに応じたタグを限定し、解説を作成する
- Romaを使ってタグの属性に使用可能な値を限定する
- Romaを使ってプロジェクトに応じたタグに使用する属性を限定する
- Romaを用いてカスタマイズしたrngファイルを作成する:使用するTEIタグを限定する
- TEI ODDから変換可能なスキーマについて:RNG、XSD、DTDなど
- TEI ODDによるIIIF対応ファクシミリ記述の制約設計
- TEI ODDファイルのカスタマイゼーション:NDL古典籍OCRの事例
- ODD Chain チュートリアル
- ODD編集Tips:その1
- TEI Processing Modelで実現する宣言的なマルチフォーマット変換
- TEI GarageのAPIを使用したODDからRNG/HTMLへの変換
- RELAX NGスキーマを操作するライブラリjingtrangを試す:検証編
- RELAX NGスキーマを操作するライブラリjingtrangを試す:rngファイルの作成編
- 生成AIを用いてプロジェクトに特化したrngファイルを作成する
- RELAX NGとSchematron
- RELAX NGとSchematronを組み合わせたTEI XMLスキーマの実装ガイド
- NDL古典籍OCR-lite Next.js版の開発
LEAF Writer
LEAF Writerに関する記事です。
- LEAF-Writerをローカル環境で動かす
- LEAF WriterをNext.jsから使用する
- LEAF Writer:日本語UIの追加
- LEAF WriterのEditor Toolbarをカスタマイズする
- LEAF Writer:CSSのカスタマイズ
- LEAF Writer:スキーマのカスタマイズ
- LEAF Writer:Japan Searchに対するEntity Lookup
- LEAF Writer: Image Viewerの使い方
- LEAF Writer: Miradorを追加する
- LEAF Writer: サンプルデータの追加方法
- LEAF WriterとGakuNin RDMを用いたTEI/XMLファイルの編集環境の試作
CETEIcean
CETEIceanに関する記事です。
- Gatsby CETEIceanを試す
- CETEIceanとNuxt3を使ったサンプルリポジトリを作成しました。
- Next.js + CETEIcean + React TEI Routerを使ったビューア開発
- CETEIceanとXPathを使って特定の要素にスクロールする
- Miradorで画像を表示し、CETEIceanでテキストを表示するサンプルアプリ
TEI Publisher
TEI Publisherに関する記事です。
TEI Garage
TEI Garageに関する記事です。
- TEIGarageを試す
- WordファイルをTEI XMLに変換する方法:TEIgarage APIの活用ガイ
- TEI GarageのAPIを使用したODDからRNG/HTMLへの変換
- TEI Garage APIを使って、DOCX → TEI/XML 変換ツールをブラウザだけで作った
DTS(Distributed Text Services)
DTSおよびCTSに関する記事です。
- DTS(Distributed Text Services)を使ってみる
- 校異源氏物語テキストDBで公開するTEI/XMLファイルに対するDTS APIを作成する
- 校異源氏物語テキストDBで公開するTEI/XMLファイルに対するDTS APIのGitHubリポジトリ
- 校異源氏物語テキストDBのDTS(Distributed Text Services) APIの更新
- TEI/XMLから検索システムを構築する際のDTS(Distributed Text Services)のdts:wrapperの応用例
- DTS (Distributed Text Services)のビューア開発
- DTS Viewerの更新:ページネーションへの対応
- DTSとCTSの関係
- Canonical Text Serviceを試す
- MyCapytainライブラリを試す
- Vercelにデプロイしたexpressについて、vercel.jsonによるcors対応を行う
校異源氏物語
校異源氏物語プロジェクトに関する記事です。
- デジタル源氏物語における校異源氏物語と現代語訳の対応づけ
- 校異源氏物語・本文テキストデータリポジトリで公開しているTEI/XMLを一部更新しました。
- 校異源氏物語テキストDBに対する検索を行うAPIサーバの構築
- 校異源氏物語テキストDBのTEI/XMLからPDFを作成する
- app要素を含むTEI/XMLファイルに対して、編集距離を算出するプログラムを作成しました。
- 校異源氏物語に対する類似テキスト検索アプリを作成しました。
IIIF連携
IIIFとTEIの連携に関する記事です。
- IIIFマニフェストファイルからTEIのfacsimile要素を作成するプログラムを作成しました。
- IIIF Curation ListをTEIのfacsimile要素に変換する
- IIIFの多角形アノテーションをTEI/XMLで表現する一例
- IIIF画像に対する多角形アノテーション支援ツールの改修
- TEI ODDによるIIIF対応ファクシミリ記述の制約設計
- XSLTを使ってIIIFとTEIの対照表示を実現する
OCRとTEI
OCR結果をTEI/XMLに統合する方法に関する記事です。
- NDL古典籍OCR-Liteを用いて、IIIFマニフェストファイルからTEI/XMLファイルを作成する
- 画像ファイルに対してGoogle Cloud Visionを適用して、IIIFマニフェストおよびTEI/XMLファイルを作成する
- Google Cloud Vision APIとGakuNin RDMを用いたTEI/XMLファイル作成アプリの試作
- IIIFマニフェストファイルからOCR結果を含むTEI_XMLファイルを作成するプログラム
- NDL古典籍OCR-Liteを用いたアノテーション付きIIIFマニフェストファイルとTEI/XMLファイルの作成
- その2:NDL古典籍OCR-Liteを用いたアノテーション付きIIIFマニフェストファイルとTEI/XMLファイルの作成
- 「NDL OCR x IIIF」アプリにTEI/XML形式でダウンロードする機能を追加しました。
- DToC: Dynamic Table of Contextsを試す
ビューア開発
TEI/XMLのビューア開発に関する記事です。
- Next.jsを用いたTEI/XMLファイルの簡易ビューアを作成しました
- TEIビューアでの利用を想定したCustom OpenSegDragon Viewerを作成しました。
- TEI古典籍ビューワをカスタマイズして判読不能箇所(gap)を表示する
- TEI/XMLの可視化例:Leafletを用いた地図表示
- Knight LabのTimelineJSやStoryMapJSをNext.jsから利用する
PDF/ePub/DOCX変換
形式変換に関する記事です。
- 校異源氏物語テキストDBのTEI/XMLからPDFを作成する
- TEI/XMLファイルを縦書きPDFに変換する方法の1例
- TEI Critical Apparatus Toolboxを用いてTEI XMLをLaTeXに変換してみる
- Pythonを用いてTEI/XMLファイルをEPUBに変換する
- python-docxを用いた両側ルビ
その他のツール・プロジェクト
- テキストマークアップツール「CATMA」の使い方
- TEIテキストの作成支援ツール「FairCopy」の紹介
- TEI Boilerplateを試す
- Visual Studio Code(VSCode)でVersioning Machine(VM5.0)を使用する
- OpenITI mARkdownからTEI XMLへの自動変換ツール「oitei」を試す
- Oxygen XML Editorのイメージマップエディタの使用例
- Hypothes.is APIでWebアノテーションをエクスポートしてTEI/XMLに変換する
- Annotorious v2のpolygonツールを使って、polylineを作成する
- CWRC XML Validator APIを試す
- Visual Studio Live Shareを用いてTEI/XMLファイルを共同編集する(xmlでなくても可)
- Odeuropaに関連するツールを試す
- 「前近代日本-アジア関係資料デジタルアーカイブ」のビューアを試す
- Omeka S XML Viewerモジュールの使い方
- MediaWikiのTEI拡張を試す(結果:うまくいきませんでした。)
- cwrcのwikidata-entity-lookupを試す
- Japan Search利活用スキーマを使ったentity-lookupの試作
- 二つのテキスト間の差分を抽出するプログラムを作成しました。
- [TEI x JavaScript] Nuxt3で意図しないWhitespaceを削除する
TEI公式リソース
TEI Guidelines
TEIガイドラインは、TEIのすべての要素、属性、モジュールの定義と使用法を記述した公式リファレンスです。
TEI by Example
TEIの使い方を具体的な例題を通じて学べるオンラインチュートリアルです。
TEI Wiki
TEIコミュニティが共同で維持するWikiサイトです。
TEI GitHub リポジトリ
TEIガイドラインのソースコードはGitHubで管理されています。関連リポジトリとして以下があります。
| リポジトリ | 内容 |
|---|---|
TEIC/TEI | ガイドライン本体 |
TEIC/Stylesheets | XSLT変換スタイルシート集 |
TEIC/CETEIcean | ブラウザレンダリングライブラリ |
TEIC/Roma | スキーマ生成ツール |
Roma
カスタムTEIスキーマの生成ツールです。
TEI Garage
TEIドキュメントの形式変換をオンラインで行えるサービスです。
TEI Publisher Demo
https://teipublisher.com/exist/apps/tei-publisher/index.html
TEI Publisherのデモインスタンスです。
学習リソース
DARIAH-Campus
デジタルヒューマニティーズの教育リソースを集約したプラットフォームです。TEIに関するチュートリアルも多数あります。
TAPAS Project
TEIドキュメントをアップロードして公開できるホスティングサービスです。
Oxford Text Archive (OTA)
https://ota.bodleian.ox.ac.uk/
TEIでエンコーディングされたテキストが多数収録されています。
DHコミュニティ
TEIコンソーシアム
TEIガイドラインの開発・維持・普及を担う国際組織です。
TEI-L メーリングリスト
https://listserv.brown.edu/cgi-bin/wa?A0=TEI-L
TEIコミュニティの公式メーリングリストです。
ADHO
デジタルヒューマニティーズの国際的な連合組織です。
日本デジタル・ヒューマニティーズ学会(JADH)
日本におけるデジタルヒューマニティーズの学術団体です。
書籍
- “What is the Text Encoding Initiative?” by Lou Burnard (OpenEdition Press, 2014) – TEIの概要を簡潔に解説した入門書。オープンアクセスで公開
- “Digital Scholarly Editing: Theories and Practices” edited by Matthew James Driscoll and Elena Pierazzo (Open Book Publishers, 2016)
- 『デジタル・ヒューマニティーズ入門』 永崎研宣著(文学通信、2021年)
- 『日本の文化をデジタル世界に伝える』 永崎研宣著(樹村房、2019年)
本書のまとめ
本書では、TEIの基本概念から各要素の詳細、ツールの活用、Webでの公開に至るまで、TEIの主要なトピックを体系的に解説してきました。各章の末尾に掲載した筆者の関連記事と、本章のリソース集を活用して、さらに理解を深めていただければ幸いです。
TEIは30年以上の歴史を持つ成熟した標準であり、世界中の人文学研究者やデジタルアーカイブ機関にとって不可欠な基盤技術です。本書が、テキスト資料のデジタル化・構造化・共有の推進に貢献する一助となれば幸いです。