Archivematica における非DCメタデータの登録検証 ── source-metadata.csv を使ったEADの組み込み

Archivematica では、Dublin Core(DC)以外のメタデータスキーマもAIPのMETS.xmlに組み込むことができます。本ガイドでは、source-metadata.csv を使って EAD や MODS などの非DCメタデータをTransferに含め、AIPに正しく格納されるかをAPI経由で検証します。 目次 背景と目的 source-metadata.csv の仕組み XML Validation 機能 検証1: MODS単独でのメタデータ登録 検証2: EAD + MODS の同時登録 METS.xml における非DCメタデータの格納形式 検証3: Reingest によるメタデータ追加 まとめ 背景と目的 Archivematica の標準的な Transfer では、metadata/metadata.csv に記述した Dublin Core メタデータが METS.xml に <dmdSec> として格納されます。しかし、実際のデジタルアーカイブ運用では、以下のようなユースケースで DC 以外のメタデータスキーマを扱う必要があります。 EAD(Encoded Archival Description) : アーカイブズの階層記述で広く使われる標準 MODS(Metadata Object Description Schema) : 図書館資料の詳細記述に使われるスキーマ LIDO : 博物館・美術館資料の記述標準 MARC21 : 図書館の目録データフォーマット Archivematica は source-metadata.csv というCSVファイルを通じて、任意の XML メタデータを Transfer に紐付け、AIP の METS.xml に <dmdSec> として格納する機能を提供しています。本ガイドでは、この機能を API 経由で実際に検証します。 ...

2026年2月17日 · 24 分 · Nakamura

ArchivematicaのPreservation planningにおいて、Normalizationのルールを追加する

概要 ArchivematicaのPreservation planningにおいて、Normalizationのルールを追加する方法の備忘録です。 背景 拡張子が.jpgである画像をArchivematicaに投入した際、以下のようにFormatがJPEGのものに対してtifファイルを保存用に作成するルールを用意しているにもかかわらず、tifファイルが作成されないことがありました。 そこで、以下のような履歴の画面から、タスクの内容を確認しました。 結果は以下です。 具体的には以下のような記載になっており、該当するルールが存在しない、ということが記載されています。 F N i o l t e n f o o r r m m a a l t i : z i I n m g a g 1 e 1 e ( c R f a 0 s 5 t d e - r 8 ) f : c 6 E - x 4 c 7 h 0 a 4 n - g a e 6 a e b 9 l - e 4 a I 2 m 6 a e g f e 9 8 F f i 1 l 8 e 6 . F j o p r g m a t - ( N C o o m r p u r l e e s s o e r d ) d : e f E a X u I l F t C r o u m l p e r e f s o s u e n d d I t m o a g n e o r 2 m . a 2 l . i 1 z e ( b f i o g r - e p n r d e i s a e n r ) v a ( t f i m o t n / 6 4 5 ) そこで、fmt/645に対するルールを追加します。 ...

2025年4月24日 · 2 分 · Nakamura

Alfrescoのファイルに対して、Archivematicaを使ってAIPを作成する

概要 Alfrescoのファイルに対して、Archivematicaを使ってAIPを作成する方法の一例です。 以下が成果物のデモ動画です。 https://youtu.be/7WCO7JoMnWc システム構成 今回は以下のようなシステム構成とします。複数のクラウドサービスを利用していることに特に意味はありません。 Alfrescoは、以下の記事を参考に、Azure上に構築したものを使用します。 Archivematicaとオブジェクトストレージはmdx.jpを使用し、分析環境はGakuNin RDMを使用します。 オブジェクトストレージへのファイルアップロード Alfrescoからファイルをダウンロード Alfrescoからのファイルダウンロードにあたっては、REST APIを使用します。 https://docs.alfresco.com/content-services/6.0/develop/rest-api-guide/ OpenAPIに準拠しており、以下などを参考にしました。 https://api-explorer.alfresco.com/api-explorer/ 例えば以下により、Alfrescoのユーザ名とパスワード、およびホスト名を環境変数から読み込み、メタデータの取得やコンテンツのダウンロードを行うことができました。 # f i i f # c r m m r l % o p p o % a % m o o m % s r r s d d d d d t t b e e e e a A f f f f t o r s / p n e s e e n i " A " s # l # s s s s } # c e s } s } _ " A " i g " A R " u s t e e g " A " u s } r b o w s } b n q 6 b C _ " r " e o e e e e ) r n e e ) d " r " f e " r e " r e r x x e " r " r e ) e i s i e ) s u 4 s l i " g " l . a 環 l l l l B e c l l e " g " t " g t " l l y c c t " g " l l s n . t l / e / i n A s f e d 境 f f f f a d o f f b デ s s _ ノ s u f : e e _ ノ s f p a m h f 0 i s i 0 e i l : v . n _ 変 . . . . " " " s e d . ' ' . " " u バ : m d e p i n ー : n r d = . r r r p s r p s r n ー : n o = . " " o r a f . " " 0 m t m 0 n t f e v v d 数 u p t _ u p t i n e h a a _ a a g ッ e a l r f o ド o n i _ e e e t e e t e e o ド o u _ u o n y k o i _ s p _ p s p _ t _ r r e の o の s a a d s a a c t d e c u d c u ( グ s t f i d I d s c f d s s t l t l t d の d t f d r u s _ e p l d i a c o o c : _ e b r 読 t 取 e s r e e s r 認 i _ a c t e c t s 情 s a . n d e D e : t " e p p u r f u r f u e コ e p " e l t e d d e e e z t o r r o ( s o b み e 得 r s g b r s g 証 a c d e h b e h e 報 a v t a f s で _ : { b o u h t o r e . r e . r s ン _ u { b " p a i n . b e h r t t r s c s o 込 n w e u " w e の l r e p o u p o l を g ( e ( t o _ ノ i s u n r e i n n q _ n q _ n _ テ i t s u : u = t r ( w u " " e e e o e s み v = o t g : o t ヘ s e r t r g t r f 出 e d r f a r n ー d ノ e g s l a m s u d u d n ン d _ e g t a s o r g : : . l b . l e ( r _ ( r _ ッ d s ' i ( " i , 力 i b " : o ド ー l ( e , d e e r e e N e e N o ツ p l ( u _ r ( u i ( i o 6 i f A ( o o d h " s d h ダ = e : z " : z す ( c o 🔍 k p d 情 ( ド f " e o . e s b o s b o d を ( a f " r p e = o t t " l o p a 4 p , P b = v s o 環 e " o ー n = a ヘ a m る s t s e r e 報 s 情 . A = r u r s t u n t u n e 取 s t . A l a q s p e フ e u y d e y I o e . = s 境 l : s を f t ' t ッ s t e t , e { y i I を t 報 t P s t a p s g e s g e I 得 t h t P , t u r . u ( ァ n t n _ n n v o v r g t 変 f t 作 " i { a i ダ e i s r : m , n d 取 r a I r = = i o . ( . ( d す r a I h e e p t b イ ( p b d c b e C l e r e o 数 . " " 成 { a p o ー l o s ) o e t ( 得 ) r リ e s f s n e " e " _ る ) ( r リ " s s a _ i ル b u o o r l ) r i t s = の u * : s l p n の f n a : p s v ( s す : g ク q e l e s x エ x エ c : s g ク : t p t p n 保 i t 3 t d 4 b i : b d e . 設 s " e s l ' 設 . " g t s a f e る e エ u l o _ e c ラ c ラ o t e エ s o h a a 存 n _ e e o e o e n g o 定 e s l i : 定 h : e メ i a l " l ノ t ス e f a f . e ー e ー n ノ r t ス o . n . t r 完 a p n s n デ s = v e s : r e f = c : e : ッ o g u f ー _ ト s . t o j p : p : t ー ) _ ト u g s d h y 了 r a v e t バ e T ( t . " , l . a f " a " セ n e e , ド h : t h ( r s t " t " e ド : h : t e e i , _ : y t = ッ r ' e g , l f u b t ' , d B s ー a } - I o " s e 3 _ o i , i , n I o " p t . r d " _ h F グ u A n e e . s 6 i B e a t ジ l " i n D s , . a 0 s n o o t D 出 s , u ( c n " a , d a 情 e L v t { n t e 4 o a { r s r ) ) n { o t g d ) t ( n { n { ( 力 t t u o a w t a l 報 ) F ( e ( a r e n s s i , : k d } { e e a ) s " s " s パ } { _ r n m b a { t s を _ ' n s r } n / i [ c d e e / " t r t . t . t e ス / p l t e " ) a e 出 U A v e g : c j c ' d 追 a y _ a u ( s u T y R y l a a , e ( ) ) ) 力 S L ( l e { o s a a 加 t } i l r , s i p e p f l t n o , : す E F ' f t s d o { c t の a : d f l ( m e q e , f h h t u a る R _ A . _ e e n e c * a デ . : r " ) e " u " r e t s か ' P L p h l ( ' n e " : ー i { e : o : e : n e a p ど ) A F a o f c , c p タ t v s s u s o s d u f う S _ s s . r o t d e a t c u t " t " d c e t i か S T s t p e d ' i m l r o r : t E r e o r _ l W A w a d e ] c s u ) / l i x e _ / s p e O R o s e d , t ( e : a } m c q i a = a : R G r s n _ ) } p ) e e u d p s t D E d w t c = : " i o p e : i e h ' T ) o i r ) / u t s / l ) ) _ r a e N - t i t s - f , H i d l d o d " o " t d . O f } s e n e , n , r e h e S " . n e f , f e x T s e t ) a " a " a a i ' e n i : u m s m o u d s ) l c a l e e u l e t f o l t s e s t t r _ . d s - s : s p - s o p e } / a a u / ) k a ( ' p g g t p = s ) u e e _ u T s ) b " " p b r w . l : : a l u o d i t i e r e c " s h c ) d c / リ t : / o a ク r a e d l エ ( s l l e f ス e t f s ( r ト ) r r e ) e が } ) e s タ ) : s N c イ c o o ム o n / ア / e v ウ v , e ト e r し r s ま s i し i o た o n " n s } s / ) / 1 1 / / n n o o d d e e s s / / { { n n o o d d e e _ _ i i d d } } " / c o n t e n t " オブジェクトストレージにファイルをアップロード boto3と、オブジェクトストレージのENDPOINT_URL、ACCESS_KEY、SECRET_KEYおよびBUCKET_NAMEなどを使用して、ファイルのアップロード(とダウンロード)を行います。 ...

2025年1月26日 · 26 分 · Nakamura

DataverseのデータをArchivematicaで処理する

概要 DataverseのデータをArchivematicaで処理する流れを確認しましたので、備忘録です。 背景 ArchivematicaではDataverseのデータを入力する機能を提供しています。 https://www.archivematica.org/en/docs/archivematica-1.17/user-manual/transfer/dataverse/ 本機能について、以下の講演会で教えていただいたので、実際に試してみました。 https://www.kulib.kyoto-u.ac.jp/bulletin/1402322 Dataverse 以下の記事でも使用したDemo Dataverseを使用します。 以下のデータをアップロードしました。 https://demo.dataverse.org/dataset.xhtml?persistentId=doi:10.70122/FK2/IHQZL3 ここから画像データそのものと、JSONデータをダウンロードします。Metadataタブに移動し、Export MetadataからJSONを選択します。 以下はJSONファイルの一部ですが、metadataBlocksにメタデータ、filesに画像ファイルの情報が記載されています。 { } " } " ] m , f e " } i { } t c l a i " " " ] e " " " " " } d t d n f s l r v d d a a i a i { } { } { } { } { } { } { } " a e e a a " " " " " " " " " " " } " " " " t t s m e , , , , , , : b s r t t i p p f c f f s r m c , t c p f a i p e l " " " " " " " " ] " " " " ] " " " " ] " " " " ] " " " " " " " " e t s a a d e i i o r i t o d h " " a r u i B o l " d t m t v t m t v t m t v t m t v t m t v t m t v t m t v [ l r i s F " r d l n i l o o 5 e t v b e b l l n a : s y u y a y u y a { } y u y a { } y u y a { } y u y a " y u y a y u y a " i o e i : s U e t e e r t " c y a u a l e o " y " p l p l p l p l p l p l p l p l p l p l A p l p l p l p l : c n t l i R n e n s a D : k p l l t i A c : N " : e t e u e t e u " } " } e t e u " } " } e t e u " } e t e u r e t e u e t e u t " V e 2 s L a n d i g a s e u a i c c k a c N i C e N i C e a , a N i C e d , d N i C e d N i C e t N i C e N i C e " e : e " 5 t " m t l z e t " u " e r o a c s { m i [ a p l " a p l " u " " " " u " " " " " } a p l " a " " " " a " " " " a p l " s " " " " a p l " s a p l " a p l " n d r : 1 e : e T y e I a 7 m : " D n t e " e t m l a : m l a : t t m t v t t m t v e m l a : t t m t v t t m t v m l a : D t m t v m l a : m l a : m l a : a " 1 s 4 n " y T " d F 2 " : a D i s : " a e e s e e s h y u y a h y u y a x " " " e e s a y u y a a y u y a e e s e y u y a e e s a e e s e e s k : , i { 7 t " : p y : e i f : " t a o s : t " " s " " " s [ o p l p l o p l p l p s t @ " " s [ s p l p l s p l p l " " s [ s p l p l " " s [ n " " s " " " s " a o 2 I h e p n l 0 M " a t n R { i : : " n : : " r e t e u r e t e u a c e t : : " e e t e u e e t e u : : " c e t e u : : " d : : " N : : " 2 m f n 4 d t " " e 5 t e 8 { D 7 " e D e " o : a : N N i C e A N i C e n h r y : t N i C e t N i C e : r N i C e : : a : 0 u a I , " t n : " 3 i I a 5 2 : " a q C n " f k " t a a p l " f a p l " d e m p " t C a p l " C a p l " " t i a p l " " t H " f k " f 2 r l d : p a : 6 f d 8 " f : t u i " t a " a a r " m m l a : f m l a : e m N e d r " o m l a : o m l a : d r " p m l a : s r " u d a " a d a " 5 a s " s k " 5 i " b , 0 f e e t , i l p m u u c e e e s i e e s d e a " a u c n e e s n e e s s u c t e e s u u c m e l p m a l p - 1 e : " : a i " 6 e : 0 8 a " " s a t s r u t e o " " " s " l " " s " v " m : t e o t " " s " t " " s " D e o i " " s " b e o a p s r u t s r 0 9 , d m m J , r 7 a l 2 : t t l e i r h , m : : : " N i : : " h a : e a , m a : : " N a : : " n e , m o : : " M j , n n o e i r e e i 1 6 2 / u a P " - b 8 s 0 " i e , m a o p : a a : t l " " s p c : a c : a s p n : y e t i s , m a O , m - . 8 i d r g E : 1 a b e 2 " : o " i 1 r o { " f k t " f t u " : h e o t " f k t " f . c o V " f c r t i i , f i 1 j 1 : o a e G , c 0 , 5 2 n , t 9 " u a a " a i a a " p e h t t u N d a " a E d a " k r u a d a " F t o i t t D t 9 p 0 1 i 1 / " b 7 - 0 t i 6 , n u l p m o u l p s " t " t C n a a l p m m a l p a i n l s l p i " l e o i S e i " g 9 0 . 9 j I s e b 0 2 r M v " d t s r u n t s r : : t T p o d m t s r u a t s r m p d u D s r r , l s r v a p v " 3 . o 6 p m 3 3 a 1 5 u e e " h e i r " h e i / p h s n " e a e i r i a e i u t " e e e i s e " " e t o e , , 7 r . e a : b c - - e t " , o , m a : o , m / { : e : t , " s , m a l s , m r i , " s , m t d , " o s " 0 g j g g / 5 b 1 0 a , r i , r i r / / a : e i , " e i a o : c i V , r i , 1 / p " e / c e 9 1 d N t { A t o / U / c t t : t t . n r t D o u t 2 1 g , " d f 3 " - a a i S f i r w n s t { C i S C i 1 " { i i a c " " 2 0 " , e 0 b , 1 t m v a f v . w i c " o v a { o v 2 , p v t a , / . , m 2 5 9 a e e t i e o w v h , n e t n e 6 t e a b F 7 o 1 c " " " " o l " r . e e t " o t " 3 i " s u K 0 - 9 f , , , , r i , g g r m a , r a , @ o , e l 2 1 d 1 0 u a / r s a c u c g n t a / 2 a 0 2 " t 0 i i . t " t m V " r I 2 t f 1 i 5 d t o N E a a y H / a d 9 o 7 . y r a m i l " Q F v 2 1 n z a g m a l u , Z K e 6 0 " h c / e i . e L 2 r d f , 3 f O " l c " 3 s c d y o r , " o , I e " 2 9 n T g , m B H - , 6 6 t o a " 7 Q o d " o k n J Z r c , l y i V L g " o o z Q 3 : g " a S / 1 y , t " B 9 / i , 7 4 " o J 8 , n V 1 " Q 5 S 4 " 8 , 2 0 d - 6 3 7 3 3 5 3 3 e a 7 c " , データの準備 Dataverseのサンプルデータは以下に格納されています。 ...

2025年1月21日 · 21 分 · Nakamura

Archivematicaのtransferにおいて、processing_configを使う

概要 Archivematicaのtransferにおいて、processing_configの使用方法について説明します。 背景 Archivematicaのtransferにおいて、processing_configを選択することができます。以下では、「automated」「default」「mdx」の3つから選択できることがわかります。 これは、「Administration」メニューにおける「Processing configuration」において設定することができます。 例えば以下は、mdx.jpのs3互換ストレージとやりとりすることを前提とした設定例です。 以下のように、「Store AIP location」に対象ストレージを選択することで、このprocessing configurationを選択した際には、当該ストレージにAIPが保存されることになります。 APIからの利用 APIからもこの設定を利用することができます。 以下のBETA版として提供されているものになりますが、/api/v2beta/packageを利用することができます。 https://www.archivematica.org/en/docs/archivematica-1.16/dev-manual/api/api-reference-archivematica/#package processing_configオプションを設定することで、APIからの利用においても、入力データごとに、AIPやDIPの出力フォルダを変更することができます。 まとめ Archivematicaの利用にあたり、参考になりましたら幸いです。

2024年11月19日 · 1 分 · Nakamura

ArchivematicaのMETSファイルの内容を可視化するPythonライブラリ

概要 ArchivematicaのMETSファイルの内容を可視化するPythonライブラリを作成しました。 例えば以下のように、AIPの作成過程で行われた処理(premis:event)の集計結果などを可視化します。 背景 以下の記事で、ArchivematicaのMETSファイルを人間に優しい方法で探索するためのウェブアプリケーションであるMETSFlaskを紹介しました。 今回作成したものは、このMETSFlaskで提供されている機能を、Flask以外からも利用しやすいようにライブラリ化したものです。 リポジトリ 以下で公開しています。README.mdファイルに使用方法を記載しています。 https://github.com/nakamura196/mets_tools GitHub Pagesでもドキュメントを公開しています。 https://nakamura196.github.io/mets_tools/ まとめ ArchivematicaおよびAIPの利用にあたり、参考になりましたら幸いです。

2024年10月31日 · 1 分 · Nakamura

Archivematicaにmdx.jpのオブジェクトストレージを追加する

概要 Archivematicaにmdx.jpのオブジェクトストレージを追加する機会がありましたので、備忘録です。 背景 以下の記事で、Amazon S3をArchivematicaの処理対象およびAIPの保存先に設定する方法を記載しました。 今回は、この手順をベースとしつつ、mdx.jpのオブジェクトストレージを接続してみます。 設定方法 以下のように設定します。 S3 Endpoint URLには、https://s3ds.mdx.jpを設定します。 Access Key ID to authenticateとSecret Access Key to authenticate withには、以下で得られるアクセスキーと秘密鍵を使用します。 結果 結果、以下のように、mdx.jpのオブジェクトストレージを入出力ストレージとして利用できるようになりました。これにより、AIPやDIPをmdx.jpのオブジェクトストレージに保存することができます。 補足 以下の記事で記載した方法を参考に、GakuNin RDMとmdx.jpのオブジェクトストレージを接続することができます。 これにより、GakuNin RDM上でAIPやDIPの確認が可能となります。これにより、GakuNin RDMのBinderHubを用いたAIPの分析や可視化が可能となります。 可視化例として、ArchivematicaのMETSファイルを人間に優しい方法で探索可能とするMETSFlaskの応用などが考えられます。 まとめ Archivematica, GakuNin RDM, mdx.jpなどの連携にあたり、参考になりましたら幸いです。

2024年10月25日 · 1 分 · Nakamura

GakuNin RDMとAmazon S3を接続し、Archivematicaでファイルを処理する

概要 GakuNin RDMとAmazon S3を接続し、Archivematicaでファイルを処理する方法に関する備忘録です。 https://rcos.nii.ac.jp/service/rdm/ 背景 以下の記事で、ArchivematicaでAmazon S3を処理対象とする方法を記載しました。 これにより、指定したバケットにファイルやフォルダをアップロードすることにより、それらをArchivematicaの処理対象として、AIPやDIPを作成することができます。 ただし、このままではプロジェクトのメンバー毎にIAMユーザを作成する必要がありました。 GakuNin RDMの利用 今回はメンバー全員がGakuNin RDMのプロジェクトのメンバーとして登録されていました。 そこで、プロジェクトにAmazon S3を接続して、GakuNin RDMからS3にファイルをアップロードできるようにしてみます。 これにより、IAMユーザの管理が不要になります。 設定方法 アドオンを選択します。 Amazon S3を有効にします。 IAMユーザで作成したアクセスキーIDとシークレットアクセスキーを入力することで、バケットの一覧が表示されます。 結果、GakuNin RDMからAmazon S3にファイルをアップロードできるようになりました。 Archivematicaからも同バケットを以下のように参照できるため、ここからAIPなどを作成することができます。 まとめ GakuNin RDMを利用可能な方に限られてしまいますが、参考になりましたら幸いです。

2024年10月9日 · 1 分 · Nakamura

Archivematicaでフォルダにメタデータを登録する際には、日本語のフォルダ名は避ける

概要 Archivematicaでフォルダにメタデータを登録する際には、日本語のフォルダ名は避ける必要がありましたので、その備忘録です。 メタデータ 以下のような/metadata/metadata.csvファイルを用意することにより、AIPにメタデータを含めることができます。 filename dc.type objects/aaa フォルダ objects/aaa/MARBLES.TGA 画像 この時、aaaを日本語で用意すると、当該レコードに関するメタデータが登録されませんでした。 まとめ 同様のことでお困りの方の参考になりましたら幸いです。

2024年8月27日 · 1 分 · Nakamura

Archivematicaのサンプルデータ

概要 Archivematicaのサンプルデータは以下のリポジトリに格納されています。 https://github.com/artefactual/archivematica-sampledata 補足 Archivematicaでは、Standard, Zipped directory, Zipped bagなど、複数の入力タイプをサポートしています。 これらのタイプごとにどのようなファイルおよびフォルダを用意すればよいのか、という際に、上記のリポジトリのデータが参考になります。 例: メタデータを記述したCSVファイルと共に登録する マニュアルの記載箇所は以下です。 https://www.archivematica.org/en/docs/archivematica-1.16/user-manual/transfer/transfer/#transfers-with-metadata 以下にサンプルがあります。 https://github.com/artefactual/archivematica-sampledata/tree/master/SampleTransfers/CSVmetadata 例: Submission documentationと共に登録する マニュアルの記載箇所は以下です。 https://www.archivematica.org/en/docs/archivematica-1.16/user-manual/transfer/transfer/#create-submission 以下にサンプルがあります。「メタデータを記述したCSVファイルと共に登録する」と同じです。 https://github.com/artefactual/archivematica-sampledata/tree/master/SampleTransfers/CSVmetadata まとめ 参考になりましたら幸いです。

2024年8月23日 · 1 分 · Nakamura

ArchivematicaをDockerで起動する

概要 Archivematicaの起動にあたっては、Dockerを用いる方法が簡単でした。以下にインストール方法が記載されています。 https://github.com/artefactual/archivematica/tree/qa/1.x/hack 手順通りに進めるとうまくインストールできましたが、失敗した点について備忘録として記載します。 Elasticsearch container Elasticsearchのコンテナ起動にあたり、vm.max_map_countを設定するように指示されています。 https://github.com/artefactual/archivematica/tree/qa/1.x/hack#elasticsearch-container この設定を忘れると、以下のように、Elasticsearchコンテナが起動しませんでした。 d [ A e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e d o + ✔ ✔ ✔ ✔ ✔ ✔ ✔ ✔ ✔ ✔ t l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l e c ] t a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a p k C C C C C C C C C C a s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s e e R o o o o o o o o o o c t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t t n r u n n n n n n n n n n h i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i d n t t t t t t t t t t i c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c e c n a a a a a a a a a a n s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s n o i i i i i i i i i i i g e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e c m n n n n n n n n n n n a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a y p g e e e e e e e e e e t r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r o r r r r r r r r r r o c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c f s 1 h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h a e 0 a a a a a a a a a a a - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - i / m m m m m m m m m m r 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l u 0 - - - - - - - - - - c e p m a n c e f g a a a h d y r g l l i e r r r i s c i a a t a c c c v t q h n m s s r h h h e o l i x a t - m i i i m - v - v i 1 a v v v a s 1 e 1 d c n e e e t t m - s d m m m i a a 1 e - a a a c r t a 1 t t t a t i r i i i - : c c c c c d a h a a a a c - - - - - s o s 1 m d m h n t c a c b t o p s p o a r - h - a i a c b s r n g l o e d [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ E [ [ [ [ [ [ e e i a r - 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 R 1 2 2 2 2 2 r - e r v 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 R ] 0 0 0 0 0 s n d e , 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 O : 2 2 2 2 2 a e t - r 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 R 4 4 4 4 4 m r - 1 - a - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - : m - - - - - - v 1 1 r 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 a 0 0 0 0 0 e i c 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 [ x 6 6 6 6 6 l c h - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - 1 - - - - - a e i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ] v 1 1 1 1 1 s - v 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 i 8 8 8 8 8 t 1 e T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T T b r T T T T T i m 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 o t 0 0 0 0 0 c a 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 o u 2 2 2 2 2 s R R R R C R R R C R t : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : t a : : : : : e u u u u r u u u r u i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 s l 1 1 1 1 1 a n n n n e n n n e n c 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 t 6 6 6 6 6 r n n n n a n n n a n a : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : r m : : : : : c i i i i t i i i t i - 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 5 5 5 5 a e 5 5 5 5 5 h n n n n e n n n e n m 0 0 0 0 0 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 7 8 8 0 0 0 0 p m 0 0 0 0 0 - g g g g d g g g d g c , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , o , , , , , 1 p 3 3 4 4 4 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 3 1 9 0 0 1 1 c r 2 2 2 2 2 - 7 7 3 3 3 9 9 9 9 9 9 9 9 9 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 7 4 0 1 3 9 h y 3 5 5 6 6 e c 3 9 3 3 4 6 7 7 8 8 8 8 9 9 9 0 0 0 0 1 1 2 3 3 4 4 4 5 5 5 5 6 6 6 7 4 2 4 9 0 9 0 e 8 3 4 5 8 x l ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] c a ] ] ] ] ] i i [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ k r [ [ [ [ [ t e I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I s e I I I I I e n N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N N a N N N N N d t F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F f s F F F F F - O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O O a O O O O O ( 1 i v 7 , ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] l m ] ] ] ] ] 8 [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ e . [ [ [ [ [ ) a o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o d m o o o o o r . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a . . . . . c e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e x e e e e e h . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . _ . . . . . i e e n n n p p p p p p p p p p p p p p p p p p p p p p p p p p p p p p x x d n n t b m n n n n x v . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . a . . . . . e N N N N N P P P P P P P P P P P P P P P P P P P P P P P P P P P P P P s m D N N T B p N N N N m m o o o o o l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l . . i o o r o _ o o o o . a d d d d d u u u u u u u u u u u u u u u u u u u u u u u u u u u u u u a p s d d a o c d d d d p t e e e e e g g g g g g g g g g g g g g g g g g g g g g g g g g g g g g . . c e e n t o e e e e . i E E i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i s l o s s u N c n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n . . v p t n a a v v s s s s s s s s s s s s s s s s s s s s s s s s s s s s s s F C e o r t t - i i S S S S S S S S S S S S S S S S S S S S S S S S S S S S S S i p r r a i m r r e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e l p y t p [ v c o o r r r r r r r r r r r r r r r r r r r r r r r r r r r r r r e L M S C 6 e p n n v v v v v v v v v v v v v v v v v v v v v v v v v v v v v v R o o e h 5 C - m m i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i o g d r e 5 o s e e c c c c c c c c c c c c c c c c c c c c c c c c c c c c c c l M u v c 3 n e n n e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e l i k 0 t r t t s s e c s ] r v S s e o e t a i l r o g s l - r e e 1 ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] e H ] ] ] ] ] t ] ] ] ] r , ] a o ] [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ n [ [ [ [ [ o [ [ [ [ a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a [ d a a a a a a a a a [ r m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m m a l m m m m m l m m m m a c - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - m e - - - - - o - - - - m h n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n n - r n n n n n w n n n n - i o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o n ] o o o o o , o o o o n v d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d d o d d d d d d d d d o e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e d [ e e e e e i e e e e d m ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] ] e a ] ] ] ] ] n ] ] ] ] e a ] m c ] t u h n v J l l l l l l l l l l l l l l l l l l l l l l l l l l l l l n - u i s p b r s s c c i s e o e V o o o o o o o o o o o o o o o o o o o o o o o o o o o o o o p n s n t u o e t t l l N c i a d r M a a a a a a a a a a a a a a a a a a a a a a a a a a a a a a o i i a b u a o o o o a a n p e s d d d d d d d d d d d d d d d d d d d d d d d d d d d d d p r d n t r l n s p p s s t - g i a e e e e e e e e e e e e e e e e e e e e e e e e e e e e e l s e g i t i d e p p i e i s s n o r d d d d d d d d d d d d d d d d d d d d d d d d d d d d d u e ] a i s i e n d v t [ i a n g g d d l n h o t n d g e o 1 z m [ u m m m m m m m m m m m m m m m m m m m m m m m m m m m m m i [ i i g _ r o g r ] e e 6 m o o o o o o o o o o o o o o o o o o o o o o o o o o o o o n [ c s z a c a . e d d d d d d d d d d d d d d d d d d d d d d d d d d d d d s 0 o c e d p a o g d [ [ 8 n u u u u u u u u u u u u u u u u u u u u u u u u u u u u u ] n o d d u t n e a 5 a . t l l l l l l l l l l l l l l l l l l l l l l l l l l l l l l t v r b t - t 1 m 2 s e e e e e e e e e e e e e e e e e e e e e e e e e e e e e o r r e e l l r s a 2 - 3 a o o r s i e o e m n ] [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ d l l y s s a l r p b o , - a a i i i l l l m p p r r r t t x x x x x x x x x x x x x e e l h s l v a ] d X g n n n n a a a a a e a e e r r - - - - - - - - - - - - - d s e t { i t e i t , e p m g a g g g n n n p r r n i p a i p p p p p p p p p p p p p r y 1 n r c h ] i s s l e e e g g g p e c k n o n b a a a a a a a a a a a a a f / p 7 g [ e s c , d 1 - y s s s - - - e n o - d s s e c c c c c c c c c c c c c r 9 e 2 2 p - , o [ g m s t t t e m p r t l e e i p ] k k k k k k k k k k k k k o 6 . t 6 r 1 m n 1 , a i - - - x u a - - a v x t o - - - - - - - - - - - - - m ] [ 2 o 2 o , m p o ] t s c g u p s i e j t a ] o r c c d g i l m m r s s u w z 3 1 c o r d , - r - o e s r t n x o o l r t c o e r l o l o o e q p a f [ e . a 4 e c u e e X i c m o e e a l t i r ] y - r r p a m g ] n l c l g t i M n 0 4 s l n s b m x o m i r s c e r n ] - n ] e r p ] s i l u ] r c l a ] . n ] s a t s I u x - m o p - s h s a ] u e ] e h t t u r a h e i 3 o m s e D i 1 s m n ] a i e s s r t c ] a o p i d e n a : n h a d l g t o ] g o ] ] ] l t a s r ] t e r [ . n 9 - a v [ [ d , a n e n ] y t h i y ] ] c d 3 l s d [ S [ t ] n ] 4 i ] n ] u c 0 o - r o d - s t ] o g s @ h 0 o s 1 u d m e X ] ] n ] r 1 o } p t , s i t f X ] / 1 s , b o r n T a : s 4 t a p e / a Y u + h ] b c p l s r 5 l U a p o k e a h y C t s r c r u d s a T / e e o n a t r o F d G n v d d - i e b - o 1 e t i _ d c / j S c G l r d a r n s e e f k C a o e d e o e l c Y e , s l r d s a a t e r t l s r s n r s 3 / - i e e , e c t p g 4 X c r [ s w h i o L f X s s s e - c i B 6 : e ( e e n n 1 s n p 7 G a 6 t s f a , e t O 8 1 r 4 t o t a e w 5 R c i { r i f r r ] 6 e h b n 0 c v i c s / s / i g . i e t h 2 e c t s 0 n s / [ 0 r o ) ] . g p - d t 2 v n : 0 r 1 a r 2 e f . b o , t u - P i V 0 o c a e 0 e g e : o e g ] 1 r / r 9 t s e - c r s 3 s s a / 0 e o i 0 t e r d 6 n l o 0 r s m e T t e n } a a v 2 = s p c n / 1 2 . 6 a d r : 5 y . c n - o 3 , m 8 h 1 o 0 l . e b , t : - ] 2 c e ) 5 X 3 k m ] 0 X s s y ] . : ( t s , 0 I B a q 8 n u r l n 7 i i t - e 7 t l e 1 t 1 i d d , 6 a u Z t 3 n s ] i 1 g a , n 2 i b g 5 n l O H 6 x e S e d - _ [ a e 1 s L p a p i O b a n c 9 c u c 4 e x u a / p d [ 6 a d 1 . n ) 1 5 c . . y C 4 0 P o g - e p b 1 r y ] 0 c r , 1 e i 8 n g n - t h e a = t t w 3 s 0 ( t / , c o a ) t m - a d D 2 l 6 e 0 _ 4 s 2 s ] . 2 p , n a e E c J t l e V w a M o s [ [ r t 4 A k i 8 d a c . o d s 2 p d e g t r a b O e r ] p s c , e s h n . t J c B y D a V p K c e / h s O e p . [ e t e n t x J l t D = 4 K 6 ] 0 6 , 4 - - B D i e t s . S n e e r t v w e o r r k V a M d / d 1 r 5 e . s 0 s . . 1 c / a 1 c 5 h . e 0 . . n 1 e + g 9 a ] t i v e . t t l = 1 0 , - X X : + A l w a y s P r e T o u c h , - X s s 1 m , - D j a v a . 0 0 0 0 0 0 0 0 0 0 a . . . . . . . . . . w 0 0 0 0 0 0 0 0 0 0 t s s s s s s s s s s . h e a d l e s s = t r u e , - D f i l e . e n c o d i n g = U T F - 8 , - D j n a . n o s y s = t r u e , - X X : - O m i t S t a c k T r a c e I n F a s t T h r o w , - X X : + S h o w C o d e D e t a i l s I n E x c e p t i o n M e s s a g e s , - D i o . n e t t y . n o U n s a f e = t r u e , - D i o . n e t t y . n o K e y S e t O p t i m i z a t i o n = t r u e , - D i o . n e t t y . r e c y c l e r . m a x C a p a c i t y P e r T h r e a d = 0 , - D l o g 4 j . s h u t d o w n H o o k E n a b l e d = f a l s e , - D l o g 4 j 2 . d i s a b l e . j m x = t r u e , - D l o g 4 j 2 . f o r m a t M s g N o L o o k u p s = t r u e , - D j a v a . i o . t m p d i r = / t m p / e l a s t i c s e a r c h - 7 1 6 2 1 2 9 9 8 5 1 2 0 2 8 1 5 0 9 , - X X : + H e a p D u m p O n O u t O f M e m o r y E r r o r , - X X : H e a p D u m p P a t h = d a t a , - X X : E r r o r F i l e = l o g s / h s _ e r r _ p i d % p . l o g , - X l o g : g c * , g c + a g e = t r a c e , s a f e p o i n t : f i l e = l o g s / g c . l o g : u t c t i m e , p i d , t a g s : f i l e c o u n t = 3 2 , f i l e s i z e = 6 4 m , - D j a v a . l o c a l e . p r o v i d e r s = C O M P A T , - X X : U s e A V X = 2 , - D e s . c g r o u p s . h i e r a r c h y . o v e r r i d e = / , - X m s 5 1 2 m , - X m x 5 1 2 m , - D e s . p a t h . h o m e = / u s r / s h a r e / e l a s t i c s e a r c h , - D e s . p a t h . c o n f = / u s r / s h a r e / e l a s t i c s e a r c h / c o n f i g , - D e s . d i s t r i b u t i o n . f l a v o r = d e f a u l t , - D e s . d i s t r i b u t i o n . t y p e = d o c k e r ] まとめ Dockerによる起動については、開発者のために設計されている と記載されており、プロダクション環境での使用には注意が必要ですが、Archivematicaの使用にあたり、参考になりましたら幸いです。 ...

2024年6月19日 · 34 分 · Nakamura

Archivematicaの日本語ファイル名変換を修正する

概要 デフォルト設定のArchivematicaに日本語ファイル名のファイルを入力すると、「ユースケース公募提案書.docx」というファイル名は以下のように変換されます。 yu-suke-suGong_Mu_Ti_An_Shu_.docx このファイル名変換をカスタマイズする方法について説明します。 概要 ファイル名の変換は以下で行われています。 https://github.com/artefactual/archivematica/blob/qa/1.x/src/MCPClient/lib/clientScripts/change_names.py 具体的には、以下です。 d e c o d e d _ n a m e = u n i d e c o d e ( b a s e n a m e ) Google Colabでの実行例は以下です。 https://colab.research.google.com/github/nakamura196/000_tools/blob/main/unidecodeを試す.ipynb カスタマイズ 今回は、pykakasiを使用してみます。 https://codeberg.org/miurahr/pykakasi また、DockerでArchivematicaを起動しているとします。以下の記事を参考にしてください。 まず、以下にpykakasiを追記します。 https://github.com/artefactual/archivematica/blob/qa/1.x/requirements-dev.txt そして、以下のファイルも修正します。 https://github.com/artefactual/archivematica/blob/qa/1.x/src/MCPClient/lib/clientScripts/change_names.py i i i f i # k # k k k k # c V # A R d m m m r m a a a a a o E L E e p p p o p 初 k テ k k k k コ n R L L P f o o o m o 期 a キ a a a a ン v S e O L r r r r 化 s ス s s s s バ e I t W A c i # d t t t u t i ト i i i i ー r O t E C h f e n を . . . . タ t N e D E a d c o r s i p = ロ s s s s ー e r _ M n b e o s e h d y ー e e e e を r = s C E g a r c d u e k p マ t t t t 作 , H N e s a o e t c a y 字 M M M M 成 = " A T _ e i d d i o k k に o o o o 1 d R _ n n s e _ l d a a 設 d d d d k . i S C a a e d n e s k 定 e e e e a 1 g H m m _ a i a ( ( ( ( k 0 i = A e e V n m i s " " " " a . t R ( a a e m i H K J r s " s r b = l m p . " " " " i e = a = u e = o k , , , , . + a . s e r a g n c " e " E = c t k " " " " e " d o _ n " r o a a a a H t $ m " a : r u n u s " " " e C I a p m o n v n i ) ) ) p o d i e r i e i ( b n $ f l ) ( d r d ) u v " e e : " e t e # # # r e . w ( c c e c n r s r h o r o 平 カ 漢 " t p p " a d . d 仮 タ 字 ) e l u [ n e d e 名 カ を r i n ^ g ( o を ナ ロ ( t c a e b ( ロ を ー # ) ( t - _ a b ー ロ マ " u z n s a マ ー 字 ヘ a A a e s 字 マ に ボ " t - m n e に 字 ン ) i Z e a n に 式 [ o 0 m a ロ 1 n - r e m ー ] 9 e ) e マ c \ c ) 字 h - e に a _ i 設 r . v 定 a \ e c ( d t \ e ) a r ] n s " ) e m p t y f i l e n a m e . " ) 上記の修正を加えて、Archivematicaを再ビルドした結果、以下のようなファイル名に変換されるようになりました。 ...

2024年6月19日 · 4 分 · Nakamura

METSFlaskを試す

概要 以下のMETSFlaskを試します。 https://github.com/tw4l/METSFlask 以下のように説明されています。 A web application for human-friendly exploration of Archivematica METS files [機械翻訳] ArchivematicaのMETSファイルを人間に優しい方法で探索するためのウェブアプリケーション 使い方 以下のサイトで試すことができます。 http://bitarchivist.pythonanywhere.com/ METSファイルをアップロードした結果が以下です。今回は、1つのWordファイルのみが格納されていたため、1つのオリジナルファイルに関する情報が表示されます。 Viewボタンをクリックすると、詳細画面に遷移します。 PREMIS Eventsにおいて、METSファイルのmets:digiprovMDセクションの内容が表示されていました。このセクションは、デジタルプロビナンス(デジタルオブジェクトの起源や履歴を追跡する情報)メタデータを扱うようです。 < < < < < < < < < < < < < < < < < < < < < < < < m m m p p p p / p p p p / p p p p / / p p p / p p p / p p p / / / / / e e e r r r r p r r r r p r r r r p p r r r p r r r p r r r p p m m m t t t e e e e r e e e e r e e e e r r e e e r e e e r e e e r r e e e s s s m m m m e m m m m e m m m m e e m m m e m m m e m m m e e t t t : : : i i i i m i i i i m i i i i m m i i i m i i i m i i i m m s s s d m x s s s s i s s s s i s s s s i i s s s i s s s i s s s i i : : : i d m : : : : s : : : : s : : : : s s : : : s : : : s : : : s s x m d g W l e e e e : e e e e : e e e e : : l l l : l l l : l l l : : m d i i r D v v v v e v v v v e v v v v e e i i i l i i i l i i i l e l W g p a a e e e e v e e e e v e e e e v v n n n i n n n i n n n i v D r i r p t n n n n e n n n n e n n n n e e k k k n k k k n k k k n e a a p o a t t t t n t t t t n t t t t n n i i i k i i i k i i i k n t p r v M > I I I t T D D D t O O O O t t n n n i n n n i n n n i t a > o M D x d d d I y a e e D u u u u O O g g g n g g g n g g g n > > v D T m e e e d p t t t e t t t t u u A A A g A A A g A A A g M Y l n n n e e e a a t c c c c t t g g g A g g g A g g g A D I P n t t t n > T i i a o o o o c c e e e g e e e g e e e g > D E s i i i t i i l l i m m m m o o n n n e n n n e n n n e = = : f f f i n m I / l e e e e m m t t t n t t t n t t t n " " p i i i f g e n > I I / D D e e I I I t I I I t I I I t d P r e e e i e > f n n > e e D I d d d I d d d I d d d I i R e r r r e s 2 o f f t t e n e e e d e e e d e e e d g E m > T V r t 0 r o o a a t f n n n e n n n e n n n e i M i y a > i 2 m r r i i a o t t t n t t t n t t t n p I s p l o 4 a m m l l i r i i i t i i i t i i i t r S = e u n - t a a > N l m f f f i f f f i f f f i o : " > e < 0 i t t o > a i i i f i i i f i i i f v E h U > / 2 o i i t t e e e i e e e i e e e i M V t U 2 p - n o o e i r r r e r r r e r r r e D E t I 4 r 2 > n n / o > T V r > T V r > T V r _ N p D 7 e 6 > > > n y a > y a > y a > 8 T : < 4 m T > p l p l p l " " / / 1 i 0 e u e u e u > > / p 1 s 3 > e > e > e w r 4 : : p > r > A > w e 2 e 3 r A e t r 1 w m - v 4 e r p e c < . i 4 e : s c o s h / l s 6 n 1 e h s t i p o : 7 t 9 r i i < v r c e a T . v v t e e . v - y 0 a e p m m g e 4 p 8 t m r r a i o n 5 e 2 i a y e t s v t d > 5 o t m i : / I a 6 n i c i c l p d - 3 c o s a i r e 9 + s a d : n e n 3 0 y - e l u k m t 6 0 s 1 < i s i i i e : t . / n e n s f - 0 e 1 p k r g / i 7 0 m 6 r i A v e 8 < < < e n p g 3 r e / / / m g k e " T 4 p p p i A < n y 3 r r r s g / t x p a e e e : e p I s e b m m m l n r d i > 6 i i i i t e e : 8 s s s n I m n s a : : : k d i t c 6 e l l i e s i h c v i i n n : f e < e n n g t l i m / n k k A i i e a p t i i g f n r L r D n n e i k V o e a g g n e i a c m t A A t r n l a i e g g I V g u t s T e e d a A e i : i n n e l g > o e m t t n u e n v e I I t e n = e > d d i > t " n e e f I h t n n i d t I t t e e t d i i r n p e f f T t : n i i y i / t e e p f / i r r e i w f T V > e w i y a r w e p l T . r e u y l V > e p o a > e c l > . u g e o > v / p r e m i s / v 3 h t t p : / / w w w . l o c . g o v / s t a n d a r d s / p r e m i s / v 3 / p r e m i s . x s d " v e r s i o n = " 3 . 0 " > mets:mdWrapのChatGPT 4による説明は以下のとおりです。 ...

2024年2月27日 · 46 分 · Nakamura

AIPscanを試す

概要 以下のツールを試します。 https://github.com/artefactual-labs/AIPscan 本ツールは以下のように説明されています。 AIPscan was developed to provide a more in-depth reporting solution for Archivematica users. It crawls METS files from AIPs in the Archivematica Storage Service to generate tabular and visual reports about repository holdings. It is designed to run as a stand-alone add-on to Archivematica. It only needs a valid Storage Service API key to fetch source data. AIPscanは、Archivematicaユーザーにより詳細なレポーティングソリューションを提供するために開発されました。それはArchivematicaストレージサービスのAIPからMETSファイルをクロールして、リポジトリ保有物についての表形式および視覚的レポートを生成します。これはArchivematicaへのスタンドアロンアドオンとして実行されるように設計されています。ソースデータを取得するために有効なストレージサービスAPIキーのみが必要です。 Archivematicaのストレージサービスに格納されたAIPの内容を視覚化します。 本記事は、その使い方について説明します。 セットアップ 以下の記載の通りに進めることでセットアップすることができました。 https://github.com/artefactual-labs/AIPscan?tab=readme-ov-file#installation 試す:ストレージサービスの追加 Archivematica Storage Servicesメニューをクリックし、以下にアクセスします。画面下部のNew storage serviceボタンをクリックします。 ...

2024年2月25日 · 1 分 · Nakamura

sphinxを用いた作成されたドキュメントサイトに日本語訳を追加する

概要 sphinxを用いた作成されたドキュメントサイトに日本語訳を追加することがあり、その備忘録です。 以下を対象にします。 https://github.com/artefactual/archivematica-storage-service-docs 方法 まず、対象リポジトリをForkします。 次に、Cloneします。 g c i d t a c t l o o m n - e d o h c t s t p s : / / g i t h u b . c o m / n a k a m u r a 1 9 6 / a r c h i v e m a t i c a - s t o r a g e - s e r v i c e - d o c s ここでは、Pythonの仮想環境を作成しておきます。 ...

2024年2月12日 · 8 分 · Nakamura

ArchivematicaでAmazon S3を処理対象およびAIPの保存先に設定する

概要 Archivematicaにおいて、Amazon S3上のファイルやフォルダを処理対象として、さらに処理結果であるAIPをS3に保存する方法に関する備忘録です。 S3をストレージとして利用することにより、他のシステムとの連携の容易化や、AIPの長期保存に関する選択肢が増えると考えられます。 ウェルカムコレクションの以下の記事が参考になりました。 https://docs.wellcomecollection.org/archivematica/administering-archivematica/bootstrapping Amazon S3の設定 バケットを作成します。今回、us-east-1リージョンに、archivematica.aws.ldas.jpというバケットを作成しました。 そして処理対象のファイルなどを格納する「transfer_source」、処理結果であるAIPを格納する「aip_storage」というフォルダを作成しておきます。これらの名前や階層は任意で、後述の過程でどのフォルダを使用するか設定できます。 Archivematica Storage Serviceの設定 Dockerを使ってArchivematicaをインストールした場合、以下のようなURLでArchivematica Storage Serviceにアクセスできます。 http://127.0.0.1:62081/ ログイン後、以下にアクセスします。「Create new space」リンクをクリックします。 /spaces/ 「Create Space」の画面で、以下のように入力します。「Access protocol」にS3を選択し、Access Keyなどを入力します。 Staging pathについてはよくわからず、以下の記事の値を入力します。 https://docs.wellcomecollection.org/archivematica/administering-archivematica/bootstrapping#step_7 Spaceを作成後、「Create Location here」を押して、ロケーションを作成します。2つリンクがありますが、どちらも同じでした。 ここで、2つのロケーションを作成します。一つは、以下のような、Purposeを「Transfer Source」とするロケーションです。 Relative Pathについては、「Browse」ボタンから、先に作成したフォルダから選択します。 また上記ではPipelineがひとつですが、複数のPipelineを作成している場合には、関連づけるものを選択することになると思います。 もう一つは、以下のような、Purposeを「AIP Storage」とするロケーションです。 それぞれの画面で、「Set as global default location for its purpose:」という項目がありますが、これをチェックしておくと、後述するデフォルト設定などが不要になります。 確認 ここまでの設定により、/spaces/にアクセスすると、デフォルトのAccess Protocolが「Local Filesystem」のスペースに加えて、Access Protocolが「S3」のスペースが追加されていることが確認できます。 さらに、/locations/にアクセスすると、追加した2つのロケーションが追加されていることが確認できます。 Archivematica Dashboardの設定 Dockerを使ってArchivematicaをインストールした場合、以下のようなURLでArchivematica Dashboardにアクセスできます。 http://127.0.0.1:62080/ AIPの格納先の設定 そして以下にアクセスして、例えばプロセスautomatedを編集します。 /administration/processing/ ...

2024年2月3日 · 1 分 · Nakamura

EC2に立てたArchivematicaをHTTPS対応する

はじめに 以下の記事で、EC2にArchivematicaを立てる方法を記載しました。 今回は、独自ドメインの設定とHTTPS対応を行います。 独自ドメインの設定 今回、matica.aws.ldas.jpとstorage.aws.ldas.jpいうドメインを<IPアドレス>に割り当てます。Route 53を使用します。 SSL証明書の取得 s y y e u u u r d m m t o b i i o s n n t u s s t t c a a e l l r l l t o e c n p e l e r y l t - b r o - e t w l e e b a r s o e o t - w / u s r / s h a r e / n g i n x / h t m l - d m a t i c a . a w s . l d a s . j p - d s t o r a g e . a w s . l d a s . j p Webサーバの設定: Nginxのインストール v i / e t c / n g i n x / c o n f . d / a r c h i v e m a t i c a - a n d - s t o r a g e . c o n f 設定 ...

2023年9月22日 · 6 分 · Nakamura

ArchivematicaのAPIを用いて、TransferからAIPのダウンロードまでを行う。

背景 ArchivematicaのAPIを用いて、TransferからAIPのダウンロードまでを行うことができましたので、メモします。 以前、ArchivematicaのAPI利用と、Storage ServiceのAPI利用をそれぞれ記事にしました。 今回は、上記を組み合わせて、TransferからAIPのダウンロードまでを行います。 方法 以下のノートブックに方法を記載しました。 https://colab.research.google.com/github/nakamura196/ndl_ocr/blob/main/ArchivematicaのAPIを使ってみる.ipynb まとめ ArchivematicaのAPI利用にあたり、参考になりましたら幸いです。 今後は、サーバへの処理対象ファイルのアップロードや、上記のAPIを使用したフロントエンドの開発にも取り組みたいと思います。

2023年6月16日 · 1 分 · Nakamura

ArchivematicaでBrowseがうまくできない場合の原因と対応

概要 ArchivematicaでBrowseを押してもフォルダやファイルが閲覧できない不具合に遭遇しました。この原因と対策について紹介します。 /transfer/ 事象 /administration/storage/ E r r o r r e t r i e v i n g l o c a t i o n s : i s t h e s t o r a g e s e r v e r r u n n i n g ? P l e a s e c o n t a c t a n a d m i n i s t r a t o r . ...

2023年6月7日 · 1 分 · Nakamura

Archivematica AIPのREADMEファイルの日本語訳例

Archivematicaによって作成するAIPには、README.htmlファイルが含まれています。本ファイルをDeepLで翻訳(一部を人手で修正)しました。誤りも多く含まれているかと思いますが、参考になりましたら幸いです。 アーカイブマティカのAIP構造 このReadmeファイルでは、Archivematicaが生成するArchival Information Package(AIP)の基本的な構造について説明しています。 頭字語 AIP = アーカイバルインフォメーションパッケージ METS = メタデータのエンコードと送信の標準規格 OAIS = Open Archival Information System(オープン・アーカイブ・インフォメーション・システム) PDI = 保存記述情報(Preservation Description Information) PREMIS = 保存メタデータ実装ストラテジー UUID = ユニークユニバーサル識別子 はじめに Archivematica は、多様なデジタルコンテンツを取り込み、長期保存のためのAIPを作成するために設計されたオープンソースのツール群です。一度作成されたAIPは、Archivematicaに依存することなく、標準的なファイルブラウザで開くことができます。AIPのコンセプトは、ISO 14721:2012 Reference Model for an Open Archival Information System (OAIS) に由来し、「コンテンツ情報と関連する保存記述情報(PDI)からなり、OAIS内に保存される情報パッケージ」として定義されています。 コンテンツ情報 Archivematica AIPでは、コンテンツ情報は、主に最初に取り込まれたデジタルオブジェクトと、時間の経過とともにフォーマットが陳腐化するリスクを軽減するために作成されたオブジェクトの保存バージョンで構成されています。保存版は通常、元のオブジェクトと同じファイル名ですが、ファイル拡張子が異なり、ファイル名にUUIDが付加されています。たとえば、BBhelmet.aiという名前の元のファイルに対して、保存版の名前はBBhelmet-e3a3988d-8149-49ea-adc5-c255fb68d4f9.pdfである場合があります。 最初に取り込まれたデジタルオブジェクトと保存バージョンは、AIPのobjectsディレクトリに配置されます。もしこれらのサブディレクトリがオリジナルの転送に含まれていたり、SIPの配置中に追加された場合は、objectsディレクトリにネストしたサブディレクトリが存在します。objectsディレクトリには、submissionDocumentationフォルダーとmetadataフォルダーも含まれます。submissionDocumentationフォルダには、ドナー契約や譲渡書などの文書(AIPに含まれている場合)、およびAIPの作成元となった元の譲渡の内容を記録するMETSファイルが含まれます。metadataフォルダには、オリジナルの転送ファイルに含まれるメタデータファイルや、処理中に生成されたOCRテキストファイルが保存されます。 保存説明情報(PDI) Archivematica AIPのPDIは、METS XMLファイルに記録されています。METSは米国議会図書館によって管理されており、その定義は「World Wide Web ConsortiumのXMLスキーマ言語を使用して表現された、デジタルライブラリ内のオブジェクトに関する記述的、管理的、構造的メタデータをエンコードするための標準」です。Archivematica AIPでは、METSファイル名は、METSという名前にUUIDファイル拡張子とXMLファイル拡張子で構成されています。例えば、METS.0ad8cdab-dbbf-4863-8a4d-9a675c227216.xmlのようなファイル名です。METS ファイルは通常、以下の標準 METS セクションで構成されています。 mets:metsHdr (METSヘッダー):METSファイルに関する基本的な情報。 mets:dmdSec(記述的メタデータ・セクション):デジタル・オブジェクトについての記述的メタデータ。 mets:amdSec (管理メタデータセクション): デジタルオブジェクトに関する技術的および出所情報。 mets:fileSec (ファイルセクション): デジタルオブジェクトのリストとAIPにおける役割の表示(オリジナル、保存、メタデータ、提出書類、ライセンスなど)。 mets:structMap(構造マップ):デジタル・オブジェクトの物理的または論理的な順序付け。すべてのAIP METSファイルには、デフォルトの物理的structMapが含まれ、AIPの構造に応じて、物理的または論理的な追加のstructMapを含むことができます。 METS amdSecの技術的および出所情報は、PREMISメタデータとして記録されます。PREMISは米国議会図書館の規格でもあり、「デジタル・オブジェクトの保存を支援し、その長期的な有用性を確保するためのメタデータの国際標準」と説明されている。PREMISエンティティは、METSファイルの中で以下のようにラップされています。 ...

2023年2月9日 · 1 分 · Nakamura