DROIDで見つける隠れたファイル形式の問題:デジタル保存の必須ツール
デジタルアーカイブや長期保存を担当している方なら、「このファイル、本当に拡張子通りの形式なのか?」と疑問に思ったことがあるはずです。今回は、そんな疑問を解決してくれる強力なツール「DROID」について、実際の分析結果を交えながら紹介します。 DROIDとは? DROID(Digital Record Object Identification)は、英国国立公文書館(The National Archives)が開発したファイル形式識別ツールです。ファイルの拡張子だけでなく、ファイルの内部構造(シグネチャ)を分析 して、真の形式を特定します。 DROIDの主な機能 バイナリシグネチャによる識別 :ファイルの内容を直接分析 PRONOMレジストリとの連携 :15,000以上のファイル形式データベースを活用 一括処理 :フォルダ単位での大量ファイル分析 拡張子ミスマッチの検出 :拡張子と実際の形式の不一致を発見 CSV出力 :分析結果をデータとして活用可能 なぜDROIDが必要なのか? デジタルファイルには、以下のような問題がよくあります: 意図的な拡張子変更 :ファイル形式を隠すため 誤った拡張子の付与 :人為的ミスやシステムエラー 形式変換時の拡張子未更新 :変換後に拡張子が古いまま 拡張子のない/不明なファイル :古いシステムからの移行時など これらの問題は、長期保存計画や移行戦略に深刻な影響 を与える可能性があります。 実例で見るDROIDの威力 実際にDROIDで分析したデジタル保存ワークショップのサンプルファイルから、興味深い問題が複数見つかりました。 🚨 発見された主な問題 1. 音声ファイルが画像ファイルを装っている フ 拡 実 P M 状 ァ 張 際 U I 態 イ 子 の I M : ル : 形 D E 名 式 : E : . : T X t f y T 4 i W m p E 1 f a t e N 2 ( v / : S 0 T e 1 I 1 I f 4 a O 6 F o 1 u N _ F r d _ _ 画 m i M s 像 o I k 形 A / S y 式 u x M m を d - A a 示 i w T r 唆 o a C y ) v H _ ( _ P = c C a M t t W r - A u p V e u E r F r O i R n M g A - T a ) n d - m e o w . t i f 問題点 :画像として扱われる可能性があり、適切な音声再生ツールでアクセスできない恐れがあります。 ...