目次
メタデータ管理とは、どのようなデータをどのように管理することなのか具体的に紹介します。
メタデータは「データのためのデータ」と表現されます。あるファイルAについて、以下のようなデータがメタデータです。
Aというファイルを説明するための付帯情報がメタデータといえます。
メタデータは次の3種類に分けることができます。
テクニカルメタデータとはITにおける物理的なメタデータです。データベースのカラムのプロパティやアクセス権などが含まれます。
ビジネスメタデータとは業務に関するメタデータのことを指します。業務の中で使われる名称、業務ルールや変換ルール、計算方法などもビジネスメタデータとして扱われます。
オペレーショナルメタデータとは、システムを運用する過程で作られるメタデータです。プログラムの実行ログ、データの抽出や更新結果などの履歴情報などが含まれます。
身近なWordやExcel、PDFデータなど全てのファイルにメタデータが存在します。それらのメタデータは簡単に確認することができます。確認したいファイルを選び、Windowsなら右クリックで「プロパティ」を、Macならファイルから「情報を見る」を選びます。
すると、そのファイルの種類やサイズ、作成日や最終変更日などが記載されていますが、これらがメタデータです。付帯情報なので、そのファイルに付帯して管理されています。
メタデータを図書目録に例えることができます。図書目録がない状態で、図書館からタイトルだけで1冊の本を探すには時間がかかるものの見つけ出すことは可能でしょう。しかし、「10年前に出版された鳥に関わる本」を全て探さなければいけない場合、1冊も漏らさず見つけ出すのはとても困難です。
このようなとき、図書目録として出版日や内容に関するメタデータが登録されていれば、欲しい本を簡単に探せるようになります。
メタデータ管理が重要視されている理由は、データの利活用が注目されているためです。
例えば、メタデータを活用して、さまざまな情報からデータを分析することで商品やビジネスプロセスの改善に役立てることができます。また、データをどのように扱っているのか、という点に注目するとセキュリティ等の強化にもつなげられます。
メタデータは情報量が多いので、それぞれのデータにどのような意味があるのか、どこに整理しているのかなどを管理しておくことが大切です。管理しておくことで必要な情報をすぐに取り出し、分析できます。
例えば、メタデータを活用するシーンにはこのようなものがあります。
電子帳簿保存法の「検索系の確保」では、保存した請求書などの膨大なファイルに対して日付や金額、取引先などを検索できるようにすることが必要です。さらに、検索では範囲検索や複数条件を組み合わせて検索することも求められます。もし、メタデータを付与せずに、日付や金額がファイルを開かないとわからない状態では、検索性を確保することができません。ファイルに対して関連するメタデータを付与することで、そのメタデータを検索し、目的のファイルを探し出すことができるので、電子帳簿保存法の「検索性の確保」を満たすことができます。
メタデータ管理をすることで具体的にどのようなメリットがあるのかご紹介します。
メタデータ管理ができていないと、データの量が多すぎる上、社内のさまざまなシステムに分散しているデータの中から、必要なデータを探し出すのはとても大変です。
メタデータ管理をすることで、どのようなデータがどこにあるのか、が可視化できるようになり、結果としてデータを活用するための準備期間が短縮され、データ分析を素早く行うことができます。また、間違ったデータを利用してしまい、その分析結果やそのデータを元にした意思決定に影響が出てしまうリスクも下がります。
各データでは次のようなことをメタデータで管理することができます。
これらを確認することでデータが適切に管理されているのか、適切な方法でのみ利用されているのかを監視できるようになります。
特に、個人情報については厳重な管理が必要です。ただのデータとして管理するだけではなく「個人情報である」ことをフラグなどで追加することにより、利用者が注意を払いやすくなり、適切なセキュリティレベルを確保できるようにもなります。
一方、メタデータの内容を知らずにファイルを公開してしまうことで、メタデータ内にあった個人情報などが流出してしまう可能性がある点では取り扱いに注意が必要です。便利な反面、注意事項もある点を認識しておくと良いでしょう。
メタデータ管理の具体的な手順をご紹介します。
どのような目的のためにデータを集めるのかを明確にします。例えば、「商品開発」や「セキュリティ強化」などです。
目標を決めずに「とりあえずデータを見てみたい」という理由でデータ収集を始めると、データの量が膨大になりすぎてしまいます。
前段階で決めた目標に合わせて必要となるデータを決めます。必要な情報を過不足なく集めるために重要な工程です。データが足りないと正しい分析が難しくなります。
必要なメタデータを作成します。ツールを使ったりIT担当者と業務担当者が連携したりして品質の高い有効なデータを収集します。
また、データには鮮度があるので、必要に応じて新しいデータを取り入れ更新する必要もあります。
メタデータ管理をする上で、注意しておいた方が良いことをご紹介します。
メタデータの収集・管理には時間がかかります。そのため、必要なものを過不足なく集めるということが重要です。
まず前述した管理の手順に基づき必要なデータを考えます。すでに手元にある、もしくは収集可能なデータの中から必要なものをピックアップすると、本当に必要なものが集まらなくなるリスクがあります。
また、「いつか必要になるかもしれないから」という理由で集められるだけ集めてしまおうと考えてしまいがちですが、収集と管理にかかる時間を考えると必要になってから集めた方が効率が良いでしょう。事前に集めておくとデータの鮮度が落ちてしまい、結局、使えなくなってしまうかもしれません。
データは会社のさまざまな部署でそれぞれが管理していることが多いです。また、部署によって利用しているシステムが違います。メタデータ管理をする際はこれらを一元管理できるようにデータ同士の連携をすることが大切です。
データ連携をして情報収集するには、メタデータ管理ツールの活用がおすすめです。ツールを導入することでデータ収集の時間を短縮し、IT部門に頼らなくても現場主導で必要なデータが集められるというメリットがあります。
また、一旦データをDWH(データの倉庫)に保管し、必要なときにメタデータを元にデータを探し出して活用することも可能です。
具体的なメタデータ管理事例をご紹介します。
メディア事業やインターネット広告事業などを展開している株式会社サーバーエージェントでは、DX推進の一環としてデータ活用の強化を検討していました。しかし、さまざまなシステムを利用していたため、データが散在している点が課題でした。また、新しいサービスの利用やフォーマットの変更があると、システム開発が完了するまで手動でデータ収集をしなくてはいけない点も改善したいと考えていました。
そこで、データ連携ツール「ASTERIA Warp(アステリア ワープ)」を導入し、クラウドDWH(データの倉庫)にデータを集約し、必要なときに分析できるようにしました。DWHにあるデータはメタデータで分類も可能なので必要な時に必要なデータを確認できます。
この事例についての詳細はこちらのページでご確認ください。
メタデータ管理とはデータのデータを管理することです。メタデータ管理をすることでデータの属性を確認することができデータの利活用がしやすくなります。また、システム開発や運用保守、セキュリティに生かすこともできるのがメリットです。
メタデータ管理をする際は、管理ツールを使って管理したり、DWHに一旦データを集めて必要なときに必要なデータを取り出して使用する方法があります。
ASTERIA Warpではさまざまなシステムとのデータ連携がノーコードで可能です。IT部門に依頼せずとも現場が欲しいと思うデータを自分で集められるようになるため、迅速にデータ分析を始められます。具体的にどのような方法でメタデータ管理をしているのか知りたい方は、こちらの資料がおすすめです。
ASTERIA Warp製品の技術情報やTips、また情報交換の場として「ADNフォーラム」をご用意しています。
アステリア製品デベロッパー同士をつなげ、技術情報の共有やちょっとしたの疑問解決の場とすることを目的としたコミュニティです。