情報セキュリティマネジメント試験の公開問題を解こう!(令和7年度・科目A・B)(11)「データウェアハウス、データレイク、データマート」

ITの基礎

情報セキュリティマネジメント試験の令和7年度の公開問題(科目 A・B)を解こう。

今回のテーマは、「データウェアハウス、データレイク、データマート」である。

令和7年度 情報セキュリティマネジメント試験 公開問題 科目 A・B 問11

問11 企業全体で使用するデータを統合・整理したデータウェアハウスから、特定の分析
目的のためにデータを加工して構築したものはどれか。
ア データカタログ
イ データマート
ウ データリネージ
エ データレイク

答えを確認する

正解は イ です。

データマートとは

データマート(Data Mart)とは、データの市場(mart)という意味です。

通常、市場では、魚類を扱う所、肉類を扱う所、青野菜を扱う所、日用品を扱う所など、購入者の購入用途や目的などに応じて、売りものを棚に並べます。
(略)
これと同様に、システムに蓄積された膨大なデータの中から、データ利用者の用途、目的などに応じて必要なものだけを抽出、加工し、利用しやすい形に格納したデータベースのことを、データマートと呼びます。

ちなみに、データ利用者の用途、目的などに応じて必要なものを利用しやすくしたものがデータマートですが、特定の目的に限定せず、複数のシステムからデータを集めてきた倉庫のようなものをDWH(データウェアハウス)と言います

つまり、データマートは「DWHの中から、特定の目的に合わせて抜き出したもの」と言うことができます。
(株式会社NTTデータ バリュー・エンジニアのWebサイトより)
アンダーライン:筆者

それでは、各肢を検討していこう。

ア 誤り。

データカタログとは、

「データのカタログ」という、そのままの意味です。

とは言っても、どんなものかイメージが沸きづらいかもしれませんので、まずは、一般的なカタログ冊子を思い浮かべていただくと良いかと思います。

カタログ上で品物を探す時、人によっては、一通りに目を通して「欲しいと思える品物があるかどうか」を見たい場合もあると思います。

また、人によっては欲しいものが大体決まっていて「どんな色があるのか、どんな大きさがあるのか」などバリエーションを見たい場合もあると思います。

そのようなニーズに合わせて、全体の品揃えがわかるページを用意したり、索引を載せたりして、そこから各品物が記載されたページを探せるようにしたり、各ページでは、どのようなパリエーションがあるのかを記載したりするわけです。

これと同様にデータカタログも「欲しいと思えるデータがあるかどうか」を検索できる機能を用意したり「そのデータには、どのようなバリエーションがあるか」がわかるような機能が用意されます。
なお、データカタログで管理されるデータ(例:データ項目名、データの意味など)を、メタデータと呼びます。

(株式会社NTTデータ バリュー・エンジニアのWebサイトより)
アンダーライン:筆者

イ 正解。

ウ 誤り。

データリネージとは、

今日では、基幹システムで作成されたデータをDWHに蓄積し、データマートやBIで高度に利用することが企業の情報システムで主流となっています。

利用されるデータがどこで登録され、どのシステムを経由し、なおかつどのように加工されて眼前に至っているのか、源泉から現在地点までのデータの変遷のことをデータリネージ(リネージとは系統・血統を意味する)と呼びます。

データリネージを明らかにすることによって、データの意味や位置づけが明確になり間違ったデータ利用を抑制することができます。

また、システム刷新に際して予め現行システムのデータリネージを調査しておくことは、重複したデータ取得・加工処理や複雑なデータ流通経路を排除したシンプルなシステムの構築に繋がります。
(略)

(株式会社NTTデータ バリュー・エンジニアのWebサイトより)
アンダーライン:筆者

エ データレイクとは

2010年頃にデータレイクという概念が登場し、企業は膨大な量の多種多様なデータを格納することが可能になりました。
ビッグデータ時代の到来に伴い、企業が取り扱うデータも多様化する中で、データレイクは、あらゆる形式の構造化データ、非構造化データを蓄積することができ、データウェアハウスのような、事前のややこしい設計が不要であるという点で関心を引いています。

しかし、無目的にデータを集め続けていった結果、どんなデータが格納されているのか把握できなくなり、データレイクは“湖”どころか、データスワンプ、つまり“濁った沼”になってしまっているケースも少なくありません。
そうしたデータレイクの惨状を救うために誕生したのが、データカタログであると推察されます。
(略)
(株式会社NTTデータ バリュー・エンジニアのWebサイトより)
アンダーライン:筆者
データレイク(Data Lake)とは、データの湖(Lake)という意味です。

これの対比語としてデータスワンプ(Data Swamp:データの沼地)があります。
沼には、いろんな魚が住んでいるかもしれませんが、水が濁っているため、どこにどんな魚がいるか全く見えません。
(略)
その一方で、湖は、水が澄んでいるため、魚を見ることができ「おっ!魚がいるな。何とか捕まえてみよう」と思えます。
この沼と湖にいる魚を、データの例えとして使っているのが、データスワンプと、データレイクという言葉です。

つまり、どこにどんなデータがあるかわからず、欲しいデータを捉えることができない状態をデータスワンプと呼び、どこにどんなデータがあるかがはっきりわかり、欲しいデータを捉えることができる状態をデータレイクと呼びます。
(略)

(株式会社NTTデータ バリュー・エンジニアのWebサイトより)
アンダーライン:筆者

(解法のポイント)
初見なら本問はかなり難しかったのではないだろうか。
この機会に知識の整理をしておこう。

コメント

タイトルとURLをコピーしました