データレイク・データウェアハウス(DWH)・データマートそれぞれの違い、メリット・デメリットを紹介!

ビッグデータをはじめ、膨大かつ多様な情報が存在する現在、データを効果的に活用・分析することが企業には求められています。そこで重要になるのがデータ分析基盤の構築です。本記事では、データ分析基盤を構成するデータレイク・データウェアハウス(DWH)・データマートの特徴やメリット・デメリットをご紹介します。

- お役立ち資料
- データ分析基盤構築ガイドブック
現代において重要なデータ分析基盤構築
膨大な量の情報が存在する現代社会では、企業で取り扱うデータ量も急激に増加しています。また、データ量が増加しているだけではなく、ビッグデータをはじめ現代のデータにはさまざまな形態や大きさ、種類があり、そうしたデータをいかに分析・活用するかによって企業の成長が左右されるといわれています。
ビッグデータの効果的な分析・活用を実現するためには、データ分析基盤を構築することが重要です。データ分析基盤にはデータの収集・蓄積・活用というフェーズがありますが、以下では特に重要であるデータの蓄積(データレイク・データウェアハウス(DWH)・データマート)についてご紹介します。

- クラウド型 ERP 導入で進む「 ERP 一本化施策」の悪影響と対策
- ERP ブームから 20 年経った現在では、新たに「クラウド型 ERP 」の導入が進められています。近年の流行でもあるクラウド型 ERP の導入を成功させるためには、 ERP 導入の本質を理解しておくことが重…
Warning: Undefined array key "caption" in /home/xs621032/tmedia.jp/public_html/lakeel-wp-test.tmedia.jp/wp-content/themes/lakeel-new/single-column.php on line 126
あらゆるデータを蓄積する:データレイク
Warning: Undefined array key "caption_image_view" in /home/xs621032/tmedia.jp/public_html/lakeel-wp-test.tmedia.jp/wp-content/themes/lakeel-new/single-column.php on line 132
データレイクとは
データレイクとは、データの構造や大きさ、性質、種類などにかかわらず、あらゆるデータをそのままの形で集めて保存できる格納庫のことです。規則性を持つ構造化データや、文書や画像などの非構造化データを形にとらわれずに保存できる点が特徴です。
大量のデータが泳ぐことのできる「湖」(Lake)という意味合いから、データレイクと名付けられています。
Warning: Undefined array key "caption_image_view" in /home/xs621032/tmedia.jp/public_html/lakeel-wp-test.tmedia.jp/wp-content/themes/lakeel-new/single-column.php on line 132
データレイクのメリット・デメリット
データレイクのメリットとして、収集したデータを未加工の形で保管できることにより、データの一元管理が可能な点が挙げられます。構造化する手間がなく、瞬時にローデータ(生データ)を格納するため、コストをかけずに大量のデータを保存でき、かつ高速でのデータ処理や全社を横断したデータ共有が可能です。
柔軟性のあるローデータを保存でき、任意の目的で迅速に分析できるため、機械学習のシステムに応用するのが理想的です。
デメリットとして、データが未加工の状態で保管されているため、分析に工数がかかる場合があります。技術的な知識がない人にとっては使いにくく、誰もが簡単かつ自由に活用できるわけではない点には留意が必要です。
構造化されたデータを保管する:データウェアハウス(DWH)
Warning: Undefined array key "caption_image_view" in /home/xs621032/tmedia.jp/public_html/lakeel-wp-test.tmedia.jp/wp-content/themes/lakeel-new/single-column.php on line 132
データウェアハウス(DWH)とは
データウェアハウスは、基幹系システムなどから収集したデータを活用するための保管場所のことです。データレイクとは異なり、ローデータではなく処理済み、構築済みのデータを蓄積します。データウェアハウス内では、これらのデータがサブジェクトと呼ばれるまとまりごとに整理・保管されています。
あらゆるデータをそのまま保存するデータレイクとは異なり、さまざまなフォーマットのデータを分析しやすいよう集約・整理しているため、検索が容易な点が特徴です。
Warning: Undefined array key "caption_image_view" in /home/xs621032/tmedia.jp/public_html/lakeel-wp-test.tmedia.jp/wp-content/themes/lakeel-new/single-column.php on line 132
データウェアハウス(DWH)のメリット・デメリット
データウェアハウスのメリットは、データをすべて時系列順に保管できる点です。そのため、過去のどの時点で保存されたのか把握でき、分析に際して総合的な判断や的確な意思決定が可能です。
一方、データレイクと違い、あらかじめ決められた目的でしかデータを活用できないため、定型的な分析に陥りやすい点がデメリットです。
目的や用途に沿って抽出する:データマート
Warning: Undefined array key "caption_image_view" in /home/xs621032/tmedia.jp/public_html/lakeel-wp-test.tmedia.jp/wp-content/themes/lakeel-new/single-column.php on line 132
データマートとは
データマートとは、データの利用部門や用途、目的などに応じて必要なものだけを抽出し、利用しやすい形に加工したうえで格納する場所を指します。情報が網羅的に格納されるデータウェアハウスとは異なり、データマートはデータを目的や用途ごとに小分けした「マート」(店)というイメージです。
Warning: Undefined array key "caption_image_view" in /home/xs621032/tmedia.jp/public_html/lakeel-wp-test.tmedia.jp/wp-content/themes/lakeel-new/single-column.php on line 132
データマートのメリット・デメリット
データマートは、目的や用途に沿って抽出・保管されているため、迅速かつ容易にデータを取り出せる点がメリットです。また、特定の情報の収集や分析を目的としているため、既存のデータウェアハウスをもとに簡単に作成できるメリットもあります。
一方、目的や用途によって抽出されたデータであるため、重層的・多角的な分析に向かない点はデメリットです。
近年は顧客のニーズの変化が激しくなっており、データマートでは対応しきれなくなりつつあります。要件に合わせてデータマートの数が増えると、修正などに多くの手間やコストがかかってしまうからです。また、部門の要件ごとにデータマートを作成すると、データ活用の仕方が部門ごとに異なってしまう点もデメリットです。
データレイク・データウェアハウス(DWH)・データマートの関係性
データ分析基盤は、前述のデータレイク・データウェアハウス・データマートが段階的な層をなすことで構築されています。
さまざまな形や性格・種類のローデータをそのまま保管する湖のような層がデータレイクであり、データレイク内のデータを分析しやすいように加工し、保管する層がデータウェアハウスです。そして、データウェアハウスに保管された情報のうち、目的や用途に沿って抽出したものを保管する層をデータマートと呼びます。これらを通じて段階的に収集→構造化→集計・集約・抽出することで、データは活用しやすくなります。
Warning: Undefined array key "caption" in /home/xs621032/tmedia.jp/public_html/lakeel-wp-test.tmedia.jp/wp-content/themes/lakeel-new/single-column.php on line 126
データ分析基盤を単独で構築することは考えない。併用して行うことが重要
前述の通り、データレイク、データウェアハウス、データマートは3層構造となっており、データ分析基盤を支える重要な要素です。それぞれが密接に関連しているため、データ分析基盤を構築する際、これら3つの要素を単独で構築してしまうとメリットを十分に享受できません。それぞれを併用して統一的に基盤を構築し、データ活用につなげる必要があります。
データ分析基盤の構築のポイントについては以下リンクの記事で詳しく説明していますので、あわせてご覧ください。
ラキールが提供している「LaKeel Data Insight」では、データレイク、データウェアハウス(DWH)、データマートの3層を併用しながらデータ管理、構築、連携処理が可能です。蓄積されたデータは、技術的な特性を意識することなく簡単な操作で利用できるほか、データがカタログ化されているため、アクセスが容易でありながら強固なセキュリティを実現しています。
また、「LaKeel Data Insight」のデータはAPIで取り出せるため、レポート作成やAIなどさまざまなアプリケーションと連携が可能です。これによりサイロ化を回避し、効率の良いデータ活用が可能となります。
以下の資料では、データの収集、蓄積、加工、分析を一貫して行える「データ分析基盤」について詳しく解説しています。ご興味のある方は、ぜひダウンロードしてお役立てください。
Warning: Undefined array key "caption" in /home/xs621032/tmedia.jp/public_html/lakeel-wp-test.tmedia.jp/wp-content/themes/lakeel-new/single-column.php on line 126
データマートそれぞれの違い、
メリット・デメリットを紹介!」

- お役立ち資料
- データ分析基盤構築ガイドブック
Warning: Undefined variable $olumn_bnr_service_lp_post_id in /home/xs621032/tmedia.jp/public_html/lakeel-wp-test.tmedia.jp/wp-content/themes/lakeel-new/single-column.php on line 185

このコラムを書いたライター

本サイトでは、企業のDX推進に役立つ様々な情報をお届けしています。