データウェアハウス
データを大量に蓄積・整理したデータベースで、ビジネス上の意思決定に利用する。(情報系データベース)
一方、業務で使用するデータベースを業務系データベース、基幹系データベースということがある。
データウェアハウスは、過去の実績データをの分析に利用する目的なので、長期間保存が原則で、一定期間ごとにデータが追加される。一方、業務系データベースはリアルタイムにデータが追加・変更・削除される。
データウェアハウスに関連する用語
OLAP(Online Analytical Processing)
エンドユーザーが直接データベースを集計して問題点や解決策を探るという分析型アプリケーションの概念。データアクセスが速く、簡単に分析できる機能の提供する。
経営情報を蓄積し、情報を分析することで、意思決定を支援するDSS(意思決定支援システム)と同じ考え。
OLTP(Online Transaction Processing)
ホストコンピューターにオンライン接続された複数の端末からホストコンピューターにメッセージを送り、その内容に従ってホストコンピューターが処理をして即座に結果を送り返す処理形態。業務系データベースの処理形態はOLTP。
データマート
データウェアハウスから特定の目的に応じて抽出、要約したデータを格納したデータベース。
データウェアハウスのサブセット。
データマイニング
膨大な生データから経営やマーケティングなどにとって必要な傾向、相関関係などを、統計解析やニューラルネットワークなどの手法を使って導き出す技術・手法。
データ資源の管理
データ資源の管理とはデータベースのデータ量が多くなったときに、データをどう管理するか?って話。
IRDS(Information Resource Dicitionary System)
情報資源辞書システムという。
データ辞書を発展させたもので、情報資源全体を管理するために用いる。
データ辞書とは、データの項目の名前や意味をまとめた辞書。データの重複や同じ意味で異なる名称のものが存在する事によるデータの肥大化を防ぐことができる。
メタデータ
データそのものではなく、データについて記述したデータのこと。データの属性、意味、保存場所などの情報。
メタデータを管理するデータベースをリポジトリという。
DD/D(Data Dictionary/Directory)
データディクショナリ/ディレクトリ。
メタデータを収集・保存・提供するための仕組み。
データディクショナリはデータを人間が記述したもの、データディレクトリはデータディクショナリをコンピューター向けに翻訳したもの。