初心者向けのデータ モデリングの概念

初心者向けのデータ モデリングの概念

ソースノード: 2623283
データモデリングの概念データモデリングの概念

データ モデリングの概念は、データがシステム内をどのように移動するかの全体像をサポートします。 データ モデリングは、データ システムまたはデータ システムの一部を設計するプロセスとして説明できます。 これらのモデルは、ストレージ システムからデータベース、組織のデータ構造全体に至るまで多岐にわたります。 データ モデルは、新しいシステムを実装するための設計として、またはすでに確立されているシステムの参考資料として使用できます。 

「完全な」データ モデルは、データ システム内で使用および保存されるデータの種類、使用される形式、データ ファイル間の関係、およびデータをグループ化して編成する方法を伝達する必要があります。

多くの企業は、組織の特定のニーズと要件に基づいて構築された独自の個別データ モデル (およびその結果として得られる独自の個別データ システム) を開発しています。 これらのモデルを使用して、システム内のデータの移動を視覚化できます。 データ モデルは、組織内のデータ フローのあらゆる側面や、研究目的で販売データのみを表示するなどの特定のパラメーターをカバーしようと試みることができます。

適切に設計されたデータ モデルは、次のことを説明します。 ビジネスルールの必要性だけでなく、 企業コンプライアンス データの。

データ モデリング プロセスには、概念モデル、論理モデル、物理モデルの XNUMX つのフェーズがあります。 モデル開発の各フェーズ、つまり段階は、特定の目的を果たします。 さらに、モデルにはいくつかの「タイプ」があります。

ビジュアル データ モデルはアーキテクトの設計図に似ており、データ システムを開発または変更する際のガイダンスを提供するリンク テキストでサポートできます。 ビジュアルデータモデルの例は次のとおりです。 こちら.

データモデリングの利点と課題

データ モデルを開発すると、データ システムを作成または変更するためのマップと通信ツールが提供されます。 データ モデリングの概念により、データ システムの構築が非常に簡単になります。 新しく構築されたデータベースやデータ システムは、良好な組織コミュニケーションをサポートする必要があります。 また、支出パターン、請求書、その他のビジネス プロセスに関するデータの収集など、リアルタイム プロジェクトもサポートする必要があります。

データ モデリング プロセスを使用して、 データ品質の問題、重複データ、冗長データ、欠落データなど。

データ モデルを作成する際の困難の XNUMX つは、データ システムの理解が欠如していることです。通常、この問題はモデルを構築することで解決されます。 もう XNUMX つの問題は、ある領域での小さな変更が他の領域で大きな変更を必要とする場合があることです。 さらに、データ システムの構造に注目するあまり、個々のアプリケーションの長所と短所が無視されがちです。

重要な質問

データ モデルの開発は、組織のニーズ、要件、目標に関する情報を収集することから始まります。 システムの一部のモデルは、まったく新しいシステムのモデルを開発するよりも、必要な質問が少なくなります。 システムの一部のモデルについて尋ねるべき基本的な質問は次のとおりです。 

  • 変更の目的または目標は何ですか?
  • システムは現在どのような種類のデータを扱っていますか?
  • どのようなデータが必要ですか?
  • 目標を達成するにはどのようなツールやソフトウェアが必要ですか?
  • ツールやソフトウェアには互換性がありますか?

データ モデルは組織のニーズに基づいて構築される必要があり、新しいモデルを開発したり、古いモデルを調整したりする際の重要な要素となります。 データベースやまったく新しいシステムを設計するときに尋ねられる質問には、より広範な回答が必要になることがよくあります。 以下の質問に答えるときは、XNUMX 年間の事業計画を組み込むことが最善です。 

  • ビジネスの目標 (研究、販売、アプリ開発、会計サービス) は何ですか? これにより、ビジネスをサポートするのに最適なソフトウェアの種類 (研究用の NoSQL またはグラフィックス、基本的な販売または会計用の SQL、アプリ開発用のさまざまなクラウドまたは複数のクラウド サービスへのアクセス) が決定されます。
  • 組織にとって最も適切で費用対効果の高いソフトウェアの種類は何ですか?
  • 何人が同時にシステムにアクセスしますか?
  • 部門は何つあり、各部門には何名いますか?
  • 部門ごとに異なる種類のソフトウェアが必要になるでしょうか?
  • 考慮すべき異常なニーズはありますか? 
  • どれくらいの量のデータを保存する必要がありますか?
  • スケーラビリティが問題ですか?
  • データベースに接続しますか? ビジネスインテリジェンスツール?
  • オンライン分析クエリ (OLAP)、トランザクション処理 (OLTP)、またはその両方が必要ですか?
  • データベースは現在の技術スタックと統合されますか?
  • データの形式を変換する必要がありますか?
  • あなたの好きなプログラミング言語は何ですか?
  • 機械学習ソフトウェアと統合されますか?

データモデリングの XNUMX つのフェーズ

データモデリングが重要になった 1960の間に、経営情報システムが普及し始めた頃。 (60 年代以前は、実際のデータ保存手段はほとんどありませんでした。当時のコンピューターは基本的に巨大な計算機でした。) 

データ モデリングの概念に関して言えば、完全に開発されたデータ モデルは、多くの場合、概念モデル、論理モデル、物理モデルの XNUMX つのフェーズで構築されます。 この設計プロセスにより、データ システムとデータがシステム内をどのように流れるかを明確に理解できます。 このプロセスは、ストレージ プロシージャがどのように機能するかを示し、システム内のすべてのデータ オブジェクトが確実に表現されるようにするのにも役立ちます。 (データが電子的に保存された情報である場合、データ オブジェクトは、ファイルやデータ テーブルなど、電子的に保存された情報の個々の集合です。)

概念的なデータモデル 通常、システムの最も基本的なコンポーネントと、システム内でデータがどのように移動するかを説明するために使用されます。 の 概念的なデータモデル 情報がどのようにある部門を通過し、次の部門に移動するかを伝えます。 これは、広範なエンティティ (現実に存在するものの表現) とその関係 (XNUMX つ以上のエンティティの間に存在する関連) を示します。 詳細な情報は基本的に省略されます。

論理データモデル 通常、モデル内のデータ オブジェクトのレイアウトと構造に焦点を当て、それらの間の関係を確立します。 また、物理モデルを構築するための基盤も提供します。 の 論理データモデル 有用な情報を概念モデルに追加します。

物理データモデル 本質的には 実装前モデル 非常に詳細であり、多くの場合データベース設計に重点が置かれています。 データベースの開発に必要な詳細が表示されます (ただし、システムの新しい部分を実装するために使用することもできます)。 このデータ モデリングの概念により、データベースの制約、列キー、トリガー、その他のデータ管理機能を伝達することで、データ構造の視覚化が大幅に容易になります。 このモデルは、アクセス プロファイル、承認、主キーと外部キーなども伝達します。

さまざまな種類のデータモデル

以下に、さまざまなタイプのデータ モデルの例をいくつか示します。

階層モデル かなり古く、1960年代から70年代に非常に人気がありました。 データをツリー状の構造に編成します。 現在では、主にファイル システムと地理情報を保存するために使用されています。 の中に 階層モデル、データはデータ ファイルと XNUMX 対多の関係に編成されます。

ネットワークモデル 階層モデルに似ており、リンクされたレコードとのさまざまな関係を作成できます。 の ネットワークモデル 関連するレコードのセットを使用してモデルを構築できるようになります。 各レコードは複数のファイルおよびデータ オブジェクトに関連付けられており、複雑な関係を促進および表現します。

エンティティ関係モデル データ ファイルとエンティティ、およびそれらの関係をグラフィカルに表現したものです。 現実世界のシナリオを作成しようとします。 データ システム モデルとしては、 実体関係モデル エンティティ セット、関係セット、属性、および制約を作成します。 これらはリレーショナル データベースの設計によく使用されます。

グラフデータモデル データセット内のどのエンティティをノードに指定し、どのエンティティをリンクに指定し、どのエンティティを破棄するかを決定する必要があります。 グラフデータモデル データのエンティティ、プロパティ、および関係のレイアウトを提供します。 このプロセスは反復的で、試行錯誤が必要で、退屈な場合もありますが、正しく行う価値があります。  

オブジェクト指向データベースモデル メソッドと機能に関連付けられたデータ オブジェクトに焦点を当てます。 テーブルが組み込まれていますが、必ずしもテーブルに限定されるわけではありません。 データとその関係は、単一のエンティティ (データ オブジェクト) として一緒に保存されます。 データ オブジェクトは現実世界のエンティティを表します。 の オブジェクト指向データベースモデル さまざまな形式を処理し、研究に使用されます。

リレーショナルモデルは SQL とも呼ばれ、現在最も人気のあるデータ モデルです。 データの保存と関係の伝達には XNUMX 次元テーブルが使用されます。 特定の種類のデータはすべて、テーブルの一部として行に格納されます。 テーブルは関係を表し、テーブルを結合することで、保存されたデータ間の関係が確立されます。 リレーショナル データベース モデル は、さまざまな目的のために大量のソフトウェアによってサポートされる成熟したモデルです。

NoSQL データモデル 行と列を使用せず、実際にはいかなる種類のセット構造も使用しません。 その開発と設計 通常は、物理データ モデルの作成に重点を置いています。 スケーラビリティには特有の癖や問題があり、重大な懸念事項です。 

オブジェクトリレーショナルデータベースモデル オブジェクト指向データベース モデルとリレーショナル データベース モデルを組み合わせたものです。 オブジェクト指向モデルと同じ方法でオブジェクト、クラス、継承などを格納しますが、リレーショナル データベース モデルのような表形式の構造もサポートします。 このデザイン 設計者はその機能をテーブル構造に組み込むことができます。

データモデリングの概念の重要性

データ モデルは青写真に似ていますが、データベースまたはデータ システムの関係、エンティティ、属性を定義します。 効率的な物理データベースとデータ システムを開発するには、組織化され、適切に設計されたデータ モデルが必要です。 効率的なデータ取得をサポートしながらストレージの問題や冗長性の問題を解決するには、データ モデリングの概念をよく理解する必要があります。 

データ モデリングは困難を伴う場合があり、各タイプのモデルには独自の利点と欠点があることを認識することが重要です。 

Shutterstock.comからのライセンスに基づき使用されている画像

タイムスタンプ:

より多くの データバーシティ