データ分析ファブリックのコンセプトの紹介 - DATAVERSITY

データ分析ファブリックのコンセプトの紹介 – DATAVERSITY

ソースノード: 2884345

営利・非営利を問わず、世界中の組織が業績向上のためにデータ分析を活用することを検討しています。 からの調査結果 マッキンゼー調査 データドリブンな組織は、顧客を獲得する可能性が 23 倍、顧客を維持する可能性が 19 倍、収益性が 1 倍高いことを示しています [XNUMX]。 MITによる研究 デジタル的に成熟した企業は、同業他社よりも 26% 利益が高いことがわかりました [2]。 しかし、多くの企業は、データが豊富であるにもかかわらず、ビジネス ニーズ、利用可能な機能、リソースの間で優先順位が矛盾しているため、データ分析の実装に苦労しています。 ガートナーによる調査 データおよび分析プロジェクトの 85% 以上が失敗していることがわかりました [3]。 共同報告 IBM とカーネギー メロンの調査では、組織内のデータの 90% がいかなる戦略的目的にもう​​まく使用されていないことが示されています [4]。

このような背景を踏まえ、当社は、(a) ビジネスのニーズや目的、(b) 人材やスキルなどの利用可能な機能に基づいてデータ分析を効果的に機能させるためのエコシステムまたは構造として、「データ分析ファブリック (DAF)」の概念を導入します。 、プロセス、文化、テクノロジー、洞察、意思決定能力など、および (c) リソース (つまり、企業がビジネスを運営するために必要なコンポーネント)。

データ分析ファブリックを導入する主な目的は、「意思決定を可能にするシステムを効果的に構築するには何が必要か」という基本的な質問に答えることです。 データサイエンス ビジネスパフォーマンスを測定し、改善するためのアルゴリズムはあるでしょうか?」 データ分析ファブリックとその XNUMX つの主要な表現を以下に示し、説明します。

画像ソース: DBP研究所

1. 測定重視

分析の核心は、データを使用して洞察を導き出し、ビジネスのパフォーマンスを測定し、改善することです[5]。 ビジネス パフォーマンスを測定および改善するための分析には、主に XNUMX つのタイプがあります。

  • 記述的分析 「何が起こったのですか?」と質問します。 記述的分析は、探索的、連想的、推論的データ分析手法を使用して履歴データを分析し、パターン、傾向、関係を特定するために使用されます。 探索的データ分析手法は、データセットを分析して要約します。 連想記述分析は、変数間の関係を説明します。 推論的記述データ分析は、サンプル データセットに基づいて、より大きな母集団に関する傾向を推測または結論付けるために使用されます。 
  • 予測分析 「何が起こるでしょうか?」という質問に答えることに目を向けています。 基本的に、予測分析は、データを使用して将来の傾向やイベントを予測するプロセスです。 予測分析は手動で (一般にアナリスト主導の予測分析として知られています)、または次のコマンドを使用して実行できます。 機械学習アルゴリズム (データ駆動型予測分析とも呼ばれます)。 いずれの場合も、過去のデータは将来の予測を行うために使用されます。
  • 処方分析 「どうすればそれを実現できるのか?」という質問に答えるのに役立ちます。 基本的に、規範的分析では、最適化とシミュレーションの手法を使用して、前進するための最適な行動方針を推奨します。 通常、予測分析と処方分析は併用します。予測分析は潜在的な結果を見つけるのに役立ち、処方分析はそれらの結果を調べてより多くのオプションを見つけるのに役立ちます。

2. 変数に焦点を当てる

利用可能な変数の数に基づいてデータを分析することもできます。 この点に関して、変数の数に基づいて、データ分析手法は単変量、二変量、または多変量になります。

  • 単変量分析: 単変量分析では、中心性 (平均、中央値、最頻値など) と変動 (標準偏差、標準誤差、分散など) の尺度を使用して、単一の変数に存在するパターンを分析します。
  • 二変量解析: 分析は原因と XNUMX つの変数間の関係に関連する XNUMX つの変数があります。 これら XNUMX つの変数は、互いに依存することも、独立することもできます。 相関手法は、最もよく使用される二変量解析手法です。
  • 多変量解析: この手法は、XNUMX つ以上の変数を分析するために使用されます。 多変量環境では、通常、予測分析の分野で動作し、線形回帰、ロジスティック回帰、回帰ツリー、サポート ベクター マシン、ニューラル ネットワークなどのよく知られた機械学習 (ML) アルゴリズムのほとんどが多変量環境に適用されます。設定。

3. 監督重視

XNUMX 番目のタイプのデータ分析ファブリックは、入力データ、または特定の出力 (つまり、従属変数) に対してラベル付けされた独立変数データのトレーニングを扱います。 基本的に、独立変数は実験者が制御する変数です。 従属変数は、独立変数に応じて変化する変数です。 監視に重点を置いた DAF は、XNUMX つのタイプのいずれかになります。

  • 因果関係: ラベル付きデータは、自動生成か手動生成かにかかわらず、教師あり学習には不可欠です。 ラベル付きデータを使用すると、従属変数を明確に定義できます。その後は、ラベル (従属変数) と一連の独立変数の間の関係を構築する AI/ML ツールを構築する予測分析アルゴリズムの問​​題になります。 従属変数の概念と一連の独立変数の間には明確な境界があるという事実から、この関係を最もよく説明するために「因果関係」という用語を導入することを許可します。
  • 非因果関係: 私たちが次元として「監督重視」を示すとき、それは「監督の不在」も意味しており、それによって非因果モデルが議論に持ち込まれます。 非因果モデルは、ラベル付きデータを必要としないため、言及する価値があります。 ここでの基本的な手法はクラスタリングであり、最も一般的な手法は K-Means と階層的クラスタリングです。  

4. データ型重視

データ分析ファブリックのこの側面または表現は、洞察を引き出すためのデータ分析手法で使用される独立変数と従属変数の両方に関連する XNUMX つの異なるタイプのデータ変数に焦点を当てています。 

  • 公称データ データのラベル付けまたは分類に使用されます。 これには数値が含まれないため、名目データを使用して統計計算を行うことはできません。 公称データの例としては、性別、製品の説明、顧客の住所などが挙げられます。 
  • 順序またはランク付けされたデータ は値の順序ですが、それぞれの違いは実際にはわかりません。 ここでの一般的な例は、時価総額、ベンダーの支払い条件、顧客満足度スコア、納期優先度などに基づいて企業をランク付けすることです。 
  • 数値データ 説明の必要はありませんが、値は数値です。 これらの変数は、あらゆる種類のアルゴリズムをモデル化するために使用できる最も基本的なデータ型です。  

5. 結果重視

このタイプのデータ分析ファブリックでは、分析から得られる洞察からビジネス価値を提供する方法を検討します。 分析によってビジネス価値を高める方法は XNUMX つあり、XNUMX つは製品またはプロジェクトによるものです。 製品ではユーザー エクスペリエンスとソフトウェア エンジニアリングに関する追加の影響に対処する必要がある場合がありますが、モデルを導出するために行われるモデリング作業はプロジェクトと製品の両方で同様になります。

  • A データ分析製品 ビジネスの長期的なニーズに応える再利用可能なデータ資産です。 関連するデータ ソースからデータを収集し、データの品質を確保し、処理して、必要な誰もがデータにアクセスできるようにします。 通常、製品はペルソナ向けに設計されており、製品の価値が実現されるまでの複数のライフサイクル ステージまたはイテレーションがあります。
  • データ分析プロジェクト 特定または固有のビジネス ニーズに対応するように設計されており、定義された、または狭いユーザー ベースまたは目的を持っています。 基本的に、プロジェクトは、定義された範囲のソリューションを予算内かつ期限内に提供することを目的とした一時的な取り組みです。

組織がビジネスパフォーマンスを測定および改善するための洞察を導き出し、意思決定を行うためにデータと分析をますます使用するようになるため、世界経済は今後数年間で劇的に変化すると考えられます。 マッキンゼー 調査結果によると、洞察を重視する企業は EBITDA (利息、税金、減価償却前利益) が最大 25% 増加していると報告されています [5]。 しかし、多くの組織は、データと分析を活用してビジネスの成果を向上させることに成功していません。 しかし、データ分析を実現する単一の標準的な方法やアプローチはありません。 データ分析ソリューションの展開または実装は、ビジネスの目的、機能、リソースによって異なります。 ここで説明する DAF とその XNUMX つのマニフェストにより、ビジネス ニーズ、利用可能な機能、リソースに基づいて分析を効果的に導入できるようになります。

参考文献

  1. mckinsey.com/capabilities/growth-marketing-and-sales/our-insights/five-facts-how-customer-analytics-boosts-corporate-perform
  2. ide.mit.edu/insights/digitally-mature-firms-are-26-more-profitable-than-their-peers/
  3. gartner.com/en/newsroom/press-releases/2018-02-13-gartner-says-nearly-half-of-cios-are-planning-to-deploy-artificial-intelligence
  4. forbes.com/sites/forbestechcouncil/2023/04/04/three-key-misconceptions-of-data-quality/?sh=58570fc66f98
  5. Southekal、Prashanth、「分析のベスト プラクティス」、Technics、2020 年
  6. mckinsey.com/capabilities/growth-marketing-and-sales/our-insights/insights-to-impact-creating-and-sustaining-data-driven-commercial-growth

タイムスタンプ:

より多くの データバーシティ