Quatre perspectives sur l'art de l'analyse de données - DATAVERSITY

Quatre perspectives sur l’art de l’analyse des données – DATAVERSITY

Nœud source: 3059543

En tant que professionnels de la science des données, nous sommes souvent considérés comme des personnes qui tirent des conclusions basées uniquement sur des données et minimisent d’autres facteurs. Cette perception devient généralement controversée lorsque les idées et les preuves issues des données sont incompatibles avec « l’hypothèse » de quelqu’un d’autre. Ou bien nous sommes confus et peut-être frustrés lorsque l’analyse « qualitative » l’emporte sur l’analyse quantitative. La prochaine fois que vous ressentirez cette frustration, considérez ces quatre perspectives sur l'analyse des données pour valider et considérer d'autres points de vue afin que vous puissiez essayer de trouver un terrain d'entente :  

1. « Égalité des chances pour les personnes aberrantes. »  

Les valeurs aberrantes se présentent dans un ensemble de données comme des anomalies. Les valeurs aberrantes sont peut-être du bruit, mais elles sont peut-être spéciales. 

Les valeurs aberrantes peuvent être des informations uniques, des tendances émergentes ou des segments intéressants. Dans la recherche médicale, une valeur aberrante pourrait indiquer un effet secondaire rare mais potentiellement mortel d’un médicament. Dans le cas des données clients, une valeur aberrante peut constituer une niche client précieuse qui n’a pas encore été abordée. Les valeurs aberrantes pourraient constituer une tendance émergente. La couleur rose a commencé comme une couleur aberrante, mais est rapidement devenue le choix de mode le plus populaire. 

Avant de considérer les valeurs aberrantes comme du bruit, utilisez-les pour susciter des questions et susciter la curiosité :   

  • La valeur aberrante indique-t-elle une opportunité ?   
  • Pourquoi la valeur aberrante existe-t-elle ?   
  • Si vous pouviez modifier l’horodatage de votre ensemble de données, quel impact cela pourrait-il avoir sur les valeurs aberrantes ? 
  • Devriez-vous supposer s’il y avait davantage de valeurs aberrantes ?  
  • Que nous apprend une valeur aberrante sur le système ou le processus analysé ?    
  • Que faudrait-il pour qu’une valeur aberrante devienne un profil ou un segment distinct ?  

Comprendre les valeurs aberrantes peut conduire au développement de produits innovants, à l’identification de nouvelles opportunités de marché et à la reconnaissance des risques potentiels. Dans des domaines tels que les sciences de l’environnement ou l’économie, les valeurs aberrantes peuvent signaler des changements de tendance importants, comme des changements climatiques soudains ou des crises financières. Les valeurs aberrantes ont le potentiel de transformer la façon dont nous visualisons et interprétons les données, en les transformant de points de données mal compris en de précieuses informations. 

2. «Une fois, c'est un hasard. Deux fois, c'est une coïncidence. Trois fois est une action ennemie." -Le doigt d'or  

Vous êtes-vous déjà demandé pourquoi les autres sont à l'aise en faisant "data-driven« des décisions avec des informations très limitées ? Plus de points de données nous donnent à tous plus de confiance et une plus grande précision, mais parfois, nous devons agir rapidement.  

Plus récemment, OpenAI a lancé ChatGPT malgré ses défauts, tandis que d'autres disposant de produits similaires attendaient d'augmenter leur niveau de confiance dans l'exactitude des réponses. Lorsque vous pensez que quelqu'un prend une décision fondée sur des données avec de faibles niveaux de confiance et une précision limitée, pensez au coût du temps. L'ennemi pourrait tirer. 

3. « Tout ce qui compte ne peut pas être compté, et tout ce qui peut être compté ne compte pas. » –communément attribué à Albert Einstein 

En d’autres termes : « J’apprécie votre analyse des données, mais ce que je pense ou entends est plus important. Cela ne peut pas être compté ou mesuré. 

Comment répondez-vous ? C’est dans cette situation que vous devez faire preuve de créativité.   

Par exemple, le comportement des clients, notamment leur sentiment, leur fidélité à la marque et les tendances induites par les changements culturels, peuvent être intangibles et difficiles à quantifier. Si vous ne disposez que de données sur le comportement en ligne, utilisez d'autres méthodes pour accéder à de nouvelles sources de données, telles que des programmes de test, des enquêtes, une analyse des sentiments sociaux, une ethnographie en ligne ou une recherche client primaire de retour aux sources.  

Peut-être que rien ne sera définitif, mais c’est la combinaison et la cohérence de différentes méthodes et sources qui permettent d’aboutir à une conclusion cohérente.  

4. « La corrélation est égale à la causalité ? »  

Remplacer la corrélation par la causalité peut conduire à une prise de décision erronée lorsqu'elle est prise sans en être conscient. Cependant, il existe des situations dans lesquelles nous n’avons accès qu’à des données de corrélation. Dans ces cas-là, il est essentiel de vérifier si la corrélation est une simple coïncidence ou s’il existe une cause sous-jacente valable. 

Par exemple, considérons le défi que représente la mesure de l’attribution des dépenses marketing et l’analyse des activités de vente. Ce sont des tâches complexes sans lien de causalité direct. On peut observer un taux de clôture de 90 % lorsque les clients se rendent dans le bureau d'un fournisseur pour un briefing client, mais il est important de ne pas tirer de conclusions hâtives et de supposer un lien de causalité. Au lieu de cela, une approche plus nuancée est nécessaire.  

En y regardant de plus près, il devient évident que le taux de clôture élevé n'est pas le résultat de la simple planification de briefings clients pour chaque interaction commerciale. Au lieu de cela, les interactions elles-mêmes créent le désir chez les clients d’assister à ces briefings, ce qui conduit ensuite à un taux de clôture élevé. Cet exemple illustre la fusion de l'art et de la science dans analytique – un processus qui implique de comprendre les dynamiques sous-jacentes et de ne pas se fier uniquement à des corrélations superficielles. 

Nous aimerions tous bénéficier de la fiabilité statistique d'un grand nombre de données avec l'ensemble de données idéal. La réalité est que parfois, nous devons faire preuve de créativité et d’imagination et examiner les valeurs aberrantes, les corrélations et les ensembles de données alternatifs. Ou parfois, vous n’avez pas le temps et vous devez agir sur des données limitées. 

Horodatage:

Plus de DATAVERSITÉ