Quatro Perspectivas sobre a Arte da Análise de Dados - DATAVERSITY

Quatro Perspectivas sobre a Arte da Análise de Dados – DATAVERSITY

Nó Fonte: 3059543

Como profissionais de ciência de dados, muitas vezes somos vistos como pessoas que tiram conclusões baseadas apenas em dados e minimizam outros fatores. Esta percepção geralmente se torna controversa quando os insights e as evidências dos dados são inconsistentes com a “hipótese” de outra pessoa. Ou ficamos confusos e talvez frustrados quando a análise “qualitativa” supera a análise quantitativa. Na próxima vez que você sentir essa frustração, considere estas quatro perspectivas sobre análise de dados para validar e considerar outras visões para que você possa tentar encontrar um terreno comum:  

1. “Outliers oportunidades iguais.”  

Os valores discrepantes se apresentam em um conjunto de dados como anomalias. Talvez os valores discrepantes sejam ruído, mas talvez sejam especiais. 

Os valores discrepantes podem ser insights exclusivos, tendências emergentes ou segmentos interessantes. Na pesquisa médica, um valor atípico pode apontar para um efeito colateral raro, mas potencialmente fatal, de um medicamento. No caso de dados de clientes, um valor atípico pode ser um nicho de cliente valioso que ainda não foi abordado. Outliers podem ser uma tendência emergente. A cor rosa começou como uma exceção, mas rapidamente se tornou a escolha de moda mais popular. 

Antes de descartar valores discrepantes como ruído, use-os para despertar dúvidas e curiosidade:   

  • O outlier aponta para uma oportunidade?   
  • Por que o outlier existe?   
  • Se você pudesse alterar o carimbo de data/hora do seu conjunto de dados, como isso poderia impactar os valores discrepantes? 
  • Você teria que assumir se há mais valores discrepantes?  
  • O que um valor discrepante nos diz sobre o sistema ou processo que está sendo analisado?    
  • O que seria necessário para que um valor discrepante se tornasse um perfil ou segmento distinto?  

Compreender os valores discrepantes pode levar ao desenvolvimento de produtos inovadores, à identificação de novas oportunidades de mercado e ao reconhecimento de riscos potenciais. Em domínios como a ciência ambiental ou a economia, os valores atípicos podem sinalizar mudanças importantes nos padrões, como mudanças climáticas súbitas ou crises financeiras. Os valores discrepantes têm o potencial de transformar a maneira como vemos e interpretamos os dados, transformando-os de pontos de dados mal compreendidos em informações valiosas. 

2. “Uma vez é acaso. Duas vezes é uma coincidência. Três vezes é ação inimiga.” -Dedo de ouro  

Você já se perguntou por que os outros se sentem confortáveis ​​em fazer “orientado por dados” decisões com informações muito limitadas? Mais pontos de dados nos dão mais confiança e maior precisão, mas às vezes precisamos agir rapidamente.  

Mais recentemente, a OpenAI lançou o ChatGPT apesar das suas falhas, enquanto outros que tinham produtos semelhantes esperaram para aumentar o seu nível de confiança na precisão das respostas. Quando você pensa que alguém está tomando uma decisão baseada em dados, com baixos níveis de confiança e precisão limitada, considere o custo do tempo. O inimigo pode estar atirando. 

3. “Nem tudo que conta pode ser contado, e nem tudo que pode ser contado conta.” –comumente atribuído a Albert Einstein 

Em outras palavras: “Agradeço sua análise de dados, mas o que penso ou ouço é mais importante. Não pode ser contado ou medido.” 

Como você responde? É nesta situação que você precisa ser criativo.   

Por exemplo, o comportamento do cliente, incluindo o sentimento do cliente, a fidelidade à marca e as tendências impulsionadas por mudanças culturais, pode ser intangível e difícil de quantificar. Se você tiver apenas dados de comportamento online, use outros métodos para acessar novas fontes de dados, como programas de teste, pesquisas, análise de sentimento social, etnografia online ou pesquisas básicas de clientes primários.  

Talvez nada seja definitivo, mas é a combinação e consistência de diferentes métodos e fontes que apontam para uma conclusão consistente.  

4. “Correlação é igual a causalidade?”  

Substituir causalidade por correlação pode levar a tomadas de decisão equivocadas quando feitas sem consciência. Porém, existem situações em que só temos acesso aos dados de correlação. Nestes casos, é fundamental examinar se a correlação é mera coincidência ou se existe uma causa subjacente válida. 

Por exemplo, considere o desafio de medir a atribuição de gastos com marketing e analisar as atividades de vendas. Estas são tarefas complexas sem ligação causal direta. Pode-se observar uma taxa de fechamento de 90% quando os clientes visitam o escritório de um fornecedor para receber instruções, mas é importante não tirar conclusões precipitadas e presumir a causalidade. Em vez disso, é necessária uma abordagem mais matizada.  

Após uma análise mais detalhada, fica evidente que a alta taxa de fechamento não é resultado do simples agendamento de briefings aos clientes para cada interação de vendas. Em vez disso, as próprias interações criam nos clientes o desejo de participar desses briefings, o que subsequentemente leva a uma alta taxa de fechamento. Este exemplo ilustra a fusão entre arte e ciência em analítica – um processo que envolve a compreensão da dinâmica subjacente e não apenas confiar em correlações superficiais. 

Todos gostaríamos da confiança estatística de muitos dados com o conjunto de dados ideal. A realidade é que, por vezes, temos de ser criativos e imaginativos e examinar valores discrepantes, correlações e conjuntos de dados alternativos. Ou, às vezes, não há tempo e você precisa agir com base em dados limitados. 

Carimbo de hora:

Mais de DATAVERSIDADE