Tendências de dados para 2024: do compartilhamento colaborativo de dados às operações orientadas por IA - DATAVERSITY

Tendências de dados para 2024: do compartilhamento colaborativo de dados às operações orientadas por IA – DATAVERSITY

Nó Fonte: 3013137

No cenário de dados em rápida evolução, compreender as tendências emergentes e abraçar os avanços tecnológicos são essenciais para permanecer à frente. À medida que nos aproximamos de 2024, este artigo explora as tendências de dados que definirão o cenário estratégico para o próximo ano.

Tendência: foco em dados Sharing e Data Ccolaboração

Melhorar a partilha de dados e a colaboração segura de dados entre as partes está a tornar-se uma área fundamental. Empresas como Snowflake e Databricks estão adotando essa ideia e ela está ganhando força em vários setores. 

Na última década, transformação digital levou à divisão de processos e sistemas de negócios em pedaços menores. Algumas dessas peças permanecem dentro da empresa, enquanto outras são terceirizadas para fornecedores externos, criando um ecossistema complexo. Por exemplo, os esforços de transformação digital do processamento global de pagamentos podem agora abranger 10 ou 15 empresas, e os dados estão espalhados por todas estas diferentes partes. Os dados de vários fornecedores precisam de ser integrados para serem vistos de forma holística, e isto é um desafio.

Assim, os produtos de dados estão cada vez mais sendo construídos em torno da ideia de mesclar dados entre diferentes partes. Espera-se que esta tendência continue nos próximos anos e muitos produtos de dados serão construídos em torno deste processo.

Tendência: a ascensão da malha de dados

O conceito de malha de dados ganhou força nos últimos três anos. Ele traz dois componentes principais para o primeiro plano. Primeiro, introduz a ideia de “dados como produto”, que envolve empacotar dados num formato bem definido e detectável que pode ser usado de forma self-service, sem envolvimento direto do produtor de dados. Este conceito inclui não apenas dados brutos, mas também modelos analíticos, como aqueles usados ​​para rotatividade de clientes ou prevenção de fraudes.

Em segundo lugar, a utilização de plataformas de autoatendimento para a produção de produtos de dados, e não para inteligência de negócios, permite que várias unidades de negócios criem produtos de dados sem a necessidade de plataformas de dados separadas. Isso reduz custos e aumenta a eficiência.

Os principais fornecedores de tecnologia, incluindo serviços em nuvem como Azure e AWS, estão se atualizando e oferecendo soluções para gerenciar dados distribuídos e plataformas analíticas em forma de malha de dados. Isso ajuda a conectar dados em diversas plataformas e tecnologias, proporcionando uma visão centralizada do cenário de dados.

Tendência: LLMs desempenharão um papel crucial no aprimoramento da engenharia e operações de dados

A IA generativa e os grandes modelos de linguagem (LLM) têm o potencial de transformar o espaço de dados. Essa transformação inclui a implantação de modelos GenAI em infraestruturas de dados existentes para tarefas como engenharia e operações de dados. 

Ainda mais interessante é o potencial dessas tecnologias para resolver tarefas rudimentares, como criação de perfil, modelagem e integração de dados, simplificação de processos e melhoria da qualidade dos dados. Espera-se que os LLMs desempenhem um papel crucial no aprimoramento da engenharia e das operações de dados.

Tendência: as empresas investirão em ferramentas de descoberta de dados e catálogos de dados

A governança de dados evoluiu nos últimos anos. Anteriormente, concentrava-se na proteção de dados e na gestão de riscos, mas desde então passou a disponibilizar amplamente os dados e, ao mesmo tempo, a minimizar os riscos. O conceito de dados como produto é a maior mudança, porque transfere a responsabilidade para as equipes que produzem, possuem ou fornecem os dados.

As empresas estão investindo em ferramentas de descoberta de dados e catálogos de dados para obter visibilidade de seus dados, incluindo suas fontes, propriedade, estrutura e qualidade. A governança de dados agora envolve tornar os dados visíveis, detectáveis, reutilizáveis ​​e úteis. 

Tendência: crescente ênfase na qualidade dos dados 

A observabilidade de dados ganhou popularidade nos últimos dois ou três anos, impulsionada pelo aumento do uso da análise de dados e pela necessidade de qualidade de dados. Ele oferece uma compreensão granular dos dados em tempo de execução, ajudando as organizações a rastrear o fluxo de dados e a identificar problemas de qualidade de dados, problemas operacionais e alterações nos sistemas de dados. Ele agrega muito valor aos engenheiros e ao pessoal operacional em termos de visibilidade e compreensão do que está acontecendo.

Ferramentas de observabilidade de dados como Monte Carlo e Soda surgiram para atender à crescente demanda por melhoria da qualidade dos dados e eficiência operacional.

Outro aspecto desta tendência é o crescente investimento em análise de dados. No domínio da análise de dados, o valor derivado depende fortemente da qualidade dos dados que estão sendo analisados. Como resultado, as organizações estão dando maior ênfase à qualidade dos dados. Durante este processo, torna-se evidente que muitos problemas de Qualidade de Dados não decorrem da ausência de regras de negócio ou regras de validação bem definidas para os dados. Em vez disso, os problemas têm frequentemente origem em discrepâncias operacionais, tais como alterações feitas por indivíduos ou imprecisões nos dados recebidos dos fornecedores, entre outros desafios operacionais.

Estas são cinco das tendências de dados mais importantes que você deve conhecer em 2024. Quais você adicionaria à lista?

Carimbo de hora:

Mais de DATAVERSIDADE