IBM Databand: Autoaprendizagem para detecção de anomalias - IBM Blog

IBM Databand: Autoaprendizagem para detecção de anomalias – IBM Blog

Nó Fonte: 3093740


IBM Databand: Autoaprendizagem para detecção de anomalias – IBM Blog



Engenheiros discutindo na mesa no escritório criativo

Há quase um ano, a IBM encontrou um problema de validação de dados durante um de nossos fluxos de dados de fusões e aquisições urgentes. Enfrentamos vários desafios enquanto trabalhávamos para resolver o problema, incluindo solução de problemas, identificação do problema, correção do fluxo de dados, realização de alterações nos pipelines de dados downstream e execução ad hoc de um fluxo de trabalho automatizado.

Melhorando a resolução de dados e a eficiência do monitoramento com Databand

Depois que o problema imediato foi resolvido, uma análise retrospectiva revelou que a validação adequada dos dados e o monitoramento inteligente poderiam ter aliviado o problema e acelerado o tempo de resolução. Em vez de desenvolver uma solução customizada apenas para a preocupação imediata, a IBM buscou uma solução de validação de dados amplamente aplicável, capaz de lidar não apenas com esse cenário, mas também com possíveis problemas negligenciados.  

Foi então que descobri um de nossos produtos adquiridos recentemente, o IBM® Databand® para observabilidade de dados. Ao contrário das ferramentas de monitoramento tradicionais com monitoramento baseado em regras ou centenas de scripts de monitoramento desenvolvidos sob medida, o Databand oferece monitoramento de autoaprendizagem. Ele observa o comportamento dos dados anteriores e identifica desvios que excedem determinados limites. Esse recurso de aprendizado de máquina permite que os usuários monitorem dados com configuração mínima de regras e detecção de anomalias, mesmo que tenham conhecimento limitado sobre os dados ou seus padrões comportamentais.

Otimizando a observabilidade do fluxo de dados com o monitoramento de autoaprendizagem do Databand

O Databand considera o comportamento histórico do fluxo de dados e sinaliza atividades suspeitas enquanto alerta o usuário. A IBM integrou o Databand em nosso fluxo de dados, que compreendia mais de 100 pipelines. Ele forneceu atualizações de status facilmente observáveis ​​para todas as execuções e pipelines e, mais importante, destacou falhas. Isso nos permitiu concentrar e acelerar a correção de incidentes de fluxo de dados.

O Databand para observabilidade de dados usa autoaprendizagem para monitorar o seguinte:  

  • Mudanças de esquema: Quando uma alteração de esquema é detectada, o Databand sinaliza em um painel e envia um alerta. Qualquer pessoa que trabalhe com dados provavelmente já encontrou cenários em que uma fonte de dados sofre alterações de esquema, como adição ou remoção de colunas. Essas mudanças impactam os fluxos de trabalho, que por sua vez afetam o processamento do pipeline de dados downstream, levando a um efeito cascata. O Databand pode analisar o histórico do esquema e alertar-nos imediatamente sobre quaisquer anomalias, evitando possíveis interrupções.
  • Impacto do acordo de nível de serviço (SLA): Databand mostra a linhagem de dados e identifica pipelines de dados downstream afetados por uma falha no pipeline de dados. Se houver um SLA definido para entrega de dados, os alertas ajudarão a reconhecer e manter a conformidade com o SLA.
  • Anomalias de desempenho e tempo de execução: Databand monitora a duração das execuções do pipeline de dados e aprende a detectar anomalias, sinalizando-as quando necessário. Os usuários não precisam estar cientes da duração do pipeline; Databand aprende com seus dados históricos.
  • Estado: O Databand monitora o status das execuções, incluindo se elas falharam, foram canceladas ou bem-sucedidas.
  • Data de validade: O Databand observa as faixas de valores dos dados ao longo do tempo e envia um alerta ao detectar anomalias. Isto inclui estatísticas típicas como média, desvio padrão, mínimo, máximo e quartis.

Alertas transformativos de banda de dados para pipelines de dados aprimorados

Os usuários podem definir alertas usando a interface de usuário do Databand, que é descomplicada e apresenta um painel intuitivo que monitora e oferece suporte a fluxos de trabalho. Ele fornece visibilidade detalhada por meio de gráficos acíclicos direcionados, o que é útil ao lidar com muitos pipelines de dados. Este sistema completo permite que as equipes de suporte se concentrem em áreas que requerem atenção, permitindo-lhes acelerar os resultados.

As fusões e aquisições da IBM Enterprise Data nos permitiram aprimorar nossos pipelines de dados com o Databand e não olhamos para trás. Temos o prazer de oferecer a você este software transformador que ajuda a identificar incidentes de dados mais cedo, resolvê-los com mais rapidez e fornecer dados mais confiáveis ​​às empresas.

Forneça dados confiáveis ​​com observabilidade contínua dos dados

Leia o relatório do Gartner

Esse artigo foi útil?

SimNão


Mais de Dados e Análise




O que é MongoDB Enterprise Advanced com IBM?

3 min ler - MongoDB Enterprise Advanced com IBM é um banco de dados de documentos construído em uma arquitetura horizontalmente escalável que usa um esquema flexível para armazenamento de dados. Fundado em 2007, o MongoDB conquistou uma base de fãs mundial dentro da comunidade de desenvolvedores. Resolvendo a expansão de TI: Otimizando a infraestrutura de banco de dados para inovação O MongoDB ajudou a desencadear uma tendência do setor em direção à especialização com seu modelo de documento e escalabilidade horizontal. No entanto, ao longo do tempo, estes produtos estritamente especializados introduziram frequentemente mais custos e complexidades. Integrar produtos diferentes em um único…




Personalize insights de varejo com Boxes e IBM watsonx

2 min ler - Lembro-me de quando tinha 7 anos e esperava ansiosamente o fim do dia escolar para ir trabalhar com meu pai. Ele foi um empresário pioneiro no Uruguai e meu maior mentor, desenvolvendo máquinas de venda automática que ajudaram as marcas a se adaptarem à evolução do comportamento do consumidor. Em 2024, o setor retalhista necessita mais uma vez de uma abordagem moderna para satisfazer a procura dos consumidores. É por isso que criei Boxes, para ajudar varejistas e empresas de bens de consumo embalados (CPG) a envolver melhor os consumidores em locais físicos,…




A importância da ingestão e integração de dados para IA empresarial

4 min ler - O surgimento da IA ​​generativa levou várias empresas proeminentes a restringir a sua utilização devido ao tratamento incorreto de dados internos sensíveis. Segundo a CNN, algumas empresas impuseram proibições internas às ferramentas generativas de IA enquanto procuravam compreender melhor a tecnologia e muitas também bloquearam o uso do ChatGPT interno. As empresas ainda muitas vezes aceitam o risco de usar dados internos ao explorar grandes modelos de linguagem (LLMs), porque esses dados contextuais são o que permite que os LLMs mudem de uso geral para…




O novo modelo de fala grande watsonx da IBM traz IA generativa para o telefone

3 min ler - Quase todo mundo já ouviu falar de grandes modelos de linguagem, ou LLMs, desde que a IA generativa entrou em nosso léxico diário por meio de seus incríveis recursos de geração de texto e imagem e de sua promessa como uma revolução na forma como as empresas lidam com as principais funções de negócios. Agora, mais do que nunca, a ideia de falar com a IA por meio de uma interface de bate-papo ou fazer com que ela execute tarefas específicas para você é uma realidade tangível. Enormes avanços estão ocorrendo para adotar esta tecnologia para impactar positivamente as experiências diárias como indivíduos e…

Boletins informativos da IBM

Receba nossos boletins informativos e atualizações de tópicos que oferecem as mais recentes lideranças inovadoras e insights sobre tendências emergentes.

Inscreva-se agora

Mais boletins informativos

Carimbo de hora:

Mais de IBM