Os últimos anos testemunharam uma explosão na proliferação de unidades de autoarmazenamento. Estas grandes unidades de armazém surgiram a nível nacional como uma indústria em expansão por uma razão: a pessoa média tem agora mais bens do que sabe o que fazer com eles.
A mesma situação básica também assola o mundo da TI. Estamos no meio de uma explosão de dados. Mesmo objetos relativamente simples, do dia a dia, agora geram dados rotineiramente por conta própria, graças a Internet of Things (IoT) funcionalidade. Nunca antes na história tantos dados foram criados, coletados e analisados. E nunca antes tantos gestores de dados lutaram com o problema de como armazenar tantos dados.
Uma empresa pode inicialmente não reconhecer o problema ou o quão grande ele pode se tornar, e então essa empresa terá que encontrar uma solução de armazenamento maior. Com o tempo, a empresa também poderá superar esse sistema de armazenamento, exigindo ainda mais investimentos. Inevitavelmente, a empresa se cansará desse jogo e buscará uma opção mais barata e simples – o que nos leva a desduplicação de dados.
Embora muitas organizações utilizem técnicas de desduplicação de dados (ou “desduplicação”) como parte de seu sistema de gerenciamento de dados, poucas realmente entendem o que é o processo de desduplicação e o que ele pretende fazer. Então, vamos desmistificar a desduplicação e explicar como funciona a desduplicação de dados.
O que a desduplicação faz?
Primeiro, vamos esclarecer nosso termo principal. A desduplicação de dados é um processo que as organizações usam para simplificar seus acervos de dados e reduzir a quantidade de dados arquivados, eliminando cópias redundantes de dados.
Além disso, devemos salientar que quando falamos de dados redundantes, estamos na verdade falando ao nível dos ficheiros e referindo-nos a uma proliferação desenfreada de ficheiros de dados. Portanto, quando discutimos os esforços de desduplicação de dados, na verdade é necessário um sistema de desduplicação de arquivos.
Qual é o principal objetivo da desduplicação?
Algumas pessoas têm uma noção incorreta sobre a natureza dos dados, vendo-os como uma mercadoria que simplesmente existe para ser recolhida e colhida – como maçãs de uma árvore no seu próprio quintal.
A realidade é que cada novo arquivo de dados custa dinheiro. Em primeiro lugar, normalmente custa dinheiro obter tais dados (através da compra de listas de dados). Ou requer um investimento financeiro substancial para que uma organização seja capaz de reunir e coletar dados por conta própria, mesmo que sejam dados que a própria organização esteja produzindo e coletando organicamente. Os conjuntos de dados, portanto, são um investimento e, como qualquer investimento valioso, devem ser protegidos rigorosamente.
Neste caso, estamos falando de espaço de armazenamento de dados – seja na forma de servidores de hardware locais ou através de armazenamento em nuvem através de um serviço baseado em nuvem centro de dados-que deve ser comprado ou alugado.
Cópias duplicadas de dados que foram replicados, portanto, prejudicam o resultado final, impondo custos de armazenamento adicionais além daqueles associados ao sistema de armazenamento primário e seu espaço de armazenamento. Em suma, mais ativos de mídia de armazenamento devem ser dedicados para acomodar tanto dados novos como dados já armazenados. Em algum momento da trajetória de uma empresa, dados duplicados podem facilmente se tornar um passivo financeiro.
Portanto, resumindo, o principal objetivo da desduplicação de dados é economizar dinheiro, permitindo que as organizações gastem menos em armazenamento extra.
Benefícios adicionais da desduplicação
Existem também outras razões, além da capacidade de armazenamento, para que as empresas adotem soluções de desduplicação de dados – provavelmente nenhuma mais essencial do que a proteção e o aprimoramento de dados que elas fornecem. As organizações refinam e otimizam cargas de trabalho de dados desduplicados para que sejam executadas com mais eficiência do que dados repletos de arquivos duplicados.
Outro aspecto importante da desduplicação é como ela ajuda a capacitar um processo rápido e bem-sucedido. desastre esforço de recuperação e minimiza a quantidade de perda de dados que muitas vezes pode resultar de tal evento. A desduplicação ajuda a permitir um processo de backup robusto para que o sistema de backup de uma organização esteja à altura da tarefa de lidar com seus dados de backup. Além de ajudar nos backups completos, a desduplicação também auxilia nos esforços de retenção.
Ainda outro benefício da desduplicação de dados é o quão bem ela funciona em conjunto com infraestrutura de área de trabalho virtual (VDI) implantações, graças ao fato de que os discos rígidos virtuais por trás dos desktops remotos do VDI operam de forma idêntica. Popular Desktop como serviço (DaaS) os produtos incluem o Azure Virtual Desktop da Microsoft e seu Windows VDI. Esses produtos criam máquinas virtuais (VMs), que são criados durante o processo de virtualização do servidor. Por sua vez, essas máquinas virtuais capacitam a tecnologia VDI.
Metodologia de desduplicação
A forma mais comumente usada de desduplicação de dados é a desduplicação em bloco. Este método opera usando funções automatizadas para identificar duplicações em blocos de dados e, em seguida, remover essas duplicações. Ao trabalhar neste nível de bloco, pedaços de dados exclusivos podem ser analisados e especificados como dignos de validação e preservação. Então, quando o software de desduplicação detecta uma repetição do mesmo bloco de dados, essa repetição é removida e uma referência aos dados originais é incluída em seu lugar.
Essa é a principal forma de desduplicação, mas dificilmente é o único método. Em outros casos de uso, um método alternativo de desduplicação de dados opera no nível do arquivo. O armazenamento de instância única compara cópias completas de dados no servidor de arquivos, mas não pedaços ou blocos de dados. Assim como seu método equivalente, a desduplicação de arquivos depende da manutenção do arquivo original no sistema de arquivos e da remoção de cópias extras.
Deve-se notar que as técnicas de desduplicação não funcionam da mesma maneira que os algoritmos de compressão de dados (por exemplo, LZ77, LZ78), embora seja verdade que ambos perseguem o mesmo objetivo geral de reduzir redundâncias de dados. As técnicas de desduplicação conseguem isso em uma escala macro maior do que os algoritmos de compactação, cujo objetivo é menos substituir arquivos idênticos por cópias compartilhadas e mais codificar redundâncias de dados de maneira mais eficiente.
Tipos de desduplicação de dados
Existem diferentes tipos de desduplicação de dados, dependendo quando o processo de desduplicação ocorre:
- Desduplicação em linha: Essa forma de desduplicação de dados ocorre instantaneamente – em tempo real – à medida que os dados fluem dentro do sistema de armazenamento. O sistema de desduplicação em linha transporta menos tráfego de dados porque não transfere nem armazena dados duplicados. Isso pode levar a uma redução na quantidade total de largura de banda necessária para aquela organização.
- Desduplicação pós-processo: Esse tipo de desduplicação ocorre depois que os dados são gravados e colocados em algum tipo de dispositivo de armazenamento.
Aqui vale a pena explicar que ambos os tipos de desduplicação de dados são afetados pelos cálculos de hash inerentes à desduplicação de dados. Esses criptografia os cálculos são essenciais para identificar padrões repetidos nos dados. Durante as desduplicações em linha, esses cálculos são realizados no momento, o que pode dominar e sobrecarregar temporariamente a funcionalidade do computador. Nas desduplicações pós-processamento, os cálculos de hash podem ser realizados a qualquer momento após os dados serem adicionados de uma forma e em um momento que não sobrecarregue os recursos do computador da organização.
As diferenças sutis entre os tipos de desduplicação não param por aí. Outra maneira de classificar os tipos de desduplicação é baseada em onde tais processos ocorrem.
- Desduplicação de origem: Essa forma de desduplicação ocorre perto de onde os novos dados são realmente gerados. O sistema verifica essa área e detecta novas cópias de arquivos, que são então removidas.
- Desduplicação de destino: Outro tipo de desduplicação é como uma inversão da desduplicação de origem. Na desduplicação de destino, o sistema desduplica todas as cópias encontradas em áreas diferentes de onde os dados originais foram criados.
Como existem diferentes tipos de desduplicação praticados, as organizações voltadas para o futuro devem tomar decisões cuidadosas e ponderadas em relação ao tipo de desduplicação escolhido, equilibrando esse método com as necessidades específicas da empresa.
Em muitos casos de uso, o método de desduplicação escolhido por uma organização pode muito bem se resumir a uma variedade de variáveis internas, como as seguintes:
- Quantos e que tipo de conjuntos de dados estão sendo criados
- O sistema de armazenamento primário da organização
- Quais ambientes virtuais estão em uso
- Em quais aplicativos a empresa confia
Desenvolvimentos recentes de desduplicação de dados
Como toda saída de computador, a desduplicação de dados está preparada para fazer uso crescente de inteligência artificial (AI) à medida que continua a evoluir. A desduplicação se tornará cada vez mais sofisticada à medida que desenvolve ainda mais nuances que a auxiliam na busca de padrões de redundância à medida que blocos de dados são verificados.
Uma tendência emergente na desduplicação é o aprendizado por reforço. Isto utiliza um sistema de recompensas e penalidades (como no treinamento de reforço) e aplica uma política ideal para separar registros ou fundi-los.
Outra tendência que vale a pena observar é o uso de métodos de conjunto, nos quais diferentes modelos ou algoritmos são usados em conjunto para garantir uma precisão ainda maior no processo de desduplicação.
O dilema contínuo
O mundo da TI está cada vez mais concentrado na questão contínua da proliferação de dados e no que fazer a respeito. Muitas empresas encontram-se na posição incómoda de quererem simultaneamente reter todos os dados que trabalharam para acumular e também de quererem guardar os seus novos dados transbordantes em qualquer recipiente de armazenamento possível, mesmo que apenas para os tirar do caminho.
Embora esse dilema persista, a ênfase nos esforços de desduplicação de dados continuará, à medida que as organizações veem a desduplicação como a alternativa mais barata à compra de mais armazenamento. Porque, em última análise, embora entendamos intuitivamente que os negócios precisam de dados, também sabemos que os dados muitas vezes exigem desduplicação.
Saiba como o IBM Storage FlashSystem pode ajudá-lo com suas necessidades de armazenamento
Esse artigo foi útil?
SimNão
Mais da nuvem
Boletins informativos da IBM
Receba nossos boletins informativos e atualizações de tópicos que oferecem as mais recentes lideranças inovadoras e insights sobre tendências emergentes.
Inscreva-se agora
Mais boletins informativos
- Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
- PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
- PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
- PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
- PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
- Fonte: https://www.ibm.com/blog/how-does-data-deduplication-work/
- :tem
- :é
- :não
- :onde
- $UP
- 1
- 17
- 19
- 2022
- 2024
- 22
- 28
- 29
- 30
- 300
- 36
- 400
- 41
- 7
- 84
- 9
- 91
- a
- Capaz
- Sobre
- sobre isso
- acomodar
- Segundo
- precisão
- Alcançar
- adicionado
- Adição
- Adicional
- avançado
- Publicidade
- afetado
- Depois de
- contra
- AI
- SIDA
- visar
- algoritmos
- Todos os Produtos
- sozinho
- tb
- alternativa
- Apesar
- quantidade
- amp
- an
- analítica
- analisado
- e
- Anúncios
- Outro
- qualquer
- aplica
- Aplicativos
- SOMOS
- ÁREA
- áreas
- artigo
- AS
- aspecto
- Ativos
- auxiliar
- associado
- At
- autor
- Automatizado
- média
- Azul
- em caminho duplo
- pano de fundo
- backup
- backups
- equilíbrio
- Largura de Banda
- baseado
- basic
- BE
- Porque
- tornam-se
- tornando-se
- sido
- antes
- atrás
- ser
- beneficiar
- Benefícios
- entre
- Pós
- bilhão
- Bloquear
- Blocos
- Blog
- Blogs
- Azul
- ambos
- Inferior
- Traz
- orçamentação
- construir
- negócio
- a continuidade dos negócios
- negócios
- mas a
- botão
- by
- CAN
- Capacidade
- capital
- carbono
- cartão
- Cartões
- cuidadoso
- transportar
- casos
- CAT
- Categoria
- Cadeira
- desafiar
- desafios
- Canal
- mais barato
- verificar
- escolha
- escolha
- escolhido
- círculos
- CIS
- classe
- classificar
- de perto
- Na nuvem
- computação em nuvem
- Coleta
- cor
- como
- vem
- mercadoria
- geralmente
- Empresas
- Empresa
- Empresa
- computador
- computação
- conjunção
- considerado
- considerando
- Recipiente
- continuar
- continua
- continuidade
- cópias
- custos
- Contrapartida
- cobertura
- crio
- criado
- cruzado
- APF
- personalizadas
- Cíber segurança
- dias
- dados,
- Perda de Dados
- gestão de dados
- protecção de dados
- conjuntos de dados
- armazenamento de dados
- Data
- decisões
- Padrão
- definições
- entregar
- Desmistificar
- Dependendo
- depende
- Implantações
- descrição
- concepção
- área de trabalho
- detalhado
- desenvolve
- dispositivo
- diferenças
- diferente
- desastre
- discutir
- do
- parece
- Não faz
- dominar
- não
- down
- durante
- e
- cada
- facilmente
- eficientemente
- esforço
- esforços
- eliminando
- abraços
- emergente
- ênfase
- autorizar
- permitir
- permitindo
- codificação
- final
- aprimoramento
- garantir
- Entrar
- Empreendimento
- empresas
- ambientes
- episódio
- igual
- essencial
- Éter (ETH)
- Mesmo
- Evento
- Cada
- cotidiano
- evolui
- existe
- saída
- Explicação
- explicando
- explosão
- extra
- Rosto
- rostos
- fato
- fábrica
- FALHA
- fallout
- falso
- Apresentando
- Envie o
- Arquivos
- financeiro
- Encontre
- descoberta
- Primeiro nome
- Fluxos
- Foco
- seguir
- seguinte
- fontes
- Escolha
- formulário
- encontrado
- Quadro
- da
- cheio
- funcionalidade
- funções
- jogo
- reunir
- colhido
- Geral
- gerar
- gerado
- gerador
- geopolítica
- ter
- óculos
- Global
- pandemia global
- meta
- maior
- maior
- Verde
- Grade
- Cresça:
- mão
- Manipulação
- Queijos duros
- Hardware
- hash
- Ter
- Título
- altura
- ajudar
- útil
- ajuda
- ajuda
- história
- Holdings
- Como funciona o dobrador de carta de canal
- Como Negociar
- HTTPS
- IBM
- IBM Cloud
- ICO
- ÍCONE
- idêntico
- identificar
- identificar
- if
- imagem
- importante
- aspecto importante
- imponente
- in
- Em outra
- incidentes
- incluir
- incluído
- Crescimento
- aumentou
- aumentando
- cada vez mais
- índice
- indústria
- inevitavelmente
- Infraestrutura
- inerente
- inicialmente
- insights
- instância
- em vez disso
- integral
- Inteligência
- Pretendido
- interno
- inversão
- investimento
- iot
- emitem
- IT
- ESTÁ
- se
- janeiro
- jpg
- manutenção
- Chave
- Saber
- laptop
- grande
- Maior
- Sobrenome
- Ano passado
- mais recente
- conduzir
- Liderança
- aprendizagem
- menos
- Nível
- responsabilidade
- como
- Line
- listas
- local
- local
- fora
- máquinas
- Macro
- a Principal
- fazer
- homem
- de grupos
- Sistema de gestão
- Gerentes
- maneira
- muitos
- max-width
- Posso..
- Mídia
- Membros
- fusão
- método
- métodos
- Microsoft
- poder
- minutos
- minimizar
- minimiza
- minutos
- Móvel Esteira
- modelos
- EQUIPAMENTOS
- momento
- dinheiro
- mais
- a maioria
- muito
- devo
- nacionalmente
- Natureza
- Navegação
- Perto
- quase
- necessário
- Cria
- Nem
- nunca
- Novo
- notícias
- newsletters
- nenhum
- nem
- notado
- nada
- Noção
- agora
- nuances
- objetos
- obter
- ocorrer
- of
- WOW!
- frequentemente
- on
- ONE
- contínuo
- só
- aberto
- operar
- opera
- Operações
- ideal
- Otimize
- otimizado
- Opções
- or
- organicamente
- organização
- organizações
- original
- Outros
- A Nossa
- Fora
- contornos
- saída
- próprio
- página
- pandemia
- parte
- particular
- padrões
- pagamento
- país
- penalidades
- Pessoas
- realizada
- persiste
- pessoa
- PHP
- Lugar
- colocado
- Pragas
- plano
- planejamento
- planos
- platão
- Inteligência de Dados Platão
- PlatãoData
- Plugado
- plug-in
- ponto
- equilibrado
- Privacidade
- Popular
- popularidade
- posição
- haveres
- possível
- Publique
- pós-processamento
- Powell
- poderoso
- Previsível
- Preparar
- preservação
- primário
- Problema
- processo
- processos
- produtor
- Produtos
- protegido
- proteção
- fornecer
- fornecedores
- publicado
- compra
- comprado
- aquisitivo
- prosseguir
- busca
- bastante
- RE
- Leitura
- Realidade
- razões
- recentemente
- reconhecer
- registros
- recuperação
- reduzir
- Reduzido
- redução
- redução
- referência
- refinar
- em relação a
- aprendizagem de reforço
- relacionado
- relativamente
- depender
- remoto
- remover
- Removido
- removendo
- repetido
- réplica
- Denunciar
- exige
- Recursos
- responsivo
- resultar
- reter
- retenção
- retorno
- Recompensas
- certo
- ascensão
- Risco
- gestão de risco
- roteiros
- robôs
- Quarto
- rotineiramente
- Execute
- corrida
- mesmo
- Salvar
- Escala
- digitaliza
- Peneira
- Scripts
- Vejo
- Buscar
- seo
- separando
- Série
- servidor
- Servidores
- serviço
- Conjuntos
- compartilhado
- mudança
- Baixo
- tiro
- rede de apoio social
- simples
- mais simples
- simplesmente
- simultaneamente
- local
- Sentado
- situação
- pequeno
- So
- Software
- solução
- Soluções
- alguns
- sofisticado
- fonte
- Espaço
- falar
- falando
- específico
- especificada
- gastar
- Passar
- gasto
- Patrocinado
- quadrados
- começo
- ficar
- Passos
- vara
- armazenamento
- loja
- lojas
- estratégias
- Estratégia
- simplificar
- robusto
- Inscreva-se
- substancial
- bem sucedido
- tal
- soma
- certo
- SVG
- .
- Tire
- toma
- tomar
- falando
- Tandem
- Target
- Tarefa
- Profissionais
- Membros do time
- tecnologia
- técnicas
- Tecnologia
- prazo
- condições
- terciário
- do que
- obrigado
- que
- A
- o mundo
- deles
- Eles
- tema
- si mesmos
- então
- Lá.
- assim sendo
- Este
- deles
- coisas
- think
- isto
- aqueles
- pensamento
- liderança de pensamento
- ameaça
- Através da
- todo
- apertado
- tempo
- pneu
- Título
- para
- topo
- tópico
- Temas
- Total
- tráfego
- Training
- trajetória
- fáceis
- árvore
- Trend
- Tendências
- verdadeiro
- verdadeiramente
- VIRAR
- tipo
- tipos
- Em última análise
- inegavelmente
- sofrido
- compreender
- Compreensível
- Inesperado
- único
- unidades
- Atualizações
- sobre
- URL
- us
- USD
- usar
- usava
- usos
- utilização
- geralmente
- validação
- Valioso
- variedade
- muito
- via
- Vídeo
- vendo
- Virtual
- área de trabalho virtual
- vs
- W
- querendo
- Armazém
- foi
- assistindo
- Caminho..
- we
- web
- BEM
- O Quê
- quando
- qual
- enquanto
- de quem
- precisarão
- Windows
- de
- dentro
- testemunhado
- WordPress
- Atividades:
- trabalhou
- trabalhar
- trabalho
- mundo
- no mundo todo
- Equivalente há
- digno
- escrito
- ano
- anos
- Você
- investimentos
- Youtube
- zefirnet