In den letzten Jahren kam es zu einem explosionsartigen Anstieg der Verbreitung von Selfstorage-Einheiten. Diese großen Lagerhallen haben sich landesweit zu einer boomenden Industrie entwickelt, und zwar aus einem Grund: Der durchschnittliche Mensch verfügt heute über mehr Besitztümer, als er damit anzufangen weiß.
Die gleiche Grundsituation herrscht auch in der IT-Welt. Wir befinden uns mitten in einer Datenexplosion. Sogar relativ einfache Alltagsgegenstände generieren dank dieser mittlerweile routinemäßig selbst Daten Internet der Dinge (IoT) Funktionalität. Noch nie in der Geschichte wurden so viele Daten erstellt, gesammelt und analysiert. Und noch nie haben sich mehr Datenmanager mit dem Problem auseinandergesetzt, wie so viele Daten gespeichert werden sollen.
Ein Unternehmen erkennt das Problem möglicherweise zunächst nicht oder erkennt nicht, wie groß es werden kann, und muss dann eine Lösung für mehr Speicher finden. Mit der Zeit könnte das Unternehmen auch aus diesem Speichersystem herauswachsen, was noch mehr Investitionen erfordern würde. Das Unternehmen wird dieses Spiel unweigerlich satt haben und nach einer günstigeren und einfacheren Option suchen – womit wir hier angelangt sind Datendeduplizierung.
Obwohl viele Organisationen Datendeduplizierungstechniken (oder „Deduplizierung“) als Teil ihres Datenverwaltungssystems nutzen, verstehen nicht annähernd so viele wirklich, was der Deduplizierungsprozess ist und was er bewirken soll. Lassen Sie uns also die Deduplizierung entmystifizieren und erklären, wie die Datendeduplizierung funktioniert.
Was bewirkt die Deduplizierung?
Lassen Sie uns zunächst unseren Hauptbegriff klären. Datendeduplizierung ist ein Prozess, mit dem Unternehmen ihre Datenbestände rationalisieren und die Menge der archivierten Daten reduzieren, indem sie redundante Datenkopien eliminieren.
Darüber hinaus sollten wir darauf hinweisen, dass wir, wenn wir von redundanten Daten sprechen, tatsächlich von der Dateiebene sprechen und von einer rasanten Verbreitung von Datendateien sprechen. Wenn wir also über Datendeduplizierungsbemühungen sprechen, ist es eigentlich ein Dateideduplizierungssystem, das benötigt wird.
Was ist das Hauptziel der Deduplizierung?
Manche Menschen haben eine falsche Vorstellung von der Natur von Daten und betrachten sie als eine Ware, die einfach dazu da ist, gesammelt und geerntet zu werden – wie Äpfel von einem Baum in Ihrem eigenen Garten.
Die Realität ist, dass jede neue Datendatei Geld kostet. Erstens kostet es in der Regel Geld, solche Daten zu erhalten (durch den Kauf von Datenlisten). Oder es erfordert erhebliche finanzielle Investitionen, damit eine Organisation selbst Daten sammeln und sammeln kann, selbst wenn es sich um Daten handelt, die die Organisation selbst organisch produziert und sammelt. Datensätze sind daher eine Investition und müssen wie jede wertvolle Investition streng geschützt werden.
In diesem Fall geht es um Datenspeicherplatz – sei es in Form von On-Premise-Hardwareservern oder durch Cloud-Speicher über eine cloudbasierte Rechenzentrum.– das muss gekauft oder geleast werden.
Doppelte Kopien von Daten, die einer Replikation unterzogen wurden, schmälern daher das Endergebnis, da sie zusätzliche Speicherkosten verursachen, die über die mit dem primären Speichersystem und seinem Speicherplatz verbundenen Kosten hinausgehen. Kurz gesagt, es müssen mehr Speichermedienressourcen bereitgestellt werden, um sowohl neue als auch bereits gespeicherte Daten aufzunehmen. Irgendwann in der Entwicklung eines Unternehmens können doppelte Daten leicht zu einer finanziellen Belastung werden.
Zusammenfassend lässt sich sagen, dass das Hauptziel der Datendeduplizierung darin besteht, Geld zu sparen, indem Unternehmen weniger Geld für zusätzlichen Speicher ausgeben müssen.
Zusätzliche Vorteile der Deduplizierung
Für Unternehmen gibt es über die Speicherkapazität hinaus noch weitere Gründe, sich für Datendeduplizierungslösungen zu entscheiden – wahrscheinlich nicht wichtiger als der Datenschutz und die Verbesserung, die sie bieten. Unternehmen verfeinern und optimieren deduplizierte Daten-Workloads, sodass diese effizienter ausgeführt werden als Daten, die voller doppelter Dateien sind.
Ein weiterer wichtiger Aspekt der Deduplizierung besteht darin, wie sie dazu beiträgt, eine schnelle und erfolgreiche Lösung zu ermöglichen Katastrophe den Wiederherstellungsaufwand und minimiert den Datenverlust, der häufig aus einem solchen Ereignis resultieren kann. Dedupe trägt dazu bei, einen stabilen Backup-Prozess zu ermöglichen, sodass das Backup-System eines Unternehmens der Aufgabe, seine Backup-Daten zu verwalten, gewachsen ist. Die Deduplizierung hilft nicht nur bei vollständigen Backups, sondern unterstützt auch die Aufbewahrungsbemühungen.
Ein weiterer Vorteil der Datendeduplizierung besteht darin, wie gut sie in Verbindung mit funktioniert virtuelle Desktop-Infrastruktur (VDI) Bereitstellungen, da die virtuellen Festplatten hinter den Remote-Desktops des VDI identisch funktionieren. Beliebt Desktop als Dienst (DaaS) Zu den Produkten gehören Azure Virtual Desktop von Microsoft und dessen Windows VDI. Diese Produkte schaffen virtuelle Maschinen (VMs), die während des Servervirtualisierungsprozesses erstellt werden. Diese virtuellen Maschinen wiederum unterstützen die VDI-Technologie.
Deduplizierungsmethodik
Die am häufigsten verwendete Form der Datendeduplizierung ist die Blockdeduplizierung. Bei dieser Methode werden automatisierte Funktionen verwendet, um Duplikate in Datenblöcken zu identifizieren und diese Duplikate dann zu entfernen. Durch die Arbeit auf dieser Blockebene können einzelne Datenblöcke analysiert und als validierungs- und archivierungswürdig eingestuft werden. Wenn die Deduplizierungssoftware dann eine Wiederholung desselben Datenblocks erkennt, wird diese Wiederholung entfernt und an ihrer Stelle ein Verweis auf die Originaldaten eingefügt.
Das ist die Hauptform der Deduplizierung, aber bei weitem nicht die einzige Methode. In anderen Anwendungsfällen erfolgt eine alternative Methode der Datendeduplizierung auf Dateiebene. Beim Einzelinstanzspeicher werden vollständige Datenkopien innerhalb des Dateiservers verglichen, jedoch keine Datenblöcke oder Datenblöcke. Wie die entsprechende Methode hängt auch die Dateideduplizierung davon ab, dass die Originaldatei im Dateisystem verbleibt und zusätzliche Kopien entfernt werden.
Es ist zu beachten, dass Deduplizierungstechniken nicht ganz auf die gleiche Weise funktionieren wie Datenkomprimierungsalgorithmen (z. B. LZ77, LZ78), obwohl beide das gleiche allgemeine Ziel verfolgen, nämlich die Reduzierung von Datenredundanzen. Deduplizierungstechniken erreichen dies auf einer größeren Makroebene als Komprimierungsalgorithmen, deren Ziel weniger darin besteht, identische Dateien durch gemeinsam genutzte Kopien zu ersetzen, als vielmehr darin, Datenredundanzen effizienter zu kodieren.
Arten der Datendeduplizierung
Je nachdem gibt es unterschiedliche Arten der Datendeduplizierung wann Der Deduplizierungsprozess findet statt:
- Inline-Deduplizierung: Diese Form der Datendeduplizierung erfolgt augenblicklich – in Echtzeit – während die Daten innerhalb des Speichersystems fließen. Das Inline-Deduplizierungssystem trägt weniger Datenverkehr, da es weder duplizierte Daten überträgt noch speichert. Dies kann zu einer Verringerung der von dieser Organisation insgesamt benötigten Bandbreite führen.
- Deduplizierung nach dem Prozess: Diese Art der Deduplizierung findet statt, nachdem Daten geschrieben und auf einem Speichergerät abgelegt wurden.
An dieser Stelle ist zu erklären, dass beide Arten der Datendeduplizierung von den Hash-Berechnungen betroffen sind, die mit der Datendeduplizierung einhergehen. Diese kryptographisch Berechnungen sind ein wesentlicher Bestandteil der Identifizierung wiederholter Muster in Daten. Bei Inline-Deduplizierungen werden die Berechnungen im Moment ausgeführt, die die Computerfunktionalität dominieren und vorübergehend überfordern können. Bei Post-Processing-Deduplizierungen können die Hash-Berechnungen jederzeit nach dem Hinzufügen der Daten durchgeführt werden, und zwar auf eine Art und Weise und zu einem Zeitpunkt, der die Computerressourcen des Unternehmens nicht überlastet.
Die subtilen Unterschiede zwischen den Deduplizierungstypen enden hier jedoch nicht. Eine andere Möglichkeit zur Klassifizierung von Deduplizierungstypen basiert auf woher Solche Prozesse finden statt.
- Quellendeduplizierung: Diese Form der Deduplizierung findet in der Nähe des Ortes statt, an dem neue Daten tatsächlich generiert werden. Das System scannt diesen Bereich und erkennt neue Kopien von Dateien, die dann entfernt werden.
- Zieldeduplizierung: Eine andere Art der Deduplizierung ähnelt einer Umkehrung der Quelldeduplizierung. Bei der Zieldeduplizierung dedupliziert das System alle Kopien, die sich in anderen Bereichen als denen befinden, in denen die Originaldaten erstellt wurden.
Da unterschiedliche Arten der Deduplizierung praktiziert werden, müssen zukunftsorientierte Unternehmen sorgfältige und überlegte Entscheidungen hinsichtlich der gewählten Art der Deduplizierung treffen und diese Methode an den besonderen Anforderungen des Unternehmens abwägen.
In vielen Anwendungsfällen hängt die Wahl der Deduplizierungsmethode eines Unternehmens möglicherweise von einer Vielzahl interner Variablen ab, wie zum Beispiel den folgenden:
- Wie viele und welche Art von Datensätzen werden erstellt?
- Das primäre Speichersystem der Organisation
- Welche virtuellen Umgebungen werden verwendet?
- Auf welche Apps das Unternehmen setzt
Aktuelle Entwicklungen bei der Datendeduplizierung
Wie bei allen Computerausgaben wird auch die Datendeduplizierung zunehmend zum Einsatz kommen Künstliche Intelligenz (KI) wie es sich weiterentwickelt. Die Deduplizierung wird immer ausgefeilter, da sie immer mehr Nuancen entwickelt, die ihr bei der Suche nach Redundanzmustern beim Scannen von Datenblöcken helfen.
Ein aufkommender Trend bei der Deduplizierung ist Reinforcement Learning. Hierbei wird ein System von Belohnungen und Strafen verwendet (wie beim Verstärkungstraining) und eine optimale Richtlinie zum Trennen oder Zusammenführen von Datensätzen angewendet.
Ein weiterer beobachtenswerter Trend ist der Einsatz von Ensemble-Methoden, bei denen verschiedene Modelle oder Algorithmen im Tandem verwendet werden, um eine noch höhere Genauigkeit im Deduplizierungsprozess zu gewährleisten.
Das anhaltende Dilemma
Die IT-Welt konzentriert sich zunehmend auf das anhaltende Problem der Datenverbreitung und darauf, was dagegen zu tun ist. Viele Unternehmen befinden sich in der misslichen Lage, gleichzeitig alle Daten, die sie sich angesammelt haben, behalten zu wollen und gleichzeitig ihre überquellenden neuen Daten in einem beliebigen Speichercontainer unterzubringen, und sei es nur, um sie aus dem Weg zu räumen.
Während dieses Dilemma weiterhin besteht, wird der Schwerpunkt weiterhin auf Datendeduplizierungsbemühungen liegen, da Unternehmen die Deduplizierung als die günstigere Alternative zum Kauf von mehr Speicher betrachten. Denn obwohl wir intuitiv verstehen, dass Unternehmen Daten benötigen, wissen wir letztendlich auch, dass Daten sehr oft einer Deduplizierung bedürfen.
Erfahren Sie, wie IBM Storage FlashSystem Sie bei Ihren Speicheranforderungen unterstützen kann
War dieser Artikel hilfreich?
JaNein
Mehr von Cloud
IBM Newsletter
Erhalten Sie unsere Newsletter und Themenaktualisierungen, die die neuesten Gedanken und Einblicke in neue Trends liefern.
Abonniere jetzt
Weitere Newsletter
- SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
- PlatoData.Network Vertikale generative KI. Motiviere dich selbst. Hier zugreifen.
- PlatoAiStream. Web3-Intelligenz. Wissen verstärkt. Hier zugreifen.
- PlatoESG. Kohlenstoff, CleanTech, Energie, Umwelt, Solar, Abfallwirtschaft. Hier zugreifen.
- PlatoHealth. Informationen zu Biotechnologie und klinischen Studien. Hier zugreifen.
- Quelle: https://www.ibm.com/blog/how-does-data-deduplication-work/
- :hast
- :Ist
- :nicht
- :Wo
- $UP
- 1
- 17
- 19
- 2022
- 2024
- 22
- 28
- 29
- 30
- 300
- 36
- 400
- 41
- 7
- 84
- 9
- 91
- a
- Fähig
- LiveBuzz
- darüber
- unterbringen
- Nach
- Genauigkeit
- Erreichen
- berührt das Schneidwerkzeug
- hinzugefügt
- Zusatz
- Zusätzliche
- advanced
- Marketings
- betroffen
- Nach der
- gegen
- AI
- AIDS
- Ziel
- Algorithmen
- Alle
- allein
- ebenfalls
- Alternative
- Obwohl
- Betrag
- amp
- an
- Analytik
- analysiert
- und
- Ankündigungen
- Ein anderer
- jedem
- gilt
- Apps
- SIND
- Bereich
- Bereiche
- Artikel
- AS
- Aussehen
- Details
- helfen
- damit verbundenen
- At
- Autor
- Automatisiert
- durchschnittlich
- Azure
- Zurück
- Hintergrund
- Sicherungskopie
- Sicherungen
- Balancing
- Bandbreite
- basierend
- basic
- BE
- weil
- werden
- Werden
- war
- Bevor
- hinter
- Sein
- Nutzen
- Vorteile
- zwischen
- Beyond
- Milliarde
- Blockieren
- Blockiert
- Blog
- Blogs
- Blau
- beide
- Boden
- Brings
- Budgetierung
- bauen
- Geschäft
- Geschäftskontinuität
- Unternehmen
- aber
- Taste im nun erscheinenden Bestätigungsfenster nun wieder los.
- by
- CAN
- Kapazität
- Hauptstadt
- Kohlenstoff
- Karte
- Karten
- vorsichtig
- tragen
- Fälle
- CAT
- Kategorie
- Vorsitzende
- challenges
- Herausforderungen
- Kanal
- billiger
- aus der Ferne überprüfen
- Wahl
- Auswahl
- gewählt
- Kreise
- CIS
- Klasse
- klassifizieren
- eng
- Cloud
- Cloud Computing
- Das Sammeln
- Farbe
- wie die
- kommt
- Ware
- häufig
- Unternehmen
- Unternehmen
- Unternehmen
- Computer
- Computing
- Verbindung
- betrachtet
- Berücksichtigung
- Container
- fortsetzen
- weiter
- Kontinuität
- Kopien
- Kosten
- Gegenstück
- Abdeckung
- erstellen
- erstellt
- Crossed
- CSS
- Original
- Internet-Sicherheit
- Tage
- technische Daten
- Data Loss
- Datenmanagement
- Datenschutz
- Datensätze
- Datenspeichervorrichtung
- Datum
- Entscheidungen
- Standard
- Definitionen
- Übergeben
- entmystifizieren
- Abhängig
- hängt
- Implementierungen
- Beschreibung
- Entwerfen
- Desktop
- detailliert
- entwickelt
- Gerät
- Unterschiede
- anders
- Katastrophe
- diskutieren
- do
- die
- Tut nicht
- dominieren
- Nicht
- nach unten
- im
- e
- jeder
- leicht
- effizient
- Anstrengung
- Bemühungen
- eliminieren
- umarmen
- aufstrebenden
- Betonung
- ermächtigen
- ermöglichen
- ermöglichen
- Codierung
- Ende
- Erweiterung
- gewährleisten
- Enter
- Unternehmen
- Unternehmen
- Umgebungen
- Folge anschauen
- gleich
- essential
- Äther (ETH)
- Sogar
- Event
- Jedes
- jeden Tag
- entwickelt sich
- existiert
- Beenden
- Erklären
- Erläuterung
- Explosion
- extra
- Gesicht
- Gesichter
- Tatsache
- Fabrik
- FAIL
- Fallout
- falsch
- Einzigartige
- Reichen Sie das
- Mappen
- Revolution
- Finden Sie
- Suche nach
- Vorname
- Fließt
- Setzen Sie mit Achtsamkeit
- folgen
- Folgende
- Schriftarten
- Aussichten für
- unten stehende Formular
- gefunden
- Unser Ansatz
- für
- voller
- Funktionalität
- Funktionen
- Spiel
- sammeln
- gesammelt
- Allgemeines
- erzeugen
- erzeugt
- Generator
- geopolitischen
- bekommen
- Brille
- Global
- globale Pandemie
- Kundenziele
- mehr
- größte
- Grün
- Gitter
- Wachsen Sie über sich hinaus
- Pflege
- Handling
- hart
- Hardware
- Hash-
- Haben
- Überschrift
- Höhe
- Hilfe
- hilfreich
- Unternehmen
- hilft
- Geschichte
- Holdings
- Ultraschall
- Hilfe
- HTTPS
- IBM
- IBM Cloud
- ICO
- ICON
- identisch
- identifizieren
- Identifizierung
- if
- Image
- wichtig
- wichtiger Aspekt
- imposant
- in
- In anderen
- Zwischenfälle
- das
- inklusive
- Erhöhung
- hat
- zunehmend
- zunehmend
- Index
- Energiegewinnung
- zwangsläufig
- Infrastruktur
- inhärent
- anfänglich
- Einblicke
- Instanz
- beantragen müssen
- Integral
- Intelligenz
- beabsichtigt
- intern
- Inversion
- Investition
- iot
- Problem
- IT
- SEINE
- selbst
- Januar
- jpg
- Aufbewahrung
- Wesentliche
- Wissen
- Laptop
- grosse
- größer
- Nachname
- Letztes Jahr
- neueste
- führen
- Leadership
- lernen
- weniger
- Niveau
- Haftung
- Gefällt mir
- Line
- Listen
- aus einer regionalen
- lokal
- Verlust
- Maschinen
- Makro
- Main
- um
- Mann
- Management
- Management System
- Manager
- Weise
- viele
- max-width
- Kann..
- Medien
- Mitglieder
- Verschmelzung
- Methode
- Methoden
- Microsoft
- könnte
- Min.
- minimieren
- minimiert
- Minuten
- Mobil
- für
- modern
- Moment
- Geld
- mehr
- vor allem warme
- viel
- sollen
- landesweit
- Natur
- Menü
- In der Nähe von
- fast
- erforderlich
- Bedürfnisse
- Weder
- hört niemals
- Neu
- News
- Newsletter
- Andere
- noch
- bekannt
- nichts
- Notion
- jetzt an
- Abschattung
- Objekte
- erhalten
- auftreten
- of
- WOW!
- vorgenommen,
- on
- EINEM
- laufend
- einzige
- XNUMXh geöffnet
- betreiben
- arbeitet
- Einkauf & Prozesse
- optimal
- Optimieren
- optimiert
- Optionen
- or
- organisch
- Organisation
- Organisationen
- Original
- Andere
- UNSERE
- Umrissen
- Möglichkeiten für das Ausgangssignal:
- besitzen
- Seite
- Pandemie
- Teil
- besondere
- Muster
- Zahlung
- Land
- Strafen
- Personen
- durchgeführt
- besteht fort
- person
- PHP
- Ort
- platziert
- Seuchen
- Plan
- Planung
- Pläne
- Plato
- Datenintelligenz von Plato
- PlatoData
- Gesteckt
- Plugin
- Points
- balanciert
- Datenschutzrichtlinien
- Beliebt
- Popularität
- Position
- Habe
- möglich
- Post
- Nachbearbeitung
- Powell
- größte treibende
- Vorhersagbar
- Danach
- Erhaltung
- primär
- Aufgabenstellung:
- Prozessdefinierung
- anpassen
- Herstellung
- Produkte
- geschützt
- Sicherheit
- die
- Anbieter
- veröffentlicht
- Kauf
- gekauft
- Kauf
- verfolgen
- Verfolgung
- ganz
- RE
- Lesebrillen
- Realität
- Gründe
- kürzlich
- erkennen
- Aufzeichnungen
- Erholung
- Veteran
- Reduziert
- Reduzierung
- Reduktion
- Referenz
- verfeinern
- in Bezug auf
- Verstärkung lernen
- bezogene
- verhältnismäßig
- verlassen
- entfernt
- entfernen
- Entfernt
- Entfernen
- wiederholt
- Replikation
- berichten
- erfordert
- Downloads
- ansprechbar
- Folge
- behalten
- Beibehaltung
- Rückkehr
- Belohnung
- Recht
- Anstieg
- Risiko
- Risikomanagement
- Roadmaps
- Roboter
- Zimmer
- regelmäßig
- Führen Sie
- Laufen
- gleich
- Speichern
- Skalieren
- scannt
- Bildschirm
- Skripte
- sehen
- Suchen
- seo
- Trennung
- Modellreihe
- Server
- Server
- Sets
- von Locals geführtes
- verschieben
- Short
- Schuss
- sollte
- Einfacher
- einfacher
- einfach
- gleichzeitig
- am Standort
- Sitzend
- Situation
- klein
- So
- Software
- Lösung
- Lösungen
- einige
- anspruchsvoll
- Quelle
- Raumfahrt
- sprechen
- Sprechen
- spezifisch
- angegeben
- verbringen
- Ausgabe
- verbrachte
- Sponsored
- Quadrate
- Anfang
- bleiben
- Shritte
- Kleben
- Lagerung
- speichern
- Läden
- Strategien
- Strategie
- rationalisieren
- robust
- Abonnieren
- wesentlich
- erfolgreich
- so
- Summe
- sicher
- SVG
- System
- Nehmen
- nimmt
- Einnahme
- sprechen
- Tandem
- Target
- Aufgabe
- Team
- Teammitglieder
- Tech
- Techniken
- Technologie
- Begriff
- AGB
- Tertiär-
- als
- dank
- zur Verbesserung der Gesundheitsgerechtigkeit
- Das
- die Welt
- ihr
- Sie
- Thema
- sich
- dann
- Dort.
- deswegen
- Diese
- vom Nutzer definierten
- think
- fehlen uns die Worte.
- diejenigen
- dachte
- Gedankenführung
- Bedrohung
- Durch
- während
- angezogen
- Zeit
- Reifen
- Titel
- zu
- Top
- Thema
- Themen
- Gesamt
- der Verkehr
- Ausbildung
- Flugbahn
- Transfers
- Baum
- Trend
- Trends
- was immer dies auch sein sollte.
- wirklich
- WENDE
- tippe
- Typen
- Letztlich
- unbestreitbar
- unterzogen
- verstehen
- Verständlicherweise
- Unerwartet
- einzigartiges
- Bereiche
- Updates
- auf
- URL
- us
- USD
- -
- benutzt
- verwendet
- Verwendung von
- gewöhnlich
- Bestätigung
- wertvoll
- Vielfalt
- sehr
- Video
- Besichtigung
- Assistent
- virtueller Desktop
- vs
- W
- wollen
- Warehouse
- wurde
- beobachten
- Weg..
- we
- Netz
- GUT
- Was
- wann
- welche
- während
- deren
- werden wir
- Fenster
- mit
- .
- Zeuge
- WordPress
- Arbeiten
- gearbeitet
- arbeiten,
- Werk
- weltweit wie ausgehandelt und gekauft ausgeführt wird.
- Das weltweit
- wert
- würdig
- geschrieben
- Jahr
- Jahr
- U
- Ihr
- Youtube
- Zephyrnet