W ostatnich latach nastąpił gwałtowny wzrost liczby modułów typu self-storage. Te duże magazyny stały się dynamicznie rozwijającym się przemysłem w całym kraju z jednego powodu — przeciętny człowiek ma obecnie więcej rzeczy, niż wie, co zrobić.
Ta sama podstawowa sytuacja nęka także świat IT. Jesteśmy w trakcie eksplozji danych. Nawet stosunkowo proste przedmioty codziennego użytku rutynowo generują obecnie dane samodzielnie, dzięki Internet przedmiotów (Internet przedmiotów) funkcjonalność. Nigdy wcześniej w historii nie stworzono, nie zebrano i nie przeanalizowano tak dużej ilości danych. Nigdy wcześniej więcej menedżerów danych nie zmagało się z problemem przechowywania tak dużej ilości danych.
Firma może początkowo nie rozpoznać problemu ani tego, jak duży może być, a następnie musi znaleźć lepsze rozwiązanie w zakresie przechowywania. Z czasem firma może również przerosnąć ten system przechowywania, co będzie wymagało jeszcze większych inwestycji. Nieuchronnie firma zmęczy się tą grą i będzie szukać tańszej i prostszej opcji – co nas prowadzi deduplikacja danych.
Chociaż wiele organizacji korzysta z technik deduplikacji danych („deduplikacji”) w ramach swoich systemów zarządzania danymi, niewiele z nich tak naprawdę rozumie, na czym polega proces deduplikacji i do czego jest przeznaczony. Wyjaśnijmy więc, jak działa deduplikacja danych i wyjaśnijmy, jak działa deduplikacja.
Do czego służy deduplikacja?
Najpierw wyjaśnijmy nasz główny termin. Deduplikacja danych to proces stosowany przez organizacje w celu usprawnienia przechowywania danych i zmniejszenia ilości archiwizowanych danych poprzez eliminację zbędnych kopii danych.
Ponadto powinniśmy podkreślić, że mówiąc o zbędnych danych, w rzeczywistości mówimy na poziomie pliku i mamy na myśli szalejące rozprzestrzenianie się plików danych. Kiedy więc omawiamy wysiłki związane z deduplikacją danych, tak naprawdę potrzebny jest system deduplikacji plików.
Jaki jest główny cel deduplikacji?
Niektórzy ludzie żywią błędne wyobrażenie o naturze danych, postrzegając je jako towar, który po prostu istnieje po to, aby go gromadzić i zbierać – jak jabłka z drzewa z własnego podwórka.
Rzeczywistość jest taka, że każdy nowy plik danych kosztuje. Po pierwsze, uzyskanie takich danych jest zwykle kosztowne (poprzez zakup list danych). Lub też wymaga znacznych inwestycji finansowych, aby organizacja mogła samodzielnie gromadzić i gromadzić dane, nawet jeśli są to dane, które sama organizacja wytwarza i gromadzi w sposób organiczny. Zbiory danych stanowią zatem inwestycję i jak każda wartościowa inwestycja muszą być rygorystycznie chronione.
W tym przypadku mówimy o przestrzeni do przechowywania danych — czy to w postaci lokalnych serwerów sprzętowych, czy za pośrednictwem przechowywanie w chmurze za pośrednictwem chmury centrum danych– które należy kupić lub wydzierżawić.
Zduplikowane kopie danych, które zostały poddane replikacji, pogarszają zatem wyniki finansowe, narzucając dodatkowe koszty przechowywania, wykraczające poza te związane z podstawowym systemem pamięci masowej i jego przestrzenią do przechowywania. Krótko mówiąc, należy przeznaczyć więcej zasobów nośników pamięci, aby pomieścić zarówno nowe, jak i już przechowywane dane. Na pewnym etapie działalności firmy zduplikowane dane mogą łatwo stać się obciążeniem finansowym.
Podsumowując, głównym celem deduplikacji danych jest zaoszczędzenie pieniędzy poprzez umożliwienie organizacjom wydawania mniej na dodatkową pamięć masową.
Dodatkowe korzyści z deduplikacji
Oprócz pojemności pamięci masowej firmy decydują się na rozwiązania do deduplikacji danych także z innych powodów — prawdopodobnie żaden z nich nie jest bardziej istotny niż zapewniana przez nie ochrona i ulepszanie danych. Organizacje udoskonalają i optymalizują obciążenia związane z deduplikowanymi danymi, aby działały wydajniej niż dane zawierające duplikaty plików.
Innym ważnym aspektem dedupe jest to, jak pomaga zapewnić szybkość i skuteczność katastrofa wysiłku związanego z odzyskiwaniem danych i minimalizuje ilość utraty danych, która często może wynikać z takiego zdarzenia. Dedupe pomaga zapewnić solidny proces tworzenia kopii zapasowych, dzięki czemu system tworzenia kopii zapasowych organizacji jest w stanie sprostać zadaniu obsługi danych kopii zapasowych. Oprócz pomocy przy pełnych kopiach zapasowych, dedupe pomaga również w wysiłkach związanych z przechowywaniem.
Kolejną zaletą deduplikacji danych jest to, jak dobrze działa w połączeniu z infrastruktura wirtualnych pulpitów (VDI) wdrożeniach, dzięki temu, że wirtualne dyski twarde znajdujące się za zdalnymi pulpitami VDI działają identycznie. Popularny Pulpit jako usługa (DaaS) produkty obejmują Azure Virtual Desktop firmy Microsoft i jej Windows VDI. Te produkty tworzą maszyny wirtualne (VM), które powstają w procesie wirtualizacji serwerów. Z kolei te maszyny wirtualne wspierają technologię VDI.
Metodologia deduplikacji
Najpowszechniej stosowaną formą deduplikacji danych jest deduplikacja blokowa. Metoda ta opiera się na automatycznych funkcjach identyfikujących duplikacje w blokach danych, a następnie usuwających te duplikacje. Pracując na tym poziomie bloku, można analizować fragmenty unikalnych danych i określać je jako warte sprawdzenia i zachowania. Następnie, gdy oprogramowanie do deduplikacji wykryje powtórzenie tego samego bloku danych, powtórzenie to jest usuwane, a w jego miejsce umieszczane jest odniesienie do oryginalnych danych.
To główna forma deduplikacji, ale nie jedyna metoda. W innych przypadkach alternatywna metoda deduplikacji danych działa na poziomie pliku. Magazyn z pojedynczą instancją porównuje pełne kopie danych na serwerze plików, ale nie fragmenty lub bloki danych. Podobnie jak metoda odpowiednika, deduplikacja plików polega na przechowywaniu oryginalnego pliku w systemie plików i usuwaniu dodatkowych kopii.
Należy zauważyć, że techniki deduplikacji nie działają w taki sam sposób, jak algorytmy kompresji danych (np. LZ77, LZ78), chociaż prawdą jest, że oba mają ten sam ogólny cel, jakim jest zmniejszenie nadmiarowości danych. Techniki deduplikacji osiągają to na większą, makroskalę niż algorytmy kompresji, których celem nie jest zastępowanie identycznych plików udostępnionymi kopiami, a bardziej wydajne kodowanie nadmiarowości danych.
Rodzaje deduplikacji danych
W zależności od rodzaju deduplikacji danych istnieją różne typy deduplikacji jeśli chodzi o komunikację i motywację zachodzi proces deduplikacji:
- Deduplikacja inline: Ta forma deduplikacji danych odbywa się w momencie – w czasie rzeczywistym – przepływu danych w systemie pamięci masowej. Wbudowany system deduplikacji przenosi mniejszy ruch danych, ponieważ nie przesyła ani nie przechowuje zduplikowanych danych. Może to prowadzić do zmniejszenia całkowitej przepustowości wymaganej przez tę organizację.
- Deduplikacja poprocesowa: Ten typ deduplikacji ma miejsce po zapisaniu danych i umieszczeniu ich na jakimś urządzeniu magazynującym.
W tym miejscu warto wyjaśnić, że obliczenia skrótu właściwe dla deduplikacji danych mają wpływ na oba typy deduplikacji danych. Te kryptograficzny obliczenia są integralną częścią identyfikacji powtarzających się wzorców w danych. Podczas deduplikacji in-line obliczenia te wykonywane są w momencie, który może zdominować i chwilowo przeciążyć funkcjonalność komputera. W deduplikacjach postprocessingowych obliczenia skrótu można wykonać w dowolnym momencie po dodaniu danych w sposób i w czasie nie obciążającym zasobów komputerowych organizacji.
Na tym nie kończą się subtelne różnice między typami deduplikacji. Inny sposób klasyfikacji typów deduplikacji opiera się na gdzie takie procesy zachodzą.
- Deduplikacja źródła: Ta forma deduplikacji ma miejsce w pobliżu miejsca, w którym faktycznie generowane są nowe dane. System skanuje ten obszar i wykrywa nowe kopie plików, które następnie usuwa.
- Docelowa deduplikacja: Innym rodzajem deduplikacji jest odwrócenie deduplikacji źródłowej. W przypadku deduplikacji docelowej system deduplikuje wszelkie kopie znalezione w obszarach innych niż te, w których utworzono oryginalne dane.
Ponieważ stosowane są różne rodzaje deduplikacji, organizacje myślące przyszłościowo muszą podejmować ostrożne i przemyślane decyzje dotyczące wybranego rodzaju deduplikacji, równoważąc tę metodę ze szczególnymi potrzebami firmy.
W wielu przypadkach wybrana przez organizację metoda deduplikacji może równie dobrze sprowadzić się do różnych zmiennych wewnętrznych, takich jak następujące:
- Ile i jakiego rodzaju zbiory danych są tworzone
- Podstawowy system przechowywania danych w organizacji
- Które środowiska wirtualne są używane
- Na jakich aplikacjach firma polega
Najnowsze osiągnięcia w zakresie deduplikacji danych
Podobnie jak wszystkie dane wyjściowe komputera, deduplikacja danych będzie coraz częściej wykorzystywana sztuczna inteligencja (AI) w miarę dalszego rozwoju. Dedupe będzie coraz bardziej wyrafinowany w miarę opracowywania coraz większej liczby niuansów, które pomogą mu w poszukiwaniu wzorców nadmiarowości podczas skanowania bloków danych.
Jednym z pojawiających się trendów w deduplikacji jest uczenie się przez wzmacnianie. Wykorzystuje to system nagród i kar (jak w szkoleniu wzmacniającym) i stosuje optymalną politykę oddzielania rekordów lub ich łączenia.
Kolejnym trendem, na który warto zwrócić uwagę, jest stosowanie metod zespołowych, w których różne modele lub algorytmy są wykorzystywane w tandemie, aby zapewnić jeszcze większą dokładność w procesie deduplikacji.
Ciągły dylemat
Świat IT coraz bardziej koncentruje się na ciągłym problemie rozprzestrzeniania się danych i sposobach jego rozwiązania. Wiele firm znajduje się w niezręcznej sytuacji, chcąc jednocześnie zachować wszystkie dane, nad którymi pracowały, zgromadzić, a jednocześnie chcąc przechowywać nowe, przepełnione dane w dowolnym możliwym pojemniku do przechowywania, choćby po to, aby się ich pozbyć.
Chociaż taki dylemat nie ustąpi, nacisk na wysiłki w zakresie deduplikacji danych będzie nadal kładziony, ponieważ organizacje postrzegają deduplikację jako tańszą alternatywę dla zakupu większej ilości pamięci masowej. Bo ostatecznie, chociaż intuicyjnie rozumiemy, że biznes potrzebuje danych, wiemy też, że dane bardzo często wymagają deduplikacji.
Czy ten artykuł był pomocny?
TakNie
Więcej z chmury
Biuletyny IBM
Otrzymuj nasze biuletyny i aktualizacje tematów, które dostarczają najnowszych informacji i spostrzeżeń na temat pojawiających się trendów.
Subskrybuj teraz
Więcej biuletynów
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
- PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
- PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
- Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
- Źródło: https://www.ibm.com/blog/how-does-data-deduplication-work/
- :ma
- :Jest
- :nie
- :Gdzie
- $W GÓRĘ
- 1
- 17
- 19
- 2022
- 2024
- 22
- 28
- 29
- 30
- 300
- 36
- 400
- 41
- 7
- 84
- 9
- 91
- a
- Zdolny
- O nas
- o tym
- pomieścić
- Stosownie
- precyzja
- Osiągać
- faktycznie
- w dodatku
- dodatek
- Dodatkowy
- zaawansowany
- Reklama
- afektowany
- Po
- przed
- AI
- AIDS
- zmierzać
- Algorytmy
- Wszystkie kategorie
- sam
- również
- alternatywny
- Chociaż
- ilość
- amp
- an
- analityka
- analizowane
- i
- Ogłoszenia
- Inne
- każdy
- dotyczy
- mobilne i webowe
- SĄ
- POWIERZCHNIA
- obszary
- artykuł
- AS
- aspekt
- Aktywa
- pomagać
- powiązany
- At
- autor
- zautomatyzowane
- średni
- Lazur
- z powrotem
- zasłona
- backup
- Kopie zapasowe
- równoważenie
- przepustowość
- na podstawie
- podstawowy
- BE
- bo
- stają się
- staje
- być
- zanim
- za
- jest
- korzyści
- Korzyści
- pomiędzy
- Poza
- Miliard
- Blokować
- Bloki
- Blog
- blogi
- Niebieski
- obie
- Dolny
- Przynosi
- budżetowanie
- budować
- biznes
- ciągłości działania
- biznes
- ale
- przycisk
- by
- CAN
- Pojemność
- kapitał
- węgiel
- karta
- Kartki okolicznosciowe
- ostrożny
- nieść
- Etui
- CAT
- Kategoria
- Krzesło
- wyzwanie
- wyzwania
- Kanał
- tańsze
- ZOBACZ
- wybór
- Wybierając
- wybrany
- koła
- CIS
- klasa
- Klasyfikuj
- dokładnie
- Chmura
- cloud computing
- Zbieranie
- kolor
- jak
- byliśmy spójni, od początku
- towar
- powszechnie
- Firmy
- sukcesy firma
- Firma
- komputer
- computing
- spójnik
- za
- wobec
- Pojemnik
- kontynuować
- ciągły
- ciągłość
- kopie
- Koszty:
- Odpowiednik
- pokrycie
- Stwórz
- stworzony
- Crossed
- CSS
- zwyczaj
- Bezpieczeństwo cybernetyczne
- tak
- dane
- Utrata danych
- zarządzanie danymi
- Ochrona danych
- zestawy danych
- przechowywanie danych
- Data
- Decyzje
- Domyślnie
- definicje
- dostarczyć
- wyjaśnić
- W zależności
- zależy
- wdrożenia
- opis
- projektowanie
- stacjonarny
- szczegółowe
- rozwija się
- urządzenie
- Różnice
- różne
- katastrofa
- dyskutować
- do
- robi
- Nie
- dominować
- nie
- na dół
- podczas
- e
- każdy
- z łatwością
- skutecznie
- wysiłek
- starania
- eliminując
- objąć
- wschodzących
- nacisk
- upoważniać
- umożliwiać
- umożliwiając
- kodowanie
- zakończenia
- wzmocnienie
- zapewnić
- Wchodzę
- Enterprise
- przedsiębiorstwa
- środowiska
- epizod
- równy
- niezbędny
- Eter (ETH)
- Parzyste
- wydarzenie
- Każdy
- codzienny
- ewoluuje
- istnieje
- Wyjście
- Wyjaśniać
- wyjaśniając
- eksplozja
- dodatkowy
- Twarz
- twarze
- fakt
- fabryka
- FAIL
- fallout
- fałszywy
- Wyposażony w
- filet
- Akta
- budżetowy
- Znajdź
- znalezieniu
- i terminów, a
- Przepływy
- Skupiać
- obserwuj
- następujący
- czcionki
- W razie zamówieenia projektu
- Nasz formularz
- znaleziono
- Framework
- od
- pełny
- Funkcjonalność
- Funkcje
- gra
- zbierać
- zebrane
- Ogólne
- Generować
- wygenerowane
- generator
- geopolityczna
- otrzymać
- okulary
- Globalne
- globalna pandemia
- cel
- większy
- Największym
- Zielony
- Krata
- Rosnąć
- ręka
- Prowadzenie
- Ciężko
- sprzęt komputerowy
- haszysz
- Have
- Nagłówek
- wysokość
- pomoc
- pomocny
- pomoc
- pomaga
- historia
- Holdings
- W jaki sposób
- How To
- HTTPS
- IBM
- IBM Cloud
- ICO
- ICON
- identiques
- zidentyfikować
- identyfikacja
- if
- obraz
- ważny
- ważny aspekt
- imponujący
- in
- W innych
- incydenty
- zawierać
- włączony
- Zwiększać
- wzrosła
- wzrastający
- coraz bardziej
- wskaźnik
- przemysł
- nieuchronnie
- Infrastruktura
- nieodłączny
- początkowo
- spostrzeżenia
- przykład
- zamiast
- integralny
- Inteligencja
- zamierzony
- wewnętrzny
- inwersja
- inwestycja
- Internet przedmiotów
- problem
- IT
- JEGO
- samo
- styczeń
- jpg
- konserwacja
- Klawisz
- Wiedzieć
- laptopa
- duży
- większe
- Nazwisko
- Ostatni rok
- firmy
- prowadzić
- Przywództwo
- nauka
- mniej
- poziom
- odpowiedzialność
- lubić
- Linia
- wykazy
- miejscowy
- lokalny
- od
- maszyny
- Macro
- Główny
- robić
- mężczyzna
- i konserwacjami
- System zarządzania
- Zarządzający
- sposób
- wiele
- Maksymalna szerokość
- Może..
- Media
- Użytkownicy
- połączenie
- metoda
- metody
- Microsoft
- może
- min
- zminimalizować
- minimalizuje
- minuty
- Aplikacje mobilne
- modele
- Nowoczesne technologie
- moment
- pieniądze
- jeszcze
- większość
- dużo
- musi
- narodowo
- Natura
- Nawigacja
- Blisko
- prawie
- potrzebne
- wymagania
- Ani
- nigdy
- Nowości
- aktualności
- Newsletter
- żaden
- ani
- zauważyć
- nic
- Pojęcie
- już dziś
- zacienienie
- obiekty
- uzyskać
- występować
- of
- poza
- często
- on
- ONE
- trwający
- tylko
- koncepcja
- działać
- działa
- operacje
- Optymalny
- Optymalizacja
- zoptymalizowane
- Opcje
- or
- organicznie
- organizacja
- organizacji
- oryginalny
- Inne
- ludzkiej,
- na zewnątrz
- wytyczne
- wydajność
- własny
- strona
- pandemiczny
- część
- szczególny
- wzory
- płatność
- kraj
- kary
- Ludzie
- wykonywane
- utrzymuje się
- osoba
- PHP
- Miejsce
- umieszczony
- Plagi
- krok po kroku
- planowanie
- plany
- plato
- Analiza danych Platona
- PlatoDane
- Zatkany
- wtyczka
- punkt
- Gotowy
- polityka
- Popularny
- popularność
- position
- dobytek
- możliwy
- Post
- przetwarzanie końcowe
- Powell
- mocny
- Możliwy do przewidzenia
- Przygotować
- ochrona
- pierwotny
- Problem
- wygląda tak
- procesów
- produkcji
- Produkty
- chroniony
- ochrona
- zapewniać
- dostawców
- opublikowany
- zakup
- zakupione
- nabywczy
- kontynuować
- pościg
- całkiem
- RE
- Czytający
- Rzeczywistość
- Przyczyny
- niedawny
- rozpoznać
- dokumentacja
- regeneracja
- zmniejszyć
- Zredukowany
- redukcja
- redukcja
- odniesienie
- oczyścić
- w sprawie
- uczenie się wzmacniania
- związane z
- stosunkowo
- polegać
- zdalny
- usunąć
- Usunięto
- usuwanie
- powtórzony
- replikacja
- raport
- Wymaga
- Zasoby
- czuły
- dalsze
- zachować
- retencja
- powrót
- Nagrody
- prawo
- podniesienie
- Ryzyko
- Zarządzanie ryzykiem
- mapy drogowe
- roboty
- Pokój
- rutynowo
- run
- bieganie
- taki sam
- Zapisz
- Skala
- skany
- Ekran
- skrypty
- widzieć
- Szukajcie
- seo
- rozsadzający
- Serie
- serwer
- serwery
- usługa
- Zestawy
- shared
- przesunięcie
- Short
- strzał
- powinien
- Prosty
- prostsze
- po prostu
- jednocześnie
- witryna internetowa
- Siedzący
- sytuacja
- mały
- So
- Tworzenie
- rozwiązanie
- Rozwiązania
- kilka
- wyrafinowany
- Źródło
- Typ przestrzeni
- mówić
- Mówiąc
- specyficzny
- określony
- wydać
- Spędzanie
- spędził
- Łącza
- kwadraty
- początek
- pobyt
- Cel
- Kij
- przechowywanie
- sklep
- sklep
- strategie
- Strategia
- opływowy
- silny
- subskrybuj
- znaczny
- udany
- taki
- suma
- pewnie
- SVG
- system
- Brać
- trwa
- biorąc
- rozmawiać
- Tandem
- cel
- Zadanie
- zespół
- Członkowie Zespołu
- tech
- Techniki
- Technologia
- semestr
- REGULAMIN
- trzeciorzędowy
- niż
- dzięki
- że
- Połączenia
- świat
- ich
- Im
- motyw
- sami
- następnie
- Tam.
- w związku z tym
- Te
- one
- rzeczy
- myśleć
- to
- tych
- myśl
- myśl przywództwo
- groźba
- Przez
- poprzez
- zaostrzone
- czas
- opona
- Tytuł
- do
- Top
- aktualny
- tematy
- Kwota produktów:
- ruch drogowy
- Trening
- trajektoria
- transfery
- drzewo
- Trend
- Trendy
- prawdziwy
- naprawdę
- SKRĘCAĆ
- i twitterze
- rodzaj
- typy
- Ostatecznie
- niezaprzeczalnie
- przeszedł
- zrozumieć
- Zrozumiały
- Nieoczekiwany
- wyjątkowy
- jednostek
- Nowości
- na
- URL
- us
- USD
- posługiwać się
- używany
- zastosowania
- za pomocą
- zazwyczaj
- uprawomocnienie
- Cenny
- różnorodność
- początku.
- przez
- Wideo
- wejść
- Wirtualny
- wirtualny pulpit
- vs
- W
- brakujący
- Magazyn
- była
- oglądania
- Droga..
- we
- sieć
- DOBRZE
- Co
- jeśli chodzi o komunikację i motywację
- który
- Podczas
- którego
- będzie
- okna
- w
- w ciągu
- świadkiem
- WordPress
- Praca
- pracował
- pracujący
- działa
- świat
- na calym swiecie
- wartość
- godny
- napisany
- rok
- lat
- ty
- Twój
- youtube
- zefirnet