Ultimii ani au fost martorii unei explozii în proliferarea unităților de auto-stocare. Aceste unități mari de depozite au apărut la nivel național ca o industrie în plină expansiune dintr-un motiv: omul obișnuit are acum mai multe bunuri decât știe cu ce să facă.
Aceeași situație de bază afectează și lumea IT-ului. Suntem în mijlocul unei explozii de date. Chiar și obiectele de zi cu zi relativ simple acum generează în mod obișnuit date pe cont propriu datorită Internetul obiectelor (IoT) funcţionalitate. Niciodată în istorie nu au fost create, colectate și analizate atât de multe date. Și niciodată mai mulți manageri de date nu s-au luptat cu problema modului de a stoca atât de multe date.
O companie poate să nu recunoască inițial problema sau cât de mare poate deveni, iar apoi compania respectivă trebuie să găsească o soluție de stocare sporită. În timp, compania poate depăși și acel sistem de stocare, necesitând și mai multe investiții. În mod inevitabil, compania se va sătura de acest joc și va căuta o opțiune mai ieftină și mai simplă, ceea ce ne duce la deduplicarea datelor.
Deși multe organizații folosesc tehnici de deduplicare a datelor (sau „deduplicare”) ca parte a sistemului lor de gestionare a datelor, nu atât de multe înțeleg cu adevărat ce este procesul de deduplicare și ce este intenționat să facă. Deci, să demitificăm deduplicarea și să explicăm cum funcționează deduplicarea datelor.
Ce face deduplicarea?
În primul rând, să clarificăm termenul nostru principal. Deduplicarea datelor este un proces pe care organizațiile îl folosesc pentru a-și eficientiza stocurile de date și pentru a reduce cantitatea de date pe care le arhivează prin eliminarea copiilor redundante ale datelor.
Mai mult, ar trebui să subliniem că atunci când vorbim despre date redundante, vorbim de fapt la nivel de fișier și ne referim la o proliferare rampantă a fișierelor de date. Deci, atunci când discutăm despre eforturile de deduplicare a datelor, este de fapt necesar un sistem de deduplicare a fișierelor.
Care este scopul principal al deduplicarii?
Unii oameni poartă o noțiune incorectă despre natura datelor, vizându-le ca pe o marfă care pur și simplu există pentru a fi strânsă și recoltată - ca merele de pe un copac din propria curte.
Realitatea este că fiecare fișier nou de date costă bani. În primul rând, de obicei costă bani pentru a obține astfel de date (prin achiziționarea de liste de date). Sau necesită investiții financiare substanțiale pentru ca o organizație să fie capabilă să adune și să culeagă date pe cont propriu, chiar dacă sunt date pe care organizația însăși le produce și le colectează organic. Prin urmare, seturile de date sunt o investiție și, ca orice investiție valoroasă, trebuie protejate cu rigurozitate.
În acest caz, vorbim despre spațiul de stocare a datelor – fie că acesta este sub formă de servere hardware locale sau prin Stocare in cloud printr-un sistem bazat pe cloud centru de date— care trebuie cumpărat sau închiriat.
Copiile duplicate ale datelor care au fost supuse replicării, prin urmare, diminuează rezultatul prin impunerea unor costuri suplimentare de stocare dincolo de cele asociate cu sistemul de stocare primar și cu spațiul de stocare al acestuia. Pe scurt, mai multe active medii de stocare trebuie dedicate pentru a găzdui atât datele noi, cât și cele deja stocate. La un moment dat în traiectoria unei companii, datele duplicate pot deveni cu ușurință o datorie financiară.
Deci, pentru a rezuma, obiectivul principal al deduplicarii datelor este de a economisi bani, permițând organizațiilor să cheltuiască mai puțin pe spațiu de stocare suplimentar.
Beneficii suplimentare ale deduplicarii
Există și alte motive, în afara capacității de stocare, pentru ca companiile să adopte soluții de deduplicare a datelor – probabil niciunul mai esențial decât protecția și îmbunătățirea datelor pe care le oferă. Organizațiile rafinează și optimizează sarcinile de lucru deduplicate de date, astfel încât acestea să ruleze mai eficient decât datele care sunt pline de fișiere duplicate.
Un alt aspect important al dedupării este modul în care ajută la împuternicirea unei persoane rapide și de succes dezastru efort de recuperare și minimizează cantitatea de pierderi de date care poate rezulta adesea dintr-un astfel de eveniment. Dedupeul ajută la activarea unui proces de backup robust, astfel încât sistemul de backup al unei organizații să fie egal cu sarcina de a gestiona datele de backup. Pe lângă faptul că ajută la backup-urile complete, deduplicarea ajută și la eforturile de reținere.
Un alt beneficiu al deduplicării datelor este cât de bine funcționează împreună cu infrastructura desktop virtual (VDI) implementări, datorită faptului că hard disk-urile virtuale din spatele desktopurilor la distanță ale VDI funcționează identic. Popular Desktop ca serviciu (DaaS) produsele includ Azure Virtual Desktop de la Microsoft și Windows VDI. Aceste produse creează mașini virtuale (VM), care sunt create în timpul procesului de virtualizare a serverului. La rândul lor, aceste mașini virtuale împuternicesc tehnologia VDI.
Metodologia deduplicarii
Cea mai frecvent utilizată formă de deduplicare a datelor este deduplicarea în bloc. Această metodă funcționează prin utilizarea funcțiilor automate pentru a identifica dublările în blocuri de date și apoi pentru a elimina dublările respective. Lucrând la acest nivel de bloc, bucăți de date unice pot fi analizate și specificate ca fiind demne de validare și conservare. Apoi, atunci când software-ul de deduplicare detectează o repetiție a aceluiași bloc de date, acea repetiție este eliminată și o referință la datele originale este inclusă în locul său.
Aceasta este principala formă de deducție, dar cu greu singura metodă. În alte cazuri de utilizare, o metodă alternativă de deduplicare a datelor operează la nivel de fișier. Stocarea cu o singură instanță compară copiile complete ale datelor din serverul de fișiere, dar nu bucăți sau blocuri de date. La fel ca metoda omoloage, deduplicarea fișierelor depinde de păstrarea fișierului original în sistemul de fișiere și de eliminarea copiilor suplimentare.
Trebuie remarcat faptul că tehnicile de deduplicare nu funcționează în același mod ca algoritmii de comprimare a datelor (de exemplu, LZ77, LZ78), deși este adevărat că ambele urmăresc același obiectiv general de reducere a redundanțelor de date. Tehnicile de deduplicare realizează acest lucru la o scară macro mai mare decât algoritmii de compresie, al căror scop este mai puțin înlocuirea fișierelor identice cu copii partajate și mai mult despre codificarea mai eficientă a redundanțelor de date.
Tipuri de deduplicare a datelor
Există diferite tipuri de deduplicare a datelor, în funcție de cand are loc procesul de deduplicare:
- Deduplicare inline: Această formă de deduplicare a datelor are loc în acest moment, în timp real, pe măsură ce datele circulă în sistemul de stocare. Sistemul de deduplicare inline transportă mai puțin trafic de date, deoarece nici nu transferă și nici nu stochează date duplicate. Acest lucru poate duce la o reducere a cantității totale de lățime de bandă necesară organizației respective.
- Deduplicarea post-proces: Acest tip de deduplicare are loc după ce datele au fost scrise și plasate pe un anumit tip de dispozitiv de stocare.
Aici merită explicat faptul că ambele tipuri de deduplicare a datelor sunt afectate de calculele hash inerente deduplicarii datelor. Aceste criptografic calculele sunt esențiale pentru identificarea tiparelor repetate în date. În timpul deduplicărilor în linie, acele calcule sunt efectuate în momentul de față, ceea ce poate domina și copleși temporar funcționalitatea computerului. În deduplicarile de post-procesare, calculele hash pot fi efectuate în orice moment după ce datele sunt adăugate într-un mod și într-un moment care nu suprasolicita resursele informatice ale organizației.
Diferențele subtile dintre tipurile de deduplicare nu se termină aici. Un alt mod de a clasifica tipurile de deduplicare se bazează pe Unde apar astfel de procese.
- Deduplicarea sursei: Această formă de deduplicare are loc în apropierea locului unde sunt de fapt generate noi date. Sistemul scanează acea zonă și detectează noi copii ale fișierelor, care sunt apoi eliminate.
- Deduplicare țintă: Un alt tip de deduplicare este ca o inversare a deduplicarii sursei. În deduplicarea țintă, sistemul deduplică orice copii care se găsesc în alte zone decât cele în care au fost create datele originale.
Deoarece există diferite tipuri de deduplicare practicate, organizațiile care se înclină spre viitor trebuie să ia decizii atente și luate în considerare cu privire la tipul de deduplicare ales, echilibrând acea metodă cu nevoile specifice ale acelei companii.
În multe cazuri de utilizare, metoda de deduplicare aleasă de o organizație se poate reduce foarte bine la o varietate de variabile interne, cum ar fi următoarele:
- Câte și ce tip de seturi de date sunt create
- Sistemul principal de stocare al organizației
- Ce medii virtuale sunt utilizate
- Pe ce aplicații se bazează compania
Evoluții recente în deduplicarea datelor
La fel ca toate ieșirile computerizate, deduplicarea datelor este gata să folosească din ce în ce mai mult inteligență artificială (AI) pe măsură ce continuă să evolueze. Dedupe va deveni din ce în ce mai sofisticat pe măsură ce dezvoltă și mai multe nuanțe care îl ajută în căutarea modelelor de redundanță pe măsură ce blocurile de date sunt scanate.
O tendință emergentă în dedupare este învățarea prin consolidare. Acesta utilizează un sistem de recompense și penalități (cum ar fi în antrenamentul de întărire) și aplică o politică optimă pentru separarea înregistrărilor sau îmbinarea lor.
O altă tendință care merită urmărită este utilizarea metodelor de ansamblu, în care diferite modele sau algoritmi sunt utilizați în tandem pentru a asigura o acuratețe și mai mare în cadrul procesului de deducție.
Dilema în curs
Lumea IT devine din ce în ce mai concentrată pe problema în curs de desfășurare a proliferării datelor și ce trebuie făcut în acest sens. Multe companii se trezesc în situația incomodă de a dori simultan să rețină toate datele pe care au muncit să le strângă și, de asemenea, să dorească să-și pună noile date debordante în orice container de stocare posibil, chiar dacă doar pentru a le scoate din drum.
În timp ce o astfel de dilemă persistă, accentul pus pe eforturile de deduplicare a datelor va continua, deoarece organizațiile văd deduplicarea ca alternativă mai ieftină la achiziționarea mai multor spațiu de stocare. Pentru că în cele din urmă, deși înțelegem intuitiv că afacerea are nevoie de date, știm, de asemenea, că datele necesită foarte adesea deduplicare.
Aflați cum IBM Storage FlashSystem vă poate ajuta cu nevoile dvs. de stocare
A fost util acest articol?
DaNu
Mai multe de la Cloud
Buletine informative IBM
Primiți buletinele noastre informative și actualizările subiectelor care oferă cele mai recente idei de lider și perspective despre tendințele emergente.
Abonează-te acum
Mai multe buletine informative
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://www.ibm.com/blog/how-does-data-deduplication-work/
- :are
- :este
- :nu
- :Unde
- $UP
- 1
- 17
- 19
- 2022
- 2024
- 22
- 28
- 29
- 30
- 300
- 36
- 400
- 41
- 7
- 84
- 9
- 91
- a
- Capabil
- Despre Noi
- despre
- găzdui
- Conform
- precizie
- Obține
- de fapt
- adăugat
- plus
- Suplimentar
- avansat
- Promovare
- afectat
- După
- împotriva
- AI
- SIDA
- urmări
- algoritmi
- TOATE
- singur
- de asemenea
- alternativă
- Cu toate ca
- sumă
- amp
- an
- Google Analytics
- analizate
- și
- anunturi
- O alta
- Orice
- se aplică
- Apps
- SUNT
- ZONĂ
- domenii
- articol
- AS
- aspect
- Bunuri
- ajuta
- asociate
- At
- autor
- Automata
- in medie
- Azuriu
- înapoi
- fundal
- Backup
- backup-uri
- de echilibrare
- Lățime de bandă
- bazat
- de bază
- BE
- deoarece
- deveni
- devenire
- fost
- înainte
- în spatele
- fiind
- beneficia
- Beneficiile
- între
- Dincolo de
- Miliard
- Bloca
- Blocuri
- Blog
- bloguri
- Albastru
- atât
- De jos
- Aduce
- bugetarea
- construi
- afaceri
- continuitatea afacerii
- întreprinderi
- dar
- buton
- by
- CAN
- Capacitate
- capital
- carbon
- card
- Carduri
- atent
- transporta
- cazuri
- CAT
- Categorii
- Scaun
- contesta
- provocări
- Canal
- mai ieftin
- verifica
- alegere
- alegere
- ales
- cerc
- CSI
- clasă
- Clasifica
- îndeaproape
- Cloud
- cloud computing
- Colectare
- culoare
- cum
- vine
- produs
- în mod obișnuit
- Companii
- companie
- Compania
- calculator
- tehnica de calcul
- conjuncție
- luate în considerare
- luand in considerare
- Recipient
- continua
- continuă
- continuitate
- copii
- Cheltuieli
- Echivalent
- acoperire
- crea
- a creat
- traversată
- CSS
- personalizat
- Securitate cibernetică
- daas
- de date
- pierderi de date
- management de date
- protejarea datelor
- seturi de date
- stocare a datelor
- Data
- Deciziile
- Mod implicit
- Definitii
- livra
- demistifică
- În funcție
- depinde de
- implementări
- descriere
- proiect
- desktop
- detaliat
- dezvoltă
- dispozitiv
- diferenţele
- diferit
- dezastru
- discuta
- do
- face
- Nu
- domina
- Dont
- jos
- în timpul
- e
- fiecare
- cu ușurință
- eficient
- efort
- Eforturile
- eliminarea
- îmbrăţişare
- șmirghel
- accent
- împuternici
- permite
- permițând
- codare
- capăt
- sporire
- asigura
- Intrați
- Afacere
- Companii
- medii
- episod
- egal
- esenţial
- Eter (ETH)
- Chiar
- eveniment
- Fiecare
- de fiecare zi
- evolua
- există
- Ieşire
- Explica
- explicând
- explozie
- suplimentar
- Față
- fete
- fapt
- fabrică
- FAIL
- Fallout
- fals
- Dispunând
- Fișier
- Fişiere
- financiar
- Găsi
- descoperire
- First
- fluxurilor
- Concentra
- urma
- următor
- fonturi
- Pentru
- formă
- găsit
- Cadru
- din
- Complet
- funcționalitate
- funcții
- joc
- aduna
- s-au adunat
- General
- genera
- generată
- generator
- geopolitice
- obține
- ochelari
- Caritate
- pandemie globală
- scop
- mai mare
- cea mai mare
- Verde
- Grilă
- Crește
- mână
- Manipularea
- Greu
- Piese metalice
- hașiș
- Avea
- Rubrică
- înălțime
- ajutor
- util
- ajutor
- ajută
- istorie
- Holdings
- Cum
- Cum Pentru a
- HTTPS
- IBM
- IBM Cloud
- ICO
- ICON
- identic
- identifica
- identificarea
- if
- imagine
- important
- aspect important
- impozant
- in
- În altele
- incidente
- include
- inclus
- Crește
- a crescut
- crescând
- tot mai mult
- index
- industrie
- inevitabil
- Infrastructură
- inerent
- inițial
- perspective
- instanță
- in schimb
- integrală
- Inteligență
- destinate
- intern
- inversare
- investiţie
- IoT
- problema
- IT
- ESTE
- în sine
- ianuarie
- jpg
- păstrare
- Cheie
- Cunoaște
- laptop
- mare
- mai mare
- Nume
- Anul trecut
- Ultimele
- conduce
- Conducere
- învăţare
- mai puțin
- Nivel
- răspundere
- ca
- Linie
- liste
- local
- localizare
- de pe
- Masini
- Macro
- Principal
- face
- om
- administrare
- sistemul de management
- Manageri
- manieră
- multe
- max-width
- Mai..
- Mass-media
- Membri actuali
- care fuzionează
- metodă
- Metode
- Microsoft
- ar putea
- minute
- minimaliza
- minimizează
- minute
- Mobil
- Modele
- Modern
- moment
- bani
- mai mult
- cele mai multe
- mult
- trebuie sa
- la nivel național
- Natură
- Navigare
- În apropiere
- aproape
- necesar
- nevoilor
- Nici
- nu
- Nou
- ştiri
- buletine de știri
- Nici unul
- nici
- notat
- nimic
- noțiune
- acum
- umbrire
- obiecte
- obține
- avea loc
- of
- de pe
- de multe ori
- on
- ONE
- în curs de desfășurare
- afară
- deschide
- funcionar
- opereaza
- Operațiuni
- optimă
- Optimizați
- optimizate
- Opţiuni
- or
- organic
- organizație
- organizații
- original
- Altele
- al nostru
- afară
- contururi
- producție
- propriu
- pagină
- pandemie
- parte
- special
- modele
- plată
- țară
- penalități
- oameni
- efectuată
- persistă
- persoană
- PHP
- Loc
- plasat
- Epidemiile
- plan
- planificare
- Planurile
- Plato
- Informații despre date Platon
- PlatoData
- astupat
- conecteaza
- Punct
- gata
- Politica
- Popular
- popularitate
- poziţie
- posesiunile
- posibil
- Post
- post-procesare
- Powell
- puternic
- predictibil
- Pregăti
- conservare
- primar
- Problemă
- proces
- procese
- producând
- Produse
- protejat
- protecţie
- furniza
- furnizori
- publicat
- cumpărare
- cumparate
- de cumpărare
- urmări
- urmărire
- cu totul
- RE
- Citind
- Realitate
- motive
- recent
- recunoaște
- înregistrări
- recuperare
- reduce
- Redus
- reducerea
- reducere
- referință
- rafina
- cu privire la
- Consolidarea învățării
- legate de
- relativ
- se bazează
- la distanta
- scoate
- îndepărtat
- eliminarea
- repetat
- replică
- raportează
- Necesită
- Resurse
- sensibil
- rezultat
- reține
- retenţie
- reveni
- Recompense
- dreapta
- în creștere
- Risc
- de gestionare a riscurilor
- foi de parcurs
- roboţi
- Cameră
- în mod obișnuit
- Alerga
- funcţionare
- acelaşi
- Economisiți
- Scară
- scanări
- Ecran
- script-uri
- vedea
- Căuta
- SEO
- separând
- serie
- serverul
- servere
- serviciu
- Seturi
- comun
- schimbare
- Pantaloni scurți
- shot
- să
- simplu
- simplu
- pur şi simplu
- simultan
- teren
- Ședință
- situație
- mic
- So
- Software
- soluţie
- soluţii
- unele
- sofisticat
- Sursă
- Spaţiu
- vorbi
- vorbire
- specific
- specificată
- petrece
- Cheltuire
- uzat
- Sponsorizat
- pătrate
- Începe
- şedere
- paşi
- Lipi
- depozitare
- stoca
- magazine
- strategii
- Strategie
- simplifica
- voinic
- subscrie
- substanțial
- de succes
- astfel de
- sumă
- sigur
- SVG
- sistem
- Lua
- ia
- luare
- vorbesc
- Tandem
- Ţintă
- Sarcină
- echipă
- Membrii echipei
- tech
- tehnici de
- Tehnologia
- durată
- termeni
- terţiar
- decât
- Mulțumiri
- acea
- lumea
- lor
- Lor
- temă
- se
- apoi
- Acolo.
- prin urmare
- Acestea
- ei
- lucruri
- crede
- acest
- aceste
- gândit
- conducerea gândirii
- amenințare
- Prin
- de-a lungul
- înăsprit
- timp
- anvelopă
- Titlu
- la
- top
- subiect
- subiecte
- Total
- trafic
- Pregătire
- traiectorie
- Transferuri
- copac
- tendință
- Tendinţe
- adevărat
- cu adevărat
- ÎNTORCĂ
- stare de nervozitate
- tip
- Tipuri
- în cele din urmă
- incontestabil
- supuse unei
- înţelege
- Lesne de înțeles
- Neașteptat
- unic
- de unităţi
- actualizări
- pe
- URL-ul
- us
- USD
- utilizare
- utilizat
- utilizări
- folosind
- obișnuit
- validare
- Valoros
- varietate
- foarte
- de
- Video
- vizionează
- Virtual
- desktop virtual
- vs
- W
- doresc
- Depozit
- a fost
- vizionarea
- Cale..
- we
- web
- BINE
- Ce
- cand
- care
- în timp ce
- a caror
- voi
- ferestre
- cu
- în
- asistat
- WordPress
- Apartamente
- a lucrat
- de lucru
- fabrică
- lume
- la nivel internațional.
- valoare
- vrednic
- scris
- an
- ani
- tu
- Ta
- youtube
- zephyrnet