IBM Databand: samouczenie się do wykrywania anomalii - blog IBM

IBM Databand: Samouczenie się do wykrywania anomalii — blog IBM

Węzeł źródłowy: 3093740


IBM Databand: Samouczenie się do wykrywania anomalii — blog IBM



Inżynierowie dyskutują na stole w kreatywnym biurze

Prawie rok temu IBM napotkał problem ze sprawdzaniem poprawności danych podczas jednego z naszych wrażliwych na czas przepływów danych dotyczących fuzji i przejęć. Pracując nad rozwiązaniem tego problemu, stanęliśmy przed kilkoma wyzwaniami, w tym rozwiązywaniem problemów, identyfikacją problemu, naprawą przepływu danych, wprowadzaniem zmian w dalszych potokach danych i wykonywaniem ad hoc zautomatyzowanego przepływu pracy.

Zwiększanie rozdzielczości danych i wydajności monitorowania dzięki Databand

Po rozwiązaniu natychmiastowego problemu retrospektywna analiza wykazała, że ​​właściwa weryfikacja danych i inteligentne monitorowanie mogły złagodzić ból i przyspieszyć czas rozwiązania. Zamiast opracowywać niestandardowe rozwiązanie wyłącznie do natychmiastowych zastosowań, IBM poszukiwał rozwiązania do sprawdzania poprawności danych o szerokim zastosowaniu, które byłoby w stanie obsłużyć nie tylko ten scenariusz, ale także potencjalne przeoczone problemy.  

Właśnie wtedy odkryłem jeden z naszych niedawno nabytych produktów, IBM® Databand® umożliwiający obserwowanie danych. W przeciwieństwie do tradycyjnych narzędzi monitorujących z monitorowaniem opartym na regułach lub setkami niestandardowych skryptów monitorujących, Databand oferuje monitorowanie samouczące się. Obserwuje zachowanie danych w przeszłości i identyfikuje odchylenia przekraczające określone progi. Ta funkcja uczenia maszynowego umożliwia użytkownikom monitorowanie danych przy minimalnej konfiguracji reguł i wykrywaniu anomalii, nawet jeśli mają ograniczoną wiedzę na temat danych lub ich wzorców zachowań.

Optymalizacja obserwowalności przepływu danych dzięki samouczącemu się monitorowaniu Databand

Databand uwzględnia historyczne zachowanie przepływu danych i sygnalizuje podejrzane działania, jednocześnie ostrzegając użytkownika. IBM zintegrował Databand z naszym przepływem danych, który składał się z ponad 100 potoków. Zapewniało łatwo obserwowalne aktualizacje statusu wszystkich przebiegów i rurociągów oraz, co ważniejsze, uwydatniało awarie. Pozwoliło nam to skoncentrować się na i przyspieszyć eliminowanie incydentów związanych z przepływem danych.

Pasmo danych do obserwacji danych wykorzystuje samouczenie się do monitorowania:  

  • Zmiany schematu: Po wykryciu zmiany schematu Databand flaguje ją na pulpicie nawigacyjnym i wysyła alert. Każdy, kto pracuje z danymi, prawdopodobnie spotkał się ze scenariuszami, w których źródło danych podlega zmianom schematu, takim jak dodawanie lub usuwanie kolumn. Zmiany te wpływają na przepływy pracy, które z kolei wpływają na dalsze przetwarzanie potoku danych, prowadząc do efektu domina. Databand może analizować historię schematów i natychmiast ostrzegać nas o wszelkich anomaliach, zapobiegając potencjalnym zakłóceniom.
  • Wpływ umowy o poziomie usług (SLA): Pasmo danych pokazuje pochodzenie danych i identyfikuje dalsze potoki danych dotknięte awarią potoku danych. Jeśli zdefiniowano umowę SLA na dostarczanie danych, alerty pomagają rozpoznać i utrzymać zgodność z umową SLA.
  • Anomalie wydajności i czasu działania: Databand monitoruje czas trwania uruchomień potoków danych i uczy się wykrywać anomalie, flagując je w razie potrzeby. Użytkownicy nie muszą być świadomi czasu trwania rurociągu; Databand uczy się na swoich danych historycznych.
  • Status: Databand monitoruje status przebiegów, w tym informację o ich niepowodzeniu, anulowaniu lub pomyślnym wyniku.
  • Walidacji danych: Databand obserwuje zakresy wartości danych w czasie i wysyła alert w przypadku wykrycia anomalii. Obejmuje to typowe statystyki, takie jak średnia, odchylenie standardowe, minimum, maksimum i kwartyle.

Transformacyjne alerty pasma danych dla ulepszonych potoków danych

Użytkownicy mogą ustawiać alerty za pomocą interfejsu użytkownika Databand, który jest nieskomplikowany i zawiera intuicyjny pulpit nawigacyjny monitorujący i obsługujący przepływy pracy. Zapewnia dogłębną widoczność dzięki ukierunkowanym grafom acyklicznym, co jest przydatne w przypadku wielu potoków danych. Ten kompleksowy system umożliwia zespołom wsparcia skupienie się na obszarach wymagających uwagi, co pozwala im przyspieszyć dostarczanie rezultatów.

Fuzje i przejęcia IBM Enterprise Data umożliwiły nam ulepszenie naszych potoków danych dzięki Databand i nie oglądaliśmy się wstecz. Cieszymy się, że możemy zaoferować Ci to rewolucyjne oprogramowanie, które pomaga wcześniej identyfikować incydenty związane z danymi, szybciej je rozwiązywać i dostarczać firmom bardziej niezawodne dane.

Dostarczaj wiarygodne dane dzięki ciągłej możliwości ich obserwacji

Przeczytaj raport Gartnera

Czy ten artykuł był pomocny?

TakNie


Więcej z danych i analityki




Co to jest MongoDB Enterprise Advanced z IBM?

3 czytaj min - MongoDB Enterprise Advanced with IBM to baza danych dokumentów zbudowana w oparciu o architekturę skalowalną poziomo, która wykorzystuje elastyczny schemat przechowywania danych. Założona w 2007 roku firma MongoDB zyskała rzeszę fanów na całym świecie w społeczności programistów. Rozwiązanie problemu rozrostu IT: Optymalizacja infrastruktury baz danych pod kątem innowacji MongoDB pomogło zapoczątkować trend w branży w kierunku specjalizacji dzięki modelowi dokumentów i skalowalności poziomej. Jednak z biegiem czasu te wąsko wyspecjalizowane produkty często powodowały większe koszty i złożoność. Łączenie różnych produktów w jeden…




Personalizuj statystyki dotyczące sprzedaży detalicznej za pomocą aplikacji Boxes i IBM watsonx

2 czytaj min - Pamiętam, że jako 7-latek z niecierpliwością czekałem na koniec dnia szkolnego, aby dołączyć do ojca w pracy. Był pionierem w Urugwaju i moim największym mentorem, tworzącym automaty sprzedające, które pomogły markom dostosować się do zmieniających się zachowań konsumentów. W 2024 roku branża detaliczna po raz kolejny potrzebuje nowoczesnego podejścia do zaspokojenia potrzeb konsumentów. Właśnie dlatego stworzyłem Boxes, aby pomóc sprzedawcom detalicznym i firmom zajmującym się towarami konsumenckimi (CPG) lepiej angażować konsumentów w lokalizacjach stacjonarnych poprzez…




Znaczenie pozyskiwania i integracji danych dla sztucznej inteligencji przedsiębiorstwa

4 czytaj min - Pojawienie się generatywnej sztucznej inteligencji skłoniło kilka znanych firm do ograniczenia jej stosowania ze względu na niewłaściwe obchodzenie się z wrażliwymi danymi wewnętrznymi. Według CNN niektóre firmy nałożyły wewnętrzne zakazy na narzędzia generatywnej sztucznej inteligencji, chcąc lepiej zrozumieć tę technologię, a wiele z nich zablokowało także korzystanie z wewnętrznego ChatGPT. Firmy nadal często akceptują ryzyko wykorzystania danych wewnętrznych podczas eksploracji dużych modeli językowych (LLM), ponieważ dane kontekstowe umożliwiają LLM zmianę z ogólnego przeznaczenia na…




Nowy model dużej mowy IBM Watsonx wprowadza do telefonu generatywną sztuczną inteligencję

3 czytaj min - Prawie wszyscy słyszeli o dużych modelach językowych, czyli LLM, odkąd generatywna sztuczna inteligencja weszła do naszego codziennego leksykonu dzięki niesamowitym możliwościom generowania tekstu i obrazów oraz obietnicy rewolucji w sposobie, w jaki przedsiębiorstwa radzą sobie z podstawowymi funkcjami biznesowymi. Teraz, bardziej niż kiedykolwiek, myśl o rozmowie ze sztuczną inteligencją za pośrednictwem interfejsu czatu lub poleceniu jej wykonania określonych zadań za Ciebie stała się namacalną rzeczywistością. Dokonuje się ogromnych postępów, aby przyjąć tę technologię, aby pozytywnie wpłynąć na codzienne doświadczenia jako jednostki i…

Biuletyny IBM

Otrzymuj nasze biuletyny i aktualizacje tematów, które dostarczają najnowszych informacji i spostrzeżeń na temat pojawiających się trendów.

Subskrybuj teraz

Więcej biuletynów

Znak czasu:

Więcej z IBM