Daten sind die Grundlage, um den maximalen Nutzen aus der KI-Technologie zu ziehen und Geschäftsprobleme schnell zu lösen. Um das Potenzial generativer KI-Technologien auszuschöpfen, gibt es jedoch eine entscheidende Voraussetzung: Ihre Daten müssen entsprechend aufbereitet sein. In diesem Beitrag beschreiben wir, wie Sie mithilfe generativer KI Ihre Datenpipeline aktualisieren und skalieren können Amazon SageMaker-Leinwand zur Datenvorbereitung.
Typischerweise erfordert die Arbeit mit der Datenpipeline eine spezielle Fähigkeit, Daten vorzubereiten und zu organisieren, damit Sicherheitsanalysten sie zur Wertschöpfung nutzen können. Dies kann zeitaufwändig sein, Risiken erhöhen und die Zeit bis zur Wertschöpfung verlängern. Mit SageMaker Canvas können Sicherheitsanalysten mühelos und sicher auf führende Basismodelle zugreifen, um ihre Daten schneller aufzubereiten und Cyber-Sicherheitsrisiken zu beseitigen.
Die Datenvorbereitung erfordert sorgfältige Formatierung und durchdachte Kontextualisierung, ausgehend vom Kundenproblem. Mit der Chat-Funktion von SageMaker Canvas für die Datenvorbereitung können Analysten mit Domänenkenntnissen jetzt mithilfe einer chatbasierten Erfahrung Daten schnell vorbereiten, organisieren und Mehrwert aus ihnen ziehen.
Lösungsüberblick
Generative KI revolutioniert den Sicherheitsbereich, indem sie personalisierte und natürliche Spracherlebnisse bereitstellt, die Risikoerkennung und -behebung verbessert und gleichzeitig die Unternehmensproduktivität steigert. Für diesen Anwendungsfall verwenden wir SageMaker Canvas, Amazon SageMaker Data Wrangler, Amazon Security Lake und Amazon Simple Storage-Service (Amazon S3). Mit Amazon Security Lake können Sie Sicherheitsdaten zur Analyse aggregieren und normalisieren, um ein besseres Verständnis der Sicherheit in Ihrem Unternehmen zu erhalten. Mit Amazon S3 können Sie jederzeit und an jedem Ort beliebige Datenmengen speichern und abrufen. Es bietet branchenführende Skalierbarkeit, Datenverfügbarkeit, Sicherheit und Leistung.
SageMaker Canvas unterstützt jetzt umfassende Datenvorbereitungsfunktionen, die von SageMaker Data Wrangler unterstützt werden. Mit dieser Integration bietet SageMaker Canvas einen durchgängigen No-Code-Arbeitsbereich zum Vorbereiten von Daten, Erstellen und Verwenden von maschinellem Lernen (ML) und Amazonas Grundgestein Basismodelle, um die Zeit von Daten zu Geschäftserkenntnissen zu verkürzen. Sie können jetzt Daten aus über 50 Datenquellen entdecken und aggregieren und Daten mithilfe von über 300 integrierten Analysen und Transformationen in der visuellen Benutzeroberfläche von SageMaker Canvas untersuchen und vorbereiten. Sie werden außerdem eine schnellere Leistung bei Transformationen und Analysen feststellen und von einer Schnittstelle in natürlicher Sprache profitieren, um Daten für ML zu untersuchen und zu transformieren.
In diesem Beitrag demonstrieren wir drei wichtige Transformationen; Filterung, Spaltenumbenennung und Textextraktion aus einer Spalte im Sicherheitsbefund-Datensatz. Wir demonstrieren auch die Verwendung der Chat-Funktion zur Datenvorbereitung in SageMaker Canvas, um die Daten zu analysieren und Ihre Ergebnisse zu visualisieren.
Voraussetzungen:
Bevor Sie beginnen, benötigen Sie ein AWS-Konto. Sie müssen außerdem eine einrichten Amazon SageMaker-Studio Domain. Anweisungen zum Einrichten von SageMaker Canvas finden Sie unter Generieren Sie Vorhersagen für maschinelles Lernen ohne Code.
Greifen Sie auf die Chat-Oberfläche von SageMaker Canvas zu
Führen Sie die folgenden Schritte aus, um mit der Nutzung der SageMaker Canvas-Chat-Funktion zu beginnen:
- Wählen Sie in der SageMaker Canvas-Konsole Daten-Wrangler.
- Der Datensätze, wählen Sie Amazon S3 als Quelle und geben Sie die an Datensatz zu Sicherheitsbefunden von Amazon Security Lake.
- Wählen Sie Ihren Datenfluss und entscheiden Sie Chat zur Datenvorbereitung, das eine Chat-Oberfläche mit geführten Eingabeaufforderungen anzeigt.
Daten filtern
Für diesen Beitrag möchten wir zunächst nach kritischen und schwerwiegenden Warnungen filtern, also geben wir in das Chatfeld Anweisungen dazu ein Entfernen Sie Befunde, die nicht kritisch oder von hohem Schweregrad sind. Canvas entfernt die Zeilen, zeigt eine Vorschau der transformierten Daten an und bietet die Möglichkeit, den Code zu verwenden. Wir können es zur Liste der Schritte im hinzufügen Shritte Feld.
Spalten umbenennen
Als nächstes möchten wir zwei Spalten umbenennen, also geben wir in das Chat-Feld die folgende Eingabeaufforderung ein, um die umzubenennen desc und Titel Spalten zu Erkenntnis und Remediation. SageMaker Canvas generiert eine Vorschau, und wenn Sie mit den Ergebnissen zufrieden sind, können Sie die transformierten Daten den Datenflussschritten hinzufügen.
Text extrahieren
Um die Quellregionen der Befunde zu ermitteln, können Sie im Chat Anweisungen eingeben Extrahieren Sie den Regionstext basierend auf dem Muster aus der UID-Spalte arn:aws:security:securityhub:region:*
und erstellen Sie eine neue Spalte mit dem Namen Region), um den Regionstext basierend auf einem Muster aus der UID-Spalte zu extrahieren. SageMaker Canvas generiert dann Code zum Erstellen einer neuen Regionsspalte. Die Datenvorschau zeigt, dass die Ergebnisse aus einer Region stammen: us-west-2
. Sie können diese Transformation zur nachgelagerten Analyse zum Datenfluss hinzufügen.
Analysieren Sie die Daten
Abschließend wollen wir die Daten analysieren, um festzustellen, ob ein Zusammenhang zwischen der Tageszeit und der Anzahl kritischer Befunde besteht. Sie können im Chat eine Anfrage eingeben, um kritische Ergebnisse nach Tageszeit zusammenzufassen, und SageMaker Canvas gibt Erkenntnisse zurück, die für Ihre Untersuchung und Analyse nützlich sind.
Erkenntnisse visualisieren
Als nächstes visualisieren wir die Ergebnisse nach Schweregrad im Zeitverlauf, um sie in einen Führungsbericht aufzunehmen. Sie können SageMaker Canvas bitten, ein Balkendiagramm des Schweregrads im Vergleich zur Tageszeit zu erstellen. In Sekundenschnelle hat SageMaker Canvas das nach Schweregrad gruppierte Diagramm erstellt. Sie können diese Visualisierung zur Analyse im Datenfluss hinzufügen und für Ihren Bericht herunterladen. Die Daten zeigen, dass die Erkenntnisse aus einer Region stammen und zu bestimmten Zeiten auftreten. Dies gibt uns die Gewissheit, worauf wir bei der Untersuchung unserer Sicherheitsergebnisse den Schwerpunkt legen müssen, um die Grundursachen und Korrekturmaßnahmen zu ermitteln.
Aufräumen
Um unbeabsichtigte Gebühren zu vermeiden, führen Sie die folgenden Schritte aus, um Ihre Ressourcen zu bereinigen:
- Leeren Sie den S3-Bucket, den Sie als Quelle verwendet haben.
- Melden Sie sich von SageMaker Canvas ab.
Zusammenfassung
In diesem Beitrag haben wir Ihnen gezeigt, wie Sie SageMaker Canvas als durchgängigen No-Code-Arbeitsbereich für die Datenvorbereitung verwenden, um Amazon Bedrock-Grundlagenmodelle zu erstellen und zu nutzen, um die Zeit zum Sammeln von Geschäftserkenntnissen aus Daten zu verkürzen.
Beachten Sie, dass dieser Ansatz nicht auf Sicherheitsergebnisse beschränkt ist; Sie können dies auf jeden generativen KI-Anwendungsfall anwenden, bei dem die Datenvorbereitung im Mittelpunkt steht.
Die Zukunft gehört Unternehmen, die die Leistungsfähigkeit generativer KI und großer Sprachmodelle effektiv nutzen können. Dazu müssen wir jedoch zunächst eine solide Datenstrategie entwickeln und die Kunst der Datenaufbereitung verstehen. Indem wir generative KI nutzen, um unsere Daten intelligent zu strukturieren und rückwärts vom Kunden aus zu arbeiten, können wir Geschäftsprobleme schneller lösen. Mit dem SageMaker Canvas-Chat zur Datenaufbereitung ist es für Analysten mühelos, loszulegen und sofortigen Nutzen aus der KI zu ziehen.
Über die Autoren
Sudeesh Sasidharan ist Senior Solutions Architect bei AWS im Energieteam. Sudeesh liebt es, mit neuen Technologien zu experimentieren und innovative Lösungen zu entwickeln, die komplexe geschäftliche Herausforderungen lösen. Wenn er nicht gerade Lösungen entwirft oder an den neuesten Technologien bastelt, findet man ihn auf dem Tennisplatz bei der Arbeit an seiner Rückhand.
John Klacynski ist Principal Customer Solution Manager im AWS Independent Software Vendor (ISV)-Team. In dieser Rolle unterstützt er ISV-Kunden programmatisch bei der Einführung von AWS-Technologien und -Services, um ihre Geschäftsziele schneller zu erreichen. Bevor er zu AWS kam, leitete John Datenproduktteams für große Unternehmen der Konsumgüterverpackung und half ihnen dabei, Dateneinblicke zu nutzen, um ihre Abläufe und Entscheidungsfindung zu verbessern.
- SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
- PlatoData.Network Vertikale generative KI. Motiviere dich selbst. Hier zugreifen.
- PlatoAiStream. Web3-Intelligenz. Wissen verstärkt. Hier zugreifen.
- PlatoESG. Kohlenstoff, CleanTech, Energie, Umwelt, Solar, Abfallwirtschaft. Hier zugreifen.
- PlatoHealth. Informationen zu Biotechnologie und klinischen Studien. Hier zugreifen.
- Quelle: https://aws.amazon.com/blogs/machine-learning/analyze-security-findings-faster-with-no-code-data-preparation-using-generative-ai-and-amazon-sagemaker-canvas/
- :hast
- :Ist
- :nicht
- :Wo
- $UP
- 100
- 125
- 300
- 50
- a
- beschleunigen
- Zugang
- Konto
- über
- Aktionen
- hinzufügen
- adoptieren
- Aggregat
- AI
- erlaubt
- ebenfalls
- Amazon
- Amazon Sage Maker
- Amazon SageMaker-Leinwand
- Amazon Web Services
- Betrag
- an
- Analysen
- Analyse
- Business Analysten
- analysieren
- und
- jedem
- Bewerben
- Ansatz
- passend
- SIND
- Kunst
- AS
- fragen
- At
- Verfügbarkeit
- vermeiden
- AWS
- Bar
- basierend
- BE
- gehört
- Nutzen
- Besser
- zwischen
- Stärkung
- Box
- bauen
- Building
- eingebaut
- Geschäft
- Unternehmen
- aber
- by
- namens
- CAN
- Leinwand
- Fähigkeiten
- capability
- Erfassung
- Capturing
- vorsichtig
- Häuser
- Ursachen
- Herausforderungen
- Gebühren
- Chart
- Chat
- Auswählen
- reinigen
- Code
- Kolonne
- Spalten
- Unternehmen
- verglichen
- abschließen
- Komplex
- umfassend
- Vertrauen
- Konsul (Console)
- Verbraucher
- Kernbereich
- Korrelation
- Platz
- erstellen
- erstellt
- kritischem
- Kunde
- Kunden
- Cyber-
- Internet-Sicherheit
- technische Daten
- Datenaufbereitung
- Datenstrategie
- Tag
- Entscheidung
- Decision Making
- zeigen
- beschreiben
- Entwerfen
- Bestimmen
- entwickeln
- entdeckt,
- Display
- Displays
- do
- Domain
- herunterladen
- effektiv
- mühelos
- mühelos
- ermöglicht
- End-to-End
- Energie
- Eine Verbesserung der
- Enter
- Äther (ETH)
- ERFAHRUNGEN
- Erfahrungen
- Experimentieren
- ERKUNDEN
- Extrakt
- Extraktion
- beschleunigt
- Merkmal
- Filter
- Filterung
- Finden Sie
- Befund
- Vorname
- Fluss
- Setzen Sie mit Achtsamkeit
- Folgende
- Aussichten für
- Foundation
- für
- Zukunft
- Gewinnen
- sammeln
- erzeugen
- erzeugt
- generativ
- Generative KI
- bekommen
- gibt
- Ziele
- Waren
- geführt
- passieren
- glücklich
- Geschirr
- he
- Unternehmen
- hilft
- GUTE
- ihm
- seine
- Ultraschall
- Hilfe
- aber
- http
- HTTPS
- Login
- if
- unmittelbar
- zu unterstützen,
- in
- das
- Erhöhung
- unabhängig
- branchenführend
- innovativ
- Einblicke
- Anleitung
- Integration
- Schnittstelle
- in
- Untersuchung
- beinhaltet
- Isv
- IT
- SEINE
- Peter
- Beitritt
- jpg
- Wesentliche
- Wissen
- See
- Sprache
- grosse
- neueste
- Leadership
- führenden
- lernen
- geführt
- Geführte Daten
- Hebelwirkung
- Limitiert
- Liste
- liebt
- Maschine
- Maschinelles Lernen
- Making
- Manager
- maximal
- ML
- für
- mehr
- sollen
- Natürliche
- Natürliche Sprache
- Need
- Bedürfnisse
- Neu
- Neue Technologien
- jetzt an
- Anzahl
- of
- Angebote
- on
- EINEM
- Einkauf & Prozesse
- Option
- or
- Organisation
- UNSERE
- übrig
- Paket
- Brot
- Schnittmuster
- Leistung
- Personalisiert
- Pipeline
- Ort
- Plato
- Datenintelligenz von Plato
- PlatoData
- Post
- Potenzial
- Werkzeuge
- angetriebene
- Prognosen
- Vorbereitung
- Danach
- bereit
- Vorspann
- Principal
- Vor
- Aufgabenstellung:
- Probleme
- Produkt
- PRODUKTIVITÄT
- Eingabeaufforderungen
- bietet
- Bereitstellung
- schnell
- erreichen
- siehe
- Region
- Regionen
- entfernt
- berichten
- Anforderung
- erfordert
- Downloads
- Die Ergebnisse
- Rückgabe
- Revolutionierung
- Risiko
- Risiken
- Rollen
- Wurzel
- sagemaker
- Skalierbarkeit
- Skalieren
- Sekunden
- sicher
- Sicherheitdienst
- Sicherheitsrisiken
- sehen
- Senior
- Lösungen
- kompensieren
- Einstellung
- Schwere
- zeigte
- Konzerte
- Einfacher
- Geschicklichkeit
- So
- Software
- solide
- Lösung
- Lösungen
- LÖSEN
- Auflösung
- Quelle
- Quellen
- spezialisiert
- spezifisch
- Anfang
- begonnen
- Beginnen Sie
- Shritte
- Lagerung
- speichern
- Strategie
- Struktur
- zusammenfassen
- Unterstützt
- Nehmen
- Team
- Teams
- Technologies
- Technologie
- Tennis
- Text
- zur Verbesserung der Gesundheitsgerechtigkeit
- Das
- Die Quelle
- ihr
- Sie
- dann
- Dort.
- fehlen uns die Worte.
- nach drei
- Zeit
- mal
- zu
- Transformieren
- Transformation
- Transformationen
- verwandelt
- Transformationen
- XNUMX
- verstehen
- Verständnis
- öffnen
- Aktualisierung
- us
- -
- Anwendungsfall
- benutzt
- nützlich
- verwendet
- Verwendung von
- Wert
- Verkäufer
- visuell
- Visualisierung
- visualisieren
- wollen
- we
- Netz
- Web-Services
- wann
- welche
- während
- werden wir
- mit
- .
- ohne
- Arbeiten
- arbeiten,
- U
- Ihr
- Zephyrnet