Данные — это основа для получения максимальной выгоды от технологий искусственного интеллекта и быстрого решения бизнес-задач. Однако чтобы раскрыть потенциал генеративных технологий искусственного интеллекта, есть ключевое условие: ваши данные должны быть соответствующим образом подготовлены. В этом посте мы опишем, как использовать генеративный ИИ для обновления и масштабирования вашего конвейера данных с помощью Холст Amazon SageMaker для подготовки данных.
Как правило, работа с конвейером данных требует специальных навыков для подготовки и организации данных, которые аналитики безопасности смогут использовать для извлечения выгоды, что может занять время, увеличить риски и увеличить время окупаемости. С помощью SageMaker Canvas аналитики безопасности могут легко и безопасно получить доступ к ведущим базовым моделям, чтобы быстрее подготовить свои данные и устранить риски кибербезопасности.
Подготовка данных включает в себя тщательное форматирование и продуманную контекстуализацию, отходя от проблемы клиента. Теперь, благодаря чату SageMaker Canvas для подготовки данных, аналитики со знаниями предметной области могут быстро подготовить, систематизировать и извлечь пользу из данных, используя чат.
Обзор решения
Генеративный искусственный интеллект совершает революцию в сфере безопасности, предоставляя персонализированный интерфейс на естественном языке, улучшая выявление и устранение рисков, а также повышая продуктивность бизнеса. В этом случае мы используем SageMaker Canvas, Обработчик данных Amazon SageMaker, Озеро безопасности Амазонкии Простой сервис хранения Amazon (Амазонка S3). Amazon Security Lake позволяет агрегировать и нормализовать данные безопасности для анализа, чтобы лучше понять безопасность в вашей организации. Amazon S3 позволяет хранить и извлекать любой объем данных в любое время и в любом месте. Он предлагает лучшие в отрасли масштабируемость, доступность данных, безопасность и производительность.
SageMaker Canvas теперь поддерживает комплексные возможности подготовки данных на базе SageMaker Data Wrangler. Благодаря этой интеграции SageMaker Canvas предоставляет комплексное рабочее пространство без программирования для подготовки данных, построения и использования машинного обучения (ML) и Коренная порода Амазонки базовые модели для ускорения перехода от данных к бизнес-идеям. Теперь вы можете обнаруживать и агрегировать данные из более чем 50 источников данных, а также исследовать и готовить данные, используя более 300 встроенных методов анализа и преобразований в визуальном интерфейсе SageMaker Canvas. Вы также почувствуете более высокую производительность преобразований и анализа и получите преимущества от интерфейса на естественном языке для исследования и преобразования данных для машинного обучения.
В этом посте мы демонстрируем три ключевых преобразования; фильтрация, переименование столбцов и извлечение текста из столбца набора данных результатов безопасности. Мы также демонстрируем использование функции чата для подготовки данных в SageMaker Canvas для анализа данных и визуализации результатов.
Предпосылки
Прежде чем начать, вам понадобится учетная запись AWS. Вам также необходимо настроить Студия Amazon SageMaker домен. Инструкции по настройке SageMaker Canvas см. Генерируйте прогнозы машинного обучения без кода.
Доступ к интерфейсу чата SageMaker Canvas.
Выполните следующие шаги, чтобы начать использовать функцию чата SageMaker Canvas:
- В консоли SageMaker Canvas выберите Обработчик данных.
- Под Datasets, выберите Amazon S3 в качестве источника и укажите набор данных результатов безопасности из озера безопасности Amazon.
- Выберите поток данных и выберите Чат для подготовки данных, который будет отображать интерфейс чата с подсказками.
Данные фильтра
В этом сообщении мы сначала хотим отфильтровать критические и серьезные предупреждения, поэтому вводим в окно чата инструкции, чтобы удалить результаты, которые не являются критическими или высокой степенью серьезности. Canvas удаляет строки, отображает предварительный просмотр преобразованных данных и предоставляет возможность использовать код. Мы можем добавить его в список шагов в Шаги панель.
Переименовать столбцы
Далее мы хотим переименовать два столбца, поэтому вводим в поле чата следующую подсказку, чтобы переименовать по убыванию и название столбцы в Обнаружение и Санация. SageMaker Canvas создает предварительный просмотр, и если вас устраивают результаты, вы можете добавить преобразованные данные к шагам потока данных.
Извлечь текст
Для определения региона-источника находки вы можете ввести в чат инструкции по Извлеките текст региона из столбца UID на основе шаблона. arn:aws:security:securityhub:region:*
и создайте новый столбец под названием «Регион».), чтобы извлечь текст региона из столбца UID на основе шаблона. Затем SageMaker Canvas генерирует код для создания нового столбца региона. Предварительный просмотр данных показывает, что результаты получены из одного региона: us-west-2
. Вы можете добавить это преобразование в поток данных для последующего анализа.
Проанализируйте данные
Наконец, мы хотим проанализировать данные, чтобы определить, существует ли корреляция между временем суток и количеством важных результатов. Вы можете ввести в чат запрос на обобщение важных выводов по времени суток, и SageMaker Canvas предоставит информацию, полезную для вашего расследования и анализа.
Визуализация результатов
Затем мы визуализируем результаты по серьезности с течением времени, чтобы включить их в отчет руководства. Вы можете попросить SageMaker Canvas создать гистограмму степени серьезности в зависимости от времени суток. За считанные секунды SageMaker Canvas создал диаграмму, сгруппированную по серьезности. Вы можете добавить эту визуализацию к анализу в потоке данных и загрузить ее для своего отчета. Данные показывают, что результаты происходят из одного региона и происходят в определенное время. Это дает нам уверенность в том, на чем сосредоточить наше расследование обнаруженных нарушений безопасности, чтобы определить основные причины и корректирующие действия.
Убирать
Чтобы избежать непредвиденных расходов, выполните следующие действия для очистки ресурсов:
- Очистите корзину S3, которую вы использовали в качестве источника.
- Выйдите из SageMaker Canvas.
Заключение
В этом посте мы показали, как использовать SageMaker Canvas в качестве комплексного рабочего пространства без программирования для подготовки данных для создания и использования базовых моделей Amazon Bedrock, чтобы ускорить сбор бизнес-информации из данных.
Обратите внимание, что этот подход не ограничивается выводами о безопасности; вы можете применить это к любому варианту использования генеративного ИИ, в основе которого лежит подготовка данных.
Будущее принадлежит компаниям, которые смогут эффективно использовать возможности генеративного искусственного интеллекта и больших языковых моделей. Но для этого мы должны сначала разработать надежную стратегию обработки данных и понять искусство подготовки данных. Используя генеративный искусственный интеллект для разумного структурирования наших данных и работая в обратном направлении от клиента, мы можем быстрее решать бизнес-задачи. Благодаря чату SageMaker Canvas для подготовки данных аналитикам легко приступить к работе и сразу же получить выгоду от ИИ.
Об авторах
Судиш Сасидхаран — старший архитектор решений в AWS в отделе энергетики. Судиш любит экспериментировать с новыми технологиями и создавать инновационные решения, которые решают сложные бизнес-задачи. Когда он не разрабатывает решения и не возится с новейшими технологиями, его можно найти на теннисном корте, работающим над ударом слева.
Джон Клачински является главным менеджером по решениям для клиентов в команде независимых поставщиков программного обеспечения (ISV) AWS. В этой роли он программно помогает клиентам независимых поставщиков программного обеспечения внедрять технологии и сервисы AWS для более быстрого достижения своих бизнес-целей. До прихода в AWS Джон возглавлял группы по обработке данных в крупных компаниях, производящих потребительские товары, помогая им использовать аналитические данные для улучшения своей деятельности и принятия решений.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/analyze-security-findings-faster-with-no-code-data-preparation-using-generative-ai-and-amazon-sagemaker-canvas/
- :имеет
- :является
- :нет
- :куда
- $UP
- 100
- 125
- 300
- 50
- a
- ускорять
- доступ
- Учетная запись
- через
- действия
- Добавить
- принять
- совокупный
- AI
- позволяет
- причислены
- Amazon
- Создатель мудреца Амазонки
- Холст Amazon SageMaker
- Amazon Web Services
- количество
- an
- анализирует
- анализ
- Аналитики
- анализировать
- и
- любой
- Применить
- подхода
- надлежащим образом
- МЫ
- Искусство
- AS
- спросить
- At
- свободных мест
- избежать
- AWS
- бар
- основанный
- BE
- принадлежит
- польза
- Лучшая
- между
- стимулирование
- Коробка
- строить
- Строительство
- встроенный
- бизнес
- бизнес
- но
- by
- под названием
- CAN
- холст
- возможности
- возможности
- захватить
- Захват
- тщательный
- случаев
- Причины
- проблемы
- расходы
- График
- чат
- Выберите
- чистым
- код
- Column
- Колонки
- Компании
- сравненный
- полный
- комплекс
- комплексный
- доверие
- Консоли
- потребитель
- Основные
- Корреляция
- корт
- Создайте
- создали
- критической
- клиент
- Клиенты
- кибер-
- информационная безопасность
- данным
- Подготовка данных
- стратегия данных
- день
- решение
- Принятие решений
- демонстрировать
- описывать
- проектирование
- Определять
- развивать
- обнаружить
- Дисплей
- дисплеев
- do
- домен
- скачать
- фактически
- легкий
- легко
- позволяет
- впритык
- энергетика
- повышение
- Enter
- Эфир (ETH)
- опыт
- Впечатления
- экспериментировал
- Больше
- извлечение
- добыча
- быстрее
- Особенность
- фильтр
- фильтрация
- Найдите
- результаты
- Во-первых,
- поток
- Фокус
- после
- Что касается
- Год основания
- от
- будущее
- Gain
- собирать
- порождать
- генерирует
- генеративный
- Генеративный ИИ
- получить
- дает
- Цели
- товары
- управляемый
- происходить
- счастливый
- упряжь
- he
- помощь
- помогает
- High
- его
- его
- Как
- How To
- Однако
- HTTP
- HTTPS
- Идентификация
- if
- немедленная
- улучшать
- in
- включают
- Увеличение
- независимые
- отрасли
- инновационный
- размышления
- инструкции
- интеграции.
- Интерфейс
- в
- ходе расследования,
- включает в себя
- ISV
- IT
- ЕГО
- John
- присоединение
- JPG
- Основные
- знания
- озеро
- язык
- большой
- последний
- Наша команда
- ведущий
- изучение
- привело
- Светодиодные данные
- Кредитное плечо
- Ограниченный
- Список
- любит
- машина
- обучение с помощью машины
- Создание
- менеджер
- максимальный
- ML
- Модели
- БОЛЕЕ
- должен
- натуральный
- Естественный язык
- Необходимость
- потребности
- Новые
- Новые технологии
- сейчас
- номер
- of
- Предложения
- on
- ONE
- Операционный отдел
- Опция
- or
- организация
- наши
- внешний
- за
- пакет
- хлеб
- шаблон
- производительность
- Персонализированные
- трубопровод
- Часть
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- После
- потенциал
- мощностью
- Питание
- Predictions
- подготовка
- Подготовить
- подготовленный
- предварительный просмотр
- Основной
- Предварительный
- Проблема
- проблемам
- Продукт
- производительность
- наводящие
- приводит
- обеспечение
- быстро
- достигать
- относиться
- область
- районы
- удаляет
- отчету
- запросить
- требуется
- Полезные ресурсы
- Итоги
- Возвращает
- Революционные
- Снижение
- рисках,
- Роли
- корень
- sagemaker
- Масштабируемость
- Шкала
- секунды
- безопасно
- безопасность
- риски безопасности
- посмотреть
- старший
- Услуги
- набор
- установка
- строгость
- показал
- Шоу
- просто
- умение
- So
- Software
- твердый
- Решение
- Решения
- РЕШАТЬ
- Решение
- Источник
- Источники
- специализированный
- конкретный
- Начало
- и политические лидеры
- Начало
- Шаги
- диск
- магазин
- Стратегия
- Структура
- суммировать
- Поддержка
- взять
- команда
- команды
- технологии
- Технологии
- теннис
- текст
- который
- Ассоциация
- Источник
- их
- Их
- тогда
- Там.
- этой
- три
- время
- раз
- в
- Transform
- трансформация
- преобразований
- преобразован
- прообразы
- два
- понимать
- понимание
- отпереть
- Обновление ПО
- us
- использование
- прецедент
- используемый
- полезный
- использования
- через
- ценностное
- продавец
- визуальный
- визуализация
- визуализации
- хотеть
- we
- Web
- веб-сервисы
- когда
- который
- в то время как
- будете
- в
- без
- Работа
- работает
- являетесь
- ВАШЕ
- зефирнет