In Первая часть В этом сообщении блога мы описали, почему перед разработчиками инструментов тестирования конвейеров данных возникает множество проблем (сложность технологий, большое разнообразие структур и форматов данных, а также необходимость поддержки различных конвейеров CI/CD). Было описано более 15 различных категорий инструментов тестирования, которые нужны разработчикам конвейеров.
Вторая часть углубляется в эти сложности и освещает тонкости, стоящие на пути универсальных инструментов тестирования, которые можно применять к широкому спектру задач. конвейеры данных. Затем мы расскажем, как найти отдельные инструменты и платформы для тестирования конвейеров данных, отвечающие вашим потребностям.
Рассмотрите варианты инфраструктур инструментов тестирования конвейеров данных
Каковы реальные решения проблем владельцев конвейеров данных при выборе инструментов автоматизированного тестирования для удовлетворения их разнообразных требований к тестированию конвейеров данных?
Разнообразие и сложность систем управления данными могут затруднить выбор инструментов автоматического тестирования для конвейеров данных. Однако практические решения могут помочь владельцам конвейеров данных сделать правильный выбор.
- Модульные инструментальные рамки: Вместо того, чтобы выбирать один монолитный инструмент, рассмотрите модульные структуры, которые обеспечивают возможности Plug-and-Play. Эти платформы позволяют владельцам конвейеров интегрировать конкретные модули или плагины тестирования, адаптированные для каждой уникальной технологии или требования. Выгода: Обеспечивает гибкость для адаптации к различным технологиям и может быть легко расширена по мере развития или изменения компонентов конвейера.
- Выбор гибридного инструмента: Вместо того, чтобы искать один инструмент, чтобы сделать все это, используйте комбинацию специализированных инструментов. Например, используйте один инструмент, предназначенный для проверки потока данных в реальном времени, а другой — для проверки пакетной обработки. Выгода: Использование сильных сторон специализированных инструментов обеспечивает всесторонний охват и глубокое понимание конкретных компонентов трубопровода.
- Непрерывная интеграция и интеграция непрерывного развертывания (CI/CD): Выбирайте инструменты тестирования, которые легко интегрируются в существующие конвейеры CI/CD. Это гарантирует, что автоматическое тестирование станет рутинной частью цикла разработки и развертывания. Выгода: Облегчает раннее обнаружение проблем, упрощенное развертывание и последовательное тестирование на протяжении всего жизненного цикла разработки.
- Поддержка сообщества и поставщиков: Отдавайте приоритет инструментам, которые имеют сильную поддержку сообщества или поставщиков. Активные форумы, регулярные обновления, обширная документация и оперативная поддержка клиентов могут иметь решающее значение, особенно когда вы сталкиваетесь с уникальными проблемами или адаптируетесь к новым технологиям. Выгода: Обеспечивает долговечность инструмента, своевременную помощь и доступ к пулу знаний и решений от разработчиков и пользователей.
- Пилотное тестирование и итеративная оценка: Прежде чем брать на себя долгосрочные обязательства, проведите пилотные испытания потенциальных инструментов на репрезентативных подмножествах конвейера данных. Эта прямая оценка дает представление о возможностях инструмента, ограничениях и совместимости с конкретными конвейерными технологиями. Выгода: Снижает риск использования инструмента, который может оказаться неподходящим, гарантируя, что выбранное решение точно соответствует уникальным требованиям конвейера.
Включение решений предлагает структурированный подход к дилемме выбора инструментов, позволяя владельцам конвейеров данных делать выбор, который отвечает их непосредственным потребностям и часто остается адаптируемым и эффективным перед лицом будущего технологического развития.
Для каждой из этих категорий обнаружение ошибок имеет первостепенное значение. Сбои или неточности в обработке данных могут привести к серьезным проблемам в дальнейшем, потенциально ставя под угрозу бизнес-решения или системные операции, зависящие от данных.
Рабочие процессы конвейера данных включают в себя множество операций: от извлечения и преобразования до загрузки, проверки и мониторинга. Соответственно, различные инструменты автоматизированного тестирования предназначены для удовлетворения различных этапов и потребностей этих рабочих процессов.
Спланируйте путь к тестированию решений для автоматизации
При выборе инструментов важно убедиться, что они соответствуют вашим текущим и ближайшим потребностям. Часто лучше выбрать инструмент с большими возможностями, чем вам нужно в данный момент, а не тот, который вы скоро перерастете.
Определите цели тестирования: Найдите назначение каждого потенциального инструмента тестирования: проверка, регрессия, производительность и т. д. Поймите объем и характер ваших данных: структурированные, неструктурированные, в реальном времени, пакетные.
Определите требования к тестированию: Определите желаемые функции инструментов тестирования, а затем определитесь с типами необходимых тестов: модульное, интеграционное, сквозное и нагрузочное тестирование.
Классифицировать необходимые функции и возможности:
- Гибкость: Будут ли инструменты поддерживать широкий спектр форматов и источников данных?
- Масштабируемость: Смогут ли они справиться с ожидаемым объемом данных?
- Интеграция: Легко ли они интегрируются с вашими существующими системами, например, инструментами CI/CD, платформами данных и системами оповещения?
- Юзабилити: Удобны ли инструменты для пользователя или им нужно долго учиться?
- Сообщество и поддержка: Есть ли сильная общественность и/или официальная поддержка?
Опишите требования к отчетности и аналитике:
- Лучшие инструменты тестирования должны предоставлять подробные журналы и аналитику, позволяющие легко отлаживать и понимать результаты тестирования.
- Решите, соответствует ли отчетность инструмента потребностям вашей команды.
Опишите ваши потребности в расширяемости и настройке:
- Проверьте, позволяет ли инструмент писать собственные плагины или расширения.
- Выясните, можете ли вы легко изменить его в соответствии с меняющимися требованиями.
Откройте для себя доступные инструменты
Поиск инструментов разработчиков для аналогичных конвейеров данных требует исследований, налаживания связей и экспериментов. Вот системный подход, который поможет вам найти эти инструменты:
Доступные инструменты исследования: Начните с широко известных инструментов тестирования конвейеров данных, таких как Apache JMeter, встроенные возможности тестирования Apache Airflow, Great Expectations и т. д. Рассмотрите инструменты, которые хорошо интегрируются с вашим текущим технологическим стеком.
Отраслевые форумы и сообщества:
- Форумы по инженерии данных: На таких веб-сайтах, как Stack Overflow, Data Engineering на Reddit, GitHub и других, можно выполнять поиск по ключевым словам, связанным с вашими источниками данных, преобразованиями и технологиями.
- Материалы конференций: Ознакомьтесь с материалами таких конференций, как Strata Data, Spark + AI Summit. Часто разработчики представляют свои конвейеры данных, и вы можете получить представление об инструментах, которые они используют.
Сеть:
- Встречи: Посещайте или присоединяйтесь к местным встречам по разработке данных или конкретным технологиям. Взаимодействие может привести к пониманию используемых инструментов.
- Семинары и конференции: Посещайте семинары и конференции, посвященные инженерии данных. На этих мероприятиях часто проводятся тематические исследования, в которых обсуждаются инструменты и методологии.
Сайты продавцов и продуктов: Многие поставщики инструментов публикуют тематические исследования или истории пользователей. Просмотрите их, чтобы понять, как и где используются их инструменты.
Платформы с открытым исходным кодом: Такие платформы, как GitHub или GitLab, могут стать настоящей сокровищницей. Найдите репозитории, подобные вашему конвейеру, и изучите инструменты и технологии, которые они используют.
Отраслевые отчеты: Промышленный дизайн аналитические отчеты а опросы (например, от Gartner, Forrester и O’Reilly) дают представление о популярных инструментах и технологиях.
Прямое обращение: Найдите компании или команды, работающие над похожими конвейерами данных (через блоги и статьи), и свяжитесь напрямую, выражая свои взаимные интересы и обращаясь за советом.
Документация поставщика: Если вы используете определенные технологии или платформы обработки данных (например, AWS, Azure, Google Cloud), ознакомьтесь с их официальной документацией и блогами, чтобы узнать о лучших практиках и рекомендуемых инструментах для тестирования конвейера данных.
Внутренняя сеть: Ваши коллеги, особенно если вы работаете в более крупной организации, могут иметь понимание или знать кого-то, у кого оно есть.
Google ученый: Найдите академические и исследовательские работы, например, Google Scholarи введите соответствующие ключевые слова, например «инструменты тестирования конвейера данных», «среды тестирования конвейера данных» или «лучшие практики тестирования конвейера данных».
Консалтинговые фирмы: Консалтинговые фирмы, специализирующиеся на разработке данных или аналитике, часто имеют широкий доступ к различным инструментам и передовым практикам в разных отраслях.
Обучение и онлайн-курсы: Онлайн-платформы предлагают курсы по инженерии данных. В этих курсах часто упоминаются инструменты и лучшие практики; вы можете оценить, какие инструменты популярны или перспективны.
Отраслевые блоги и информационные бюллетени: Следите за блогами или информационными бюллетенями, посвященными инженерии данных или конкретным технологиям, которые вас интересуют. В них часто обсуждаются инструменты, их плюсы и минусы, а также варианты использования. Присоединяйтесь к онлайн-сообществам и форумам, связанным с разработкой данных, конвейерами данных или вашими конкретными источниками данных (например, Hadoop, Spark, Kafka). Такие сайты, как Stack Overflow, Reddit или специализированные форумы, часто обсуждают инструменты и методы, которые используют разработчики.
GitHub и проекты с открытым исходным кодом: Найдите в репозиториях GitHub проекты конвейеров данных с открытым исходным кодом или связанные инструменты. Многие разработчики открыто делятся своими проектами и упоминают инструменты, которые они используют, в своих файлах README.
Профессиональные ассоциации: Рассмотрите возможность вступления в профессиональные ассоциации, связанные с разработкой данных или наукой о данных. Они часто предоставляют ресурсы, вебинары и сетевые возможности, которые могут помочь вам найти популярные инструменты.
ИИ-чаты: Пример запроса: «Разработайте список инструментов тестирования конвейера данных и опишите каждый из них. В список будут включены инструменты, которые часто рекомендуются для проектов конвейеров данных. Инструменты должны включать инструменты для тестирования источников и типов данных, преобразования данных, профилирования данных, извлечения данных, приема данных и проверки качества данных. Рассмотрим типы инструментов, которые доступны у поставщиков инструментов, на Git-Hub и в открытых источниках.
Платформы сравнения инструментов: Такие сайты, как G2, Capterra и IT Central Station, предоставляют сравнение инструментов, включая отзывы пользователей. Читая обзоры, вы часто можете сделать вывод о контексте использования этих инструментов.
Используя сочетание описанных выше методов и постоянно оставаясь в курсе отраслевых тенденций, вы можете понять, какие инструменты тестирования используют разработчики аналогичных конвейеров данных.
Заключение
В огромном и сложном мире конвейеров данных нельзя отрицать необходимость в точных и всеобъемлющих инструментах тестирования. Хотя концепция универсальных инструментов тестирования – тех, которые могут без проблем интегрироваться с любой мыслимой технологией конвейера данных – продолжает оставаться привлекательной. Сделать это непросто из-за большого разнообразия технологий, их быстрого развития и сложности самой задачи.
Вместо поиска решений, применимых ко всем ситуациям, следует сосредоточиться на поиске специализированных инструментов или модульных структур, обеспечивающих сочетание адаптируемости и глубины. Реализация этой стратегии гарантирует исчерпывающее тестирование, адаптированное к точным требованиям, и открывает путь к инновациям в методологиях тестирования конвейеров данных.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://www.dataversity.net/choosing-tools-for-data-pipeline-test-automation-part-2/
- :является
- :нет
- :куда
- 1
- 15%
- 2022
- a
- О нас
- выше
- академический
- доступ
- достижения
- соответственно
- через
- активный
- приспосабливать
- совет
- AI
- помощь
- выравнивать
- Выравнивает
- Все
- позволять
- Позволяющий
- позволяет
- Несмотря на то, что
- аналитика
- и
- Другой
- любой
- апаш
- привлекательный
- прикладной
- Применить
- подхода
- МЫ
- AS
- Помощь
- ассоциации
- посещать
- Автоматизированный
- автоматизация
- доступен
- AWS
- Лазурный
- BE
- становится
- до
- не являетесь
- польза
- ЛУЧШЕЕ
- лучшие практики
- Лучшая
- Блог
- блоги
- изоферменты печени
- широкий
- встроенный
- бизнес
- by
- CAN
- не могу
- возможности
- возможности
- случаев
- Сферы деятельности
- случаев
- категории
- обслуживать
- центральный
- проблемы
- сложные
- изменение
- проверка
- выбор
- Выберите
- Выбирая
- тесно
- облако
- COM
- сочетание
- обязательство
- совершение
- Сообщества
- сообщество
- Компании
- сравнение
- сравнения
- совместимость
- комплекс
- сложности
- сложность
- компоненты
- комплексный
- компромат
- сама концепция
- Проводить
- конференции
- Минусы
- Рассматривать
- последовательный
- контексты
- беспрестанно
- продолжается
- (CIJ)
- курсы
- охват
- Текущий
- В настоящее время
- кривая
- изготовленный на заказ
- клиент
- служба поддержки
- настройка
- цикл
- данным
- обработка данных
- Качество данных
- наука о данных
- ДАТАВЕРСИЯ
- решать
- решения
- преданный
- глубоко
- запросы
- развертывание
- глубина
- описывать
- описано
- предназначенный
- желанный
- подробный
- обнаружение
- застройщиков
- Развитие
- различный
- направлять
- непосредственно
- обнаружить
- обсуждать
- обсуждается
- отчетливый
- Разное
- Разнообразие
- do
- документации
- приносит
- два
- e
- каждый
- Рано
- легко
- легко
- эффективный
- включить
- охватывала
- впритык
- Проект и
- обеспечивает
- обеспечение
- Enter
- ошибки
- особенно
- существенный
- и т.д
- оценка
- События
- эволюция
- эволюций
- развивается
- развивается
- пример
- существующий
- ожидания
- ожидаемый
- Экспозиция
- расширенная
- обширный
- добыча
- Face
- сталкиваются
- сбои
- Особенность
- Особенности
- Файлы
- Найдите
- обнаружение
- Компаний
- соответствовать
- Трансформируемость
- Фокус
- внимание
- следовать
- Что касается
- Forrester
- форумы
- каркасы
- от
- будущее
- G2
- Gain
- Gartner
- калибр
- GitHub
- Go
- Цели
- хорошо
- Google Cloud
- большой
- гарантии
- Hadoop
- Есть
- помощь
- здесь
- основной момент
- Как
- Однако
- HTTPS
- if
- немедленная
- Осуществляющий
- значение
- in
- включают
- В том числе
- individual
- промышленности
- промышленность
- свойственный
- Инновации
- размышления
- пример
- интегрировать
- интеграции.
- взаимодействие
- заинтересованный
- интересы
- в
- тонкости
- исследовать
- вопросы
- IT
- присоединиться
- присоединение
- JPG
- Кафка
- ключевые слова
- Знать
- знания
- большой
- больше
- вести
- изучение
- Жизненный цикл
- такое как
- недостатки
- Список
- Включенный в список
- загрузка
- погрузка
- локальным
- долгосрочный
- долговечность
- сделать
- Создание
- управлять
- управление
- многих
- Встречайте
- Соответствует
- Meetups
- упомянуть
- методологии
- методы
- может быть
- смешивать
- модульный
- Модули
- Мониторинг
- монолитный
- БОЛЕЕ
- взаимное
- природа
- Необходимость
- необходимый
- потребности
- сеть
- сетей
- Сетевые возможности
- более новый
- Рассылки
- of
- предлагают
- Предложения
- Официальный представитель в Грузии
- .
- on
- ONE
- онлайн
- онлайн-сообщества
- открытый
- с открытым исходным кодом
- открыто
- Операционный отдел
- Возможности
- Опции
- or
- организация
- Другое
- внешний
- контур
- аутрич
- Владельцы
- бумага
- Первостепенный
- часть
- путь
- обломки
- производительность
- пилот
- трубопровод
- основной
- Платформы
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- плагины
- бассейн
- Популярное
- После
- потенциал
- потенциально
- практическое
- практиками
- необходимость
- представить
- Производство
- обработка
- Продукт
- профессиональный
- профилирование
- проектов
- PROS
- приводит
- публиковать
- цель
- ассортимент
- быстро
- скорее
- достигать
- Reading
- реального времени
- данные в реальном времени
- признанный
- Управление по борьбе с наркотиками (DEA)
- Reddit.
- регресс
- регулярный
- Связанный
- соответствующие
- оставаться
- Reporting
- Отчеты
- представитель
- обязательный
- требование
- Требования
- требуется
- исследованиям
- Полезные ресурсы
- отзывчивый
- Отзывы
- Снижение
- рутина
- Ученый
- Наука
- сфера
- легко
- Поиск
- поиск
- поиск
- выбранный
- выбор
- выбор
- Поделиться
- должен
- значительный
- аналогичный
- одинарной
- Сайтов
- обстоятельства
- Решение
- Решения
- Кто-то
- Скоро
- Источники
- Искриться
- специализированный
- специализация
- конкретный
- стек
- этапы
- стоять
- станция
- пребывание
- Истории
- Стратегия
- поток
- обтекаемый
- сильные
- сильный
- структурированный
- структур
- исследования
- такие
- Костюм
- Саммит
- поставка
- поддержка
- система
- системы
- с учетом
- команды
- технологии
- технологический
- технологии
- Технологии
- тестXNUMX
- Тестирование
- тестов
- чем
- который
- Ассоциация
- их
- тогда
- Там.
- Эти
- они
- этой
- те
- Через
- по всему
- своевременно
- в
- инструментом
- инструменты
- трансформация
- преобразований
- Тенденции
- два
- Типы
- понимать
- понимание
- созданного
- Ед. изм
- Universal
- обновление
- Updates
- использование
- используемый
- Информация о пользователе
- Отзывы Пользователей
- удобно
- пользователей
- через
- Проверка
- разнообразие
- различный
- Огромная
- продавец
- поставщики
- проверки
- объем
- Путь..
- we
- Вебинары
- веб-сайты
- ЧТО Ж
- были
- когда
- который
- КТО
- зачем
- широкий
- Широкий диапазон
- широко
- будете
- WISE
- без
- Рабочие процессы
- работает
- Семинары
- Мир
- записывать
- являетесь
- ВАШЕ
- зефирнет