2024년 데이터 트렌드: 협업 데이터 공유에서 AI 기반 운영까지 - DATAVERSITY

2024년 데이터 트렌드: 협업 데이터 공유에서 AI 기반 운영까지 – DATAVERSITY

소스 노드 : 3013137

빠르게 진화하는 데이터 환경에서 새로운 트렌드를 이해하고 기술 발전을 수용하는 것이 앞서 나가기 위한 핵심입니다. 2024년이 다가오면서 이 문서에서는 내년의 전략적 환경을 정의할 데이터 추세를 살펴봅니다.

트렌드: 데이터에 초점 S하링  Data C협력

데이터 공유를 개선하고 당사자 간 안전한 데이터 협업이 핵심 영역이 되고 있습니다. Snowflake 및 Databricks와 같은 회사는 이 아이디어를 수용하고 있으며 다양한 산업 분야에서 관심을 얻고 있습니다. 

지난 10 년 동안, 디지털 변환 이로 인해 비즈니스 프로세스와 시스템이 더 작은 조각으로 세분화되었습니다. 그 중 일부는 회사 내에 남아 있고 다른 일부는 외부 제공업체에 아웃소싱되어 복잡한 생태계를 형성합니다. 예를 들어 글로벌 결제 처리의 디지털 혁신 노력은 이제 10~15개 회사에 영향을 미칠 수 있으며 데이터는 이러한 모든 당사자에게 분산됩니다. 전체적으로 보려면 여러 제공업체의 데이터를 통합해야 하는데 이는 어려운 일입니다.

따라서 데이터 제품은 여러 당사자의 데이터를 병합한다는 아이디어를 중심으로 점점 더 많이 구축되고 있습니다. 이러한 추세는 향후 몇 년 동안 계속될 것으로 예상되며, 이 프로세스를 중심으로 많은 데이터 제품이 구축될 것입니다.

트렌드: 데이터 메시의 부상

의 개념 데이터 메시 지난 3년 동안 관심을 끌었습니다. 이는 두 가지 핵심 구성 요소를 최전선으로 가져옵니다. 첫째, 데이터 생산자의 직접적인 개입 없이 셀프서비스 방식으로 사용할 수 있는 잘 정의되고 검색 가능한 형식으로 데이터를 패키징하는 '제품으로서의 데이터'라는 아이디어를 소개합니다. 이 개념에는 원시 데이터뿐만 아니라 고객 이탈이나 사기 예방에 사용되는 분석 모델도 포함됩니다.

둘째, 비즈니스 인텔리전스가 아닌 데이터 제품 생산을 위한 셀프 서비스 플랫폼을 사용하면 다양한 사업부가 별도의 데이터 플랫폼 없이도 데이터 제품을 만들 수 있습니다. 이를 통해 비용이 절감되고 효율성이 향상됩니다.

Azure 및 AWS와 같은 클라우드 서비스를 포함한 주요 기술 제공업체는 데이터 메시 방식으로 분산 데이터 및 분석 플랫폼을 관리하기 위한 솔루션을 따라잡고 제공하고 있습니다. 이를 통해 다양한 플랫폼과 기술 전반에 걸쳐 데이터를 연결하고 데이터 환경에 대한 중앙 집중식 보기를 제공할 수 있습니다.

추세: LLM은 데이터 엔지니어링 및 데이터 운영 향상에 중요한 역할을 할 것입니다.

생성 AI와 대규모 언어 모델(LLM)은 데이터 공간을 변화시킬 수 있는 잠재력을 가지고 있습니다. 이러한 변환에는 데이터 엔지니어링 및 데이터 운영과 같은 작업을 위해 기존 데이터 인프라 내에 GenAI 모델을 배포하는 것이 포함됩니다. 

더욱 흥미로운 점은 이러한 기술이 데이터 프로파일링, 모델링, 통합, 프로세스 간소화, 데이터 품질 개선과 같은 기초적인 작업을 해결할 수 있다는 점입니다. LLM은 데이터 엔지니어링 및 데이터 운영을 향상하는 데 중요한 역할을 할 것으로 예상됩니다.

추세: 기업은 데이터 검색 도구 및 데이터 카탈로그에 투자할 것입니다.

데이터 거버넌스는 지난 몇 년 동안 발전해 왔습니다. 이전에는 데이터 확보 및 위험 관리에 중점을 두었지만, 이후에는 위험을 최소화하면서 데이터를 널리 사용할 수 있도록 전환했습니다. 제품으로서의 데이터라는 개념은 가장 큰 변화입니다. 책임이 데이터를 생산, 소유 또는 제공하는 팀으로 이전되기 때문입니다.

기업은 소스, 소유권, 구조, 품질 등 데이터에 대한 가시성을 확보하기 위해 데이터 검색 도구와 데이터 카탈로그에 투자하고 있습니다. 이제 데이터 거버넌스에는 데이터를 표시하고, 검색하고, 재사용하고, 유용하게 만드는 것이 포함됩니다. 

추세: 데이터 품질에 대한 강조 증가 

데이터 분석 사용 증가와 데이터 품질에 대한 필요성으로 인해 지난 2~3년 동안 데이터 관측 가능성이 인기를 얻었습니다. 런타임 시 데이터에 대한 세부적인 이해를 제공하여 조직이 데이터 흐름을 추적하고 데이터 품질 문제, 운영 문제, 데이터 시스템 변경 사항을 식별하는 데 도움을 줍니다. 이는 가시성 및 진행 상황에 대한 이해 측면에서 엔지니어와 운영 담당자에게 많은 가치를 제공합니다.

향상된 데이터 품질 및 운영 효율성에 대한 증가하는 수요를 충족하기 위해 Monte Carlo 및 Soda와 같은 데이터 관찰 도구가 등장했습니다.

이러한 추세의 또 다른 측면은 데이터 분석에 대한 투자가 증가하고 있다는 것입니다. 데이터 분석 영역에서 파생되는 가치는 분석되는 데이터의 품질에 따라 크게 달라집니다. 결과적으로 조직에서는 데이터 품질에 더 큰 중점을 두고 있습니다. 이 과정에서 많은 데이터 품질 문제가 데이터에 대해 잘 정의된 비즈니스 규칙이나 유효성 검사 규칙이 없기 때문에 발생하는 것이 아니라는 것이 분명해졌습니다. 대신 문제는 개인이 변경한 사항이나 제공자로부터 받은 데이터의 부정확성 등 운영상의 불일치로 인해 발생하는 경우가 많습니다.

2024년에 알아야 할 가장 중요한 XNUMX가지 데이터 동향은 다음과 같습니다. 목록에 어떤 것을 추가하시겠습니까?

타임 스탬프 :

더보기 데이터 버 시티