Que sont les produits de données et pourquoi sont-ils importants ? - DATAVERSITÉ

Que sont les produits de données et pourquoi sont-ils importants ? – DATAVERSITÉ

Nœud source: 3037494

Les produits de données sont des logiciels sous la forme d'outils et d'applications spécialisés conçus pour prendre en charge les données utilisées en tant que service. Ils peuvent être aussi simples et directs qu'un programme qui convertit un ensemble de données en visualisation, ou aussi complexes qu'un système d'apprentissage automatique basé sur de grands modèles de langage (LLM), tels que ChatGPT. Ce que tous les produits de données ont en commun, c'est qu'ils atteignent un objectif spécifique grâce à l'application de données.

Un aspect potentiellement déroutant de la technologie est la distinction entre les produits de données et «les données en tant que produit», qui fusionne des outils de données avec des stratégies pour répondre aux besoins de consommateurs de données spécifiques, qu'il s'agisse d'une personne ou d'un service ou d'une organisation dans son ensemble. En revanche, les produits de données constituent la matière première que les entreprises peuvent combiner de manière unique pour mettre en œuvre des stratégies visant à atteindre leurs objectifs à court et à long terme. Ils opèrent au niveau des individus, des équipes, des départements, des entreprises et des industries entières.

Qu'est-ce qu'un Produit de données ?

L’IA et d’autres technologies en plein essor permettent aux organisations de tirer des enseignements de leurs actifs de données de manière à maximiser la valeur de ces données. Les produits de données servent de moyen par lequel les entreprises convertissent les données en actions qui améliorent leur efficacité, leur compétitivité et leur rentabilité. Ancien scientifique en chef des données aux États-Unis DJ Patil a inventé le terme "jujitsu de données» en 2012 comme « l’art de transformer les données en produit ». 

Grâce à l'application intelligente d'éléments de données, le jujitsu de données permet de résoudre des problèmes de données itératifs autrement insolubles en utilisant le « poids » du problème contre lui-même, tout comme les combattants de jujitsu tentent d'utiliser le poids de leurs adversaires à leur avantage et au désavantage de leurs adversaires. . L’approche standard de résolution de problèmes consistant à l’attaquer de front en utilisant diverses expertises techniques complique souvent le problème et le rend plus difficile à résoudre.

L’objectif des produits de données est de simplifier la résolution de problèmes en abordant dès le départ une question simple : qui veut ou a besoin de ce produit ? Pour répondre rapidement à cette question, les développeurs prennent des raccourcis qui peuvent aboutir à la version finale, ou être remplacés par des approches plus compliquées plus tard dans le processus. L’essentiel est de démarrer simplement, pour éviter de s’enliser au début du projet.

Composants des produits de données

Même les produits de données les plus simples sont constitués d'une liste diversifiée d'éléments qui se combinent pour soutenir les décisions et résoudre les problèmes commerciaux. Voici les huit éléments clés d'un produit de données :

  • Les sources de données doit être fiable, accessible en temps réel ou par lots, pertinent au problème à résoudre et conforme aux réglementations en matière de protection des données telles que RGPD ainsi que les HIPAA, ainsi qu'aux normes juridiques et éthiques.
  • Canalisations de données automatiser toutes les conversions de données requises (ETL, par exemple), s'adaptent à des ensembles de données croissants, incluent des outils robustes de gestion des erreurs et des contrôles de qualité des données, et sont modulaires pour prendre en charge les modifications de configuration.
  • Stockage de données doit répondre aux exigences de performances, évoluer horizontalement et verticalement sans interruption, appliquer le chiffrement et les contrôles d'accès et être rentable tout en prenant en charge les types de données structurées, semi-structurées et non structurées.
  • Modèles de données et algorithmes fournir des informations et des prédictions précises qui ont été validées à l’aide de techniques telles que la validation croisée. Ils doivent être faciles à comprendre pour les parties prenantes, efficaces sur le plan informatique et faciles à entretenir.
  • Les Interface utilisateur doit être suffisamment intuitif pour nécessiter une formation minimale de l’utilisateur. Il devrait utiliser des visualisations et faciliter l’interaction des utilisateurs avec les données, y compris des mécanismes de retour d’information et une prise en charge multi-appareils.
  • API et points de terminaison nécessitent une autorisation et une authentification sécurisées, des limites sur le nombre d'appels API de chaque utilisateur ou système et une documentation suffisante pour les développeurs. Ils doivent prendre en charge les formats de données tels que JSON ainsi que les XML pour assurer la compatibilité.
  • Surveillance et journalisation en temps réel permet aux produits de données d'identifier et de résoudre rapidement les problèmes. Les administrateurs sont alertés des problèmes de performances et des erreurs, et les pistes d'audit aident les entreprises à répondre aux exigences de conformité. Les mesures de performances à surveiller incluent la latence, le débit et les taux d'erreur.
  • Documentation comprend des manuels d'utilisation, des spécifications techniques, de la documentation sur les API, des journaux de modifications et des enregistrements de conformité.

Exemples de produits de données

L'exemple le plus populaire de produit de données peut être ChatGPT, l'outil gratuit basé sur l'IA qui répond à des questions simples et complexes de manière conversationnelle et entre dans un dialogue avec les utilisateurs qui permet des questions de suivi, admet ses erreurs et conteste les inexactitudes. ChatGPT est considéré comme un produit de données car il dépend d'un très grand ensemble de données textuelles, bien que le système soit beaucoup plus complexe que les produits de données classiques. 

Cependant, dans son état actuel, ChatGPT manque d'un aspect important des produits de données : l'exactitude. Le propriétaire du produit de données est responsable de garantir à la fois une expérience utilisateur positive et une résolution fiable du problème pour lequel le produit a été conçu. Cela nécessite les meilleures pratiques en matière de gestion de produits et un accès cohérent et fiable aux analyses qui soutiennent les décisions commerciales.

Ces six catégories de produits de données démontrer l’utilisation de la technologie dans les produits du quotidien :

  • Moteurs de recommandation proposés par des sociétés telles qu'Amazon, Netflix et TripAdvisor personnalisent leurs réponses pour renforcer l'engagement des clients et améliorer les taux de conversion.
  • Outils d'analyse prédictive incluent ceux utilisés par FICO, LinkedIn et Zillow qui identifient les tendances des données et génèrent des prévisions basées sur des techniques avancées d'exploration de données et de modélisation.
  • API de données tels que Google Maps, les profils LinkedIn et IO Weather facilitent la fluidité du flux de données entre des systèmes disparates. Les formats courants sont le transfert d'état de représentation (REST), le protocole SOAP (Simple Object Access Protocol), XML-RPC et JSON-RPC.
  • Tableaux de bord en temps réel présenter les données visuellement et mettre à jour automatiquement les écrans des utilisateurs à mesure que de nouvelles informations deviennent disponibles. Ils sont appliqués pour surveiller les données d’inventaire, de ventes et opérationnelles à l’appui des décisions commerciales. Tableaux de bord populaires incluent Tableau, Microsoft BI et Zoho Analytics.
  • Finances personnelles les outils comprendre Exploitez  (anciennement Personal Capital), Quicken et You Need a Budget (YNAB), qui tentent tous d'apporter plus de clarté et de confiance à la planification financière des individus.
  • Produits portables de surveillance de la santé tels que Apple Watch, FitBit et le glucomètre continu de Dexcom vont au-delà du suivi du pouls, des habitudes de sommeil et d'autres problèmes de santé en partageant les informations avec les prestataires de soins de santé.

Pourquoi les produits de données sont importants

Produits de données bénéficier aux consommateurs de données de plusieurs manières:

  • Ils obtiennent des informations plus rapidement en utilisant des produits prédéfinis plutôt que de devoir démarrer chaque projet à partir de zéro.
  • L'intégrité des données est vérifiée au préalable, la confiance est donc intégrée aux produits.
  • La connaissance de la situation en temps réel améliore la valeur des analyses de données.
  • La capacité de réagir en temps réel permet une prise de décision plus rapide et éclairée.
  • La gouvernance est facilitée par des garanties initiales de Qualité des données et conformité.
  • Les produits facilitent la recherche et l'accès aux données à partir de divers systèmes.

Les organisations considèrent les produits de données comme la clé d’une plus grande efficacité et rentabilité :

  • Les produits de données aident l’entreprise à se concentrer davantage sur les résultats positifs.
  • Ils améliorent l’agilité des organisations et génèrent de la valeur progressivement.
  • La réutilisation des produits de données maximise la valeur des données avec très peu de frais généraux.
  • Les architectures de données sont rendues évolutives grâce à l’adaptabilité des produits de données.
  • Moins de questions se posent quant à la fiabilité et à l’intégrité des données sous-jacentes.
  • Les départements métiers et informatiques communiquent en utilisant le même langage.

Le plus grand avantage des produits de données pour les organisations est peut-être leur capacité à libérer la valeur des données en servant de ciment qui relie les systèmes physiques, la modélisation des données, les processus métier et les cas d'utilisation. Ils remplacent l'approche fragmentaire que de nombreuses entreprises adoptent pour leurs opérations de données tout en décentralisant la gestion des données. Cela libère les données sous-jacentes qui peuvent être appliquées à la volée dans diverses situations et conditions, avec un prétraitement minimal ou nul. 

Selon McKinsey, les produits de données permettent de développer de nouveaux cas d'utilisation métier. mis en œuvre 90 % plus rapidement et le coût total de possession diminuera de 30 %. Ils réduisent également les risques ainsi que le temps et l’argent consacrés aux opérations de gouvernance.

Réaliser les avantages promis par les produits de données nécessite d'adopter une approche agile de la gestion des données qui commence petit, sort rapidement, se répète et démontre la valeur des produits. Ajoutez quelques fonctionnalités supplémentaires à chaque version pour augmenter progressivement la valeur du produit afin de stimuler l’adoption et d’obtenir des investissements accrus pour de nouveaux produits et cas d’utilisation. Une fois que les produits de données seront intégrés aux processus métier quotidiens de votre entreprise, les outils commenceront à se vendre à mesure que leur valeur deviendra évidente pour les utilisateurs et les gestionnaires. 

Image utilisée sous licence Shutterstock

Horodatage:

Plus de DATAVERSITÉ