Le Data Management au service de la Data Science
Si le terme « système d’information » est consacré depuis de nombreuses années pour désigner ce que l’on appelait précédemment « l’informatique », il prend désormais tout son sens avec la « data » comme principale ressource d’information et de valeur pour l’organisation. Une optique nouvelle qui nécessite toutefois un changement d’approche en matière de gestion du système d’information : le data management.
Big Data, Data Science, Data Management : rappels sémantiques
Dans l’IT, comme dans de nombreux autres secteurs, il y a des modes, des tendances. Lesquelles se traduisent en concepts plus ou moins compris, aux définitions parfois floues et aux périmètres pas toujours très clairs. La data et son écosystème n’échappent bien évidemment pas au principe. Sans tomber dans l’inventaire à la Prévert, petit lexique de la data.
Tout d’abord, la data, ou la donnée : qui n’est à ne surtout pas confondre avec l’information. Car une donnée brute, qu’elle soit structurée ou non et quels que soient sa provenance et son format, n’est pas intrinsèquement utile. Un croisement avec une autre donnée ou un traitement quelconque sont en général nécessaires pour lui apporter de la valeur, et la transformer en information utile.
Le Big Data, au sens strict, c’est la capacité de collecte d’une quantité de plus en plus importante de données. Avec le risque d’infobésité : collecter des quantités colossales de données sans avoir la capacité de les traiter n’a pas vraiment de sens. Ce qui est tout l’objectif de la data science, dont les travaux d’analyses, centrés sur les métiers, doivent justement permettre de créer la valeur de la donnée, en la transformant en véritable information pour les processus de l’organisation concernés.
Mais dans de nombreux cas, les data scientists rencontrent un certain nombre d’obstacles dans leurs missions. Et bien souvent techniques : une très grande partie de leur temps est d’ailleurs consacrée à ces problématiques. Ce qui n’est plus le cas s’ils peuvent compter sur le data management, une démarche globale de gestion notamment technique des données, afin d’en simplifier, pour les métiers, la valorisation, l’utilisation et la visualisation.
Définition du Data Management : un cercle vertueux
Qu’est-ce que le data management ? C’est en quelque sorte inscrire tout autour de la donnée un cercle vertueux d’actions, capable de créer de la valeur, de la maintenir dans le temps et même de la renforcer.
- Identifier, collecter, stocker : c’est bien sûr le point de départ. Interne ou externe, structurée ou non structurée, issue d’un outil d’entreprise ou d’un objet connecté, etc., la donnée est à la base du processus.
- Valoriser : plusieurs types d’actions peuvent permettre de valoriser une donnée. Il peut s’agir de la structurer, de la formater ou encore de l’enrichir. La question du temps est aussi essentielle : on parle de valeur temporelle. En effet, la donnée peut avoir une forte valeur à un instant T (pour une alerte par exemple) et une valeur moindre à un autre moment. Dans tous les cas, cette phase a pour objet de faire naître la valeur et l’exprimer au bon moment.
- Sécuriser : comme pour tous les éléments du système d’information, il s’agit ici de garantir la disponibilité et l’intégration de la donnée, mais aussi d’en sécuriser ses usages et en maîtriser les risques. Ce qui signifie aussi prendre la notion temporelle en compte : dans le cas d’une rétention de long terme par exemple, combien de données ne sont aujourd’hui plus lisibles car impossibles à restaurer dans leurs bases de données d’origine ?
- Opérer : à la fois hardware et software mais surtout services, l’architecture sous-jacente aux données fait partie intégrante du data management. C’est tout l’ensemble des services d’’exploitation et du maintien en condition opérationnelle des systèmes,
- Optimiser & piloter : aspects budgétaires, réglementaires ou techniques, les éléments qui entourent la donnée sont vivants. Les faire évoluer et les adapter dans le temps, autant que savoir en mesurer et en optimiser les coûts, est essentiel à une exploitation pertinente des données sur la durée. Il s’agit là d’adopter une gouvernance des données pérenne.
La DSI, prescriptrice de valeur
Avec cette nouvelle approche, la DSI et tout son écosystème (prestataires de services, fournisseurs de solutions, fournisseurs d’infrastructure, etc.) ne se positionnent plus comme un centre de coûts pour l’organisation, mais au contraire en prescripteurs de valeur pour les métiers.
Détentrice du savoir et des savoir-faire en matière de données, la DSI est en effet en mesure, comme aucun autre département de l’entreprise, d’innover :
- Optimiser et consolider des services existants par l’adjonction d’informations complémentaires au bon moment dans le bon processus : maintenance prédictive, vérification d’un numéro de série pour envoi d’une pièce détachée, etc.
- Créer de nouveaux services, car les métiers eux-mêmes peuvent n’avoir aucune conscience de la valeur de leurs données et de ce qu’il est possible d’en faire pour créer de la valeur business, par une amélioration des performances ou même la création de nouveaux services monnayables.
En d’autres termes, plus large que la notion de Big Data et plus technologique que la data science, le data management constitue aujourd’hui le socle fondamental du système d’information de demain.