Retour

Relever les défis que présente la migration infonuagique pour l’entreposage de données

Louis Roy 

Architecte de Systèmes

11 avril 2023

Relever les défis que présente la migration infonuagique pour l’entreposage de données

Offrant d’immenses possibilités d’éliminer les silos de données, il n’est pas surprenant que les entreprises migrent de plus en plus leurs bases de données locales vers des entrepôts de données infonuagiques. Toutefois, les entreprises n’en sont pas toutes au même stade dans leur transition vers l’infonuagique. Outre le temps nécessaire pour migrer des ensembles de données entiers vers ces nouveaux systèmes, les capacités réelles (ou l’absence de celles-ci) de ces entrepôts peuvent être à l’origine de nombreuses frictions entre les services.

Un changement de comportement est également nécessaire de la part des différentes parties prenantes (qu’il s’agisse des SIG, de la science des données ou des équipes de TI) pour passer d’une approche ETC (extraction, transformation, chargement)  à une approche ECT (extraction, chargement, transformation) et ainsi tirer parti de l’extensibilité du nuage et des concepts de gouvernance et de sécurité des données.

Votre entreprise a probablement déjà opté pour une solution d’entreposage, mais connaissez-vous l’étendue de ses capacités géospatiales? Cette solution est-elle adaptée à vos besoins?

Korem est là pour habiliter vos équipes en matière de géolocalisation, démystifier les différentes options infonuagiques disponibles sur le marché et surmonter vos défis de migration vers le nuage.

Les entrepôts de données infonuagiques ne sont pas tous équivalents

Il n’est pas rare de constater des lacunes dans les connaissances concernant les capacités géospatiales de la solution infonuagique choisie ou disponible, en particulier si votre entreprise ne présente pas suffisamment de compétences en matière de cloud ou est trop habituée à son ancien entrepôt local.

La plupart des solutions d’entreposage de données sont dotées de capacités géospatiales communes qui répondent aux cas d’utilisation de base. La véritable puissance de ces solutions réside toutefois dans les fonctions définies par l’utilisateur, qui aideront les parties prenantes à augmenter les capacités de leur système avec une logique personnalisée et des opérateurs géospatiaux avancés auxquels elles sont habituées.

En règle générale, les fonctions définies par l’utilisateur sont calculées soit en interne, soit en externe.

Opérations internes

Pour les opérations internes, les données sont en circuit fermé et les calculs tirent parti de la capacité de mise à l’échelle des entrepôts de données. Ainsi, les données ne quittent jamais les locaux de l’entrepôt de données infonuagique. Elles bénéficient également de types de déploiement simples qui vont de l’installation en un clic à une configuration en quelques étapes. 

Une grande variété de fonctions définies par l’utilisateur permet de réaliser des fonctions géospatiales de base autant qu’avancées, incluant des transformations, des mesures et des regroupements. Les autres fonctions disponibles comprennent notamment :

  • Groupement de données par classe (H3, quadbin, S2)
  • Tuiles (tuiles vectorielles)
  • Géocodage
  • Validation de l’adresse
  • Acheminement
  • Analyse de données matricielles

Opérations externes

En fonction des besoins, il peut être impossible de tout calculer au sein de l’entrepôt de données. Cela peut être dû à des limitations des systèmes de fichiers, à des obstacles liés au langage de programmation ou à des interactions complexes avec des dictionnaires personnalisés. Vous pourriez, par exemple, avoir besoin d’une API externe pour atteindre vos objectifs.

Pour ces opérations externes, les données quittent les locaux pour atteindre une source extérieure. Les calculs sont donc exécutés par un service Web externe. L’extensibilité gérée en externe pourrait poser des problèmes de performance et de coût, puisque les temps de latence et les frais d’entrée et de sortie peuvent souvent réserver des surprises.

Tout comme les opérations internes, les opérations externes bénéficient de types de déploiement simples, car vous pouvez facilement tirer parti des solutions SaaS (Software as a Service) existantes. En fonction de la sensibilité des données, leur déplacement à l’intérieur et hors de l’entrepôt de données n’est toutefois pas forcément la meilleure solution.

External operations

Heureusement, il existe une troisième possibilité, qui est essentiellement une combinaison des deux. Les fonctions font toujours appel à un service Web externe, mais cette fois, le service Web est hébergé dans vos locaux (nuage public ou privé). Cette solution permet des opérations hautement sécurisées, une latence réduite et l’élimination des frais d’entrée et de sortie.

Cette option implique toutefois des déploiements plus complexes, tels que des déploiements Kubernetes hautement extensibles et résilients, et nécessite donc une importante expertise technique.

External operations (cont.)

Les défis que présente la migration infonuagique

Processus d’intégration de données

La migration des données vers une solution infonuagique implique des efforts considérables pour consolider et synchroniser différents formats et types de données à des fins multiples et provenant de diverses sources et applications, telles que les systèmes de gestion des relations clients et la planification des ressources de l’entreprise.

Il s’agit également de passer d’un processus ETC à un processus ECT. Dans le processus ECT, la transformation des données est effectuée après leur chargement dans le système cible, et peut conduire à un processus de transformation des données complexe. Il est donc plus difficile d’analyser et de transformer un grand volume de données déjà chargées. Vous devez donc vous assurer que vous avez choisi une infrastructure robuste et extensible pour traiter d’importants volumes de données.

Les mégadonnées ne sont toutefois pas le seul élément à prendre en compte. Une faible qualité des données peut également avoir un impact considérable sur la réussite du processus de migration, car des efforts et des investissements considérables pour le nettoyage et l’enrichissement des données seront nécessaires. Encore une fois, comme les données sont chargées avant d’être transformées dans le processus ECT, un éventuel problème de qualité ne peut être détecté qu’après le chargement des données. Par conséquent, des vérifications de la qualité des données devraient être mises en place à différents stades du processus ECT afin d’éviter les erreurs.

Gestion des ressources et des coûts

Les solutions infonuagiques sont généralement plus rentables que les infrastructures traditionnelles, en raison de la réduction des coûts de matériel et de maintenance ainsi que de la possibilité de ne payer que pour les ressources utilisées. Cependant, le processus de migration des données peut s’avérer plus coûteux que prévu en termes de temps et d’argent s’il ne repose pas sur une stratégie solide.

En effet, une recherche et une planification inadéquates, par exemple en ce qui concerne le fournisseur de services infonuagiques et ses politiques en matière de données, peuvent entraîner des factures ou des frais inattendus. Idéalement, l’ensemble du processus devrait être réalisé en plusieurs étapes, comprenant des essais et une validation approfondis entre chacune d’elles. Cette approche nécessite une expertise technique importante et un investissement dans de nouvelles compétences pour charger de grandes quantités de données dans le système cible.

Malheureusement, les entreprises manquent souvent de l’expertise et des ressources nécessaires pour exploiter pleinement les nouvelles technologies de manière autonome. C’est là que les services gérés de Korem s’avèrent utiles, car ils vous permettent de confier la gestion de vos opérations à notre équipe d’experts hautement qualifiés.

Sécurité et confidentialité des données

Les fournisseurs de services infonuagiques mettent généralement en place diverses mesures de sécurité, telles que le cryptage, les contrôles d’accès basés sur les rôles et les audits réguliers. Il s’agit de garantir une protection optimale des données, de la confidentialité et de la conformité aux exigences réglementaires, et de protéger les données et l’infrastructure des clients contre les cyberattaques et autres menaces. Les services infonuagiques offrent également souvent des solutions intégrées de reprise après sinistre, permettant aux entreprises de récupérer rapidement leurs données et applications en cas d’interruption de service.

Vous devez toutefois vous assurer que les protocoles de sécurité offerts par le fournisseur de services infonuagiques que vous avez choisi répondent à vos exigences en matière de sécurité et de confidentialité des données. C’est d’autant plus important pour les déploiements en nuage public, où une entreprise partage des serveurs et des infrastructures avec d’autres clients en nuage. Dans ce contexte, les vulnérabilités des serveurs peuvent entraîner des fuites de données ou d’autres incidents de sécurité.

Il se peut également que vous n’ayez aucune visibilité sur l’emplacement d’hébergement réel de vos données et applications dans les déploiements en nuage public, ce qui peut s’avérer problématique face à certaines lois sur la confidentialité des données telles que le RGPD. Par exemple, les données à caractère personnel (DCP), les données personnelles ou les données sensibles ne seront probablement pas autorisées à transiter vers des plateformes de données externes.

Selon une enquête de SANS, 56 % des personnes interrogées sont extrêmement préoccupées par la sécurité, qui constitue l’un des principaux défis de la migration infonuagique. La gouvernance des données devient donc essentielle pour mettre en place des mesures de sécurité rigoureuses, afin de garantir que les données sont sécurisées, organisées et gérées efficacement, et que chaque utilisateur a accès au bon niveau de données.

Heureusement, grâce à notre offre de gestion d’actifs logiciels et de soutien à la conformité des licences, nous pouvons vous aider à mieux comprendre les conditions d’utilisation associées à chaque ensemble de données et au besoin, à modifier ces conditions d’utilisation avec le fournisseur que vous avez choisi.

Outils de visualisation des données

Enfin, si vous souhaitez tirer pleinement parti de vos données pour répondre à des questions commerciales et résoudre des problèmes géospatiaux, vous devez vous assurer de choisir le bon outil de visualisation. La visualisation de quantités massives de données nécessitant des outils et des méthodologies spécialisés, il se peut que votre ancienne solution de visualisation ne soit plus adaptée à vos besoins.

Par exemple, avec la Plateforme CARTO, vous pouvez rapidement créer des services intuitifs d’intelligence géospatiale ou utiliser un modèle d’application pour accélérer votre analyse géospatiale. Elle est également compatible avec les principales plateformes de données infonuagiques et les principaux outils d’analyse, tels que Google BigQuery, Snowflake, Amazon Redshift et Databricks.

Votre solution infonuagique vous convient-elle?

Lorsqu’elles sont correctement exploitées, les solutions infonuagiques peuvent réduire les coûts, améliorer l’exactitude et la sécurité des données, offrir une certaine extensibilité et vous aider à mieux connaître votre entreprise pour prendre des décisions fondées sur des données. Mais avant de choisir un entrepôt de données infonuagiques, demandez-vous :

  • Quelle est ma vision d’un service infonuagique?
  • Quels sont mes principaux défis spatiaux (analyse, géocodage, acheminement, etc.)?
  • Comment décrirais-je mes ensembles de données (DCP, sensibles, etc.)?
  • Quelles sont mes attentes en termes de volume, de délai de réponse et de temps de disponibilité?
  • Est-ce que je décrirais ma charge de travail comme un traitement par lots, en temps réel, ou un mélange des deux?
  • Est-ce que j’utilise déjà des solutions géospatiales? Si oui, que réalisent-elles et où sont-elles hébergées?

Si vous n’êtes pas certain que votre plateforme de données infonuagiques soit adaptée à vos besoins, ou si vous n’avez toujours pas fait votre choix, Korem possède l’expertise et les produits pour vous aider à choisir la meilleure option en fonction de vos besoins et vous offrir le soutien nécessaire dans le processus complexe de migration d’un entrepôt de données traditionnel.

Communiquez avec nous »

Restez connecté!

Inscrivez-vous à notre infolettre :

CLAVARDEZ