Quand les départements opérationnels convoquent au sein d'une cellule de crise, les équipes IT responsables du réseau, des applications, de la sécurité, des DevOps et d'autres fonctions internes, mais aussi les FAI et autres fournisseurs SaaS, cloud, etc., tout le monde ne pense qu'à une chose : s'exonérer de toute responsabilité dans les meilleurs délais. Est-ce vraiment la meilleure manière de fonctionner ?
Avant de répondre, prenons un peu de recul. La transformation digitale ne date pas d'hier, mais son impact est aujourd'hui plus important que jamais. En effet, nous préférons tous aujourd'hui interagir avec une entreprise (ou même avec l'administration publique) par voie digitale. Après la pandémie, la connectivité digitale et les plateformes de collaboration se sont définitivement imposées comme des éléments incontournables de toute activité professionnelle. On imagine mal comment une entreprise pourrait prospérer à l'heure actuelle sans proposer des expériences digitales de qualité à ses utilisateurs, clients et employés.
Comprendre les risques propres au digital
Quelques chiffres :
- Les recettes du commerce électronique devraient dépasser 6 330 milliards de dollars d'ici 2024. (eMarketer)
- 60 % des dirigeants désignent la transformation digitale comme le facteur de croissance le plus important (PwC)
Malgré ces chiffres, nombre de dirigeants sous-estiment l'importance d'assurer le bon fonctionnement de leur plateforme digitale pour garantir la réussite de leurs projets stratégiques. Combien d'entre nous ont une connaissance suffisante des environnements digitaux pour en maîtriser les risques ?
Les entreprises opèrent aujourd'hui dans un environnement en constante mutation. Le rythme des innovations technologiques a conduit à la digitalisation de presque tous les aspects de nos vies, activités professionnelles comprises. Cette transformation digitale est synonyme d'opportunités inédites, mais aussi de nouveaux défis, en particulier du fait de la complexité et de l'interdépendance des services dont nous ne pouvons plus nous passer.
Toute entreprise souhaitant proposer des expériences digitales fluides et intuitives est désormais contrainte de gérer un réseau complexe de technologies distribuées. Or il suffit que les interactions entre ces technologies dépassent un délai de quelques millisecondes pour qu'une perte de qualité de l'expérience utilisateur se fasse sentir. Certes, les performances, la résilience et l'évolutivité des applications ont fait des progrès prodigieux au cours des 10 dernières années, mais ces avancées ont été accompagnées d'une complexification de l'écosystème des fournisseurs de réseaux, de cloud, d'applications et de services tiers nécessaires pour en assurer la gestion. En outre, ce sont les maillons faibles de la chaîne technologique qui dictent les performances globales.
Protéger les performances de l'entreprise
Faute d'une compréhension claire des performances digitales et des dangers associés, les entreprises s'exposent à un large éventail de risques, y compris la dégradation de l'expérience des clients et des employés, un impact négatif sur leur marque et leur réputation, des pénalités financières liées au non-respect des accords de niveau de service, une incapacité à répondre aux normes de conformité ainsi que des pertes de profits.
Si, par le passé, il pouvait être possible de continuer à travailler d'une manière ou d'une autre en cas de panne informatique. Désormais, le moindre incident est susceptible de suspendre l'activité de l'entreprise. Que faire face à un tel risque ?
Il faut commencer par une prise de conscience : nos systèmes et processus opérationnels doivent changer. À moins d'être une très jeune start-up, personne ne part de zéro face à un tel défi. Nous possédons tous des systèmes dans nos unités d'exploitation, avec des processus en place et des compétences spécifiques. Cependant, les priorités d'hier ne sont pas celles de demain. Ainsi, lorsque la majorité de nos workloads se trouvent dans le cloud, n'est-ce pas là que devrait porter la majorité de nos efforts ? De même, si 80 % de nos salariés pratiquent le télétravail pendant 80 % de leur temps, ne devrions-nous pas consacrer 80 % de notre attention à assurer la qualité de cette expérience distribuée ?
Il est crucial de comprendre comment articuler cette nouvelle distribution de vos applications, de votre infrastructure et de vos employés avec votre pile de supervision existante afin d'identifier les déséquilibres, les failles et les manques de visibilité. Dans la plupart des cas, ces carences sont le fait d'intervenants externes ou découlent du fonctionnement combiné des services dont dépend l'expérience digitale. Mais il serait mal avisé de ne pas vous intéresser à l'expérience de vos clients ou de vos employés sous prétexte que les applications ou infrastructures concernées sont gérées par des tiers.
La première étape consiste à identifier ces lacunes. Ces lacunes sont des risques auxquels votre entreprise est confrontée et auxquels vous devez faire face. Il est essentiel de trouver des plateformes comme ThousandEyes pour combler ces lacunes. Tout aussi important est l'examen réfléchi de la façon d'exploiter ces données télémétriques, de leurs implications sur votre pile d'opérations existante, de la façon de les intégrer et de les agréger, de leurs impacts sur votre flux de travail existant et de ce que cela signifie en termes d'ensembles de compétences requises. C'est ce processus qui, en fin de compte, permet d'opérationnaliser le risque digital et d'y réagir.
Et les cellules de crise dans tout cela ?
Les cellules de crise sont parfois inévitables dans un monde où personne ne peut anticiper, identifier et résoudre tous les problèmes avant qu'ils n'impactent l'entreprise. Mais deux points méritent d'être précisés.
Premièrement, alors que les applications, les infrastructures et les réseaux affichent une sophistication sans précédent, et que presque toutes nos interactions dépendent de connexions digitales, est-il vraiment nécessaire de demander à tant d'intervenants de se justifier ? Il est facile de déterminer qui de l'application ou du réseau est en cause, puis d'isoler le domaine réseau posant problème. De plus, dans des architectures modernes où les applications distribuées dépendent de tout un écosystème de fournisseurs, il n'est plus raisonnable de demander des comptes à une liste d'intervenants toujours plus longue en cas de problème. Une approche radicalement différente est requise : nous devons traiter chaque réseau comme s'il nous appartenait.
Deuxièmement, considérer que ce qui n'est pas de votre ressort « n'est pas votre problème » est problématique en soi. Il faut décloisonner les silos et sortir du dédouanement individuel pour assumer l'entière responsabilité des performances de l'application ainsi que de l'expérience utilisateur de bout en bout. Il faut notamment intégrer Application Performance Monitoring (APM) et certains systèmes de supervision cloud natifs, comme AWS CloudWatch. Cependant, ces derniers concernent l'application et non l'utilisateur. Si nous voulons miser sur l'expérience utilisateur et sur ses conséquences pour la réussite d'une entreprise digitale, alors nous devons analyser chaque élément clé en partant de l'utilisateur. La responsabilisation, les analyses chiffrées et l'optimisation permettent d'assurer la qualité de l'expérience de bout en bout.
Une assurance réseau de bout en bout pour les entreprises modernes
Le manque de visibilité propre à l'Internet génère beaucoup plus de risques pour les entreprises qu'on ne croit. L'assurance réseau offerte par ThousandEyes permet de suivre chaque phase de l'expérience de chaque utilisateur, sur tous les réseaux et pour toutes les applications. Vous pouvez ainsi traiter chaque réseau comme s'il vous appartenait et offrir les meilleures expériences possibles.