Le flux toujours plus grand de données tirées de capteurs, de photos, de textes, de contenus vocaux et vidéo, ainsi que les nouvelles méthodes de traitement des données, jouent un rôle majeur dans le processus de transformation numérique que connaissent toutes les industries.
Les entreprises ont la possibilité de déterminer non seulement le segment de leur clientèle qui achète, ou va acheter, leur produit, mais également à quel moment cet achat aura lieu. Les mégadonnées améliorent l’efficacité de la gestion des opérations des entreprises. Les mégadonnées changent le monde de bien d’autres façons :
Améliorer les services de santé. En analysant de grands volumes d’images et de dossiers médicaux, il est possible d’identifier des modèles pour établir des diagnostics précoces et créer de nouveaux médicaments.
Prédire les catastrophes naturelles et humaines, puis y faire face. Des données, recueillies par des capteurs, sont analysées afin de prédire les tremblements de terre et les tsunamis. Des organisations recherchent des modèles de comportements humains types dans l’espoir d’améliorer les secours. Les technologies des mégadonnées sont également utilisées pour comprendre les dynamiques complexes de l’émigration grâce à la compilation et l’analyse de statistiques pertinentes.
Les mégadonnées de la Terre. Les avancées dans le domaine de la télédétection, des réseaux sociaux, des modèles de simulation de haute performance et de la surveillance in situ nous fournissent des quantités de mégadonnées sans précédent sur notre planète. Toutes les connaissances extraites de ces données très nombreuses et variées sont autant d’occasions de mieux comprendre la Terre.
Des secteurs traditionnels, comme le transport, la santé ou l’industrie, vont à l’avenir grandement bénéficier de l’analyse et du traitement des données – et des mégadonnées en particulier. Ces données sont susceptibles de :
Réorganiser l’industrie des services en Europe, en contribuant à la création de produits et de services d’information innovants, fondés sur les préférences et les besoins des clients.
Stimuler la productivité en ouvrant tous les secteurs à l’informatique décisionnelle perfectionnée.
Consolider notre connaissance et notre compréhension de méthodes qui nous aideront à faire face à de multiples défis sociétaux.
Faire avancer la recherche et d’accélérer l’innovation.
Réduire les coûts, en aidant les entreprises à offrir des services et des produits plus personnalisés.
Renforcer l’efficacité du secteur public.
Quelques exemples d’utilisation des mégadonnées :
Les stratégies de commercialisation personnalisées.
L’analyse des sentiments (avis et commentaires sur les produits).
Guider la croissance du produit en fonction de la croissance de la consommation (comportement du consommateur).
Applications biomédicales (médecine et traitements personnalisés).
Gestion de la ville grâce aux mégadonnées (villes connectées).
La santé connectée : améliorer les services de santé et la santé publique
Il a fallu 10 ans pour décoder le génome humain. Aujourd’hui, grâce à la puissance de calcul des systèmes d’analyse des mégadonnées, il est possible de décoder une séquence d’ADN en quelques minutes. On pense que cela nous aidera à soigner et comprendre certaines maladies et à créer des profils pathologiques. Si toutes les données personnelles des montres connectées et des autres objets connectés portables étaient rassemblées, on pourrait imaginer les utiliser pour aider des millions de malades. Cela pourrait permettre de rendre les essais cliniques bien plus solides et concluants.
Par exemple, la nouvelle application de santé d’Apple, ResearchKit, transforme votre téléphone en appareil de recherche biomédical. Des chercheurs peuvent désormais collecter les données et les retours d’utilisateurs de mobiles, afin de réaliser des études sur leur santé. Votre appareil (une montre connectée, par exemple) est en mesure de compter le nombre de pas que vous effectuez chaque jour, de surveiller votre sommeil, de demander à des patients atteints d’un cancer comment ils se sentent après une séance de chimiothérapie ou encore de mesurer l’évolution de l’état d’un patient atteint de la maladie de Parkinson. Tout cela est susceptible d’accroître le nombre d’études et d’essais cliniques et d’améliorer la fiabilité des données.
Autre exemple, les techniques de mégadonnées sont utilisées pour assurer le suivi des bébés prématurés. Les nouveau-nés prématurés doivent finir leur développement à l’extérieur du ventre de leur mère, alors que leur système immunitaire n’est pas entièrement fonctionnel. Ils sont donc plus vulnérables aux infections. Pouvoir s’appuyer sur des diagnostics rapides, sans surveillance invasive, est alors essentiel. Digi-NewB travaille sur un système de surveillance non invasif qui aidera les médecins et le personnel soignant à prendre des décisions plus rapides et avisées pour éviter les infections. Ce système a été développé à partir d’une grande base de données de constantes vitales, de dossiers médicaux et de ressources audio et vidéo.
Éthique et progrès technologique
Les mégadonnées ouvrent la voie à des connaissances et des perspectives sans précédent. Quid du revers de la médaille ? Il faut tenir compte d’inquiétudes et de questions importantes, afin de s’assurer que nos droits fondamentaux et nos systèmes démocratiques sont protégés.
Confidentialité des données personnelles. Les données que nous produisons contiennent un nombre incroyable d’informations sur nos vies personnelles. C’est notre droit d’exiger qu’elles restent confidentielles. Quand des données confidentielles se retrouvent entre les mains d’individus malintentionnés, les conséquences peuvent être dramatiques. À la suite d’une fuite de données dans un établissement scolaire, des criminels pourraient obtenir des informations confidentielles sur des élèves et usurper leur identité. De même, si un hôpital ou un cabinet médical étaient piratés, les données de patients pourraient être exploitées à mauvais escient.
Sécurité des données personnelles. Lorsque l’on décide de partager des données pour surveiller notre santé, par exemple, peut-on être sûr qu’elles seront en sécurité ? Les données sont des biens extrêmement précieux. Leur collecte et leur partage constituent un secteur commercial majeur de l’économie numérique. Nous dépendons de plus en plus des ordinateurs. Un certain nombre de menaces pèsent donc sur les données qui y sont stockées. Des données peuvent être perdues à la suite d’une panne informatique, corrompues par un virus, supprimées ou modifiées par un pirate.
Discriminations fondées sur les données. Si tout est dévoilé, devient-il acceptable de laisser s’exercer des discriminations contre une personne en fonction des données que l’on possède sur sa vie ? Par exemple, peut-on proposer une mutuelle moins avantageuse à une personne obèse ? Ou offrir un taux d’intérêt plus haut aux personnes dont les parents ont des difficultés financières ? La banque et l’assurance sont des secteurs qui reposent grandement sur les données. Les individus peuvent s’attendre à être analysés et scrutés sous toutes les coutures. Comment s’assurer que cela ne rendra pas plus compliquée la vie des moins fortunés et de ceux pour qui l’accès à l’information est plus difficile ?
Dans l’UE, des pratiques éthiques en matière de mégadonnées sont promues dans des règlements et d’autres documents. Leur objectif est de trouver des solutions concrètes pour maximiser la valeur des mégadonnées, sans pour autant sacrifier nos droits fondamentaux. Le Contrôleur européen de la protection des données (CEPD) promeut le droit à la vie privée et le droit à la protection des données personnelles, dans le respect de la dignité humaine.
Qu’est-ce qu’une donnée personnelle ?
Le Règlement général sur la protection des données (RGPD) stipule que :
« On entend par “données à caractère personnel”, toute information se rapportant à une personne physique identifiée ou identifiable ; est réputée être une “personne physique identifiable” une personne physique qui peut être identifiée, directement ou indirectement, notamment par référence à un identifiant, tel qu’un nom, un numéro d’identification, des données de localisation, un identifiant en ligne, ou à un ou plusieurs éléments spécifiques propres à son identité physique, physiologique, génétique, psychique, économique, culturelle ou sociale ».
Vous pouvez en apprendre plus sur les données personnelles et les règles de protection des données sur la page consacrée à la RGPD.
Tenir compte de ces problématiques et en apprendre plus à leur sujet est un aspect fondamental de l’utilisation des mégadonnées. Les organisations qui souhaitent exploiter les données se doivent de respecter des règles éthiques et les droits individuels. Si ce n’était pas le cas, nos sociétés seraient plus vulnérables et les entreprises menacées d’un point de vue juridique, financier – sans oublier l’atteinte à leur réputation.
Il existe de nombreuses autres inquiétudes éthiques liées à l’utilisation des données, notamment le droit à la non-discrimination fondée sur les caractéristiques individuelles, le profilage des individus et l’analyse prédictive des comportements en vue d’influencer les processus démocratiques, ou encore l’équité et le respect de l’autonomie humaine. C’est pourquoi, aujourd’hui plus que jamais, il est essentiel de bien connaître l’utilisation des données dans notre société – le quoi, le pourquoi et le comment des données – afin de comprendre et de reconnaître les abus en la matière.
Les compétences relatives aux mégadonnées et l’avenir des emplois
Comme nous avons pu le voir, l’étude des données s’appuie sur de nombreuses méthodes. Chacune requiert des compétences uniques. Pour travailler avec les mégadonnées, des connaissances techniques et non techniques sont nécessaires : connaître le fonctionnement des technologies essentielles, comprendre les techniques d’analyse des données, être créatif/ve et savoir exprimer un propos en vue de concevoir des visualisations de données efficaces.
Il faut pour cela maîtriser les bonnes compétences et posséder un état d’esprit adéquat. Il s’agit de déterminer la méthode la plus adaptée en fonction du type de données et des besoins (la raison pour laquelle on analyse ces données), puis de choisir les bons outils afin de créer de la valeur. Il ne suffit pas d’obtenir des données. Il faut aussi pouvoir compter sur des personnes qui sauront en tirer quelque chose.
Les professionnels des mégadonnées se doivent également de saisir les aspects légaux et économiques du domaine, afin de traduire leurs observations en valeur et d’échanger régulièrement avec les dirigeants et les chefs de produit à propos de ce qu’ils ont appris et de la façon dont ces conclusions pourraient être utilisées d’un point de vue commercial de façon innovante : nouveaux services ou produits, modèles opérationnels plus efficaces, ou nouveaux marchés.
Être curieux/se, avide de découvrir de nouvelles choses, savoir créer et tester des théories et trouver des tendances permettant de prédire des résultats. Voilà ce qu’il vous faut pour réussir dans ce secteur.
Un jour ou l’autre, tous les emplois reposeront sur une combinaison de compétences spécialisées et de compétences relatives à la science des données. En effet, dans tous les secteurs d’activité, les données sont en train de devenir un moteur d’activité :
Les entrepreneurs utiliseront les données à des fins d’analyse des comportements, d’optimisation (variété, prix, facteur travail, distribution et logistique) et de prédiction de la demande. Correctement mettre en place une stratégie fondée sur les données nécessite également de bien connaître les secteurs industriels et commerciaux.
Les médecins qui analysent de grands ensembles de données de patients peuvent contribuer à identifier ceux qui sont les plus susceptibles de souffrir d’une maladie spécifique. En donnant leur avis, les professionnels de la santé auront également un rôle clé à jouer dans le processus d’entraînement de l’IA pour la scintigraphie cérébrale.
Les professionnels du secteur bancaire peuvent s’appuyer sur les techniques d’analyse des sentiments et d’analyse prédictive pour prévoir le profil des clients potentiels et proposer des produits personnalisés complémentaires à leurs clients actuels.
Et cetera et cetera.
Peu importe les avancées, la science et l’analyse des données ne remettent pas en cause le besoin d’un apport humain. C’est même tout le contraire. Il existe un besoin pressant de professionnels qualifiés, capables de comprendre les données, mais aussi les problématiques sectorielles et d’en tirer des conclusions.
Les ingénieurs en science des données font aujourd’hui partie des professionnels les plus recherchés
Les ingénieurs spécialisés dans les données sont des membres essentiels dans les équipes d’analyse de toutes les entreprises. Ils sont responsables de la gestion, de l’optimisation, de la supervision et de la surveillance de l’extraction, du stockage et de la diffusion des données, à tous les niveaux de l’organisation.
Ces ingénieurs sont chargés de déceler des tendances dans les ensembles de données et de développer des algorithmes pour rendre les données brutes exploitables par l’entreprise. Cette profession requiert un certain nombre de compétences techniques informatiques, notamment une très bonne compréhension de la structure des bases de données SQL et de divers langages de programmation. Mais ces ingénieurs doivent également avoir de bonnes compétences communicationnelles, afin de travailler avec différents services et de comprendre ce que les dirigeants souhaitent tirer des grandes bases de données de leur entreprise.
Compétences recherchées : Apache Spark, Scala, Hadoop, Python, Hive, Amazon Web Services, Apache Kafka, mégadonnées, Extract/Transform/Load (ETL), SQL, apprentissage automatique. Secteurs qui embauchent : technologies et services de l’information, Internet, industrie automobile, éditeurs informatiques, conseil de gestion, génie mécanique et industriel, services financiers, secteur hospitalier et sanitaire, télécommunications.
Autres perspectives d’emploi dans le domaine des mégadonnées : expert scientifique, développeur et consultant.