Quand on parle de Big data dans le domaine de la santé on entend par ce terme l’ensemble des données sociodémographiques et de santé collectées de différentes sources pour assurer la gestion des soins, des dossiers médicaux, le suivi d’indicateurs….
Exploiter ces données facilite l’identification de facteurs de risque de maladie, aide au diagnostic, au choix et au suivi de l’efficacité des traitements, pharmacovigilance, épidémiologie… La mise en place du big data soulève aussi de nombreux défis techniques et humains et pose autant de questions éthiques notamment en termes de sécurisation des données pour éviter toute récupération
Après un focus sur la terminologie du terme Big Data, focalisons sur son utilité dans le secteur médical et ses principaux enjeux.
Le Big Data c’est quoi ?
Environ 2,5 trillions d’octets de données générés chaque jour dont 90% dans le monde ont été créées au cours des deux dernières années seulement. Elles viennent de partout : d’images numériques, de vidéos publiées en ligne, de capteurs utilisés pour collecter les informations climatiques, de messages sur les sites de médias sociaux, d’enregistrements transactionnels d’achats en ligne et de signaux GPS de téléphones mobiles…
Les chercheurs ont alors décidé d’adopter de nouvelles manières de voir et d’analyser le monde par la découverte de nouveaux ordres de grandeur concernant la capture, la recherche, le partage, le stockage, l’analyse et la présentation des données et c’est ainsi que le « Big Data » a vu le jour. Il s’agit d’un concept qui vise à stocker un nombre indicible d’informations sur une base numérique. Littéralement, le big data signifie méga-données, c’est-à-dire de grosses données ou encore données massives qu’aucun outil classique de gestion de base de données ou de gestion de l’information ne peut vraiment travailler.
Big Data pour l’analyse de données en masse
Le big data vise à proposer un choix aux solutions classiques de bases de données et d’analyse (plate-forme de Business Intelligence en serveur SQL…). Selon le Gartner, le concept est composé d’une pléthore d’outils qui répondent à une triple problématique appelée règle des 3V. C’est un volume de données considérable à traiter, une grande Variété d’informations (issues de diverses sources, non-structurées, organisées, Open…), et un certain degré de Vélocité à atteindre, c’est-à-dire la fréquence de création, collecte et partage de ces données.
La digitalisation du secteur de la santé
Les patriciens et tous professionnels de santé sont parfaitement convaincus que rien ne marche aujourd’hui sans la digitalisation de la santé à l’instar du secteur éducatif. L’accélération de la diffusion du digital dans le domaine médical ne cesse d’apporter des progrès sensibles et massifs dans tous les domaines.
D’ailleurs, la digitalisation du secteur médical fait réellement partie du quotidien des professionnels de santé. Plus qu’une innovation, elle est aujourd’hui vue comme un levier de développement et représente une très grande opportunité. Mais le meilleur argument avancé en faveur de la digitalisation du secteur de la santé est essentiellement le gain de temps grâce à de nombreux logiciels de rdv docteur en ligne et de transmissions d’informations rapides entre professionnels.
Mais avec le Big data, cette base de données géante qui fédère toutes les informations relatives à l’état de santé des patients comme les ordonnances prescrites, consultations…, le travail des professionnels de santé deviendra plus optimisé.
Enjeux du Big data pour les acteurs de la santé
Le Big data apporte une réponse concrète aux défis des maladies chroniques et du vieillissement des populations. Il permet la démultiplication du pouvoir des données médicales et l’abolition des frontières entre disciplines, métiers, recherches et pratiques, assure l’exploitation des données établit les corrélations qui ne sont pas envisageables par le cerveau humain. La science de l’analyse et des algorithmes, l’intelligence artificielle et le cloud computing sont désormais le must d’une nouvelle médecine, prédictive, préventive, personnalisée et participative (dite «médecine des 4P»).
Toutes les pathologies et situations médicales sont concernées par le Data mining et le Big data telles que pathologies chroniques, maladies rares, soins d’urgence… Rappelons aux Etats-Unis l’initiative de la Maison-Blanche, qui a investi 1 milliard de dollars dans un nouveau «Cancer Moonshot» pour accélérer la recherche dans la détection, le traitement et la prévention de la maladie, en comptant sur les avancées majeures de la science des données pour marquer la différence par rapport aux précédents investissements dans ce domaine.
Le but consiste à de doubler le rythme des innovations, grâce à un plus grand partage des données issues de l’industrie pharmaceutique, des centres de recherche et des groupes de patients.
Les maladies cardiovasculaires, maladies mentales et, dans une moindre mesure, l’asthme sont des maladies concernées. Les grands thèmes de santé publique comme l’identification des risques ou la gestion des populations constituent une autre cible. C’est le cas du suivi des maladies infectieuses émergentes (Ebola, Zika…).
Nous sommes face à un projet qui requiert quelque 6 billions de dollars et qui devrait progresser en moyenne de 25 % par an dans les cinq prochaines années, notamment par rapport à l’accès à l’information, le droit d’exploitation, la sécurisation des données, l’organisation et leadership…