Ciblage et parcours de soins : classification des assurés

Le cadre réglementaire et la frilosité des assurés à confier leurs données à des assureurs limitent les informations auxquelles a accès l’assureur. Comment, dans ce cas, arriver à proposer des actions de prévention pertinentes aux assurés ? Comment les cibler pour les proposer à ceux qui en profiteraient le plus et ainsi réduire les coûts de mise en place ? Afin de répondre à cette problématique, on cherche à mettre au point une méthode qui permet d’identifier les profils de risques des assurés à partir de leurs consommations, afin de leur proposer des actions de prévention pertinentes. On caractérise ces profils de risques avec des variables extérieures (âge, sexe,…), et on essaie enfin d’analyser comment les groupes de risques d’un individu évoluent dans le temps, afin d’essayer de construire des alertes qui permettraient de prédire certaines pathologies.

L’utilisation de techniques de data science devrait permettre d’identifier des groupes homogènes d’assurés et leur proposer des programmes de prévention ciblés (fonction des risques de pathologies actuelles ou à venir). Comment détecter les besoins de prévention des assurés à l’aide de la data science ? Les résultats seront issus d’une modélisation à l’aide d’un algorithme par factorisation de matrices combiné avec une approche de data visualisation. Deux bases de prestations santé sont comparées permettant de mettre en évidence des similarités et des différences d’appétence des assurés au regard d’actions de prévention. D’autres algorithmes plus classiques sont également testés afin de valider la pertinence du choix de l’algorithme. Au travers de cette étude, l’enjeu de la granularité de l’information contenue dans les bases de données est également abordé.