« Une nouvelle méthode de classification permettant de cibler des actions de prévention » par Romain GAUCHON

Romain Gauchon, actuellement doctorant CIFRE dans un partenariat entre ACTUARIS et SAF ISFA, vient de soutenir son mémoire d’actuaire sur une des problématiques centrales de la chaire Prevent’Horizon : « Une nouvelle méthode de classification permettant de cibler des actions de prévention».
Le jury a été unanime pour reconnaître ses talents de chercheur en actuariat et a été impressionné par l’innovation qu’il a développé pour améliorer les techniques de ciblage des patients / assurés.

Travail co-encadré par Stéphane LOISEL et Jean-Louis RULLIERE pour l’ISFA et Alexandra BARRAL, Céline BLATTNER et Cécile PARADIS pour Actuaris.

 

Pour qu’une action de prévention soit efficace, il est important de cibler des personnes et d’identifier leurs besoins, afin de proposer des programmes de prévention adaptés. Dans le secteur de l’assurance santé, cela pose un problème majeur : la législation restreint le nombre de données disponibles. Les organismes assureurs n’ont accès qu’à quelques variables permettant de caractériser un assuré (sexe, âge, localisation…), ainsi qu’aux remboursements qui lui ont été effectués.

De plus, les statistiques descriptives classiques sur ces données ne sont généralement pas suffisantes pour identifier les besoins de prévention, en particulier dans le cadre de la prévention tertiaire. Enfin, les approches de data science sont souvent supervisées, ce qui supposerait de connaitre l’état de santé de nos assurés.
Ce cadre restrictif a conduit à développer une méthode de classification innovante pour répondre aux contraintes pratiques liées à la prévention dans le domaine de l’assurance santé : elle devait être non supervisée, complémentaire aux statistiques descriptives usuelles et entièrement interprétable, ceci afin de pouvoir cibler des groupes d’assurés et proposer des actions de prévention tertiaire adaptées à leur besoin ou affiner le ciblage d’actions de prévention primaire.
La méthode développée dans ce mémoire se déroule en trois temps. Tout d’abord, il est nécessaire de retraiter les données relatives aux prestations santé versées par l’organisme assureur afin d’obtenir une matrice où chaque ligne représente la consommation d’un assuré, en comptant les fréquences de consommation de chaque acte santé.
La seconde étape consiste à réduire la dimension de la matrice précédente, afin de faciliter les interprétations et d’améliorer la qualité de la classification. Les algorithmes NMF (Non negative Matrix Factorisation) remplissent bien ce rôle.
Enfin, les assurés sont classifiés à l’aide d’une carte de Kohonen. Une cartographie de l’ensemble de nos assurés constituée de quinze à vingt groupes de risque homogènes est réalisée. Cette méthode offre une visualisation naturelle de notre portefeuille. En ce sens, elle est complémentaire aux statistiques descriptives classiques puisqu’elle décrit graphiquement les groupes de risques sous-jacents. Les classes obtenues sont facilement interprétables et peuvent permettre par exemple d’identifier les personnes âgées les plus sujettes au risque de chutes et de leur proposer des actions de prévention adaptées.
 
Date de soutenance : 14 mai 2018