Ce meet-up sera axé autour d’une problématique d’assurance santé : comment améliorer la connaissance des risques couverts par l’assureur afin de cibler une action de prévention sur la population qui en bénéficiera le plus ? Les prestations santé remboursées par l’assureur santé reflètent partiellement l’historique médical de l’assuré. Ces actes médicaux peuvent être vus comme les mots d’un texte racontant une histoire sur chacun des assurés. Le domaine du text mining peut-il aider dans l’analyse de ces données santé ?
Les travaux présentés ont pour objectif d’utiliser trois méthodes de réduction de dimension issues du domaine de l’analyse du langage (NMF, mSDA et Word2Vec) afin de créer des groupes d’actes de soins. Ces derniers peuvent ensuite être utilisés afin de construire une classification non supervisée des assurés par groupe de risque santé, ce qui facilite le ciblage d’une action de prévention. L’analyse de la stabilité de cette classification sera également évoquée.
L’évènement aura lieu sur Twitch.
https://www.twitch.tv/lyondatascience
Rendez-vous