Mardi 22 novembre 2021 – Meetup – Rendre les réseaux convolutifs à nouveau invariants à la translation

L’événement sera hybride : présentiel et en streaming. Inscrivez-vous si vous désirez être présent physiquement.

Cet exposé propose l’étude d’un article intitulé Making Convolutional Networks Shift-Invariant Again et publié à ICML2019 par Richard Zhang (Adobe Research). Ce titre est provocateur car il laisse penser que, avant cette publication, les réseaux convolutifs n’étaient plus vraiment invariants à la translation.

La première partie de la présentation aura pour objectif de reprendre rapidement quelques élément de base du traitement du signal, à savoir la transformée de Fourier, la théorie du filtrage et la théorie de l’échantillonnage (théorème de Shannon et filtre anti-repliement).

La deuxième partie sera une lecture guidée de l’article : les éléments de traitement du signal permettront de comprendre les défauts méthodologiques mis en lumière par l’auteur, ainsi que leurs implications sur une architecture neuronale convolutive. Les résultats et les applications seront analysés et suivis d’une discussion critique.

Ressources
Page et vidéo de présentation du papier : Making Convolutional Networks Shift-Invariant Again
https://richzhang.github.io/antialiased-cnns/

Théorème d’échantillonnage
https://fr.wikipedia.org/wiki/Th%C3%A9or%C3%A8me_d%27%C3%A9chantillonnage

Shannon Nyquist Sampling Theorem – Vidéo
https://www.youtube.com/watch?v=FcXZ28BX-xE

Orateur : Quentin Barthelemy

Rendez-vous

Mardi 29 septembre 2021 – Meetup – Deep Learning embarqué

Véhicules autonomes, smart cities, robotique… L’IA s’invite dans les objets pour les rendre intelligents.

Avec son Edge TPU Coral, Google à développé une puce optimisée pour l’IA qui permet d’exécuter des modèles de deep Learning avec une consommation d’énergie faible et des performances élevées.

Nous allons voir comment utiliser ce hardware avec Tensorflow pour faire de la détection d’objets en temps-reel. Nous allons également voir quelles sont les limites de ce type de projets et comment les dépasser.

Léo Bourrel, free-lance data scientist spécialisé en NLP et Computer Vision. https://www.leobourrel.fr/

Orateur : Léo Bourrel

Rendez-vous

Mardi 29 juin 2021 – Meetup – Enjeux de l’Intelligence Artificielle

Pour ce dernier MeetUp de la saison, nous vous proposons une présentation moins technique pour aborder des enjeux sociétaux, éthiques et environnementaux des technologies liées à l’intelligence artificielle.

Sans être totalement exhaustif, nous illustrons nos propos par des retours d’expériences, afin d’apporter des connaissances qui nous semblent pertinentes pour tout futur spécialiste de cette branche de l’informatique.

Orateur : Jérémy Espinas

Rendez-vous

Pour revoir la présentation :

Mardi 1 juin 2021 – Meetup – Efficacité « réelle » d’un test de catégorisation

 

Que ce soit en Data Science ou en médical (test Covid !), un test de catégorisation est livré avec des indicateurs de qualité calculés au moment de l’apprentissage et/ou de la mise au point.
La question abordée par cette présentation est la suivante : un objet/individu est soumis au test, le test prédit « positif » (ou « catégorie C1 »), peut-on simplement appliquer les indicateurs de qualité pour en déduire la probabilité que l’objet/individu soit réellement « positif » (ou de « catégorie C1 ») ?

Oratrice : Dominique Maret

Rendez-vous

Voici l’enregistrement du meetup :

Mardi 2 mars 2021 – Meetup – ML à l’échelle : Session LiveCoding sur Spark MLlib

A propos du Machine Learning en production, et si on parlait du passage à l’échelle ?
Comment adapter nos algorithmes pour travailler avec une taille arbitraire de données ?

Une des références du traitement de données à haute volumétrie est Apache Spark. Celui-ci embarque dans ses valises quelque chose qui peut nous intéresser : MLlib.

Pourquoi recourrir à Spark MLlib ? Quand doit-on l’utiliser ? Et surtout comment ?
Aujourd’hui, retrouvons nous pour une session de programmation en live sur la bibliothèque de machine learning de Spark.

Orateur : Guillaume Facchini

Rendez-vous

Mardi 19 janvier 2021 – Meetup – Machine learning en production

Une fois passée la phase de prototype, comment va-t-on en production quand on fait du machine learning ?

Comment s’assure-t-on que tout va bien une fois en production ?

Déploiement, tests, monitoring, etc. Il y a beaucoup de choses à penser. Sur ce long sujet, je vous propose ici une petite introduction basée sur mes expériences.

Oratrice : Nastasia Saby

Rendez-vous

Voici l’enregistrement du meetup :

Jeudi 3 décembre 2020 – Meetup – Prédiction de classements de courses sportives à partir d’estimations locales

Le Datawok a eu l’opportunité de travailler sur un projet d’aide à la prise de paris sportifs dont l’objectif était d’identifier les favoris et les outsiders d’une course.
Comment ? En prédisant avant chaque course et pour chaque coureur sa probabilité d’arriver à un rang donné.
Pour atteindre cet objectif, nous avions à notre disposition de nombreuses données concernant les coureurs (âge, palmarès, statistiques variées, …), mais aussi sur la course en elle-même (date et heure, température, nature de la piste, …). A l’occasion de ce Meetup, je vous dévoile la méthode mise au point par l’équipe Datawok pour obtenir des scores égalant ceux d’experts en prise de paris.

Intervenant: Daoud Chami, Data Scientist au Datawok, le pôle Data de Linkvalue.

L’évènement aura lieu sur la chaine Twitch de LDS.
https://www.twitch.tv/lyondatascience

Rendez-vous

Voici l’enregistrement du meetup :

Mardi 20 octobre 2020 – Meetup – Les applications du NLP au domaine de l’assurance santé

Ce meet-up sera axé autour d’une problématique d’assurance santé : comment améliorer la connaissance des risques couverts par l’assureur afin de cibler une action de prévention sur la population qui en bénéficiera le plus ? Les prestations santé remboursées par l’assureur santé reflètent partiellement l’historique médical de l’assuré. Ces actes médicaux peuvent être vus comme les mots d’un texte racontant une histoire sur chacun des assurés. Le domaine du text mining peut-il aider dans l’analyse de ces données santé ?

Les travaux présentés ont pour objectif d’utiliser trois méthodes de réduction de dimension issues du domaine de l’analyse du langage (NMF, mSDA et Word2Vec) afin de créer des groupes d’actes de soins. Ces derniers peuvent ensuite être utilisés afin de construire une classification non supervisée des assurés par groupe de risque santé, ce qui facilite le ciblage d’une action de prévention. L’analyse de la stabilité de cette classification sera également évoquée.

L’évènement aura lieu sur Twitch.

https://www.twitch.tv/lyondatascience

Rendez-vous

Lundi 20 juillet 2020 – Meetup – Faut-il faire confiance aux modèles compartimentaux pour l’étude du CoVid?

Ce MeetUp vise à introduire les modèles compartimentaux, très utilisés en épidémiologie. L’accent sera mis sur les modèles en eux mêmes plus que sur leurs résultats : comment sont ils construits ? Quels sont leurs spécificités, avantage et limitations ?

La comparaison détaillée de trois modèles épidémiologiques utilisés par des équipes françaises lors de la crise du CoVid servira à illustrer le propos. La démarche de comparaison des modèles adoptés est une démarche généralisable à l’ensemble de la Data Science, et n’est globalement pas spécifique à l’épidémiologie.

La présentation aura globalement pour vocation de s’adresser à tous, sans forcément de prérequis. Quelques slides nécessiteront un bagage mathématique pour être comprises, mais elles ne seront pas nécessaires pour comprendre l’intuition des modèles (elles ne seront présentes que pour permettre aux slides d’être exhaustives).

Rendez-vous

Mercredi 29 avril 2020 – Meetup – L’Industrialisation des modèles de machine learning via la conteneurisation

What we’ll do

Pour la deuxième session sur Twitch, Lyon Data Science vous propose de s’intéresser à aux sujets de la mise en production et de la conteneurisation en Data Science.

L’industrialisation des modèles de machine learning est une tâche complexe et nécessite souvent l’intervention de plusieurs équipes (dev, devops, architect, data engineer et data scientist). Ainsi, nous vous proposons dans cette session un REX sur une mission d’industrialisation du ML ( Python et R ) via la conteneurisation dans la plateforme Openshift.

Nous aborderons les questions suivantes :

– L’importance de la communication entre les équipes.
– La conteneurisation et le machine learning.
– L’intérêt des pipelines de pré-traitements pour la mise en production des modèles.
– La CI/CD mise en place.
– Le monitoring des modèles et le train automatique via la conteneurisation.

Stack technique :
Openshift, Kubernetes, Docker, Nexus, Gitlab CI/CD, Python, R.

Intervenant : Seif Eddine, Data Scientist chez Ippon Technologies.

Voici l’enregistrement du Meetup :