Lundi 12 mars 2019 – Meetup – Les GANs et leurs applications

Une percée majeure en machine learning est l’apparition récente des réseaux antagonistes génératifs ou en anglais Generatif Adversarial Networks (GANs), qui permet de simuler des données , e.g., visages, pratiquement impossibles de différencier de vraies données. Ses applications sont aussi nombreuses que diversifiées, allant de l’édition de photos jusqu’à la traduction automatique en passant par le transfert de style. Dans cet exposé, Prof. Chen va introduire les principes de base des GANs , en décrire quelques applications , et donner un aperçu de ses derniers travaux, notamment de l’algorithme IVI-GAN, qui permet d’isoler des facteurs de variation dans la génération de données.

Dr. Liming Chen est Professeur à l’Ecole Centrale de Lyon où il mène un groupe de recherche sur la vision par ordinateur, le machine learning et la robotique depuis de nombreuses années. Son groupe a été lauréat des médailles d’or et d’argent du challenge ImageClef sur l’annotation automatique d’images en 2011 et de médaille d’or au challenge Shrec 3D face recognition en 2012. Leurs travaux de recherche ont trouvé de nombreuses applications, e.g., Morphoway, en biométrie pour le portail de passage automatique à l’aéroport, ou encore en bras de manipulation robotique, en partenariat avec des acteurs industriels majeurs.

Références :
– Generative Adversarial Nets, Goodfellow : https://papers.nips.cc/paper/5423-generative-adversarial-nets.pdf

– Conditional Generative Adversarial Nets, Mirza : https://arxiv.org/pdf/1411.1784.pdf

– Intra-class Variation Isolation in Conditional GANs, Chen : https://arxiv.org/pdf/1811.11296.pdf

Lundi 28 fev 2019 – Meetup – What R we doing in cancer research?

For this new session of Lyon Data Science, three cancer researchers from the International Agency for Research on Cancer (IARC) will discuss diverse approaches in studying cancer with applications in R.

First, Dr. Virani will present a surveillance method focused on predictions of cancer incidence trends into the future to determine magnitude and burden over time. Next, Dr. Mariosa will discuss how to use genetic information to identify cancer risk factors using Mendelian randomization. Finally, Dr. Lennon will present examples of determining how different weight trajectories throughout lifetime relate to cancer risk.

This evening is a collaboration of Lyon Data Science with R-Ladies Lyon (https://www.meetup.com/rladies-lyon/). The talks will be held in English.

· Daniela Mariosa

· Hannah Lennon @HannahLenn;
https://www.linkedin.com/in/hlennon/
https://twitter.com/HannahLennon_

· Shama Virani @scisha;
https://www.linkedin.com/in/shamavirani/
https://twitter.com/SciSha

Lundi 21 janv 2019 – Meetup – L’apprentissage par renforcement

Bonjour,

Pour cette nouvelle séance, notre speaker Thibault Neveu, le responsable du HUB IA de l’Epitech Lyon, nous parlera de l’apprentissage par renforcement.

L’apprentissage par renforcement est un des domaines qui a connu un taux de croissance important durant l’année 2018 avec de nombreux succès. Durant la présentation, je parlerai des différentes méthodes utilisés dans l’apprentissage par renforcement ainsi que les principales limites que l’on peut rencontrer. Je présenterai d’intéressant travaux menés pour lever ces problématiques tout en présentant certains cas concrets où le renforcement peut être appliqué. J’évoquerais ensuite les dangers et bénéfices de son application tout en terminant sur les points potentiellement manquants pour se diriger vers une intelligence artificielle générale.

Thibault a une chaîne Youtube, où il donne des cours sur l’IA. https://www.youtube.com/channel/UCVso5UVvQeGAuwbksmA95iA

A très bientôt,

Pour revoir la conférence :

Mardi 4 dec 2018 – Meetup – La data science pour aider le diabète

Pour un diabétique, une hypoglycémie peut avoir des conséquences catastrophiques. Maxime, étudiant en mathématique appliquées, a essayé d’appliquer du Machine Learning pour les anticiper. Après une présentation des données utilisées et des problèmes liés à leurs collecte. Maxime nous présentera un modèle avant de nous faire part des challenges rencontrées lors de la modélisation. Cette présentation s’achèvera avec une ouverture sur comment l’IOT pourrait permettre une grande amélioration dans la gestion du diabète.

Mots Clefs : Diabète, machine learning, régression quantile

A très bientôt,

L’équipe LDS

Lundi 5 Nov 2018 – Meetup – Data Science en production avec R : quels enjeux ? Quelles solutions?

Pour cette nouvelle séance de Lyon Data Science, animée par Colin Fay, Data Scientist & R Hacker chez ThinkR (une agence française spécialisée en Data Science et langage R), nous découvrirons les enjeux de la mise en production avec R.

Comment passer de l’expérimentation en ligne de commande à l’utilisation grande échelle ? Comment faire le pas d’une recherche et développement dans le confort de son ordinateur à un produit utilisé par de nombreux utilisateurs ? Comment partager son travail à ses collaborateurs non initiés ? Comment faire le grand saut de l’industrialisation de la Data Science ?

C’est ce qu’abordera Colin dans ce talk sur R, où il viendra présenter ce langage et quels sont les enjeux d’une mise en production de celui, tant du point de vue utilisateur qu’infrastructure.

Nous aborderons, entre autres, les questions suivantes :
De la ligne de commande à l’interface utilisateur
De la R&D à la mise en production
De la mise en production à l’industrialisation

A très bientôt,

L’équipe LDS

Vous pouvez retrouver les slides de la présentation en cliquant sur le lien suivant : Data_Science_en_production_avec_R

Jeudi 4 Oct 2018 – Meetup – L’analyse de graphes au service de la fiabilisation du réseau basse tension

Intervenants : Thomas Pilaud (Enedis) et Lisa Laisné (Data Scientist, Datalyo)

Cette session sera consacrée à un retour d’expérience Data Science et Machine Learning sur la fiabilisation du réseau basse tension. Seront évoquées les solutions techniques mises en œuvre, les algorithmes implémentés et les aspects métiers relatifs au sujet.

Mots clés : Data Science, Machine Learning, énergie, graphes, réseau, R

Accueil à partir de 18h30 dans la grande salle du Campus Région du Numérique à Confluence.

Vendredi 14 sept 2018 – Meetup – AutoML avec R: le tuning de modèles pour paresseux

Pour cette rentrée, Alex Boulangé, Chief Data Scientist chez Social Intelligence, nous parlera d’un package R qu’il a développé pour pouvoir tuner des réseaux de neurones artificielles avec du biomimétisme (en utilisant notamment l’optimisation par essaims particulaires).

Descriptif du package sur CRAN (actuellement en attente de validation):
« Package to fit highly customizable deep neural network either with
gradient descent or particle swarm optimization, using custom layers
(number, size, activation, dropout), automatic hyper parameters tuning and custom cost function. This package mixes the best of last tricks on deep learning (based on different research papers wrapped up in Andrew NG Deep Learning specialization) and PSO (based on 1995 research paper and following research papers wrapped up in yarpiz
video tutorial).

Key words: autoML, Deep Learning, Particle Swarm Optimization, learning rate, minibatch, batch normalization, lambda, RMSprop, momentum, adam optimization, learning rate decay, particles number, kappa, regression, logistic regression). »

En espérant vous voir nombreux !

L’équipe LDS

Vendredi 22 juin 2018 – Meetup – Traitement automatique de la Langue et extraction de sentiment: outils et enjeux

Bonjour,

Pour cette nouvelle séance de Lyon Data Science, animée par Catalina Chircu, Data Scientist chez Hardis, en mission chez Lizeo, nous découvrirons des outils pour le traitement de la langue. Nous aurons aussi, après la présentation de Catalina, une présentation rapide d’un outil pour extraire de coordonnées à partir du texte brut, faite par Olivier Courtin de chez Data Pink.

Dans cette conférence, Catalina parlera d’un outil d’extraction de sens à partir du texte, et de ce que le data mining dans le cadre du traitement du texte implique, de manière générale. Elle présentera d’abord l’outil pour l’annotation automatique qu’elle a créé au sein de l’équipe R&D de Lizéo. Ensuite, elle fera quelques remarques sur les enjeux du data mining / apprentissage automatique, ainsi que sur les difficultés rencontrées et les divers choix qu’elle a faits.

Olivier Courtin, pour sa part, nous parlera de comment, à partir des outils et méthodes NLP actuels, extraire des lemmes se référant à une spatialisation, et les appareiller à une base toponymique pour en récupérer leur géolocalisation. Ou dit autrement, donne moi du texte et je te donnerai des coordonnées GPS.

A très bientôt,

L´équipe LDS

Mercredi 23 mai 2018 – Meetup – Introduction au Machine Learning avec Spark 2.x et Scala

Bonjour à tous,

Dans cette session je vous propose de partir à la découverte des fonctionnalités de Spark 2 et du langage Scala, avec notamment :

– Une présentation des concepts clés de Spark Core & Spark ML (DataFrame / Dataset, Pipelines, Transformers, Estimators, etc…)
– Un tour d’horizon des différentes librairies de ML et de traitement de données disponibles dans l’écosystème Spark / Scala.
– Le tout associé à quelques démos ‘live’ de quelques cas pratiques (clustering, régression, etc …) sur de gros volumes de données avec notre datalake.

Cette séance sera animée par Jean-Yves Besson de chez Lizeo,

A très bientôt,

L’équipe LDS

Jeudi 12 avril 2018 – Meetup – Incertitude : source de fiabilité

Bonjour,

Nous sommes ravis de vous proposer une séance sur l’incertitude et la confiance des modèles de Machine Learning, animée par Samy Melaine de Data Genius.

Avec les progrès récents sur les techniques de Machine Learning et les résultats qu’ils apportent, des systèmes qui jusqu’à récemment n’étaient appliqués qu’à des données académiques sont maintenant déployés dans des environnements réels pour des applications commerciales. Dans ces cas, si les systèmes implémentés ne sont pas fiables et génèrent des prédictions fausses sans que cela ne puisse être détecté, des conséquences graves sont à prévoir. Pour palier à cela il est donc important de mettre en production un modèle qui « sait ce qu’il ne sait pas ». Ensemble et durant ce Meetup nous allons :

– Définir concrètement ce qu’est ce concept d’incertitude et ce que cela n’est pas (beware of softmax)

– Comment on peut entraîner des modèles (réseaux de neurones ou ensemblistes) à ressortir des valeurs de confiance fiables

– Et enfin, revoir des techniques qui permettent de (ou se rapprochent d’) expliquer les prédictions d’un modèle de ML et ce qu’il a appris.

A très bientôt,

L’équipe de Lyon Data Science