Mardi 4 juin 2019 – Meetup – Qu’est-ce que l’écologie nous apprend sur la résistance aux antibiotiques?

Pour cette nouvelle séance de Lyon Data Science nous accueillons Julie Shapiro PhD, chercheuse chez l’Institut national de la santé et de la recherche médicale (INSERM).

Les antibiotiques ont transformé la médecine au siècle dernier, mais leur efficacité est à présent menacée par la résistance des bactéries pathogènes. Si nous n’enrayons pas la diffusion des bactéries multirésistantes, elle pourrait nous mener à une ère post-antibiotique dans laquelle le risque d’infection nosocomiale fatale menacerait le bénéfice de pratiques aussi courantes que les chimiothérapies ou les césariennes.

Nos stratégies actuelles contre la résistance, qui cherchent à réduire : 1. l’utilisation des antibiotiques (épargne antibiotique) et 2. la transmission des pathogènes résistants (hygiène hospitalière), ont eu jusqu’à présent un succès limité. Nous avons en effet une compréhension limitée de l’évolution et de la dissémination de la multirésistance ainsi que de la façon dont elle est influencée par l’environnement hospitalier, les stratégies d’épargne antibiotique et l’hygiène hospitalière.

Je montrerai comment les analyses adaptées d’écologie peuvent nous aider à comprendre les facteurs qu’influence la résistance aux antibiotiques dans les hôpitaux et nous permettent de concevoir des stratégies optimales, fondées sur une théorie écologique solide, pour mieux combattre la résistance.

Mardi 14 mai 2019 – Meetup – 7 conseils pour démarrer avec Spark

Après plusieurs sessions orientées Machine Learning, nous vous proposons de revenir un sur de la technique avec un retour d’expérience sur Apache Spark de Nastasia Saby, ingénieure Big Data chez Zenika. Elle passera en revue 7 conseils indispensables pour bien démarrer avec Spark. Au menu de cette session :
– L’utilisation du Spark-Shell.
– Différence entre transformations et actions.
– Apprendre les bases de Scala ?
– Connaître son infra.
– Les RDDs.
– Replonge toi dans le SQL !
– Ne pas abuser des UDFS.
– Les tests en Spark.

A bientôt !

Avec ce retour d’expérience, je vous propose de vous dire ce que j’aurais aimé qu’on me dise avant de me lancer dans Spark. Je promets aussi de vous parler de ce que bien heureusement mes camarades plus expérimentés m’ont aussi donné comme astuces pour m’aider dans ce grand saut. Ce sera donc une entrée en matière dans le monde de Spark au travers de 7 conseils qui m’ont été ou m’auraient été bien pratiques pour démarrer.

Nastasia Saby

Lundi 11 avr 2019 – Meetup – Data for plant science : la donnée au service de l’Ag-tech

L’utilisation des données en Ag-Tech s’intensifie avec de nombreuses sociétés apportant de nouvelles idées au service de l’agriculture.

Cartographie des startup Agritech en France — 2nd édition :
https://medium.com/xangevc/cartographie-des-startup-agritech-en-france-2nd-%C3%A9dition-f92a7c58d61c

Nous vous proposons une plongée dans l’univers des « datasciences au service des plantes » avec la présentation de la start-up valentinoise Carbon Bee. Cette soirée sera l’occasion de vous présenter un travail mené conjointement par Carbon Bee et Bayer sur le thème de la
détection des champignons pathogènes des plantes.

Dans un premier temps, vous découvrirez les résultats d’une étude pilote utilisant l’analyse d’image par Machine Learning pour la quantification de maladies fongiques sur plante.

Puis, nous nous concentrerons sur l’outillage matériel et logiciel employé pour l’acquisition et l’analyse des données, notamment un détecteur innovant combinant différents types d’informations (spatiales et spectrales) et des algorithmes de Deep Learning. En permettant une détection automatique précise des adventices (mauvaises herbes) ou des maladies au champ, cette solution s’inscrit dans une stratégie d’optimisation des intrants et des pratiques agricoles.

Nous serons heureux d’échanger autour du thème de la datascience en agriculture de précision.

Vous pouvez découvrir le capteur et la méthode sur le site de Carbon Bee
(https://carbonbee.fr) ainsi qu’une vidéo sympa illustrant le travail de l’entreprise : https://www.youtube.com/watch?v=tFVWWhhYSzc

Speakers:
Catherine SIRVEN Bayer
Anthony GELIBERT Carbon Bee
Aurélie THEBAULT Carbon Bee AgTech

Lundi 12 mars 2019 – Meetup – Les GANs et leurs applications

Une percée majeure en machine learning est l’apparition récente des réseaux antagonistes génératifs ou en anglais Generatif Adversarial Networks (GANs), qui permet de simuler des données , e.g., visages, pratiquement impossibles de différencier de vraies données. Ses applications sont aussi nombreuses que diversifiées, allant de l’édition de photos jusqu’à la traduction automatique en passant par le transfert de style. Dans cet exposé, Prof. Chen va introduire les principes de base des GANs , en décrire quelques applications , et donner un aperçu de ses derniers travaux, notamment de l’algorithme IVI-GAN, qui permet d’isoler des facteurs de variation dans la génération de données.

Dr. Liming Chen est Professeur à l’Ecole Centrale de Lyon où il mène un groupe de recherche sur la vision par ordinateur, le machine learning et la robotique depuis de nombreuses années. Son groupe a été lauréat des médailles d’or et d’argent du challenge ImageClef sur l’annotation automatique d’images en 2011 et de médaille d’or au challenge Shrec 3D face recognition en 2012. Leurs travaux de recherche ont trouvé de nombreuses applications, e.g., Morphoway, en biométrie pour le portail de passage automatique à l’aéroport, ou encore en bras de manipulation robotique, en partenariat avec des acteurs industriels majeurs.

Références :
– Generative Adversarial Nets, Goodfellow : https://papers.nips.cc/paper/5423-generative-adversarial-nets.pdf

– Conditional Generative Adversarial Nets, Mirza : https://arxiv.org/pdf/1411.1784.pdf

– Intra-class Variation Isolation in Conditional GANs, Chen : https://arxiv.org/pdf/1811.11296.pdf

Lundi 28 fev 2019 – Meetup – What R we doing in cancer research?

For this new session of Lyon Data Science, three cancer researchers from the International Agency for Research on Cancer (IARC) will discuss diverse approaches in studying cancer with applications in R.

First, Dr. Virani will present a surveillance method focused on predictions of cancer incidence trends into the future to determine magnitude and burden over time. Next, Dr. Mariosa will discuss how to use genetic information to identify cancer risk factors using Mendelian randomization. Finally, Dr. Lennon will present examples of determining how different weight trajectories throughout lifetime relate to cancer risk.

This evening is a collaboration of Lyon Data Science with R-Ladies Lyon (https://www.meetup.com/rladies-lyon/). The talks will be held in English.

· Daniela Mariosa

· Hannah Lennon @HannahLenn;
https://www.linkedin.com/in/hlennon/
https://twitter.com/HannahLennon_

· Shama Virani @scisha;
https://www.linkedin.com/in/shamavirani/
https://twitter.com/SciSha

Lundi 21 janv 2019 – Meetup – L’apprentissage par renforcement

Bonjour,

Pour cette nouvelle séance, notre speaker Thibault Neveu, le responsable du HUB IA de l’Epitech Lyon, nous parlera de l’apprentissage par renforcement.

L’apprentissage par renforcement est un des domaines qui a connu un taux de croissance important durant l’année 2018 avec de nombreux succès. Durant la présentation, je parlerai des différentes méthodes utilisés dans l’apprentissage par renforcement ainsi que les principales limites que l’on peut rencontrer. Je présenterai d’intéressant travaux menés pour lever ces problématiques tout en présentant certains cas concrets où le renforcement peut être appliqué. J’évoquerais ensuite les dangers et bénéfices de son application tout en terminant sur les points potentiellement manquants pour se diriger vers une intelligence artificielle générale.

Thibault a une chaîne Youtube, où il donne des cours sur l’IA. https://www.youtube.com/channel/UCVso5UVvQeGAuwbksmA95iA

A très bientôt,

Pour revoir la conférence :

Mardi 4 dec 2018 – Meetup – La data science pour aider le diabète

Pour un diabétique, une hypoglycémie peut avoir des conséquences catastrophiques. Maxime, étudiant en mathématique appliquées, a essayé d’appliquer du Machine Learning pour les anticiper. Après une présentation des données utilisées et des problèmes liés à leurs collecte. Maxime nous présentera un modèle avant de nous faire part des challenges rencontrées lors de la modélisation. Cette présentation s’achèvera avec une ouverture sur comment l’IOT pourrait permettre une grande amélioration dans la gestion du diabète.

Mots Clefs : Diabète, machine learning, régression quantile

A très bientôt,

L’équipe LDS

Lundi 5 Nov 2018 – Meetup – Data Science en production avec R : quels enjeux ? Quelles solutions?

Pour cette nouvelle séance de Lyon Data Science, animée par Colin Fay, Data Scientist & R Hacker chez ThinkR (une agence française spécialisée en Data Science et langage R), nous découvrirons les enjeux de la mise en production avec R.

Comment passer de l’expérimentation en ligne de commande à l’utilisation grande échelle ? Comment faire le pas d’une recherche et développement dans le confort de son ordinateur à un produit utilisé par de nombreux utilisateurs ? Comment partager son travail à ses collaborateurs non initiés ? Comment faire le grand saut de l’industrialisation de la Data Science ?

C’est ce qu’abordera Colin dans ce talk sur R, où il viendra présenter ce langage et quels sont les enjeux d’une mise en production de celui, tant du point de vue utilisateur qu’infrastructure.

Nous aborderons, entre autres, les questions suivantes :
De la ligne de commande à l’interface utilisateur
De la R&D à la mise en production
De la mise en production à l’industrialisation

A très bientôt,

L’équipe LDS

Vous pouvez retrouver les slides de la présentation en cliquant sur le lien suivant : Data_Science_en_production_avec_R

Jeudi 4 Oct 2018 – Meetup – L’analyse de graphes au service de la fiabilisation du réseau basse tension

Intervenants : Thomas Pilaud (Enedis) et Lisa Laisné (Data Scientist, Datalyo)

Cette session sera consacrée à un retour d’expérience Data Science et Machine Learning sur la fiabilisation du réseau basse tension. Seront évoquées les solutions techniques mises en œuvre, les algorithmes implémentés et les aspects métiers relatifs au sujet.

Mots clés : Data Science, Machine Learning, énergie, graphes, réseau, R

Accueil à partir de 18h30 dans la grande salle du Campus Région du Numérique à Confluence.

Vendredi 14 sept 2018 – Meetup – AutoML avec R: le tuning de modèles pour paresseux

Pour cette rentrée, Alex Boulangé, Chief Data Scientist chez Social Intelligence, nous parlera d’un package R qu’il a développé pour pouvoir tuner des réseaux de neurones artificielles avec du biomimétisme (en utilisant notamment l’optimisation par essaims particulaires).

Descriptif du package sur CRAN (actuellement en attente de validation):
« Package to fit highly customizable deep neural network either with
gradient descent or particle swarm optimization, using custom layers
(number, size, activation, dropout), automatic hyper parameters tuning and custom cost function. This package mixes the best of last tricks on deep learning (based on different research papers wrapped up in Andrew NG Deep Learning specialization) and PSO (based on 1995 research paper and following research papers wrapped up in yarpiz
video tutorial).

Key words: autoML, Deep Learning, Particle Swarm Optimization, learning rate, minibatch, batch normalization, lambda, RMSprop, momentum, adam optimization, learning rate decay, particles number, kappa, regression, logistic regression). »

En espérant vous voir nombreux !

L’équipe LDS