Mardi 19 novembre 2019 – Meetup – Deep learning pour l’industrie : un cas d’usage chez Enedis

La session sera consacrée à un retour d’expérience autour du Deep Learning sur la détection automatique de pannes sur le réseau électrique aérien d’Enedis.

Christophe Gay, Data Scientist chez Enedis, et Quentin Fresnel, Data Scientist chez Datalyo, évoqueront les solutions techniques mises en œuvre, les algorithmes implémentés et les aspects métiers relatifs au sujet.

Mardi 15 octobre 2019 – Meetup – Présentation de Sagemaker: plateforme ML d’AWS

Au travers de ce meetup, nous vous proposons de vous présenter la plateforme de Cloud Computing Amazon Web Services (AWS) et détailler plus spécifiquement le service Sagemaker qui permet de réaliser vos travaux de Machine Learning & Deep Learning.

Au menu de cette session :
– Introduction au Cloud Computing et aux différentes briques au travers d’AWS
– Dive Deep sur Amazon Sagemaker au travers d’un cas concret

Ce meetup sera animé par Damien PEELMAN (Ingénieur Machine Learning) et Arnaud JEAN (Data Architect), 2 féru de Data & Analytics au sein du groupe TeamWork.

Mardi 10 septembre 2019 – Meetup – L’importance de la normalisation en analyse de données

Pré-requis : statistiques descriptives (moyenne, variance, z-score, médiane, distributions, Gausienne, etc)

L’analyse de données est une tâche complexe, composée de multiples étapes successives : lecture des données, pré-traitements, extraction des caractéristiques, modélisation des caractéristiques et évaluation. La normalisation des données semble appartenir majoritairement à l’étape de pré-traitements, ce qui est faux, puisqu’on peut la retrouver aussi dans des tâches haut niveau comme la détection d’anomalies, l’apprentissage automatique, l’apprentissage profond, les tests statistiques, etc. De plus, l’étape de pré-traitements est souvent vue comme contraignante et peu valorisante. Il n’en est rien, car en réalité, c’est ici que se joue une grande part de l’efficacité de toute la chaine de traitements. La valeur ajoutée du data scientist est rarement dans l’étape maSuperMethode.apply(), mais plus souvent dans la manière de présenter les données à cette méthode.
Dans cet exposé, nous verrons dans un premier temps l’intérêt de la normalisation, puis les différentes manières de normaliser, et enfin les applications.

Quentin Barthélemy

Vous avez accès aux slides à partir du lien suivant : http://www.slideshare.net/secret/qej6iuFlYu1gna

Mardi 4 juin 2019 – Meetup – Qu’est-ce que l’écologie nous apprend sur la résistance aux antibiotiques?

Pour cette nouvelle séance de Lyon Data Science nous accueillons Julie Shapiro PhD, chercheuse chez l’Institut national de la santé et de la recherche médicale (INSERM).

Les antibiotiques ont transformé la médecine au siècle dernier, mais leur efficacité est à présent menacée par la résistance des bactéries pathogènes. Si nous n’enrayons pas la diffusion des bactéries multirésistantes, elle pourrait nous mener à une ère post-antibiotique dans laquelle le risque d’infection nosocomiale fatale menacerait le bénéfice de pratiques aussi courantes que les chimiothérapies ou les césariennes.

Nos stratégies actuelles contre la résistance, qui cherchent à réduire : 1. l’utilisation des antibiotiques (épargne antibiotique) et 2. la transmission des pathogènes résistants (hygiène hospitalière), ont eu jusqu’à présent un succès limité. Nous avons en effet une compréhension limitée de l’évolution et de la dissémination de la multirésistance ainsi que de la façon dont elle est influencée par l’environnement hospitalier, les stratégies d’épargne antibiotique et l’hygiène hospitalière.

Je montrerai comment les analyses adaptées d’écologie peuvent nous aider à comprendre les facteurs qu’influence la résistance aux antibiotiques dans les hôpitaux et nous permettent de concevoir des stratégies optimales, fondées sur une théorie écologique solide, pour mieux combattre la résistance.

Mardi 14 mai 2019 – Meetup – 7 conseils pour démarrer avec Spark

Après plusieurs sessions orientées Machine Learning, nous vous proposons de revenir un sur de la technique avec un retour d’expérience sur Apache Spark de Nastasia Saby, ingénieure Big Data chez Zenika. Elle passera en revue 7 conseils indispensables pour bien démarrer avec Spark. Au menu de cette session :
– L’utilisation du Spark-Shell.
– Différence entre transformations et actions.
– Apprendre les bases de Scala ?
– Connaître son infra.
– Les RDDs.
– Replonge toi dans le SQL !
– Ne pas abuser des UDFS.
– Les tests en Spark.

A bientôt !

Avec ce retour d’expérience, je vous propose de vous dire ce que j’aurais aimé qu’on me dise avant de me lancer dans Spark. Je promets aussi de vous parler de ce que bien heureusement mes camarades plus expérimentés m’ont aussi donné comme astuces pour m’aider dans ce grand saut. Ce sera donc une entrée en matière dans le monde de Spark au travers de 7 conseils qui m’ont été ou m’auraient été bien pratiques pour démarrer.

Nastasia Saby

Lundi 11 avr 2019 – Meetup – Data for plant science : la donnée au service de l’Ag-tech

L’utilisation des données en Ag-Tech s’intensifie avec de nombreuses sociétés apportant de nouvelles idées au service de l’agriculture.

Cartographie des startup Agritech en France — 2nd édition :
https://medium.com/xangevc/cartographie-des-startup-agritech-en-france-2nd-%C3%A9dition-f92a7c58d61c

Nous vous proposons une plongée dans l’univers des « datasciences au service des plantes » avec la présentation de la start-up valentinoise Carbon Bee. Cette soirée sera l’occasion de vous présenter un travail mené conjointement par Carbon Bee et Bayer sur le thème de la
détection des champignons pathogènes des plantes.

Dans un premier temps, vous découvrirez les résultats d’une étude pilote utilisant l’analyse d’image par Machine Learning pour la quantification de maladies fongiques sur plante.

Puis, nous nous concentrerons sur l’outillage matériel et logiciel employé pour l’acquisition et l’analyse des données, notamment un détecteur innovant combinant différents types d’informations (spatiales et spectrales) et des algorithmes de Deep Learning. En permettant une détection automatique précise des adventices (mauvaises herbes) ou des maladies au champ, cette solution s’inscrit dans une stratégie d’optimisation des intrants et des pratiques agricoles.

Nous serons heureux d’échanger autour du thème de la datascience en agriculture de précision.

Vous pouvez découvrir le capteur et la méthode sur le site de Carbon Bee
(https://carbonbee.fr) ainsi qu’une vidéo sympa illustrant le travail de l’entreprise : https://www.youtube.com/watch?v=tFVWWhhYSzc

Speakers:
Catherine SIRVEN Bayer
Anthony GELIBERT Carbon Bee
Aurélie THEBAULT Carbon Bee AgTech

Lundi 12 mars 2019 – Meetup – Les GANs et leurs applications

Une percée majeure en machine learning est l’apparition récente des réseaux antagonistes génératifs ou en anglais Generatif Adversarial Networks (GANs), qui permet de simuler des données , e.g., visages, pratiquement impossibles de différencier de vraies données. Ses applications sont aussi nombreuses que diversifiées, allant de l’édition de photos jusqu’à la traduction automatique en passant par le transfert de style. Dans cet exposé, Prof. Chen va introduire les principes de base des GANs , en décrire quelques applications , et donner un aperçu de ses derniers travaux, notamment de l’algorithme IVI-GAN, qui permet d’isoler des facteurs de variation dans la génération de données.

Dr. Liming Chen est Professeur à l’Ecole Centrale de Lyon où il mène un groupe de recherche sur la vision par ordinateur, le machine learning et la robotique depuis de nombreuses années. Son groupe a été lauréat des médailles d’or et d’argent du challenge ImageClef sur l’annotation automatique d’images en 2011 et de médaille d’or au challenge Shrec 3D face recognition en 2012. Leurs travaux de recherche ont trouvé de nombreuses applications, e.g., Morphoway, en biométrie pour le portail de passage automatique à l’aéroport, ou encore en bras de manipulation robotique, en partenariat avec des acteurs industriels majeurs.

Références :
– Generative Adversarial Nets, Goodfellow : https://papers.nips.cc/paper/5423-generative-adversarial-nets.pdf

– Conditional Generative Adversarial Nets, Mirza : https://arxiv.org/pdf/1411.1784.pdf

– Intra-class Variation Isolation in Conditional GANs, Chen : https://arxiv.org/pdf/1811.11296.pdf

Lundi 28 fev 2019 – Meetup – What R we doing in cancer research?

For this new session of Lyon Data Science, three cancer researchers from the International Agency for Research on Cancer (IARC) will discuss diverse approaches in studying cancer with applications in R.

First, Dr. Virani will present a surveillance method focused on predictions of cancer incidence trends into the future to determine magnitude and burden over time. Next, Dr. Mariosa will discuss how to use genetic information to identify cancer risk factors using Mendelian randomization. Finally, Dr. Lennon will present examples of determining how different weight trajectories throughout lifetime relate to cancer risk.

This evening is a collaboration of Lyon Data Science with R-Ladies Lyon (https://www.meetup.com/rladies-lyon/). The talks will be held in English.

· Daniela Mariosa

· Hannah Lennon @HannahLenn;
https://www.linkedin.com/in/hlennon/
https://twitter.com/HannahLennon_

· Shama Virani @scisha;
https://www.linkedin.com/in/shamavirani/
https://twitter.com/SciSha

Lundi 21 janv 2019 – Meetup – L’apprentissage par renforcement

Bonjour,

Pour cette nouvelle séance, notre speaker Thibault Neveu, le responsable du HUB IA de l’Epitech Lyon, nous parlera de l’apprentissage par renforcement.

L’apprentissage par renforcement est un des domaines qui a connu un taux de croissance important durant l’année 2018 avec de nombreux succès. Durant la présentation, je parlerai des différentes méthodes utilisés dans l’apprentissage par renforcement ainsi que les principales limites que l’on peut rencontrer. Je présenterai d’intéressant travaux menés pour lever ces problématiques tout en présentant certains cas concrets où le renforcement peut être appliqué. J’évoquerais ensuite les dangers et bénéfices de son application tout en terminant sur les points potentiellement manquants pour se diriger vers une intelligence artificielle générale.

Thibault a une chaîne Youtube, où il donne des cours sur l’IA. https://www.youtube.com/channel/UCVso5UVvQeGAuwbksmA95iA

A très bientôt,

Pour revoir la conférence :

Mardi 4 dec 2018 – Meetup – La data science pour aider le diabète

Pour un diabétique, une hypoglycémie peut avoir des conséquences catastrophiques. Maxime, étudiant en mathématique appliquées, a essayé d’appliquer du Machine Learning pour les anticiper. Après une présentation des données utilisées et des problèmes liés à leurs collecte. Maxime nous présentera un modèle avant de nous faire part des challenges rencontrées lors de la modélisation. Cette présentation s’achèvera avec une ouverture sur comment l’IOT pourrait permettre une grande amélioration dans la gestion du diabète.

Mots Clefs : Diabète, machine learning, régression quantile

A très bientôt,

L’équipe LDS