Jeudi 3 mars 2016 – Meetup – Retour d’expérience Data Science

Retour d’expérience Data Science : par Gaëtan Constant, Data Scientist chez Datalyo

Retour d’expérience sur une mission Data Science pour un grand compte de l’industrie de notre région. Présentation des différents résultats sur les thématiques suivantes :

• analyses de détection de fraudes ;recherche de facteurs influents sur les défauts des produits ;optimisation de stocks.

• Présentation des technologies utilisées (outils de Data Science, de DataViz, ETL) ainsi que des méthodes mathématiques utilisées (modèles prédictifs et analyses statistiques).

Pré-requis:

La présentation sera interactive et ne nécessitera pas de compétences techniques préalables. Les aspects métiers seront simples et détaillés afin que chacun puisse interagir.

Cela sera donc l’occasion de pouvoir échanger sur les bonnes pratiques d’une étude Data Science et des enjeux Business qui peuvent se cacher derrière les données d’entreprises.

L’équipe Lyon Data Science

Jeudi 11 février 2016 – Meetup – La (data) science de la dataviz

La (data) science de la dataviz: par Romain Vuillemot

« Je présenterai les différents rôles de la visualisation de données (dataviz) dans le contexte de la data science. A la fois au niveau exploratoire (caractérisation d’un jeu de données), mais aussi pour les étapes telles que le nettoyage et la communication visuelle de résultats (storytelling).

Je présenterai ensuite, les principes de bases d’une visualisation interactive efficace telle que définie par les principaux influenceurs du domaine (Tufte, Wilkinson, Shneiderman). Je ferai aussi un panorama des outils existants, depuis les bibliothèques intégrées (matplotlib/seaborn), indépendantes (Plot.ly, Highchart) et des outils comme Tableau. J’introduirai D3,js, ses exemples emblématiques ( http://bl.ocks.org/ ) et ceux du NyTimes, FiveThirtyEight, et Bloomberg. »

Pré-requis:

La présentation ne nécessite pas de compétences techniques préalables et sera très interactive. Même si beaucoup d’outils et d’exemples seront en JavaScript/Python, les principes introduits et discutés restent agnostiques et reproductibles avec tout type d’outil de R à Excel.

L’équipe Lyon Data Science

Pour accéder aux slides de la présentation, cliquer sur le lien suivant : présentation

Jeudi 7 janvier 2016 – MeetUp – Construire un modèle de prédiction avec AWS Redshift et Amazon Machine Learning

Intervenant: Julien SIMON, Technical Evangelist, Amazon Web Services.

Après un bref panorama des technos Data disponibles sur AWS, nous débuterons l’intervention par la construction d’un data warehouse avec AWS Redshift, qui sera ensuite alimenté depuis AWS S3 et à partir duquel nous exécuterons quelques requêtes SQL.

Deux points importants seront abordés pour la performance de Redshift : le choix des clés et la distribution des données entre les noeuds.

Toujours à partir de Redshift, nous vous proposerons de construire un modèle de prédiction grâce à Amazon Machine Learning. Une API de prédiction sera également mise en place et invoquée depuis une application Java.

L’intervention se terminera par une présentation rapide de nos architectures de référence, et de quelques cas d’utilisations clients.

Pré-requis:

Aucun sur AWS.

Connaissances de base sur SQL, Java et la régression linéaire.

Les débutants sont les bienvenus !

Réseautage à votre guise.

L’équipe Lyon Data Science

Pour accéder aux slides de la présentation, cliquez sur le lien suivant : présentation

 

Jeudi 12 novembre 2015 – MeetUp -Data sources : where do I get and store my data?

Présentation du TUBA

20 mn : Le TUBA qui nous accueille nous présentera ses activités autour des datasciences/données.

Data sources : where do I get and store my data? par Fanilo

30/40 mn : « Lorsque nous évoquons le poste de Data Scientist, nous pensons instantanément aux statistiques, à l’apprentissage machine, aux prédictions qu’il fait, à ses qualités d’analyse de données hétérogènes provenant de sources multiples. Nous prenons moins souvent en compte le travail de collecte et de stockage des données avant analyse, et du fait que le Data Scientist doit être capable de travailler avec une multitude de référentiels de données pour arriver à ses fins. Dans cette présentation, nous ferons un point rapide sur les formats de fichier, les bases SQL et NoSQL, les particularités de système de fichiers distribués comme Hadoop, et les différentes sources de données accessibles sur le net. En sortant de cette présentation, le Data Scientist amateur aura une vue d’ensemble des solutions pour la collecte et le stockage de la donnée ».

Réseautage à votre guise.

L’équipe Lyon Data Science

Télécharger le diaporama ici.

Jeudi 1 octobre 2015 – MeetUp – Introduction aux data sciences et machines learning

Cette session d’initiation sera composée de :

• Introduction aux data science (20 minutes) + Questions et réponses

• Introduction aux machine learning (20 minutes) + Questions et réponses

Ce groupe vient de naitre et pour l’instant nous n’avons pas créé d’association. Nous ne pourrons donc pas vous proposer une collation en fin de soirée.

Devant le nombre d’inscrits nous devons changer de lieu et l’école Supinfo a répondu positivement à notre appel.

http://www.supinfo.com/en/lyon/ La station Laennec est la plus simple pour ceux qui ne connaissent pas le lieu. A cette heure, il devrait avoir la possibilité de se garer en voiture dans le quartier.

L’équipe Lyon Data Science.

Accéder ici au diaporama sur l’introduction à la Data Science.

Accéder ici au diaporama sur l’introduction au Machine Learning.

Accéder au diaporama de l’atelier Data science-appliquée.

Jeudi 3 septembre 2015 – MeetUp – Quelles sont vos attentes du groupe Lyon Data Science?

Nous avons tous de plus en plus besoin de donner du sens aux Giga de données que nous stockons sur nos systèmes. La plupart de nous se sont essayés aux statistiques, mais souvent leurs cotés trop abstraits nous en a éloigné.

Depuis au moins dix ans nous voyons apparaitre des outils/langages qui permettent de faire des recherches, extraire des tendances de ces puits de données. Ainsi, ce domaine de data science devient plus ludique.

Nous vous proposons de faire un premier meetup, pour discuter de nos attentes (big data, data science, graph, visualisation, data mining, analyse sources données publiques, data journalisme, vie privée, marketing, etc. ), envies de progresser sur ce sujet et voir ce que nous pourrions construire autour de cette discipline.

Nous nous retrouverons à l’Antre Autre.
Comme ils nous laissent la salle gratuitement, chacun devra prendre son verre lui même. Ils ne prennent que du liquide.

Pour plus de détails, voir http://bit.ly/lyondatascience

L’équipe Lyon Data Science

Pour accéder aux slides de présentations, cliquez ici :
Introduction à la Data Science
Introduction Machine Learning