Jeudi 9 juin 2016 – Meetup – Quelles évolutions dans la recherche documentaire ?

La recherche d’information dans de vastes corpus documentaires, composés de documents issus de silos hétérogènes, a bénéficié ces dernières années de nombreux apports à la fois méthodologiques et technologiques :

Grâce aux approches et aux standards du web des données, improprement appelé web sémantique, il est possible de relier des documents via leurs métadonnées, après les avoir si nécessaire normalisées voire améliorées.

Et avec les progrès de l’intelligence artificielle et notamment du machine learning, des outils facilitant l’extraction des entités nommées, la classification automatique, la clusterisation dynamique sont désormais disponibles pour enrichir les corpus documentaires et en accroître la valeur.

Retours d’expérience sur des projets menés chez LexisNexis France, le CNRS, le Centre d’Accès à l’Information Juridique du Québec…

Présentateur : Pierre Col – Antidot

Mercredi 27 avril 2016 – Meetup – Data Vodka

Les beaux jours sont de retour, quoi de mieux que de siroter un bloody mary en discutant data avec des passionnés ?

Lyon Data Science vous propose son premier Data Vodka. Comme son nom l’indique (ou pas…?), il ne s’agit pas d’un atelier tuning d’algorithmes sur des bases de données de plusieurs Tera mais plutôt une occasion d’échanger sans prise de tête sur les différents domaines de la data science et du big data.

Vendredi 15 avril 2016 – Meetup – Data Scientist: Codeur ou Matheux?

Data Scientist, Codeur ou Matheux? par Fabien Cellier, Data Scientist, Dascils

Pour pouvoir accueillir plus de participants, cet évènement ce déroulera dans l’amphithéâtre Epitech / ISEG au 86 Boulevard Marius Vivier Merle, 69003 Lyon. L’entrée principale est fermée quelques minutes après 19 h, alors passez la porte avant 19h 🙂

Avoir de la data, c’est bien, pouvoir l’exploiter et le faire bien c’est encore mieux!

Au cours de cette présentation nous allons voir quelques démarches et étapes de l’analyse de données.

Doit-on être un expert en statistiques pour l’analyse? Quelles sont les bases mathématiques nécessaires? Existe t-il des méthodes de machine learning type boîte noire qui ne nécessitent aucune intervention humaine? Quelles sont les démarches à suivre pour quel type de donnée?

Nous verrons comment le problème est étudié par le statisticien puis par le codeur, et le danger de chacune de ces démarches.

En se basant sur le profil des personnes présentent lors des meetups précédents, cette présentation passera un peu plus de temps sur les notions de bases mathématiques que sur les bases du développement informatique.

Pour accéder aux slides de la présentation, cliquer sur le lien suivant : présentation

Jeudi 3 mars 2016 – Meetup – Retour d’expérience Data Science

Retour d’expérience Data Science : par Gaëtan Constant, Data Scientist chez Datalyo

Retour d’expérience sur une mission Data Science pour un grand compte de l’industrie de notre région. Présentation des différents résultats sur les thématiques suivantes :

• analyses de détection de fraudes ;recherche de facteurs influents sur les défauts des produits ;optimisation de stocks.

• Présentation des technologies utilisées (outils de Data Science, de DataViz, ETL) ainsi que des méthodes mathématiques utilisées (modèles prédictifs et analyses statistiques).

Pré-requis:

La présentation sera interactive et ne nécessitera pas de compétences techniques préalables. Les aspects métiers seront simples et détaillés afin que chacun puisse interagir.

Cela sera donc l’occasion de pouvoir échanger sur les bonnes pratiques d’une étude Data Science et des enjeux Business qui peuvent se cacher derrière les données d’entreprises.

L’équipe Lyon Data Science

Jeudi 11 février 2016 – Meetup – La (data) science de la dataviz

La (data) science de la dataviz: par Romain Vuillemot

« Je présenterai les différents rôles de la visualisation de données (dataviz) dans le contexte de la data science. A la fois au niveau exploratoire (caractérisation d’un jeu de données), mais aussi pour les étapes telles que le nettoyage et la communication visuelle de résultats (storytelling).

Je présenterai ensuite, les principes de bases d’une visualisation interactive efficace telle que définie par les principaux influenceurs du domaine (Tufte, Wilkinson, Shneiderman). Je ferai aussi un panorama des outils existants, depuis les bibliothèques intégrées (matplotlib/seaborn), indépendantes (Plot.ly, Highchart) et des outils comme Tableau. J’introduirai D3,js, ses exemples emblématiques ( http://bl.ocks.org/ ) et ceux du NyTimes, FiveThirtyEight, et Bloomberg. »

Pré-requis:

La présentation ne nécessite pas de compétences techniques préalables et sera très interactive. Même si beaucoup d’outils et d’exemples seront en JavaScript/Python, les principes introduits et discutés restent agnostiques et reproductibles avec tout type d’outil de R à Excel.

L’équipe Lyon Data Science

Pour accéder aux slides de la présentation, cliquer sur le lien suivant : présentation

Jeudi 7 janvier 2016 – MeetUp – Construire un modèle de prédiction avec AWS Redshift et Amazon Machine Learning

Intervenant: Julien SIMON, Technical Evangelist, Amazon Web Services.

Après un bref panorama des technos Data disponibles sur AWS, nous débuterons l’intervention par la construction d’un data warehouse avec AWS Redshift, qui sera ensuite alimenté depuis AWS S3 et à partir duquel nous exécuterons quelques requêtes SQL.

Deux points importants seront abordés pour la performance de Redshift : le choix des clés et la distribution des données entre les noeuds.

Toujours à partir de Redshift, nous vous proposerons de construire un modèle de prédiction grâce à Amazon Machine Learning. Une API de prédiction sera également mise en place et invoquée depuis une application Java.

L’intervention se terminera par une présentation rapide de nos architectures de référence, et de quelques cas d’utilisations clients.

Pré-requis:

Aucun sur AWS.

Connaissances de base sur SQL, Java et la régression linéaire.

Les débutants sont les bienvenus !

Réseautage à votre guise.

L’équipe Lyon Data Science

Pour accéder aux slides de la présentation, cliquez sur le lien suivant : présentation

 

Jeudi 12 novembre 2015 – MeetUp -Data sources : where do I get and store my data?

Présentation du TUBA

20 mn : Le TUBA qui nous accueille nous présentera ses activités autour des datasciences/données.

Data sources : where do I get and store my data? par Fanilo

30/40 mn : « Lorsque nous évoquons le poste de Data Scientist, nous pensons instantanément aux statistiques, à l’apprentissage machine, aux prédictions qu’il fait, à ses qualités d’analyse de données hétérogènes provenant de sources multiples. Nous prenons moins souvent en compte le travail de collecte et de stockage des données avant analyse, et du fait que le Data Scientist doit être capable de travailler avec une multitude de référentiels de données pour arriver à ses fins. Dans cette présentation, nous ferons un point rapide sur les formats de fichier, les bases SQL et NoSQL, les particularités de système de fichiers distribués comme Hadoop, et les différentes sources de données accessibles sur le net. En sortant de cette présentation, le Data Scientist amateur aura une vue d’ensemble des solutions pour la collecte et le stockage de la donnée ».

Réseautage à votre guise.

L’équipe Lyon Data Science

Télécharger le diaporama ici.

Jeudi 1 octobre 2015 – MeetUp – Introduction aux data sciences et machines learning

Cette session d’initiation sera composée de :

• Introduction aux data science (20 minutes) + Questions et réponses

• Introduction aux machine learning (20 minutes) + Questions et réponses

Ce groupe vient de naitre et pour l’instant nous n’avons pas créé d’association. Nous ne pourrons donc pas vous proposer une collation en fin de soirée.

Devant le nombre d’inscrits nous devons changer de lieu et l’école Supinfo a répondu positivement à notre appel.

http://www.supinfo.com/en/lyon/ La station Laennec est la plus simple pour ceux qui ne connaissent pas le lieu. A cette heure, il devrait avoir la possibilité de se garer en voiture dans le quartier.

L’équipe Lyon Data Science.

Accéder ici au diaporama sur l’introduction à la Data Science.

Accéder ici au diaporama sur l’introduction au Machine Learning.

Accéder au diaporama de l’atelier Data science-appliquée.

Jeudi 3 septembre 2015 – MeetUp – Quelles sont vos attentes du groupe Lyon Data Science?

Nous avons tous de plus en plus besoin de donner du sens aux Giga de données que nous stockons sur nos systèmes. La plupart de nous se sont essayés aux statistiques, mais souvent leurs cotés trop abstraits nous en a éloigné.

Depuis au moins dix ans nous voyons apparaitre des outils/langages qui permettent de faire des recherches, extraire des tendances de ces puits de données. Ainsi, ce domaine de data science devient plus ludique.

Nous vous proposons de faire un premier meetup, pour discuter de nos attentes (big data, data science, graph, visualisation, data mining, analyse sources données publiques, data journalisme, vie privée, marketing, etc. ), envies de progresser sur ce sujet et voir ce que nous pourrions construire autour de cette discipline.

Nous nous retrouverons à l’Antre Autre.
Comme ils nous laissent la salle gratuitement, chacun devra prendre son verre lui même. Ils ne prennent que du liquide.

Pour plus de détails, voir http://bit.ly/lyondatascience

L’équipe Lyon Data Science

Pour accéder aux slides de présentations, cliquez ici :
Introduction à la Data Science
Introduction Machine Learning