Jeudi 23 février 2017 – Meetup – Tour d’horizon des solutions pour créer un data lake directement dans le cloud

Salut les data passionnés,

Après quelques sessions orientées recherche, nous vous proposons une session data lake.

N’oubliez pas d’arriver avant 19h car la porte d’accès du bâtiment est fermée à 19h. <- si vraiment 🙂

Tour d’horizon des solutions de data lake directement dans le cloud: La mise en place de serveur pour un datalake est coûteux, que ce soit en terme d’infrastructure ou même de compétence pour l’exploitation. Afin d’offrir les capacité d’analyse au plus grands nombre, les géants du web mettent à dispositions des solutions « hadoop as service ». Durant cette présentation nous ferons un point rapide sur l’existant puis nous partagerons l’avis d’un datascientiste sur le sujet et les avantages ainsi que les manques actuelles de ces solutions.

L’équipe LDS.

Jeudi 19 janvier 2017 – Meetup – Apprentissage supervisé et fonctions coût

Bonne année chers data passionnés et meilleurs voeux à tous! Pour commencer 2017 nous vous proposons une intervention détaillée sur les fonctions coûts en apprentissage supervisé.

Intervenant : Maxime Gasse, doctorant au LIRIS (équipe DM2L)

Prérequis : quelques bases de machine learning, optimisation, probabilités.

Résumé : Après quelques rappels de base sur l’apprentissage supervisé (minimisation de risque et fonctions coût), nous étudierons l’impact de différentes fonctions coût en régression standard (normes L2, L1, L0), en classification multi-label (hamming loss, 0/1 loss, F-loss), puis en régression multi-output (normes L2^2, L1^1, L2^1).

Jeudi 1er décembre 2016 – Meetup – Présentation de Dataiku DSS

Startup parisienne créée en 2013, Dataïku est un acteur majeur de la Data Science en France.

Dataïku DSS est une plateforme qui facilite et accélère l’analyse de données et la création d’applications business et prédictives en environnement Big Data.

Pour le dernier meetup de l’année, Matthieu Scordia, data scientist chez Dataïku nous présentera cette solution Made in France !

La session étant à 20h00, il est probable que nous entrerons par la porte en fer grise qui se trouve 50 m à gauche de l’entrée principale.

A bientôt 😉

Mercredi 16 novembre 2016 – Meetup – Atelier Metabase – Explorez vos données !

LDS vous propose un atelier sur Metabase (http://www.metabase.com/), une application open source qui facilite la création de dashboards pour présenter vos données de façons élégantes !

Notre intervenant, Gabriel Pillet (https://twitter.com/tentacode), présentera succinctement l’outil et une fois Metabase installé, ca sera à vous de jouer !
N’hésitez pas à ramener vos propres jeux de données, si vous en avez pas sous la main, Gabriel se fera un plaisir de vous fournir ses données sur les chatons 😉

Prérequis : Cet atelier est à destination des développeurs (débutants à confirmés).

Jeudi 13 octobre 2016 – Meetup – Introduction au deep learning (apprentissage profond) avec Mathieu Lefort

Mathieu Lefort

Introduction au deep learning (apprentissage profond)

Niveau : Débutant / Intermédiaire

Prérequis : Algèbre linéaire, optimisation, bases du ML

Si 2013 et 2014 ont été les années de la Data Science et du Big Data, 2015 et 2016 ont assurément été marquées par le Deep Learning (jeu de Go, voitures autonomes, bibliothèques open source telles TensorFlow et CNTK, etc…). Mais que se cache-t-il derrière tout ce buzz ?

Mathieu Lefort, maître de conférence à l’Université Lyon 1 va mettre en lumière les différents concepts de l’apprentissage profond du modèle Perceptron classique aux réseaux convolutionnels.

L’équipe Lyon Data Science

Vous pouvez accéder aux slides de la présentation, en cliquant sur le lien suivant : deep_learning

Jeudi 22 septembre 2016 – Meetup – Objectifs de l’année, Introduction aux concepts Data Science et ML, Démo outils

3 speakers : Anil, Fanilo, Fabien

Niveau : Débutant

La première année de notre association a été pour nous l’occasion de vous proposer des sessions mensuelles sur des sujets d’initiation au machine learning, au traitement des données et aux problématiques générales de la data science. Suite au succès de ces meetups, nous aimerions passer la vitesse supérieure et commencer à aborder des sujets plus pointus ! Pour celles et ceux qui n’ont pas révisé leur gradient descendant et leur MapReduce pendant les vacances, nous vous proposons une dernière session de rattrapage :

• Présentation de l’association, des nouvelles activités à venir et des projets que nous aimerions réaliser.

• Fondamentaux de la data science, du machine learning et des big data.

• Avant goût des algorithmes / méthodes / technos que nous allons étudier cette année : comment créer un classifieur sur scikit-learn, traiter ses données avec pandas et numpy, text mining, deep learning avec Keras et TensorFlow, etc…

Jeudi 9 juin 2016 – Meetup – Quelles évolutions dans la recherche documentaire ?

La recherche d’information dans de vastes corpus documentaires, composés de documents issus de silos hétérogènes, a bénéficié ces dernières années de nombreux apports à la fois méthodologiques et technologiques :

Grâce aux approches et aux standards du web des données, improprement appelé web sémantique, il est possible de relier des documents via leurs métadonnées, après les avoir si nécessaire normalisées voire améliorées.

Et avec les progrès de l’intelligence artificielle et notamment du machine learning, des outils facilitant l’extraction des entités nommées, la classification automatique, la clusterisation dynamique sont désormais disponibles pour enrichir les corpus documentaires et en accroître la valeur.

Retours d’expérience sur des projets menés chez LexisNexis France, le CNRS, le Centre d’Accès à l’Information Juridique du Québec…

Présentateur : Pierre Col – Antidot

Mercredi 27 avril 2016 – Meetup – Data Vodka

Les beaux jours sont de retour, quoi de mieux que de siroter un bloody mary en discutant data avec des passionnés ?

Lyon Data Science vous propose son premier Data Vodka. Comme son nom l’indique (ou pas…?), il ne s’agit pas d’un atelier tuning d’algorithmes sur des bases de données de plusieurs Tera mais plutôt une occasion d’échanger sans prise de tête sur les différents domaines de la data science et du big data.

Vendredi 15 avril 2016 – Meetup – Data Scientist: Codeur ou Matheux?

Data Scientist, Codeur ou Matheux? par Fabien Cellier, Data Scientist, Dascils

Pour pouvoir accueillir plus de participants, cet évènement ce déroulera dans l’amphithéâtre Epitech / ISEG au 86 Boulevard Marius Vivier Merle, 69003 Lyon. L’entrée principale est fermée quelques minutes après 19 h, alors passez la porte avant 19h 🙂

Avoir de la data, c’est bien, pouvoir l’exploiter et le faire bien c’est encore mieux!

Au cours de cette présentation nous allons voir quelques démarches et étapes de l’analyse de données.

Doit-on être un expert en statistiques pour l’analyse? Quelles sont les bases mathématiques nécessaires? Existe t-il des méthodes de machine learning type boîte noire qui ne nécessitent aucune intervention humaine? Quelles sont les démarches à suivre pour quel type de donnée?

Nous verrons comment le problème est étudié par le statisticien puis par le codeur, et le danger de chacune de ces démarches.

En se basant sur le profil des personnes présentent lors des meetups précédents, cette présentation passera un peu plus de temps sur les notions de bases mathématiques que sur les bases du développement informatique.

Pour accéder aux slides de la présentation, cliquer sur le lien suivant : présentation