Présentation du TUBA
20 mn : Le TUBA qui nous accueille nous présentera ses activités autour des datasciences/données.
Data sources : where do I get and store my data? par Fanilo
30/40 mn : « Lorsque nous évoquons le poste de Data Scientist, nous pensons instantanément aux statistiques, à l’apprentissage machine, aux prédictions qu’il fait, à ses qualités d’analyse de données hétérogènes provenant de sources multiples. Nous prenons moins souvent en compte le travail de collecte et de stockage des données avant analyse, et du fait que le Data Scientist doit être capable de travailler avec une multitude de référentiels de données pour arriver à ses fins. Dans cette présentation, nous ferons un point rapide sur les formats de fichier, les bases SQL et NoSQL, les particularités de système de fichiers distribués comme Hadoop, et les différentes sources de données accessibles sur le net. En sortant de cette présentation, le Data Scientist amateur aura une vue d’ensemble des solutions pour la collecte et le stockage de la donnée ».
Réseautage à votre guise.
L’équipe Lyon Data Science