Le métier de data scientist

Data Scientist (n.): Person who is better at statistics than any software engineer and better at software engineering than any statistician. — Josh Wills (@josh_wills) May 3, 2012

Le métier de data scientist

Une carte de métro ludique et précise sur les compétences d’un data scientist : http://nirvacana.com/thoughts/becoming-a-data-scientist/

Une présentation des métiers de data scientist au sein d’une entreprise : http://www.r-bloggers.com/the-data-science-industry-who-does-what-infographic/

Comparaison des métiers de big data, Data Scientist vs Data Engineer vs Statistician : http://www.analyticsvidhya.com/blog/2015/10/job-comparison-data-scientist-data-engineer-statistician/

Comment devenir data scientist?

Un blog complet pour savoir comment devenir un data scientist : http://blog.datacamp.com/how-to-become-a-data-scientist

Une grille des salaires en 2014 : http://blog.dominodatalab.com/2014-data-science-salary-survey/

Recrutement et définition de poste : https://www.reddit.com/r/datascience/comments/3gzf9c/data_scientists_the_most_dangerous_game/

Les questions fréquentes lors d’un entretien d’embauche : http://www.datasciencecentral.com/profiles/blogs/job-interview-questions-for-data-scientists

Compétences par profil

  Data Engineering Data Science Expert Domain (data journalist, métier, etc.) Statisticien
infrastructure data (bdd, nosql) x      
Langage informatique x      
Langage Statistique   x   x
Data Wrangling (formatage données) x x    
Statistique   x   x
Visualisation   x x x
         

source du tableau : http://www.datasciencecentral.com/profiles/blogs/ingredients-of-data-science-1

Emploi

La demande en data scientist est élévée. Selon LinkedIn, la compétence statistical analysis et data mining est généralement la plus demandée : http://fr.slideshare.net/linkedin/the-25-hottest-skills-of-2014-on-linkedin

Influences

Une liste des 33 data scientists les plus suivis sur Twitter : http://bigdata-madesimple.com/33-most-noted-data-scientists-on-twitter/

La liste des 150 personnes les plus influentes dans le domaine du Big Data et du framework Hadoop : http://www.greycampus.com/blog/big-data/the-150-most-influential-people-in-big-data-hadoop

Groupes discussion

Text et data mining :
https://www.reddit.com/r/textdatamining/
https://www.reddit.com/r/datascience

Data Science :
http://www.datatau.com/
https://www.quora.com/Data-Science