Langages et frameworks

Dans cette section, nous vous proposons différents liens pour découvrir les différents langages et frameworks dans le domaine du Big Data.

Présentation des différents langages

Java et les logiciels associés en Data Mining : http://www.cs.waikato.ac.nz/ml/weka/

Julia : http://julialang.org

Objective C et framework en Machine Learning YCML (écrit en Objective-C et en Swift) : https://github.com/yconst/ycml/

Octave : https://www.gnu.org/software/octave

NPL (Stanford Natural Language Processing Group) : http://nlp.stanford.edu/software/

Python :
– Procédure d’installation NumPy, SciPy et Matplotlib : http://sebastianraschka.com/Articles/2014_install_python_sci_pkgs.html
Learning Python : http://www.datasciencecentral.com/profiles/blogs/learning-python-for-data-science
– Scipy : http://www.scipy.org
– Pandas : http://pandas.pydata.org/
– Caffe (librairie de Deep Learning spécialisée dans le réseau de neurones conventionnel et l’analyse visuel) : http://caffe.berkeleyvision.org/
– Top 20 des projets Python Open source en Machine Learning : http://www.kdnuggets.com/2015/06/top-20-python-machine-learning-open-source-projects.html
– Une présentation des frameworks en Deep Learninghttp://www.kdnuggets.com/2017/02/python-deep-learning-frameworks-overview.html
– Implémentations de plusieurs modèles et algorithmes fondamentaux en Machine Learning : https://github.com/eriklindernoren/ML-From-Scratch

R :
– Des projets en langage R : https://www.r-project.org/
– Un IDE pour R : https://www.rstudio.com/
– Un tutoriel vidéo : https://www.youtube.com/playlist?list=PLD34F9615AAD9BDAB
– Top 20 des packages les plus ackages by popularity : http://www.kdnuggets.com/2015/06/top-20-r-packages.html

– Comparaison entre R et Python : http://blog.datacamp.com/r-or-python-for-data-analysis/ et http://readwrite.com/2013/11/25/python-displacing-r-as-the-programming-language-for-data-science

Lua :
-Kit de développement en Deep Learning (NN) développé par Facebook et Google : http://torch.ch/
Et plusieurs add-ons : https://github.com/torch/cunn et https://github.com/facebook/fbcunn

Scala :
– Scientific Computing, Machine Learning, and Natural Language Processing : http://www.scalanlp.org
– API scala pour Cascading : http://twitter.com/scalding et https://github.com/twitter/scalding

Présentation des différents frameworks

Analyse distribuée

Hadoop :https://pig.apache.org/
Spark : https://github.com/databricks/spark-training

Visualisation

Gephi est une plateforme Open Source de visualisation interactive et d’exploration, pour tous types de réseaux  et de systèmes complexes, dynamiques et de graphes hiérarchisés : http://gephi.github.io

Apache Giraph : http://giraph.apache.org

Seaborn : https://web.stanford.edu/~mwaskom/software/seaborn/

Un article répertoriant les différents outils de visualisation : http://colah.github.io/posts/2015-09-Visual-Information/