Dans cette section, nous vous proposons différents liens pour découvrir les différents langages et frameworks dans le domaine du Big Data.
Présentation des différents
Julia : http://julialang.org
Objective C et framework en Machine Learning YCML (écrit en Objective-C et en Swift) : https://github.com/yconst/ycml/
Octave : https://www.gnu.org/software/octave
NPL (Stanford Natural Language Processing Group) : http://nlp.stanford.edu/software/
Python :
– Procédure d’installation NumPy, SciPy et Matplotlib : http://sebastianraschka.com/Articles/2014_install_python_sci_pkgs.html
– Learning Python : http://www.datasciencecentral.com/profiles/blogs/learning-python-for-data-science
– Scipy : http://www.scipy.org
– Pandas : http://pandas.pydata.org/
– Caffe (librairie de Deep Learning spécialisée dans le réseau de neurones conventionnel et l’analyse visuel) : http://caffe.berkeleyvision.org/
– Top 20 des projets Python Open source en Machine Learning : http://www.kdnuggets.com/2015/06/top-20-python-machine-learning-open-source-projects.html
– Une présentation des frameworks en Deep Learning : http://www.kdnuggets.com/2017/02/python-deep-learning-frameworks-overview.html
– Implémentations de plusieurs modèles et algorithmes fondamentaux en Machine Learning : https://github.com/eriklindernoren/ML-From-Scratch
R :
– Des projets en langage R : https://www.r-project.org/
– Un IDE pour R : https://www.rstudio.com/
– Un tutoriel vidéo : https://www.youtube.com/playlist?list=PLD34F9615AAD9BDAB
– Top 20 des packages les plus ackages by popularity : http://www.kdnuggets.com/2015/06/top-20-r-packages.html
– Comparaison entre R et Python : http://blog.datacamp.com/r-or-python-for-data-analysis/ et http://readwrite.com/2013/11/25/python-displacing-r-as-the-programming-language-for-data-science
Lua :
-Kit de développement en Deep Learning (NN) développé par Facebook et Google : http://torch.ch/
Et plusieurs add-ons : https://github.com/torch/cunn et https://github.com/facebook/fbcunn
Scala :
– Scientific Computing, Machine Learning, and Natural Language Processing : http://www.scalanlp.org
– API scala pour Cascading : http://twitter.com/scalding et https://github.com/twitter/scalding
Présentation des différents frameworks
Analyse distribuée
Hadoop :https://pig.apache.org/
Spark : https://github.com/databricks/spark-training
Visualisation
Gephi est une plateforme Open Source de visualisation interactive et d’exploration, pour tous types de réseaux et de systèmes complexes, dynamiques et de graphes hiérarchisés : http://gephi.github.io
Apache Giraph : http://giraph.apache.org
Seaborn : https://web.stanford.edu/~mwaskom/software/seaborn/
Un article répertoriant les différents outils de visualisation : http://colah.github.io/posts/2015-09-Visual-Information/