Les défis du Big Data
A l’issue de ce stage, vous serez capable de prendre part à une réflexion sur le Big Data. ■ PROBLÉMATIQUES […]
Description du cours
A l’issue de ce stage, vous serez capable de prendre part à une réflexion sur le Big Data.
■ PROBLÉMATIQUES
 – Explosion des données
 – Hétérogénéité des données
 – Scale Up ou Scale Out
 – Parallélisation des traitements
 – Machine learning
 – Data Mining et grands cas d’utilisation
 ■ BIG DATA …BASE
 – Théorème de Cap
 – Typologie des bases NoSQL
 – Sharding
 – Redis, MongoDB, Neo4J
 – Autres sources de données
 ■ HADOOP
 – Genèse
 – Hbase et HDFS
 – Clusters Hadoop
 – Map Reduce
 – Pig, Hive
 – Distributions Cloudera, Hortonworks et MapR
 – Hadoop et le Cloud
 – Amazon EMR, EC2 et S3
 ■ ANALYSE ET REPORTING
 – R et les langages statistiques
 – Mahout et l’apprentissage machine
 – Recherche avec SoIR et ElasticSearch
 – Spark
 – Processing
 – D3