Les défis du Big Data
A l’issue de ce stage, vous serez capable de prendre part à une réflexion sur le Big Data. ■ PROBLÉMATIQUES […]
Description du cours
A l’issue de ce stage, vous serez capable de prendre part à une réflexion sur le Big Data.
■ PROBLÉMATIQUES
– Explosion des données
– Hétérogénéité des données
– Scale Up ou Scale Out
– Parallélisation des traitements
– Machine learning
– Data Mining et grands cas d’utilisation
■ BIG DATA …BASE
– Théorème de Cap
– Typologie des bases NoSQL
– Sharding
– Redis, MongoDB, Neo4J
– Autres sources de données
■ HADOOP
– Genèse
– Hbase et HDFS
– Clusters Hadoop
– Map Reduce
– Pig, Hive
– Distributions Cloudera, Hortonworks et MapR
– Hadoop et le Cloud
– Amazon EMR, EC2 et S3
■ ANALYSE ET REPORTING
– R et les langages statistiques
– Mahout et l’apprentissage machine
– Recherche avec SoIR et ElasticSearch
– Spark
– Processing
– D3