Skip to main content

Mutable Ideas

Resumen del Taller: Introducción al Desarrollo de Aplicaciones para Big Data

Durante el mes de Agosto, Juan Pampliega y yo recibimos la invitación para armar un taller de Big Data en el Espacio Fundación Telefonica como un complemento a la exposición “Big Bang Data”. Este post es un resumen del evento y las referencias de lectura para los que no tuvieran la oportunidad de participar.

Grupo Completo

Exposición de Gustavo Arjones

Exposición de Juan Pampliega

## Lista de Discusión

Durante el taller creamos una lista de discusión que vaya más allá del programa y quedemos en contacto para aprender en conjunto. Si tenés interes en la tematica, inscribite acá

## Resultados

Tomando los resultados de la encuesta hecha con los participantes, es muy placentero saber que 60% definió como Excelente la calidad del taller y 40% como Muy Bueno - correcto, no hubo calificaciones inferiores a estas :) - también quedó muy marcado el pedido de más horas de taller para que puedan tener más horas de practica, así que nos inspira a buscar este objetivo en futuros talleres.


## Referencias

El material abajo es contiene las principales referencias que usamos para armar el material del curso. No debe ser considerado un listado exhaustivo.

## Clase I y II: Introducción a Big Data y Hadoop

# Libros y referencias (en papel)

## Hadoop

  • Tom White, Hadoop: The Definitive Guide, 4th Edition, O’Reilly Media, March 2015
  • Alex Holmes, Hadoop in Practice, Second Edition, Manning Publications, September 2014
  • Mark Grover, Ted Malaska, Jonathan Seidman, Gwen Shapira, Hadoop Application Architectures, O’Reilly Media, Final version not released

## Big Data / Apache Spark

  • Nathan Marz and James Warren, Big Data, Manning Publications, April 2015
  • Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia, Learning Spark, O’Reilly Media, January 2015
  • Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills, Advanced Analytics with Spark, O’Reilly Media, Inc., March 2015
  • Martin Kleppmann, Designing Data Intensive Applications, O’Reilly Media, Final version not released

## Sitios y Newsletters:


## Clase III: NoSQL databases y más

# NoSQL

# NewSQL


## Clase IV: Stream Processing

# Conceptos Generales:

# Kafka:

# Frameworks de Procesamiento


## Clase V: Apache Spark y Spark Streaming

# Spark Summit 2014

# Spark Summit 2015

# Laboratorio Hands-On

La VM y los ejemplos están documentados en este post (en inglés)


## Otros

# Aplicaciones Referencia para Apache Spark