Paradigma Tecnológico y Javahispano organizaron este Seminario gratuito de Introducción a Apache Hadoop el 1 de diciembre de 2011. El seminario fue impartido por Marco Martínez y Alejandro González.
Apache Hadoop es una librería open Source para procesamiento distribuido donde caracterizada principalmente por su fiabilidad y escalabilidad. La clave de Hadoop es la posibilidad de manejar grandes cantidades de datos bajo un modelo de programación simple.
A continuación se describen los contenidos impartidos en el seminario:
Contenido Teórico
- Historia. Se comentó el origen que montó la librería
- Sistema de ficheros Hadoop Distributed File System
- Arquitectura
- Mecanismos de replicacion de datos
- Robustez
- Posibilidades de configuracion
- Integridad de datos
- Casos reales de uso (Empresas que lo usan y volumenes de datos)
- Hadoop MapReduce
- Que es MapReduce.
- Arquitectura Hadoop MapReduce.
- Cómo funciona y fases del MapReduce.
- Posibilidades de configuración.
Contenido Práctico
- Creamos un cluster hadoop con la distribución de cloudera
- Ejemplo práctico Map/Reduce.
¿Quiénes son los ponentes?
Alejandro
González
Alejandro González es un analista programador con más de 4 años de experiencia en el desarrollo de software. Ha trabajado sobre todo con lenguajes dinámicos como Perl y Python en el ambito del NLP, Sentiment Analysis, Motores de busqueda y aplicaciónes de monitorización y seguimiento de tendencias y opiniones en redes sociales.Le atrae especialmente la adquisición y analisis automático de grandes volúmenes de información para inferir tendencias y patrones de propagación de ideas en internet, así como tecnologías de BigData, tanto de persistencia como de computación.Actualmente se encuentra en Paradigma Tecnológico trabajando en varios proyectos de Sentiment Analysis y de detección y seguimiento de movimientos en redes sociales.
Marco
Martínez
Marco Martínez es un analista programador con 3 años de experiencia en el desarrollo de software. Marco trabaja sobre todo con Java, sin dejar de lado lenguajes como Groovy y Python y la ultimas tendencias de base de datos NoSQL.
Está enfocado principalmente al desarollo de buscadores utilizando Apache Solr y Apache Lucene.
Próximos eventos..
Ver todos los eventos.