.
Inicio / Cursos / Big Data / Curso Oficial IBM: Open Platform with Apache Hadoop

Curso Oficial IBM: Open Platform with Apache Hadoop

Área: Big Data | Sub Área: Hadoop
Este curso esta disponible solo en modalidad Presencial

¡Y PARTICIPA EN EL SORTEO DE UNA BECA PARA ESTE PROGRAMA!

Duración: Un fin de semana

Fechas de inicio

  • Lima 07 Marzo 2020
  • Santa Cruz 13 Junio 2020
  • Bogota 03 Julio 2020
Matricularme ahora

Objetivos

Al finalizar el curso el participante estará en la capacidad de:

  • Describir los principales componentes de IBM Open Data Platform.
  • Describir los componentes principales del ecosistema de Apache Hadoop fundamentales para manipular y desarrollar proyectos de Big Data.
  • Describir la funcionalidad de cada componente de fuente abierta del ecosistema de Hadoop.

Público Objetivo

El Curso Oficial IBM: Open Platform with Apache Hadoop está dirigido a administradores de sistemas, ingenieros de datos, científicos de datos, profesionales de BI, en general cualquier persona que quiera aprender sobre el manejo de las herramientas principales del ecosistema Hadoop y su distribución Open Platform de IBM con Apache Hadoop.


Pre-Requisitos

Se recomienda que el participante posea conocimientos básicos en virtualización, lenguajes de programación y bases de datos.


Estructura Curricular

IBM Open Platform con Apache Hadoop

  • Enumerar los principales componentes de IBM ODP.
  • Lista de componentes del ecosistema Apache Hadoop.
  • Describir la funcionalidad de los componentes de código abierto.

Apache Ambari

  • Comprender el propósito de Apache Ambari en ODP.
  • Comprender la arquitectura de Ambari.
  • Listar las funciones de los componentes principales de Ambari.

Sistema de archivos distribuidos de Hadoop HDFS

  • Describir la naturaleza del archivo distribuido de Hadoop. Sistema (HDFS).
  • Explicar funciones de NameNode y DataNodes.
  • Explicar el almacenamiento de archivos y la replicación de bloques.

MapReduce y YARN

  • Describir el modelo MapReduce v1
  • Enumerar las limitaciones de Hadoop 1 y MapReduce 1
  • Describir el modelo YARN, y comparar Hadoop 2/YARN con Hadoop 1
  • Hadoop Ecosystem Major Components

Apache Spark

  • Comprender el propósito de Apache Spark en el Ecosistema de Hadoop.
  • Describir el papel de un conjunto de datos distribuido resiliente.
  • Lanzar y usar las conchas Scala y Python de Spark.

Gestión de coordinación y gobernanza

  • Comprender los desafíos de las aplicaciones distribuidas.
  • Uso de la CLI de ZooKeeper para interactuar con los servicios.
  • Comprender el uso de Apache Slider con YARN para implementar y monitorear aplicaciones distribuidas.

Movimiento de datos

  • Lista de escenarios de carga aplicables a Hadoop.
  • Comprender cómo cargar datos en reposo y en movimiento.
  • Comprender cómo cargar datos de fuentes comunes.
  • Sqoop y Flume.

Almacenamiento y acceso a datos

  • Lista las características de los formatos de archivo de datos (archivos planos / de texto, CSV, XML, JSON, YAML).
  • Lista las características de los tipos de almacenamiento de datos NoSQL.
  • Describir el almacenamiento utilizado por HBase.
  • Comparar los lenguajes de programación de fuente abierta Pig y Hive.
  • Lista de características de R y Python.

Temas avanzados

  • Explicar los flujos de trabajo de Oozie.
  • Describir un flujo de trabajo en un procesamiento Big Data.
  • Comprender el uso de los motores de búsqueda de texto para explorar Big Data
  • Comprender el procedimiento de búsqueda de Apache Solr.

Expositores

OSCAR PULIDO (COLOMBIA)

Master en Big Data & Business Analytics por la Universidad de Alcalá de España. Cuenta con especialización en Base de Datos por la Universidad Pedagógica y Tecnológica de Colombia. Actualmente, se desempeña como Big Data Architect en la empresa Globant de Colombia. Cuenta con amplia experiencia en Técnicas y Herramientas Big Data, Proyectos de BI, Administración Bases de Datos NoSQL y Relacionales, Auditoria, Tuning, Afinamiento PL/SQL, Análisis, Consultoría, Arquitectura, Desarrollo de Proyectos de Implementación, Personalización e Integración de Core Bancario, Analítica, Desarrollo e Industrialización de Modelos con Pyspark y Spark Scala. Es Ingeniero de Sistemas y Computación por la Universidad Pedagógica y Tecnológica de Colombia.


NOTA: No necesariamente todos los expositores mencionados participarán en el dictado del programa o sesiones webinar, asimismo se podrá contar con la participación de otros expositores adicionales a los mencionados.


Los participantes que completen exitosamente el curso, recibirán la siguiente certificación:

  • Certificación emitido por BSG Institute.

En la modalidad Presencial:

El Curso Oficial IBM: Open Platform with Apache Hadoop se desarrolla en el siguiente horario (*):

En Lima con una frecuencia Mensual:

  • Sábado: 09:00 a 13:00 - 14:30 a 18:30 horas.
  • Domingo: 09:00 a 13:00 - 14:30 a 18:30 horas.

En Bogota con una frecuencia Quincenal:

  • Viernes: 08:00 a 12:00 - 14:00 a 18:00 horas.
  • Sábado: 08:00 a 12:00 - 14:00 a 18:00 horas.

En Santa Cruz con una frecuencia Mensual:

  • Sábado: 09:00 a 13:00 - 14:30 a 18:30 horas.
  • Domingo: 09:00 a 13:00 - 14:30 a 18:30 horas.

(*)Para más detalle sobre fechas y horarios solicite su cronograma de alumnos.


DUDAS E INFORMACIÓN

¿Tiene dudas sobre algún aspecto del programa ?

Registre sus datos para que un asesor especializado pueda ayudarlo en todo lo que requiera.

LLÁMENOS a costo de llamada local



Beneficios

El curso incluye los siguientes beneficios:

  • Acceso a 16 horas de presenciales en las fechas establecidas.
  • Certificación emitido por BSG Institute.

Inversión

Al Contado desde US$ 790

Consulte por nuestras opciones de pago personalizadas y flexibles así como por las opciones de descuentos.

Puede pagar a través de nuestro sitio web con los siguientes medios de pago:

  • Tarjetas de crédito Visa, Mastercard, American Express, Dinners Club, Discover, o JBC.
  • Tarjetas de debito Visa, Visa Electrón o cualquier tarjeta de debito con el logo de Visa.
  • Paypal.

Cursos Relacionados