Menú
BSG Institute

Blogs, Artículos, Cursos, Programas, Certificaciones relacionados con Hadoop

¿Qué es Hadoop?

Hadoop es un sistema de código abierto que permite el almacenamiento y procesamiento distribuido de grandes cantidades de datos, estructurados y no estructurados, con la finalidad de obtener conocimiento de manera rápida y efectiva.

Las principales características de Hadoop son:

-Permite el Procesamiento distribuido, es la forma de procesar información mediante conjuntos conglomerados de ordenadores unidos entre sí por una red de alta velocidad y que se comportan como si fuesen una única computadora.
-Es tolerante a fallos, debido a que si falla un nodo (Equipo físico que posee sus propios componentes de hardware y software) los trabajos son redirigidos automáticamente a otros nodos para asegurarse de que no falle el procesamiento distribuido.
-Es escalable, añade capacidad sin la necesidad de cambiar los formatos de datos, agregandose más nodos.
-Es flexible, a diferencia de las bases de datos relacionales, no tiene que procesar previamente los datos antes de almacenarlos, puede almacenar tantos datos como desee y posteriormente decidir cómo utilizarlos.

Cursos, Programas, Certificaciones

Blog

Apache Spark: Flexibilidad y Procesamiento en Big Data

Apache Spark: Flexibilidad y Procesamiento en Big Data

Este blog explica las funciónes de Apache Spark, flexibilidad y compatibilidad de esta herramienta Big Data de análisis de datos a gran escala.

White Papers

¿Qué es Apache Hadoop?

¿Qué es Apache Hadoop?
En el whitepaper ¿Qué es Apache Hadoop? conoceremos a profundidad sobre Apache Hadoop, una solución líder de Big Data.

¿Qué es Apache Spark?

¿Qué es Apache Spark?
En el whitepaper ¿Qué es Apache Spark? se revisará el concepto y características de Apache Spark y el porqué de su importancia.

Desarrollo de Aplicaciones Interactivas con Shiny

Shiny: Desarrollar Aplicaciones Interactivas
Este whitepaper brinda la definición de Shiny, una herramienta para desarrollar aplicaciones interactivas, y detalla las funciones de esta.

¿Qué es HDFS: Hadoop Distributed File System?

HDFS: Hadoop Distributed File System
El whitepaper Hadoop: HDFS describe el componente HDFS de Apache Hadoop, así como sus características y funciones.

¿Qué es Hadoop MapReduce?

¿Qué es Hadoop MapReduce?
En el whitepaper Hadoop: MapReduce se describen las principales características y el funcionamiento de MapReduce, considerado el corazón de Hadoop.

Python y R enfocados al Desarrollo de Aplicaciones Big Data

Python y R enfocados al Desarrollo de Aplicaciones Big Data
El whitepaper revisa las características de los lenguajes de programación Python y R, y brinda un concepto de su funcionamiento y aplicación en Big Data.

Métricas para evaluar Modelos Predictivos: Curvas Lift y ROC

Métricas para evaluar Modelos Predictivos: Curvas Lift y ROC
Este whitepaper define y detalla las Curvas Lift y ROC, métricas y herramientas fundamentales para realizar la evaluación de modelos predictivos.

Herramientas de Apache Hadoop: PIG, Hive y Flume

Herramientas de Apache Hadoop: PIG, Hive y Flume
En este whitepaper se revisan las características y la arquitectura de los componentes de Apache Hadoop: Pig, Hive y Flume.
© 2020 BSG Institute, todos los derechos reservados • Términos de usoPolítica de privacidad
The PMI® Authorized Training Partner seal, PMI logo, Project Management Professional (PMP), Certified Associate in Project Management (CAPM), PMBOK, are registered marks of the Project Management Institute, Inc.
Libro de Reclamaciones Libro de Reclamaciones