Menú
BSG Institute

Blogs, Artículos, Cursos, Programas, Certificaciones relacionados con Apache Spark

¿Qué es Apache Spark?

Apache Spark es un sistema de computación basado en Hadoop Map Reduce que permite dividir o pararelizar el trabajo mediante la combinación de un sistema de computación distribuida a través de clusters de ordenadores.

Spark toma los programas escritos en un lenguaje conciso de alto nivel y distribuye la ejecución de sus tareas en muchas máquinas. Lo logra a través de una API (Interfaz de Programación de Aplicaciones) marcos de datos y conjuntos de datos construidos sobre conjuntos de datos distribuidos resistentes (RDD).

Las principales características de Apache Spark son:
- Trabaja de forma integrada con Apache Hadoop.
- Consigue mucha mayor velocidad de procesamiento, gracias a su almacenamiento distribuido.
- Posee un desarrollo fácil y productivo.

Cursos, Programas, Certificaciones

Blog

Apache Spark: Flexibilidad y Procesamiento en Big Data

Apache Spark: Flexibilidad y Procesamiento en Big Data

Este blog explica las funciónes de Apache Spark, flexibilidad y compatibilidad de esta herramienta Big Data de análisis de datos a gran escala.

White Papers

¿Qué es Big Data?

¿Qué es Big Data?
En este whitepaper se revisarán aspectos sobre la evolución, concepto y características de Big Data, así como sus aplicaciones.

¿Qué es Apache Hadoop?

¿Qué es Apache Hadoop?
En el whitepaper ¿Qué es Apache Hadoop? conoceremos a profundidad sobre Apache Hadoop, una solución líder de Big Data.

¿Qué es Apache Spark?

¿Qué es Apache Spark?
En el whitepaper ¿Qué es Apache Spark? se revisará el concepto y características de Apache Spark y el porqué de su importancia.

Desarrollo de Aplicaciones Interactivas con Shiny

Shiny: Desarrollar Aplicaciones Interactivas
Este whitepaper brinda la definición de Shiny, una herramienta para desarrollar aplicaciones interactivas, y detalla las funciones de esta.

Casos de Éxito en Big Data

Casos de Éxito en Big Data
El whitepaper Big Data: Casos de éxito presenta empresas que lograron triunfar utilizando el Big Data como herramienta de mejora.

¿Qué es HDFS: Hadoop Distributed File System?

HDFS: Hadoop Distributed File System
El whitepaper Hadoop: HDFS describe el componente HDFS de Apache Hadoop, así como sus características y funciones.

¿Qué es Hadoop MapReduce?

¿Qué es Hadoop MapReduce?
En el whitepaper Hadoop: MapReduce se describen las principales características y el funcionamiento de MapReduce, considerado el corazón de Hadoop.

Python y R enfocados al Desarrollo de Aplicaciones Big Data

Python y R enfocados al Desarrollo de Aplicaciones Big Data
El whitepaper revisa las características de los lenguajes de programación Python y R, y brinda un concepto de su funcionamiento y aplicación en Big Data.

Métricas para evaluar Modelos Predictivos: Curvas Lift y ROC

Métricas para evaluar Modelos Predictivos: Curvas Lift y ROC
Este whitepaper define y detalla las Curvas Lift y ROC, métricas y herramientas fundamentales para realizar la evaluación de modelos predictivos.

Herramientas de Apache Hadoop: PIG, Hive y Flume

Herramientas de Apache Hadoop: PIG, Hive y Flume
En este whitepaper se revisan las características y la arquitectura de los componentes de Apache Hadoop: Pig, Hive y Flume.
© 2020 BSG Institute, todos los derechos reservados • Términos de usoPolítica de privacidad
The PMI® Authorized Training Partner seal, PMI logo, Project Management Professional (PMP), Certified Associate in Project Management (CAPM), PMBOK, are registered marks of the Project Management Institute, Inc.
Libro de Reclamaciones Libro de Reclamaciones