BIG DATA con PYTHON. Recolección, almacenamiento y proceso

21,95

Descripción

El análisis de datos está presente en nuestras vidas: los periódicos hablan de noticias virales, las empresas buscan científicos de datos, los comercios nos ofrecen ofertas personalizadas en función de nuestras costumbres y nosotros mismos engrasamos el sistema ofreciendo información personal gratuita desde nuestras redes sociales, búsquedas en internet e incluso desde dispositivos inteligentes para controlar nuestra actividad física diaria.

En este libro se presentan los conocimientos y las tecnologías que permitirán participar en esta nueva era de la información, regida por el Big Data y el aprendizaje automático; se analiza la “vida” de los datos paso a paso, mostrando cómo obtenerlos, almacenarlos, procesarlos, visualizarlos, y extraer conclusiones de ellos; es decir, mostrar el análisis de datos tal y como es: un área fascinante, que requiere muchas horas de trabajo cuidadoso.

Asimismo, se analiza el lenguaje de programación Python, el más utilizado dentro del análisis de datos debido a la multitud de bibliotecas que facilita, pero no se limita al “estándar”, sino que presenta tecnologías actuales que, con Python como interfaz, permitirán escalar el tamaño de los datos al máximo. Por ello, nuestro viaje con los datos nos llevará, por ejemplo, a conocer la base de datos MongoDB y el entorno de procesamiento Spark.

El libro contiene ejemplos detallados de cómo realizar las distintas tareas en Python; y además, por comodidad para el lector de los fragmentos incluidos se facilita el acceso de los lectores a un repositorio donde encontrarán el código listo para ser ejecutado. También cada capítulo presenta lecturas recomendadas para poder profundizar en aquellos aspectos que resulten más interesantes.

¡Le invitamos a sumergirse en el apasionante mundo del análisis de datos en Python y a explorar los misterios del Big Data y del aprendizaje automático!

Primer Capítulo


Descargar PDF

Los autores


Rafael Caballero es doctor en Ciencias Matemáticas y actualmente dirige la Cátedra de Big Data y Analítica Hewlett Packard-UCM. Profesor de la Facultad de Informática de la Universidad Complutense de Madrid con 20 años de experiencia en docencia de bases de datos y gestión de la información, también es autor de más de 50 publicaciones científicas y de varios libros sobre lenguajes de programación. Aplica su interés por Big Data a los grandes catálogos astronómicos, habiendo descubierto mediante el análisis de estos catálogos más de 500 estrellas dobles nuevas.

Enrique Martín Martín es doctor en Ingeniería Informática por la Universidad Complutense de Madrid, universidad en la que ha sido profesor desde 2007. Durante años ha impartido asignaturas en la Facultad de Informática sobre gestión de la información y Big Data. Su investigación principal gira en torno a los métodos formales para el análisis de programas en entornos distribuidos.

Adrián Riesco es doctor en Ingeniería Informática por la Universidad Complutense de Madrid, universidad en la que ha sido profesor desde 2011. Su docencia incluye una asignatura de introducción a la programación Python, así como otras asignaturas de grado y máster. Sus principales áreas de investigación son la depuración de programas y los métodos formales basados en lógica de reescritura.

Información adicional

Peso 0.5 kg
Dimensiones 1.5 × 17 × 23 cm
Autor

Formato

ISBN

Nº Páginas

IBIC

,

Publicación

25/09/2018

También te recomendamos…