Data science

Matplotlib: la libreria Python para la visualización de datos

Matplotlib es una libreria de gráficos para el lenguaje de programación Python que permite crear gráficos estáticos, animados e interactivos. Es una de las bibliotecas más populares y utilizadas para la visualización de datos en Python, debido a su flexibilidad y a la amplia gama de gráficos que puede generar. La biblioteca fue creada originalmente por John D. Hunter en 2003, y desde entonces ha experimentado un crecimiento constante y una comunidad activa de desarrolladores y usuarios.

Instalación de Matplotlib en Python

Para instalar Matplotlib, basta con utilizar pip, el gestor de paquetes de Python. La instalación es rápida y sencilla, haciendo que Matplotlib sea accesible a cualquiera que tenga una base de Python instalada en su sistema. 

Línea de código: pip install matplotlib

Creación de gráficos básicos

Una de las principales características de Matplotlib es su facilidad de uso para crear gráficos básicos. A continuación, presentaremos algunos ejemplos de gráficos que se pueden crear. Para cada ejemplo, proporcionaremos el código HTML pertinente para descargar con el fin de poder replicarlos.

1. Gráfico de líneas

Por ejemplo, para crear un gráfico lineal, basta con introducir los datos de los ejes X e Y y listo. Esta facilidad de uso permite incluso a los principiantes iniciarse rápidamente en la visualización de datos.

				
					import matplotlib.pyplot as plt

# Dati di esempio
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]

# Creazione del grafico
plt.plot(x, y)
plt.title("Grafico a Linee")
plt.xlabel("Asse X")
plt.ylabel("Asse Y")
plt.show()
				
			
Gráfico de líneas

2. Gráfico de barras

Los gráficos de barras son útiles para comparar cantidades entre distintas categorías. Con Matplotlib, crear un gráfico de barras es tan sencillo como definir categorías y valores asociados. Este tipo de gráfico es especialmente útil cuando se analizan datos categóricos.

				
					import matplotlib.pyplot as plt

# Dati di esempio
categorie = ['A', 'B', 'C', 'D', 'E']
valori = [5, 7, 3, 8, 6]

# Creazione del grafico a barre
plt.bar(categorie, valori)
plt.title("Grafico a Barre")
plt.xlabel("Categorie")
plt.ylabel("Valori")
plt.show()
				
			
Gráfico de barras

3. Histograma

Los histogramas representan la distribución de un conjunto de datos continuos. Son esenciales para comprender la frecuencia de aparición de los valores en un conjunto de datos. Con Matplotlib, crear un histograma solo requiere unos pocos pasos, lo que hace que esta técnica de análisis sea fácilmente accesible.

				
					import matplotlib.pyplot as plt
import numpy as np

# Dati di esempio
data = np.random.randn(1000)

# Creazione dell'istogramma
plt.hist(data, bins=30, edgecolor='black')
plt.title("Istogramma")
plt.xlabel("Valori")
plt.ylabel("Frequenza")
plt.show()
				
			
Histogramas

4. Gráfico de dispersión

Los gráficos de dispersión se utilizan para visualizar la relación entre dos variables. Este tipo de gráfico es muy útil en estadística y aprendizaje automático para identificar correlaciones o patrones entre variables. Matplotlib facilita la creación de gráficos de dispersión, lo que permite visualizar claramente las relaciones en los datos.

				
					import matplotlib.pyplot as plt

# Dati di esempio
x = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
y = [2, 4, 5, 7, 6, 9, 11, 12, 10, 15]

# Creazione del grafico a dispersione
plt.scatter(x, y)
plt.title("Grafico a Dispersione")
plt.xlabel("Asse X")
plt.ylabel("Asse Y")
plt.show()
				
			
Gráfico de dispersión

Personalización de gráficos

Una de las características más potentes de Matplotlib es la posibilidad de personalizar los gráficos. Puedes cambiar colores, estilos de línea, añadir etiquetas y anotaciones, y mucho más. Esta flexibilidad permite crear gráficos que no sólo presentan datos, sino que lo hacen de una manera visualmente atractiva y profesional.

				
					import matplotlib.pyplot as plt

# Dati di esempio
x = [1, 2, 3, 4, 5]
y = [2, 3, 5, 7, 11]

# Creazione del grafico con personalizzazioni
plt.plot(x, y, linestyle='--', color='r', marker='o')
plt.title("Grafico a Linee Personalizzato")
plt.xlabel("Asse X")
plt.ylabel("Asse Y")
plt.grid(True)
plt.show()
				
			
Gráfico de líneas personalizado

Gráficos 3D

Matplotlib también permite crear gráficos tridimensionales (3D), gracias al módulo mpl_toolkits.mplot3d. Los gráficos 3D son útiles para visualizar datos que tienen tres dimensiones, como superficies o gráficos de dispersión 3D. Estos gráficos pueden ofrecer una perspectiva adicional y una comprensión más profunda de las relaciones en los datos. Crear gráficos 3D en Matplotlib es relativamente sencillo y sigue una sintaxis similar a la de los gráficos 2D.

				
					import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import numpy as np

# Creazione dei dati
x = np.linspace(-5, 5, 100)
y = np.linspace(-5, 5, 100)
x, y = np.meshgrid(x, y)
z = np.sin(np.sqrt(x**2 + y**2))

# Creazione del grafico 3D
fig = plt.figure()
ax = fig.add_subplot(111, projection='3d')
ax.plot_surface(x, y, z, cmap='viridis')

ax.set_title("Grafico a Superficie 3D")
ax.set_xlabel("Asse X")
ax.set_ylabel("Asse Y")
ax.set_zlabel("Asse Z")

plt.show()
				
			
Gráficos 3D

En este ejemplo, usamos np.meshgrid para crear una rejilla de valores para los ejes X e Y y calculamos los valores Z como una función de X e Y. A continuación, se utiliza el método plot_surface de Axes3D para crear la superficie 3D. El resultado es un gráfico tridimensional que representa una función matemática de una manera visualmente atractiva.

Conclusiones

Matplotlib es una biblioteca potente y versátil para visualizar datos en Python. Su facilidad de uso y su amplia gama de funcionalidades la convierten en la opción ideal para cualquiera que necesite crear gráficos para el análisis de datos. Con sólo unos pocos comandos, puede crear gráficos eficaces y profesionales, personalizándolos para adaptarlos a sus necesidades. La activa comunidad y la extensa documentación disponible hacen de Matplotlib un excelente recurso para analistas de datos, investigadores y desarrolladores.

Lee todos nuestros artículos sobre Data Tech

¿Quiere conocer las últimas novedades sobre Fivetran y las nuevas tecnologías de data science?

Visualitics Team
Este artículo ha sido escrito y editado por uno de nuestros consultores

Compártelo ahora en tus redes sociales o por correo electrónico:

Suscríbete al boletín

Para estar informado sobre las novedades de Tableau y Alteryx, sobre nuestros productos y servicios y sobre los próximos eventos de Visualitics, suscríbete a nuestro boletín. ¡Puedes elegir el tipo de envío que prefieres y darte de baja en cualquier momento!
¿Qué novedades quieres recibir?
¿Qué empresa trata tus datos?

VISUALITICS PARTNERS, S.L. (en adelante, “VISUALITICS“)

¿Por qué tratamos los datos que te pedimos?

Únicamente tratamos tus datos para poder prestarte los servicios de VISUALITICS + info

¿Cuál es la legitimación para este tratamiento de tus datos?

Estos datos son necesarios para llevar a cabo la prestación de los servicios ofrecidos por VISUALITICS + info

¿Se van a hacer cesiones o transferencias con tus datos?

Si así lo consientes, tus datos podrán ser cedidos a terceras empresas. + info

¿Cuáles son mis derechos?

El interesado tiene derecho a ejercitar su derecho de:

– Acceso, rectificación, supresión, oposición, portabilidad de los Datos, limitación del tratamiento y a no ser objeto de decisiones automatizadas individualizadas + info

¿Tienes dudas?

Tanto si tienes alguna o sugerencia como si quieres darte de baja ponte en contacto con nosotros enviando un email a la siguiente dirección: info@visualitics.es