Gráfico de Dispersión
Un diagrama de dispersión es un tipo de gráfico que muestra la relación entre dos variables (x y y) utilizando puntos u otros marcadores.
Los diagramas de dispersión son una de las herramientas más sencillas para examinar visualmente si dos variables están correlacionadas. Aunque no es el método más preciso, a menudo proporciona información útil de un vistazo.
Es similar a un gráfico de líneas, excepto que no tiene líneas, solo marcadores. Para crear un diagrama de dispersión, simplemente se utiliza la función scatter()
de pyplot
, pasando primero los valores para el eje x y luego los valores para el eje y. Veamos un ejemplo:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Creating a scatter plot plt.scatter(x, y) plt.show()
La sintaxis de la función scatter()
es similar a la de plot()
. Sin embargo, a diferencia de plot()
, siempre se deben proporcionar valores para ambos parámetros x
y y
.
En este ejemplo, y
se calcula utilizando la fórmula y = 2x + 5
. El diagrama de dispersión muestra una relación lineal positiva: a medida que x
aumenta, y
también incrementa, y viceversa.
También es posible establecer otros marcadores en lugar de puntos y definir su tamaño utilizando los parámetros marker
y s
, respectivamente:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Specifying the markers and their size plt.scatter(x, y, marker='x', s=100) plt.show()
Aquí se utilizaron marcadores 'x'
en lugar del valor predeterminado 'o'
(puntos), y su tamaño se estableció en 100. Puede ajustar el parámetro s
para explorar diferentes tamaños de marcador.
La siguiente sección se centrará más en la personalización de gráficos, pero, por ahora, puedes consultar la scatter()
documentación de la función para explorar más.
La representación de múltiples gráficos de dispersión se puede lograr simplemente llamando dos veces a la función scatter()
con diferentes argumentos x
y y
(de manera similar a los gráficos de líneas).
Aunque plt.plot(x, y, 'o')
y plt.scatter(x, y)
pueden parecer similares a primera vista, cumplen funciones diferentes:
plt.plot(x, y, 'o')
es una función de gráfico de líneas que utiliza'o'
para mostrar solo los marcadores. Es rápida pero ofrece un estilo limitado.plt.scatter(x, y)
es una función dedicada a gráficos de dispersión que proporciona mayor control — permitiendo la personalización individual del tamaño, color y transparencia de los marcadores.
Swipe to start coding
Mostrar una relación cuadrática entre dos variables utilizando un diagrama de dispersión:
- Reemplazar los guiones bajos para que el arreglo
y
contenga los elementos al cuadrado del arreglox
. - Utilizar la función correcta para crear un diagrama de dispersión.
- Pasar
x
yy
a esta función en el orden correcto. - Establecer el tamaño de los marcadores en 70.
Solución
¡Gracias por tus comentarios!