El coeficiente de correlación de Pearson se define en estadística como la medida de la fuerza de la relación entre dos variables y su asociación con cada una de ellas. Hoy te compartiremos algunos ejemplos del coeficiente de correlación de Pearson que te ayudarán a entenderlo mejor.
En palabras sencillas, el coeficiente de correlación de Pearson calcula el efecto del cambio en una variable cuando la otra variable cambia.
Por ejemplo: Hasta una cierta edad, (en la mayoría de los casos) la estatura de un niño seguirá incrementando a medida que su edad aumente. Por supuesto, su crecimiento depende de varios factores como los genes, la dieta, el estilo de vida, etc.
Este enfoque se basa en la covarianza y por lo tanto es el mejor método para medir la relación entre dos variables.
¿En qué consiste la prueba del coeficiente de correlación de Pearson?
El coeficiente de correlación de Pearson tiene una gran importancia estadística. Busca trazar una línea a través de los datos de dos variables para mostrar su relación. Esta relación lineal puede ser positiva o negativa.
Por ejemplo:
Relación lineal positiva: En la mayoría de los casos, universalmente, los ingresos de una persona aumentan a medida que aumenta su edad.
Relación lineal negativa: Si el vehículo aumenta su velocidad, el tiempo de viaje disminuye, y viceversa.
Del ejemplo anterior se desprende que el coeficiente de correlación de Pearson, r, trata de averiguar dos cosas: la fuerza y la dirección de la relación a partir de los tamaños de muestra dados.
La fórmula del coeficiente de correlación de Pearson
La fórmula del coeficiente de correlación descubre la relación entre las variables.
Dónde:
N = Número de valores o elementos
Σxy = la suma de los productos de las puntuaciones emparejadas
Σx = la suma de puntuaciones x
Σy = la suma de puntuaciones y
Σx2 = Suma de cuadrados Puntuación x
Σy2 = Suma de cuadrados Puntuación y
Cómo calcular el coeficiente de correlación de Pearson
Aquí hay una guía paso a paso para calcular el coeficiente de correlación de Pearson:
Paso uno: Crear una tabla de coeficientes de correlación de Pearson. Hacer una tabla de datos, incluyendo ambas variables. Etiqueta estas variables como «x» e «y». Añade tres columnas adicionales – (xy), (x^2), y (y^2). Checa esta simple tabla de datos.
Paso dos: Usa una multiplicación básica para completar la tabla.
Paso tres: Sume todas las columnas de abajo a arriba.
Paso cuatro: Usar la fórmula de correlación para conectar los valores.
Si el resultado es negativo, hay una relación de correlación negativa entre las dos variables. Si el resultado es positivo, hay una relación de correlación positiva entre las variables.
Los resultados también pueden definir la fuerza de una relación lineal, es decir, una relación positiva fuerte, una relación negativa fuerte, una relación positiva media, etc.
El coeficiente de Pearson (también llamado coeficiente de correlación del producto-momento), determina la fuerza de la relación lineal entre dos variables. Cuanto más fuerte sea la asociación entre las dos variables, más se inclinará la respuesta hacia 1 o -1.
Alcanzar valores de 1 o -1 significa que el cambio de factores de cualquier variable no debilita la correlación con la otra variable. Cuanto más se acerque la respuesta a 0, mayor será la variación de las variables.
Cómo interpretar el coeficiente de correlación de Pearson
A continuación se proponen las directrices para la interpretación de la correlación del coeficiente de Pearson:
Ten en cuenta que la fuerza de la asociación de las variables depende de lo que se mide y de los tamaños de las muestras.
En un gráfico, uno puede notar la relación entre las variables y hacer suposiciones antes incluso de calcularlas. Los gráficos de dispersión, si están cerca de la línea, muestran una fuerte relación entre las variables. Cuanto más cerca están los diagramas de dispersión de la línea, más fuerte es la relación de las variables. Cuanto más se alejan de la línea, más débil es la relación. Si la línea es casi paralela al eje x, debido a los diagramas de dispersión colocados al azar en el gráfico, es seguro suponer que no hay correlación entre las dos variables.
Conoce sobre el análisis de correlación en encuestas.
¿Qué significan los términos fuerza y dirección?
Los términos «fuerza» y «dirección» tienen un significado estadístico. Aquí hay una explicación directa de las dos palabras:
Fuerza: La fuerza significa la correlación de relación entre dos variables. Significa cuán consistentemente una variable cambiará debido al cambio en la otra.
Los valores cercanos a +1 o -1 indican una relación fuerte. Estos valores se alcanzan si los puntos de datos caen sobre la línea o muy cerca de ella. Cuanto más se alejan los puntos de datos, más débil es la fuerza de la relación lineal. Cuando no hay una forma práctica de trazar una línea recta porque los puntos de datos están dispersos, la fuerza de la relación lineal es la más débil.
Dirección: La dirección de la línea indica una relación lineal positiva o negativa entre las variables. Si la línea tiene una pendiente ascendente, las variables tienen una relación positiva. Esto significa que un aumento en el valor de una variable llevará a un aumento en el valor de la otra variable. Una correlación negativa representa una pendiente descendente. Esto significa que un aumento en la cantidad de una variable lleva a una disminución en el valor de otra variable.
Ejemplos del coeficiente de correlación de Pearson
Veamos algunos ejemplos visuales para ayudarte a interpretar una tabla de coeficientes de correlación de Pearson:
Gran correlación positiva:
La figura anterior muestra una correlación de casi +1.
Los gráficos de dispersión están casi trazados en línea recta.
La pendiente es positiva, lo que significa que si una variable aumenta, la otra variable también aumenta, mostrando una línea lineal positiva.
Esto denota que un cambio en una variable es directamente proporcional al cambio en la otra variable.
Un ejemplo de una gran correlación positiva sería: A medida que los niños crecen, también lo hacen sus tallas de ropa y zapatos.
Veamos algunos ejemplos del coeficiente de correlación de Pearson para que puedas apreciar de manera más visual.
Correlación positiva media
La figura anterior muestra una correlación positiva.
La correlación es superior a +0,8 pero inferior a 1+.
Muestra un patrón lineal ascendente bastante fuerte.
Un ejemplo de una correlación positiva media sería: A medida que el número de automóviles aumenta, también aumenta la demanda en la variable combustible.
Pequeña correlación negativa
En la figura de arriba, los gráficos de dispersión no están tan cerca de la línea recta en comparación con los ejemplos anteriores.
Muestra una correlación lineal negativa de aproximadamente -0,5.
El cambio de una variable es inversamente proporcional al cambio de la otra variable ya que la pendiente es negativa.
Un ejemplo de una pequeña correlación negativa sería, cuanto más come alguien, menos hambre tiene.
Débil / sin correlación
Los diagramas de dispersión están muy lejos de la línea.
Es difícil dibujar prácticamente una línea.
La correlación es aproximadamente de +0,15
No se puede juzgar que el cambio en una variable es directamente proporcional o inversamente proporcional a la otra variable.
Un ejemplo de una correlación débil/ninguna sería, un aumento en el precio del combustible lleva a que menos personas adopten mascotas.
Ahora que ya conociste algunos ejemplos del coeficiente de correlación de Pearson, quizá te interese conocer también sobre el coeficiente de correlación de spearman, otro de los coeficientes para medir las relaciones entre conjuntos de datos.
Autor: QuestionPro LATAM.
El equipo de QuestionPro Latinoamérica está constituido por expertos en investigación y recolección de datos. Ayudamos a cientos de empresas alrededor del mundo ofreciéndoles soluciones tecnológicas para el éxito de sus proyectos.