Calculadora interactiva

Cómo calcular la correlación entre dos variables

Introduce dos listas de valores numéricos y obtén al instante la correlación de Pearson o Spearman, una interpretación profesional del resultado, estadísticas clave y una visualización tipo dispersión con línea de tendencia. Ideal para análisis de negocio, investigación, educación y ciencia de datos.

Calculadora de correlación

Variable X

Escribe números separados por comas, espacios o saltos de línea.

Variable Y

Ambas listas deben contener la misma cantidad de observaciones y estar emparejadas por fila o posición.

Método

Decimales

Resultado y gráfico

Coeficiente

–

N observaciones

–

Introduce dos series de datos y pulsa Calcular correlación para ver la interpretación, las medias, la covarianza y la fuerza de la relación.

Guía experta: cómo calcular la correlación entre dos variables paso a paso

La correlación es una de las herramientas más utilizadas en estadística para medir el grado de asociación entre dos variables. Cuando alguien busca cómo calcular la correlación entre dos variables, normalmente quiere responder una pregunta muy concreta: si una variable sube, ¿la otra también tiende a subir, tiende a bajar o no parece cambiar de forma consistente? Esta pregunta aparece en marketing, finanzas, salud, educación, ingeniería y prácticamente en cualquier campo en el que existan datos cuantitativos.

En términos simples, la correlación resume en un solo número la dirección y la intensidad de la relación entre dos series de datos. El resultado suele expresarse entre -1 y +1. Un valor cercano a +1 indica una relación positiva fuerte; un valor cercano a -1 indica una relación negativa fuerte; y un valor cercano a 0 sugiere una relación lineal débil o inexistente. Sin embargo, interpretar correctamente ese número requiere contexto, revisión visual del gráfico y una comprensión clara del método elegido.

¿Qué significa la correlación?

La correlación no prueba causalidad. Ese es el primer principio que debes recordar. Que dos variables se muevan juntas no significa que una cause a la otra. Pueden existir variables externas, sesgos de medición, tendencias temporales comunes o simples coincidencias muestrales. Aun así, la correlación es extremadamente útil para:

detectar patrones iniciales en un conjunto de datos,
comparar la fuerza de relaciones entre distintos pares de variables,
construir modelos predictivos,
validar hipótesis exploratorias,
identificar variables potencialmente redundantes.

Tipos principales: Pearson y Spearman

La calculadora de esta página te permite elegir entre dos coeficientes muy usados:

Correlación de Pearson: mide la relación lineal entre dos variables numéricas. Es la más conocida y la adecuada cuando la asociación es aproximadamente lineal y los datos no están fuertemente distorsionados por valores extremos.
Correlación de Spearman: convierte los valores en rangos y mide la asociación monotónica. Es útil cuando la relación no es perfectamente lineal, cuando hay outliers que afectan mucho a Pearson o cuando los datos se interpretan mejor por orden que por distancia exacta.

Fórmula de la correlación de Pearson

La fórmula clásica del coeficiente de Pearson es:

r = cov(X,Y) / (sx · sy)

Donde:

cov(X,Y) es la covarianza entre X y Y,
sx es la desviación estándar de X,
sy es la desviación estándar de Y.

La idea central es sencilla: primero se mide si ambas variables tienden a desviarse de sus medias en la misma dirección; luego se estandariza ese valor para obtener un coeficiente comparable entre diferentes escalas.

Cómo calcularla manualmente

Si quieres aprender el proceso de forma conceptual, sigue estos pasos:

Empareja las observaciones. Cada valor de X debe corresponder exactamente con un valor de Y.
Calcula la media de X y la media de Y.
Resta a cada valor su media correspondiente para obtener las desviaciones.
Multiplica las desviaciones emparejadas de X e Y.
Suma esos productos para obtener la covarianza no normalizada.
Calcula la desviación estándar de X y de Y.
Divide la covarianza por el producto de ambas desviaciones estándar.

Cuando el resultado final es positivo, ambas variables suelen moverse en la misma dirección. Si es negativo, una tiende a subir cuando la otra baja. Si es cercano a cero, la relación lineal es baja.

Ejemplo práctico sencillo

Supón que deseas estudiar la relación entre horas de estudio y calificación final. Si al aumentar las horas también aumentan las notas de forma bastante consistente, obtendrás una correlación positiva. Si, en cambio, observas una nube sin estructura aparente, el coeficiente podría estar cerca de cero. El gráfico de dispersión es fundamental porque muestra si la relación es realmente lineal o si existen curvaturas, grupos separados o valores atípicos.

Interpretación orientativa	Rango de r	Lectura práctica
Muy fuerte negativa	-1.00 a -0.80	Las variables se mueven en direcciones opuestas de forma muy consistente.
Moderada negativa	-0.79 a -0.40	Existe tendencia inversa apreciable, pero con más dispersión.
Débil o casi nula	-0.39 a 0.39	La relación lineal es baja o poco útil para predicción simple.
Moderada positiva	0.40 a 0.79	Las variables suelen aumentar juntas con cierta consistencia.
Muy fuerte positiva	0.80 a 1.00	La relación lineal es muy marcada y visualmente clara.

Cuándo usar Spearman en lugar de Pearson

Spearman es especialmente conveniente en tres situaciones. Primero, cuando la relación es monotónica pero no lineal; por ejemplo, una variable aumenta rápido al inicio y luego se estabiliza. Segundo, cuando existen outliers que alteran mucho la pendiente y la varianza. Tercero, cuando trabajas con escalas ordinales, rankings o posiciones. Al basarse en rangos, Spearman es más robusto para relaciones de orden.

Errores frecuentes al calcular la correlación entre dos variables

Comparar listas con distinta longitud. Si X tiene 10 datos y Y tiene 9, el cálculo no es válido.
Desalinear observaciones. Cambiar el orden rompe el emparejamiento y genera un resultado engañoso.
Ignorar outliers. Un solo valor extremo puede inflar o hundir la correlación de Pearson.
Confundir correlación con causalidad. Es un error clásico y muy costoso en toma de decisiones.
No mirar el gráfico. Dos conjuntos diferentes pueden compartir un valor parecido de r y, sin embargo, mostrar patrones radicalmente distintos.

Cómo interpretar la correlación en negocios y análisis de datos

En analítica comercial, la correlación se usa para examinar si el gasto publicitario se relaciona con las ventas, si el tiempo de permanencia se asocia con la conversión, o si el precio se vincula con la demanda. En recursos humanos, puede explorarse la relación entre formación y productividad. En operaciones, entre tiempos de espera y satisfacción del cliente. En cada caso, el coeficiente sirve como señal inicial, no como prueba definitiva.

Una práctica profesional recomendable es combinar la correlación con:

gráficos de dispersión,
segmentación por grupos,
regresión simple o múltiple,
revisión temporal,
análisis de variables de confusión.

Ejemplos con estadísticas conocidas de conjuntos de datos públicos y académicos

La siguiente tabla muestra ejemplos ampliamente utilizados en docencia y análisis exploratorio. Son útiles para entender magnitudes de correlación reales en datos conocidos:

Conjunto de datos	Variables comparadas	Correlación aproximada	Comentario
mtcars	Consumo de combustible (mpg) vs peso del auto (wt)	r ≈ -0.868	Relación negativa fuerte: los autos más pesados tienden a tener menos millas por galón.
Iris	Largo del sépalo vs largo del pétalo	r ≈ 0.872	Relación positiva fuerte en uno de los conjuntos clásicos de clasificación.
Anscombe I	X vs Y	r ≈ 0.816	Ejemplo famoso que demuestra por qué el gráfico es tan importante como el coeficiente.

Por qué una misma correlación puede esconder historias muy distintas

Uno de los aprendizajes más valiosos en estadística aplicada es que un único valor de correlación no describe por completo la estructura de los datos. Dos pares de variables pueden tener una correlación muy parecida y, aun así, diferir en:

curvatura,
heterogeneidad de la varianza,
presencia de grupos,
valores atípicos,
tamaño de muestra.

Por eso, esta calculadora incorpora un gráfico de dispersión. La vista visual complementa el número y permite comprobar si la relación observada parece lineal, monotónica o potencialmente afectada por casos extremos.

Qué tamaño de muestra necesito

No existe un único tamaño mínimo universal, porque depende de la fuerza esperada de la relación y del nivel de precisión que busques. Aun así, en la práctica, una muestra muy pequeña puede generar coeficientes inestables. Con 5 o 6 puntos ya es posible calcular una correlación, pero las conclusiones serán frágiles. Con más observaciones, el resultado suele ser más estable y representativo. En análisis serios, además del coeficiente, se suele revisar significancia estadística e intervalos de confianza.

Relación entre correlación y regresión

La correlación mide asociación; la regresión modela una relación funcional. Son conceptos relacionados, pero no idénticos. Si obtienes una correlación alta, podrías avanzar hacia una regresión lineal para estimar cuánto cambia Y cuando X cambia una unidad. Sin embargo, una correlación alta no garantiza un modelo adecuado si la relación no es lineal o si hay problemas de calidad de datos.

Fuentes de referencia recomendadas

Si deseas profundizar con materiales de alta autoridad, revisa estas referencias:

Conclusión

Entender cómo calcular la correlación entre dos variables es una habilidad fundamental para cualquier persona que trabaje con datos. El proceso matemático no es complicado, pero su interpretación exige criterio. Usa Pearson cuando analices relaciones lineales entre variables numéricas y Spearman cuando te interesen los rangos o la monotonicidad. Comprueba siempre que los datos estén emparejados, revisa el gráfico de dispersión y evita sacar conclusiones causales automáticas. Si aplicas estas buenas prácticas, la correlación se convierte en una herramienta poderosa para descubrir patrones útiles y tomar decisiones mejor informadas.

Nota: los rangos interpretativos son orientativos. En investigación aplicada, la relevancia de un coeficiente depende del contexto, del tamaño de muestra, del error de medición y del objetivo analítico.

Como Calcular La Correlacion Entre Dos Variables