Análisis bivariante

AuthorJordi Mas Elias
ProfessionProfesor de los Estudios de Derecho y Ciencia Política en la Universitat Oberta de Catalunya (UOC)
Pages189-250
Editorial UOC Capítulo IV. Análisis bivariante
189
Capítulo IV
Análisis bivariante
1. Introducción
El análisis bivariante se ocupa del análisis estadístico con dos
variables. A veces las funciones del análisis bivariante se confun-
den con las del análisis univariante, puesto que a menudo este
último también admite el análisis con dos variables. La gran dis-
tinción, sin embargo, es que el análisis univariante está orientado
a hacer comparaciones entre subgrupos y describir las similitudes
y las diferencias de esta variable entre subgrupos, mientras que
el análisis bivariante busca principalmente explicar cómo dos
variables se relacionan entre sí (Babbie, 2013). Por ejemplo, en
análisis univariante podemos observar si los países que tienen
acceso al mar son más ricos que los países que no lo tienen. En
cambio, en análisis bivariante, buscaremos la asociación entre
estas dos variables y diremos que tener acceso al mar tiene un
efecto sobre la riqueza. Cuando hablemos, pues, de asociaciones
o efectos entre variables, solo lo haremos mediante las técnicas
del análisis bivariante, que nos permitirá sugerir desde un punto
de vista estadístico si el comportamiento de una variable está
parcialmente determinado por la otra (King y otros, 1994).
Establecer asociaciones entre dos variables es una práctica
frecuente en el día a día. Acostumbramos a decir que la con-
taminación tiene un efecto sobre el calentamiento global, que
los países democráticos suelen ser más ricos o que tener una
ideología de derechas influye a la hora de votar un partido
Editorial UOC Análisis de datos con R en estudios internacionales
190
determinado. En otras palabras, creemos que si conocemos
los valores de la primera variable (niveles de contaminación,
democracia o ideología) podremos saber algo sobre los valores
de la segunda variable (calentamiento global, riqueza o voto a
partido) porque creemos que están relacionadas. Llamaremos a
la primera variable, que es la que pensamos que causa el efec-
to, variable independiente y la ilustraremos con el símbolo x. La
segunda variable, que es la que creemos que está afectada por
la variable independiente, la denominaremos variable dependiente
y la ilustraremos con el símbolo y.
Otras denominaciones de las variables
Hay otras maneras de referirse a las variables independiente y depen-
diente. A la variable independiente se la denomina variable explicativa,
mientras que la variable dependiente es llamada variable explicada o de
respuesta.
Para visualizar y cuantificar estadísticamente una asociación
bivariante, utilizaremos una técnica diferente según si las varia-
bles independiente y dependiente son numéricas o categóricas.
En la tabla 13 resumimos la técnica utilizada según el tipo de
variable y si ocupa la posición de independiente o dependiente. Si
tanto la variable independiente como la dependiente son categó-
ricas, utilizaremos una tabla de contingencia. Si, en cambio, tanto
la variable independiente como la dependiente son numéricas,
utilizaremos la regresión y la correlación. Si la variable indepen-
diente es categórica y la dependiente es continua, usaremos la
diferencia de medias. Finalmente, si la variable independiente es
continua y la variable dependiente es categórica, haremos una
regresión logística.
Editorial UOC Capítulo IV. Análisis bivariante
191
Tabla 13. Técnicas de análisis bivariante
Variable independiente
Categórica Numérica
Variable
dependiente
Categórica Tablas de contingencia (Regresión logística)
Numérica Diferencia de medias Regresión y correlación
Fuente: elaboración propia.
En este capítulo no explicaremos la regresión logística, de
forma que las páginas siguientes describirán las otras tres técnicas
de análisis bivariante:
• la tabla de contingencia,
• la diferencia de medias, y
• la regresión y la correlación.
Cada apartado muestra primero cómo representar visualmen-
te una relación bivariante según si las variables independiente y
dependiente son numéricas o categóricas, y a continuación se
explica la manera de cuantificar la relación.
Aunque las técnicas utilizadas cambien según los tipos de
variable, todas las combinaciones tienen unos requisitos similares
para indicar si dos variables tienen relación.
El primer requisito, que es el que trataremos con más pro-
fundidad en estas páginas, es que la asociación observada tenga
apoyo estadístico. A veces podemos observar asociaciones poco
consistentes entre variables. Por ejemplo, si echamos una mone-
da y sale dos veces cara, sería una inferencia débil decir que
siempre saldrá cara. Desde un punto de vista estadístico, basado
en las teorías de la probabilidad, para hacer inferencias a partir de

To continue reading

Request your trial

VLEX uses login cookies to provide you with a better browsing experience. If you click on 'Accept' or continue browsing this site we consider that you accept our cookie policy. ACCEPT