Funciones de grafico scatterplot en R para correlación de variables

26.04.2015 18:22

En análisis de marketing, uno de los problemas básicos que se nos plantea, es determinar cuál de las características de un cliente/mercado, facilitan que se produzca una venta con mayor probabilidad.

En estadística existe un modelo de regresión lineal muy útil para determinar que variables son las más significativas y si existe una relación lineal que permita establecer una línea recta de función que relacione de una manera clara una con otra.

Un graficó típico de dispersión nos permite observar la distribución de una variable respecto de otra como vemos a continuación

Como vemos, aunque las variables parecen distribuirse de manera caótica, puede  establecerse una recta en que la suma de las distancias entre los puntos que quedan en la parte inferior y los que quedan en la parte superior sea igual. Estaríamos, por tanto en un modelo que relaciona las dos variables, estableciendo una correlación que podemos cuantificar con un parámetro o valor de correlación que va de 0 a 1

Por tanto, a la hora de determinar un modelo nos será útil un  gráfico que nos permita visualizar de manera clara tanto las variables con su parámetro de correlación, como sus gráficos asociados,  y es precisamente lo que nos proporciona la función pairs de R.

Pairs nos muestra una matriz de gráficos como la siguiente:

Podemos observar a simple vista las variables que muestran un indice alto y una linea de regresion clara y las que no :

Los gráficos del tipo scatterplot admiten gran variedad de configuraciones una muestra de las cuales puede verse en este enlace:  https://www.statmethods.net/graphs/scatterplot.html

Utilizando  la potencia de qlikview y R como motor, es posible configurar aplicaciones para analizar gran cantidad de segmentos y variables con gran rapidez y efectividad

Un ejemplo de integración de R con qlikview puede descargarse desde el siguiente link:

https://community.qlik.com/docs/DOC-3981