A la hora de crear mapas temáticos y analizar la variable contenida en el mapa, es muy probable que hayamos utilizado el método de cuantiles, pero ¿acaso es el único método para tramear? ¿existen otros métodos? ¿sabías que existe un método llamado Corte Naturales de Jenks? Y lo más importante, en el caso de interpretar mapas, donde ya hay una connotación geográfica… ¿qué es lo más recomendable? ¿a partir de qué método es más fácil interpretar mapas y obtener conclusiones?
Esto es lo que veremos en este video artículo.
Empecemos.
Índice
Lo que queremos es los que tramos “nos hablen”
Todos lo que nos dedicamos a análisis de negocio tenemos la premisa que para interpretar las cifras necesitamos usar tramos con el principal objetivo que agrupe elementos (ya sea clientes, tiendas, productos y un largo etcétera) con similares comportamientos.
Es importante como analista de negocio, sacar el “oro” de muchas fuentes con el objetivo de generar conclusiones y recomendaciones.
Por eso, es necesario que los tramos “nos hablen”, “nos digan” los grupos de unidades (clientes, tiendas, productos, regiones, etc.) que tienen comportamiento similar, con el fin de ir generando las hipótesis de negocio, es decir, interpretando los datos y a partir de ahí, generar conclusiones y recomendaciones.
Sin entrar en el detalle estadístico o matemático, principalmente porque no soy ni estadístico, ni matemático L ; lo que busco con este artículo es mostrar de forma práctica las ventajas de utilizar los cortes naturales de jenks vs el método de los cuantiles.
Personalmente prefiero perder algo de rigurosidad matemática, si con eso gano velocidad en el análisis.
Por tanto, a continuación, verás una explicación de negocio y no tanto una explicación matemática.
Como digo, los tramos nos deben servir para generar conclusiones de negocio, son una herramienta, no un fin. Y siempre depende del contexto de negocio.
Empecemos por algo básico ¿Por qué tramear variables?
La respuesta es muy simple, al tramear una variable lo que se busca es juntar en un mismo rango (intervalo) de valores a los elementos que tienen un valor similar.
Si no usamos tramos o rangos de valor, sería complicado analizar variables numéricas como el peso, la longitud, densidad, edad o el sueldo, por citar algunas variables.
En el caso de negocio que veremos en este artículo vamos a tramear el número de clientes por zona geográfica.
Método 1 – ¿Qué son los cortes de Jenks?
Hay algunas veces que me gusta echar mano de la historia, y ésta es una de esas pocas oportunidades que tengo.
George Frederick Jenks fue un cartógrafo norteamericano del siglo XX. Se graduó en la Universidad de Syracusa y trabajó en la Universidad de Kansas durante 37 años. Fue en esta universidad que dictó el curso de Cartografía. Dedicó mucho tiempo a promover técnicas de mejora cartográfica, así como investigar con mapas tridimensionales, mapas temáticos y geo estadística.
Jenks quería mejorar la precisión/rigurosidad visual de los mapas coropléticos (mapas temáticos que representan una variable, más información en https://es.wikipedia.org/wiki/Mapa_coropl%C3%A9tico ) usando elementos que eviten usar las medias para generalizar los datos.
Jenks buscaba visualizar las diferencias entre los tramos de las variables
La situación geo estadística genera que, debido a las connotaciones propias de la geografía se puedan presentar y visualizar casos de valores extremos (valores extremos de densidad de población o una superficie, por citar algunas métricas). Y es ahí donde su método aplica muy pero muy bien.
Si quieres echar una mirada a la historia de George Jenks, aquí te dejo el enlace a la Wikipedia. https://en.wikipedia.org/wiki/Jenks_natural_breaks_optimization
Método 2 – ¿Qué son cuantiles?
Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de una variable aleatoria.
El término cuantil fue usado por primera vez por Kendall en 1940.
Los cuantiles suelen usarse por grupos que dividen la distribución en partes iguales; entendidas éstas como intervalos que comprenden la misma proporción de valores. Los más usados son:
- Los cuartiles, que dividen a la distribución en cuatro partes (corresponden a los cuantiles 0,25; 0,50 y 0,75);
- Los quintiles, que dividen a la distribución en cinco partes (corresponden a los cuantiles 0,20; 0,40; 0,60 y 0,80);
- Los deciles, que dividen a la distribución en diez partes;
- Los percentiles, que dividen a la distribución en cien partes.
Caso de negocio de geomarketing– Número de clientes por zonas geográficas
El caso de negocio que usaremos para mostrar las diferencias al usar cada método parte de esta hoja de valores.
Supongamos que tenemos la siguiente tabla de clientes por Comunidad Autónoma (CCAA) de España.
A continuación, generamos este gráfico que muestra lo que aporta cada CCAA de forma individual y acumulada:
Distribución de clientes usando el método de los cortes naturales de Jenks
Tablas y gráficos usando Cortes Naturales de Jenks (3 tramos)
Aplicando los cortes naturales de Jenks, obtendríamos la siguiente tabla:
A continuación, vemos el mapa temático con la variable de cliente (mapa generado usando la plataforma Xpert de Axesor)
Por tanto, usando los Cortes de Jenks obtendríamos estos grupos de CCAA
Conclusión de los tramos de clientes usando los cortes de Jenks
- Agrupa los valores muy altos (12 K y 9K) en el tramo alto. Los valores intermedios, entre 5K y 2K en el tramo medio y el resto, valores de menos de 700 en el tramo bajo.
- Desde un punto de vista de negocio, lo veo riguroso. Agrupa en tramos los valores similares de este ejemplo.
Distribución de clientes usando el método de los cuantiles
Tablas y gráficos usando cuantiles (3 tramos)
Aplicando el método de los cuantiles obtendremos esta tabla:
Lo que generaría el siguiente mapa temático:
Por tanto, usando cuantiles obtendríamos estos grupos de CCAA
Conclusión de los tramos de clientes usando los cuantiles
- En el tramo alto tenemos valores de 12K (Madrid) y a País Vasco (2K), donde ya veo una alta desviación. En el tramo medio están valores de 700 a 300 y en el tramo bajo están los valores por debajo de 400.
- Desde un punto de vista de negocio, no me gusta que tengamos tanta disparidad en los tramos. Es posible que algunos piensen que antes he debido analizar la desviación estándar, pero como dije al inicio del artículo, prefiero personalmente utilizar métodos que me den rapidez.
Comparativa de los cortes naturales de Jenks vs Cuantiles
A continuación, podemos ver los dos mapas temáticos obtenidos
Conclusiones a la hora de analizar un mapa temático con este caso de negocio
- Partiendo de la situación de la geografía, donde habitualmente vemos valores extremos de variables (por ejemplo, densidad poblacional en una zona porque hay un edificio de 20 plantas respecto a una zona de viviendas unifamiliares o chalets) utilizar los Cortes Naturales permiten generar los tramos con valores similares
- Los cuantiles parten de la situación que dividen la distribución en partes iguales, y creo que los cuantiles sí se deben usar en casos donde las variables pueden tener mayor “similitud”.
- Los Cortes Naturales al agrupar tramos con valores más similares generan mapas temáticos más claros y, por tanto, tienen mayor facilidad a la hora de interpretar las variables. En este caso de negocio se ve claramente.
Video resumen del artículo
¿Te parece que los mapas temáticos utilizando Cortes Naturales de Jenks son más fáciles de interpretar? ¿En qué caso crees que no se debería utilizar este método? ¿Tienes alguna experiencia en donde los cuantiles han sesgado el análisis?
De antemano agradezco tus comentarios.
Si te he aportado alguna idea o te ha parecido interesante este artículo, ayúdame a difundirlo.
1 abrazo
Omar
Deja una respuesta