A la hora de crear mapas temáticos y analizar la variable contenida en el mapa, es muy probable que hayamos utilizado el método de cuantiles, pero ¿acaso es el único método para tramear? ¿existen otros métodos? ¿sabías que existe un método llamado Corte Naturales de Jenks? Y lo más importante, en el caso de interpretar mapas, donde ya hay una connotación geográfica… ¿qué es lo más recomendable? ¿a partir de qué método es más fácil interpretar mapas y obtener conclusiones?
Esto es lo que veremos en este video artículo.
Empecemos.
Lo que queremos es los que tramos “nos hablen”
Todos lo que nos dedicamos a análisis de negocio tenemos la premisa que para interpretar las cifras necesitamos usar tramos con el principal objetivo que agrupe elementos (ya sea clientes, tiendas, productos y un largo etcétera) con similares comportamientos.
Es importante como analista de negocio, sacar el “oro” de muchas fuentes con el objetivo de generar conclusiones y recomendaciones.
Por eso, es necesario que los tramos “nos hablen”, “nos digan” los grupos de unidades (clientes, tiendas, productos, regiones, etc.) que tienen comportamiento similar, con el fin de ir generando las hipótesis de negocio, es decir, interpretando los datos y a partir de ahí, generar conclusiones y recomendaciones.
Sin entrar en el detalle estadístico o matemático, principalmente porque no soy ni estadístico, ni matemático L ; lo que busco con este artículo es mostrar de forma práctica las ventajas de utilizar los cortes naturales de jenks vs el método de los cuantiles.
Personalmente prefiero perder algo de rigurosidad matemática, si con eso gano velocidad en el análisis.
Por tanto, a continuación, verás una explicación de negocio y no tanto una explicación matemática.
Como digo, los tramos nos deben servir para generar conclusiones de negocio, son una herramienta, no un fin. Y siempre depende del contexto de negocio.
Empecemos por algo básico ¿Por qué tramear variables?
La respuesta es muy simple, al tramear una variable lo que se busca es juntar en un mismo rango (intervalo) de valores a los elementos que tienen un valor similar.
Si no usamos tramos o rangos de valor, sería complicado analizar variables numéricas como el peso, la longitud, densidad, edad o el sueldo, por citar algunas variables.
En el caso de negocio que veremos en este artículo vamos a tramear el número de clientes por zona geográfica.
Método 1 – ¿Qué son los cortes de Jenks?
Hay algunas veces que me gusta echar mano de la historia, y ésta es una de esas pocas oportunidades que tengo.
George Frederick Jenks fue un cartógrafo norteamericano del siglo XX. Se graduó en la Universidad de Syracusa y trabajó en la Universidad de Kansas durante 37 años. Fue en esta universidad que dictó el curso de Cartografía. Dedicó mucho tiempo a promover técnicas de mejora cartográfica, así como investigar con mapas tridimensionales, mapas temáticos y geo estadística.
Jenks quería mejorar la precisión/rigurosidad visual de los mapas coropléticos (mapas temáticos que representan una variable, más información en https://es.wikipedia.org/wiki/Mapa_coropl%C3%A9tico ) usando elementos que eviten usar las medias para generalizar los datos.
Jenks buscaba visualizar las diferencias entre los tramos de las variables
La situación geo estadística genera que, debido a las connotaciones propias de la geografía se puedan presentar y visualizar casos de valores extremos (valores extremos de densidad de población o una superficie, por citar algunas métricas). Y es ahí donde su método aplica muy pero muy bien.
Si quieres echar una mirada a la historia de George Jenks, aquí te dejo el enlace a la Wikipedia. https://en.wikipedia.org/wiki/Jenks_natural_breaks_optimization
Método 2 – ¿Qué son cuantiles?
Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de una variable aleatoria.
El término cuantil fue usado por primera vez por Kendall en 1940.
Los cuantiles suelen usarse por grupos que dividen la distribución en partes iguales; entendidas éstas como intervalos que comprenden la misma proporción de valores. Los más usados son:
- Los cuartiles, que dividen a la distribución en cuatro partes (corresponden a los cuantiles 0,25; 0,50 y 0,75);
- Los quintiles, que dividen a la distribución en cinco partes (corresponden a los cuantiles 0,20; 0,40; 0,60 y 0,80);
- Los deciles, que dividen a la distribución en diez partes;
- Los percentiles, que dividen a la distribución en cien partes.
Caso de negocio de geomarketing– Número de clientes por zonas geográficas
El caso de negocio que usaremos para mostrar las diferencias al usar cada método parte de esta hoja de valores.
Supongamos que tenemos la siguiente tabla de clientes por Comunidad Autónoma (CCAA) de España.