Segmentación geodemográfica


En marketing , la segmentación geodemográfica es una técnica de clasificación estadística multivariada para descubrir si los individuos de una población pertenecen a diferentes grupos al hacer comparaciones cuantitativas de múltiples características con el supuesto de que las diferencias dentro de cualquier grupo deben ser menores que las diferencias entre grupos.

El uso de diferentes algoritmos conduce a diferentes resultados, pero no existe un mejor enfoque único para seleccionar el mejor algoritmo, al igual que ningún algoritmo ofrece ninguna prueba teórica de su certeza. [1] Una de las técnicas más utilizadas en la segmentación geodemográfica es el conocido algoritmo de agrupamiento k-means . De hecho, la mayoría de los sistemas geodemográficos comerciales actuales se basan en un algoritmo k-means. Aún así, las técnicas de agrupamiento provenientes de redes neuronales artificiales, algoritmos genéticos o lógica difusa son más eficientes dentro de grandes bases de datos multidimensionales (Brimicombe 2007).

Las redes neuronales pueden manejar relaciones no lineales, son resistentes al ruido y exhiben un alto grado de automatización. No asumen hipótesis sobre la naturaleza o distribución de los datos y brindan una valiosa ayuda en el manejo de problemas de carácter geográfico que, hasta la fecha, han sido imposibles de resolver. Uno de los métodos de redes neuronales más conocidos y eficientes para lograr la agrupación en clústeres no supervisada es el Mapa autoorganizado (SOM). SOM se ha propuesto como una mejora sobre el método k-means, ya que proporciona un enfoque más flexible para la agrupación de datos censales. El método SOM ha sido utilizado recientemente por Spielman y Thill (2008) para desarrollar la agrupación geodemográfica de un conjunto de datos censales relacionados con Nueva York. Ciudad.

Otra forma de caracterizar la similitud de un polígono individual con todas las regiones se basa en la lógica difusa . El concepto básico del agrupamiento borroso es que un objeto puede pertenecer a más de un grupo. En lógica binaria, el conjunto está limitado por la definición binaria sí – no, lo que significa que un objeto pertenece o no a un grupo. El agrupamiento difuso permite que una unidad espacial pertenezca a más de un conglomerado con diferentes valores de membresía. La mayoría de los estudios relacionados con el análisis geodemográfico y la lógica difusa emplean el algoritmo Fuzzy C-Means y el algoritmo Gustafson-Kessel, [1] (Feng y Flowerdew 1999).

Los sistemas de segmentación geodemográfica famosos son Claritas Prizm (EE. UU.), CanaCode Lifestyles (Canadá), PSYTE HD (Canadá), Tapestry (EE. UU.), CAMEO (Reino Unido), ACORN (Reino Unido) y el sistema MOSAIC (Reino Unido). También están surgiendo nuevos sistemas dirigidos a subgrupos de la población. Por ejemplo, Segmentos examina los estilos de vida geodemográficos de los hispanos en los Estados Unidos. Tanto MOSAIC como ACORN usan onomástica para inferir el origen étnico de los nombres de los residentes. [2] [3]

CanaCode Lifestyle Clusters es desarrollado por Manifold Data Mining y clasifica los códigos postales canadienses en 18 grupos de estilo de vida principales distintos y 110 estilos de vida de nicho. [4] Utiliza estadísticas del año en curso sobre más de 10.000 variables que van desde datos demográficos hasta factores socioeconómicos, gastos y rasgos de estilo de vida (p. ej., comportamientos del consumidor), incluido el uso de productos, el uso de medios y la psicografía.