Modelado de mejora

El modelado de elevación , también conocido como modelado incremental , modelado de elevación real o modelado de red es una técnica de modelado predictivo que modela directamente el impacto incremental de un tratamiento (como una acción de marketing directo) en el comportamiento de un individuo.

El modelado de mejora tiene aplicaciones en la gestión de relaciones con los clientes para el modelado de venta ascendente, venta cruzada y retención. También se ha aplicado a la elección política y la medicina personalizada . A diferencia del concepto relacionado de predicción diferencial en psicología, Uplift Modeling asume un agente activo.

Introducción

El modelado Uplift utiliza un control científico aleatorio no solo para medir la efectividad de una acción, sino también para construir un modelo predictivo que predice la respuesta incremental a la acción. Se trata de una minería de datos técnica que se ha aplicado sobre todo en los servicios financieros, las telecomunicaciones y las industrias de comercialización directa al por menor para aumentar las ventas , la venta cruzada , la rotación y la retención de las actividades.

Medición de la elevación

La mejora de una campaña de marketing generalmente se define como la diferencia en la tasa de respuesta entre un grupo tratado y un grupo de control aleatorizado . Esto permite a un equipo de marketing aislar el efecto de una acción de marketing y medir la efectividad o no de esa acción de marketing individual. Los equipos de marketing honestos solo se atribuirán el mérito del efecto incremental de su campaña.

Sin embargo, muchos especialistas en marketing definen la elevación (en lugar de la elevación) como la diferencia en la tasa de respuesta entre el tratamiento y el control, por lo que el modelado de la elevación se puede definir como una mejora (aumento) de la elevación a través de un modelo predictivo.

La siguiente tabla muestra los detalles de una campaña que muestra el número de respuestas y la tasa de respuesta calculada para una campaña de marketing hipotética. Esta campaña se definiría con un aumento de la tasa de respuesta del 5%. Ha creado 50.000 respuestas incrementales (100.000 - 50.000).

Grupo	Numero de clientes	Respuestas	Tasa de respuesta
Tratado	1,000,000	100.000	10%
Control	1,000,000	50.000	5%

Modelado de respuesta tradicional

El modelado de respuesta tradicional generalmente toma un grupo de clientes tratados e intenta construir un modelo predictivo que separa a los que probablemente responden de los que no responden mediante el uso de una de varias técnicas de modelado predictivo . Normalmente, esto usaría árboles de decisión o análisis de regresión .

Este modelo solo usaría a los clientes tratados para construir el modelo.

En contraste, el modelado de mejora utiliza tanto a los clientes tratados como a los de control para construir un modelo predictivo que se centra en la respuesta incremental. Para entender este tipo de modelo se propone que existe una segmentación fundamental que separa a los clientes en los siguientes grupos (sus nombres fueron sugeridos por N. Radcliffe y explicados en ^[1] )

The Persuadables : clientes que solo responden a la acción de marketing porque estaban dirigidos
Las cosas seguras : clientes que habrían respondido tanto si eran el objetivo como si no
Las Causas Perdidas : clientes que no responderán independientemente de si son objetivo o no.
No molestar o perros durmientes : clientes que tienen menos probabilidades de responder porque fueron atacados

El único segmento que proporciona verdaderas respuestas incrementales es el Persuadables .

El modelado de mejora proporciona una técnica de puntuación que puede separar a los clientes en los grupos descritos anteriormente.

El modelado de respuesta tradicional a menudo se enfoca en los Sure Things que no pueden distinguirlos de los Persuadables .

Retorno de la inversión

Debido a que el modelado de mejora se centra únicamente en respuestas incrementales, proporciona un gran retorno de los casos de inversión cuando se aplica a las actividades tradicionales de generación y retención de la demanda. Por ejemplo, al apuntar solo a los clientes persuadibles en una campaña de marketing saliente , los costos de contacto y, por lo tanto, el retorno por unidad de gasto se pueden mejorar dramáticamente.

Eliminación de efectos negativos

Uno de los usos más eficaces del modelo de mejora es la eliminación de los efectos negativos de las campañas de retención. Tanto en la industria de las telecomunicaciones como en la de los servicios financieros, las campañas de retención pueden hacer que los clientes cancelen un contrato o una póliza. El modelo Uplift permite que estos clientes, los No molestar, se eliminen de la campaña.

Aplicación a pruebas A / B y multivariadas

Rara vez se da el caso de que haya un solo grupo de tratamiento y de control. A menudo, el "tratamiento" puede ser una variedad de variaciones simples de un mensaje o una estrategia de contacto de múltiples etapas que se clasifica como un solo tratamiento. En el caso de las pruebas A / B o multivariadas , el modelo de mejora puede ayudar a comprender si las variaciones en las pruebas proporcionan una mejora significativa en comparación con otros criterios de focalización, como los indicadores de comportamiento o demográficos.

Historia del modelado de levantamiento

La primera aparición del modelo de respuesta real parece estar en el trabajo de Radcliffe y Surry. ^[2]

Victor Lo también publicó sobre este tema en The True Lift Model (2002), ^[3] y posteriormente Radcliffe nuevamente con Using Control Groups to Target on Predicted Lift: Building and Assessing Uplift Models (2007). ^[4]

Radcliffe también proporciona una sección de preguntas frecuentes (FAQ) muy útil en su sitio web, Scientific Marketer. ^[5] Lo (2008) proporciona un marco más general, desde el diseño de programas hasta el modelado predictivo y la optimización, junto con áreas de investigación futuras. ^[6]

Piotr Rzepakowski ha estudiado el modelado de elevación independiente. Junto con Szymon Jaroszewicz, adaptó la teoría de la información para construir árboles de decisión de elevación de clases múltiples y publicó el artículo en 2010. ^[7] Y más tarde en 2011 ampliaron el algoritmo a casos de tratamiento múltiple. ^[8]

Se han explorado enfoques similares en la medicina personalizada . ^[9]^[10] Szymon Jaroszewicz y Piotr Rzepakowski (2014) diseñaron una metodología de mejora para el análisis de supervivencia y la aplicaron al análisis de ensayos controlados aleatorios. ^[11] Yong (2015) combinó un algoritmo de optimización matemática a través de la programación dinámica con métodos de aprendizaje automático para estratificar a los pacientes de manera óptima. ^[12]

El modelado de elevación es un caso especial del antiguo concepto de psicología de predicción diferencial. ^[13] En contraste con la predicción diferencial, el modelado de elevación asume un agente activo y utiliza la medida de elevación como una métrica de optimización.

El modelado de elevación se ha ampliado e incorporado recientemente en diversos algoritmos de aprendizaje automático , como Programación lógica inductiva , ^[13] Red bayesiana , ^[14] Aprendizaje relacional estadístico , ^[10] Máquinas de vectores de soporte , ^[15]^[16] Análisis de supervivencia ^[11] y aprendizaje en conjunto . ^[17]

Aunque el modelo de mejora se aplica ampliamente en la práctica del marketing (junto con las elecciones políticas), rara vez ha aparecido en la literatura de marketing. Kane, Lo y Zheng (2014) publicaron un análisis exhaustivo de tres conjuntos de datos utilizando múltiples métodos en una revista de marketing y proporcionaron evidencia de que un enfoque más nuevo (conocido como el Método de los Cuatro Cuadrantes) funcionó bastante bien en la práctica. ^[18] Recientemente, Lo y Pachamanova (2015) ampliaron el modelado de elevación a la analítica prescriptiva para múltiples situaciones de tratamiento y propusieron algoritmos para resolver grandes problemas de optimización determinista y problemas complejos de optimización estocástica donde las estimaciones no son exactas. ^[19]

Aquí se puede encontrar una descripción detallada del modelado de uplift, su historia, la forma en que se construyen los modelos de uplift, las diferencias con la construcción de modelos clásicos, así como las técnicas de evaluación específicas de uplift, una comparación de varias soluciones de software y una explicación de diferentes escenarios económicos. ^[20]

Implementaciones

paquete de elevación para R
JMP por SAS
Retrato de Pitney Bowes
Nodo de elevación para KNIME de Dymatrix
pylift para Python
Modelado Uplift en Miró por Stochastic Solutions

Conjuntos de datos

Conjunto de datos de marketing por correo electrónico de Hillstrom
Conjunto de datos de predicción de elevación de Criteo

notas y referencias

^ N. Radcliffe (2007). Identificar quiénes pueden ser salvados y quiénes serán ahuyentados por la actividad de retención . Solución estocástica limitada
^ Radcliffe, Nueva Jersey; y Surry, PD (1999); Análisis de respuesta diferencial: modelado de la respuesta real aislando el efecto de una sola acción , en Proceedings of Credit Scoring and Credit Control VI , Credit Research Center, University of Edinburgh Management School
^ Lo, VSY (2002); The True Lift Model , ACM SIGKDD Explorations Newsletter, vol. 4, No. 2, 78–86, disponible en http://www.sigkdd.org/sites/default/files/issues/4-2-2002-12/lo.pdf Archivado el 20 de enero de 2015 en Wayback Máquina
^ Radcliffe, Nueva Jersey (2007); Uso de grupos de control para apuntar al aumento previsto: creación y evaluación de modelos de mejora , diario de análisis de marketing directo, asociación de marketing directo
^ Las preguntas frecuentes de Scientific Marketer sobre modelado de mejora
^ Lo, VSY (2008) "Nuevas oportunidades en la minería de datos de marketing". En Encyclopedia of Data Warehousing and Mining, segunda edición, editado por Wang (2008), Idea Group Publishing.
^ Rzepakowski, Piotr; Jaroszewicz, Szymon (2010). Árboles de decisión para modelado de elevación . En Actas de la 10ª Conferencia Internacional IEEE sobre Minería de Datos (ICDM'10) . Sydney, Australia. págs. 441–450. doi : 10.1109 / ICDM.2010.62 . ISBN 978-1-4244-9131-5.
^ Rzepakowski, Piotr; Jaroszewicz, Szymon (2011). "Árboles de decisión para el modelado de uplift con tratamientos únicos y múltiples" . Sistemas de conocimiento e información . 32 (2): 303–327. doi : 10.1007 / s10115-011-0434-0 .
^ Cai, T .; Tian, L .; Wong, PH; y Wei, LJ (2009); Análisis de datos de ensayos clínicos comparativos aleatorios para selecciones de tratamientos personalizados , serie de documentos de trabajo sobre bioestadística de la Universidad de Harvard, documento 97
^ a b Nassif, Houssam; Kuusisto, finlandés; Burnside, Elizabeth S; Page, David; Shavlik, Jude; Santos Costa, Vitor (2013). Score As You Lift (SAYL): un enfoque de aprendizaje relacional estadístico para el modelado de mejora . Congreso Europeo de Aprendizaje Automático (ECML'13) . Apuntes de conferencias en Ciencias de la Computación. 8190 . Praga. págs. 595–611. doi : 10.1007 / 978-3-642-40994-3_38 . ISBN 978-3-642-38708-1. PMC 4492311 . PMID 26158122 .
^ a b Jaroszewicz, Szymon; Rzepakowski, Piotr (2014). "Modelado de elevación con datos de supervivencia" (PDF) . Taller ACM SIGKDD sobre Informática en Salud (HI KDD'14) . Nueva York, Estados Unidos.
^ Yong, FH (2015), "Métodos cuantitativos para la medicina estratificada", tesis doctoral, Departamento de bioestadística, Escuela de salud pública Harvard TH Chan, http://dash.harvard.edu/bitstream/handle/1/17463130/YONG -DISERTACIÓN-2015.pdf? Secuencia = 1 .
^ a b Nassif, Houssam; Santos Costa, Vitor; Burnside, Elizabeth S; Page, David (2012). Predicción diferencial relacional . Congreso Europeo de Aprendizaje Automático (ECML'12) . Apuntes de conferencias en Ciencias de la Computación. 7523 . Bristol, Reino Unido. págs. 617–632. doi : 10.1007 / 978-3-642-33460-3_45 . ISBN 978-3-642-33459-7.
^ Nassif, Houssam; Wu, Yirong; Page, David; Burnside, Elizabeth (2012). "Red de Bayes de predicción diferencial lógica, mejora del diagnóstico de cáncer de mama para mujeres mayores" . Simposio de la Asociación Estadounidense de Informática Médica (AMIA'12) . 2012 : 1330-1339. PMC 3540455 . PMID 23304412 .
^ Kuusisto, finlandés; Santos Costa, Vitor; Nassif, Houssam; Burnside, Elizabeth; Page, David; Shavlik, Jude (2014). Soporta máquinas vectoriales para predicción diferencial . Conferencia europea sobre aprendizaje automático (ECML'14) . Apuntes de conferencias en Ciencias de la Computación. 8725 . Nancy, Francia. págs. 50–65. doi : 10.1007 / 978-3-662-44851-9_4 . ISBN 978-3-662-44850-2. PMC 4492338 . PMID 26158123 .
^ Zaniewicz, Lukasz; Jaroszewicz, Szymon (2013). "Máquinas de vectores de soporte para modelado de elevación". El primer taller IEEE ICDM sobre descubrimiento causal . Dallas, Texas.
^ Sołtys, Michał; Jaroszewicz, Szymon; Rzepakowski, Piotr (2015). "Métodos de conjuntos para modelado de levantamiento" . Minería de datos y descubrimiento de conocimientos . 29 (6): 1531-1559. doi : 10.1007 / s10618-014-0383-9 .
^ Kane, K .; Lo, VSY; Zheng, J. (2014). "Minería para clientes y prospectos verdaderamente receptivos mediante el modelado True-Lift: comparación de métodos nuevos y existentes". Revista de análisis de marketing . 2 (4): 218–238. doi : 10.1057 / jma.2014.18 .
^ Lo, VSY; Pachamanova, D. (2015). "Desde el modelado predictivo de elevación a la analítica de elevación prescriptiva: un enfoque práctico para la optimización del tratamiento teniendo en cuenta el riesgo de estimación". Revista de análisis de marketing . 3 (2): 79–95. doi : 10.1057 / jma.2015.5 .
^ R. Michel, I. Schnakenburg, T. von Martens (2019). "Orientación al aumento". Saltador, ISBN 978-3-030-22625-1

Ver también

Lift (minería de datos)

enlaces externos

Abby Johnson explica cómo funciona en esta transmisión de video
Libro blanco introductorio con referencias completas
Eric Siegel: Modelado de mejora

[1] N. Radcliffe (2007). Identificar quiénes pueden ser salvados y quiénes serán ahuyentados por la actividad de retención . Solución estocástica limitada

[2] Radcliffe, Nueva Jersey; y Surry, PD (1999); Análisis de respuesta diferencial: modelado de la respuesta real aislando el efecto de una sola acción , en Proceedings of Credit Scoring and Credit Control VI , Credit Research Center, University of Edinburgh Management School

[3] Lo, VSY (2002); The True Lift Model , ACM SIGKDD Explorations Newsletter, vol. 4, No. 2, 78–86, disponible en http://www.sigkdd.org/sites/default/files/issues/4-2-2002-12/lo.pdf Archivado el 20 de enero de 2015 en Wayback Máquina

[4] Radcliffe, Nueva Jersey (2007); Uso de grupos de control para apuntar al aumento previsto: creación y evaluación de modelos de mejora , diario de análisis de marketing directo, asociación de marketing directo

[5] Las preguntas frecuentes de Scientific Marketer sobre modelado de mejora

[6] Lo, VSY (2008) "Nuevas oportunidades en la minería de datos de marketing". En Encyclopedia of Data Warehousing and Mining, segunda edición, editado por Wang (2008), Idea Group Publishing.

[uplift-trees-7] Rzepakowski, Piotr; Jaroszewicz, Szymon (2010). Árboles de decisión para modelado de elevación . En Actas de la 10ª Conferencia Internacional IEEE sobre Minería de Datos (ICDM'10) . Sydney, Australia. págs. 441–450. doi : 10.1109 / ICDM.2010.62 . ISBN 978-1-4244-9131-5.

[multiple-treatment-uplift-trees-8] Rzepakowski, Piotr; Jaroszewicz, Szymon (2011). "Árboles de decisión para el modelado de uplift con tratamientos únicos y múltiples" . Sistemas de conocimiento e información . 32 (2): 303–327. doi : 10.1007 / s10115-011-0434-0 .

[9] Cai, T .; Tian, L .; Wong, PH; y Wei, LJ (2009); Análisis de datos de ensayos clínicos comparativos aleatorios para selecciones de tratamientos personalizados , serie de documentos de trabajo sobre bioestadística de la Universidad de Harvard, documento 97

[SAYL-10] Nassif, Houssam; Kuusisto, finlandés; Burnside, Elizabeth S; Page, David; Shavlik, Jude; Santos Costa, Vitor (2013). Score As You Lift (SAYL): un enfoque de aprendizaje relacional estadístico para el modelado de mejora . Congreso Europeo de Aprendizaje Automático (ECML'13) . Apuntes de conferencias en Ciencias de la Computación. 8190 . Praga. págs. 595–611. doi : 10.1007 / 978-3-642-40994-3_38 . ISBN 978-3-642-38708-1. PMC 4492311 . PMID 26158122 .

[uplift-survival-analysis-11] Jaroszewicz, Szymon; Rzepakowski, Piotr (2014). "Modelado de elevación con datos de supervivencia" (PDF) . Taller ACM SIGKDD sobre Informática en Salud (HI KDD'14) . Nueva York, Estados Unidos.

[12] Yong, FH (2015), "Métodos cuantitativos para la medicina estratificada", tesis doctoral, Departamento de bioestadística, Escuela de salud pública Harvard TH Chan, http://dash.harvard.edu/bitstream/handle/1/17463130/YONG -DISERTACIÓN-2015.pdf? Secuencia = 1 .

[RDP-13] Nassif, Houssam; Santos Costa, Vitor; Burnside, Elizabeth S; Page, David (2012). Predicción diferencial relacional . Congreso Europeo de Aprendizaje Automático (ECML'12) . Apuntes de conferencias en Ciencias de la Computación. 7523 . Bristol, Reino Unido. págs. 617–632. doi : 10.1007 / 978-3-642-33460-3_45 . ISBN 978-3-642-33459-7.

[14] Nassif, Houssam; Wu, Yirong; Page, David; Burnside, Elizabeth (2012). "Red de Bayes de predicción diferencial lógica, mejora del diagnóstico de cáncer de mama para mujeres mayores" . Simposio de la Asociación Estadounidense de Informática Médica (AMIA'12) . 2012 : 1330-1339. PMC 3540455 . PMID 23304412 .

[15] Kuusisto, finlandés; Santos Costa, Vitor; Nassif, Houssam; Burnside, Elizabeth; Page, David; Shavlik, Jude (2014). Soporta máquinas vectoriales para predicción diferencial . Conferencia europea sobre aprendizaje automático (ECML'14) . Apuntes de conferencias en Ciencias de la Computación. 8725 . Nancy, Francia. págs. 50–65. doi : 10.1007 / 978-3-662-44851-9_4 . ISBN 978-3-662-44850-2. PMC 4492338 . PMID 26158123 .

[16] Zaniewicz, Lukasz; Jaroszewicz, Szymon (2013). "Máquinas de vectores de soporte para modelado de elevación". El primer taller IEEE ICDM sobre descubrimiento causal . Dallas, Texas.

[17] Sołtys, Michał; Jaroszewicz, Szymon; Rzepakowski, Piotr (2015). "Métodos de conjuntos para modelado de levantamiento" . Minería de datos y descubrimiento de conocimientos . 29 (6): 1531-1559. doi : 10.1007 / s10618-014-0383-9 .

[18] Kane, K .; Lo, VSY; Zheng, J. (2014). "Minería para clientes y prospectos verdaderamente receptivos mediante el modelado True-Lift: comparación de métodos nuevos y existentes". Revista de análisis de marketing . 2 (4): 218–238. doi : 10.1057 / jma.2014.18 .

[19] Lo, VSY; Pachamanova, D. (2015). "Desde el modelado predictivo de elevación a la analítica de elevación prescriptiva: un enfoque práctico para la optimización del tratamiento teniendo en cuenta el riesgo de estimación". Revista de análisis de marketing . 3 (2): 79–95. doi : 10.1057 / jma.2015.5 .

[20] R. Michel, I. Schnakenburg, T. von Martens (2019). "Orientación al aumento". Saltador, ISBN 978-3-030-22625-1

[1]