Elaboración de perfiles (ciencias de la información)


En ciencias de la información , la creación de perfiles se refiere al proceso de construcción y aplicación de perfiles de usuario generados por análisis de datos computarizados .

Este es el uso de algoritmos u otras técnicas matemáticas que permiten descubrir patrones o correlaciones en grandes cantidades de datos, agregados en bases de datos . Cuando estos patrones o correlaciones se utilizan para identificar o representar personas, se les puede llamar perfiles . Aparte de una discusión sobre tecnologías de perfilado o perfiles de población , la noción de perfilado en este sentido no se trata solo de la construcción de perfiles, sino que también se refiere a la aplicación de perfiles grupales a individuos, p. g., en los casos de credit scoring, discriminación de precios o identificación de riesgos de seguridad ( Hildebrandt & Gutwirth 2008 ) ( Elmer 2004 ).

La creación de perfiles se utiliza en la prevención del fraude , la inteligencia ambiental y el análisis de consumidores . Los métodos estadísticos de creación de perfiles incluyen Knowledge Discovery in Databases (KDD).

La recolección, preparación y minería de datos pertenecen a la fase en la que se está construyendo el perfil. Sin embargo, la elaboración de perfiles también se refiere a la aplicación de perfiles, lo que significa el uso de perfiles para la identificación o categorización de grupos o personas individuales. Como se puede ver en el paso seis (aplicación), el proceso es circular. Hay un ciclo de retroalimentación entre la construcción y la aplicación de perfiles. La interpretación de los perfiles puede conducir a la reiteración, posiblemente en tiempo real, del ajuste fino de pasos previos específicos en el proceso de creación de perfiles. La aplicación de perfiles a personas cuyos datos no se utilizaron para construir el perfil se basa en la coincidencia de datos, que proporciona nuevos datos que permiten ajustes adicionales. El proceso de creación de perfiles es tanto dinámico como adaptativo.Un buen ejemplo de la naturaleza dinámica y adaptativa de la elaboración de perfiles es el Proceso estándar intersectorial para la minería de datos (CRISP-DM ).

Para aclarar la naturaleza de las tecnologías de perfilado, se deben hacer algunas distinciones cruciales entre diferentes tipos de prácticas de perfilado, además de la distinción entre la construcción y la aplicación de perfiles. Las principales distinciones son aquellas entre perfiles de abajo hacia arriba y de arriba hacia abajo (o aprendizaje supervisado y no supervisado), y entre perfiles individuales y grupales.

Los perfiles se pueden clasificar según la forma en que se han generado ( Fayyad, Piatetsky-Shapiro & Smyth 1996 ) ( Zarsky & 2002-3 ) . Por un lado, se pueden generar perfiles probando una correlación hipotética. Esto se denomina perfilado de arriba hacia abajo o aprendizaje supervisado . Esta es similar a la metodología de la investigación científica tradicional en que parte de una hipótesis y consiste en probar su validez. El resultado de este tipo de perfilado es la verificación o refutación de la hipótesis. También se podría hablar de perfiles deductivos. Por otro lado, se pueden generar perfiles explorando una base de datos, utilizando la minería de datosproceso para detectar patrones en la base de datos que no fueron hipotetizados previamente. En cierto modo, se trata de generar hipótesis: encontrar correlaciones que uno no esperaba o ni siquiera pensó. Una vez extraídos los patrones, entrarán en el bucle, descrito anteriormente, y se probarán con el uso de nuevos datos. Esto se llama aprendizaje no supervisado .