Filtración colaborativa

El filtrado colaborativo ( CF ) es una técnica utilizada por los sistemas de recomendación . ^[1] El filtrado colaborativo tiene dos sentidos, uno estrecho y otro más general. ^[2]

Esta imagen muestra un ejemplo de predicción de la calificación del usuario mediante el filtrado colaborativo . Al principio, las personas califican diferentes elementos (como videos, imágenes, juegos). Después de eso, el sistema hace predicciones sobre la calificación del usuario para un artículo, que el usuario aún no ha calificado. Estas predicciones se basan en las calificaciones existentes de otros usuarios, que tienen calificaciones similares con el usuario activo. Por ejemplo, en nuestro caso, el sistema ha hecho una predicción de que al usuario activo no le gustará el video.

En el sentido más nuevo y más estricto, el filtrado colaborativo es un método para realizar predicciones automáticas (filtrado) sobre los intereses de un usuario mediante la recopilación de preferencias o información de gustos de muchos usuarios (colaborando). El supuesto subyacente del enfoque de filtrado colaborativo es que si una persona A tiene la misma opinión que una persona B sobre un tema, es más probable que A tenga la opinión de B sobre un tema diferente que la de una persona elegida al azar. Por ejemplo, un sistema de recomendación de filtrado colaborativo para las preferencias en la programación de televisión podría hacer predicciones sobre qué programa de televisión le gustaría a un usuario dada una lista parcial de los gustos de ese usuario (gustos o disgustos). ^[3] Tenga en cuenta que estas predicciones son específicas del usuario, pero utilizan información obtenida de muchos usuarios. Esto difiere del enfoque más simple de dar una puntuación media (no específica) para cada elemento de interés, por ejemplo, en función de su número de votos .

En el sentido más general, el filtrado colaborativo es el proceso de filtrado de información o patrones utilizando técnicas que implican la colaboración entre múltiples agentes, puntos de vista, fuentes de datos, etc. ^[2] Las aplicaciones del filtrado colaborativo normalmente involucran conjuntos de datos muy grandes. Se han aplicado métodos de filtrado colaborativo a muchos tipos diferentes de datos, incluidos: datos de detección y monitoreo, como en la exploración de minerales, detección ambiental en áreas extensas o sensores múltiples; datos financieros, como instituciones de servicios financieros que integran muchas fuentes financieras; o en el comercio electrónico y las aplicaciones web donde el enfoque está en los datos del usuario, etc. El resto de esta discusión se enfoca en el filtrado colaborativo para los datos del usuario, aunque algunos de los métodos y enfoques pueden aplicarse también a las otras aplicaciones principales.

Descripción general

El crecimiento de Internet ha dificultado mucho más la extracción eficaz de información útil de toda la información en línea disponible . ^{[ según quién? ]} La abrumadora cantidad de datos requiere mecanismos para un filtrado de información eficiente . ^{[ según quién? ]} El filtrado colaborativo es una de las técnicas utilizadas para abordar este problema.

La motivación para el filtrado colaborativo proviene de la idea de que las personas a menudo obtienen las mejores recomendaciones de alguien con gustos similares a ellos. ^{[ cita requerida ]} El filtrado colaborativo abarca técnicas para hacer coincidir a personas con intereses similares y hacer recomendaciones sobre esta base.

Los algoritmos de filtrado colaborativo a menudo requieren (1) la participación activa de los usuarios, (2) una forma fácil de representar los intereses de los usuarios y (3) algoritmos que puedan hacer coincidir a personas con intereses similares.

Normalmente, el flujo de trabajo de un sistema de filtrado colaborativo es:

Un usuario expresa sus preferencias al calificar elementos (por ejemplo, libros, películas o grabaciones de música) del sistema. Estas calificaciones pueden verse como una representación aproximada del interés del usuario en el dominio correspondiente.
El sistema compara las calificaciones de este usuario con las de otros usuarios y busca a las personas con gustos más "similares".
Con usuarios similares, el sistema recomienda elementos que los usuarios similares han calificado altamente pero que aún no han sido calificados por este usuario (presumiblemente, la ausencia de calificación a menudo se considera como la falta de familiaridad de un elemento)

Un problema clave del filtrado colaborativo es cómo combinar y ponderar las preferencias de los usuarios vecinos. A veces, los usuarios pueden calificar inmediatamente los elementos recomendados. Como resultado, el sistema obtiene una representación cada vez más precisa de las preferencias del usuario a lo largo del tiempo.

Metodología

Filtrado colaborativo en sistemas de recomendación

Los sistemas de filtrado colaborativo tienen muchas formas, pero muchos sistemas comunes se pueden reducir a dos pasos:

Busque usuarios que compartan los mismos patrones de calificación con el usuario activo (el usuario para quien es la predicción).
Utilice las calificaciones de los usuarios de ideas afines que se encuentran en el paso 1 para calcular una predicción para el usuario activo

Esto se incluye en la categoría de filtrado colaborativo basado en usuarios. Una aplicación específica de esto es el algoritmo de vecino más cercano basado en el usuario .

Alternativamente, el filtrado colaborativo basado en elementos (los usuarios que compraron x también compraron y), procede de una manera centrada en el elemento:

Construya una matriz artículo-artículo que determine las relaciones entre pares de artículos
Inferir los gustos del usuario actual examinando la matriz y haciendo coincidir los datos de ese usuario

Consulte, por ejemplo, la familia de filtrado colaborativo basado en elementos de Slope One .

Otra forma de filtrado colaborativo puede basarse en observaciones implícitas del comportamiento normal del usuario (a diferencia del comportamiento artificial impuesto por una tarea de calificación). Estos sistemas observan lo que ha hecho un usuario junto con lo que han hecho todos los usuarios (qué música han escuchado, qué artículos han comprado) y utilizan esos datos para predecir el comportamiento del usuario en el futuro, o para predecir cómo le podría gustar a un usuario. comportarse dada la oportunidad. Luego, estas predicciones deben filtrarse a través de la lógica empresarial para determinar cómo podrían afectar las acciones de un sistema empresarial. Por ejemplo, no es útil ofrecer a alguien vender un álbum de música en particular si ya ha demostrado que es el propietario de esa música.

Confiar en un sistema de puntuación o calificación que se promedia entre todos los usuarios ignora las demandas específicas de un usuario y es particularmente pobre en tareas donde hay una gran variación en el interés (como en la recomendación de música). Sin embargo, existen otros métodos para combatir la explosión de la información, como la búsqueda web y la agrupación de datos .

Tipos

Basado en la memoria

El enfoque basado en memoria utiliza datos de calificación de usuarios para calcular la similitud entre usuarios o elementos. Ejemplos típicos de este enfoque son la FC basada en el vecindario y las recomendaciones top-N basadas en elementos / usuarios. Por ejemplo, en los enfoques basados en el usuario, el valor de las calificaciones que el usuario u otorga al elemento i se calcula como una agregación de la calificación del elemento de algunos usuarios similares:

{\ Displaystyle r_ {u, i} = \ operatorname {aggr} _ {u ^ {\ prime} \ in U} r_ {u ^ {\ prime}, i}}

donde U denota el conjunto de los principales N usuarios que son más similares al usuario u que calificó el elemento i . Algunos ejemplos de la función de agregación incluyen:

{\ Displaystyle r_ {u, i} = {\ frac {1} {N}} \ sum \ limits _ {u ^ {\ prime} \ in U} r_ {u ^ {\ prime}, i}}

{\ Displaystyle r_ {u, i} = k \ sum \ limits _ {u ^ {\ prime} \ in U} \ operatorname {simil} (u, u ^ {\ prime}) r_ {u ^ {\ prime} ,I}}

donde k es un factor de normalización definido como ${\ Displaystyle k = 1 / \ sum _ {u ^ {\ prime} \ in U} | \ operatorname {simil} (u, u ^ {\ prime}) |}$ , y

{\ Displaystyle r_ {u, i} = {\ bar {r_ {u}}} + k \ sum \ limits _ {u ^ {\ prime} \ in U} \ operatorname {simil} (u, u ^ {\ prime}) (r_ {u ^ {\ prime}, i} - {\ bar {r_ {u ^ {\ prime}}}})}

dónde ${\ displaystyle {\ bar {r_ {u}}}}$ es la calificación promedio del usuario u para todos los elementos calificados por u .

El algoritmo basado en vecindarios calcula la similitud entre dos usuarios o elementos y produce una predicción para el usuario tomando el promedio ponderado de todas las calificaciones. El cálculo de la similitud entre elementos o usuarios es una parte importante de este enfoque. Para esto, se utilizan múltiples medidas, como la correlación de Pearson y la similitud basada en coseno vectorial .

La similitud de correlación de Pearson de dos usuarios x , y se define como

{\ Displaystyle \ operatorname {simil} (x, y) = {\ frac {\ sum \ limits _ {i \ in I_ {xy}} (r_ {x, i} - {\ bar {r_ {x}}} ) (r_ {y, i} - {\ bar {r_ {y}}})} {{\ sqrt {\ sum \ limits _ {i \ in I_ {xy}} (r_ {x, i} - {\ barra {r_ {x}}}) ^ {2}}} {\ sqrt {\ sum \ límites _ {i \ in I_ {xy}} (r_ {y, i} - {\ bar {r_ {y}} }) ^ {2}}}}}}

donde I _xy es el conjunto de elementos calificados tanto por el usuario x como por el usuario y .

El enfoque basado en coseno define el coseno similitud entre dos usuarios de x y y como: ^[4]

{\ Displaystyle \ operatorname {simil} (x, y) = \ cos ({\ vec {x}}, {\ vec {y}}) = {\ frac {{\ vec {x}} \ cdot {\ vec {y}}} {|| {\ vec {x}} || \ times || {\ vec {y}} ||}} = {\ frac {\ sum \ limits _ {i \ in I_ {xy} } r_ {x, i} r_ {y, i}} {{\ sqrt {\ sum \ límites _ {i \ in I_ {x}} r_ {x, i} ^ {2}}} {\ sqrt {\ suma \ límites _ {i \ in I_ {y}} r_ {y, i} ^ {2}}}}}}

El algoritmo de recomendación top-N basado en el usuario utiliza un modelo vectorial basado en similitudes para identificar los k usuarios más similares a un usuario activo. Una vez que se encuentran los k usuarios más similares, se agregan sus correspondientes matrices usuario-elemento para identificar el conjunto de elementos que se recomendarán. Un método popular para encontrar usuarios similares es el hash sensible a la localidad , que implementa el mecanismo de vecino más cercano en tiempo lineal.

Las ventajas de este enfoque incluyen: la explicabilidad de los resultados, que es un aspecto importante de los sistemas de recomendación; fácil creación y uso; facilitación de nuevos datos; independencia del contenido de los elementos recomendados; buena escala con ítems co-calificados.

También hay varias desventajas con este enfoque. Su rendimiento disminuye cuando los datos escasean , lo que ocurre con frecuencia con elementos relacionados con la web. Esto dificulta la escalabilidad de este enfoque y crea problemas con grandes conjuntos de datos. Aunque puede manejar de manera eficiente a nuevos usuarios porque se basa en una estructura de datos , agregar nuevos elementos se vuelve más complicado ya que esa representación generalmente se basa en un espacio vectorial específico . Agregar nuevos elementos requiere la inclusión del nuevo elemento y la reinserción de todos los elementos en la estructura.

Basado en modelos

En este enfoque, los modelos se desarrollan utilizando diferentes minería de datos , aprendizaje automático algoritmos para predecir calificación de artículos no clasificados de los usuarios. Hay muchos algoritmos de CF basados en modelos. Redes bayesianas , los modelos de conglomerado , modelos semánticos latentes tales como la descomposición en valores singulares , análisis semántico latente probabilístico , el factor multiplicativo múltiple, la asignación de Dirichlet latente y procesos de decisión de Markov modelos basados. ^[5]

A través de este enfoque, los métodos de reducción de dimensionalidad se utilizan principalmente como técnica complementaria para mejorar la robustez y precisión del enfoque basado en la memoria. En este sentido, métodos como la descomposición de valores singulares , el análisis de componentes principales , conocidos como modelos de factores latentes, comprimen la matriz de usuario-elemento en una representación de baja dimensión en términos de factores latentes. Una ventaja de usar este enfoque es que en lugar de tener una matriz de alta dimensión que contiene un número abundante de valores perdidos, estaremos tratando con una matriz mucho más pequeña en un espacio de menor dimensión. Se podría utilizar una presentación reducida para los algoritmos de vecindad basados en el usuario o en los elementos que se presentan en la sección anterior. Hay varias ventajas con este paradigma. Maneja la escasez de la matriz original mejor que las basadas en memoria. Además, comparar la similitud en la matriz resultante es mucho más escalable, especialmente cuando se trata de grandes conjuntos de datos dispersos. ^[6]

Híbrido

Varias aplicaciones combinan los algoritmos CF basados en memoria y basados en modelos. Estos superan las limitaciones de los enfoques de CF nativos y mejoran el rendimiento de la predicción. Es importante destacar que superan los problemas de la FQ como la escasez y la pérdida de información. Sin embargo, tienen una mayor complejidad y su implementación es costosa. ^[7] Por lo general, la mayoría de los sistemas de recomendación comerciales son híbridos, por ejemplo, el sistema de recomendación de noticias de Google. ^[8]

Aprendizaje profundo

En los últimos años se han propuesto una serie de técnicas neuronales y de aprendizaje profundo. Algunos generalizan los algoritmos tradicionales de factorización de matrices a través de una arquitectura neuronal no lineal, ^[9] o aprovechan nuevos tipos de modelos como los codificadores automáticos variacionales . ^[10] Si bien el aprendizaje profundo se ha aplicado a muchos escenarios diferentes: consciente del contexto, consciente de la secuencia, etiquetado social, etc., se ha puesto en duda su eficacia real cuando se utiliza en un escenario de recomendación colaborativa simple. Un análisis sistemático de las publicaciones que aplican métodos de aprendizaje profundo o neuronales al problema de recomendación top-k, publicado en las principales conferencias (SIGIR, KDD, WWW, RecSys), ha demostrado que en promedio menos del 40% de los artículos son reproducibles, con tan poco como 14% en algunas conferencias. En general, el estudio identifica 18 artículos, solo 7 de ellos pudieron reproducirse y 6 de ellos podrían tener un rendimiento superior a partir de líneas de base mucho más antiguas y simples, debidamente ajustadas. El artículo también destaca una serie de problemas potenciales en la beca de investigación actual y pide mejores prácticas científicas en esa área. ^[11] También se han detectado problemas similares en los sistemas de recomendación con reconocimiento de secuencias. ^[12]

Filtrado colaborativo sensible al contexto

Muchos sistemas de recomendación simplemente ignoran otra información contextual existente junto con la calificación del usuario al proporcionar recomendaciones de artículos. ^[13] Sin embargo, debido a la disponibilidad generalizada de información contextual como la hora, la ubicación, la información social y el tipo de dispositivo que utiliza el usuario, se está volviendo más importante que nunca para un sistema de recomendación exitoso proporcionar una recomendación sensible al contexto. Según Charu Aggrawal, "los sistemas de recomendación sensibles al contexto adaptan sus recomendaciones a la información adicional que define la situación específica bajo la cual se hacen las recomendaciones. Esta información adicional se conoce como el contexto". ^[6]

Teniendo en cuenta la información contextual, tendremos una dimensión adicional a la matriz de calificación de usuario-elemento existente. Como ejemplo, suponga un sistema de recomendación de música que proporcione diferentes recomendaciones en función de la hora del día. En este caso, es posible que un usuario tenga diferentes preferencias para una música en diferentes momentos del día. Por lo tanto, en lugar de usar la matriz de elementos de usuario, podemos usar un tensor de orden 3 (o superior para considerar otros contextos) para representar las preferencias de los usuarios sensibles al contexto. ^[14]^[15]^[16]

Para aprovechar el filtrado colaborativo y, en particular, los métodos basados en vecindarios, los enfoques pueden extenderse desde una matriz de calificación bidimensional a un tensor de orden superior ^{[ cita requerida ]} . Para este propósito, el enfoque es encontrar los usuarios más similares / con ideas afines a un usuario objetivo; se puede extraer y calcular la similitud de sectores (por ejemplo, matriz de tiempo de artículo) correspondientes a cada usuario. A diferencia del caso insensible al contexto para el que se calcula la similitud de dos vectores de calificación, en los enfoques sensibles al contexto , la similitud de las matrices de calificación correspondientes a cada usuario se calcula utilizando coeficientes de Pearson . ^[6] Una vez que se encuentran los usuarios más afines, sus calificaciones correspondientes se agregan para identificar el conjunto de elementos que se recomendarán al usuario objetivo.

La desventaja más importante de tener en cuenta el contexto en el modelo de recomendación es poder manejar un conjunto de datos más grande que contiene muchos más valores faltantes en comparación con la matriz de calificación de elementos de usuario ^{[ cita requerida ]} . Por lo tanto, de manera similar a los métodos de factorización matricial , las técnicas de factorización tensorial se pueden usar para reducir la dimensionalidad de los datos originales antes de usar cualquier método basado en vecindarios ^{[ cita requerida ]} .

Aplicación en web social

A diferencia del modelo tradicional de los medios convencionales, en el que hay pocos editores que establecen pautas, las redes sociales filtradas de forma colaborativa pueden tener una gran cantidad de editores y el contenido mejora a medida que aumenta el número de participantes. Servicios como Reddit , YouTube y Last.fm son ejemplos típicos de medios basados en filtrado colaborativo. ^[17]

Un escenario de aplicación de filtrado colaborativo es recomendar información interesante o popular según lo juzgue la comunidad. Como ejemplo típico, las historias aparecen en la página principal de Reddit cuando son "votadas" (calificadas positivamente) por la comunidad. A medida que la comunidad se vuelve más grande y diversa, las historias promocionadas pueden reflejar mejor el interés promedio de los miembros de la comunidad.

Wikipedia es otra aplicación de filtrado colaborativo. Los voluntarios contribuyen a la enciclopedia filtrando los hechos de las falsedades. ^[18]

Otro aspecto de los sistemas de filtrado colaborativo es la capacidad de generar recomendaciones más personalizadas mediante el análisis de información de la actividad pasada de un usuario específico, o el historial de otros usuarios considerados de gusto similar a un usuario determinado. Estos recursos se utilizan como perfiles de usuarios y ayudan al sitio a recomendar contenido usuario por usuario. Cuanto más un usuario hace uso del sistema, mejores son las recomendaciones, ya que el sistema obtiene datos para mejorar su modelo de ese usuario.

Problemas

Un sistema de filtrado colaborativo no necesariamente logra hacer coincidir automáticamente el contenido con las preferencias de uno. A menos que la plataforma logre una diversidad e independencia de opiniones inusualmente buenas, un punto de vista siempre dominará a otro en una comunidad en particular. Al igual que en el escenario de recomendación personalizada, la introducción de nuevos usuarios o nuevos elementos puede provocar el problema del arranque en frío , ya que no habrá datos suficientes sobre estas nuevas entradas para que el filtrado colaborativo funcione con precisión. Para poder hacer recomendaciones apropiadas para un nuevo usuario, el sistema primero debe conocer las preferencias del usuario analizando las votaciones o las actividades de calificación anteriores. El sistema de filtrado colaborativo requiere que un número considerable de usuarios califiquen un nuevo elemento antes de que se pueda recomendar ese elemento.

Desafíos

Dispersión de datos

En la práctica, muchos sistemas de recomendación comerciales se basan en grandes conjuntos de datos. Como resultado, la matriz de elementos de usuario utilizada para el filtrado colaborativo podría ser extremadamente grande y escasa, lo que plantea desafíos en el desempeño de la recomendación.

Un problema típico causado por la escasez de datos es el problema del arranque en frío . Dado que los métodos de filtrado colaborativo recomiendan elementos basados en las preferencias pasadas de los usuarios, los nuevos usuarios deberán calificar una cantidad suficiente de elementos para permitir que el sistema capture sus preferencias con precisión y, por lo tanto, proporcione recomendaciones confiables.

Del mismo modo, los artículos nuevos también tienen el mismo problema. Cuando se agregan nuevos elementos al sistema, deben ser calificados por un número sustancial de usuarios antes de poder recomendarlos a usuarios que tienen gustos similares a los que los calificaron. El problema del nuevo elemento no afecta las recomendaciones basadas en contenido , porque la recomendación de un elemento se basa en su conjunto discreto de cualidades descriptivas en lugar de sus calificaciones.

Escalabilidad

A medida que aumenta el número de usuarios y elementos, los algoritmos CF tradicionales sufrirán serios problemas de escalabilidad ^{[ cita requerida ]} . Por ejemplo, con decenas de millones de clientes. ${\ Displaystyle O (M)}$ y millones de artículos ${\ Displaystyle O (N)}$ , un algoritmo de CF con la complejidad de ${\ Displaystyle n}$ ya es demasiado grande. Además, muchos sistemas necesitan reaccionar de inmediato a los requisitos en línea y hacer recomendaciones para todos los usuarios independientemente de sus compras y su historial de calificaciones, lo que exige una mayor escalabilidad de un sistema CF. Las grandes empresas web como Twitter utilizan grupos de máquinas para escalar las recomendaciones para sus millones de usuarios, y la mayoría de los cálculos se realizan en máquinas de memoria muy grande. ^[19]

Sinónimos

Los sinónimos se refieren a la tendencia de varios elementos iguales o muy similares a tener nombres o entradas diferentes. La mayoría de los sistemas de recomendación son incapaces de descubrir esta asociación latente y, por lo tanto, tratan estos productos de manera diferente.

Por ejemplo, los elementos aparentemente diferentes "película para niños" y "película para niños" en realidad se refieren al mismo elemento. De hecho, el grado de variabilidad en el uso de términos descriptivos es mayor de lo que comúnmente se sospecha. ^{[ cita requerida ]} La prevalencia de sinónimos disminuye el rendimiento de recomendación de los sistemas de FQ. El modelado de temas (como la técnica de asignación de Dirichlet latente ) podría resolver esto agrupando diferentes palabras pertenecientes al mismo tema. ^{[ cita requerida ]}

Oveja gris

La oveja gris se refiere a los usuarios cuyas opiniones no están de acuerdo o en desacuerdo consistentemente con ningún grupo de personas y, por lo tanto, no se benefician del filtrado colaborativo. Las ovejas negras son un grupo cuyos gustos idiosincrásicos hacen que las recomendaciones sean casi imposibles. Si bien esto es una falla del sistema de recomendación, los recomendadores no electrónicos también tienen grandes problemas en estos casos, por lo que tener oveja negra es una falla aceptable. ^{[ disputado - discutir ]}

Ataques de chelín

En un sistema de recomendación donde todos pueden dar las calificaciones, las personas pueden otorgar muchas calificaciones positivas para sus propios artículos y calificaciones negativas para sus competidores. A menudo es necesario que los sistemas de filtrado colaborativo introduzcan precauciones para desalentar tales manipulaciones.

Diversidad y cola larga

Se espera que los filtros colaborativos aumenten la diversidad porque nos ayudan a descubrir nuevos productos. Sin embargo, algunos algoritmos pueden hacer lo contrario sin querer. Debido a que los filtros colaborativos recomiendan productos basados en ventas o calificaciones pasadas, generalmente no pueden recomendar productos con datos históricos limitados. Esto puede crear un efecto enriquecedor para productos populares, similar a la retroalimentación positiva . Este sesgo hacia la popularidad puede evitar lo que de otro modo serían mejores coincidencias entre productos de consumo. Un estudio de Wharton detalla este fenómeno junto con varias ideas que pueden promover la diversidad y la " cola larga ". ^[20] Se han desarrollado varios algoritmos de filtrado colaborativo para promover la diversidad y la " cola larga " ^[21] mediante la recomendación de elementos novedosos, inesperados, ^[22] y fortuitos. ^[23]

Innovaciones

Se han desarrollado nuevos algoritmos para CF como resultado del premio Netflix .
Filtrado colaborativo entre sistemas en el que los perfiles de usuario de varios sistemas de recomendación se combinan de forma multitarea; de esta manera, se logra compartir patrones de preferencias entre modelos. ^[24]
Filtrado colaborativo robusto , donde la recomendación es estable frente a esfuerzos de manipulación. Esta área de investigación aún está activa y no está completamente resuelta. ^[25]

Información auxiliar

La matriz de elementos de usuario es una base básica de las técnicas tradicionales de filtrado colaborativo y presenta un problema de escasez de datos (es decir, arranque en frío ). Como consecuencia, a excepción de la matriz de elementos de usuario, los investigadores están tratando de recopilar más información auxiliar para ayudar a impulsar el rendimiento de las recomendaciones y desarrollar sistemas de recomendación personalizados. ^[26] Generalmente, hay dos tipos de información auxiliar populares: información de atributos e información de interacción. La información de atributo describe las propiedades de un usuario o de un elemento. Por ejemplo, el atributo de usuario puede incluir el perfil general (por ejemplo, sexo y edad) y contactos sociales (por ejemplo, seguidores o amigos en las redes sociales ); Atributo de artículo significa propiedades como categoría, marca o contenido. Además, la información de interacción se refiere a los datos implícitos que muestran cómo los usuarios interactúan con el artículo. La información de interacción ampliamente utilizada contiene etiquetas, comentarios o reseñas e historial de navegación, etc. La información auxiliar juega un papel importante en una variedad de aspectos. Los vínculos sociales explícitos, como un representante confiable de la confianza o la amistad, siempre se emplean en el cálculo de similitud para encontrar personas similares que compartan interés con el usuario objetivo. ^[27]^[28] La información asociada a la interacción (etiquetas) se toma como una tercera dimensión (además del usuario y el elemento) en el filtrado colaborativo avanzado para construir una estructura tensorial tridimensional para explorar la recomendación. ^[29]

Ver también

Lenguaje de marcado de perfiles de atención (APML)
Inicio fresco
Modelo colaborativo
Motor de búsqueda colaborativo
Inteligencia colectiva
Compromiso con el cliente
Democracia delegativa , el mismo principio se aplica a la votación en lugar de filtrar
Marcadores empresariales
Firefly (sitio web) , un sitio web desaparecido que se basaba en el filtrado colaborativo
Burbuja de filtro
Rango de página
Elicitación de preferencias
Filtrado psicográfico
Sistema de recomendación
Relevancia (recuperación de información)
Sistema de reputación
Filtrado colaborativo robusto
Búsqueda de similitudes
Pendiente uno
Translucidez social

Referencias

^ Francesco Ricci y Lior Rokach y Bracha Shapira, Introducción al manual de sistemas de recomendación, Manual de sistemas de recomendación, Springer, 2011, págs. 1-35
↑ a b Terveen, Loren ; Hill, Will (2001). "Más allá de los sistemas de recomendación: ayudar a las personas a ayudarse entre sí" (PDF) . Addison-Wesley. pag. 6 . Consultado el 16 de enero de 2012 .
^ Un enfoque integrado a las recomendaciones de TV y VOD Archivado el 6 de junio de 2012 en Wayback Machine
^ John S. Breese, David Heckerman y Carl Kadie, Análisis empírico de algoritmos predictivos para filtrado colaborativo , 1998 Archivado el 19 de octubre de 2013 en Wayback Machine.
^ Xiaoyuan Su, Taghi M. Khoshgoftaar, Una encuesta sobre técnicas de filtrado colaborativo , Archivo de avances en inteligencia artificial, 2009.
^ a b c Sistemas de recomendación: el libro de texto | Charu C. Aggarwal | Springer . Saltador. 2016. ISBN 9783319296579.
^ Ghazanfar, Mustansar Ali; Prügel-Bennett, Adam; Szedmak, Sandor (2012). "Algoritmos del sistema de recomendación de mapeo de kernel". Ciencias de la información . 208 : 81-104. CiteSeerX 10.1.1.701.7729 . doi : 10.1016 / j.ins.2012.04.012 .
^ Das, Abhinandan S .; Datar, Mayur; Garg, Ashutosh; Rajaram, Shyam (2007). "Personalización de noticias de Google". Actas de la 16ª conferencia internacional sobre World Wide Web - WWW '07 . pag. 271. doi : 10.1145 / 1242572.1242610 . ISBN 9781595936547. S2CID 207163129 .
^ Él, Xiangnan; Liao, Lizi; Zhang, Hanwang; Nie, Liqiang; Hu, Xia; Chua, Tat-Seng (2017). "Filtrado colaborativo neuronal" . Actas de la 26ª Conferencia Internacional sobre World Wide Web . Comité Directivo de las Conferencias Internacionales de la World Wide Web: 173–182. arXiv : 1708.05031 . doi : 10.1145 / 3038912.3052569 . ISBN 9781450349130. S2CID 13907106 . Consultado el 16 de octubre de 2019 .
^ Liang, Dawen; Krishnan, Rahul G .; Hoffman, Matthew D .; Jebara, Tony (2018). "Autoencoders variacionales para filtrado colaborativo" . Actas de la Conferencia World Wide Web 2018 . Comité Directivo de Conferencias Internacionales World Wide Web: 689–698. arXiv : 1802.05814 . doi : 10.1145 / 3178876.3186150 . ISBN 9781450356398.
^ Ferrari Dacrema, Maurizio; Cremonesi, Paolo; Jannach, Dietmar (2019). "¿Realmente estamos haciendo mucho progreso? Un análisis preocupante de enfoques recientes de recomendación neuronal" . Actas de la 13ª Conferencia de ACM sobre sistemas de recomendación . ACM: 101–109. arXiv : 1907.06902 . doi : 10.1145 / 3298689.3347058 . hdl : 11311/1108996 . ISBN 9781450362436. S2CID 196831663 . Consultado el 16 de octubre de 2019 .
^ Ludewig, Malte; Mauro, Noemi; Latifi, Sara; Jannach, Dietmar (2019). "Comparación de rendimiento de enfoques neuronales y no neuronales a la recomendación basada en sesiones" . Actas de la 13ª Conferencia de ACM sobre sistemas de recomendación . ACM: 462–466. doi : 10.1145 / 3298689.3347041 . ISBN 9781450362436. Consultado el 16 de octubre de 2019 .
^ Adomavicius, Gediminas; Tuzhilin, Alexander (1 de enero de 2015). Ricci, Francesco; Rokach, Lior; Shapira, Bracha (eds.). Manual de sistemas de recomendación . Springer EE. UU. págs. 191–226. doi : 10.1007 / 978-1-4899-7637-6_6 . ISBN 9781489976369.
^ Bi, Xuan; Qu, Annie; Shen, Xiaotong (2018). "Factorización de tensor multicapa con aplicaciones a sistemas de recomendación" . Annals of Statistics . 46 (6B): 3303–3333. arXiv : 1711.01598 . doi : 10.1214 / 17-AOS1659 . S2CID 13677707 .
^ Zhang, Yanqing; Bi, Xuan; Tang, Niansheng; Qu, Annie (2020). "Sistemas de recomendación de tensor dinámico". arXiv : 2003.05568v1 [ stat.ME ].
^ Bi, Xuan; Tang, Xiwei; Yuan, Yubai; Zhang, Yanqing; Qu, Annie (2021). "Tensores en Estadística" . Revisión anual de estadísticas y su aplicación . 8 (1): annurev. Código Bibliográfico : 2021AnRSA ... 842720B . doi : 10.1146 / annurev-statistics-042720-020816 .
^ Filtrado colaborativo: elemento vital de la Web social Archivado el 22 de abril de 2012 en Wayback Machine
^ Gleick, James (2012). La información: una historia, una teoría, una inundación (1st Vintage books ed., 2012 ed.). Nueva York: Vintage Books. pag. 410. ISBN 978-1-4000-9623-7. OCLC 745979816 .
^ Pankaj Gupta, Ashish Goel, Jimmy Lin, Aneesh Sharma, Dong Wang y Reza Bosagh Zadeh WTF: El sistema a quién seguir en Twitter , Actas de la 22a conferencia internacional en World Wide Web
^ Fleder, Daniel; Hosanagar, Kartik (mayo de 2009). "Próxima subida o caída de la cultura de Blockbuster: el impacto de los sistemas de recomendación en la diversidad de ventas". Ciencias de la gestión . 55 (5): 697–712. doi : 10.1287 / mnsc.1080.0974 . SSRN 955984 .
^ Castells, Pablo ; Hurley, Neil J .; Vargas, Saúl (2015). "Novedad y diversidad en los sistemas de recomendación" . En Ricci, Francesco; Rokach, Lior; Shapira, Bracha (eds.). Manual de sistemas de recomendación (2 ed.). Springer EE. UU. págs. 881–918. doi : 10.1007 / 978-1-4899-7637-6_26 . ISBN 978-1-4899-7637-6.
^ Adamopoulos, Panagiotis; Tuzhilin, Alexander (enero de 2015). "Sobre lo inesperado en los sistemas de recomendación: o cómo esperar mejor lo inesperado". Transacciones ACM sobre tecnología y sistemas inteligentes . 5 (4): 1–32. doi : 10.1145 / 2559952 . S2CID 15282396 .
^ Adamopoulos, Panagiotis (octubre de 2013). Más allá de la precisión de la predicción de calificaciones: nuevas perspectivas en los sistemas de recomendación . Actas de la 7ª Conferencia ACM sobre sistemas de recomendación . págs. 459–462. doi : 10.1145 / 2507157.2508073 . ISBN 9781450324090. S2CID 1526264 .
^ Chatzis, Sotirios (octubre de 2013). "Filtrado colaborativo multitarea bayesiano no paramétrico". CIKM '13: Actas de la 22ª conferencia internacional ACM sobre Gestión de la Información y el Conocimiento . Portal.acm.org. págs. 2149–2158. doi : 10.1145 / 2505515.2505517 .
^ Mehta, Bhaskar; Hofmann, Thomas; Nejdl, Wolfgang (19 de octubre de 2007). Actas de la conferencia ACM de 2007 sobre sistemas de recomendación - Rec Sys '07 . Portal.acm.org. pag. 49. CiteSeerX 10.1.1.695.1712 . doi : 10.1145 / 1297231.1297240 . ISBN 9781595937308. S2CID 5640125 .
^ Shi, Yue; Larson, Martha; Hanjalic, Alan (2014). "Filtrado colaborativo más allá de la matriz usuario-elemento: una encuesta sobre el estado del arte y los desafíos futuros". Encuestas de computación ACM . 47 : 1–45. doi : 10.1145 / 2556270 . S2CID 5493334 .
^ Massa, Paolo; Avesani, Paolo (2009). Computación con confianza social . Londres: Springer. págs. 259-285.
^ Groh Georg; Ehmig Christian. Recomendaciones en dominios relacionados con el gusto: filtrado colaborativo vs. filtrado social . Actas de la conferencia internacional de 2007 de ACM sobre el trabajo de grupos de apoyo. págs. 127-136. CiteSeerX 10.1.1.165.3679 .
^ Symeonidis, Panagiotis; Nanopoulos, Alexandros; Manolopoulos, Yannis (2008). Recomendaciones de etiquetas basadas en la reducción de la dimensionalidad del tensor . Actas de la Conferencia ACM de 2008 sobre sistemas de recomendación . págs. 43–50. CiteSeerX 10.1.1.217.1437 . doi : 10.1145 / 1454008.1454017 . ISBN 9781605580937. S2CID 17911131 .

enlaces externos

Más allá de los sistemas de recomendación: ayudar a las personas a ayudarse entre sí , página 12, 2001
Sistemas de recomendación. Prem Melville y Vikas Sindhwani. En Encyclopedia of Machine Learning, Claude Sammut y Geoffrey Webb (Eds), Springer, 2010.
Sistemas de recomendación en contextos industriales: tesis de doctorado (2012) que incluye una descripción general completa de muchos sistemas de recomendación colaborativos
Hacia la próxima generación de sistemas de recomendación: un estudio del estado del arte y posibles extensiones ^{[ enlace muerto ]} . Adomavicius, G. y Tuzhilin, A. Transacciones IEEE sobre conocimiento e ingeniería de datos 06.2005
Evaluación de sistemas de recomendación de filtrado colaborativo ( DOI : 10.1145 / 963770.963772 )
Artículos de investigación de GroupLens .
Filtrado colaborativo potenciado por contenido para recomendaciones mejoradas. Prem Melville, Raymond J. Mooney y Ramadass Nagarajan. Actas de la Decimoctava Conferencia Nacional sobre Inteligencia Artificial (AAAI-2002), págs. 187-192, Edmonton, Canadá, julio de 2002.
Una colección de proyectos de "filtrado de información" pasados y presentes (incluido el filtrado colaborativo) en MIT Media Lab
Eigentaste: un algoritmo de filtrado colaborativo de tiempo constante. Ken Goldberg, Theresa Roeder, Dhruv Gupta y Chris Perkins. Recuperación de información, 4 (2), 133-151. Julio de 2001.
Estudio de técnicas de filtrado colaborativo Su, Xiaoyuan y Khoshgortaar, Taghi. METRO
Personalización de Google Noticias: filtrado colaborativo en línea escalable Abhinandan Das, Mayur Datar, Ashutosh Garg y Shyam Rajaram. Conferencia internacional de la World Wide Web, Actas de la decimosexta conferencia internacional sobre la World Wide Web
Incluya a los vecinos: filtrado colaborativo escalable y preciso Yehuda Koren, Transactions on Knowledge Discovery from Data (TKDD) (2009)
Predicción de calificaciones mediante filtrado colaborativo
Sistemas de recomendación
Filtrado colaborativo de Berkeley

[handbook-1] Francesco Ricci y Lior Rokach y Bracha Shapira, Introducción al manual de sistemas de recomendación, Manual de sistemas de recomendación, Springer, 2011, págs. 1-35

[recommender-2] Terveen, Loren ; Hill, Will (2001). "Más allá de los sistemas de recomendación: ayudar a las personas a ayudarse entre sí" (PDF) . Addison-Wesley. pag. 6 . Consultado el 16 de enero de 2012 .

[3] Un enfoque integrado a las recomendaciones de TV y VOD Archivado el 6 de junio de 2012 en Wayback Machine

[Breese1999-4] John S. Breese, David Heckerman y Carl Kadie, Análisis empírico de algoritmos predictivos para filtrado colaborativo , 1998 Archivado el 19 de octubre de 2013 en Wayback Machine.

[Suetal2009-5] Xiaoyuan Su, Taghi M. Khoshgoftaar, Una encuesta sobre técnicas de filtrado colaborativo , Archivo de avances en inteligencia artificial, 2009.

[:0-6] Sistemas de recomendación: el libro de texto | Charu C. Aggarwal | Springer . Saltador. 2016. ISBN 9783319296579.

[7] Ghazanfar, Mustansar Ali; Prügel-Bennett, Adam; Szedmak, Sandor (2012). "Algoritmos del sistema de recomendación de mapeo de kernel". Ciencias de la información . 208 : 81-104. CiteSeerX 10.1.1.701.7729 . doi : 10.1016 / j.ins.2012.04.012 .

[8] Das, Abhinandan S .; Datar, Mayur; Garg, Ashutosh; Rajaram, Shyam (2007). "Personalización de noticias de Google". Actas de la 16ª conferencia internacional sobre World Wide Web - WWW '07 . pag. 271. doi : 10.1145 / 1242572.1242610 . ISBN 9781595936547. S2CID 207163129 .

[9] Él, Xiangnan; Liao, Lizi; Zhang, Hanwang; Nie, Liqiang; Hu, Xia; Chua, Tat-Seng (2017). "Filtrado colaborativo neuronal" . Actas de la 26ª Conferencia Internacional sobre World Wide Web . Comité Directivo de las Conferencias Internacionales de la World Wide Web: 173–182. arXiv : 1708.05031 . doi : 10.1145 / 3038912.3052569 . ISBN 9781450349130. S2CID 13907106 . Consultado el 16 de octubre de 2019 .

[10] Liang, Dawen; Krishnan, Rahul G .; Hoffman, Matthew D .; Jebara, Tony (2018). "Autoencoders variacionales para filtrado colaborativo" . Actas de la Conferencia World Wide Web 2018 . Comité Directivo de Conferencias Internacionales World Wide Web: 689–698. arXiv : 1802.05814 . doi : 10.1145 / 3178876.3186150 . ISBN 9781450356398.

[11] Ferrari Dacrema, Maurizio; Cremonesi, Paolo; Jannach, Dietmar (2019). "¿Realmente estamos haciendo mucho progreso? Un análisis preocupante de enfoques recientes de recomendación neuronal" . Actas de la 13ª Conferencia de ACM sobre sistemas de recomendación . ACM: 101–109. arXiv : 1907.06902 . doi : 10.1145 / 3298689.3347058 . hdl : 11311/1108996 . ISBN 9781450362436. S2CID 196831663 . Consultado el 16 de octubre de 2019 .

[12] Ludewig, Malte; Mauro, Noemi; Latifi, Sara; Jannach, Dietmar (2019). "Comparación de rendimiento de enfoques neuronales y no neuronales a la recomendación basada en sesiones" . Actas de la 13ª Conferencia de ACM sobre sistemas de recomendación . ACM: 462–466. doi : 10.1145 / 3298689.3347041 . ISBN 9781450362436. Consultado el 16 de octubre de 2019 .

[13] Adomavicius, Gediminas; Tuzhilin, Alexander (1 de enero de 2015). Ricci, Francesco; Rokach, Lior; Shapira, Bracha (eds.). Manual de sistemas de recomendación . Springer EE. UU. págs. 191–226. doi : 10.1007 / 978-1-4899-7637-6_6 . ISBN 9781489976369.

[14] Bi, Xuan; Qu, Annie; Shen, Xiaotong (2018). "Factorización de tensor multicapa con aplicaciones a sistemas de recomendación" . Annals of Statistics . 46 (6B): 3303–3333. arXiv : 1711.01598 . doi : 10.1214 / 17-AOS1659 . S2CID 13677707 .

[15] Zhang, Yanqing; Bi, Xuan; Tang, Niansheng; Qu, Annie (2020). "Sistemas de recomendación de tensor dinámico". arXiv : 2003.05568v1 [ stat.ME ].

[16] Bi, Xuan; Tang, Xiwei; Yuan, Yubai; Zhang, Yanqing; Qu, Annie (2021). "Tensores en Estadística" . Revisión anual de estadísticas y su aplicación . 8 (1): annurev. Código Bibliográfico : 2021AnRSA ... 842720B . doi : 10.1146 / annurev-statistics-042720-020816 .

[17] Filtrado colaborativo: elemento vital de la Web social Archivado el 22 de abril de 2012 en Wayback Machine

[18] Gleick, James (2012). La información: una historia, una teoría, una inundación (1st Vintage books ed., 2012 ed.). Nueva York: Vintage Books. pag. 410. ISBN 978-1-4000-9623-7. OCLC 745979816 .

[twitterwtf-19] Pankaj Gupta, Ashish Goel, Jimmy Lin, Aneesh Sharma, Dong Wang y Reza Bosagh Zadeh WTF: El sistema a quién seguir en Twitter , Actas de la 22a conferencia internacional en World Wide Web

[20] Fleder, Daniel; Hosanagar, Kartik (mayo de 2009). "Próxima subida o caída de la cultura de Blockbuster: el impacto de los sistemas de recomendación en la diversidad de ventas". Ciencias de la gestión . 55 (5): 697–712. doi : 10.1287 / mnsc.1080.0974 . SSRN 955984 .

[castells2015-21] Castells, Pablo ; Hurley, Neil J .; Vargas, Saúl (2015). "Novedad y diversidad en los sistemas de recomendación" . En Ricci, Francesco; Rokach, Lior; Shapira, Bracha (eds.). Manual de sistemas de recomendación (2 ed.). Springer EE. UU. págs. 881–918. doi : 10.1007 / 978-1-4899-7637-6_26 . ISBN 978-1-4899-7637-6.

[22] Adamopoulos, Panagiotis; Tuzhilin, Alexander (enero de 2015). "Sobre lo inesperado en los sistemas de recomendación: o cómo esperar mejor lo inesperado". Transacciones ACM sobre tecnología y sistemas inteligentes . 5 (4): 1–32. doi : 10.1145 / 2559952 . S2CID 15282396 .

[23] Adamopoulos, Panagiotis (octubre de 2013). Más allá de la precisión de la predicción de calificaciones: nuevas perspectivas en los sistemas de recomendación . Actas de la 7ª Conferencia ACM sobre sistemas de recomendación . págs. 459–462. doi : 10.1145 / 2507157.2508073 . ISBN 9781450324090. S2CID 1526264 .

[24] Chatzis, Sotirios (octubre de 2013). "Filtrado colaborativo multitarea bayesiano no paramétrico". CIKM '13: Actas de la 22ª conferencia internacional ACM sobre Gestión de la Información y el Conocimiento . Portal.acm.org. págs. 2149–2158. doi : 10.1145 / 2505515.2505517 .

[25] Mehta, Bhaskar; Hofmann, Thomas; Nejdl, Wolfgang (19 de octubre de 2007). Actas de la conferencia ACM de 2007 sobre sistemas de recomendación - Rec Sys '07 . Portal.acm.org. pag. 49. CiteSeerX 10.1.1.695.1712 . doi : 10.1145 / 1297231.1297240 . ISBN 9781595937308. S2CID 5640125 .

[26] Shi, Yue; Larson, Martha; Hanjalic, Alan (2014). "Filtrado colaborativo más allá de la matriz usuario-elemento: una encuesta sobre el estado del arte y los desafíos futuros". Encuestas de computación ACM . 47 : 1–45. doi : 10.1145 / 2556270 . S2CID 5493334 .

[27] Massa, Paolo; Avesani, Paolo (2009). Computación con confianza social . Londres: Springer. págs. 259-285.

[28] Groh Georg; Ehmig Christian. Recomendaciones en dominios relacionados con el gusto: filtrado colaborativo vs. filtrado social . Actas de la conferencia internacional de 2007 de ACM sobre el trabajo de grupos de apoyo. págs. 127-136. CiteSeerX 10.1.1.165.3679 .

[29] Symeonidis, Panagiotis; Nanopoulos, Alexandros; Manolopoulos, Yannis (2008). Recomendaciones de etiquetas basadas en la reducción de la dimensionalidad del tensor . Actas de la Conferencia ACM de 2008 sobre sistemas de recomendación . págs. 43–50. CiteSeerX 10.1.1.217.1437 . doi : 10.1145 / 1454008.1454017 . ISBN 9781605580937. S2CID 17911131 .

[1]