El análisis de sentimientos (también conocido como minería de opiniones o IA emocional ) es el uso del procesamiento del lenguaje natural , el análisis de texto , la lingüística computacional y la biometría para identificar, extraer, cuantificar y estudiar sistemáticamente los estados afectivos y la información subjetiva. El análisis de sentimientos se aplica ampliamente a los materiales de voz del cliente , como revisiones y respuestas a encuestas, redes sociales y en línea, y materiales de atención médica para aplicaciones que van desde el marketing hasta el servicio al cliente y la medicina clínica.
Ejemplos de
El objetivo y los desafíos del análisis de sentimientos se pueden mostrar a través de algunos ejemplos simples.
Casos sencillos
- Coronet tiene las mejores líneas de cruceros de todo el día.
- Bertram tiene un casco en V profundo y atraviesa fácilmente los mares.
- Los cruceros diurnos de colores pastel de los años 80 de Florida son feos.
- No me gustan los cruceros de cabina viejos .
Ejemplos más desafiantes
- No me disgustan los cruceros de cabina. ( Manejo de negación )
- No me gustan las motos de agua no es lo mío. (Negación, orden de palabras invertido )
- A veces realmente odio las semirrígidas . ( Adverbial modifica el sentimiento)
- ¡Realmente me encantaría salir con este clima! (Posiblemente sarcástico )
- Chris Craft es más guapo que Limestone. (Dos marcas , identificar el objetivo de la actitud es difícil).
- Chris Craft es más atractivo que Limestone, pero Limestone proyecta navegabilidad y confiabilidad. (Dos actitudes, dos marcas).
- La película es sorprendente con muchos giros de trama inquietantes. (Término negativo usado en sentido positivo en ciertos dominios).
- Debería ver su menú de postres decadente. (El término actitudinal ha cambiado de polaridad recientemente en ciertos dominios)
- Me encanta mi móvil, pero no se lo recomendaría a ninguno de mis compañeros. (Sentimiento positivo calificado, difícil de categorizar)
- ¡El concierto de la semana que viene estará bien, koide9! ("¿Quoi de neuf?" Fr .: "¿Qué hay de nuevo?". Los términos recién acuñados pueden ser muy actitudinales pero volátiles en polaridad y, a menudo, fuera del vocabulario conocido).
Tipos
Una tarea básica en el análisis de sentimientos es clasificar la polaridad de un texto dado a nivel de documento, oración o característica / aspecto, ya sea que la opinión expresada en un documento, una oración o una característica / aspecto de entidad sea positiva, negativa o neutral. La clasificación de sentimiento avanzada, "más allá de la polaridad", se centra, por ejemplo, en estados emocionales como el disfrute, la ira, el disgusto, la tristeza, el miedo y la sorpresa. [1]
Los precursores del análisis sentimental incluyen el General Inquirer, [2] que proporcionó pistas para cuantificar patrones en el texto y, por separado, la investigación psicológica que examinó el estado psicológico de una persona basándose en el análisis de su comportamiento verbal. [3]
Posteriormente, el método descrito en una patente por Volcani y Fogel, [4] analizó específicamente el sentimiento e identificó palabras y frases individuales en el texto con respecto a diferentes escalas emocionales. Un sistema actual basado en su trabajo, llamado EffectCheck, presenta sinónimos que pueden usarse para aumentar o disminuir el nivel de emoción evocada en cada escala.
Muchos otros esfuerzos posteriores fueron menos sofisticados, utilizando una mera visión polar del sentimiento, de positivo a negativo, como el trabajo de Turney, [5] y Pang [6], quienes aplicaron diferentes métodos para detectar la polaridad de reseñas de productos y reseñas de películas, respectivamente. . Este trabajo está a nivel de documento. También se puede clasificar la polaridad de un documento en una escala multidireccional, lo que fue intentado por Pang [7] y Snyder [8] entre otros: Pang y Lee [7] ampliaron la tarea básica de clasificar una reseña de una película como positiva o negativa. para predecir calificaciones de estrellas en una escala de 3 o 4 estrellas, mientras que Snyder [8] realizó un análisis en profundidad de las reseñas de restaurantes, prediciendo calificaciones para varios aspectos del restaurante dado, como la comida y el ambiente (en un escala de cinco estrellas).
Los primeros pasos para unir varios enfoques (aprendizaje, léxico, basado en el conocimiento, etc.) se tomaron en el Simposio de primavera de la AAAI de 2004, donde lingüistas, informáticos y otros investigadores interesados primero alinearon intereses y propusieron tareas compartidas y conjuntos de datos de referencia para el Investigación computacional sistemática sobre el afecto, el atractivo, la subjetividad y el sentimiento en el texto. [9]
Aunque en la mayoría de los métodos de clasificación estadística, la clase neutra se ignora bajo el supuesto de que los textos neutrales se encuentran cerca del límite del clasificador binario, varios investigadores sugieren que, como en todo problema de polaridad, deben identificarse tres categorías. Además, se puede demostrar que clasificadores específicos como Max Entropy [10] y SVMs [11] pueden beneficiarse de la introducción de una clase neutra y mejorar la precisión general de la clasificación. En principio, hay dos formas de operar con una clase neutra. O bien, el algoritmo procede identificando primero el lenguaje neutral, filtrándolo y luego evaluando el resto en términos de sentimientos positivos y negativos, o construye una clasificación de tres vías en un solo paso. [12] Este segundo enfoque a menudo implica estimar una distribución de probabilidad sobre todas las categorías (por ejemplo, clasificadores ingenuos de Bayes implementados por el NLTK ). El uso de una clase neutral y cómo hacerlo depende de la naturaleza de los datos: si los datos están claramente agrupados en un lenguaje neutral, negativo y positivo, tiene sentido filtrar el lenguaje neutral y enfocarse en la polaridad entre sentimientos positivos y negativos. Si, por el contrario, los datos son en su mayoría neutrales con pequeñas desviaciones hacia el afecto positivo y negativo, esta estrategia haría más difícil distinguir claramente entre los dos polos.
Un método diferente para determinar el sentimiento es el uso de un sistema de escala mediante el cual a las palabras comúnmente asociadas con tener un sentimiento negativo, neutral o positivo con ellas se les asigna un número asociado en una escala de −10 a +10 (del más negativo al más positivo) o simplemente de 0 a un límite superior positivo como +4. Esto hace posible ajustar el sentimiento de un término dado en relación con su entorno (generalmente en el nivel de la oración). Cuando se analiza un fragmento de texto no estructurado utilizando el procesamiento del lenguaje natural , cada concepto en el entorno especificado recibe una puntuación basada en la forma en que las palabras de sentimiento se relacionan con el concepto y su puntuación asociada. [13] [14] [15] Esto permite avanzar hacia una comprensión más sofisticada del sentimiento, porque ahora es posible ajustar el valor del sentimiento de un concepto en relación con las modificaciones que pueden rodearlo. Las palabras, por ejemplo, que intensifican, relajan o niegan el sentimiento expresado por el concepto pueden afectar su puntuación. Alternativamente, los textos pueden recibir un puntaje de fuerza de sentimiento positivo y negativo si el objetivo es determinar el sentimiento en un texto en lugar de la polaridad y fuerza general del texto. [dieciséis]
Hay varios otros tipos de análisis de sentimientos como: análisis de sentimiento basado en aspectos, análisis de sentimiento de calificación (positivo, negativo, neutral), análisis de sentimiento multilingüe y detección de emociones.
Identificación de subjetividad / objetividad
Esta tarea se define comúnmente como clasificar un texto dado (generalmente una oración) en una de dos clases: objetiva o subjetiva. [17] Este problema a veces puede ser más difícil que la clasificación de polaridad. [18] La subjetividad de las palabras y frases puede depender de su contexto y un documento objetivo puede contener oraciones subjetivas (por ejemplo, un artículo de noticias que cita las opiniones de las personas). Además, como menciona Su, [19] los resultados dependen en gran medida de la definición de subjetividad utilizada al anotar textos. Sin embargo, Pang [20] mostró que eliminar oraciones objetivas de un documento antes de clasificar su polaridad ayudó a mejorar el rendimiento.
La identificación subjetiva y objetiva, las subtareas emergentes del análisis de sentimientos para utilizar características sintácticas y semánticas y el conocimiento del aprendizaje automático para identificar una oración o documento son hechos u opiniones. La conciencia de reconocer los hechos y las opiniones no es reciente, posiblemente fue presentada por primera vez por Carbonell en la Universidad de Yale en 1979. [ aclarar ]
El término objetivo se refiere a que el incidente lleve información fáctica. [21]
- Ejemplo de una oración objetiva: "Para ser elegido presidente de los Estados Unidos, un candidato debe tener al menos treinta y cinco años de edad".
El término subjetivo describe que el incidente contiene información no fáctica en varias formas, como opiniones personales, juicios y predicciones. También conocido como 'estados privados' mencionado por Quirk et al. [22] En el ejemplo a continuación, refleja un estado privado "Nosotros los estadounidenses". Además, la entidad objetivo comentada por las opiniones puede tomar formas de servicio, desde productos tangibles hasta asuntos tópicos intangibles indicados en Liu (2010). [23] Además, Liu (2010) observó tres tipos de actitudes: 1) opiniones positivas, 2) opiniones neutrales y 3) opiniones negativas. [23]
- Ejemplo de una oración subjetiva: "Los estadounidenses debemos elegir un presidente que sea maduro y capaz de tomar decisiones acertadas".
Este análisis es un problema de clasificación. [24]
Las colecciones de palabras o indicadores de fase de cada clase se definen para localizar patrones deseables en texto sin anotaciones. Para la expresión subjetiva, se ha creado una lista de palabras diferente. En Riloff et al. (2003), varios investigadores en el campo del procesamiento del lenguaje natural y lingüistas han desarrollado listas de indicadores subjetivos en palabras o frases. [25] Debe crearse un diccionario de reglas de extracción para medir expresiones dadas. A lo largo de los años, en la detección subjetiva, la extracción de características progresa desde la curación manual de características en 1999 hasta el aprendizaje automático de características en 2005. [26] Por el momento, los métodos de aprendizaje automatizados pueden separarse aún más en aprendizaje automático supervisado y no supervisado . Los investigadores académicos han explorado ampliamente la extracción de patrones con el proceso de aprendizaje automático con texto anotado y sin anotar.
Sin embargo, los investigadores reconocieron varios desafíos en el desarrollo de conjuntos fijos de reglas para las expresiones de manera respetable. Gran parte de los desafíos en el desarrollo de reglas provienen de la naturaleza de la información textual. Se han reconocido seis desafíos en los investigadores de serval: 1) expresiones metafóricas, 2) discrepancias en los escritos, 3) sensibles al contexto, 4) palabras representadas con menos usos, 5) sensibles al tiempo y 6) volumen cada vez mayor.
- Expresiones metafóricas. El texto contiene expresión metafórica que puede repercutir en el desempeño de la extracción. [27] Además, las metáforas adoptan diferentes formas, lo que puede haber contribuido al aumento de la detección.
- Discrepancias en los escritos. Para el texto obtenido de Internet, las discrepancias en el estilo de escritura de los datos de texto específicos involucran distintos géneros y estilos de escritura.
- Sensible al contexto. La clasificación puede variar según la subjetividad u objetividad de las oraciones anteriores y siguientes. [24]
- Atributo sensible al tiempo. La tarea se ve desafiada por el atributo sensible al tiempo de algunos datos textuales. Si un grupo de investigadores quiere confirmar un hecho en las noticias, necesitan más tiempo para la validación cruzada, de lo que las noticias quedan desactualizadas.
- Palabras clave con menos usos.
- Volumen en constante crecimiento. La tarea también se ve desafiada por el gran volumen de datos textuales. La naturaleza cada vez mayor de los datos textuales hace que la tarea sea abrumadoramente difícil para que los investigadores la completen a tiempo.
Anteriormente, la investigación se centró principalmente en la clasificación a nivel de documentos. Sin embargo, la clasificación de un nivel de documento tiene menos precisión, ya que un artículo puede tener diversos tipos de expresiones involucradas. La evidencia de la investigación sugiere un conjunto de artículos de noticias que se espera que dominen por la expresión objetiva, mientras que los resultados muestran que consistió en más del 40% de expresión subjetiva. [21]
Para superar esos desafíos, los investigadores concluyen que la eficacia del clasificador depende de la precisión de los patrones del aprendiz. Y el alumno se alimenta con grandes volúmenes de datos de capacitación anotados que superaron a los capacitados en funciones subjetivas menos completas. Sin embargo, uno de los principales obstáculos para ejecutar este tipo de trabajo es generar un gran conjunto de datos de oraciones anotadas manualmente. El método de anotación manual se ha visto menos favorecido que el aprendizaje automático por tres razones:
- Variaciones en comprensiones. En la tarea de anotación manual, el desacuerdo sobre si una instancia es subjetiva u objetiva puede ocurrir entre los anotadores de serval debido a la ambigüedad de los idiomas.
- Errores humanos. La tarea de anotación manual es una tarea meticulosa, requiere una concentración intensa para terminar.
- Pérdida de tiempo. La tarea de anotación manual es un trabajo asiduo. Riloff (1996) muestra que 160 textos cuestan 8 horas para que un anotador los termine. [28]
Todas estas razones mencionadas pueden afectar la eficiencia y eficacia de la clasificación subjetiva y objetiva. En consecuencia, se diseñaron dos métodos de arranque para aprender patrones lingüísticos a partir de datos de texto no anotados. Ambos métodos comienzan con un puñado de palabras iniciales y datos textuales sin anotar.
- Meta-Bootstrapping de Riloff y Jones en 1999. [29] Nivel uno: Genere patrones de extracción basados en las reglas predefinidas y los patrones extraídos por el número de palabras semilla que contiene cada patrón. Nivel dos: Las 5 palabras principales se marcarán y se agregarán al diccionario. Repetir.
- Basilisk ( B ootstrapping A pproach to S emantIc L exicon I nduction usando S emantic K nowledge) por Thelen y Riloff. [30] Paso uno: generar patrones de extracción Paso dos: mover los mejores patrones del conjunto de patrones al conjunto de palabras candidatas. Paso tres: las 10 palabras principales se marcarán y se agregarán al diccionario. Repetir.
En general, estos algoritmos destacan la necesidad de un reconocimiento y extracción automáticos de patrones en tareas subjetivas y objetivas.
El clasificador subjetivo y de objetos puede mejorar las aplicaciones servales del procesamiento del lenguaje natural. Uno de los principales beneficios del clasificador es que popularizó la práctica de los procesos de toma de decisiones basados en datos en varias industrias. Según Liu, las aplicaciones de la identificación subjetiva y objetiva se han implementado en los negocios, la publicidad, los deportes y las ciencias sociales. [31]
- Clasificación de reseñas en línea: en la industria empresarial, el clasificador ayuda a la empresa a comprender mejor los comentarios sobre el producto y los razonamientos detrás de las reseñas.
- Predicción del precio de las acciones: en la industria financiera, el más clásico ayuda al modelo de predicción procesando información auxiliar de las redes sociales y otra información textual de Internet. Estudios previos sobre el precio de las acciones japonesas realizados por Dong et.al. indica que el modelo con módulo subjetivo y objetivo puede funcionar mejor que aquellos sin esta parte. [32]
- Análisis de redes sociales.
- Clasificación de los comentarios de los estudiantes. [33]
- Resumen de documentos: el clasificador puede extraer comentarios específicos del objetivo y recopilar opiniones hechas por una entidad en particular.
- Respuesta a preguntas complejas. El clasificador puede diseccionar las preguntas complejas clasificando el tema del lenguaje o el objetivo objetivo y enfocado. En la investigación de Yu et al. (2003), el investigador desarrolló un nivel de oración y documento que agrupaba las piezas de opinión de identidad. [34]
- Aplicaciones específicas de dominio.
- Análisis de correo electrónico: el clasificador subjetivo y objetivo detecta el spam rastreando patrones de lenguaje con palabras de destino.
Basado en características / aspectos
Se refiere a determinar las opiniones o sentimientos expresados sobre diferentes características o aspectos de entidades, por ejemplo, de un teléfono celular, una cámara digital o un banco. [35] Una característica o aspecto es un atributo o componente de una entidad, por ejemplo, la pantalla de un teléfono celular, el servicio de un restaurante o la calidad de imagen de una cámara. La ventaja del análisis de sentimientos basado en características es la posibilidad de capturar matices sobre objetos de interés. Diferentes características pueden generar diferentes respuestas de sentimiento, por ejemplo, un hotel puede tener una ubicación conveniente, pero comida mediocre. [36] Este problema involucra varios subproblemas, por ejemplo, identificar entidades relevantes, extraer sus características / aspectos y determinar si una opinión expresada sobre cada característica / aspecto es positiva, negativa o neutral. [37] La identificación automática de características se puede realizar con métodos sintácticos, con modelado de temas , [38] [39] o con aprendizaje profundo . [40] [41] Se pueden encontrar discusiones más detalladas sobre este nivel de análisis de sentimientos en el trabajo de Liu. [23]
Métodos y características
Los enfoques existentes para el análisis de sentimientos se pueden agrupar en tres categorías principales: técnicas basadas en el conocimiento, métodos estadísticos y enfoques híbridos. [42] Las técnicas basadas en el conocimiento clasifican el texto por categorías de afecto basándose en la presencia de palabras de afecto inequívocas como feliz, triste, asustado y aburrido. [43] Algunas bases de conocimiento no solo enumeran palabras afectivas obvias, sino que también asignan a palabras arbitrarias una probable "afinidad" a emociones particulares. [44] Los métodos estadísticos aprovechan elementos del aprendizaje automático como el análisis semántico latente , las máquinas de vectores de soporte , la " bolsa de palabras ", la " información mutua puntual " para la orientación semántica, [5] y el aprendizaje profundo . Los métodos más sofisticados intentan detectar al portador de un sentimiento (es decir, la persona que mantiene ese estado afectivo) y al objetivo (es decir, la entidad sobre la que se siente el afecto). [45] Para extraer la opinión en contexto y obtener la característica sobre la que ha opinado el hablante, se utilizan las relaciones gramaticales de las palabras. Las relaciones de dependencia gramatical se obtienen mediante un análisis profundo del texto. [46] Los enfoques híbridos aprovechan tanto el aprendizaje automático como elementos de la representación del conocimiento , como ontologías y redes semánticas, para detectar semánticas que se expresan de manera sutil, por ejemplo, a través del análisis de conceptos que no transmiten explícitamente información relevante, pero que están implícitamente vinculados a otros conceptos que lo hacen. [47]
Las herramientas de software de código abierto, así como una variedad de herramientas de análisis de sentimientos gratuitas y de pago, implementan aprendizaje automático , estadísticas y técnicas de procesamiento del lenguaje natural para automatizar el análisis de sentimientos en grandes colecciones de textos, incluidas páginas web, noticias en línea, grupos de discusión en Internet, reseñas en línea, blogs web y redes sociales. [48] Los sistemas basados en el conocimiento, por otro lado, hacen uso de los recursos disponibles públicamente para extraer la información semántica y afectiva asociada con los conceptos del lenguaje natural. El sistema puede ayudar a realizar el razonamiento afectivo de sentido común . [49] El análisis de sentimiento también se puede realizar en contenido visual, es decir, imágenes y videos (consulte Análisis de sentimiento multimodal ). Uno de los primeros enfoques en esta dirección es SentiBank [50] que utiliza una representación de un par de sustantivo adjetivo del contenido visual. Además, la gran mayoría de los enfoques de clasificación de sentimientos se basan en el modelo de bolsa de palabras, que ignora el contexto, la gramática e incluso el orden de las palabras . Los enfoques que analizan el sentimiento en función de cómo las palabras componen el significado de frases más largas han mostrado un mejor resultado, [51] pero incurren en una sobrecarga de anotación adicional.
Se requiere un componente de análisis humano en el análisis de sentimientos, ya que los sistemas automatizados no pueden analizar las tendencias históricas del comentarista individual o de la plataforma y, a menudo, se clasifican incorrectamente en su sentimiento expresado. La automatización afecta aproximadamente al 23% de los comentarios que los humanos clasifican correctamente. [52] Sin embargo, los humanos a menudo no están de acuerdo, y se argumenta que el acuerdo interhumano proporciona un límite superior que los clasificadores de sentimientos automatizados pueden eventualmente alcanzar. [53]
Evaluación
La precisión de un sistema de análisis de sentimientos es, en principio, qué tan bien concuerda con los juicios humanos. Por lo general, esto se mide mediante medidas variantes basadas en la precisión y el recuerdo de las dos categorías objetivo de textos negativos y positivos. Sin embargo, según la investigación, los evaluadores humanos generalmente solo están de acuerdo en aproximadamente el 80% [54] de las veces (consulte la confiabilidad entre evaluadores ). Por lo tanto, un programa que alcanza el 70% de precisión en la clasificación de sentimientos está funcionando casi tan bien como los humanos, aunque tal precisión no suene impresionante. Si un programa fuera "correcto" el 100% del tiempo, los humanos todavía estarían en desacuerdo con él aproximadamente el 20% del tiempo, ya que no están de acuerdo en ninguna respuesta. [55]
Por otro lado, los sistemas informáticos cometerán errores muy diferentes a los de los evaluadores humanos y, por lo tanto, las cifras no son del todo comparables. Por ejemplo, un sistema informático tendrá problemas con las negaciones, las exageraciones, las bromas o el sarcasmo, que normalmente son fáciles de manejar para un lector humano: algunos errores que comete un sistema informático le parecerán demasiado ingenuos. En general, la utilidad para las tareas comerciales prácticas del análisis de sentimientos, tal como se define en la investigación académica, ha sido cuestionada, principalmente porque el modelo unidimensional simple de sentimiento de negativo a positivo produce poca información procesable para un cliente preocupado por la efecto del discurso público sobre, por ejemplo, la marca o la reputación corporativa. [56] [57] [58]
Para adaptarse mejor a las necesidades del mercado, la evaluación del análisis de sentimientos se ha trasladado a medidas más basadas en tareas, formuladas junto con representantes de agencias de relaciones públicas y profesionales de investigación de mercado. Por ejemplo, el enfoque en el conjunto de datos de evaluación RepLab está menos en el contenido del texto en consideración y más en el efecto del texto en cuestión en la reputación de la marca . [59] [60] [61]
Debido a que la evaluación del análisis de sentimientos se basa cada vez más en tareas, cada implementación necesita un modelo de entrenamiento separado para obtener una representación más precisa del sentimiento para un conjunto de datos dado.
web 2.0
El auge de las redes sociales como blogs y redes sociales ha alimentado el interés en el análisis de sentimientos. Con la proliferación de reseñas, valoraciones, recomendaciones y otras formas de expresión online, la opinión online se ha convertido en una especie de moneda virtual para las empresas que buscan comercializar sus productos, identificar nuevas oportunidades y gestionar su reputación. A medida que las empresas buscan automatizar el proceso de filtrar el ruido, comprender las conversaciones, identificar el contenido relevante y actuar de manera adecuada, muchas ahora están mirando hacia el campo del análisis de sentimientos. [62] Para complicar aún más el asunto, está el aumento de plataformas de redes sociales anónimas como 4chan y Reddit . [63] Si la web 2.0 se trataba de democratizar la publicación, entonces la siguiente etapa de la web podría basarse en la democratización de la minería de datos de todo el contenido que se publica. [64]
Un paso hacia este objetivo se logra en la investigación. Varios equipos de investigación en universidades de todo el mundo se centran actualmente en comprender la dinámica del sentimiento en las comunidades electrónicas a través del análisis del sentimiento. [65] El proyecto CyberEmotions , por ejemplo, identificó recientemente el papel de las emociones negativas en la conducción de los debates en las redes sociales. [66]
El problema es que la mayoría de los algoritmos de análisis de sentimientos utilizan términos simples para expresar sentimientos sobre un producto o servicio. Sin embargo, los factores culturales, los matices lingüísticos y los contextos diferentes hacen que sea extremadamente difícil convertir una cadena de texto escrito en un simple sentimiento a favor o en contra. [62] El hecho de que los humanos a menudo no estén de acuerdo con el sentimiento del texto ilustra lo grande que es para las computadoras hacer esto bien. Cuanto más corta sea la cadena de texto, más difícil se vuelve.
Aunque las cadenas de texto cortas pueden ser un problema, el análisis de sentimientos dentro del microblogging ha demostrado que Twitter puede verse como un indicador válido en línea del sentimiento político. El sentimiento político de los tweets demuestra una estrecha correspondencia con las posiciones políticas de los partidos y los políticos, lo que indica que el contenido de los mensajes de Twitter refleja de manera plausible el panorama político fuera de línea. [67] Además, el análisis de sentimientos en Twitter también ha demostrado captar el estado de ánimo del público detrás de los ciclos de reproducción humana a escala planetaria [ término de pavo real ] , [68] así como otros problemas de relevancia para la salud pública como reacciones adversas a medicamentos. [69]
Aplicación en sistemas de recomendación
Para un sistema de recomendación , se ha demostrado que el análisis de sentimientos es una técnica valiosa. Un sistema de recomendación tiene como objetivo predecir la preferencia por un artículo de un usuario objetivo. Los sistemas de recomendación convencionales funcionan con un conjunto de datos explícitos. Por ejemplo, el filtrado colaborativo funciona en la matriz de calificación y el filtrado basado en contenido funciona en los metadatos de los elementos.
En muchos servicios de redes sociales o sitios web de comercio electrónico, los usuarios pueden proporcionar revisión de texto, comentarios o retroalimentación sobre los elementos. Este texto generado por el usuario proporciona una rica fuente de opiniones de los usuarios acerca de numerosos productos y artículos. Potencialmente, para un artículo, dicho texto puede revelar tanto la característica / aspectos relacionados del artículo como los sentimientos de los usuarios sobre cada característica. [70] Las características / aspectos del elemento descritos en el texto juegan el mismo papel que los metadatos en el filtrado basado en contenido , pero los primeros son más valiosos para el sistema de recomendación. Dado que los usuarios mencionan ampliamente estas características en sus reseñas, pueden verse como las características más cruciales que pueden influir significativamente en la experiencia del usuario en el artículo, mientras que los metadatos del artículo (generalmente proporcionados por los productores en lugar de los consumidores) puede ignorar las funciones que preocupan a los usuarios. Para diferentes elementos con características comunes, un usuario puede expresar diferentes opiniones. Además, una característica del mismo artículo puede recibir diferentes sentimientos de diferentes usuarios. Los sentimientos de los usuarios sobre las funciones se pueden considerar como una puntuación de calificación multidimensional, que refleja su preferencia por los elementos.
En función de las características / aspectos y los sentimientos extraídos del texto generado por el usuario, se puede construir un sistema de recomendación híbrido. [71] Hay dos tipos de motivación para recomendar un artículo candidato a un usuario. La primera motivación es que el artículo candidato tiene numerosas características comunes con los artículos preferidos del usuario, [72] mientras que la segunda motivación es que el artículo candidato recibe una alta opinión sobre sus características. Para un artículo preferido, es razonable creer que los artículos con las mismas características tendrán una función o utilidad similar. Por lo tanto, es probable que el usuario prefiera estos elementos. Por otro lado, para una característica compartida de dos elementos candidatos, otros usuarios pueden dar un sentimiento positivo a uno de ellos mientras dan un sentimiento negativo a otro. Claramente, el elemento de alta evaluación debe recomendarse al usuario. Con base en estas dos motivaciones, se puede construir una puntuación de clasificación combinada de similitud y clasificación de sentimiento para cada elemento candidato. [71]
Excepto por la dificultad del análisis de sentimientos en sí, la aplicación del análisis de sentimientos en reseñas o comentarios también enfrenta el desafío del spam y las reseñas sesgadas. Una dirección de trabajo se centra en evaluar la utilidad de cada revisión. [73] La revisión o la retroalimentación mal redactadas no son útiles para el sistema de recomendación. Además, una reseña puede diseñarse para obstaculizar las ventas de un producto de destino y, por lo tanto, ser perjudicial para el sistema de recomendación, incluso si está bien redactada.
Los investigadores también encontraron que las formas largas y cortas de texto generado por el usuario deben tratarse de manera diferente. Un resultado interesante muestra que las revisiones breves son a veces más útiles que las extensas, [74] porque es más fácil filtrar el ruido en un texto breve. Para el texto de formato largo, la extensión creciente del texto no siempre trae un aumento proporcional en el número de características o sentimientos en el texto.
Lamba y Madhusudhan [75] introducen una forma incipiente de satisfacer las necesidades de información de los usuarios de bibliotecas de hoy al volver a empaquetar los resultados del análisis de sentimientos de plataformas de redes sociales como Twitter y proporcionarlo como un servicio consolidado basado en el tiempo en diferentes formatos. Además, proponen una nueva forma de realizar marketing en bibliotecas utilizando la minería de redes sociales y el análisis de sentimientos.
Ver también
- Reconocimiento de emociones
- El sentimiento del mercado
- Análisis de comportamiento de mercados
- Estilometria
Referencias
- ^ Vong Anh Ho, Duong Huynh-Cong Nguyen, Danh Hoang Nguyen, Linh Thi-Van Pham, Duc-Vu Nguyen, Kiet Van Nguyen, Ngan Luu-Thuy Nguyen. "Reconocimiento de emociones para el texto de las redes sociales vietnamitas". En Actas de la Conferencia Internacional 2019 de la Asociación del Pacífico de Lingüística Computacional (PACLING 2019), Hanoi, Vietnam (2019).
- ^ Stone, Philip J., Dexter C. Dunphy y Marshall S. Smith. "El investigador general: un enfoque informático para el análisis de contenido". Prensa del MIT, Cambridge, MA (1966).
- ^ Gottschalk, Louis August y Goldine C. Gleser. La medición de estados psicológicos a través del análisis de contenido de la conducta verbal. Prensa de la Universidad de California, 1969.
- ^ EE. UU. Emitió 7.136.877 , Volcani, Yanon; & Fogel, David B., "Sistema y método para determinar y controlar el impacto del texto", publicado el 28 de junio de 2001
- ↑ a b Turney, Peter (2002). "¿Pulgar hacia arriba o hacia abajo? Orientación semántica aplicada a la clasificación no supervisada de revisiones". Actas de la Asociación de Lingüística Computacional . págs. 417–424. arXiv : cs.LG / 0212032 .
- ^ Pang, Bo; Lee, Lillian ; Vaithyanathan, Shivakumar (2002). "¿Pulgares arriba? Clasificación de sentimientos mediante técnicas de aprendizaje automático" . Actas de la Conferencia sobre métodos empíricos en el procesamiento del lenguaje natural (EMNLP) . págs. 79–86.
- ^ a b Pang, Bo; Lee, Lillian (2005). "Ver estrellas: explotación de las relaciones de clase para la categorización de sentimientos con respecto a las escalas de calificación" . Actas de la Asociación de Lingüística Computacional (ACL) . págs. 115-124.
- ^ a b Snyder, Benjamin; Barzilay, Regina (2007). "Clasificación de aspectos múltiples utilizando el algoritmo de Good Grief" . Actas de la Tecnología Conjunta del Lenguaje Humano / Capítulo Norteamericano de la Conferencia ACL (HLT-NAACL) . págs. 300-307.
- ^ Qu, Yan, James Shanahan y Janyce Wiebe. "Explorando la actitud y el afecto en el texto: teorías y aplicaciones". En AAAI Spring Symposium) Informe técnico SS-04-07. AAAI Press, Menlo Park, CA. 2004.
- ^ Vryniotis, Vasilis (2013). La importancia de la clase neutral en el análisis de sentimientos .
- ^ Koppel, Moshe; Schler, Jonathan (2006). "La importancia de los ejemplos neutrales para el sentimiento de aprendizaje". Inteligencia computacional 22 . págs. 100–109. CiteSeerX 10.1.1.84.9735 .
- ^ Ribeiro, Filipe Nunes; Araujo, Matheus (2010). "Una comparación de referencia de métodos de análisis de sentimiento de estado de la práctica" . Transacciones en sistemas informáticos integrados . 9 (4).
- ^ Taboada, Maite; Brooke, Julian (2011). "Métodos basados en léxico para el análisis de sentimientos" . Lingüística computacional . 37 (2): 272–274. CiteSeerX 10.1.1.188.5517 . doi : 10.1162 / coli_a_00049 . S2CID 3181362 .
- ^ Augustyniak, Łukasz; Szymański, Piotr; Kajdanowicz, Tomasz; Tuligłowicz, Włodzimierz (25 de diciembre de 2015). "Estudio integral sobre análisis de sentimiento de clasificación de conjuntos basado en léxico" . Entropía . 18 (1): 4. Bibcode : 2015Entrp..18 .... 4A . doi : 10.3390 / e18010004 .
- ^ Mehmood, Yasir; Balakrishnan, Vimala (1 de enero de 2020). "Un enfoque mejorado basado en el léxico para el análisis de sentimientos: un estudio de caso sobre la inmigración ilegal" . Revisión de información en línea . 44 (5): 1097-1117. doi : 10.1108 / OIR-10-2018-0295 . ISSN 1468-4527 .
- ^ Thelwall, Mike; Buckley, Kevan; Paltoglou, Georgios; Cai, Di; Kappas, Arvid (2010). "Detección de la fuerza del sentimiento en un texto informal corto" . Revista de la Sociedad Estadounidense de Ciencia y Tecnología de la Información . 61 (12): 2544-2558. CiteSeerX 10.1.1.278.3863 . doi : 10.1002 / asi.21416 .
- ^ Pang, Bo; Lee, Lillian (2008). "4.1.2 Detección de subjetividad e identificación de opiniones" . Minería de opinión y análisis de sentimiento . Ahora Publishers Inc.
- ^ Mihalcea, Rada; Banea, Carmen; Wiebe, Janyce (2007). "Aprendizaje del lenguaje subjetivo multilingüe a través de proyecciones multilingües" (PDF) . Actas de la Asociación de Lingüística Computacional (ACL) . págs. 976–983. Archivado desde el original (PDF) el 8 de julio de 2010.
- ^ Su, Fangzhong; Markert, Katja (2008). "De las palabras a los sentidos: un estudio de caso en el reconocimiento de subjetividad" (PDF) . Actas de Coling 2008, Manchester, Reino Unido .
- ^ Pang, Bo; Lee, Lillian (2004). "Una educación sentimental: análisis del sentimiento mediante el resumen de subjetividad basado en recortes mínimos" . Actas de la Asociación de Lingüística Computacional (ACL) . págs. 271-278.
- ^ a b Wiebe, Janyce; Riloff, Ellen (2005). Gelbukh, Alexander (ed.). "Creación de clasificadores de oraciones subjetivas y objetivas a partir de textos no anotados" . Lingüística computacional y procesamiento inteligente de textos . Apuntes de conferencias en informática. Berlín, Heidelberg: Springer. 3406 : 486–497. doi : 10.1007 / 978-3-540-30586-6_53 . ISBN 978-3-540-30586-6.
- ^ Quirk, Randolph; Greenbaum, Sidney; Geoffrey, Leech; Jan, Svartvik (1985). Una gramática integral del idioma inglés (gramática general) . Longman . págs. 175–239. ISBN 1933108312.
- ^ a b c Liu, Bing (2010). "Análisis de sentimiento y subjetividad" (PDF) . En Indurkhya, N .; Damerau, FJ (eds.). Manual de procesamiento del lenguaje natural (segunda ed.).
- ^ a b Pang, Bo; Lee, Lillian (6 de julio de 2008). "Minería de opinión y análisis de sentimiento" . Fundamentos y tendencias en la recuperación de información . 2 (1–2): 1–135. doi : 10.1561 / 1500000011 . ISSN 1554-0669 .
- ^ Riloff, Ellen; Wiebe, Janyce (11 de julio de 2003). "Aprendizaje de patrones de extracción para expresiones subjetivas" . Actas de la Conferencia de 2003 sobre métodos empíricos en el procesamiento del lenguaje natural . EMNLP '03. Estados Unidos: Asociación de Lingüística Computacional. 10 : 105-112. doi : 10.3115 / 1119355.1119369 . S2CID 6541910 .
- ^ Chaturvedi, Iti; Cambria, Erik; Welsch, Roy E .; Herrera, Francisco (noviembre de 2018). "Distinguir entre hechos y opiniones para el análisis de sentimientos: encuesta y desafíos" (PDF) . Fusión de información . 44 : 65–77. doi : 10.1016 / j.inffus.2017.12.006 - a través de Elsevier Science Direct.
- ^ Wiebe, Janyce; Riloff, Ellen (julio de 2011). "Encontrar beneficio mutuo entre análisis de subjetividad y extracción de información" . Transacciones IEEE sobre computación afectiva . 2 (4): 175-191. doi : 10.1109 / T-AFFC.2011.19 . ISSN 1949-3045 . S2CID 16820846 .
- ^ Riloff, Ellen (1 de agosto de 1996). "Un estudio empírico de la construcción de diccionarios automatizados para la extracción de información en tres dominios" . Inteligencia artificial . 85 (1): 101-134. doi : 10.1016 / 0004-3702 (95) 00123-9 . ISSN 0004-3702 .
- ^ Riloff, Ellen; Jones, Rosie (julio de 1999). "Aprendizaje de diccionarios para la extracción de información mediante bootstrapping multinivel" (PDF) . AAAI '99 / IAAI '99: Actas de la Decimosexta Conferencia Nacional sobre Inteligencia Artificial y la Undécima Conferencia de Aplicaciones Innovadoras de la Inteligencia Artificial Aplicaciones Innovadoras de la Inteligencia Artificial : 474–479.
- ^ Thelen, Michael; Riloff, Ellen (6 de julio de 2002). "Un método de arranque para el aprendizaje de léxicos semánticos utilizando contextos de patrones de extracción" . Actas de la Conferencia ACL-02 sobre métodos empíricos en el procesamiento del lenguaje natural - Volumen 10 . EMNLP '02. Estados Unidos: Asociación de Lingüística Computacional. 10 : 214-221. doi : 10.3115 / 1118693.1118721 . S2CID 137155 .
- ^ Liu, Bing (23 de mayo de 2012). "Análisis de sentimiento y minería de opinión" . Conferencias de síntesis sobre tecnologías del lenguaje humano . 5 (1): 1-167. doi : 10.2200 / S00416ED1V01Y201204HLT016 . ISSN 1947-4040 .
- ^ Deng, Shangkun; Mitsubishi, Takashi; Shioda, Kei; Shimada, Tatsuro; Sakurai, Akito (diciembre de 2011). "Combinando el análisis técnico con el análisis de sentimiento para la predicción del precio de las acciones" . 2011 IEEE Novena Conferencia Internacional sobre Computación Confiable, Autonómica y Segura . IEEE: 800–807. doi : 10.1109 / dasc.2011.138 . ISBN 978-1-4673-0006-3. S2CID 15262023 .
- ^ Nguyen, Kiet Van; Nguyen, Vu Duc; Nguyen, Phu XV; Truong, Tham TH; Nguyen, Ngan LT. (1 de octubre de 2018). "UIT-VSFC: corpus de comentarios de estudiantes vietnamitas para el análisis de sentimientos" . 2018 10th International Conference on Knowledge and Systems Engineering (KSE) . Vietnam: IEEE: 19-24. doi : 10.1109 / KSE.2018.8573337 . ISBN 978-1-5386-6113-0.
- ^ Yu, Hong; Hatzivassiloglou, Vasileios (11 de julio de 2003). "Hacia la respuesta a preguntas de opinión: separando hechos de opiniones e identificando la polaridad de las oraciones de opinión" . Actas de la Conferencia de 2003 sobre métodos empíricos en el procesamiento del lenguaje natural . EMNLP '03. EE.UU .: Asociación de Lingüística Computacional: 129-136. doi : 10.3115 / 1119355.1119372 .
- ^ Hu, Minqing; Liu, Bing (2004). "Minería y resumen de opiniones de clientes" . Actas de KDD 2004 .
- ^ Cataldi, Mario; Ballatore, Andrea; Tiddi, Ilaria; Aufaure, Marie-Aude (22 de junio de 2013). "Buena ubicación, comida terrible: detección de sentimiento de características en las reseñas generadas por los usuarios". Análisis de Redes Sociales y Minería . 3 (4): 1149-1163. CiteSeerX 10.1.1.396.9313 . doi : 10.1007 / s13278-013-0119-7 . ISSN 1869-5450 . S2CID 5025282 .
- ^ Liu, Bing; Hu, Minqing; Cheng, Junsheng (2005). "Observador de opinión: análisis y comparación de opiniones en la web" . Actas de WWW 2005 .
- ^ Zhai, Zhongwu; Liu, Bing; Xu, Hua; Jia, Peifa (1 de enero de 2011). Huang, Joshua Zhexue; Cao, Longbing; Srivastava, Jaideep (eds.). LDA restringido para agrupar características de productos en Opinion Mining . Apuntes de conferencias en informática. Springer Berlín Heidelberg. págs. 448–459. CiteSeerX 10.1.1.221.5178 . doi : 10.1007 / 978-3-642-20841-6_37 . ISBN 978-3-642-20840-9.
- ^ Titov, Ivan; McDonald, Ryan (1 de enero de 2008). Modelado de revisiones en línea con modelos de temas de varios granos . Actas de la 17ª Conferencia Internacional sobre World Wide Web . WWW '08. Nueva York, NY, EE.UU .: ACM. págs. 111-120. arXiv : 0801.1063 . doi : 10.1145 / 1367497.1367513 . ISBN 978-1-60558-085-2. S2CID 13609860 .
- ^ Poria, Soujanya; et al. (2016). "Extracción de aspectos para la minería de opiniones con una red neuronal convolucional profunda". Sistemas basados en el conocimiento . 108 : 42–49. doi : 10.1016 / j.knosys.2016.06.009 .
- ^ Ma, Yukun; et al. (2018). "Análisis de sentimientos basado en aspectos específicos mediante la incorporación de conocimientos de sentido común en un LSTM atento". Procedimientos de AAAI . págs. 5876–5883.
- ^ Cambria, E; Schuller, B; Xia, Y; Havasi, C (2013). "Nuevas vías en minería de opinión y análisis de sentimiento". Sistemas inteligentes IEEE . 28 (2): 15-21. CiteSeerX 10.1.1.688.1384 . doi : 10.1109 / MIS.2013.30 . S2CID 12104996 .
- ^ Ortony, Andrew; Clore, G; Collins, A (1988). La estructura cognitiva de las emociones (PDF) . Cambridge Univ. Prensa. Archivado desde el original (PDF) el 23 de noviembre de 2015.
- ^ Stevenson, Ryan; Mikels, Joseph; James, Thomas (2007). "Caracterización de las normas afectivas de las palabras en inglés por categorías emocionales discretas" (PDF) . Métodos de investigación del comportamiento . 39 (4): 1020–1024. doi : 10.3758 / bf03192999 . PMID 18183921 . S2CID 6673690 .
- ^ Kim, SM; Hovy, EH (2006). "Identificación y análisis de opiniones judiciales". (PDF) . Actas de la conferencia sobre Tecnología del Lenguaje Humano / Asociación Norteamericana de Lingüística Computacional (HLT-NAACL 2006). Nueva York, NY . Archivado desde el original (PDF) el 29 de junio de 2011.
- ^ Dey, Lipika; Haque, SK Mirajul (2008). "Minería de opinión a partir de datos de texto ruidosos" . Actas del segundo taller sobre análisis de datos de texto no estructurados ruidosos, p.83-90 .
- ^ Cambria, E; Hussain, A (2015). Computación semántica: un marco basado en el sentido común para el análisis de sentimientos a nivel de concepto . Saltador. ISBN 9783319236544.
- ^ Akcora, Cuneyt Gurcan; Bayir, Murat Ali; Demirbas, Murat; Ferhatosmanoglu, Hakan (2010). "Identificar puntos de ruptura en la opinión pública" . SigKDD, Actas del primer taller sobre análisis de redes sociales .
- ^ Sasikala, P .; Mary Immaculate Sheela, L. (diciembre de 2020). "Análisis de sentimiento de reseñas de productos en línea usando DLMNN y predicción futura de productos en línea usando IANFIS" . Revista de Big Data . 7 (1): 33. doi : 10.1186 / s40537-020-00308-7 . ISSN 2196-1115 .
- ^ Borth, Damian; Ji, Rongrong; Chen, Tao; Breuel, Thomas; Chang, Shih-Fu (2013). "Detectores y ontología de sentimiento visual a gran escala utilizando pares de sustantivos adjetivos" . Actas de ACM Int. Conferencia sobre Multimedia . págs. 223-232.
- ^ Socher, Richard; Perelygin, Alex; Wu, Jean Y .; Chuang, Jason; Manning, Christopher D .; Ng, Andrew Y .; Potts, Christopher (2013). "Modelos profundos recursivos para la composicionalidad semántica sobre un banco de árboles de sentimiento". En Proceedings of EMNLP : 1631-1642. CiteSeerX 10.1.1.593.7427 .
- ^ "Caso de estudio: análisis de sentimiento avanzado" . Consultado el 18 de octubre de 2013 .
- ^ Mozetič, Igor; Grčar, Miha; Smailović, Jasmina (5 de mayo de 2016). "Clasificación multilingüe del sentimiento de Twitter: el papel de los anotadores humanos" . PLOS ONE . 11 (5): e0155036. arXiv : 1602.07563 . Código bibliográfico : 2016PLoSO..1155036M . doi : 10.1371 / journal.pone.0155036 . ISSN 1932-6203 . PMC 4858191 . PMID 27149621 .
- ^ Ogneva, M. "Cómo las empresas pueden utilizar el análisis de sentimiento para mejorar sus negocios" . Mashable . Consultado el 13 de diciembre de 2012 .
- ^ Roebuck, K. (24 de octubre de 2012). Análisis de sentimiento: estrategias de alto impacto: lo que necesita saber: definiciones, adopciones, impacto, beneficios, madurez, proveedores . ISBN 9781743049457.
- ^ Karlgren, Jussi , Magnus Sahlgren , Fredrik Olsson, Fredrik Espinoza y Ola Hamfors. "Utilidad del análisis de sentimientos". En European Conference on Information Retrieval, págs. 426-435. Springer Berlín Heidelberg, 2012.
- ^ Karlgren, Jussi . "La relación entre el estado de ánimo del autor y el afecto con el sentimiento en el texto y el género del texto". En Actas del cuarto taller sobre explotación de anotaciones semánticas en la recuperación de información, págs. 9-10. ACM, 2011.
- ^ Karlgren, Jussi . " Afecto, atractivo y sentimiento como factores que influyen en la interacción con la información multimedia ". En el taller Proceedings of Theseus / ImageCLEF sobre evaluación de la recuperación de información visual, págs. 8-11. 2009.
- ^ Amigó, Enrique, Adolfo Corujo, Julio Gonzalo, Edgar Meij y Maarten de Rijke . "Descripción general de RepLab 2012: evaluación de sistemas de gestión de reputación en línea". En CLEF (Notas de trabajo en línea / Laboratorios / Taller). 2012.
- ^ Amigó, Enrique, Jorge Carrillo De Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Tamara Martín, Edgar Meij, Maarten de Rijke y Damiano Spina. "Descripción general de replab 2013: evaluación de los sistemas de monitoreo de reputación en línea". En Conferencia internacional del Foro de evaluación de idiomas cruzados para idiomas europeos, págs. 333-352. Springer Berlín Heidelberg, 2013.
- ^ Amigó, Enrique, Jorge Carrillo-de-Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Edgar Meij, Maarten de Rijke y Damiano Spina. "Descripción general de replab 2014: perfiles de autor y dimensiones de reputación para la gestión de la reputación en línea". En la Conferencia internacional del Foro de evaluación de idiomas cruzados para los idiomas europeos, págs. 307-322. Springer International Publishing, 2014.
- ^ a b Wright, Alex. "Explorando la Web en busca de sentimientos, no de hechos" , New York Times , 2009-08-23. Consultado el 1 de octubre de 2009.
- ^ "Análisis de sentimiento en Reddit" . 2014-09-30 . Consultado el 10 de octubre de 2014 .
- ^ Kirkpatrick, Marshall. " , ReadWriteWeb , 15 de abril de 2009. Consultado el 1 de octubre de 2009.
- ^ CORDIS. "Las emociones colectivas en el ciberespacio (CIBEREMOCIONES)" , Comisión Europea , 2009-02-03. Consultado el 13 de diciembre de 2010.
- ^ Condliffe, Jamie. "Flaming impulsa las redes sociales en línea" , New Scientist , 2010-12-07. Consultado el 13 de diciembre de 2010.
- ^ Tumasjan, Andranik; O.Sprenger, Timm; G.Sandner, Philipp; M. Welpe, Isabell (2010). "Predecir elecciones con Twitter: lo que revelan 140 personajes sobre el sentimiento político" . "Actas de la Cuarta Conferencia Internacional AAAI sobre Weblogs y Redes Sociales"
- ^ Wood, Ian B .; Varela, Pedro L .; Bollen, Johan; Rocha, Luis M .; Gonçalves-Sá, Joana (2017). "Los ciclos sexuales humanos están impulsados por la cultura y los estados de ánimo colectivos del partido" . Informes científicos . 7 (1): 17973. arXiv : 1707.03959 . Código Bib : 2017NatSR ... 717973W . doi : 10.1038 / s41598-017-18262-5 . PMC 5740080 . PMID 29269945 .
- ^ Korkontzelos, Ioannis; Nikfarjam, Azadeh; Shardlow, Matthew; Sarker, Abeed; Ananiadou, Sophia; González, Graciela H. (2016). "Análisis del efecto del análisis de sentimiento en la extracción de reacciones adversas a medicamentos de tweets y publicaciones en foros" . Revista de Informática Biomédica . 62 : 148-158. doi : 10.1016 / j.jbi.2016.06.007 . PMC 4981644 . PMID 27363901 .
- ^ Tang, Huifeng; Tan, Songbo; Cheng, Xueqi (2009). "Una encuesta sobre la detección de opiniones de opiniones" (PDF) . Sistemas expertos con aplicaciones . 36 (7): 10760–10773. doi : 10.1016 / j.eswa.2009.02.063 . S2CID 2178380 . Archivado desde el original (PDF) el 24 de mayo de 2018.
- ^ a b Jakob, Niklas, et al. "Más allá de las estrellas: aprovechar las reseñas de los usuarios en texto libre para mejorar la precisión de las recomendaciones de películas". Actas del 1er taller internacional CIKM sobre análisis de tópicos y sentimientos para la opinión de masas . ACM, 2009.
- ^ Minqing, Hu; Liu, Bing (2004). "Funciones de opinión minera en reseñas de clientes" (PDF) . AAAI . 4 (4). S2CID 5724860 . Archivado desde el original (PDF) el 24 de mayo de 2018.
- ^ Liu, Yang; Huang, Xiangji; An, Aijun; Yu, Xiaohui (2008). "Modelado y predicción de la utilidad de las reseñas en línea" (PDF) . ICDM'08. Octava conferencia internacional IEEE sobre minería de datos . IEEE. págs. 443–452. doi : 10.1109 / ICDM.2008.94 . ISBN 978-0-7695-3502-9. S2CID 18235238 .
- ^ Bermingham, Adam; Smeaton, Alan F. (2010). Clasificar el sentimiento en microblogs: ¿la brevedad es una ventaja? (PDF) . Actas de la XIX Conferencia Internacional ACM sobre Gestión de la Información y el Conocimiento . pag. 1833. doi : 10.1145 / 1871437.1871741 . ISBN 9781450300995. S2CID 2084603 .
- ^ Lamba, Manika; Madhusudhan, Margam (2018). "Aplicación del análisis de sentimientos en bibliotecas para brindar servicio de información temporal: un estudio de caso sobre diversas facetas de la productividad". Análisis de Redes Sociales y Minería . 8 (1): 1–12. doi : 10.1007 / s13278-018-0541-y . S2CID 53047128 .