La estilometría es la aplicación del estudio del estilo lingüístico , generalmente al lenguaje escrito, pero se ha aplicado con éxito a la música [1] y también a las pinturas de bellas artes [2] . [3] Otra conceptualización la define como la disciplina lingüística que evalúa el estilo de un autor mediante la aplicación del análisis estadístico a un cuerpo de su trabajo. [4]
La estilometría se utiliza a menudo para atribuir la autoría a documentos anónimos o en disputa. [5] Tiene aplicaciones tanto legales como académicas y literarias, que van desde la cuestión de la autoría de las obras de Shakespeare hasta la lingüística forense .
Historia
La estilometría surgió de técnicas anteriores de análisis de textos en busca de evidencia de autenticidad, identidad del autor y otras preguntas.
La práctica moderna de la disciplina recibió publicidad del estudio de los problemas de autoría en el teatro del Renacimiento inglés. Los investigadores y lectores observaron que algunos dramaturgos de la época tenían patrones distintivos de preferencias lingüísticas e intentaron utilizar esos patrones para identificar a los autores de obras inciertas o colaborativas. Los primeros esfuerzos no siempre tuvieron éxito: en 1901, un investigador intentó utilizar la preferencia de John Fletcher por " 'em", la forma contractiva de "ellos", como un marcador para distinguir entre Fletcher y Philip Massinger en sus colaboraciones, pero empleó erróneamente una edición de las obras de Massinger en la que el editor había ampliado todas las instancias de " 'em" a "ellos". [6]
Los fundamentos de la estilometría fueron establecidos por el filósofo polaco Wincenty Lutosławski en Principes de stylométrie (1890). Lutosławski utilizó este método para desarrollar una cronología de los Diálogos de Platón . [7]
El desarrollo de las computadoras y su capacidad para analizar grandes cantidades de datos mejoró este tipo de esfuerzo en órdenes de magnitud. Sin embargo, la gran capacidad de las computadoras para el análisis de datos no garantizaba resultados de buena calidad. A principios de la década de 1960, el Rev. AQ Morton produjo un análisis por computadora de las catorce epístolas del Nuevo Testamento atribuidas a San Pablo, que indicó que seis autores diferentes habían escrito ese cuerpo de trabajo. Una verificación de su método, aplicado a las obras de James Joyce , dio como resultado que Ulysses , la novela de múltiples perspectivas y múltiples estilos de Joyce, estaba compuesta por cinco individuos separados, ninguno de los cuales aparentemente participó en la elaboración de la primera obra de Joyce. novela, Retrato del artista joven . [8]
Sin embargo, con el tiempo y la práctica, los investigadores y académicos han perfeccionado sus métodos para obtener mejores resultados. Un éxito temprano notable fue la resolución de la autoría en disputa de doce de Los documentos federalistas de Frederick Mosteller y David Wallace. [9] Si bien todavía hay preguntas sobre los supuestos y métodos iniciales (y, tal vez, siempre lo serán), pocos ahora discuten la premisa básica de que el análisis lingüístico de textos escritos puede producir información y conocimientos valiosos. (De hecho, esto era evidente incluso antes del advenimiento de las computadoras: la aplicación exitosa de un análisis textual / lingüístico al canon de Fletcher por Cyrus Hoy y otros arrojó resultados claros a fines de la década de 1950 y principios de la de 1960).
Aplicaciones
Las aplicaciones de la estilometría incluyen estudios literarios, estudios históricos, estudios sociales y muchos casos y estudios forenses. [10] [11] También se puede aplicar al código informático [12] y la detección de plagio intrínseco , que consiste en detectar plagio en función de los cambios de estilo de escritura dentro del documento. [13] La estilometría también se puede usar para predecir si alguien es un hablante nativo o no nativo de inglés por su velocidad de escritura . [14]
La estilometría como método es vulnerable a la distorsión del texto durante la revisión. [15] También está el caso de que el autor adopte diferentes estilos a lo largo de su carrera como se demostró en el caso de Platón , quien eligió diferentes políticas estilísticas como las adoptadas para los diálogos tempranos y medios que abordan el problema socrático. [dieciséis]
La investigación actual
La estilometría moderna utiliza computadoras para análisis estadístico e inteligencia artificial y acceso al creciente corpus de textos disponibles a través de Internet . [17] Sistemas de software como Signature [18] (software gratuito producido por el Dr. Peter Millican de la Universidad de Oxford), JGAAP [19] (Programa de atribución de autoría gráfica de Java, software gratuito producido por el Dr. Patrick Juola de la Universidad de Duquesne), stylo [20] [21] (un paquete R de código abierto para una variedad de análisis estilométricos, incluida la atribución de autoría, desarrollado por Maciej Eder , Jan Rybicki y Mike Kestemont ) y Stylene [22] para holandés (software gratuito en línea del profesor Walter Daelemans de la Universidad de Amberes y la Dra. Véronique Hoste de la Universidad de Gante) hacen que su uso sea cada vez más factible, incluso para los no expertos.
Sedes y eventos académicos
Los métodos estilométricos se utilizan para varios temas académicos, principalmente como un complemento, como ocurre con el aprendizaje automático, el procesamiento del lenguaje natural y la lexicografía.
Lingüística forense
La Asociación Internacional de Lingüistas Forenses (IAFL) organiza la Conferencia Bienal de la Asociación Internacional de Lingüistas Forenses (13a edición en 2016 en Oporto ) y publica The International Journal of Speech, Language and the Law con la estilística forense como uno de sus temas centrales.
AAAI
La Asociación para el Avance de la Inteligencia Artificial (AAAI) ha organizado varios eventos sobre el análisis subjetivo y estilístico del texto. [23] [24] [25]
SARTÉN
Los talleres de PAN (originalmente, análisis de plagio, identificación de autoría y detección de casi duplicados, luego taller de manera más general sobre cómo descubrir plagio, autoría y uso indebido del software social) organizados desde 2007 principalmente en conjunto con conferencias de acceso a la información como ACM SIGIR , FIRE y CLEF . PAN formula tareas de desafío compartidas para la detección de plagio, [26] identificación de autoría, [27] identificación de género de autor, [28] perfil de autor , [29] detección de vandalismo, [30] y otras tareas de análisis de texto relacionadas, muchas de las cuales dependen de la estilometría .
Estudios de caso de interés
- En 1439, Lorenzo Valla demostró que la Donación de Constantino era una falsificación , un argumento basado en parte en una comparación del latín con el utilizado en documentos auténticos del siglo IV.
- En 1952, el sacerdote sueco Dick Helander fue elegido obispo de Strängnäs . La campaña fue competitiva y Helander fue acusado de escribir una serie de cientos de cartas calumniosas anónimas sobre otros candidatos al electorado del obispado de Strängnäs. Helander fue condenado primero por escribir las cartas y perdió su puesto de obispo, pero luego fue parcialmente exonerado. Las letras se estudiaron utilizando una serie de medidas estilométricas (y también características de la máquina de escribir) y los diversos casos judiciales y exámenes posteriores, muchos contraídos por el propio Helander durante los años hasta su muerte en 1978, discutieron el método estilométrico y su valor como prueba con cierto detalle. . [31] [32]
- En 1975, después de que Ronald Reagan se desempeñara como gobernador de California, comenzó a emitir comentarios de radio semanales sindicados a cientos de estaciones. Después de que sus notas personales se hicieran públicas en su 90 cumpleaños en 2001, un estudio utilizó métodos estiloestadísticos para determinar cuáles de esas charlas fueron escritas por él y cuáles fueron escritas por varios ayudantes. [33]
- En 1996, el análisis estilométrico del controvertido libro Primary Colors , realizado por el profesor de Vassar College Donald Foster [34], llamó la atención de un público más amplio sobre el tema después de identificar correctamente al autor como Joe Klein . (Este caso se resolvió solo después de que un análisis de escritura confirmó la autoría).
- En 1996, se utilizaron métodos estilométricos para comparar el manifiesto de Unabomber con cartas escritas por uno de los sospechosos, Theodor Kaczynski, a su hermano, lo que resultó en la aprehensión y posterior condena de Theodor. [35]
- En abril de 2015, los investigadores que utilizaron técnicas de estilometría identificaron una obra de teatro, Double Falsehood , como obra de William Shakespeare . [36] Los investigadores analizaron 54 obras de Shakespeare y John Fletcher , compararon la longitud promedio de las oraciones, estudiaron el uso de palabras inusuales y cuantificaron la complejidad y la valencia psicológica de su lenguaje.
- En 2016, MacDonald P. Jackson, profesor emérito de inglés en la Universidad de Auckland , Nueva Zelanda y miembro de la Royal Society of New Zealand , que había pasado toda su carrera académica analizando la atribución de autoría, escribió un libro titulado Who Wrote "The Noche antes de Navidad "?: Analizando el caso de Clement Clarke Moore vs. Henry Livingston Question , [20] en la que evalúa los argumentos opuestos y, por primera vez, utiliza las técnicas de atribución de autor de la estilística computacional moderna para examinar la controversia de larga data. Jackson emplea una variedad de pruebas e introduce una nueva, análisis estadístico de fonemas; concluye que Livingston es el verdadero autor de la obra clásica.
- En 2017, Simon Fuller y James O'Sullivan publicaron un estudio que afirmaba que el exitoso autor James Patterson no escribe nada en sus novelas aparentemente coautoras. [37] [38] [39] Según O'Sullivan, su colaboración con el ex presidente estadounidense Bill Clinton , The President is Missing , es una excepción a esta regla. [40]
- En 2017, un grupo de lingüistas, informáticos y académicos analizaron la autoría de Elena Ferrante . Basándose en un corpus creado en la Universidad de Padua que contiene 150 novelas escritas por 40 autores, analizaron el estilo de Ferrante basándose en siete de sus novelas. Pudieron comparar su estilo de escritura con otros 39 novelistas usando, por ejemplo, stylo. [20] La conclusión fue la misma para todos: Domenico Starnone es el autor secreto de Elena Ferrante. [41]
- En 2018, Mark Glickman , profesor titular de estadística en la Universidad de Harvard, trabajó con Ryan Song, un ex estudiante de estadística en Harvard, y Jason Brown, profesor de la Universidad de Dalhousie en Nueva Escocia, aplicando estilometría para encontrar que, muy probablemente, el La canción de los Beatles " In My Life " fue compuesta por John Lennon, pero con un 50% de probabilidad de que Paul McCartney escribiera los ocho medios . [42]
- En 2019, el proyecto ETSO: Estilometría aplicada al Teatro del Siglo de Oro español , dirigido por Álvaro Cuéllar González y Germán Vega García-Luengos (Universidad de Valladolid) consiguió reunir más de 1200 obras del Siglo de Oro español. Tras aplicar el análisis estilométrico, se ratificó la atribución de Mujeres y criados a Lope de Vega [43] [44] y se detectó un problema de autoría en La monja alférez , obra de teatro atribuida a Pérez de Montalbán que, gracias a estos análisis y a través de investigación histórica y filológica, fue finalmente atribuida a Juan Ruiz de Alarcón . [45] [46] [47] [48]
- En 2020, Rachel McCarthy y James O'Sullivan argumentaron que Emily Brontë es la verdadera autora de Cumbres borrascosas , poniendo fin a las especulaciones de algunos críticos de que la novela podría haber sido escrita por uno de sus hermanos, específicamente Branwell o Charlotte . [49]
Datos y métodos
Dado que la estilometría tiene tanto casos de uso descriptivos, utilizados para caracterizar el contenido de una colección, como casos de uso identificatorios, por ejemplo, identificación de autores o categorías de textos, los métodos utilizados para analizar los datos y las características anteriores van desde los creados para clasificar elementos en conjuntos o para distribuir artículos en un espacio de variación de características. La mayoría de los métodos son de naturaleza estadística, como el análisis de conglomerados y el análisis discriminante , se basan normalmente en datos y características filológicos , y son dominios de aplicación fructíferos para los métodos modernos de aprendizaje automático .
Mientras que en el pasado, la estilometría enfatizaba los elementos más raros o llamativos de un texto, las técnicas contemporáneas pueden aislar patrones de identificación incluso en partes comunes del discurso. La mayoría de los sistemas se basan en estadísticas léxicas, es decir, utilizan las frecuencias de palabras y términos en el texto para caracterizar el texto (o su autor). En este contexto, a diferencia de la recuperación de información , los patrones de ocurrencia observados de las palabras más comunes son más interesantes que los términos tópicos que son menos frecuentes. [50] [51]
El método estilométrico principal es el invariante del escritor : una propiedad que tienen en común todos los textos, o al menos todos los textos, lo suficientemente largos como para admitir análisis que arrojen resultados estadísticamente significativos, escritos por un autor determinado. Un ejemplo de invariante del escritor es la frecuencia de las palabras funcionales utilizadas por el escritor.
En uno de esos métodos, el texto se analiza para encontrar las 50 palabras más comunes. Luego, el texto se divide en bloques de 5.000 palabras y cada uno de los fragmentos se analiza para encontrar la frecuencia de esas 50 palabras en ese fragmento. Esto genera un identificador único de 50 números para cada fragmento. Estos números colocan cada fragmento de texto en un punto en un espacio de 50 dimensiones. Este espacio de 50 dimensiones se aplana en un plano mediante el análisis de componentes principales (PCA). Esto da como resultado una visualización de puntos que corresponden al estilo de un autor. Si dos obras literarias se colocan en el mismo plano, el patrón resultante puede mostrar si ambas obras fueron del mismo autor o de autores diferentes.
1. Estadísticas gaussianas
Los datos estilométricos se distribuyen de acuerdo con la ley de Zipf-Mandelbrot . La distribución es extremadamente puntiaguda y leptocúrtica , razón por la cual los investigadores no pudieron usar las estadísticas para resolver, por ejemplo, problemas de atribución de autoría. Sin embargo, el uso de la estadística gaussiana es perfectamente posible aplicando la transformación de datos . [52]
2. Redes neuronales
Las redes neuronales , un caso especial de métodos estadísticos de aprendizaje automático, se han utilizado para analizar la autoría de textos. Los textos de autoría indiscutible se utilizan para entrenar una red neuronal mediante procesos como la retropropagación , de modo que se calcula el error de entrenamiento y se utiliza para actualizar el proceso para aumentar la precisión. A través de un proceso similar a la regresión no lineal, la red adquiere la capacidad de generalizar su capacidad de reconocimiento a nuevos textos a los que aún no ha estado expuesta, clasificándolos con un grado de confianza establecido. Tales técnicas se aplicaron a las antiguas afirmaciones de colaboración de Shakespeare con sus contemporáneos Fletcher y Christopher Marlowe , [53] [54] y confirmaron la opinión, basada en estudios más convencionales, de que tal colaboración había ocurrido.
Un estudio de 1999 mostró que un programa de redes neuronales alcanzó el 70% de precisión para determinar la autoría de poemas que aún no había analizado. Este estudio de la Vrije Universiteit examinó la identificación de poemas de tres autores holandeses utilizando solo secuencias de letras como "den". [55]
Un estudio utilizó redes de creencias profundas (DBN) para el modelo de verificación de autoría aplicable a la autenticación continua (CA). [56]
Un problema con este método de análisis es que la red puede sesgarse en función de su conjunto de entrenamiento, posiblemente seleccionando a los autores que la red ha analizado con más frecuencia. [55]
3. Algoritmos genéticos
El algoritmo genético es otra técnica de aprendizaje automático utilizada para la estilometría. Se trata de un método que comienza con un conjunto de reglas. Un ejemplo de regla podría ser, "Si pero aparece más de 1,7 veces en cada mil palabras, entonces el texto es el autor X". El programa se presenta con texto y usa las reglas para determinar la autoría. Las reglas se prueban con un conjunto de textos conocidos y cada regla recibe una puntuación de aptitud. No se utilizan las 50 reglas con las puntuaciones más bajas. Las 50 reglas restantes reciben pequeños cambios y se introducen 50 reglas nuevas. Esto se repite hasta que las reglas evolucionadas atribuyen los textos correctamente.
4. Pares raros
Un método para identificar el estilo se denomina "pares raros" y se basa en los hábitos individuales de colocación . El uso de ciertas palabras puede, para un autor en particular, estar asociado idiosincráticamente con el uso de otras palabras predecibles.
Atribución de autoría en mensajería instantánea
La difusión de Internet ha desplazado la atención de la atribución de autoría hacia textos en línea (páginas web, blogs, etc.), mensajes electrónicos (correos electrónicos, tweets, publicaciones, etc.) y otros tipos de información escrita que son mucho más breves que un libro promedio, mucho menos formal y más diverso en términos de elementos expresivos como colores , diseño , tipografía , gráficos , emoticonos , etc. Se informaron los esfuerzos para tener en cuenta estos aspectos tanto a nivel de estructura como de sintaxis. [57] Además, se introdujeron señales idiosincrásicas y específicas del contenido (por ejemplo, modelos de temas y herramientas de revisión gramatical) para revelar elecciones estilísticas deliberadas. [58]
Se han empleado características estilométricas estándar para categorizar el contenido de un chat por mensajería instantánea , [59] o el comportamiento de los participantes, [60] pero los intentos de identificar a los participantes del chat son todavía pocos y tempranos. Además, se ha descuidado la similitud entre las conversaciones habladas y las interacciones de chat, al tiempo que constituye una gran diferencia entre los datos de chat y cualquier otro tipo de información escrita.
Ver también
- Lingüística y el Libro de Mormón, Estilometría (Estudios de Wordprint)
- Moshe Koppel
- Writeprint
Notas
- ^ Westcott, Richard (15 de junio de 2006). "Hacer de la música de éxito una ciencia" . BBC News .
- ^ "Internet Archive Wayback Machine" . 2006-06-30. Archivado desde el original el 30 de junio de 2006 . Consultado el 15 de octubre de 2012 . Citar utiliza un título genérico ( ayuda )
- ^ Argamon, Shlomo , Kevin Burns y Shlomo Dubnov , eds. La estructura del estilo: enfoques algorítmicos para comprender la manera y el significado. Springer Science & Business Media, 2010.
- ^ Yang, Christopher C .; Chen, Hsinchun; Chau, Michael; Chang, Kuiyu; Lang, Sheau-Dong; Chen, Patrick; Carley, Kathleen M .; Hsieh, Raymond; Zeng, Daniel (2008). Inteligencia y seguridad informática: IEEE ISI 2008 Talleres internacionales: PAISI, PACCF y SOCO 2008, Taipei, Taiwán, 17 de junio de 2008, Actas . Berlín: Springer Science & Business Media. pag. 252. ISBN 9783540691365.
- ^ Chen, Hsinchun; Yang, Christopher C .; Chau, Michael; Li, Shu-Hsing (2009). Informática de inteligencia y seguridad: Taller de Asia Pacífico, PAISI 2009, Bangkok, Tailandia, 27 de abril de 2009. Actas . Berlín: Springer Science & Business Media. pag. 15. ISBN 9783642013928.
- ^ Samuel Schoenbaum , Evidencia interna y autoría dramática isabelina; un ensayo sobre historia y método literarios, pág. 171.
- ^ Lutoslawski, W. (1898). "Principes de stylométrie appliqués à la chronologie des œuvres de Platon". Revue des Études Grecques . 11 (41): 61–81. doi : 10.3406 / reg.1898.5847 . ISSN 0035-2039 .
- ^ Samuel Schoenbaum , Evidencia interna y autoría dramática isabelina; un ensayo sobre historia y método literarios, pág. 196.
- ^ F. Mosteller y D. Wallace (1964). Inferencia y autoría en disputa: el federalista . Reading, MA : Addison-Wesley .
- ^ Chaski, Carole (2012). Solan, Lawrence M; Tiersma, Peter M (eds.). Identificación del autor en el ámbito forense . El Manual de Oxford de Lenguaje y Derecho . Prensa de la Universidad de Oxford. doi : 10.1093 / oxfordhb / 9780199572120.001.0001 . ISBN 9780199572120.
- ^ Chaski, Carole (22 de diciembre de 2005). Wecht, Cyril H .; Rago, John T. (eds.). Ciencias Forenses y Derecho: Aplicaciones Investigativas en Justicia Penal, Civil y Familiar . Prensa CRC. ISBN 978-1-4200-5811-6.
- ^ Claburn, Thomas (16 de marzo de 2018). "FYI: las herramientas de inteligencia artificial pueden desenmascarar codificadores anónimos de sus ejecutables binarios" . El registro . Consultado el 2 de agosto de 2018 .
- ^ Bensalem, Imene; Rosso, Paolo; Chikhi, Salim (2019). "Sobre el uso de caracteres n-gramas como única evidencia intrínseca de plagio". Recursos lingüísticos y evaluación . 53 (3): 363–396. doi : 10.1007 / s10579-019-09444-w . hdl : 10251/159151 . S2CID 86630897 .
- ^ Brizan, David (octubre de 2015). "Utilizando dinámicas de pulsación de teclas mejoradas lingüísticamente para predecir la cognición y la demografía del mecanógrafo". Revista Internacional de Estudios Humano-Informáticos . 82 : 57–68. doi : 10.1016 / j.ijhcs.2015.04.005 .
- ^ Alican, Necip Fikri (2012). Repensar Platón: una búsqueda cartesiana del verdadero Platón . Ámsterdam: Rodopi. pag. 183. ISBN 9789042035379.
- ^ Rowe, Christopher (2000). La historia de Cambridge del pensamiento político griego y romano . Cambridge, Reino Unido: Cambridge University Press. pag. 160. ISBN 0521481368.
- ^ Argamon, Shlomo , Jussi Karlgren y James G. Shanahan . Análisis estilístico del texto para el acceso a la información. Artículos del taller realizado en conjunto con la 28ª Conferencia Anual Internacional ACM sobre Investigación y Desarrollo en Recuperación de Información, 13-19 de agosto de 2005, Salvador, Bahía, Brasil. Instituto sueco de informática, 2005.
- ^ "El sistema estilométrico de la firma" . PhiloComp . Consultado el 3 de enero de 2014 .
- ^ "JGAAP" . JGAAP. 2012-09-04 . Consultado el 15 de octubre de 2012 .
- ^ a b "El paquete stylo para R" . Grupo de Estilística Computacional. 2014-10-24 . Consultado el 24 de octubre de 2014 .
- ^ Eder, Maciej; Rybicki, Jan; Kestemont, Mike (2016). "Estilometría con R: un paquete para el análisis de texto computacional" (PDF) . R Journal . 8 (1): 107–121. doi : 10.32614 / RJ-2016-007 .
- ^ Daelemans, Walter y Hoste, Véronique (2013). STYLENE: an Environment for Stylometry and Legbility Research for Dutch (Informe técnico). Serie de informes técnicos CLiPS. ISSN 2033-3544 .
- ^ Yan Qu , James Shanahan y Janyce Wiebe . "Explorando la actitud y el afecto en el texto: teorías y aplicaciones". Informe técnico del Simposio de Primavera de AAAI SS-04-07. AAAI Press, Menlo Park, CA. 2004.
- ^ Jussi Karlgren , Björn Gambäck y Pentti Kanerva . "Adquirir (y utilizar) conocimientos lingüísticos (y mundiales) para el acceso a la información". (2002). Simposio de primavera de AAAI. Informe técnico SS-02-09. AAAI Press, Menlo Park, CA. 2002.
- ^ Shlomo Argamon , Shlomo Dubnov y Julie Jupp . "Estilo y significado en el lenguaje, el arte, la música y el diseño" (2004). Simposio de otoño de AAAI. Informe técnico FS-04-07.
- ^ Potthast, Martin, Benno Stein, Alberto Barrón-Cedeño y Paolo Rosso. "Un marco de evaluación para la detección de plagio". En Actas de la 23ª conferencia internacional sobre lingüística computacional: carteles, págs. 997–1005. Asociación de Lingüística Computacional, 2010.
- ^ Stamatatos, Efstathios, Walter Daelemans, Ben Verhoeven, Patrick Juola, Aurelio López-López, Martin Potthast y Benno Stein. "Resumen de la tarea de identificación de autor en PAN 2014". En CLEF (notas de trabajo), págs. 877–897. 2014.
- ^ Rangel, Francisco, Paolo Rosso, Martin Potthast y Benno Stein. "Resumen de la quinta tarea de elaboración de perfiles de autores en pan 2017: identificación de variedad de género y lenguaje en twitter" Documentos de notas de trabajo del CLEF (2017).
- ^ Rangel Pardo, Francisco Manuel, Fabio Celli, Paolo Rosso, Martin Potthast, Benno Stein y Walter Daelemans. "Resumen de la tercera tarea de elaboración de perfiles de autores en PAN 2015". En CLEF 2015 Evaluation Labs and Workshop Working Notes Papers, págs. 1–8. 2015.
- ^ Potthast, Martin, Benno Stein y Teresa Holfeld. "Resumen del 1er Concurso Internacional de Detección de Vandalismo en Wikipedia". En CLEF (Notebook Papers / LABs / Workshops). 2010.
- ^ Procesamiento de textos, análisis y generación de textos: tipología y atribución de textos. Actas del simposio Nobel 51 / ed. por Sture Allén Estocolmo: Almqvist & Wiksell international 1982 653 pp. Data linguistica; 16 simposio Nobel; 51 ISBN 91-22-00594-3
- ^ Karlgren, Jussi (2003). "Helander: un caso de atribución de autoría" . Consultado el 4 de octubre de 2017 .
- ^ Edoardo M. Airoldi ; Stephen E. Fienberg; Kiron K. Skinner (julio de 2007). "¿Ideas de quién? ¿Palabras de quién? Autoría de las direcciones de radio de Ronald Reagan" (PDF) . PD: Ciencias Políticas y Política . 40 (3): 501–506. CiteSeerX 10.1.1.190.5798 . doi : 10.1017 / S1049096507070874 .
- ^ Autor desconocido por Gavin McNett Salon 2 de noviembre de 2000
- ^ Belluck, Pam (10 de abril de 1996). "En el caso Unabom, dolor para la familia del sospechoso" . The New York Times . Archivado desde el original el 10 de agosto de 2017 . Consultado el 5 de julio de 2008 .
- ^ "El estudio encuentra que una obra de Shakespeare en disputa lleva la marca del maestro" . LATimes.com . 2015-04-10 . Consultado el 13 de abril de 2015 .
- ^ Fuller, Simon; O'Sullivan, James (2017). "Estructura sobre estilo: autoría colaborativa y el resurgimiento del capitalismo literario" . Trimestral de Humanidades Digitales . 011 (1) . Consultado el 20 de abril de 2017 .
- ^ Lane, Anthony (18 de junio de 2018). "Colaboración conmovedora de Bill Clinton y James Patterson" . The New Yorker . Consultado el 7 de junio de 2018 .
- ^ "Por qué no es necesario escribir mucho para ser el autor más vendido del mundo" . La conversación . 3 de abril de 2017 . Consultado el 20 de abril de 2017 .
- ^ O'Sullivan, James (7 de junio de 2018). "Bill Clinton y James Patterson son coautores, pero ¿quién lo escribió?" . The Guardian . Consultado el 7 de junio de 2018 .
- ^ Jacques Savoy. Elena Ferrante desenmascarada. https://www.researchgate.net/publication/320131096_Elena_Ferrante_Unmasked
- ^ Peter Reuell. "Tú dices Juan, yo digo Pablo. Pero, ¿qué dice la estilometría?". https://news.harvard.edu/gazette/story/2018/09/harvard-statistician-examines-beatles-mystery/
- ^ "Un monstruo de la naturaleza llamado Lope" . abc (en español). 2018-11-28 . Consultado el 11 de agosto de 2019 .
- ^ "Rastreadores digitales en el Siglo de Oro" . El Norte de Castilla (en español). 2018-12-23 . Consultado el 11 de agosto de 2019 .
- ^ Real, La Tribuna de Ciudad (09/07/2019). "Juan Ruiz de Alarcón aumenta su obra cinco siglos después" . La Tribuna de Ciudad Real (en español) . Consultado el 11 de agosto de 2019 .
- ^ Chamberí, PSOE. "PSOE | PSOE Chamberí | chamberí | suplemento cultural | domingo, 28 de julio 2019 | número 06 | Daniel Migueláñez | Pág nº 08 | El Holmes de la filología" . Consultado el 11 de agosto de 2019 .
- ^ "Sor Juana Inés centró las 42 Jornadas de Teatro Clásico" . Lanza Digital (en español). 2019-07-14 . Consultado el 11 de agosto de 2019 .
- ^ " ' La monja alférez' ya no es de Pérez de Montalbán, sino de Ruiz de Alarcón" . El Norte de Castilla (en español). 2019-07-10 . Consultado el 11 de agosto de 2019 .
- ^ McCarthy, Rachel; O'Sullivan, James (2020). "¿Quién escribió Cumbres Borrascosas?" . Beca Digital en Humanidades . doi : 10.1093 / llc / fqaa031 .
- ^ Biber, Douglas . Variación a través del habla y la escritura. Prensa de la Universidad de Cambridge, 1991.
- ^ Karlgren, Jussi ; Corte, Douglass (1994). "Reconocimiento de géneros de texto con métricas simples mediante análisis discriminante". Actas de la Conferencia Internacional sobre Lingüística Computacional . 2 : 1071. arXiv : cmp-lg / 9410008 . Código Bibliográfico : 1994cmp.lg ... 10008K . doi : 10.3115 / 991250.991324 . S2CID 1297432 .
- ^ Van Droogenbroeck FJ, 'Una reformulación esencial de la ley de Zipf-Mandelbrot para resolver aplicaciones de atribución de autoría mediante estadísticas gaussianas' (2019) [1]
- ^ [2] Computación neuronal en estilometría I: una aplicación a las obras de Shakespeare y Fletcher Matthews RAJ & Merriam TVN Lit Linguist Computing (1993) 8 (4): 203-209. doi: 10.1093 / llc / 8.4.203
- ^ [3] Computación neuronal en estilometría II: una aplicación a las obras de Shakespeare y Marlowe Merriam TVN y Matthews RAJ Lit Linguist Computing (1994) 9 (1): 1-6
- ^ a b JF HoornZ; SL Frank; W Kowalczyk; F van der Ham (3 de septiembre de 2012). "Identificación de redes neuronales de poetas mediante secuencias de letras". Computación Literaria y Lingüística . 14 (3): 311–338. doi : 10.1093 / llc / 14.3.311 .
- ^ Brocardo, ML; Traore, yo; Woungang, yo; Obaidat, MS (2017). "Verificación de autoría utilizando sistemas de redes de creencias profundas". Int J Commun Syst . 30 (12): e3259. doi : 10.1002 / dac.3259 .
- ^ de Vel, O .; Anderson, A .; Corney, M .; Mohay, G. (1 de diciembre de 2001). "Minería de contenido de correo electrónico para análisis forense de identificación de autor". SIGMOD Rec . 30 (4): 55–64. CiteSeerX 10.1.1.408.4231 . doi : 10.1145 / 604264.604272 . ISSN 0163-5808 . S2CID 1623521 .
- ^ Argamon, Shlomo; Koppel, Moshe; Pennebaker, James W .; Schler, Jonathan (1 de febrero de 2009). "Perfilar automáticamente el autor de un texto anónimo". Comun. ACM . 52 (2): 119-123. CiteSeerX 10.1.1.136.9952 . doi : 10.1145 / 1461928.1461959 . ISSN 0001-0782 . S2CID 5413411 .
- ^ "Clasificación de comunicaciones de mensajería instantánea para análisis forense - TechRepublic" . TechRepublic . Consultado el 26 de enero de 2016 .
- ^ Zhou, L .; Zhang, Dongsong (1 de enero de 2004). ¿Puede el comportamiento en línea revelar a los engañadores? - una investigación exploratoria del engaño en la mensajería instantánea . Actas de la 37a Conferencia Internacional Anual de Hawaii sobre Ciencias de Sistemas, 2004 . págs. 9 págs. -. doi : 10.1109 / HICSS.2004.1265079 . ISBN 978-0-7695-2056-8. S2CID 7154702 .
Referencias
- Brocardo, Marcelo Luiz; Issa Traore; Sherif Saad; Isaac Woungang (2013). Verificación de autoría para mensajes cortos mediante estilometría . IEEE Intl. Conferencia sobre Sistemas de Computación, Información y Telecomunicaciones (CITS). doi : 10.1109 / CITS.2013.6705711 .
- Can F, Patton JM (2004). "Cambio de estilo de escritura con el tiempo". Informática y Humanidades . 38 (1): 61–82. CiteSeerX 10.1.1.1.8850 . doi : 10.1023 / b: chum.0000009225.28847.77 . S2CID 38242388 .
- Brennan, Michael Robert; Greenstadt, Rachel. "Ataques prácticos contra técnicas de reconocimiento de autoría" . Aplicaciones innovadoras de la inteligencia artificial .
- Hope, Jonathan (1994). La autoría de las obras de Shakespeare . Cambridge: Cambridge University Press.
- Hoy C (1956-1962). "Las acciones de Fletcher y sus colaboradores en el Canon de Beaumont y Fletcher". Estudios en Bibliografía . 7-15 .
- Juola, Patrick (2006). "Atribución de autoría" (PDF) . Fundamentos y tendencias en la recuperación de información . 1 (3): 3. CiteSeerX 10.1.1.219.1605 . doi : 10.1561 / 1500000005 .
- Kenny, Anthony (1982). El cálculo del estilo: una introducción a la estadística para estudiantes de literatura y humanidades . Oxford: Pergamon Press.
- Romaine, Suzanne (1982). Lingüística sociohistórica . Cambridge: Cambridge University Press.
- Samuels, ML (1972). Evolución lingüística: con especial referencia al inglés . Cambridge: Cambridge University Press.
- Schoenbaum, Samuel (1966). Evidencia interna y autoría dramática isabelina: un ensayo en historia y método literarios . Evanston, IL, EE.UU .: Northwestern University Press.
- Van Droogenbroeck, Frans J. (2016) " Manejo de la distribución Zipf en la atribución de autoría computarizada "
- Van Droogenbroeck, Frans J. (2019) " Una reformulación esencial de la ley Zipf-Mandelbrot para resolver las aplicaciones de atribución de autoría mediante estadísticas gaussianas "
- Zenkov AV (2017) " Método de atribución de texto basado en las estadísticas de números ", Journal of Quantitative Linguistics
Otras lecturas
Véase también la revista académica Literary and Linguistic Computing (publicada por la Universidad de Oxford ) y la revista Language Resources and Evaluation .
enlaces externos
- Asociación de Computación y Humanidades
- Computación literaria y lingüística
- Grupo de Estilística Computacional
- Firma Sistema Stylometric
- Programa de atribución de autoría de JGAAP
- Descubriendo el misterio de la última novela de JK Rowling