La Colección Pangloss es una biblioteca digital cuyo objetivo es almacenar y facilitar el acceso a grabaciones de audio en idiomas en peligro de extinción del mundo. Desarrollada por el centro LACITO de CNRS en París , la colección proporciona acceso gratuito en línea a documentos de habla espontánea y conectada , en idiomas de todos los continentes que de otra manera estarían mal documentados . [1]
Principios
Un archivo de sonido con transcripciones sincronizadas
Para la ciencia de la lingüística , el lenguaje es ante todo lenguaje hablado. El medio del lenguaje hablado es el sonido. La Colección Pangloss brinda acceso a grabaciones originales simultáneamente con transcripciones y traducciones, como un recurso para futuras investigaciones. Tras ser grabados en su contexto cultural, los textos se han transcrito en colaboración con hablantes nativos .
Una arquitectura estructurada y abierta
Los datos archivados están estructurados de acuerdo con los últimos estándares de procesamiento de datos, como arquitectura abierta , en un formato abierto , y pueden descargarse bajo una licencia Creative Commons . El software utilizado para prepararlo y difundirlo es de código abierto . La Colección Pangloss es miembro de la red OLAC de repositorios de archivos.
Historia
La colección se llamó inicialmente Archivo LACITO . [2] [3] El proyecto se originó en 1996 a partir de la colaboración de Boyd Michailovsky, lingüista de LACITO, con John B. Lowe, ingeniero; [4] : 15 luego se les unió Michel Jacobson, ingeniero, quien desarrolló algunas herramientas para el proyecto y lo puso en línea. [1] : 124 [4]
El propósito del archivo era “ conservar y poner a disposición para la investigación tradiciones orales grabadas y transcritas y otros materiales lingüísticos en idiomas (principalmente) no escritos, dando acceso simultáneo a grabaciones sonoras y anotaciones de texto ”. [4] Los primeros corpus archivados de la colección eran idiomas de Nepal , Nueva Caledonia , África oriental y Guayana Francesa . [5]
El archivo ha crecido de manera constante desde finales de la década de 2000, [6] incorporando corpus de varios lingüistas, ya sean miembros de LACITO o no. En 2009, el archivo tenía 200 grabaciones en 45 idiomas. [7] En 2014, la colección Pangloss (recientemente renombrada) tenía 1.400 grabaciones en 70 idiomas. [1] : 121
En abril de 2021, el archivo de Pangloss contiene 4.663 grabaciones [8] en 176 idiomas, [9] con un total de 780 horas de grabaciones de audio y video. [6]
Referencias
- ^ a b c Michailovsky, Boyd, Martine Mazaudon, Alexis Michaud, Séverine Guillaume, Alexandre François y Evangelia Adamou. 2014. Documentar e investigar lenguas en peligro: la colección Pangloss . Conservación y documentación del idioma 8, págs. 119-135.
- ^ Jacobson, Michel; Michailovsky, Boyd (2002). El Archivo LACITO: su finalidad e implementación . Taller Internacional sobre Recursos y Herramientas en Lingüística de Campo. Las Palmas, Islas Canarias, España.
- ^ Captura de pantalla de la página de inicio del archivo de LACITO - 27 de febrero de 2001.
- ^ a b c Jacobson, Michel; Michailovsky, Boyd; Lowe, John B. (2001). "Documentos lingüísticos sincronizando sonido y texto" . Comunicación de voz . Número especial: “Herramientas de anotación de voz y corpus”. 33 : 79–96.
- ^ Captura de pantalla del contenido del archivo de LACITO - 22 de abril de 2002.
- ^ a b Sección "Acerca de nosotros" de la colección Pangloss (consultado el 24 de abril de 2021)
- ^ Captura de pantalla del contenido del archivo de LACITO - 26 de noviembre de 2009.
- ^ Fuente: lista de todos los recursos de Pangloss en la página de inicio de Cocoon (consultado el 24 de abril de 2021) .
- ^ Fuente: número de entradas de idiomas en su lista de corpus (consultado el 24 de abril de 2021) .
enlaces externos
- Página de inicio de la colección Pangloss
- Texto de muestra de la colección: “The Ogre Kanayongba” , una historia en el idioma limbu de Nepal , presentada en formato bilingüe.
- Acceso a la colección Pangloss a través de su mapa de idiomas
- Acceso a la colección Pangloss a través de la interfaz de búsqueda CoCoON .
- Acceso a la colección Pangloss a través de la interfaz de búsqueda OLAC .