De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

ISO 639-3: 2007 , Códigos para la representación de nombres de idiomas - Parte 3: Código Alpha-3 para una cobertura completa de idiomas , es un estándar internacional para códigos de idiomas en la serie ISO 639 . Define códigos de tres letras para identificar idiomas. La norma fue publicada por la Organización Internacional de Normalización (ISO) el 1 de febrero de 2007. [1]

ISO 639-3 amplía los códigos ISO 639-2 alfa-3 con el objetivo de cubrir todos los lenguajes naturales conocidos . La cobertura de idioma ampliada se basó principalmente en los códigos de idioma utilizados en el Ethnologue (volúmenes 10-14) publicado por SIL International , que ahora es la autoridad de registro para ISO 639-3. [2] Proporciona una enumeración de idiomas lo más completa posible, incluidos vivos y extintos, antiguos y construidos, mayores y menores, escritos y no escritos. [1] Sin embargo, no incluye lenguajes reconstruidos como el protoindoeuropeo . [3]

ISO 639-3 está diseñado para usarse como códigos de metadatos en una amplia gama de aplicaciones. Se utiliza ampliamente en sistemas informáticos y de información, como Internet, en los que es necesario admitir muchos idiomas. En archivos y otro almacenamiento de información, se utiliza en sistemas de catalogación, indicando en qué idioma se encuentra un recurso o sobre el que se encuentra. Los códigos también se utilizan con frecuencia en la literatura lingüística y en otros lugares para compensar el hecho de que los nombres de los idiomas pueden ser oscuros o ambiguos.

Códigos de idioma [ editar ]

ISO 639-3 incluye todos los idiomas en ISO 639-1 y todos los idiomas individuales en ISO 639-2 . ISO 639-1 e ISO 639-2 se centraron en los principales idiomas, representados con mayor frecuencia en el conjunto de la literatura mundial. Dado que ISO 639-2 también incluye colecciones de idiomas y la Parte 3 no, ISO 639-3 no es un superconjunto de ISO 639-2. Donde existen códigos B y T en ISO 639-2, ISO 639-3 usa los códigos T.

Al 18 de febrero de 2021 , el estándar contiene 7.893 entradas. [6] El inventario de idiomas se basa en una serie de fuentes que incluyen: los idiomas individuales contenidos en 639-2, los idiomas modernos del Ethnologue , las variedades históricas, los idiomas antiguos y los idiomas artificiales de la Lista de lingüistas , [7] así como idiomas recomendados dentro del período anual de comentarios públicos.

Los archivos de datos legibles por máquina son proporcionados por la autoridad de registro. [6] Se pueden realizar asignaciones de ISO 639-1 o ISO 639-2 a ISO 639-3 utilizando estos archivos de datos.

La norma ISO 639-3 está destinada a asumir distinciones basadas en criterios que no son del todo subjetivos. [8] No tiene la intención de documentar o proporcionar identificadores para dialectos u otras variaciones de sub-idioma. [9] Sin embargo, los juicios con respecto a las distinciones entre idiomas pueden ser subjetivos, particularmente en el caso de variedades de idiomas sin tradiciones literarias establecidas, uso en la educación o los medios de comunicación, u otros factores que contribuyen a la convencionalización del idioma. Por lo tanto, el estándar no debe considerarse como una declaración autorizada de los distintos idiomas que existen en el mundo (acerca de los cuales puede haber un desacuerdo sustancial en algunos casos), sino simplemente como una forma útil de identificar diferentes variedades de idiomas con precisión.

Espacio de código [ editar ]

Dado que el código es alfabético de tres letras, un límite superior para el número de idiomas que se pueden representar es 26 × 26 × 26 = 17,576. Dado que ISO 639-2 define códigos especiales (4), un rango reservado (520) y códigos B solamente (22), no se pueden usar 546 códigos en la parte 3. Por lo tanto, un límite superior más estricto es 17.576 - 546 = 17.030.

El límite superior se vuelve aún más estricto si se restan las colecciones de idiomas definidas en 639-2 y las que aún no se han definido en ISO 639-5 .

Macrolenguajes [ editar ]

Hay 58 idiomas en ISO 639-2 que se consideran, para los propósitos de la norma, como "macrolenguajes" en ISO 639-3. [10]

Algunos de estos macrolenguajes no tenían un idioma individual según lo definido por ISO 639-3 en el conjunto de códigos de ISO 639-2, por ejemplo, 'ara' (árabe genérico). Otros como 'nor' (noruego) tenían sus dos partes individuales ('nno' ( Nynorsk ), 'nob' ( Bokmål )) ya en ISO 639-2.

Eso significa que algunos idiomas (por ejemplo, 'arb', árabe estándar) que ISO 639-2 consideraba dialectos de un idioma ('ara') ahora están en ISO 639-3 en ciertos contextos considerados idiomas individuales.

Este es un intento de tratar con variedades que pueden ser lingüísticamente distintas entre sí, pero que sus hablantes las tratan como dos formas del mismo idioma, por ejemplo, en casos de diglosia .

Por ejemplo:

  • http://www-01.sil.org/iso639-3/documentation.asp?id=ara (árabe genérico, 639-2)
  • http://www-01.sil.org/iso639-3/documentation.asp?id=arb (árabe estándar, 639-3)

Consulte [11] para obtener la lista completa.

Idiomas colectivos [ editar ]

"Un elemento de código de idioma colectivo es un identificador que representa un grupo de idiomas individuales que no se consideran un solo idioma en ningún contexto de uso". [12] Estos códigos no representan con precisión un idioma o macrolenguaje en particular.

Si bien ISO 639-2 incluye identificadores de tres letras para idiomas colectivos, estos códigos están excluidos de ISO 639-3. Por tanto, ISO 639-3 no es un superconjunto de ISO 639-2.

ISO 639-5 define códigos colectivos de 3 letras para familias y grupos de idiomas, incluidos los códigos colectivos de idiomas de ISO 639-2.

Códigos especiales [ editar ]

Se reservan cuatro códigos en ISO 639-2 e ISO 639-3 para los casos en los que ninguno de los códigos específicos es apropiado. Estos están destinados principalmente a aplicaciones como bases de datos donde se requiere un código ISO independientemente de si existe.

  • mis (idiomas no codificados, originalmente una abreviatura de 'varios') está destinado a idiomas que (todavía) no se han incluido en la norma ISO.
  • mul (varios idiomas) está destinado a casos en los que los datos incluyen más de un idioma y (por ejemplo) la base de datos requiere un solo código ISO.
  • und(indeterminado) está destinado a casos en los que el idioma de los datos no se ha identificado, como cuando está mal etiquetado o nunca se ha etiquetado. No está diseñado para casos como el de Trojan, en el que se ha dado un nombre a un idioma no certificado.
  • zxx(sin contenido lingüístico / no aplicable) está destinado a datos que no son un idioma en absoluto, como las llamadas de animales. [13]

Además, 520 de descuento en la gama qaa- qtzestán 'reservados para uso local'. Por ejemplo, Rebecca Bettencourt, asigna un código a los lenguajes construidos y se realizan nuevas asignaciones a pedido. [14] La Lista de lingüistas los usa para idiomas extintos . Linguist List ha asignado a uno de ellos un valor genérico: qnpprotolenguaje sin nombre. Se utiliza para los nodos intermedios propuestos en un árbol genealógico que no tienen nombre.

Procesos de mantenimiento [ editar ]

La tabla de códigos para ISO 639-3 está abierta a cambios. Para proteger la estabilidad del uso existente, los cambios permitidos se limitan a: [15]

  • modificaciones a la información de referencia para una entrada (incluidos nombres o categorizaciones por tipo y alcance),
  • adición de nuevas entradas,
  • desaprobación de entradas duplicadas o falsas,
  • fusionar una o más entradas en otra entrada, y
  • dividir una entrada de idioma existente en varias entradas de idioma nuevo.

El código asignado a un idioma no se cambia a menos que también haya un cambio en la denotación. [dieciséis]

Los cambios se realizan en un ciclo anual. Cada solicitud tiene un período mínimo de tres meses para revisión pública.

El sitio Web ISO 639-3 tiene páginas que describen "ámbitos de denotación" [17] ( tipos lánguidos ) y tipos de lenguajes, [18] que explican qué conceptos están dentro del alcance de la codificación y ciertos criterios que deben cumplirse. Por ejemplo, los lenguajes construidos se pueden codificar, pero solo si están diseñados para la comunicación humana y tienen un cuerpo de literatura, evitando solicitudes de invenciones idiosincrásicas.

La autoridad de registro documenta en su sitio web las instrucciones hechas en el texto de la norma ISO 639-3 con respecto a cómo se deben mantener las tablas de códigos. [19] También documenta los procesos utilizados para recibir y procesar solicitudes de cambio. [20]

Se proporciona un formulario de solicitud de cambio y hay un segundo formulario para recopilar información sobre las adiciones propuestas. Cualquiera de las partes puede enviar solicitudes de cambio. Cuando se envían, la autoridad de registro revisa inicialmente las solicitudes para verificar que estén completas.

Cuando se recibe una solicitud completamente documentada, se agrega a un índice de solicitud de cambio publicado. Además, los anuncios se envían a la lista de discusión general de LINGUISTA en Linguist List y otras listas que la autoridad de registro puede considerar relevantes, invitando a la opinión pública y comentarios sobre el cambio solicitado. Cualquier propietario o individuo de la lista puede solicitar notificaciones de solicitudes de cambio para regiones o familias de idiomas en particular. Los comentarios que se reciben se publican para que otras partes los revisen. Sobre la base del consenso en los comentarios recibidos, una solicitud de cambio puede retirarse o promoverse a "estado de candidato".

Tres meses antes del final de un ciclo de revisión anual (generalmente en septiembre), se establece un anuncio en la lista de discusión de LINGUISTA y otras listas con respecto a las solicitudes de cambio de estado de los candidatos. Todas las solicitudes permanecen abiertas para revisión y comentarios hasta el final del ciclo de revisión anual.

Las decisiones se anuncian al final del ciclo de revisión anual (normalmente en enero). En ese momento, las solicitudes pueden adoptarse en su totalidad o en parte, modificarse y trasladarse al siguiente ciclo de revisión, o rechazarse. Los rechazos a menudo incluyen sugerencias sobre cómo modificar propuestas para volver a presentarlas. Se mantiene un archivo público de cada solicitud de cambio junto con las decisiones tomadas y la justificación de las decisiones. [21]

Crítica [ editar ]

Los lingüistas Morey, Post y Friedman plantean varias críticas a ISO 639, y en particular a ISO 639-3: [16]

  • Los códigos de tres letras en sí mismos son problemáticos, porque si bien son etiquetas técnicas oficialmente arbitrarias, a menudo se derivan de abreviaturas mnemotécnicas para nombres de idiomas, algunas de las cuales son peyorativas. Por ejemplo, a Yemsa se le asignó el código jnj, del peyorativo "Janejero". Por lo tanto, estos códigos pueden ser considerados ofensivos por los hablantes nativos, pero los códigos en el estándar, una vez asignados, no se pueden cambiar.
  • La administración de la norma es problemática porque SIL es una organización misionera con transparencia y responsabilidad inadecuadas. Las decisiones sobre qué merece ser codificado como lenguaje se toman internamente. Si bien las aportaciones externas pueden ser bienvenidas o no, las decisiones en sí mismas son opacas y muchos lingüistas han dejado de intentar mejorar el estándar.
  • La identificación permanente de un idioma es incompatible con el cambio de idioma.
  • Los idiomas y dialectos a menudo no se pueden distinguir rigurosamente, y los continuos del dialecto pueden subdividirse de muchas maneras, mientras que el estándar privilegia una opción. En cambio, estas distinciones se basan a menudo en factores sociales y políticos.
  • Las autoridades que toman decisiones sobre la identidad y el idioma de las personas pueden malinterpretar y utilizar la norma ISO 639-3, aboliendo el derecho de los hablantes a identificarse o identificarse con su variedad de habla. Aunque SIL es sensible a tales cuestiones, este problema es inherente a la naturaleza de un estándar establecido, que puede ser utilizado (o mal utilizado) de formas que ISO y SIL no pretenden.

Martin Haspelmath está de acuerdo con cuatro de estos puntos, pero no con el punto sobre el cambio de idioma. [22] No está de acuerdo porque cualquier descripción de un idioma requiere identificarlo, y podemos identificar fácilmente las diferentes etapas de un idioma. Sugiere que los lingüistas pueden preferir utilizar una codificación que se hace en el lánguidonivel ya que "rara vez les importa a los lingüistas si de lo que están hablando es un idioma, un dialecto o una familia de idiomas muy unida". También cuestiona si una norma ISO para la identificación de idiomas es apropiada ya que ISO es una organización industrial, mientras que ve la documentación y la nomenclatura del idioma como un esfuerzo científico. Cita la necesidad original de identificadores de idioma estandarizados como "la importancia económica de la traducción y la localización de software ", para lo cual se establecieron las normas ISO 639-1 y 639-2. Pero plantea dudas sobre la necesidad de la industria de la cobertura completa proporcionada por ISO 639-3, incluso como lo hace " lenguas poco conocidas de pequeñas comunidades que nunca o apenas se utilizan por escrito y que muchas veces se encuentran en peligro de extinción ".

Uso [ editar ]

  • Ethnologue
  • Lista de lingüistas
  • OLAC : la comunidad de archivos de Open Languages [23]
  • Microsoft Windows 8 : [24] Admite todos los códigos en ISO 639-3 en el momento del lanzamiento.
  • Fundación Wikimedia: Los nuevos proyectos basados ​​en idiomas (por ejemplo, wikipedias en nuevos idiomas) deben tener un identificador de ISO 639-1, -2 o -3. [25]
  • Otros estándares que se basan en ISO 639-3:
    • Etiquetas de idioma según lo definido por el Grupo de trabajo de ingeniería de Internet (IETF) , como se documenta en:
      • BCP 47: Mejor práctica actual 47 , [26] que incluye RFC 5646
      • RFC 5646, que reemplazó a RFC 4646, que reemplazó a RFC 3066 . (Por lo tanto, todos los estándares que dependen de cualquiera de estos 3 estándares IETF ahora usan ISO 639-3).
    • El estándar ePub 3.0 para metadatos de idiomas [27] utiliza elementos Dublin Core Metadata. Estos elementos de metadatos de idioma en ePubs deben contener códigos RFC 5646 válidos para idiomas. [27] RFC5646 apunta a ISO 639-3 para idiomas sin códigos IANA más cortos.
    • Iniciativa de metadatos Dublin Core : Término de metadatos DCMI [28] para el lenguaje, a través de RFC 4646 de IETF (ahora reemplazado por RFC 5646).
    • Autoridad de Números Asignados de Internet (IANA) El esfuerzo de internacionalización del W3C recomienda el uso del Registro de subetiquetas de idioma de IANA para seleccionar códigos para idiomas. [29] El Registro de subetiquetas de idiomas de la IANA [30] depende de los códigos ISO 639-3 para los idiomas que anteriormente no tenían códigos en otras partes del estándar ISO 639.
    • HTML5: [31] a través del BCP 47 de IETF.
    • Códigos de biblioteca MARC .
    • Códigos de biblioteca MODS : [32] Incorpora RFC 3066 de IETF (ahora reemplazado por RFC 5646).
    • Iniciativa de codificación de texto (TEI): [33] a través del BCP 47 de IETF.
    • Marco de marcado léxico : especificación ISO para la representación de diccionarios legibles por máquina.
    • Unicode 's locale Común repositorio de datos : Utiliza varios cientos de códigos de la norma ISO 639-3 no incluidos en la norma ISO 639-2.

Referencias [ editar ]

  1. ^ a b "Estado y resumen de ISO 639-3" . iso.org. 2010-07-20 . Consultado el 14 de junio de 2012 .
  2. ^ "Agencias de mantenimiento y autoridades de registro" . YO ASI.
  3. ^ "Tipos de idiomas individuales - Idiomas antiguos" . sil.org . Consultado el 11 de junio de 2018 .
  4. ^ Informe de Ethnologue para el código ISO 639: zho Archivado el 12 de septiembre de 2014 en Wayback Machine en ethnologue.com
  5. ^ ISO639-3 en SIL.org
  6. ^ a b "Conjunto de códigos ISO 639-3" . Sil.org. 2021-02-18 . Consultado el 7 de abril de 2021 .
  7. ^ "ISO 639-3" . sil.org.
  8. ^ "Alcance de la denominación: idiomas individuales" . sil.org.
  9. ^ "Alcance de la denominación: dialectos" . sil.org.
  10. ^ "Alcance de la denotación: macrolenguajes" . sil.org . Consultado el 14 de junio de 2012 .
  11. ^ "Mapeos de macrolenguaje" . sil.org . Consultado el 14 de junio de 2012 .
  12. ^ "Ámbito de denotación: lenguajes colectivos" . sil.org . Consultado el 14 de junio de 2012 .
  13. ^ Grabaciones de campo de llamadas de monos Vervet . Entrada en el catálogo del Linguistic Data Consortium . Consultado el 4 de septiembre de 2012.
  14. ^ Bettencourt, Rebecca. "Registro de códigos de ConLang" . KreativeKorp . Consultado el 12 de marzo de 2021 .
  15. ^ "Envío de solicitudes de cambio ISO 639-3: tipos de cambios" . sil.org.
  16. ^ a b Morey, Stephen; Publicar, Mark W .; Friedman, Víctor A. (2013). Los códigos de idioma de ISO 639: una estandarización prematura, finalmente inalcanzable y posiblemente dañina . Conferencia PARADISEC RRR. Archivado desde el original el 23 de febrero de 2016 . Consultado el 3 de noviembre de 2015 .
  17. ^ "Alcance de la designación de identificadores de idioma" . sil.org.
  18. ^ "Tipos de idiomas" . sil.org.
  19. ^ "Gestión del cambio ISO 639-3" . sil.org.
  20. ^ "Envío de solicitudes de cambio ISO 639-3" . sil.org.
  21. ^ "Índice de solicitud de cambio ISO 639-3" . sil.org.
  22. ^ Martin Haspelmath, "¿Se puede estandarizar la identidad lingüística? Sobre la crítica de Morey et al. De ISO 639-3" , Comentario sobre lingüística de diversidad , 04/12/2013
  23. ^ "Extensión de idioma OLAC" . language-archives.org . Consultado el 3 de agosto de 2015 .
  24. ^ "Más de 7.000 idiomas, solo 1 Windows" . Microsoft. 2014-02-05.
  25. ^ "Política de propuesta de idioma" . wikimedia.org . Consultado el 3 de agosto de 2015 .
  26. ^ "BCP 47 - Etiquetas para identificar idiomas" . ietf.org . Consultado el 3 de agosto de 2015 .
  27. ^ a b "Publicaciones EPUB 3.0" . idpf.org . Consultado el 3 de agosto de 2015 .
  28. ^ "Términos de metadatos de DCMI" . purl.org . Consultado el 3 de agosto de 2015 .
  29. ^ "Códigos de idioma ISO de dos o tres letras" . w3.org . Consultado el 3 de agosto de 2015 .
  30. ^ "Registro de idiomas" . Iana.org . Consultado el 12 de agosto de 2015 .
  31. ^ "3 Semántica, estructura y API de documentos HTML - HTML5" . w3.org . Consultado el 3 de agosto de 2015 .
  32. ^ "Elementos - Directrices de usuario de MODS: esquema de descripción de objeto de metadatos: MODS (Biblioteca del Congreso)" . loc.gov . Consultado el 3 de agosto de 2015 .
  33. ^ "Lenguaje del elemento TEI" . tei-c.org . Consultado el 3 de agosto de 2015 .

Lectura adicional [ editar ]

  • Aristar, Anthony (2006). "Códigos de lengua normalizados ISO y Ethnologue" (PDF) . Boletín SSILA . 247 . Archivado desde el original (PDF) el 20 de mayo de 2014.
  • Dobrin, Lise M .; Bien, Jeff (2009). "Desarrollo práctico del lenguaje: ¿misión de quién?" (PDF) . Idioma . 85 (3): 619–629. doi : 10.1353 / lan.0.0152 .
  • Epps, Patience (2006). "En oposición a la adopción de los códigos de idioma de Ethnologue para ISO 639-3" (PDF) . Boletín SSILA . 246 . Archivado desde el original (PDF) el 20 de mayo de 2014.
  • Golla, Victor, ed. (2006). "Declaración de SSILA sobre los códigos de idioma ISO 639-3" (PDF) . Boletín SSILA . 249 . Archivado desde el original (PDF) el 20 de mayo de 2014.
  • Bien, Jeff; Cysouw, Michael (2013). "Languoid, doculect y glossonym: formalizando la noción 'lenguaje ' ". Conservación y documentación del idioma . 7 : 331–359. hdl : 10125/4606 .

Enlaces externos [ editar ]

  • Autoridad de registro ISO 639-3
  • Preguntas frecuentes en el sitio web de la Biblioteca del Congreso de los Estados Unidos
  • Solicitudes de ISO 639-3 pendientes
  • Lista de lingüistas - Lista de lenguas antiguas y extintas
  • explicación de Håvard Hjulstad