Este artículo proporciona un contexto insuficiente para quienes no están familiarizados con el tema . ( Octubre de 2009 ) |
El método de clasificación de coincidencia (MRA) es un algoritmo fonético desarrollado por Western Airlines en 1977 para la indexación y comparación de nombres homófonos . [1]
El algoritmo en sí tiene un conjunto simple de reglas de codificación pero un conjunto más extenso de reglas de comparación. El mecanismo principal es la comparación de similitudes, que calcula el número de caracteres no coincidentes comparando las cadenas de izquierda a derecha y luego de derecha a izquierda, y eliminando caracteres idénticos. Este valor se resta de 6 y luego se compara con un umbral mínimo. El umbral mínimo se define en la tabla A y depende de la longitud de las cuerdas.
El nombre codificado se conoce (quizás incorrectamente) como un identificador numérico personal (PNI). El nombre codificado nunca puede contener más de 6 caracteres alfabéticos.
El método de clasificación de coincidencia funciona bien con nombres que contienen la letra "y", a diferencia de la versión original del algoritmo NYSIIS ; por ejemplo, los apellidos "Smith" y "Smyth" se combinan correctamente. Sin embargo, MRA no funciona bien con nombres codificados que difieren en longitud en más de 2.
En esta sección, las palabras "cadena (s)" y "nombre (s)" significan "cadena (s) codificada (s)" y "nombre (s) codificado (s)".
La siguiente tabla muestra el mapeo entre la clasificación mínima y las longitudes de las cuerdas.
Suma de longitudes | Calificación mínima |
---|---|
≤ 4 | 5 |
4 <suma ≤ 7 | 4 |
7 <suma ≤ 11 | 3 |
= 12 | 2 |
La siguiente tabla muestra el resultado del algoritmo de enfoque de calificación de coincidencia para algunos nombres homófonos comunes.
Nombre | Códice MRA | Calificación mínima | Clasificación de comparación de similitud |
---|---|---|---|
Byrne | BYRN | 4 | 5 |
Boern | BRN | ||
Herrero | SMTH | 3 | 5 |
Smyth | SMYTH | ||
Catalina | CTHRN | 3 | 4 |
Kathryn | KTHRYN |
El algoritmo de implementación de Wikibook tiene una página sobre el tema: Enfoque de calificación de coincidencias |