Daitch – Mokotoff Soundex (D – M Soundex) es un algoritmo fonético inventado en 1985 por los genealogistas judíos Gary Mokotoff y Randy Daitch . Es un refinamiento de los algoritmos Russell y American Soundex diseñados para permitir una mayor precisión en la coincidencia de apellidos eslavos y yiddish con pronunciación similar pero diferencias en la ortografía.
Daitch – Mokotoff Soundex a veces se conoce como "Soundex judío" y "Soundex de Europa del Este", aunque los autores desaconsejan el uso de estos apodos para el algoritmo porque el algoritmo en sí es independiente del hecho de que la motivación para crear el nuevo sistema fue la deficiente. resultados de los sistemas predecesores cuando se trata de apellidos eslavos e idish.
Mejoras
Las mejoras sobre los algoritmos Soundex más antiguos incluyen:
- Los nombres codificados tienen seis dígitos, lo que da como resultado una mayor precisión de búsqueda (el Soundex tradicional usa cuatro caracteres)
- El carácter inicial del nombre está codificado.
- Varias reglas en el algoritmo codifican n-gramas de múltiples caracteres como dígitos únicos (American y Russell Soundex no manejan n-gramas de múltiples caracteres)
- Se pueden devolver múltiples codificaciones posibles para un solo nombre (el Soundex tradicional devuelve solo una codificación, incluso si la ortografía de un nombre podría tener múltiples pronunciaciones)
Ejemplos de
Algunos ejemplos:
Apellido | American Soundex | D – M Soundex |
---|---|---|
Peters | P362 | 739400, 734000 |
Peterson | P362 | 739460, 734600 |
Moskowitz | M232 | 645740 |
Moskovitz | M213 | 645740 |
Auerbach | A612 | 097500, 097400 |
Uhrbach | U612 | 097500, 097400 |
Jackson | J250 | 154600, 454600, 145460, 445460 |
Jackson-Jackson | J252 | 154664, 454664, 145466, 445466, 154646, 454646, 145464, 445464 |
Algoritmo de coincidencia de nombres fonéticos de Beider-Morse
Para abordar la gran cantidad de resultados falsos positivos generados por D – M Soundex, Stephen P. Morse y Alexander Beider crearon el algoritmo de coincidencia fonética de nombres Beider – Morse. [1] Este nuevo algoritmo reduce los falsos positivos a expensas de algunos falsos negativos. Varios sitios ofrecen el soundex B – M además del soundex DM. [2]
Notas
- ^ Coincidencia fonética de Beider-Morse: una alternativa a Soundex con menos falsos éxitos - copia de Avotaynu : the International Review of Jewish Genealogy (verano de 2008)
- ^ Nu? ¿Qué hay de nuevo? Volumen 9, Número 22 Gary Mokotoff, Editor - El e-zine de la genealogía judía de Avotaynu
enlaces externos
- Mokotoff, Gary. "Soundexing y genealogía". Describe la historia y las motivaciones detrás de D – M Soundex.
- JewishGen. "Codificación Soundex". Describe tanto a Russel como a D – M Soundex.
- Coles, Michael. "Kit de herramientas SQL 2000 DBA, Parte 3: Emparejamiento fonético" Implementación basada en SQL Server del algoritmo D – M Soundex con fuente.