Un algoritmo fonética es un algoritmo de indexación de palabras con su pronunciación . La mayoría de los algoritmos fonéticos se desarrollaron para el inglés y no son útiles para indexar palabras en otros idiomas. [1] Debido a que la ortografía en inglés varía significativamente dependiendo de múltiples factores, como el origen y el uso de la palabra a lo largo del tiempo y los préstamos de otros idiomas, los algoritmos fonéticos necesariamente tienen en cuenta numerosas reglas y excepciones. [2]
Entre los algoritmos fonéticos más conocidos se encuentran:
Soundex , que fue desarrollado para codificar apellidos para su uso en censos. Los códigos Soundex son cadenas de cuatro caracteres compuestas por una sola letra seguida de tres números.
Daitch – Mokotoff Soundex , que es un refinamiento de Soundex diseñado para combinar mejor los apellidos de origen eslavo y germánico. Los códigos Daitch – Mokotoff Soundex son cadenas compuestas por seis dígitos numéricos.
Fonética de Colonia : es similar a Soundex, pero más adecuada para palabras alemanas.
Metaphone y Double Metaphone que son adecuados para usar con la mayoría de las palabras en inglés, no solo con nombres. Los algoritmos de metafonía son la base de muchos correctores ortográficos populares .
Caverphone , creado para ayudar en la comparación de datos entre los registros electorales de finales del siglo XIX y principios del siglo XX, optimizado para los acentos presentes en partes de Nueva Zelanda.
Usos comunes
Los correctores ortográficos a menudo pueden contener algoritmos fonéticos. El algoritmo Metaphone , por ejemplo, puede tomar una palabra mal escrita y crear un código. Luego, el código se busca en el directorio de palabras con el mismo o similar Metaphone. Las palabras que tienen el mismo o similar Metaphone se convierten en posibles grafías alternativas.
La funcionalidad de búsqueda a menudo utilizará algoritmos fonéticos para encontrar resultados que no coincidan exactamente con los términos utilizados en la búsqueda. La búsqueda de nombres puede resultar difícil, ya que a menudo existen múltiples grafías alternativas para los nombres. Un ejemplo es el nombre Claire . Tiene dos alternativas, Clare / Clair, que se pronuncian igual. La búsqueda de una ortografía no mostraría resultados para las otras dos. Usando Soundex, las tres variaciones producen el mismo código Soundex, C460. Al buscar nombres basados en el código Soundex, se devolverán las tres variaciones.