Algoritmo fonético


De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

Un algoritmo fonética es un algoritmo de indexación de palabras con su pronunciación . La mayoría de los algoritmos fonéticos se desarrollaron para el inglés y no son útiles para indexar palabras en otros idiomas. [1] Debido a que la ortografía en inglés varía significativamente dependiendo de múltiples factores, como el origen y el uso de la palabra a lo largo del tiempo y los préstamos de otros idiomas, los algoritmos fonéticos necesariamente tienen en cuenta numerosas reglas y excepciones. [2]

Algoritmos

Entre los algoritmos fonéticos más conocidos se encuentran:

  • Soundex , que fue desarrollado para codificar apellidos para su uso en censos. Los códigos Soundex son cadenas de cuatro caracteres compuestas por una sola letra seguida de tres números.
  • Daitch – Mokotoff Soundex , que es un refinamiento de Soundex diseñado para combinar mejor los apellidos de origen eslavo y germánico. Los códigos Daitch – Mokotoff Soundex son cadenas compuestas por seis dígitos numéricos.
  • Fonética de Colonia : es similar a Soundex, pero más adecuada para palabras alemanas.
  • Metaphone y Double Metaphone que son adecuados para usar con la mayoría de las palabras en inglés, no solo con nombres. Los algoritmos de metafonía son la base de muchos correctores ortográficos populares .
  • Sistema de Identificación e Inteligencia del Estado de Nueva York (NYSIIS), que asigna fonemas similares a la misma letra. El resultado es una cadena que el lector puede pronunciar sin decodificar.
  • Enfoque de clasificación de coincidencias desarrollado por Western Airlines en 1977: este algoritmo tiene una técnica de codificación y comparación de rango.
  • Caverphone , creado para ayudar en la comparación de datos entre los registros electorales de finales del siglo XIX y principios del siglo XX, optimizado para los acentos presentes en partes de Nueva Zelanda.

Usos comunes

  • Los correctores ortográficos a menudo pueden contener algoritmos fonéticos. El algoritmo Metaphone , por ejemplo, puede tomar una palabra mal escrita y crear un código. Luego, el código se busca en el directorio de palabras con el mismo o similar Metaphone. Las palabras que tienen el mismo o similar Metaphone se convierten en posibles grafías alternativas.
  • La funcionalidad de búsqueda a menudo utilizará algoritmos fonéticos para encontrar resultados que no coincidan exactamente con los términos utilizados en la búsqueda. La búsqueda de nombres puede resultar difícil, ya que a menudo existen múltiples grafías alternativas para los nombres. Un ejemplo es el nombre Claire . Tiene dos alternativas, Clare / Clair, que se pronuncian igual. La búsqueda de una ortografía no mostraría resultados para las otras dos. Usando Soundex, las tres variaciones producen el mismo código Soundex, C460. Al buscar nombres basados ​​en el código Soundex, se devolverán las tres variaciones.

Ver también

Referencias

  1. ^ Li, Nan; Hitchcock, Peter; Blustein, James; Bliemel, Michael (2011). H. Raghav Rao; Raj Sharman; TS Raghu (eds.). Explorando los grandes desafíos para el comercio electrónico de próxima generación: octavo taller sobre comercio electrónico, WEB 2009, Phoenix, AZ, EE. UU., 15 de diciembre de 2009, artículos seleccionados revisados . Berlín: Springer. pag. 232. ISBN 9783642174483. Consultado el 31 de diciembre de 2020 .
  2. ^ Cohen, Eli B. (2009). Información creciente: Parte 2 . Santa Rosa, Calif .: Informar a la ciencia. pag. 498. ISBN 978-1-932886-17-7.

enlaces externos

  • Algoritmo para convertir palabras en fonemas y viceversa.
  • StringMetric proyecta una biblioteca Scala de algoritmos fonéticos.
  • clj-fuzzy proyecto una biblioteca Clojure de algoritmos fonéticos.
  • SoundexBR biblioteca del algoritmo implementado en fonética R .
  • Talisman, una biblioteca de JavaScript que recopila varios algoritmos fonéticos que se pueden probar en línea.
Obtenido de " https://en.wikipedia.org/w/index.php?title=Phonetic_algorithm&oldid=997435957 "