Ataque homógrafo IDN


El ataque homógrafo de nombre de dominio internacionalizado ( IDN ) es una forma en que una parte malintencionada puede engañar a los usuarios de computadoras sobre el sistema remoto con el que se están comunicando, explotando el hecho de que muchos caracteres diferentes se parecen (es decir, son homógrafos, de ahí el término para el ataque, aunque técnicamente homoglyph es el término más preciso para diferentes personajes que se parecen). Por ejemplo, un usuario habitual de example.com puede sentirse atraído a hacer clic en un enlace donde el carácter latino "a" se sustituye por el carácter cirílico "a" .

Este tipo de ataque de suplantación de identidad también se conoce como suplantación de script . Unicode incorpora numerosos sistemas de escritura y, por varias razones, a los caracteres de aspecto similar, como el griego Ο , el latín O y el cirílico О , no se les asignó el mismo código. Su uso incorrecto o malintencionado es una posibilidad de ataques a la seguridad. [1]

El registro de nombres de dominio homogéneos es similar al typosquatting , en el sentido de que ambas formas de ataque utilizan un nombre similar al de un dominio más establecido para engañar al usuario. La principal diferencia es que en el error tipográfico, el perpetrador atrae a las víctimas basándose en errores tipográficos naturales que se cometen comúnmente al ingresar manualmente una URL , mientras que en la suplantación de homógrafos, el perpetrador engaña a las víctimas al presentar hipervínculos visualmente indistinguibles . De hecho, sería raro que un usuario de la web escribiera, por ejemplo, una letra cirílica dentro de una palabra que de otra manera sería inglesa, como "citibаnk". Hay casos en los que un registro puede ser tanto typosquatting como suplantación de homógrafos; los pares de l / I , i / j, y 0 / O están todos juntos en los teclados y, según el tipo de letra, pueden ser difíciles o imposibles de distinguir.

Una molestia temprana de este tipo, anterior a Internet e incluso a las terminales de texto , fue la confusión entre "l" (letra minúscula "L") / "1" (el número "uno") y "O" (letra mayúscula para vocal "o") / "0" (el número "cero"). Algunas máquinas de escribir de la era anterior a las computadoras incluso combinaron la L y la una ; los usuarios tenían que escribir una L minúscula cuando se necesitaba el número uno. La confusión de cero / o dio lugar a la tradición de cruzar ceros , de modo que un operador de computadora los escribiría correctamente. [2] Unicode puede contribuir en gran medida a esto con la combinación de caracteres, acentos, varios tipos de guiones , etc.a menudo debido a una interpretación inadecuadasoporte, especialmente con tamaños de fuente más pequeños y la amplia variedad de fuentes. [1]

Incluso antes, la escritura a mano brindaba abundantes oportunidades de confusión. Un ejemplo notable es la etimología de la palabra " cenit ". La traducción del árabe "samt" incluyó la confusión del escriba de "m" en "ni". Esto era común en la letra negra medieval , que no conectaba las columnas verticales en las letras i, m, n o u, lo que dificultaba distinguirlas cuando varias estaban en una fila. Este último, así como la confusión "rn" / "m" / "rri" ("RN" / "M" / "RRI"), todavía es posible para el ojo humano incluso con la tecnología informática avanzada moderna.

La sustitución intencional de caracteres similares con diferentes alfabetos también se ha conocido en varios contextos. Por ejemplo, Faux Cyrillic se ha utilizado como entretenimiento o para llamar la atención y la " codificación Volapuk ", en la que la escritura cirílica está representada por caracteres latinos similares, se utilizó en los primeros días de Internet como una forma de superar la falta de soporte para el alfabeto cirílico. Otro ejemplo es que las placas de matrícula de los vehículos pueden tener tanto cirílico (para uso doméstico en países con escritura cirílica) como latino (para conducción internacional) con las mismas letras. Las placas de registro que se emiten en Grecia se limitan al uso de letras del alfabeto griego.que tienen homoglyphs en el alfabeto latino, ya que las regulaciones de la Unión Europea requieren el uso de letras latinas.


Un ejemplo de un ataque homógrafo IDN; las letras latinas "e" y "a" se sustituyen por las letras cirílicas "е" y "a".
Un ejemplo de un ataque homógrafo IDN; las letras latinas "e" y "a" se sustituyen por las letras cirílicas "е" y "a".
Los homoglyphs son comunes en los tres principales alfabetos europeos: latín , griego y cirílico . Unicode no intenta unificar los glifos y, en su lugar, separa cada secuencia de comandos .
Arriba: glifos tailandeses representados en una fuente moderna (IBM Plex) en la que se parecen a los glifos latinos.
Abajo: los mismos glifos renderizados con bucles tradicionales.