Teorema de parikh

El teorema de Parikh en informática teórica dice que si uno mira solo el número de apariciones de cada símbolo terminal en un lenguaje sin contexto , sin tener en cuenta su orden, entonces el lenguaje es indistinguible de un lenguaje regular . ^[1] Es útil para decidir que las cadenas con un número determinado de terminales no son aceptadas por una gramática libre de contexto. ^[2] Fue probado por primera vez por Rohit Parikh en 1961 ^[3] y reeditado en 1966. ^[4]

Definiciones y declaración formal

Dejar ${\ Displaystyle \ Sigma = \ {a_ {1}, a_ {2}, \ ldots, a_ {k} \}}$ ser un alfabeto . El vector Parikh de una palabra se define como la función ${\ textstyle p: \ Sigma ^ {*} \ to \ mathbb {N} ^ {k}}$ , dado por ^[1]

{\ Displaystyle p (w) = (| w | _ {a_ {1}}, | w | _ {a_ {2}}, \ ldots, | w | _ {a_ {k}})}

dónde

{\ Displaystyle | w | _ {a_ {i}}}

denota el número de apariciones de la letra

{\ Displaystyle a_ {i}}

en la palabra

{\ Displaystyle w}

.

Un subconjunto de ${\ Displaystyle \ mathbb {N} ^ {k}}$ se dice que es lineal si tiene la forma

{\ Displaystyle u_ {0} + \ mathbb {N} u_ {1} + \ dots + \ mathbb {N} u_ {m} = \ {u_ {0} + t_ {1} u_ {1} + \ dots + t_ {m} u_ {m} \ mid t_ {1}, \ ldots, t_ {m} \ in \ mathbb {N} \}}

para algunos vectores

{\ textstyle u_ {0}, \ ldots, u_ {m}}

. Un subconjunto de

{\ Displaystyle \ mathbb {N} ^ {k}}

se dice que es semilineal si es una unión de un número finito de subconjuntos lineales.

Declaración 1 : Deja ${\ Displaystyle L}$ ser un lenguaje libre de contexto. Dejar ${\ Displaystyle P (L)}$ ser el conjunto de Parikh vectores de palabras en ${\ Displaystyle L}$ , es decir, ${\ textstyle P (L) = \ {p (w) \ mid w \ in L \}}$ . Luego ${\ Displaystyle P (L)}$ es un conjunto semilineal.

Se dice que dos lenguajes son conmutativamente equivalentes si tienen el mismo conjunto de vectores Parikh.

Declaración 2 : Si ${\ Displaystyle S}$ es cualquier conjunto semilineal, el lenguaje de palabras cuyos vectores Parikh están en ${\ Displaystyle S}$ es conmutativamente equivalente a algún lenguaje regular. Por tanto, todo lenguaje libre de contexto es conmutativamente equivalente a algún lenguaje regular.

Estas dos afirmaciones equivalentes se pueden resumir diciendo que la imagen debajo ${\ Displaystyle p}$ de lenguajes libres de contexto y de lenguajes regulares es el mismo, y es igual al conjunto de conjuntos semilineales.

Fortalecimiento de las lenguas limitadas

Un idioma ${\ Displaystyle L}$ está acotado si ${\ Displaystyle L \ subconjunto w_ {1} ^ {*} \ ldots w_ {k} ^ {*}}$ por algunas palabras fijas ${\ Displaystyle w_ {1}, \ ldots, w_ {k}}$ . Ginsburg y Spanier ^[5] dieron una condición necesaria y suficiente, similar al teorema de Parikh, para los lenguajes acotados.

Llame a un conjunto lineal estratificado , si en su definición para cada ${\ Displaystyle i \ geq 1}$ el vector ${\ Displaystyle u_ {i}}$ tiene la propiedad de que tiene como máximo dos coordenadas distintas de cero, y para cada ${\ Displaystyle i, j \ geq 1}$ si cada uno de los vectores ${\ Displaystyle u_ {i}, u_ {j}}$ tiene dos coordenadas distintas de cero, ${\ Displaystyle i_ {1}$ y ${\ Displaystyle j_ {1}$ , respectivamente, entonces su orden no es ${\ Displaystyle i_ {1}$ . Un conjunto semilineal se estratifica si es una unión de un número finito de subconjuntos lineales estratificados.

El teorema de Ginsburg-Spanier dice que un lenguaje limitado ${\ Displaystyle L}$ es libre de contexto si y solo si ${\ Displaystyle \ {(n_ {1}, \ ldots, n_ {k}) \ mid w_ {1} ^ {n_ {1}} \ ldots w_ {k} ^ {n_ {k}} \ in L \} }$ es un conjunto semilineal estratificado.

Significado

El teorema tiene múltiples interpretaciones. Muestra que un lenguaje libre de contexto sobre un alfabeto singleton debe ser un lenguaje regular y que algunos lenguajes libres de contexto solo pueden tener gramáticas ambiguas ^{[ se necesita más explicación ]} . Estos lenguajes se denominan lenguajes intrínsecamente ambiguos . Desde una perspectiva de gramática formal , esto significa que algunas gramáticas ambiguas sin contexto no se pueden convertir en gramáticas equivalentes sin ambigüedades sin contexto.

Referencias

↑ ^a ^b Kozen, Dexter (1997). Autómatas y Computabilidad . Nueva York: Springer-Verlag. ISBN 3-540-78105-6.
^ Håkan Lindqvist. "Teorema de Parikh" (PDF) . Umeå Universitet.
^ Parikh, Rohit (1961). "Dispositivos de generación de lenguaje". Informe de progreso trimestral, Laboratorio de Investigación de Electrónica, MIT .
^ Parikh, Rohit (1966). "Sobre lenguajes libres de contexto" . Revista de la Asociación de Maquinaria Informática . 13 (4).
^ Ginsburg, Seymour; Spanier, Edwin H. (1966). "Fórmulas y lenguajes de Presburger" . Pacific Journal of Mathematics . 16 (2): 285-296.

[kozen-1] Kozen, Dexter (1997). Autómatas y Computabilidad . Nueva York: Springer-Verlag. ISBN 3-540-78105-6.

[2] Håkan Lindqvist. "Teorema de Parikh" (PDF) . Umeå Universitet.

[3] Parikh, Rohit (1961). "Dispositivos de generación de lenguaje". Informe de progreso trimestral, Laboratorio de Investigación de Electrónica, MIT .

[4] Parikh, Rohit (1966). "Sobre lenguajes libres de contexto" . Revista de la Asociación de Maquinaria Informática . 13 (4).

[5] Ginsburg, Seymour; Spanier, Edwin H. (1966). "Fórmulas y lenguajes de Presburger" . Pacific Journal of Mathematics . 16 (2): 285-296.

[1]