Autómata probabilístico

En matemáticas e informática , el autómata probabilístico ( AP ) es una generalización del autómata finito no determinista ; incluye la probabilidad de una transición dada a la función de transición , convirtiéndola en una matriz de transición . Así, el autómata probabilístico también generaliza los conceptos de cadena de Markov y de subdesplazamiento de tipo finito . Los lenguajes reconocidos por los autómatas probabilísticos se denominan lenguajes estocásticos ; estos incluyen los idiomas regularescomo un subconjunto. El número de lenguajes estocásticos es incontable .

El concepto fue introducido por Michael O. Rabin en 1963; ^[1] Cierto caso especial se conoce a veces como el autómata de Rabin (que no debe confundirse con la subclase de ω-autómatas también denominados autómatas de Rabin). En los últimos años, se ha formulado una variante en términos de probabilidades cuánticas, el autómata finito cuántico .

Definición

El autómata probabilístico puede definirse como una extensión de un autómata finito no determinista ${\ Displaystyle (Q, \ Sigma, \ delta, q_ {0}, F)}$ , junto con dos probabilidades: la probabilidad ${\ Displaystyle P}$ de una transición de estado particular que está teniendo lugar, y con el estado inicial ${\ Displaystyle q_ {0}}$ reemplazado por un vector estocástico que da la probabilidad de que el autómata se encuentre en un estado inicial dado.

Para el autómata finito no determinista ordinario, uno tiene

un conjunto finito de estados ${\ displaystyle Q}$
un conjunto finito de símbolos de entrada ${\ Displaystyle \ Sigma}$
una función de transición ${\ Displaystyle \ delta: Q \ times \ Sigma \ to \ wp (Q)}$
un conjunto de estados ${\ Displaystyle F}$ distinguidos como estados de aceptación (o finales ) ${\ Displaystyle F \ subseteq Q}$ .

Aquí, ${\ Displaystyle \ wp (Q)}$ denota el conjunto de poder de ${\ displaystyle Q}$ .

Mediante el uso de curry , la función de transición ${\ Displaystyle \ delta: Q \ times \ Sigma \ to \ wp (Q)}$ de un autómata finito no determinista se puede escribir como una función de pertenencia

{\ Displaystyle \ delta: Q \ times \ Sigma \ times Q \ to \ {0,1 \}}

así que eso ${\ Displaystyle \ delta (q, a, q ^ {\ prime}) = 1}$ Si ${\ Displaystyle q ^ {\ prime} \ in \ delta (q, a)}$ y ${\ Displaystyle \ delta (q, a, q ^ {\ prime}) = 0}$ Si ${\ Displaystyle q ^ {\ prime} \ notin \ delta (q, a)}$ . La función de transición al curry puede entenderse como una matriz con entradas de matriz.

{\ Displaystyle \ left [\ theta _ {a} \ right] _ {qq ^ {\ prime}} = \ delta (q, a, q ^ {\ prime})}

La matriz ${\ Displaystyle \ theta _ {a}}$ es entonces una matriz cuadrada, cuyas entradas son cero o uno, lo que indica si una transición ${\ Displaystyle q {\ stackrel {a} {\ rightarrow}} q ^ {\ prime}}$ está permitido por la NFA. Una matriz de transición de este tipo siempre se define para un autómata finito no determinista.

El autómata probabilístico reemplaza estas matrices por una familia de matrices estocásticas derechas ${\ Displaystyle P_ {a}}$ , para cada símbolo a en el alfabeto ${\ Displaystyle \ Sigma}$ de modo que la probabilidad de una transición viene dada por

{\ Displaystyle \ left [P_ {a} \ right] _ {qq ^ {\ prime}}}

Un cambio de estado de algún estado a cualquier estado debe ocurrir con probabilidad uno, por supuesto, y así uno debe tener

{\ Displaystyle \ sum _ {q ^ {\ prime}} \ left [P_ {a} \ right] _ {qq ^ {\ prime}} = 1}

para todas las letras de entrada ${\ Displaystyle a}$ y estados internos ${\ Displaystyle q}$ . El estado inicial de un autómata probabilístico está dado por un vector fila ${\ Displaystyle v}$ , cuyos componentes son las probabilidades de los estados iniciales individuales ${\ Displaystyle q}$ , que se suman a 1:

{\ Displaystyle \ sum _ {q} \ left [v \ right] _ {q} = 1}

La matriz de transición actúa a la derecha, de modo que el estado del autómata probabilístico, después de consumir la cadena de entrada ${\ displaystyle abc}$ , sería

{\ Displaystyle vP_ {a} P_ {b} P_ {c}}

En particular, el estado de un autómata probabilístico es siempre un vector estocástico, ya que el producto de dos matrices estocásticas cualesquiera es una matriz estocástica, y el producto de un vector estocástico y una matriz estocástica es nuevamente un vector estocástico. Este vector a veces se denomina distribución de estados , enfatizando que es una distribución de probabilidad discreta .

Formalmente, la definición de un autómata probabilístico no requiere la mecánica del autómata no determinista, de la que se puede prescindir. Formalmente, un autómata probabilístico PA se define como la tupla ${\ Displaystyle (Q, \ Sigma, P, v, F)}$ . Un autómata Rabin es aquel para el que la distribución inicial ${\ Displaystyle v}$ es un vector de coordenadas ; es decir, tiene cero para todas las entradas menos una y la entrada restante es una.

Lenguas estocásticas

El conjunto de lenguajes reconocidos por los autómatas probabilísticos se denominan lenguajes estocásticos . Incluyen los idiomas regulares como un subconjunto.

Dejar ${\ Displaystyle F = Q _ {\ text {accept}} \ subseteq Q}$ ser el conjunto de estados "aceptables" o "finales" del autómata. Por abuso de notación, ${\ Displaystyle Q _ {\ text {accept}}}$ también puede entenderse como el vector de columna que es la función de pertenencia para ${\ Displaystyle Q _ {\ text {accept}}}$ ; es decir, tiene un 1 en los lugares correspondientes a los elementos en ${\ Displaystyle Q _ {\ text {accept}}}$ y un cero en caso contrario. Este vector puede contraerse con la probabilidad de estado interno, para formar un escalar . El lenguaje reconocido por un autómata específico se define entonces como

{\ Displaystyle L _ {\ eta} = \ {s \ in \ Sigma ^ {*} \ vert vP_ {s} Q _ {\ text {accept}}> \ eta \}}

dónde ${\ Displaystyle \ Sigma ^ {*}}$ es el conjunto de todas las cadenas del alfabeto ${\ Displaystyle \ Sigma}$ (de modo que * es la estrella de Kleene ). El idioma depende del valor del punto de corte. ${\ Displaystyle \ eta}$ , normalmente se considera que está en el rango ${\ Displaystyle 0 \ leq \ eta <1}$ .

Un idioma se llama η- estocástico si y solo si existe algún PA que reconoce el idioma, por ${\ Displaystyle \ eta}$ . Un lenguaje se llama estocástico si y solo si hay alguna ${\ Displaystyle 0 \ leq \ eta <1}$ para cual ${\ Displaystyle L _ {\ eta}}$ es η- estocástico.

Se dice que un punto de corte es un punto de corte aislado si y solo si existe un ${\ Displaystyle \ delta> 0}$ tal que

{\ Displaystyle \ vert vP (s) Q _ {\ text {accept}} - \ eta \ vert \ geq \ delta}

para todos ${\ Displaystyle s \ in \ Sigma ^ {*}}$

Propiedades

Cada idioma regular es estocástico y, más fuertemente, cada idioma regular es η -estocástico. Un inverso débil es que todo lenguaje estocástico 0 es regular; sin embargo, lo contrario general no es válido: hay lenguajes estocásticos que no son regulares.

Todo lenguaje η -estocástico es estocástico, para algunos ${\ Displaystyle 0 <\ eta <1}$ .

Todo lenguaje estocástico es representable por un autómata de Rabin.

Si ${\ Displaystyle \ eta}$ es un punto de corte aislado, entonces ${\ Displaystyle L _ {\ eta}}$ es un idioma regular.

p -lenguas ádicas

Los lenguajes p -ádicos proporcionan un ejemplo de un lenguaje estocástico que no es regular, y también muestran que el número de lenguajes estocásticos es incontable. Un lenguaje p -ádico se define como el conjunto de cadenas

{\ Displaystyle L _ {\ eta} (p) = \ {n_ {1} n_ {2} n_ {3} \ ldots \ vert 0 \ leq n_ {k} \ eta \}}

en las letras ${\ Displaystyle 0,1,2, \ ldots, (p-1)}$ .

Es decir, un lenguaje p -ádico es simplemente el conjunto de números reales en [0, 1], escritos en base- p , de modo que son mayores que ${\ Displaystyle \ eta}$ . Es sencillo demostrar que todos los lenguajes p -ádicos son estocásticos. En particular, esto implica que el número de lenguajes estocásticos es incontable. Un lenguaje p -ádico es regular si y solo si ${\ Displaystyle \ eta}$ es racional.

Generalizaciones

El autómata probabilístico tiene una interpretación geométrica: el vector de estado puede entenderse como un punto que vive en la cara del símplex estándar , opuesto a la esquina ortogonal. Las matrices de transición forman un monoide que actúa sobre el punto. Esto puede generalizarse haciendo que el punto sea de algún espacio topológico general , mientras que las matrices de transición se eligen de una colección de operadores que actúan sobre el espacio topológico, formando así un semiautomatón . Cuando el punto de corte está adecuadamente generalizado, se tiene un autómata topológico .

Un ejemplo de tal generalización es el autómata finito cuántico ; aquí, el estado del autómata está representado por un punto en el espacio proyectivo complejo , mientras que las matrices de transición son un conjunto fijo elegido del grupo unitario . El punto de corte se entiende como un límite del valor máximo del ángulo cuántico .

Notas

^ Michael O. Rabin (1963). "Autómatas probabilísticos" . Información y control . 6 (3): 230–245. doi : 10.1016 / s0019-9958 (63) 90290-0 .

Referencias

Salomaa, Arto (1969). "Autómatas probabilísticos y no deterministas finitos". Teoría de los autómatas . Oxford: Pergamon Press .

[1] Michael O. Rabin (1963). "Autómatas probabilísticos" . Información y control . 6 (3): 230–245. doi : 10.1016 / s0019-9958 (63) 90290-0 .

[1]