La lógica de primer orden, también conocida como lógica de predicados , lógica cuantificacional y cálculo de predicados de primer orden, es una colección de sistemas formales utilizados en matemáticas , filosofía , lingüística e informática . La lógica de primer orden usa variables cuantificadas sobre objetos no lógicos y permite el uso de oraciones que contienen variables, de modo que en lugar de proposiciones como "Sócrates es un hombre", se pueden tener expresiones en la forma "existe x tal que x es Sócrates yx es un hombre ", donde" existe " es un cuantificador, mientras que xes una variable. [1] Esto la distingue de la lógica proposicional , que no usa cuantificadores ni relaciones ; [2] en este sentido, la lógica proposicional es la base de la lógica de primer orden.
Una teoría sobre un tema suele ser una lógica de primer orden junto con un dominio específico del discurso (sobre el cual se extienden las variables cuantificadas), un número finito de funciones desde ese dominio hasta sí mismo, un número finito de predicados definidos en ese dominio y un conjunto de axiomas. creía tener sobre ellos. A veces, la "teoría" se entiende en un sentido más formal, que es simplemente un conjunto de oraciones en lógica de primer orden.
El adjetivo "primer orden" distingue la lógica de primer orden de la lógica de orden superior , en la que hay predicados que tienen predicados o funciones como argumentos, o en los que se permiten cuantificadores de predicado o cuantificadores de función o ambos. [3] : 56 En las teorías de primer orden, los predicados a menudo se asocian con conjuntos. En las teorías de orden superior interpretadas, los predicados pueden interpretarse como conjuntos de conjuntos.
Hay muchos sistemas deductivos para la lógica de primer orden que son a la vez sólidos (es decir, todos los enunciados demostrables son verdaderos en todos los modelos) y completos (es decir, todos los enunciados que son verdaderos en todos los modelos son probables). Aunque la relación de consecuencia lógica es sólo semidecidible , se ha avanzado mucho en la demostración automatizada de teoremas en lógica de primer orden. La lógica de primer orden también satisface varios teoremas metalógicos que la hacen susceptible de análisis en la teoría de la demostración , como el teorema de Löwenheim-Skolem y el teorema de la compacidad .
La lógica de primer orden es el estándar para la formalización de las matemáticas en axiomas y se estudia en los fundamentos de las matemáticas . La aritmética de Peano y la teoría de conjuntos de Zermelo-Fraenkel son axiomatizaciones de la teoría de números y la teoría de conjuntos , respectivamente, en lógica de primer orden. Sin embargo, ninguna teoría de primer orden tiene la fuerza para describir de manera única una estructura con un dominio infinito, como los números naturales o la línea real . Los sistemas de axiomas que describen completamente estas dos estructuras (es decir, sistemas de axiomas categóricos ) se pueden obtener en lógicas más sólidas, como la lógica de segundo orden .
Los fundamentos de la lógica de primer orden fueron desarrollados de forma independiente por Gottlob Frege y Charles Sanders Peirce . [4] Para una historia de la lógica de primer orden y cómo llegó a dominar la lógica formal, ver José Ferreirós (2001).
Mientras que la lógica proposicional se ocupa de proposiciones declarativas simples, la lógica de primer orden también cubre los predicados y la cuantificación .
Un predicado toma una entidad o entidades del dominio del discurso como entrada, mientras que las salidas son verdaderas o falsas . Considere las dos oraciones "Sócrates es un filósofo" y "Platón es un filósofo". En la lógica proposicional , estas oraciones se consideran no relacionadas y podrían denotarse, por ejemplo, por variables como p y q . El predicado "es un filósofo" aparece en ambas oraciones, que tienen una estructura común de " a es un filósofo". La variable ase ejemplifica como "Sócrates" en la primera oración, y se ejemplifica como "Platón" en la segunda oración. Mientras que la lógica de primer orden permite el uso de predicados, como "es un filósofo" en este ejemplo, la lógica proposicional no. [5]
Las relaciones entre predicados se pueden establecer mediante conectivos lógicos . Considere, por ejemplo, la fórmula de primer orden "si a es un filósofo, entonces a es un erudito". Esta fórmula es un enunciado condicional con " a es un filósofo" como hipótesis y " a es un erudito" como conclusión. La verdad de esta fórmula depende de qué objeto se denota por a , y de las interpretaciones de los predicados "es un filósofo" y "es un erudito".
Los cuantificadores se pueden aplicar a variables en una fórmula. La variable a en la fórmula anterior se puede cuantificar universalmente, por ejemplo, con la oración de primer orden "Para cada a , si a es un filósofo, entonces a es un erudito". El cuantificador universal "para todos" en esta oración expresa la idea de que la afirmación "si a es un filósofo, entonces a es un erudito" se aplica a todas las opciones de a .
La negación de la frase "Por cada una , si una es un filósofo, a continuación, una es un erudito" es lógicamente equivalente a la frase "No existe un tal que una es un filósofo y un no es un académico". El cuantificador existencial "existe" expresa la idea de que la afirmación " a es un filósofo y a no es un erudito" vale para alguna elección de a .
Los predicados "es un filósofo" y "es un erudito" toman cada uno una sola variable. En general, los predicados pueden tomar varias variables. En la oración de primer orden "Sócrates es el maestro de Platón", el predicado "es el maestro de" toma dos variables.
Una interpretación (o modelo) de una fórmula de primer orden especifica lo que significa cada predicado y las entidades que pueden instanciar las variables. Estas entidades forman el dominio del discurso o universo, que generalmente se requiere que sea un conjunto no vacío. Por ejemplo, en una interpretación con el dominio del discurso que consiste en todos los seres humanos y el predicado "es un filósofo" entendido como "fue el autor de la República ", la frase "No existe un tal que una es un filósofo" se ve como verdadero, como lo atestigua Platón.
Hay dos partes clave de la lógica de primer orden. La sintaxis determina qué secuencias finitas de símbolos son expresiones bien formadas en lógica de primer orden, mientras que la semántica determina los significados detrás de estas expresiones.
A diferencia de los lenguajes naturales, como el inglés, el lenguaje de la lógica de primer orden es completamente formal, por lo que se puede determinar mecánicamente si una expresión dada está bien formada. Hay dos tipos clave de expresiones bien formadas: términos , que representan objetos intuitivamente, y fórmulas , que expresan predicados intuitivamente que pueden ser verdaderos o falsos. Los términos y fórmulas de la lógica de primer orden son cadenas de símbolos , donde todos los símbolos juntos forman el alfabeto del idioma. Como ocurre con todos los lenguajes formales , la naturaleza de los símbolos mismos está fuera del alcance de la lógica formal; a menudo se los considera simplemente letras y símbolos de puntuación.
Es común dividir los símbolos del alfabeto en símbolos lógicos , que siempre tienen el mismo significado, y símbolos no lógicos , cuyo significado varía según la interpretación. Por ejemplo, el símbolo lógico siempre representa "y"; nunca se interpreta como "o", que está representado por el símbolo lógico . Por otro lado, un símbolo predicado no lógico como Phil ( x ) podría interpretarse como " x es un filósofo", " x es un hombre llamado Felipe", o cualquier otro predicado unario dependiendo de la interpretación en cuestión.
Hay varios símbolos lógicos en el alfabeto, que varían según el autor, pero generalmente incluyen: [6]
No se requieren todos estos símbolos, solo uno de los cuantificadores, negación y conjunción, variables, paréntesis e igualdad es suficiente. Existen numerosas variaciones menores que pueden definir símbolos lógicos adicionales:
Los símbolos no lógicos representan predicados (relaciones), funciones y constantes en el dominio del discurso. Solía ser una práctica estándar utilizar un conjunto fijo e infinito de símbolos no lógicos para todos los propósitos. Una práctica más reciente es utilizar diferentes símbolos no lógicos según la aplicación que se tenga en mente. Por lo tanto, se ha vuelto necesario nombrar el conjunto de todos los símbolos no lógicos utilizados en una aplicación en particular. Esta elección se realiza mediante una firma . [8]
El enfoque tradicional es tener un solo conjunto infinito de símbolos no lógicos (una firma) para todas las aplicaciones. En consecuencia, bajo el enfoque tradicional hay un solo lenguaje de lógica de primer orden. [9] Este enfoque todavía es común, especialmente en libros de orientación filosófica.
En la lógica matemática contemporánea, la firma varía según la aplicación. Las firmas típicas en matemáticas son {1, ×} o simplemente {×} para grupos , o {0, 1, +, ×, <} para campos ordenados . No hay restricciones sobre el número de símbolos no lógicos. La firma puede ser vacía , finita o infinita, incluso incontable . Las firmas incontables ocurren, por ejemplo, en las demostraciones modernas del teorema de Löwenheim-Skolem .
En este enfoque, cada símbolo no lógico es de uno de los siguientes tipos.
El enfoque tradicional se puede recuperar en el enfoque moderno, simplemente especificando la firma "personalizada" para que consista en las secuencias tradicionales de símbolos no lógicos.
Gramática BNF |
---|
< índice > :: = "" | < índice > "'" < variable > :: = "x" < índice > < constante > :: = "c" < índice > < función unaria > :: = "f1" < índice > < función binaria > :: = "f2" < índice > < función ternaria > :: = "f3" < índice > <predicado unario > :: ="p1" < índice > < predicado binario > :: = "p2" < índice > < predicado ternario > :: = "p3" < índice > < término > :: = < variable > | < constante > | < función unaria > "(" < término > ")" | < función binaria > "(" < término > "," < término > ")" | < función ternaria > "(" < término > "," < término > "," < término > ")" < fórmula atómica > :: = "VERDADERO" | "FALSO" | < término > "=" < término > | < predicado unario > "(" < término > ")" | < predicado binario > "(" < término > "," < término > ")" | < predicado ternario > "(" < término > "," < término > "," < término > ")" < fórmula > :: = < fórmula atómica > | "¬" < fórmula > | < fórmula > "∧" < fórmula > | < fórmula > "∨" <fórmula > |< fórmula > "⇒" < fórmula > | < fórmula > "⇔" < fórmula > | "(" < fórmula > ")" | "∀" < variable > < fórmula > | "∃" < variable > < fórmula > |
La gramática libre de contexto anterior en forma Backus-Naur define el lenguaje de fórmulas de primer orden sintácticamente válidas con símbolos de función y símbolos de predicado hasta arity 3. Para aridades superiores, necesita adaptarse en consecuencia. [10] [11] [ cita requerida ] |
La fórmula de ejemplo ∀x ∃x' (¬x=c) ⇒ f2(x,x')=c' describe inversos multiplicativos cuando f2' , c y c' se interpretan como multiplicación, cero y uno, respectivamente. |
Las reglas de formación definen los términos y fórmulas de la lógica de primer orden. [12] Cuando los términos y fórmulas se representan como cadenas de símbolos, estas reglas se pueden usar para escribir una gramática formal para términos y fórmulas. Estas reglas generalmente no tienen contexto (cada producción tiene un solo símbolo en el lado izquierdo), excepto que se puede permitir que el conjunto de símbolos sea infinito y puede haber muchos símbolos de inicio, por ejemplo, las variables en el caso de los términos .
El conjunto de términos se define inductivamente por las siguientes reglas:
Sólo las expresiones que pueden obtenerse mediante un número finito de aplicaciones de las reglas 1 y 2 son términos. Por ejemplo, ninguna expresión que incluya un símbolo de predicado es un término.
El conjunto de fórmulas (también llamadas fórmulas bien formadas [13] o WFF ) se define inductivamente mediante las siguientes reglas:
Sólo las expresiones que pueden obtenerse mediante un número finito de aplicaciones de las reglas 1 a 5 son fórmulas. Se dice que las fórmulas obtenidas de las dos primeras reglas son fórmulas atómicas .
Por ejemplo,
es una fórmula, si f es un símbolo de función unaria, P un símbolo de predicado unario y Q un símbolo de predicado ternario. Por otro lado, no es una fórmula, aunque es una cadena de símbolos del alfabeto.
El papel de los paréntesis en la definición es garantizar que cualquier fórmula solo se pueda obtener de una manera: siguiendo la definición inductiva (es decir, hay un árbol de análisis sintáctico único para cada fórmula). Esta propiedad se conoce como legibilidad única de fórmulas. Hay muchas convenciones sobre el uso de paréntesis en las fórmulas. Por ejemplo, algunos autores utilizan dos puntos o puntos en lugar de paréntesis, o cambian los lugares en los que se insertan los paréntesis. La definición particular de cada autor debe ir acompañada de una prueba de legibilidad única.
Esta definición de una fórmula no admite la definición de una función si-entonces-si no ite(c, a, b)
, donde "c" es una condición expresada como una fórmula, que devolvería "a" si c es verdadera y "b" si es falsa. Esto se debe a que tanto los predicados como las funciones solo pueden aceptar términos como parámetros, pero el primer parámetro es una fórmula. Algunos lenguajes basados en lógica de primer orden, como SMT-LIB 2.0, agregan esto. [14]
Por conveniencia, se han desarrollado convenciones sobre la precedencia de los operadores lógicos, para evitar la necesidad de escribir paréntesis en algunos casos. Estas reglas son similares al orden de las operaciones en aritmética. Una convención común es:
Además, se puede insertar puntuación adicional que no requiera la definición, para facilitar la lectura de las fórmulas. Así la fórmula
podría estar escrito como
En algunos campos, es común usar notación infija para funciones y relaciones binarias, en lugar de la notación prefija definida anteriormente. Por ejemplo, en aritmética, normalmente se escribe "2 + 2 = 4" en lugar de "= (+ (2,2), 4)". Es común considerar las fórmulas en notación infija como abreviaturas de las fórmulas correspondientes en notación prefijada, cf. también estructura de términos vs. representación .
Las definiciones anteriores usan notación infija para conectivos binarios como . Una convención menos común es la notación polaca , en la que se escribe , y así sucesivamente frente a sus argumentos en lugar de entre ellos. Esta convención es ventajosa porque permite descartar todos los símbolos de puntuación. Como tal, la notación polaca es compacta y elegante, pero rara vez se usa en la práctica porque es difícil de leer para los humanos. En notación polaca, la fórmula
se convierte en "∀x∀y → Pfx¬ → PxQfyxz".
En una fórmula, una variable puede aparecer libre o ligada (o ambas). Intuitivamente, la ocurrencia de una variable es libre en una fórmula si no se cuantifica: [15] en ∀ y P ( x , y ) , la única ocurrencia de la variable x es libre mientras que la de y está ligada. Las ocurrencias de variables libres y ligadas en una fórmula se definen inductivamente como sigue.
Por ejemplo, en ∀ x ∀ y ( P ( x ) → Q ( x , f ( x ), z )) , x y y sólo se producen obligado, [16] z se produce sólo libre, y w es ni porque no hace ocurren en la fórmula.
Las variables libres y ligadas de una fórmula no necesitan ser conjuntos disjuntos: en la fórmula P ( x ) → ∀ x Q ( x ) , la primera aparición de x , como argumento de P , es libre mientras que la segunda, como argumento de Q , está obligado.
Una fórmula en lógica de primer orden sin ocurrencias de variables libres se llama oración de primer orden . Estas son las fórmulas que tendrán valores de verdad bien definidos bajo una interpretación. Por ejemplo, si una fórmula como Phil ( x ) es verdadera debe depender de lo que representa x . Pero la oración ∃ x Phil ( x ) será verdadera o falsa en una interpretación dada.
En matemáticas, el lenguaje de los grupos abelianos ordenados tiene un símbolo constante 0, un símbolo de función unaria -, un símbolo de función binaria + y un símbolo de relación binaria ≤. Luego:
Los axiomas para grupos abelianos ordenados se pueden expresar como un conjunto de oraciones en el idioma. Por ejemplo, el axioma que establece que el grupo es conmutativo suele escribirse
Una interpretación de un idioma de primer orden asigna una denotación a cada símbolo no lógico en ese idioma. También determina un dominio de discurso que especifica el rango de los cuantificadores. El resultado es que a cada término se le asigna un objeto que representa, a cada predicado se le asigna una propiedad de objetos y a cada oración se le asigna un valor de verdad. De esta manera, una interpretación proporciona un significado semántico a los términos, predicados y fórmulas del lenguaje. El estudio de las interpretaciones de lenguajes formales se denomina semántica formal . Lo que sigue es una descripción de la semántica estándar o de Tarsk para la lógica de primer orden. (También es posible definir la semántica del juego para la lógica de primer orden, pero además de requerir el axioma de elección , la semántica del juego concuerda con la semántica de Tarsk para la lógica de primer orden, por lo que la semántica del juego no se desarrollará aquí).
El dominio del discurso D es un conjunto no vacío de "objetos" de algún tipo. Intuitivamente, una fórmula de primer orden es una declaración sobre estos objetos; por ejemplo, establece la existencia de un objeto x tal que el predicado P es verdadero cuando se le refiere. El dominio del discurso es el conjunto de objetos considerados. Por ejemplo, se puede tomar como conjunto de números enteros.
La interpretación de un símbolo de función es una función. Por ejemplo, si el dominio del discurso consta de números enteros, un símbolo de función f de aridad 2 puede interpretarse como la función que da la suma de sus argumentos. En otras palabras, el símbolo f está asociado con la función que, en esta interpretación, es suma.
La interpretación de un símbolo constante es una función del conjunto de una sola elemento D 0 a D , que puede ser simplemente identificada con un objeto en D . Por ejemplo, una interpretación puede asignar el valor al símbolo constante .
La interpretación de un símbolo de predicado n -ario es un conjunto de n - tuplas de elementos del dominio del discurso. Esto significa que, dada una interpretación, un símbolo de predicado y n elementos del dominio del discurso, se puede decir si el predicado es verdadero de esos elementos de acuerdo con la interpretación dada. Por ejemplo, una interpretación I (P) de un símbolo de predicado binario P puede ser el conjunto de pares de números enteros de manera que el primero sea menor que el segundo. Según esta interpretación, el predicado P sería verdadero si su primer argumento es menor que el segundo.
La forma más común de especificar una interpretación (especialmente en matemáticas) es especificar una estructura (también llamada modelo ; ver más abajo). La estructura consta de un conjunto D no vacío que forma el dominio del discurso y una interpretación I de los términos no lógicos de la firma. Esta interpretación es en sí misma una función:
Una fórmula se evalúa como verdadera o falsa dada una interpretación, y una asignación de variable μ que asocia un elemento del dominio del discurso con cada variable. La razón por la que se requiere una asignación de variable es para dar significado a fórmulas con variables libres, como . El valor de verdad de esta fórmula cambia dependiendo de si x y y denotar el mismo individuo.
Primero, la asignación de variable μ puede extenderse a todos los términos del lenguaje, con el resultado de que cada término se asigna a un solo elemento del dominio del discurso. Las siguientes reglas se utilizan para realizar esta asignación:
A continuación, a cada fórmula se le asigna un valor de verdad. La definición inductiva utilizado para hacer esta asignación se denomina T-esquema .
Si una fórmula no contiene variables libres, y también una oración, entonces la asignación de variable inicial no afecta su valor de verdad. En otras palabras, una oración es verdadera de acuerdo con M y si y solo si es verdadera de acuerdo con M y todas las demás asignaciones de variables .
Existe un segundo enfoque común para definir valores de verdad que no se basa en funciones de asignación de variables. En cambio, dada una interpretación M , primero se agrega a la firma una colección de símbolos constantes, uno para cada elemento del dominio del discurso en M ; digamos que para cada d en el dominio el símbolo constante c d es fijo. La interpretación se amplía para que cada nuevo símbolo constante se asigne a su elemento correspondiente del dominio. Ahora se define sintácticamente la verdad para fórmulas cuantificadas, de la siguiente manera:
Este enfoque alternativo da exactamente los mismos valores de verdad a todas las oraciones que el enfoque a través de asignaciones de variables.
Si una oración φ se evalúa como Verdadera bajo una interpretación dada M , se dice que M satisface φ; esto se denota [17] . Una oración es satisfactoria si hay alguna interpretación bajo la cual es verdadera.
La satisfacción de fórmulas con variables libres es más complicada, porque una interpretación por sí sola no determina el valor de verdad de dicha fórmula. La convención más común es que se dice que una fórmula con variables libres se satisface mediante una interpretación si la fórmula permanece verdadera independientemente de qué individuos del dominio del discurso se asignen a sus variables libres. Esto tiene el mismo efecto que decir que una fórmula se satisface si y solo si se satisface su cierre universal .
Una fórmula es lógicamente válida (o simplemente válida ) si es verdadera en todas las interpretaciones. [18] Estas fórmulas juegan un papel similar a las tautologías en la lógica proposicional.
Una fórmula φ es una consecuencia lógica de una fórmula ψ si toda interpretación que hace que ψ sea verdadero también hace que φ sea verdadero. En este caso, se dice que φ está lógicamente implícito en ψ.
Un enfoque alternativo a la semántica de la lógica de primer orden procede a través del álgebra abstracta . Este enfoque generaliza las álgebras de lógica proposicional de Lindenbaum-Tarski . Hay tres formas de eliminar las variables cuantificadas de la lógica de primer orden que no implican reemplazar los cuantificadores con otros operadores de términos de vinculación de variables:
Todas estas álgebras son celosías que amplían adecuadamente el álgebra booleana de dos elementos .
Tarski y Givant (1987) demostraron que el fragmento de lógica de primer orden que no tiene una oración atómica dentro del alcance de más de tres cuantificadores tiene el mismo poder expresivo que el álgebra de relaciones . [19] : 32–33 Este fragmento es de gran interés porque es suficiente para la aritmética de Peano y la teoría de conjuntos más axiomática , incluida la canónica ZFC . También prueban que la lógica de primer orden con un par ordenado primitivo es equivalente a un álgebra de relaciones con dos funciones de proyección de par ordenado . [20] : 803
Una teoría de primer orden de una firma particular es un conjunto de axiomas , que son oraciones que constan de símbolos de esa firma. El conjunto de axiomas es a menudo finito o recursivamente enumerable , en cuyo caso la teoría se llama efectiva . Algunos autores exigen que las teorías incluyan también todas las consecuencias lógicas de los axiomas. Se considera que los axiomas se sostienen dentro de la teoría y de ellos se pueden derivar otras oraciones que se sostienen dentro de la teoría.
Se dice que una estructura de primer orden que satisface todas las oraciones en una teoría dada es un modelo de la teoría. Una clase elemental es el conjunto de todas las estructuras que satisfacen una teoría particular. Estas clases son un tema principal de estudio en la teoría de modelos .
Muchas teorías tienen una interpretación intencionada , un cierto modelo que se tiene en cuenta al estudiar la teoría. Por ejemplo, la interpretación prevista de la aritmética de Peano consiste en los números naturales habituales con sus operaciones habituales. Sin embargo, el teorema de Löwenheim-Skolem muestra que la mayoría de las teorías de primer orden también tendrán otros modelos no estándar .
Una teoría es consistente si no es posible probar una contradicción a partir de los axiomas de la teoría. Una teoría es completa si, para cada fórmula en su firma, esa fórmula o su negación es una consecuencia lógica de los axiomas de la teoría. El teorema de incompletitud de Gödel muestra que las teorías de primer orden efectivas que incluyen una porción suficiente de la teoría de los números naturales nunca pueden ser consistentes y completas.
Para obtener más información sobre este tema, consulte la Lista de teorías y teoría de primer orden (lógica matemática)
La definición anterior requiere que el dominio del discurso de cualquier interpretación no esté vacío. Hay configuraciones, como la lógica inclusiva , donde se permiten dominios vacíos. Además, si una clase de estructuras algebraicas incluye una estructura vacía (por ejemplo, hay un poset vacío ), esa clase solo puede ser una clase elemental en lógica de primer orden si se permiten dominios vacíos o la estructura vacía se elimina de la clase. .
Sin embargo, existen varias dificultades con los dominios vacíos:
Por lo tanto, cuando se permite el dominio vacío, a menudo debe tratarse como un caso especial. La mayoría de los autores, sin embargo, simplemente excluyen el dominio vacío por definición.
Un sistema deductivo se utiliza para demostrar, sobre una base puramente sintáctica, que una fórmula es una consecuencia lógica de otra fórmula. Existen muchos de estos sistemas para la lógica de primer orden, incluidos los sistemas deductivos al estilo de Hilbert , la deducción natural , el cálculo secuencial , el método de cuadros y la resolución . Estos comparten la propiedad común de que una deducción es un objeto sintáctico finito; el formato de este objeto y la forma en que se construye varían ampliamente. Estas deducciones finitas en sí mismas a menudo se denominan derivaciones en la teoría de la prueba. También se denominan a menudo pruebas, pero están completamente formalizadas a diferencia de las pruebas matemáticas en lenguaje natural..
Un sistema deductivo es sólido si cualquier fórmula que pueda derivarse en el sistema es lógicamente válida. Por el contrario, un sistema deductivo está completo si todas las fórmulas lógicamente válidas son derivables. Todos los sistemas discutidos en este artículo son sólidos y completos. También comparten la propiedad de que es posible verificar efectivamente que una deducción supuestamente válida es en realidad una deducción; tales sistemas de deducción se denominan efectivos .
Una propiedad clave de los sistemas deductivos es que son puramente sintácticos, por lo que las derivaciones se pueden verificar sin considerar ninguna interpretación. Por lo tanto, un argumento sólido es correcto en todas las posibles interpretaciones del lenguaje, independientemente de si esa interpretación se refiere a las matemáticas, la economía o alguna otra área.
En general, la consecuencia lógica en la lógica de primer orden es solo semidecidible : si una oración A implica lógicamente una oración B, entonces esto se puede descubrir (por ejemplo, buscando una prueba hasta encontrar una, usando alguna prueba efectiva, sólida y completa sistema). Sin embargo, si A no implica lógicamente B, esto no significa que A implica lógicamente la negación de B. No existe un procedimiento efectivo que, dadas las fórmulas A y B, siempre decida correctamente si A implica lógicamente B.
Una regla de inferencia establece que, dada una fórmula particular (o conjunto de fórmulas) con una determinada propiedad como hipótesis, se puede derivar otra fórmula específica (o conjunto de fórmulas) como conclusión. La regla es sólida (o preserva la verdad) si preserva la validez en el sentido de que siempre que cualquier interpretación satisfaga la hipótesis, esa interpretación también satisface la conclusión.
Por ejemplo, una regla de inferencia común es la regla de sustitución . Si t es un término y φ es una fórmula que posiblemente contenga la variable x , entonces φ [ t / x ] es el resultado de reemplazar todas las instancias libres de x por t en φ. La regla de sustitución establece que para cualquier φ y cualquier término t , se puede concluir φ [ t / x ] a partir de φ siempre que ninguna variable libre de t quede ligada durante el proceso de sustitución. (Si alguna variable libre de t se vuelve ligada, entonces para sustituir t por xprimero es necesario cambiar las variables ligadas de φ para que difieran de las variables libres de t .)
Para ver por qué es necesaria la restricción de las variables ligadas, considere la fórmula lógicamente válida φ dada por , en la firma de (0,1, +, ×, =) de la aritmética. Si t es el término "x + 1", la fórmula φ [ t / y ] es , que será falsa en muchas interpretaciones. El problema es que la variable libre x de t se ligó durante la sustitución. El reemplazo deseado se puede obtener cambiando el nombre de la variable ligada x de φ a otra cosa, digamos z , de modo que la fórmula después de la sustitución sea , que nuevamente es lógicamente válida.
La regla de sustitución demuestra varios aspectos comunes de las reglas de inferencia. Es completamente sintáctico; se puede saber si se aplicó correctamente sin apelar a ninguna interpretación. Tiene limitaciones (definidas sintácticamente) sobre cuándo se puede aplicar, que deben respetarse para preservar la corrección de las derivaciones. Además, como suele ser el caso, estas limitaciones son necesarias debido a las interacciones entre las variables libres y ligadas que ocurren durante las manipulaciones sintácticas de las fórmulas involucradas en la regla de inferencia.
Una deducción en un sistema deductivo al estilo de Hilbert es una lista de fórmulas, cada una de las cuales es un axioma lógico , una hipótesis que se ha asumido para la derivación en cuestión, o que se sigue de fórmulas anteriores mediante una regla de inferencia. Los axiomas lógicos consisten en varios esquemas de axiomas de fórmulas lógicamente válidas; estos abarcan una cantidad significativa de lógica proposicional. Las reglas de inferencia permiten la manipulación de cuantificadores. Los sistemas típicos del estilo de Hilbert tienen una pequeña cantidad de reglas de inferencia, junto con varios esquemas infinitos de axiomas lógicos. Es común tener solo modus ponens y generalización universal como reglas de inferencia.
Los sistemas de deducción natural se asemejan a los sistemas de estilo Hilbert en que una deducción es una lista finita de fórmulas. Sin embargo, los sistemas de deducción natural no tienen axiomas lógicos; compensan agregando reglas de inferencia adicionales que pueden usarse para manipular los conectivos lógicos en fórmulas en la demostración.
El cálculo secuencial se desarrolló para estudiar las propiedades de los sistemas de deducción natural. [21] En lugar de trabajar con una fórmula a la vez, utiliza secuencias , que son expresiones de la forma
donde A 1 , ..., A n , B 1 , ..., B k son fórmulas y el símbolo del torniquete se usa como puntuación para separar las dos mitades. Intuitivamente, un secuente expresa la idea que implica .
A diferencia de los métodos que se acaban de describir, las derivaciones del método tableaux no son listas de fórmulas. En cambio, una derivación es un árbol de fórmulas. Para mostrar que una fórmula A es demostrable, el método de cuadros intenta demostrar que la negación de A es insatisfactorio. El árbol de la derivación tiene en su raíz; las ramas del árbol de una manera que refleje la estructura de la fórmula. Por ejemplo, para demostrar que es insatisfactorio es necesario demostrar que C y D son insatisfactorios; esto corresponde a un punto de ramificación en el árbol con padre e hijos C y D.
La regla de resolución es una sola regla de inferencia que, junto con la unificación , es sólida y completa para la lógica de primer orden. Al igual que con el método de cuadros, una fórmula se prueba mostrando que la negación de la fórmula es insatisfactorio. La resolución se usa comúnmente en la demostración automatizada de teoremas.
El método de resolución funciona solo con fórmulas que son disyunciones de fórmulas atómicas; Las fórmulas arbitrarias deben convertirse primero a esta forma a través de Skolemization . La regla de resolución establece que a partir de las hipótesis y , se puede obtener la conclusión .
Se pueden probar muchas identidades, que establecen equivalencias entre fórmulas particulares. Estas identidades permiten reorganizar fórmulas moviendo cuantificadores a través de otras conectivas y son útiles para poner fórmulas en forma normal prenex . Algunas identidades demostrables incluyen:
Hay varias convenciones diferentes para usar la igualdad (o identidad) en la lógica de primer orden. La convención más común, conocida como lógica de primer orden con igualdad , incluye el símbolo de igualdad como símbolo lógico primitivo que siempre se interpreta como la relación de igualdad real entre miembros del dominio del discurso, de modo que los "dos" miembros dados son los mismo miembro. Este enfoque también agrega ciertos axiomas sobre la igualdad al sistema deductivo empleado. Estos axiomas de igualdad son: [22] : 198-200
Estos son esquemas de axiomas , cada uno de los cuales especifica un conjunto infinito de axiomas. El tercer esquema se conoce como ley de Leibniz , "el principio de sustituibilidad", "la indiscernibilidad de los idénticos" o "la propiedad de reemplazo". El segundo esquema, que involucra el símbolo de función f , es (equivalente a) un caso especial del tercer esquema, usando la fórmula
Muchas otras propiedades de la igualdad son consecuencia de los axiomas anteriores, por ejemplo:
Un enfoque alternativo considera que la relación de igualdad es un símbolo no lógico. Esta convención se conoce como lógica de primer orden sin igualdad . Si se incluye una relación de igualdad en la firma, los axiomas de igualdad ahora deben agregarse a las teorías en consideración, si se desea, en lugar de considerarse reglas de lógica. La principal diferencia entre este método y la lógica de primer orden con igualdad es que una interpretación ahora puede interpretar a dos individuos distintos como "iguales" (aunque, según la ley de Leibniz, estos satisfarán exactamente las mismas fórmulas bajo cualquier interpretación). Es decir, la relación de igualdad ahora puede ser interpretada por una relación de equivalencia arbitraria en el dominio del discurso que es congruente con respecto a las funciones y relaciones de la interpretación.
Cuando se sigue esta segunda convención, el término modelo normal se utiliza para referirse a una interpretación donde no hay individuos distintos a y b satisfacen un = b . En la lógica de primer orden con igualdad, solo se consideran los modelos normales, por lo que no existe un término para un modelo que no sea un modelo normal. Cuando se estudia la lógica de primer orden sin igualdad, es necesario enmendar los enunciados de resultados como el teorema de Löwenheim-Skolem para que solo se consideren modelos normales.
La lógica de primer orden sin igualdad se emplea a menudo en el contexto de la aritmética de segundo orden y otras teorías de la aritmética de orden superior, donde la relación de igualdad entre conjuntos de números naturales generalmente se omite.
Si una teoría tiene una fórmula binaria A ( x , y ) que satisface la reflexividad y la ley de Leibniz, se dice que la teoría tiene igualdad, o que es una teoría con igualdad. Es posible que la teoría no tenga todas las instancias de los esquemas anteriores como axiomas, sino más bien como teoremas derivables. Por ejemplo, en teorías sin símbolos de función y un número finito de relaciones, es posible definir la igualdad en términos de las relaciones, mediante la definición de los dos términos s y t ser iguales si cualquier relación no se modifica cambiando s a t en cualquier argumento.
Algunas teorías permiten otras definiciones ad hoc de igualdad:
Una motivación para el uso de la lógica de primer orden, en lugar de la lógica de orden superior , es que la lógica de primer orden tiene muchas propiedades metalógicas que las lógicas más fuertes no tienen. Estos resultados se refieren a propiedades generales de la propia lógica de primer orden, más que a propiedades de teorías individuales. Proporcionan herramientas fundamentales para la construcción de modelos de teorías de primer orden.
El teorema de completitud de Gödel , probado por Kurt Gödel en 1929, establece que existen sistemas deductivos sólidos, completos y efectivos para la lógica de primer orden y, por lo tanto, la relación de consecuencia lógica de primer orden es capturada por la demostrabilidad finita. Ingenuamente, la afirmación de que una fórmula φ implica lógicamente una fórmula ψ depende de cada modelo de φ; estos modelos serán en general de cardinalidad arbitrariamente grande y, por lo tanto, las consecuencias lógicas no se pueden verificar de manera efectiva verificando todos los modelos. Sin embargo, es posible enumerar todas las derivaciones finitas y buscar una derivación de ψ a partir de φ. Si ψ está lógicamente implícito en φ, eventualmente se encontrará dicha derivación. Así, la consecuencia lógica de primer orden es semidecidible.: es posible hacer una enumeración efectiva de todos los pares de oraciones (φ, ψ) de manera que ψ sea una consecuencia lógica de φ.
A diferencia de la lógica proposicional , la lógica de primer orden es indecidible (aunque semidecidible), siempre que el lenguaje tenga al menos un predicado de aridad al menos 2 (distinto de igualdad). Esto significa que no existe un procedimiento de decisión que determine si las fórmulas arbitrarias son lógicamente válidas. Este resultado fue establecido de forma independiente por Alonzo Church y Alan Turing en 1936 y 1937, respectivamente, dando una respuesta negativa al problema de Entscheidung planteado por David Hilbert y Wilhelm Ackermann.en 1928. Sus demostraciones demuestran una conexión entre la imposibilidad de resolver el problema de la decisión para la lógica de primer orden y la imposibilidad de resolver el problema de la detención .
Hay sistemas más débiles que la lógica de primer orden completa para los que la relación de consecuencia lógica es decidible. Estos incluyen la lógica proposicional y la lógica de predicados monádica , que es una lógica de primer orden restringida a símbolos de predicado unario y sin símbolos de función. Otras lógicas sin símbolos de función que son decidibles son el fragmento protegido de la lógica de primer orden, así como la lógica de dos variables . La clase Bernays-Schönfinkel de fórmulas de primer orden también es decidible. Los subconjuntos decidibles de la lógica de primer orden también se estudian en el marco de las lógicas descriptivas .
El teorema de Löwenheim-Skolem muestra que si una teoría de cardinalidad de primer orden λ tiene un modelo infinito, entonces tiene modelos de cada cardinalidad infinita mayor o igual que λ. Uno de los primeros resultados en la teoría de modelos , implica que no es posible caracterizar la contabilidad o la incontables en un lenguaje de primer orden con una firma contable. Es decir, no existe una fórmula de primer orden φ ( x ) tal que una estructura arbitraria M satisfaga φ si y solo si el dominio del discurso de M es contable (o, en el segundo caso, incontable).
El teorema de Löwenheim-Skolem implica que las estructuras infinitas no pueden axiomatizarse categóricamente en la lógica de primer orden. Por ejemplo, no existe una teoría de primer orden cuyo único modelo sea la línea real: cualquier teoría de primer orden con un modelo infinito también tiene un modelo de cardinalidad mayor que el continuo. Dado que la línea real es infinita, cualquier teoría satisfecha por la línea real también es satisfecha por algunos modelos no estándar . Cuando el teorema de Löwenheim-Skolem se aplica a las teorías de conjuntos de primer orden, las consecuencias no intuitivas se conocen como paradoja de Skolem .
El teorema de la compacidad establece que un conjunto de oraciones de primer orden tiene un modelo si y solo si cada subconjunto finito tiene un modelo. [25] Esto implica que si una fórmula es una consecuencia lógica de un conjunto infinito de axiomas de primer orden, entonces es una consecuencia lógica de algún número finito de esos axiomas. Este teorema fue probado primero por Kurt Gödel como consecuencia del teorema de completitud, pero se han obtenido muchas pruebas adicionales a lo largo del tiempo. Es una herramienta central en la teoría de modelos, proporcionando un método fundamental para construir modelos.
El teorema de la compacidad tiene un efecto limitante sobre qué colecciones de estructuras de primer orden son clases elementales. Por ejemplo, el teorema de la compacidad implica que cualquier teoría que tenga modelos finitos arbitrariamente grandes tiene un modelo infinito. Por tanto, la clase de todos los gráficos finitos no es una clase elemental (lo mismo se aplica a muchas otras estructuras algebraicas).
También hay limitaciones más sutiles de la lógica de primer orden que están implícitas en el teorema de la compacidad. Por ejemplo, en informática, muchas situaciones se pueden modelar como un gráfico dirigido de estados (nodos) y conexiones (bordes dirigidos). La validación de un sistema de este tipo puede requerir demostrar que no se puede alcanzar un estado "malo" desde un estado "bueno". Por lo tanto, se busca determinar si los estados bueno y malo están en diferentes componentes conectados del gráfico. Sin embargo, el teorema de la compacidad se puede utilizar para demostrar que los gráficos conectados no son una clase elemental en la lógica de primer orden, y no existe una fórmula φ ( x , y ) de la lógica de primer orden, en la lógica de los gráficos , que exprese la idea de que hay un camino desdex a y . Sin embargo, la conectividad se puede expresar en lógica de segundo orden , pero no solo con cuantificadores de conjuntos existenciales, ya que también disfruta de la compacidad.
Per Lindström mostró que las propiedades metalogicas que acabamos de discutir en realidad caracterizan la lógica de primer orden en el sentido de que ninguna lógica más fuerte puede tener también esas propiedades (Ebbinghaus y Flum 1994, Capítulo XIII). Lindström definió una clase de sistemas lógicos abstractos y una definición rigurosa de la fuerza relativa de un miembro de esta clase. Estableció dos teoremas para sistemas de este tipo:
Aunque la lógica de primer orden es suficiente para formalizar gran parte de las matemáticas, y se usa comúnmente en ciencias de la computación y otros campos, tiene ciertas limitaciones. Estos incluyen limitaciones en su expresividad y limitaciones de los fragmentos de lenguajes naturales que puede describir.
Por ejemplo, la lógica de primer orden es indecidible, lo que significa que un algoritmo de decisión sólido, completo y final para la demostrabilidad es imposible. Esto ha llevado al estudio de interesantes fragmentos decidibles, como C 2 : lógica de primer orden con dos variables y los cuantificadores de conteo y . [26]
El teorema de Löwenheim-Skolem muestra que si una teoría de primer orden tiene un modelo infinito, entonces tiene modelos infinitos de cada cardinalidad. En particular, ninguna teoría de primer orden con un modelo infinito puede ser categórica . Por tanto, no existe una teoría de primer orden cuyo único modelo tenga el conjunto de números naturales como dominio, o cuyo único modelo tenga el conjunto de números reales como dominio. Muchas extensiones de la lógica de primer orden, incluidas las lógicas infinitarias y las lógicas de orden superior, son más expresivas en el sentido de que permiten axiomatizaciones categóricas de los números naturales o reales. Sin embargo, esta expresividad tiene un costo metalológico: según el teorema de Lindström, el teorema de la compacidad y el teorema descendente de Löwenheim-Skolem no pueden tener una lógica más fuerte que la de primer orden.
La lógica de primer orden es capaz de formalizar muchas construcciones cuantificadoras simples en lenguaje natural, como "cada persona que vive en Perth vive en Australia". Pero hay muchas características más complicadas del lenguaje natural que no se pueden expresar en la lógica de primer orden (de un solo orden). "Cualquier sistema lógico que sea apropiado como instrumento para el análisis del lenguaje natural necesita una estructura mucho más rica que la lógica de predicados de primer orden". [27]
Escribe | Ejemplo | Comentario |
---|---|---|
Cuantificación sobre propiedades | Si Juan está satisfecho de sí mismo, entonces hay al menos una cosa que tiene en común con Pedro. | El ejemplo requiere un cuantificador sobre predicados, que no se puede implementar en la lógica de primer orden de un solo orden: Zj → ∃X (Xj∧Xp) . |
Cuantificación sobre propiedades | Santa Claus tiene todos los atributos de un sádico. | El ejemplo requiere cuantificadores sobre predicados, que no se pueden implementar en la lógica de primer orden de un solo orden: ∀X (∀x (Sx → Xx) → Xs) . |
Predicado adverbial | John camina rápido. | El ejemplo no puede analizarse como Wj ∧ Qj ; Los adverbiales de predicado no son lo mismo que los predicados de segundo orden, como el color. |
Adjetivo relativo | Jumbo es un pequeño elefante. | El ejemplo no puede analizarse como Sj ∧ Ej ; los adjetivos de predicado no son lo mismo que los predicados de segundo orden como el color. |
Modificador adverbial de predicado | John camina muy rápido. | - |
Modificador de adjetivo relativo | Jumbo es terriblemente pequeño. | Una expresión como "terriblemente", cuando se aplica a un adjetivo relativo como "pequeño", da como resultado un nuevo adjetivo relativo compuesto "terriblemente pequeño". |
Preposiciones | Mary está sentada junto a John. | La preposición "al lado de" cuando se aplica a "Juan" da como resultado el predicado adverbial "al lado de Juan". |
Hay muchas variaciones de lógica de primer orden. Algunos de estos no son esenciales en el sentido de que simplemente cambian la notación sin afectar la semántica. Otros cambian el poder expresivo de manera más significativa, al extender la semántica a través de cuantificadores adicionales u otros símbolos lógicos nuevos. Por ejemplo, las lógicas infinitas permiten fórmulas de tamaño infinito y las lógicas modales añaden símbolos de posibilidad y necesidad.
La lógica de primer orden se puede estudiar en lenguajes con menos símbolos lógicos que los descritos anteriormente.
Restricciones como estas son útiles como técnica para reducir el número de reglas de inferencia o esquemas de axiomas en sistemas deductivos, lo que conduce a pruebas más breves de resultados metalógicos. El costo de las restricciones es que se vuelve más difícil expresar enunciados en lenguaje natural en el sistema formal en cuestión, porque los conectivos lógicos usados en los enunciados en lenguaje natural deben ser reemplazados por sus definiciones (más largas) en términos de la colección restringida de conectivos lógicos. De manera similar, las derivaciones en los sistemas limitados pueden ser más largas que las derivaciones en sistemas que incluyen conectivos adicionales. Por lo tanto, existe una compensación entre la facilidad de trabajar dentro del sistema formal y la facilidad de probar resultados sobre el sistema formal.
También es posible restringir las aridades de los símbolos de función y los símbolos de predicado, en teorías suficientemente expresivas. En principio, se puede prescindir por completo de funciones de aridad mayor que 2 y predicados de aridad mayor que 1 en teorías que incluyen una función de emparejamiento . Esta es una función de arity 2 que toma pares de elementos del dominio y devuelve un par ordenado que los contiene. También es suficiente tener dos símbolos predicados de aridad 2 que definan funciones de proyección desde un par ordenado a sus componentes. En cualquier caso, es necesario que se satisfagan los axiomas naturales para una función de emparejamiento y sus proyecciones.
Las interpretaciones ordinarias de primer orden tienen un solo dominio de discurso sobre el que se extienden todos los cuantificadores. La lógica de primer orden de muchos ordenamientos permite que las variables tengan diferentes tipos , que tienen diferentes dominios. Esto también se denomina lógica de primer orden tipificada y los tipos se denominan tipos (como en el tipo de datos ), pero no es lo mismo que la teoría de tipos de primer orden . La lógica de primer orden de muchos ordenamientos se utiliza a menudo en el estudio de la aritmética de segundo orden . [29]
Cuando solo hay un número finito de tipos en una teoría, la lógica de primer orden de muchos ordenamientos se puede reducir a la lógica de primer orden de un solo orden. [30] : 296-299 Se introduce en la teoría de un solo orden un símbolo de predicado unario para cada género en la teoría de muchos ordenadas, y se agrega un axioma que dice que estos predicados unarios dividen el dominio del discurso. Por ejemplo, si hay dos tipos, uno agrega símbolos de predicado y y el axioma
Entonces, los elementos satisfactorios se consideran elementos del primer tipo y los elementos satisfactorios como elementos del segundo tipo. Se puede cuantificar sobre cada tipo utilizando el símbolo de predicado correspondiente para limitar el rango de cuantificación. Por ejemplo, para decir que hay un elemento del primer tipo que satisface la fórmula φ ( x ), se escribe
Se pueden agregar cuantificadores adicionales a la lógica de primer orden.
La lógica infinita permite oraciones infinitamente largas. Por ejemplo, se puede permitir una conjunción o disyunción de un número infinito de fórmulas, o una cuantificación sobre un número infinito de variables. Las oraciones infinitamente largas surgen en áreas de las matemáticas, incluida la topología y la teoría de modelos .
La lógica infinita generaliza la lógica de primer orden para permitir fórmulas de longitud infinita. La forma más común en la que las fórmulas pueden volverse infinitas es a través de conjunciones y disyunciones infinitas. Sin embargo, también es posible admitir firmas generalizadas en las que se permite que los símbolos de función y relación tengan aridades infinitas, o en las que los cuantificadores pueden unir infinitas variables. Debido a que una fórmula infinita no puede ser representada por una cadena finita, es necesario elegir alguna otra representación de fórmulas; la representación habitual en este contexto es un árbol. Por lo tanto, las fórmulas se identifican, esencialmente, con sus árboles de análisis sintáctico, en lugar de con las cadenas que se analizan.
Las lógicas infinitarias más comúnmente estudiadas se denominan L αβ , donde α y β son números cardinales o el símbolo ∞. En esta notación, la lógica ordinaria de primer orden es L ωω . En la lógica L ∞ω , se permiten conjunciones o disyunciones arbitrarias al construir fórmulas, y hay un suministro ilimitado de variables. De manera más general, la lógica que permite conjunciones o disyunciones con menos de κ constituyentes se conoce como L κω . Por ejemplo, L ω 1 ω permite conjunciones y disyunciones contables .
El conjunto de variables libres en una fórmula de L κω puede tener cualquier cardinalidad estrictamente menor que κ, pero solo un número finito de ellas puede estar en el alcance de cualquier cuantificador cuando una fórmula aparece como una subfórmula de otra. [31] En otras lógicas infinitas, una subfórmula puede estar en el alcance de un número infinito de cuantificadores. Por ejemplo, en L κ∞ , un único cuantificador universal o existencial puede unir arbitrariamente muchas variables simultáneamente. De manera similar, la lógica L κλ permite la cuantificación simultánea sobre menos de λ variables, así como conjunciones y disyunciones de tamaño menor que κ.
La lógica de punto fijo extiende la lógica de primer orden al agregar el cierre debajo de los puntos menos fijos de los operadores positivos. [32]
El rasgo característico de la lógica de primer orden es que los individuos pueden cuantificarse, pero no los predicados. Por lo tanto
es una fórmula legal de primer orden, pero
no lo es, en la mayoría de las formalizaciones de la lógica de primer orden. La lógica de segundo orden amplía la lógica de primer orden al agregar el último tipo de cuantificación. Otras lógicas de orden superior permiten la cuantificación sobre tipos incluso superiores a los que permite la lógica de segundo orden. Estos tipos superiores incluyen relaciones entre relaciones, funciones de relaciones a relaciones entre relaciones y otros objetos de tipo superior. Así, el "primero" en la lógica de primer orden describe el tipo de objetos que se pueden cuantificar.
A diferencia de la lógica de primer orden, para la que solo se estudia una semántica, existen varias semánticas posibles para la lógica de segundo orden. La semántica más comúnmente empleada para la lógica de segundo y orden superior se conoce como semántica completa . La combinación de cuantificadores adicionales y la semántica completa de estos cuantificadores hace que la lógica de orden superior sea más fuerte que la lógica de primer orden. En particular, la relación de consecuencia lógica (semántica) para la lógica de segundo orden y la lógica de orden superior no es semidecidible; No existe un sistema de deducción eficaz para la lógica de segundo orden que sea sólido y completo bajo una semántica completa.
La lógica de segundo orden con semántica completa es más expresiva que la lógica de primer orden. Por ejemplo, es posible crear sistemas de axiomas en lógica de segundo orden que caractericen de manera única los números naturales y la línea real. El costo de esta expresividad es que las lógicas de segundo orden y de orden superior tienen menos propiedades metálicas atractivas que la lógica de primer orden. Por ejemplo, el teorema de Löwenheim-Skolem y el teorema de compacidad de la lógica de primer orden se vuelven falsos cuando se generalizan a lógicas de orden superior con semántica completa.
La demostración automatizada de teoremas se refiere al desarrollo de programas informáticos que buscan y encuentran derivaciones (demostraciones formales) de teoremas matemáticos. [33] Encontrar derivaciones es una tarea difícil porque el espacio de búsqueda puede ser muy grande; una búsqueda exhaustiva de cada posible derivación es teóricamente posible pero computacionalmente inviable para muchos sistemas de interés en matemáticas. Por tanto , se desarrollan funciones heurísticas complicadas para intentar encontrar una derivación en menos tiempo que una búsqueda ciega. [ cita requerida ]
El área relacionada de verificación de pruebas automatizada utiliza programas de computadora para verificar que las pruebas creadas por humanos sean correctas. A diferencia de los complicados probadores de teoremas automatizados, los sistemas de verificación pueden ser lo suficientemente pequeños como para que su exactitud se pueda verificar tanto a mano como a través de la verificación automatizada del software. Esta validación del verificador de pruebas es necesaria para dar confianza en que cualquier derivación etiquetada como "correcta" es realmente correcta.
Algunos verificadores de pruebas, como Metamath , insisten en tener una derivación completa como entrada. Otros, como Mizar e Isabelle , toman un boceto de prueba bien formateado (que aún puede ser muy largo y detallado) y completan las piezas faltantes haciendo búsquedas de prueba simples o aplicando procedimientos de decisión conocidos: la derivación resultante es luego verificada por un "núcleo" de núcleo pequeño. Muchos de estos sistemas están destinados principalmente a un uso interactivo por parte de matemáticos humanos: estos se conocen como asistentes de prueba . También pueden usar lógicas formales que son más fuertes que la lógica de primer orden, como la teoría de tipos. Debido a que una derivación completa de cualquier resultado no trivial en un sistema deductivo de primer orden será extremadamente larga para que la escriba un humano, [34] Los resultados a menudo se formalizan como una serie de lemas, para los cuales se pueden construir derivaciones por separado.
Los probadores de teoremas automatizados también se utilizan para implementar la verificación formal en la informática. En este contexto, los probadores de teoremas se utilizan para verificar la corrección de los programas y del hardware, como los procesadores, con respecto a una especificación formal . Debido a que dicho análisis requiere mucho tiempo y, por lo tanto, es costoso, generalmente se reserva para proyectos en los que un mal funcionamiento tendría graves consecuencias humanas o financieras.
Para el problema de la verificación del modelo , se sabe que los algoritmos eficientes deciden si una estructura finita de entrada satisface una fórmula de primer orden, además de los límites de complejidad computacional : ver Verificación de modelos § Lógica de primer orden .