Función convexa


En matemáticas , una función de valor real definida en un intervalo n- dimensional se llama convexa si el segmento de línea entre dos puntos cualesquiera en el gráfico de la función se encuentra por encima del gráfico entre los dos puntos. De manera equivalente, una función es convexa si su epígrafe (el conjunto de puntos sobre o sobre la gráfica de la función) es un conjunto convexo . Una función dos veces diferenciable de una sola variable es convexa si y solo si su segunda derivada no es negativa en todo su dominio. [1] Ejemplos bien conocidos de funciones convexas de una sola variable incluyen lafunción cuadrática y la función exponencial . En términos simples, una función convexa se refiere a una función que tiene la forma de una taza., y una función cóncava tiene la forma de una tapa.

Función convexa en un intervalo.
Una función (en negro) es convexa si y solo si la región sobre su gráfico (en verde) es un conjunto convexo .
Una gráfica de la función convexa bivariada x 2 + xy + y 2 .

Las funciones convexas juegan un papel importante en muchas áreas de las matemáticas. Son especialmente importantes en el estudio de problemas de optimización en los que se distinguen por una serie de propiedades convenientes. Por ejemplo, una función estrictamente convexa en un conjunto abierto no tiene más de un mínimo. Incluso en espacios de dimensión infinita, bajo hipótesis adicionales adecuadas, las funciones convexas continúan satisfaciendo tales propiedades y, como resultado, son las funcionales mejor entendidas en el cálculo de variaciones . En la teoría de la probabilidad , una función convexa aplicada al valor esperado de una variable aleatoria siempre está delimitada por encima del valor esperado de la función convexa de la variable aleatoria. Este resultado, conocido como desigualdad de Jensen , se puede utilizar para deducir desigualdades como la desigualdad media aritmética-geométrica y la desigualdad de Hölder .

Visualización de una función convexa y la desigualdad de Jensen

Dejar ser un subconjunto convexo de un espacio vectorial real y sea ser una función.

Luego se llama convexo si y solo si se cumple alguna de las siguientes condiciones equivalentes:

  1. Para todos y todo :
    El lado derecho representa la línea recta entre y en la gráfica de como una función de creciente de a o disminuyendo de a barre esta línea. Del mismo modo, el argumento de la función en el lado izquierdo representa la línea recta entre y en o el -eje de la gráfica de Entonces, esta condición requiere que la línea recta entre cualquier par de puntos en la curva de estar por encima o simplemente cumple con el gráfico. [2]
  2. Para todos y todo tal que :
    La diferencia de esta segunda condición con respecto a la primera condición anterior es que esta condición no incluye los puntos de intersección (por ejemplo, y ) entre la línea recta que pasa por un par de puntos en la curva de (la línea recta está representada por el lado derecho de esta condición) y la curva de la primera condición incluye los puntos de intersección a medida que se convierte en o a o o De hecho, los puntos de intersección no necesitan ser considerados en una condición de convexo usando porque y son siempre verdaderas (por lo que no es útil formar parte de una condición).

El segundo enunciado que caracteriza las funciones convexas que se valoran en la línea real es también la declaración utilizada para definir funciones convexas que se valoran en la recta numérica real extendida donde tal función está permitido (pero no está obligado a) tomar como valor. La primera declaración no se usa porque permite tomar o como valor, en cuyo caso, si o respectivamente, entonces sería indefinido (porque las multiplicaciones y son indefinidos). La suma también está indefinido, por lo que una función convexa extendida de valor real generalmente solo se permite tomar exactamente uno de y como valor.

La segunda declaración también se puede modificar para obtener la definición de convexidad estricta , donde la última se obtiene reemplazando con la estricta desigualdad Explícitamente, el mapa se llama estrictamente convexo si y solo si para todo real y todo tal que :

Una función estrictamente convexa es una función que la línea recta entre cualquier par de puntos en la curva está por encima de la curva excepto por los puntos de intersección entre la línea recta y la curva.

La función se dice que es cóncavo (resp. estrictamente cóncavo ) si ( multiplicado por -1) es convexo (o estrictamente convexo).

El término convexo a menudo se denomina convexo hacia abajo o cóncavo hacia arriba , y el término cóncavo a menudo se denomina cóncavo hacia abajo o convexo hacia arriba . [3] [4] [5] Si el término "convexo" se usa sin una palabra clave "arriba" o "abajo", entonces se refiere estrictamente a un gráfico en forma de taza. Como ejemplo, la desigualdad de Jensen se refiere a una desigualdad que involucra una función convexa o convexa (hacia arriba). [6]

Muchas propiedades de funciones convexas tienen la misma formulación simple para funciones de muchas variables que para funciones de una variable. Vea a continuación las propiedades para el caso de muchas variables, ya que algunas de ellas no están listadas para funciones de una variable.

Funciones de una variable

  • Suponer es una función de una variable real definida en un intervalo, y sea
(tenga en cuenta que es la pendiente de la línea violeta en el dibujo anterior; la función R es simétrica en significa que R no cambia al intercambiar y ). es convexo si y solo si es monótonamente no decreciente en por cada fijo (o viceversa). Esta caracterización de la convexidad es bastante útil para probar los siguientes resultados.
  • Una función convexa de una variable real definida en algún intervalo abierto C es continua en admite derivadas izquierda y derecha , y estas son monótonamente no decrecientes . Como consecuencia,es diferenciable en todos, pero en muchos puntos contables , el conjunto en el queno es diferenciable, sin embargo, puede ser denso. Si está cerrado, entonces puede no ser continuo en los puntos finales de (se muestra un ejemplo en la sección de ejemplos ).
  • Una función diferenciable de una variable es convexa en un intervalo si y solo si su derivada es monótonamente no decreciente en ese intervalo. Si una función es diferenciable y convexa, también es continuamente diferenciable .
  • Una función diferenciable de una variable es convexa en un intervalo si y solo si su gráfica se encuentra por encima de todas sus tangentes : [7] : 69
para todos los x y y en el intervalo.
  • Una función dos veces diferenciable de una variable es convexa en un intervalo si y solo si su segunda derivada no es negativa allí; esto da una prueba práctica de convexidad. Visualmente, una función convexa dos veces diferenciable "se curva hacia arriba", sin ninguna curva hacia el otro lado ( puntos de inflexión ). Si su segunda derivada es positiva en todos los puntos, entonces la función es estrictamente convexa, pero la inversa no se cumple. Por ejemplo, la segunda derivada de es , que es cero para pero es estrictamente convexo.
    • Esta propiedad y la propiedad anterior en términos de "... su derivada es monótonamente no decreciente ..." no son iguales ya que si no es negativo en un intervalo luego es monótonamente no decreciente en mientras que su inverso no es cierto, por ejemplo, es monótonamente no decreciente en mientras que su derivada no está definido en algunos puntos de .
  • Si es una función convexa de una variable real, y , luego es superaditivo en los reales positivos , es decir para números reales positivos y .
  • Una función es convexa en el punto medio de un intervalo. si por todos
Esta condición es solo un poco más débil que la convexidad. Por ejemplo, una función medible de Lebesgue de valor real que es convexa de punto medio es convexa: este es un teorema de Sierpinski . [8] En particular, una función continua que sea convexa en el punto medio será convexa.

Funciones de varias variables

  • Una función valorado en los números reales extendidos es convexo si y solo si su epígrafe es un conjunto convexo.
  • Una función diferenciable definido en un dominio convexo es convexo si y solo si se mantiene para todos en el dominio.
  • Una función dos veces diferenciable de varias variables es convexa en un conjunto convexo si y solo si su matriz hessiana de segundas derivadas parciales es semidefinida positiva en el interior del conjunto convexo.
  • Para una función convexa los conjuntos de subnivel y con son conjuntos convexos. Una función que satisface esta propiedad se llama función cuasiconvexa y puede no ser una función convexa.
  • En consecuencia, el conjunto de minimizadores globales de una función convexa es un conjunto convexo: - convexo.
  • Cualquier mínimo local de una función convexa es también un mínimo global . Una función estrictamente convexa tendrá como máximo un mínimo global. [9]
  • La desigualdad de Jensen se aplica a todas las funciones convexas.. Si es una variable aleatoria que toma valores en el dominio de luego donde E denota la expectativa matemática . De hecho, las funciones convexas son exactamente aquellas que satisfacen la hipótesis de la desigualdad de Jensen .
  • Una función homogénea de primer orden de dos variables positivas y (es decir, una función que satisface por todo positivo real ) que es convexo en una variable debe ser convexo en la otra variable. [10]

  • es cóncavo si y solo si es convexo.
  • Sumas ponderadas no negativas:
    • Si y son todos convexos, entonces también lo es . En particular, la suma de dos funciones convexas es convexa.
    • esta propiedad se extiende también a sumas infinitas, integrales y valores esperados (siempre que existan).
  • Máximo de elementos: dejar ser una colección de funciones convexas. Luegoes convexo. El dominio dees la colección de puntos donde la expresión es finita. Casos especiales importantes:
    • Si son funciones convexas, entonces también lo es
    • Teorema de Danskin : si es convexo en luego es convexo en incluso si C no es un conjunto convexo.
  • Composición:
    • Si f y g son funciones convexas y g no es decreciente en un dominio univariante, entonceses convexo. Como ejemplo, si es convexo, entonces también lo es . porque es convexo y aumenta monótonamente.
    • Si f es cóncava y g es convexa y no aumenta en un dominio univariante, entonces es convexo.
    • La convexidad es invariante en mapas afines: es decir, si f es convexa con dominio, entonces también lo es , dónde con dominio .
  • Minimización: Si es convexo en luego es convexo en x , siempre que C sea ​​un conjunto convexo y que
  • Si es convexo, entonces su perspectiva con dominio es convexo.

El concepto de convexidad fuerte extiende y parametriza la noción de convexidad estricta. Una función fuertemente convexa también es estrictamente convexa, pero no al revés.

Una función diferenciable se llama fuertemente convexa con parámetro m > 0 si la siguiente desigualdad se cumple para todos los puntos x , y en su dominio: [11]

o, de manera más general,

dónde es cualquier norma . Algunos autores, como [12], se refieren a funciones que satisfacen esta desigualdad como funciones elípticas .

Una condición equivalente es la siguiente: [13]

No es necesario que una función sea diferenciable para ser fuertemente convexa. Una tercera definición [13] para una función fuertemente convexa, con parámetro m , es que, para todo x , y en el dominio y

Observe que esta definición se acerca a la definición de convexidad estricta cuando m → 0, y es idéntica a la definición de una función convexa cuando m = 0. A pesar de esto, existen funciones que son estrictamente convexas pero no fuertemente convexas para cualquier m > 0 ( ver ejemplo a continuación).

Si la función es dos veces diferenciable de forma continua, entonces es fuertemente convexo con el parámetro m si y solo sipara todo x en el dominio, donde I es la identidad yes la matriz de Hesse , y la desigualdad significa que es positivo semi-definido . Esto equivale a exigir que el valor propio mínimo desea ​​al menos m para todo x . Si el dominio es solo la línea real, entonces es solo la segunda derivada entonces la condición se convierte en . Si m = 0, esto significa que el hessiano es semidefinito positivo (o si el dominio es la línea real, significa que), lo que implica que la función es convexa, y quizás estrictamente convexa, pero no muy convexa.

Asumiendo aún que la función es dos veces continuamente diferenciable, se puede demostrar que el límite inferior de implica que es fuertemente convexo. Usando el teorema de Taylor existe

tal que

Luego

por la suposición sobre los valores propios, y por lo tanto recuperamos la segunda ecuación de convexidad fuerte anterior.

Una función es fuertemente convexa con el parámetro m si y solo si la función

es convexo.

La distinción entre convexo, estrictamente convexo y fuertemente convexo puede ser sutil a primera vista. Si es dos veces diferenciable de forma continua y el dominio es la línea real, entonces podemos caracterizarlo de la siguiente manera:

convexo si y solo si para todo x .
estrictamente convexo si para todo x (nota: esto es suficiente, pero no necesario).
fuertemente convexo si y solo si para todo x .

Por ejemplo, deja ser estrictamente convexo, y suponga que hay una secuencia de puntos tal que . Aunque, la función no es muy convexa porque se volverá arbitrariamente pequeño.

Una función dos veces diferenciable de forma continua en un dominio compacto que satisface para todos es fuertemente convexo. La prueba de esta afirmación se deriva del teorema del valor extremo , que establece que una función continua en un conjunto compacto tiene un máximo y un mínimo.

Las funciones fuertemente convexas son en general más fáciles de trabajar que las funciones convexas o estrictamente convexas, ya que son una clase más pequeña. Al igual que las funciones estrictamente convexas, las funciones fuertemente convexas tienen mínimos únicos en conjuntos compactos.

Funciones uniformemente convexas

Una función uniformemente convexa, [14] [15] con módulo, es una función que, para todo x , y en el dominio y t ∈ [0, 1] , satisface

dónde es una función que no es negativa y desaparece solo en 0. Esta es una generalización del concepto de función fuertemente convexa; tomando recuperamos la definición de convexidad fuerte.

Funciones de una variable

  • La función posee , entonces f es una función convexa. También es fuertemente convexo (y por lo tanto estrictamente convexo también), con una fuerte convexidad constante 2.
  • La función posee , entonces f es una función convexa. Es estrictamente convexo, aunque la segunda derivada no es estrictamente positiva en todos los puntos. No es muy convexo.
  • La función de valor absolutoes convexo (como se refleja en la desigualdad del triángulo ), aunque no tiene una derivada en el punto  x  = 0. No es estrictamente convexo.
  • La función por es convexo.
  • La función exponencial es convexo. También es estrictamente convexo, ya que, pero no es fuertemente convexo ya que la segunda derivada puede ser arbitrariamente cercana a cero. De manera más general, la funciónes logarítmicamente convexa si f es una función convexa. En su lugar, a veces se utiliza el término "superconvexo". [dieciséis]
  • La función con dominio [0,1] definido por por es convexo es continuo en el intervalo abierto (0, 1), pero no continuo en 0 y 1.
  • La función x 3 tiene una segunda derivada 6 x ; por tanto, es convexo en el conjunto donde x ≥ 0 y cóncavo en el conjunto donde  x  ≤ 0.
  • Ejemplos de funciones que aumentan monótonamente pero no convexas incluyen y .
  • Ejemplos de funciones que son convexas pero que no aumentan monótonamente incluyen y .
  • La función posee que es mayor que 0 si x > 0, entonces es convexo en el intervalo . Es cóncavo en el intervalo.
  • La función con , es convexo en el intervalo y convexo en el intervalo , pero no convexo en el intervalo , debido a la singularidad en  x  = 0.

Funciones de n variables

  • La función LogSumExp , también llamada función softmax, es una función convexa.
  • La función en el dominio de matrices definidas positivas es convexa. [7] : 74
  • Toda transformación lineal de valor real es convexa pero no estrictamente convexa, ya que si f es lineal, entonces. Esta afirmación también es válida si reemplazamos "convexo" por "cóncavo".
  • Cada función afín de valor real , es decir, cada función de la forma, es a la vez convexa y cóncava.
  • Toda norma es una función convexa, por la desigualdad triangular y la homogeneidad positiva .
  • El radio espectral de una matriz no negativa es una función convexa de sus elementos diagonales. [17]

  • Función cóncava
  • Análisis convexo
  • Conjugado convexo
  • Optimizacion convexa
  • Convexidad geodésica
  • Desigualdad de Hermite-Hadamard
  • Función Invex
  • La desigualdad de Jensen
  • Función K-convexa
  • El teorema de Kachurovskii , que relaciona la convexidad con la monotonicidad de la derivada
  • La desigualdad de Karamata
  • Función logarítmicamente convexa
  • Función pseudoconvexa
  • Función cuasiconvexa
  • Subderivada de una función convexa

  1. ^ "Notas de la conferencia 2" (PDF) . www.stat.cmu.edu . Consultado el 3 de marzo de 2017 .
  2. ^ "Cóncavo hacia arriba y hacia abajo" .
  3. ^ Stewart, James (2015). Cálculo (8ª ed.). Aprendizaje Cengage. págs. 223–224. ISBN 978-1305266643.
  4. ^ W. Hamming, Richard (2012). Métodos de matemáticas aplicadas al cálculo, probabilidad y estadística (edición ilustrada). Corporación de mensajería. pag. 227. ISBN 978-0-486-13887-9. Extracto de la página 227
  5. ^ Uvarov, Vasiliĭ Borisovich (1988). Análisis matemático . Editores Mir. pag. 126-127. ISBN 978-5-03-000500-3.
  6. ^ Prügel-Bennett, Adam (2020). The Probability Companion for Engineering and Computer Science (edición ilustrada). Prensa de la Universidad de Cambridge. pag. 160. ISBN 978-1-108-48053-6. Extracto de la página 160
  7. ^ a b Boyd, Stephen P .; Vandenberghe, Lieven (2004). Optimización convexa (pdf) . Prensa de la Universidad de Cambridge. ISBN 978-0-521-83378-3. Consultado el 15 de octubre de 2011 .
  8. ^ Donoghue, William F. (1969). Distribuciones y transformadas de Fourier . Prensa académica. pag. 12. ISBN 9780122206504. Consultado el 29 de agosto de 2012 .
  9. ^ "Si f es estrictamente convexo en un conjunto convexo, demuestre que no tiene más de 1 mínimo" . Math StackExchange. 21 de marzo de 2013 . Consultado el 14 de mayo de 2016 .
  10. ^ Altenberg, L., 2012. Los operadores lineales positivos resolutivos exhiben el fenómeno de reducción. Actas de la Academia Nacional de Ciencias, 109 (10), págs. 3705-3710.
  11. ^ Dimitri Bertsekas (2003). Análisis y Optimización Convexos . Colaboradores: Angelia Nedic y Asuman E. Ozdaglar. Athena Scientific. pag. 72 . ISBN 9781886529458.
  12. ^ Philippe G. Ciarlet (1989). Introducción al álgebra lineal numérica y optimización . Prensa de la Universidad de Cambridge. ISBN 9780521339841.
  13. ^ a b Yurii Nesterov (2004). Conferencias introductorias sobre optimización convexa: un curso básico . Editores académicos de Kluwer. págs.  63 –64. ISBN 9781402075537.
  14. ^ C. Zalinescu (2002). Análisis convexo en espacios vectoriales generales . World Scientific. ISBN 9812380671.
  15. ^ H. Bauschke y PL Combettes (2011). Análisis convexo y teoría del operador monótono en espacios de Hilbert . Saltador. pag. 144 . ISBN 978-1-4419-9467-7.
  16. ^ Kingman, JFC (1961). "Una propiedad de convexidad de matrices positivas". The Quarterly Journal of Mathematics . 12 : 283-284. doi : 10.1093 / qmath / 12.1.283 .
  17. ^ Cohen, JE, 1981. Convexidad del autovalor dominante de una matriz esencialmente no negativa . Actas de la American Mathematical Society, 81 (4), págs. 657-658.

  • Bertsekas, Dimitri (2003). Análisis y Optimización Convexos . Athena Scientific.
  • Borwein, Jonathan y Lewis, Adrian. (2000). Análisis convexo y optimización no lineal. Saltador.
  • Donoghue, William F. (1969). Distribuciones y transformadas de Fourier . Prensa académica.
  • Hiriart-Urruty, Jean-Baptiste y Lemaréchal, Claude . (2004). Fundamentos del análisis convexo. Berlín: Springer.
  • Krasnosel'skii MA , Rutickii Ya.B. (1961). Funciones convexas y espacios Orlicz . Groningen: P. Noordhoff Ltd.
  • Lauritzen, Niels (2013). Convexidad de pregrado . Publicaciones científicas mundiales.
  • Luenberger, David (1984). Programación lineal y no lineal . Addison-Wesley.
  • Luenberger, David (1969). Optimización por métodos de espacio vectorial . Wiley & Sons.
  • Rockafellar, RT (1970). Análisis convexo . Princeton: Prensa de la Universidad de Princeton.
  • Thomson, Brian (1994). Propiedades simétricas de funciones reales . Prensa CRC.
  • Zălinescu, C. (2002). Análisis convexo en espacios vectoriales generales . River Edge, Nueva Jersey: World Scientific Publishing Co., Inc. págs. Xx + 367. ISBN 981-238-067-1. Señor  1921556 .

  • "Función convexa (de una variable real)" , Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
  • "Función convexa (de una variable compleja)" , Enciclopedia de Matemáticas , EMS Press , 2001 [1994]