Degradado

En cálculo vectorial , el gradiente de una función diferenciable $f con$ valores escalares de varias variables es el campo vectorial (o función con valores vectoriales ) ${\ Displaystyle \ nabla f}$ cuyo valor en un punto ${\ Displaystyle p}$ es el vector ^[a] cuyos componentes son las derivadas parciales de ${\ Displaystyle f}$ a ${\ Displaystyle p}$ . ^[1]^[2]^[3]^[4]^[5]^[6]^[7]^[8]^[9] Es decir, para ${\ Displaystyle f \ colon \ mathbb {R} ^ {n} \ to \ mathbb {R}}$ , su gradiente ${\ Displaystyle \ nabla f \ colon \ mathbb {R} ^ {n} \ to \ mathbb {R} ^ {n}}$ se define en el punto ${\ Displaystyle p = (x_ {1}, \ ldots, x_ {n})}$ en el espacio n- dimensional como el vector: ^[b]

El gradiente, representado por las flechas azules, denota la dirección de mayor cambio de una función escalar. Los valores de la función se representan en escala de grises y aumentan de valor de blanco (bajo) a oscuro (alto).

{\ Displaystyle \ nabla f (p) = {\ begin {bmatrix} {\ frac {\ partial f} {\ partial x_ {1}}} (p) \\\ vdots \\ {\ frac {\ partial f} {\ partial x_ {n}}} (p) \ end {bmatrix}}.}

El símbolo nabla ${\ Displaystyle \ nabla}$ , escrito como un triángulo invertido y pronunciado "del", denota el operador diferencial vectorial .

El gradiente es dual a la derivada total ${\ displaystyle df}$ : el valor del gradiente en un punto es un vector tangente - un vector en cada punto; mientras que el valor de la derivada en un punto es un vector co tangente , una función lineal sobre los vectores. ^[c] Se relacionan en que el producto de punto de la pendiente de $f$ en un punto $p$ con otra tangente vector $v$ es igual a la derivada direccional de $f$ en $p$ de la función a lo largo de $v$ ; es decir, ${\ estilo de texto \ nabla f (p) \ cdot \ mathbf {v} = {\ frac {\ parcial f} {\ parcial \ mathbf {v}}} (p) = df _ {\ mathbf {v}} (p) }$ .

El vector de gradiente se puede interpretar como la "dirección y tasa de aumento más rápido". Si el gradiente de una función no es cero en un punto $p$ , la dirección del gradiente es la dirección en la que la función aumenta más rápidamente desde $p$ , y la magnitud del gradiente es la tasa de aumento en esa dirección, la mayor derivada direccional absoluta . ^[10]^[11]^[12]^[13]^[14]^[15]^[16] Además, el gradiente es el vector cero en un punto si y solo si es un punto estacionario (donde la derivada desaparece). Por tanto, el gradiente juega un papel fundamental en la teoría de la optimización , donde se utiliza para maximizar una función mediante el ascenso del gradiente .

El gradiente admite múltiples generalizaciones a funciones más generales sobre variedades ; ver § Generalizaciones .

Motivación

El gradiente de la función 2D

f (x, y) = xe - (x 2 + y 2)

se traza como flechas azules sobre el gráfico de pseudocolor de la función.

Considere una habitación donde la temperatura está dada por un campo escalar , $T$ , por lo que en cada punto $(x, y, z)$ la temperatura es $T (x, y, z)$ , independiente del tiempo. En cada punto de la habitación, el gradiente de $T$ en ese punto mostrará la dirección en la que la temperatura aumenta más rápidamente, alejándose de $(x, y, z)$ . La magnitud del gradiente determinará qué tan rápido aumenta la temperatura en esa dirección.

Considere una superficie cuya altura sobre el nivel del mar en el punto $(x, y)$ es $H (x, y)$ . El gradiente de $H$ en un punto es un vector que apunta plano en la dirección de la pendiente más pronunciada o grado en ese punto. La pendiente de la pendiente en ese punto viene dada por la magnitud del vector de gradiente.

El gradiente también se puede usar para medir cómo cambia un campo escalar en otras direcciones, en lugar de solo la dirección del mayor cambio, tomando un producto escalar . Suponga que la pendiente más pronunciada de una colina es del 40%. Una carretera que va directamente cuesta arriba tiene una pendiente del 40%, pero una carretera que rodea la colina en un ángulo tendrá una pendiente menos profunda. Por ejemplo, si la carretera forma un ángulo de 60 ° desde la dirección cuesta arriba (cuando ambas direcciones se proyectan en el plano horizontal), la pendiente a lo largo de la carretera será el producto escalar entre el vector de gradiente y un vector unitario a lo largo de la carretera. , es decir, 40% veces el coseno de 60 °, o 20%.

De manera más general, si la función de altura de la colina $H$ es diferenciable , entonces el gradiente de $H$ punteado con un vector unitario da la pendiente de la colina en la dirección del vector, la derivada direccional de $H a lo$ largo del vector unitario.

Notación

El gradiente de una función ${\ Displaystyle f}$ en el punto ${\ Displaystyle a}$ generalmente se escribe como ${\ Displaystyle \ nabla f (a)}$ . También puede estar indicado por cualquiera de los siguientes:

${\ Displaystyle {\ vec {\ nabla}} f (a)}$ : para enfatizar la naturaleza vectorial del resultado.
$graduado f$
${\ estilo de visualización \ izquierda. {\ frac {\ f parcial} {\ parcial x}} \ derecha | _ {x = a}}$
${\ estilo de visualización \ parcial _ {i} f}$ y ${\ Displaystyle f_ {i}}$ : Notación de Einstein .

Definición

El gradiente de la función

f (x, y) = - (cos 2 x + cos 2 y) 2

representado como un campo vectorial proyectado en el plano inferior.

El gradiente (o campo vectorial gradiente) de una función escalar $f (x 1, x 2, x 3,\dots, x n)$ se denota $\nabla f$ o $\nabla \to f$ donde $\nabla$ ( nabla ) denota el operador diferencial vectorial , del . La notación $grad f$ también se usa comúnmente para representar el gradiente. El gradiente de $f$ se define como el campo vectorial único cuyo producto escalar con cualquier vector $v$ en cada punto $x$ es la derivada direccional de $f a lo$ largo de $v$ . Es decir,

{\ Displaystyle {\ big (} \ nabla f (x) {\ big)} \ cdot \ mathbf {v} = D _ {\ mathbf {v}} f (x).}

Formalmente, el gradiente es dual con la derivada; ver relación con derivada .

Cuando una función también depende de un parámetro como el tiempo, el gradiente a menudo se refiere simplemente al vector de sus derivadas espaciales solamente (ver Gradiente espacial ).

La magnitud y la dirección del vector de gradiente son independientes de la representación de coordenadas particular . ^[17]^[18]

Coordenadas cartesianas

En el sistema de coordenadas cartesiano tridimensional con una métrica euclidiana , el gradiente, si existe, viene dado por:

{\ Displaystyle \ nabla f = {\ frac {\ parcial f} {\ parcial x}} \ mathbf {i} + {\ frac {\ parcial f} {\ parcial y}} \ mathbf {j} + {\ frac {\ parcial f} {\ parcial z}} \ mathbf {k},}

donde $i$ , $j$ , $k$ son los vectores unitarios estándar en las direcciones de las coordenadas $x$ , $y$ y $z$ , respectivamente. Por ejemplo, el gradiente de la función

{\ Displaystyle f (x, y, z) = 2x + 3y ^ {2} - \ sin (z)}

es

{\ Displaystyle \ nabla f = 2 \ mathbf {i} + 6y \ mathbf {j} - \ cos (z) \ mathbf {k}.}

En algunas aplicaciones, se acostumbra representar el gradiente como un vector de fila o de columna de sus componentes en un sistema de coordenadas rectangular; este artículo sigue la convención de que el gradiente es un vector de columna, mientras que la derivada es un vector de fila.

Coordenadas cilíndricas y esféricas

En coordenadas cilíndricas con una métrica euclidiana, el gradiente está dado por: ^[19]

{\ Displaystyle \ nabla f (\ rho, \ varphi, z) = {\ frac {\ parcial f} {\ parcial \ rho}} \ mathbf {e} _ {\ rho} + {\ frac {1} {\ rho}} {\ frac {\ parcial f} {\ parcial \ varphi}} \ mathbf {e} _ {\ varphi} + {\ frac {\ parcial f} {\ parcial z}} \ mathbf {e} _ { z},}

donde $ρ$ es la distancia axial, $φ$ es el azimutal o ángulo azimutal, $z$ es la coordenada axial, y $e ρ$ , $e φ$ y $e z$ son vectores unitarios apuntando a lo largo de las direcciones de coordenadas.

En coordenadas esféricas , el gradiente viene dado por: ^[19]

{\ Displaystyle \ nabla f (r, \ theta, \ varphi) = {\ frac {\ parcial f} {\ parcial r}} \ mathbf {e} _ {r} + {\ frac {1} {r}} {\ frac {\ parcial f} {\ parcial \ theta}} \ mathbf {e} _ {\ theta} + {\ frac {1} {r \ sin \ theta}} {\ frac {\ parcial f} {\ parcial \ varphi}} \ mathbf {e} _ {\ varphi},}

donde $r$ es la distancia radial, $φ$ es el ángulo azimutal y $θ$ es el ángulo polar, y $e r$ , $e θ$ y $e φ$ son nuevamente vectores unitarios locales que apuntan en las direcciones de las coordenadas (es decir, la base covariante normalizada ).

Para conocer el gradiente en otros sistemas de coordenadas ortogonales , consulte Coordenadas ortogonales (operadores diferenciales en tres dimensiones) .

Coordenadas generales

Consideramos coordenadas generales , que escribimos como $x 1,\dots, x i,\dots, x n$ , donde $n$ es el número de dimensiones del dominio. Aquí, el índice superior se refiere a la posición en la lista de la coordenada o componente, por lo que $x 2 se$ refiere al segundo componente, no a la cantidad $x al$ cuadrado. La variable índice $i se$ refiere a un elemento arbitrario $x i$ . Usando la notación de Einstein , el gradiente se puede escribir como:

{\ Displaystyle \ nabla f = {\ frac {\ parcial f} {\ parcial x ^ {i}}} g ^ {ij} \ mathbf {e} _ {j}}

(Tenga en cuenta que su dual es

{\ Displaystyle \ mathrm {d} f = {\ frac {\ parcial f} {\ parcial x ^ {i}}} \ mathbf {e} ^ {i}}

),

dónde ${\ Displaystyle \ mathbf {e} _ {i} = \ parcial \ mathbf {x} / \ parcial x ^ {i}}$ y ${\ Displaystyle \ mathbf {e} ^ {i} = \ mathrm {d} x ^ {i}}$ se refieren a las bases covariantes y contravariantes locales no normalizadas respectivamente, ${\ Displaystyle g ^ {ij}}$ es el tensor métrico inverso , y la convención de suma de Einstein implica la suma de i y j .

Si las coordenadas son ortogonales, podemos expresar fácilmente el gradiente (y el diferencial ) en términos de las bases normalizadas, a las que nos referimos como ${\ Displaystyle {\ hat {\ mathbf {e}}} _ {i}}$ y ${\ Displaystyle {\ hat {\ mathbf {e}}} ^ {i}}$ , utilizando los factores de escala (también conocidos como coeficientes de Lamé ) ${\ Displaystyle h_ {i} = \ lVert \ mathbf {e} _ {i} \ rVert = 1 \, / \ lVert \ mathbf {e} ^ {i} \ rVert}$ :

{\ Displaystyle \ nabla f = \ sum _ {i = 1} ^ {n} \, {\ frac {\ parcial f} {\ parcial x ^ {i}}} {\ frac {1} {h_ {i} }} \ mathbf {\ hat {e}} _ {i}}

( y

{\ Displaystyle \ mathrm {d} f = \ sum _ {i = 1} ^ {n} \, {\ frac {\ parcial f} {\ parcial x ^ {i}}} {\ frac {1} {h_ {i}}} \ mathbf {\ hat {e}} ^ {i}}

),

donde no podemos usar la notación de Einstein, ya que es imposible evitar la repetición de más de dos índices. A pesar del uso de índices superiores e inferiores, ${\ Displaystyle \ mathbf {\ hat {e}} _ {i}}$ , ${\ Displaystyle \ mathbf {\ hat {e}} ^ {i}}$ , y ${\ Displaystyle h_ {i}}$ no son contravariantes ni covariantes.

La última expresión evalúa las expresiones dadas anteriormente para coordenadas cilíndricas y esféricas.

Gradiente y derivada o diferencial

El gradiente está estrechamente relacionado con el (total) derivado ( diferencial (total) ) ${\ displaystyle df}$ : se transponen ( duales ) entre sí. Usando la convención que vectores en ${\ Displaystyle \ mathbb {R} ^ {n}}$ están representados por vectores de columna , y que los covectores (mapas lineales ${\ Displaystyle \ mathbb {R} ^ {n} \ to \ mathbb {R}}$ ) están representados por vectores de fila , ^[a] el gradiente ${\ Displaystyle \ nabla f}$ y la derivada ${\ displaystyle df}$ se expresan como un vector de columna y fila, respectivamente, con los mismos componentes, pero se transponen entre sí:

{\ Displaystyle \ nabla f (p) = {\ begin {bmatrix} {\ frac {\ partial f} {\ partial x_ {1}}} (p) \\\ vdots \\ {\ frac {\ partial f} {\ partial x_ {n}}} (p) \ end {bmatrix}};}

{\ displaystyle df_ {p} = {\ begin {bmatrix} {\ frac {\ parcial f} {\ parcial x_ {1}}} (p) y \ cdots & {\ frac {\ parcial f} {\ parcial x_ {n}}} (p) \ end {bmatrix}}.}

Si bien ambos tienen los mismos componentes, difieren en el tipo de objeto matemático que representan: en cada punto, la derivada es un vector cotangente , una forma lineal ( covector ) que expresa cuánto cambia la salida (escalar) para un infinitesimal dado. cambio en la entrada (vector), mientras que en cada punto, el gradiente es un vector tangente , que representa un cambio infinitesimal en la entrada (vector). En los símbolos, el degradado es un elemento del espacio tangente en un punto, ${\ Displaystyle \ nabla f (p) \ in T_ {p} \ mathbb {R} ^ {n}}$ , mientras que la derivada es un mapa del espacio tangente a los números reales, ${\ Displaystyle df_ {p} \ colon T_ {p} \ mathbb {R} ^ {n} \ to \ mathbb {R}}$ . Los espacios tangentes en cada punto de ${\ Displaystyle \ mathbb {R} ^ {n}}$ se puede identificar "naturalmente" ^[d] con el espacio vectorial ${\ Displaystyle \ mathbb {R} ^ {n}}$ en sí mismo, y de manera similar, el espacio cotangente en cada punto se puede identificar naturalmente con el espacio vectorial dual ${\ Displaystyle (\ mathbb {R} ^ {n}) ^ {*}}$ de covectors; por lo tanto, el valor del gradiente en un punto se puede pensar en un vector en el original ${\ Displaystyle \ mathbb {R} ^ {n}}$ , no solo como un vector tangente.

Computacionalmente, dado un vector tangente, el vector se puede multiplicar por la derivada (como matrices), que es igual a tomar el producto escalar con el gradiente:

{\ Displaystyle (df_ {p}) (v) = {\ begin {bmatrix} {\ frac {\ partial f} {\ partial x_ {1}}} (p) & \ cdots & {\ frac {\ partial f } {\ partial x_ {n}}} (p) \ end {bmatrix}} {\ begin {bmatrix} v_ {1} \\\ vdots \\ v_ {n} \ end {bmatrix}} = \ sum _ { i = 1} ^ {n} {\ frac {\ parcial f} {\ parcial x_ {i}}} (p) v_ {i} = {\ begin {bmatrix} {\ frac {\ parcial f} {\ parcial x_ {1}}} (p) \\\ vdots \\ {\ frac {\ parcial f} {\ parcial x_ {n}}} (p) \ end {bmatrix}} \ cdot {\ begin {bmatrix} v_ {1} \\\ vdots \\ v_ {n} \ end {bmatrix}} = \ nabla f (p) \ cdot v}

Derivado diferencial o (exterior)

La mejor aproximación lineal a una función diferenciable

{\ Displaystyle f \ colon \ mathbb {R} ^ {n} \ to \ mathbb {R}}

en un punto $x$ en $R n$ hay un mapa lineal de $R n$ a $R$ que a menudo se denota por $df x$ o $Df (x)$ y se denomina derivada diferencial o (total) de $f$ en $x$ . La función $df$ , que mapea $x$ a $df x$ , se llama derivada diferencial (total) o exterior de $f$ y es un ejemplo de una forma diferencial 1 .

Así como la derivada de una función de una sola variable representa la pendiente de la tangente a la gráfica de la función, ^[20] la derivada direccional de una función en varias variables representa la pendiente del hiperplano tangente en la dirección del vector.

El gradiente está relacionado con el diferencial por la fórmula

{\ Displaystyle (\ nabla f) _ {x} \ cdot v = df_ {x} (v)}

para cualquier $v \in R n$ , donde ${\ Displaystyle \ cdot}$ es el producto escalar : tomar el producto escalar de un vector con el gradiente es lo mismo que tomar la derivada direccional a lo largo del vector.

Si $R n$ se ve como el espacio de (dimensión $n$ ) vectores columna (de números reales), entonces se puede considerar $df$ como el vector fila con componentes

{\ estilo de visualización \ izquierda ({\ frac {\ f parcial} {\ x parcial_ {1}}}, \ puntos, {\ frac {\ f parcial} {\ x parcial_ {n}}} \ derecha),}

de modo que $df x (v)$ viene dado por multiplicación de matrices . Suponiendo la métrica euclidiana estándar en $R n$ , el gradiente es entonces el vector de columna correspondiente, es decir,

{\ Displaystyle (\ nabla f) _ {i} = df_ {i} ^ {\ mathsf {T}}.}

Aproximación lineal a una función

La mejor aproximación lineal a una función se puede expresar en términos del gradiente, en lugar de la derivada. El gradiente de una función $f$ del espacio euclidiano $R n$ a $R$ en cualquier punto particular $x 0$ en $R n$ caracteriza a la mejor aproximación lineal a $f$ en $x 0$ . La aproximación es la siguiente:

{\ Displaystyle f (x) \ approx f (x_ {0}) + (\ nabla f) _ {x_ {0}} \ cdot (x-x_ {0})}

para $x$ cerca de $x 0$ , donde $(\nabla f) x 0$ es el gradiente de $f$ calculado en $x 0$ , y el punto denota el producto escalar en $R n$ . Esta ecuación es equivalente a los dos primeros términos en la expansión de la serie de Taylor multivariable de $f$ en $x 0$ .

Gradiente como "derivado"

Sea $U$ un conjunto abierto en $R n$ . Si la función $f : U \to R$ es derivable , entonces el diferencial de $f$ es la derivada (Fréchet) de $f$ . Así $\nabla f$ es una función de $U$ al espacio $R n$ tal que

{\ Displaystyle \ lim _ {h \ to 0} {\ frac {| f (x + h) -f (x) - \ nabla f (x) \ cdot h |} {\ | h \ |}} = 0 ,}

donde · es el producto escalar.

Como consecuencia, las propiedades habituales de la derivada se mantienen para el gradiente, aunque el gradiente no es una derivada en sí misma, sino más bien dual a la derivada:

Linealidad

El gradiente es lineal en el sentido de que si $f$ y $g$ son dos funciones de valor real diferenciables en el punto $a \in R n$ , y $α$ y $β$ son dos constantes, entonces $αf + βg$ es diferenciable en $a$ , y además

{\ Displaystyle \ nabla \ left (\ alpha f + \ beta g \ right) (a) = \ alpha \ nabla f (a) + \ beta \ nabla g (a).}

Regla del producto

Si $f$ y $g$ son funciones de valor real diferenciables en un punto $a \in R n$ , entonces la regla del producto afirma que el producto $fg$ es diferenciable en $a$ , y

{\ Displaystyle \ nabla (fg) (a) = f (a) \ nabla g (a) + g (a) \ nabla f (a).}

Cadena de reglas

Suponga que $f : A \to R$ es una función de valor real definida en un subconjunto $A$ de $R n$ , y que $f$ es derivable en un punto $a$ . Hay dos formas de la regla de la cadena que se aplican al degradado. Primero, suponga que la función $g$ es una curva paramétrica ; es decir, una función $g : I \to R n$ mapea un subconjunto $I \subset R$ en $R n$ . Si $g$ es derivable en un punto $c \in I$ tal que $g (c) = a$ , entonces

{\ Displaystyle (f \ circ g) '(c) = \ nabla f (a) \ cdot g' (c),}

donde ∘ es el operador de composición : $(f \circ g) (x) = f (g (x))$ .

De manera más general, si en cambio $I \subset R k$ , entonces se cumple lo siguiente:

{\ Displaystyle \ nabla (f \ circ g) (c) = {\ big (} Dg (c) {\ big)} ^ {\ mathsf {T}} {\ big (} \ nabla f (a) {\ grande )},}

donde $(Dg)$ ^T denota la matriz jacobiana transpuesta .

Para la segunda forma de la regla de la cadena, supongamos que $h : I \to R$ es una verdadera función de valor en un subconjunto $I$ de $R$ , y que $h$ es diferenciable en el punto $f (un) \in I$ . Luego

{\ Displaystyle \ nabla (h \ circ f) (a) = h '{\ big (} f (a) {\ big)} \ nabla f (a).}

Otras propiedades y aplicaciones

Conjuntos de niveles

Una superficie nivelada, o isosuperficie , es el conjunto de todos los puntos donde alguna función tiene un valor dado.

Si $f$ es derivable, entonces el producto $escalar (\nabla f) x \cdot v$ del gradiente en un punto $x$ con un vector $v$ da la derivada direccional de $f$ en $x$ en la dirección $v$ . De ello se deduce que en este caso el gradiente de $f$ es ortogonal a los conjuntos de niveles de $f$ . Por ejemplo, una superficie nivelada en un espacio tridimensional se define mediante una ecuación de la forma $F (x, y, z) = c$ . El gradiente de $F$ es entonces normal a la superficie.

De manera más general, cualquier hipersuperficie incrustada en una variedad de Riemann puede cortarse mediante una ecuación de la forma $F$ $($ $P$ $) = 0$ tal que $dF$ no sea cero en ninguna parte. El gradiente de $F$ es entonces normal a la hipersuperficie.

De manera similar, una hipersuperficie algebraica afín puede definirse mediante una ecuación $F (x 1, ..., x n) = 0$ , donde $F$ es un polinomio. El gradiente de $F$ es cero en un punto singular de la hipersuperficie (esta es la definición de un punto singular). En un punto no singular, es un vector normal distinto de cero.

Campos vectoriales conservadores y el teorema del gradiente

El gradiente de una función se llama campo de gradiente. Un campo de gradiente (continuo) es siempre un campo vectorial conservador : su integral de línea a lo largo de cualquier camino depende solo de los puntos finales del camino y puede ser evaluado por el teorema del gradiente (el teorema fundamental del cálculo para integrales de línea). Por el contrario, un campo vectorial conservador (continuo) es siempre el gradiente de una función.

Generalizaciones

Jacobiano

La matriz jacobiana es la generalización del gradiente para funciones con valores vectoriales de varias variables y mapas diferenciables entre espacios euclidianos o, más generalmente, variedades . ^[21]^[22] Una generalización adicional para una función entre espacios de Banach es la derivada de Fréchet .

Suponga que $f : ℝ n \to ℝ m$ es una función tal que cada una de sus derivadas parciales de primer orden existen en $ℝ n$ . Entonces la matriz jacobiana de $f$ se define como una matriz $m \times n$ , denotada por ${\ Displaystyle \ mathbf {J} _ {\ mathbb {f}} (\ mathbb {x})}$ o simplemente ${\ Displaystyle \ mathbf {J}}$ . La entrada $(i, j)$ es ${\ Displaystyle \ mathbf {J} _ {ij} = {\ frac {\ parcial f_ {i}} {\ parcial x_ {j}}}}$ . Explícitamente

{\ Displaystyle \ mathbf {J} = {\ begin {bmatrix} {\ dfrac {\ partial \ mathbf {f}} {\ partial x_ {1}}} & \ cdots & {\ dfrac {\ partial \ mathbf {f }} {\ parcial x_ {n}}} \ end {bmatrix}} = {\ begin {bmatrix} \ nabla ^ {\ mathsf {T}} f_ {1} \\\ vdots \\\ nabla ^ {\ mathsf {T}} f_ {m} \ end {bmatrix}} = {\ begin {bmatrix} {\ dfrac {\ partial f_ {1}} {\ partial x_ {1}}} & \ cdots & {\ dfrac {\ parcial f_ {1}} {\ parcial x_ {n}}} \\\ vdots & \ ddots & \ vdots \\ {\ dfrac {\ partial f_ {m}} {\ partial x_ {1}}} & \ cdots & {\ dfrac {\ partial f_ {m}} {\ partial x_ {n}}} \ end {bmatrix}}.}

Gradiente de un campo vectorial

Dado que la derivada total de un campo vectorial es un mapeo lineal de vectores a vectores, es una cantidad tensorial .

En coordenadas rectangulares, el gradiente de un campo vectorial $f = (f 1, f 2, f 3)$ está definido por:

{\ Displaystyle \ nabla \ mathbf {f} = g ^ {jk} {\ frac {\ parcial f ^ {i}} {\ parcial x ^ {j}}} \ mathbf {e} _ {i} \ otimes \ mathbf {e} _ {k},}

(donde se usa la notación sumatoria de Einstein y el producto tensorial de los vectores $e i$ y $e k$ es un tensor diádico de tipo (2,0)). En general, esta expresión es igual a la transposición de la matriz jacobiana:

{\ Displaystyle {\ frac {\ parcial f ^ {i}} {\ parcial x ^ {j}}} = {\ frac {\ parcial (f ^ {1}, f ^ {2}, f ^ {3} )} {\ parcial (x ^ {1}, x ^ {2}, x ^ {3})}}.}

En coordenadas curvilíneas, o más generalmente en una variedad curva , el gradiente involucra símbolos de Christoffel :

{\ Displaystyle \ nabla \ mathbf {f} = g ^ {jk} \ left ({\ frac {\ partial f ^ {i}} {\ partial x ^ {j}}} + {\ Gamma ^ {i}} _ {jl} f ^ {l} \ right) \ mathbf {e} _ {i} \ otimes \ mathbf {e} _ {k},}

donde $g jk$ son los componentes del tensor métrico inverso y $e i$ son los vectores de base de coordenadas.

Expresado de manera más invariable, el gradiente de un campo vectorial $f$ se puede definir mediante la conexión Levi-Civita y el tensor métrico: ^[23]

{\ Displaystyle \ nabla ^ {a} f ^ {b} = g ^ {ac} \ nabla _ {c} f ^ {b},}

donde $\nabla c$ es la conexión.

Variedades de Riemann

Para cualquier función suave $f$ en una variedad de Riemann $(M, g)$ , el gradiente de $f$ es el campo vectorial $\nabla f$ tal que para cualquier campo vectorial $X$ ,

{\ Displaystyle g (\ nabla f, X) = \ partial _ {X} f,}

es decir,

{\ Displaystyle g_ {x} {\ big (} (\ nabla f) _ {x}, X_ {x} {\ big)} = (\ partial _ {X} f) (x),}

donde $g x (,)$ denota el producto interno de los vectores tangentes en $x$ definido por la métrica $g$ y $\partial X f$ es la función que lleva cualquier punto $x \in M$ a la derivada direccional de $f$ en la dirección $X$ , evaluada en $x$ . En otras palabras, en un gráfico de coordenadas $φ$ desde un subconjunto abierto de $M$ a un subconjunto abierto de $R n$ , $(\partial X f) (x)$ viene dado por:

{\ Displaystyle \ sum _ {j = 1} ^ {n} X ^ {j} {\ grande (} \ varphi (x) {\ grande)} {\ frac {\ parcial} {\ parcial x_ {j}} } (f \ circ \ varphi ^ {- 1}) {\ Bigg |} _ {\ varphi (x)},}

donde $X j$ denota el $j-$ ésimo componente de $X$ en este gráfico de coordenadas.

Entonces, la forma local del gradiente toma la forma:

{\ Displaystyle \ nabla f = g ^ {ik} {\ frac {\ partial f} {\ partial x ^ {k}}} {\ textbf {e}} _ {i}.}

Generalizando el caso $M = R n$ , el gradiente de una función está relacionado con su derivada exterior, ya que

{\ Displaystyle (\ partial _ {X} f) (x) = (df) _ {x} (X_ {x}).}

Más precisamente, el gradiente $\nabla f$ es el campo vectorial asociado al diferencial de forma 1 $df$ usando el isomorfismo musical

{\ Displaystyle \ sharp = \ sharp ^ {g} \ colon T ^ {*} M \ to TM}

(llamado "agudo") definido por la métrica $g$ . La relación entre la derivada exterior y el gradiente de una función en $R n$ es un caso especial de esto en el que la métrica es la métrica plana dada por el producto escalar.

Ver también

Rizo
Divergencia
Cuatro gradientes
matriz Hessiana
Gradiente sesgado

Notas

^ a b En este artículo se utiliza la convención de que los vectores de columna representan vectores y los vectores de fila representan covectores, pero la convención opuesta también es común.
^ Estrictamente hablando, el degradado es un campo vectorial ${\ Displaystyle f \ colon \ mathbb {R} ^ {n} \ to T \ mathbb {R} ^ {n}}$ , y el valor del gradiente en un punto es un vector tangente en el espacio tangente en ese punto, ${\ Displaystyle T_ {p} \ mathbb {R} ^ {n}}$ , no es un vector en el espacio original ${\ Displaystyle \ mathbb {R} ^ {n}}$ . Sin embargo, todos los espacios tangentes se pueden identificar naturalmente con el espacio original. ${\ Displaystyle \ mathbb {R} ^ {n}}$ , por lo que no es necesario distinguirlos; ver § Definición y relación con la derivada .
^ El valor del gradiente en un punto se puede considerar como un vector en el espacio original. ${\ Displaystyle \ mathbb {R} ^ {n}}$ , mientras que el valor de la derivada en un punto se puede considerar como un covector en el espacio original: un mapa lineal ${\ Displaystyle \ mathbb {R} ^ {n} \ to \ mathbb {R}}$ .
^ Informalmente, identificado "naturalmente" significa que esto se puede hacer sin tomar decisiones arbitrarias. Esto se puede formalizar con una transformación natural .

Referencias

^ Bachman (2007 , p. 76)
^ Beauregard y Fraleigh (1973 , p. 84)
^ Downing (2010 , p. 316)
^ Harper (1976 , p. 15)
^ Kreyszig (1972 , p. 307)
^ McGraw-Hill (2007 , p. 196)
^ Moise (1967 , p. 683)
^ Protter y Morrey, Jr. (1970 , p. 714)
^ Swokowski y col. (1994 , pág.1038)
^ Bachman (2007 , p. 77)
^ Downing (2010 , págs. 316–317)
↑ Kreyszig (1972 , p. 309)
^ McGraw-Hill (2007 , p. 196)
^ Moise (1967 , p. 684)
^ Protter y Morrey, Jr. (1970 , p. 715)
^ Swokowski y col. (1994 , págs. 1036,1038–1039)
^ Kreyszig (1972 , págs. 308-309)
^ Stoker (1969 , p. 292)
↑ a b Schey , 1992 , págs. 139-142.
^ Protter y Morrey, Jr. (1970 , págs. 21, 88)
^ Beauregard y Fraleigh (1973 , págs. 87, 248)
^ Kreyszig (1972 , págs. 333,353,496)
^ Dubrovin, Fomenko y Novikov 1991 , págs. 348–349.

Bachman, David (2007), cálculo avanzado desmitificado , Nueva York: McGraw-Hill , ISBN 978-0-07-148121-2
Beauregard, Raymond A .; Fraleigh, John B. (1973), Un primer curso de álgebra lineal: con introducción opcional a grupos, anillos y campos , Boston: Houghton Mifflin Company , ISBN 0-395-14017-X
Downing, Douglas, Ph.D. (2010), Barron's EZ Calculus , Nueva York: Barron's , ISBN 978-0-7641-4461-5
Dubrovin, BA; Fomenko, AT; Novikov, SP (1991). Geometría moderna — Métodos y aplicaciones: Parte I: La geometría de superficies, grupos de transformación y campos . Textos de Posgrado en Matemáticas (2ª ed.). Saltador. ISBN 978-0-387-97663-1.
Harper, Charlie (1976), Introducción a la física matemática , Nueva Jersey: Prentice-Hall , ISBN 0-13-487538-9
Kreyszig, Erwin (1972), Matemáticas de ingeniería avanzada (3.a ed.), Nueva York: Wiley , ISBN 0-471-50728-8
"Enciclopedia de ciencia y tecnología de McGraw Hill". Enciclopedia McGraw-Hill de ciencia y tecnología (10ª ed.). Nueva York: McGraw-Hill . 2007. ISBN 978-0-07-144143-8.
Moise, Edwin E. (1967), Cálculo: completo , Lectura: Addison-Wesley
Protter, Murray H .; Morrey, Jr., Charles B. (1970), Cálculo universitario con geometría analítica (2a ed.), Lectura: Addison-Wesley , LCCN 76087042
Schey, HM (1992). Div, Grad, Curl y All That (2ª ed.). WW Norton. ISBN 0-393-96251-2. OCLC 25048561 .
Stoker, JJ (1969), Geometría diferencial , Nueva York: Wiley , ISBN 0-471-82825-4
Swokowski, Earl W .; Olinick, Michael; Pence, Dennis; Cole, Jeffery A. (1994), Cálculo (6.a ed.), Boston: PWS Publishing Company, ISBN 0-534-93624-5

Otras lecturas

Korn, Theresa M .; Korn, Granino Arthur (2000). Manual de matemáticas para científicos e ingenieros: definiciones, teoremas y fórmulas para referencia y revisión . Publicaciones de Dover. págs. 157–160. ISBN 0-486-41147-8. OCLC 43864234 .

enlaces externos

"Gradiente" . Khan Academy .
Kuptsov, LP (2001) [1994], "Gradient" , Enciclopedia de Matemáticas , EMS Press.
Weisstein, Eric W. "Gradiente" . MathWorld .

[row-column-1] En este artículo se utiliza la convención de que los vectores de columna representan vectores y los vectores de fila representan covectores, pero la convención opuesta también es común.

[11] Estrictamente hablando, el degradado es un campo vectorial ${\ Displaystyle f \ colon \ mathbb {R} ^ {n} \ to T \ mathbb {R} ^ {n}}$ , y el valor del gradiente en un punto es un vector tangente en el espacio tangente en ese punto, ${\ Displaystyle T_ {p} \ mathbb {R} ^ {n}}$ , no es un vector en el espacio original ${\ Displaystyle \ mathbb {R} ^ {n}}$ . Sin embargo, todos los espacios tangentes se pueden identificar naturalmente con el espacio original. ${\ Displaystyle \ mathbb {R} ^ {n}}$ , por lo que no es necesario distinguirlos; ver § Definición y relación con la derivada .

[12] El valor del gradiente en un punto se puede considerar como un vector en el espacio original. ${\ Displaystyle \ mathbb {R} ^ {n}}$ , mientras que el valor de la derivada en un punto se puede considerar como un covector en el espacio original: un mapa lineal ${\ Displaystyle \ mathbb {R} ^ {n} \ to \ mathbb {R}}$ .

[23] Informalmente, identificado "naturalmente" significa que esto se puede hacer sin tomar decisiones arbitrarias. Esto se puede formalizar con una transformación natural .

[2] Bachman (2007 , p. 76)

[3] Beauregard y Fraleigh (1973 , p. 84)

[4] Downing (2010 , p. 316)

[5] Harper (1976 , p. 15)

[6] Kreyszig (1972 , p. 307)

[7] McGraw-Hill (2007 , p. 196)

[8] Moise (1967 , p. 683)

[9] Protter y Morrey, Jr. (1970 , p. 714)

[10] Swokowski y col. (1994 , pág.1038)

[13] Bachman (2007 , p. 77)

[14] Downing (2010 , págs. 316–317)

[15] Kreyszig (1972 , p. 309)

[16] McGraw-Hill (2007 , p. 196)

[17] Moise (1967 , p. 684)

[18] Protter y Morrey, Jr. (1970 , p. 715)

[19] Swokowski y col. (1994 , págs. 1036,1038–1039)

[20] Kreyszig (1972 , págs. 308-309)

[21] Stoker (1969 , p. 292)

[Schey-1992-22] Schey , 1992 , págs. 139-142.

[24] Protter y Morrey, Jr. (1970 , págs. 21, 88)

[25] Beauregard y Fraleigh (1973 , págs. 87, 248)

[26] Kreyszig (1972 , págs. 333,353,496)

[27] Dubrovin, Fomenko y Novikov 1991 , págs. 348–349.

[a]