introducción a la mecánica hamiltoniana

Antes de comenzar a hablar de la mecánica hamiltoniana, es importante tener fresco el concepto de la transformada de Legendre, para hacerlo más fácil todo, imaginemos que sólo queremos dar respuesta a la siguiente pregunta:

Sea alguna función f(x)f(x). ¿Puedo construir OTRA función con OTRA variable que contenga la misma información?

Es decir:

f(x) A^ g(p) A^ f(x) f(x)\;\xrightarrow{\hat A}\;g(p)\;\xrightarrow{\hat A}\;f(x)

La respuesta es que sí y justamente es la transformada de Legendre la que nos ayuda a hacer eso, tan solo pensemos en la derivada de nuestra función tal que

dfdx=p \frac{df}{dx} = p

donde sabemos que la información de cómo cambia la pendiente de f(x)f(x) está ahora contenida en pp. Para construir g(p)g(p), la transformada de Legendre nos dice que

g(p)=pxf(x) g(p) = px - f(x)

o visto de otra forma más explícita

g(p)=df(x)dxxf(x) g(p) = \frac{df(x)}{dx} x - f(x)

lo que nos permite definir el operador A^\hat{A} tal que A^=[xddx1]\hat{A} = \left[ x\frac{d}{dx} -1 \right], en donde, ahora sí

A^f(x)=g(p) \hat{A}f(x)=g(p)

y además

A^g(p)=f(x) \hat{A}g(p) = f(x)

Esto se ve más bonito cuando se ve geométricamente qué es lo que está pasando. Pero lamentablemente no me quiero meter tanto en eso en este espacio. Sin embargo, si es de interés, hay algunas cosas divertidas aquí: 1, 2.


También, antes de ir a lo que de verdad nos interesa, es importante tener claro que una función f(x1,x2,,xn)f(x_{1},x_{2},\dots,x_{n}) es homogénea de grado rr si, para todo número real λ>0\lambda>0

f(λx1,λx2,, λxn)=λrf(x1,x2,,xn) f(\lambda x_{1}, \lambda x_{2},\dots, \ \lambda x_{n}) = \lambda^{r}f(x_{1},x_{2},\dots,x_{n})

Entonces, ahora podemos hablar de el Teorema de Euler sobre funciones homogéneas.

Este es simplemente que

i=1nxifxi=rf(x1,x2,,xn) \sum_{i=1}^{n} x_{i} \frac{\partial f}{\partial x_{i}} = r \cdot f(x_{1},x_{2},\dots,x_{n})

O, escrito de forma más explícita

x1fx1+x2fx2++xnfxn=rf(x1,x2,,xn) x_{1}\frac{\partial f}{\partial x_{1}} + x_{2}\frac{\partial f}{\partial x_{2}} + \dots + x_{n}\frac{\partial f}{\partial x_{n}} = r \cdot f(x_{1},x_{2},\dots,x_{n})

Esto nos dice que la suma ponderada de las derivadas parciales de la función (donde cada derivada parcial se multiplica por su variable respectiva) es simplemente la función original multiplicada por su grado de homogeneidad.

Con lo anterior en mente, ahora recordemos la definición más fundamental de la energía cinética TT de una partícula de masa mm con velocidad v\mathbf{v}:

T=12mvv=12mv2 T = \frac{1}{2} m \mathbf{v} \cdot \mathbf{v} = \frac{1}{2} m |\mathbf{v}|^2

Aquí, la energía cinética es una función de las componentes de la velocidad. Consideremos estas componentes como las variables de nuestra función.

En coordenadas cartesianas tenemos que

T(vx,vy,vz)=12m(vx2+vy2+vz2) T(v_x, v_y, v_z) = \frac{1}{2} m (v_x^2 + v_y^2 + v_z^2)

Si checamos la homogeneidad, tendríamos que

T(λvx,λvy,λvz)=12m((λvx)2+(λvy)2+(λvz)2) T(\lambda v_x, \lambda v_y, \lambda v_z) = \frac{1}{2} m ((\lambda v_x)^2 + (\lambda v_y)^2 + (\lambda v_z)^2) =12m(λ2vx2+λ2vy2+λ2vz2)=λ2[12m(vx2+vy2+vz2)] = \frac{1}{2} m (\lambda^2 v_x^2 + \lambda^2 v_y^2 + \lambda^2 v_z^2) = \lambda^2 \left[ \frac{1}{2} m (v_x^2 + v_y^2 + v_z^2) \right] =λ2T(vx,vy,vz) = \lambda^2 T(v_x, v_y, v_z)

Por lo que vemos que la energía cinética T(vx,vy,vz)T(v_x, v_y, v_z) es una función homogénea de grado r=2r=2.

En coordenadas esféricas (r,θ,ϕ)(r, \theta, \phi), tenemos que

T(r˙,θ˙,ϕ˙;r,θ)=12m(r˙2+r2θ˙2+r2sin2θϕ˙2) T(\dot{r}, \dot{\theta}, \dot{\phi}; r, \theta) = \frac{1}{2} m (\dot{r}^2 + r^2 \dot{\theta}^2 + r^2 \sin^2\theta \dot{\phi}^2)

Si escalamos las velocidades: (r˙,θ˙,ϕ˙)(λr˙,λθ˙,λϕ˙)(\dot{r}, \dot{\theta}, \dot{\phi}) \rightarrow (\lambda\dot{r}, \lambda\dot{\theta}, \lambda\dot{\phi}):

T(λr˙,λθ˙,λϕ˙;r,θ)=12m((λr˙)2+r2(λθ˙)2+r2sin2θ(λϕ˙)2) T(\lambda\dot{r}, \lambda\dot{\theta}, \lambda\dot{\phi}; r, \theta) = \frac{1}{2} m ((\lambda\dot{r})^2 + r^2 (\lambda\dot{\theta})^2 + r^2 \sin^2\theta (\lambda\dot{\phi})^2) =12m(λ2r˙2+r2λ2θ˙2+r2sin2θλ2ϕ˙2) = \frac{1}{2} m (\lambda^2\dot{r}^2 + r^2 \lambda^2\dot{\theta}^2 + r^2 \sin^2\theta \lambda^2\dot{\phi}^2) =λ2[12m(r˙2+r2θ˙2+r2sin2θϕ˙2)]=λ2T(r˙,θ˙,ϕ˙;r,θ) = \lambda^2 \left[ \frac{1}{2} m (\dot{r}^2 + r^2 \dot{\theta}^2 + r^2 \sin^2\theta \dot{\phi}^2) \right] = \lambda^2 T(\dot{r}, \dot{\theta}, \dot{\phi}; r, \theta)

Una vez más, tenemos que la energía cinética es homogénea de grado r=2r=2

De forma más general, en un espacio con coordenadas generalizadas q1,,qnq_1, \dots, q_n, las "velocidades" son q˙1,,q˙n\dot{q}_1, \dots, \dot{q}_n. La energía cinética se puede escribir usando los componentes gij(q)g_{ij}(q) de un tensor métrico (que pueden depender de las posiciones qkq_k, pero no de las velocidades q˙k\dot{q}_k):

T(q1,,qn,q˙1,,q˙n)=12mi,jgij(q1,,qn)q˙iq˙j T(q_1,\dots,q_n, \dot{q}_1, \dots, \dot{q}_n) = \frac{1}{2} m \sum_{i,j} g_{ij}(q_1,\dots,q_n) \dot{q}_i \dot{q}_j

Si solo nos enfocamos en la dependencia de TT con respecto a las velocidades generalizadas q˙k\dot{q}_k, vemos que cada término q˙iq˙j\dot{q}_i \dot{q}_j es de segundo grado en las velocidades. Si escalamos todas las velocidades generalizadas por λ\lambda: q˙kλq˙k\dot{q}_k \rightarrow \lambda \dot{q}_k.

T(,λq˙1,,λq˙n)=12mi,jgij(q)(λq˙i)(λq˙j) T(\dots, \lambda \dot{q}_1, \dots, \lambda \dot{q}_n) = \frac{1}{2} m \sum_{i,j} g_{ij}(q) (\lambda \dot{q}_i) (\lambda \dot{q}_j) =12mi,jgij(q)λ2q˙iq˙j=λ2[12mi,jgij(q)q˙iq˙j] = \frac{1}{2} m \sum_{i,j} g_{ij}(q) \lambda^2 \dot{q}_i \dot{q}_j = \lambda^2 \left[ \frac{1}{2} m \sum_{i,j} g_{ij}(q) \dot{q}_i \dot{q}_j \right] =λ2T(,q˙1,,q˙n) = \lambda^2 T(\dots, \dot{q}_1, \dots, \dot{q}_n)

Obtenemos otra vez que la energía cinética es homogénea de grado r=2r=2.

Ahora, como ya podemos decir que la energía cinética TT es consistentemente una función homogénea de grado r=2r=2 con respecto a las componentes de la velocidad (sean estas vx,vy,vzv_x, v_y, v_z o q˙1,,q˙n\dot{q}_1, \dots, \dot{q}_n), el Teorema de Euler nos dice que:

kvkTvk=2T \sum_{k} v_k \frac{\partial T}{\partial v_k} = 2T

Sin embargo, es importante mencionar que no todas las energías cinéticas son homogéneas de grado 2. Esto está un poco fuera del tema actual, pero por ahora puedo decir que sí es cierto que sean de grado 2 siempre y cuando la energía cinética pueda expresase exclusivamente como una forma cuadrática pura en velocidades generalizadas libres.

Dicho de otra manera, porque creo que sonó un poco en chino lo anterior, digo que esta propiedad se cumple únicamente cuando todas las velocidades que aparecen en la energía cinética son grados de libertas reales del sistema, variables dinámicas independientes. Si alguna de estas velocidades es impuesta externamente, entonces la energía cinética pierde esta homogeneidad, ya que aparecen términos que dependen directamente del tiempo y no escalan adecuadamente, pero como siempre, es de mucha ayuda ver esto con un ejemplo sencillo:

Supongamos alguna partícula tal que su energía cinética en coordenadas polares es

T=m2(r˙2+r2φ˙2) T = \frac{m}{2}\left( \dot{r}^{2}+r^{2}\dot{\varphi}^{2} \right)

esta ya vimos que sí es homogénea de grado 2, pero si imponemos una condición adicional como φ(t)=sint\varphi (t) = \sin t, entonces φ˙(t)=cost\dot{\varphi}(t)=\cos t ya no es una velocidad generalizada libre, sino una función conocida del tiempo. Así la energía cinética se convierte en

T=m2(r˙2+r2cos2t) T = \frac{m}{2}\left( \dot{r}^{2}+r^{2}\cos^{2}t \right)

que claramente ya no es homogénea de grado 2 en las velocidades libres. Por lo tanto, ahora sí, ya no suena a chino decir que la energía cinética será homogénea de grado 2 si todas las velocidades involucradas son variables libres independientes y no impuestas externamente.


Ahora sí, empecemos a lo que vinimos. Para empezar a hablar de mecánica hamiltoniana, podemos partir de una inocente pregunta aún desde el marco de la mecánica lagrangiana.

La pregunta es:

¿Es el Lagrangiano L(q,q˙,t)\mathcal{L}(q, \dot{q}, t) constante en el tiempo?

Para contestar esta pregunta podemos hacer la derivada total y ver qué pasa.

dLdt=Lqq˙+Lq˙q¨+Lt \frac{d\mathcal{L}}{dt} = \frac{\partial \mathcal{L}}{\partial q} \dot{q} + \frac{\partial \mathcal{L}}{\partial \dot{q}} \ddot{q} + \frac{\partial \mathcal{L}}{\partial t}

Pero por las ecuaciones de Euler-Lagrange sabemos que

ddt(Lq˙)=Lq \frac{d}{dt}\left( \frac{\partial \mathcal{L}}{\partial \dot{q}} \right) = \frac{\partial \mathcal{L}}{\partial q}

y sustituyendo eso, nos queda

dLdt=ddt(Lq˙)q˙+Lq˙q¨+Lt. \frac{dL}{dt} = \frac{d}{dt} \left( \frac{\partial \mathcal{L}}{\partial \dot{q}} \right) \dot{q} + \frac{\partial \mathcal{L}}{\partial \dot{q}} \ddot{q} + \frac{\partial \mathcal{L}}{\partial t} .

Sin embargo, podemos observar que

ddt(Lq˙)q˙+Lq˙q¨=ddt(Lq˙q˙) \frac{d}{dt} \left( \frac{\partial \mathcal{L}}{\partial \dot{q}} \right) \dot{q} + \frac{\partial \mathcal{L}}{\partial \dot{q}} \ddot{q} = \frac{d}{dt} \left( \frac{\partial \mathcal{L}}{\partial \dot{q}} \dot{q} \right)

entonces

dLdt=ddt(Lq˙q˙)+Lt \frac{dL}{dt} = \frac{d}{dt} \left( \frac{\partial \mathcal{L}}{\partial \dot{q}} \dot{q} \right) + \frac{\partial \mathcal{L}}{\partial t}

y reordenando

Lt=ddt(Lq˙q˙)dLdt -\frac{\partial \mathcal{L}}{\partial t} = \frac{d}{dt} \left( \frac{\partial \mathcal{L}}{\partial \dot{q}} \dot{q} \right) - \frac{d\mathcal{L}}{dt} Lt=ddt[Lq˙q˙L] -\frac{\partial \mathcal{L}}{\partial t} = \frac{d}{dt} \left[ \frac{\partial \mathcal{L}}{\partial \dot{q}} \dot{q} - \mathcal{L} \right] Lt=ddt[(q˙q˙1)L] -\frac{\partial \mathcal{L}}{\partial t} = \frac{d}{dt} \left[ \left(\dot{q} \frac{\partial}{\partial \dot{q}} - 1 \right) \mathcal{L} \right]

entonces, si vemos bien a

(q˙q˙1) \left( \dot{q}\frac{\partial}{\partial \dot{q}} - 1 \right)

vemos que tenemos lo mismo que cuando definimos el operador

Λ^=[xddx1] \hat{\Lambda} = \left[ x \frac{d}{dx} - 1 \right]

de la transformada de Legendre. Entonces, si teníamos que

A^f(x)=g(p) \hat{A}f(x)=g(p)

donde A^\hat{A} ahora es [q˙q˙1]\left[ \dot{q}\frac{\partial}{\partial \dot{q}} - 1 \right] y f(x)f(x) es L(q,q˙,t)\mathcal{L}(q,\dot{q},t)

A^f(x)=q˙Lq˙L=g(p) \hat{A}f(x) = \dot{q} \frac{\partial \mathcal{L}}{\partial \dot{q}} - \mathcal{L} = g(p)

¿Y entonces quién es esa nueva función g(p)g(p)? Pues esa función es a lo que vamos a llamar el Hamiltoniano

H(q1,,qn,p1,,pn)=Lq˙q˙L \begin{equation*} \mathcal{H}(q_{1},\dots,q_{n}, p_1, \dots, p_n) = \frac{\partial \mathcal{L}}{\partial \dot{q}} \dot{q} - \mathcal{L} \end{equation*}

donde vamos a definir

Lq˙=p \begin{equation*} \frac{\partial \mathcal{L}}{\partial \dot{q}} = p \end{equation*}

como el momento canónico conjugado.

Entonces regresando a donde nos habíamos quedado, tenemos que

Lt=dHdt \begin{equation*} -\frac{\partial \mathcal{L}}{\partial t} = \frac{d\mathcal{H}}{dt} \end{equation*}

por lo que podemos ver que si L\mathcal{L} depende explícitamente del tiempo H\mathcal{H} no se conserva, y si LL no depende del tiempo, H\mathcal{H} se conserva. Toda la discusión anterior se puede llevar fácilmente al caso de más variables pero por simplicidad solo se trabajó con una, pero no debería parecer extraño que

H=ipiq˙iL. \mathcal{H} = \sum_{i}p_{i}\dot{q}_{i}-\mathcal{L}.

Finalmente, cierro esta parte con un pequeño comentario, es común que confundamos H\mathcal{H} con la energía. Son cosas distintas, que en ocasiones suelen coincidir, y de hecho, H\mathcal{H} de puede conservar y no ser la energía.

Ahora bien, ¿cuándo coincide el Hamiltoniano H\mathcal{H} con la energía EE del sistema? Esto ocurre bajo dos condiciones que se cumplen en muchos sistemas clásicos: que la energía sea una función homogénea de grado dos y que la energía potencial VV dependa únicamente de las coordenadas generalizadas qiq_{i} y no de las velocidades generalizadas q˙i\dot{q}_{i} ni explícitamente del tiempo, solo V=V(q1qn)V=V(q_{1}\dots q_{n}).

Por lo que si regresamos a nuestra definición

H=ipiq˙iL. \mathcal{H} = \sum_{i}p_{i}\dot{q}_{i}-\mathcal{L}.

y primero acordamos que la energía potencial dependa únicamente de las coordenadas generalizadas qiq_{i} entonces

pi=Lq˙i=(TV)q˙i=Tq˙i p_{i} = \frac{\partial \mathcal{L}}{\partial \dot{q}_{i}} = \frac{\partial (T-V)}{\partial \dot{q}_{i}} = \frac{\partial T}{\partial \dot{q}_{i}}

y si ahora, acordamos que la energía cinética TT sea una función homogénea de grado dos como habíamos visto, podemos aplicar el teorema de Euler para funciones homogéneas

i=1nxifxi=rf(x1,x2,,xn) \sum_{i=1}^{n} x_{i} \frac{\partial f}{\partial x_{i}} = r \cdot f(x_{1},x_{2},\dots,x_{n})

para TT que es de grado dos, tendríamos (aunque ya habíamos obtenido este resultado)

i=1nq˙iTq˙i=2T \sum_{i=1}^{n} \dot{q}_{i} \frac{\partial T}{\partial \dot{q}_{i}} = 2T

sustituyendo que pi=Tq˙ip_{i}=\frac{\partial T}{\partial \dot{q}_{i}}

i=1npiq˙i=2T \sum_{i=1}^{n} p_{i}\dot{q}_{i} = 2T

regresando a nuestra definición de H\mathcal{H}

H=ipiq˙iL=2TL \mathcal{H} = \sum_{i}p_{i}\dot{q}_{i}-\mathcal{L} = 2T - L H=2T(TV) \mathcal{H} = 2T - (T-V) H=T+V \mathcal{H} = T + V

Y como sabemos, E=T+VE = T+V. Por lo tanto, bajo estas condiciones, el Hamiltoniano HH no solo se conserva, sino que coincide con la energía total EE del sistema.