一时兴起之作。
Ⅰ. 当我们在思考变换的时候,我们在思考什么
最基本的变换是坐标变换,也是最狭义的变换
\[Q_i=Q_i(q_1,q_2...,q_n)\]这种变换最trivial,理由是它永远正确,把一个拉格朗日量进行坐标变换
\[L(q,\dot{q},t) \rightarrow L'(Q,\dot{Q},t)\]任意的$t$对应的拉格朗日量都相等,意味着其作用量也相等,得到的肯定是等价的拉格朗日方程,没什么好讨论的。
考虑到所有的有限大连续变换,在数学上都可以由无穷小生成元恢复出来。拉格朗日力学框架下,Noether定理给出的普遍形式是一个由连续参数$\epsilon$ 控制的无穷小时空变换(坐标和时间同时变换)
\[t \rightarrow t' = t + \delta t = t + \epsilon T(q, t)\] \[q_i(t) \rightarrow q_i'(t') = q_i(t) + \delta q_i = q_i(t) + \epsilon Q_i(q, t)\]不同于坐标变换的小打小闹,我们在这个变换过程中没有修改广义坐标{$q_i$}的选择,这也就意味着
\[L'(q',\dot{q'},t)=L(q',\dot{q'},t)\]相同的坐标体系,相同的拉式量定义,肯定对应着相同的拉格朗日方程
\[\frac{d}{dt}\frac{\partial L'}{\partial \dot{q_i}'}=\frac{\partial L'}{\partial {q_i'}}\] \[\frac{d}{dt}\frac{\partial L}{\partial \dot{q_i}}=\frac{\partial L}{\partial {q_i}}\]所以我们关心的是,这两个独立演化的体系,能否始终时时满足原先的对应关系
\[t' = t + \delta t = t + \epsilon T(q, t)\] \[q_i'(t') = q_i(t) + \delta q_i = q_i(t) + \epsilon Q_i(q, t)\]这件事显然是non-trivial的,且绝大多数时候是不成立的。而且这件事情本身就很诡异,就像你现在得到了两个完全相同的方程
\[m\ddot{q} + kq = 0\] \[m\ddot{q}' + kq' = 0\]然后非要找到一组关系{$t \rightarrow t’,q \rightarrow q’$}将它们配对,这种选择肯定是有限的,而且与拉氏量的具体形式有关。例如对于所谓的旋转对称体系
\[L(r, \theta, \dot{r}, \dot{\theta}) = \frac{1}{2}m(\dot{r}^2 + r^2\dot{\theta}^2) - V(r)\]不难发现求解后的方程肯定对下面的变换合法
\[t' = t\] \[r'(t') = r(t)\] \[\theta'(t') = \theta(t) + \epsilon\]也就是说一个时空下{$r,\theta,t$}的运动,经过简单的坐标旋转变换后居然完全等价于另一个时空下{$r’,\theta’,t’$}的运动。或者换一个角度,这个时空下的运动,经过一个旋转变换后,不会让人感觉与这个体系出现矛盾,也就是说这个运动依然在体系下是“合理”的。试想这个体系下如果是一个如下的变换
\[t' = t\] \[r'(t') = r(t) + \epsilon\] \[\theta'(t') = \theta(t)\]那么这样变换的运动在新的时空下肯定是不可能存在的,因为拉格朗日方程不允许这样的解出现。
但其实这么non-trivial的事情居然很容易想出一些示例,一个在时空{$x,t$}匀速运动的小球,可以等价为经过变换$t’=t ;x’ = x + \epsilon$后在时空{$x’,t’$}下匀速运动的小球,也可以等价为经过变换$t’=t + \epsilon ;x’ = x$后在时空{$x’,t’$}下匀速运动的小球。原本没什么具体内涵的数学形式{$x’,t’$},能够与真实运动存在真实的存在变换,这本身应该让我们惊讶。
错位的虚构时空因为变换本身得以变得真实,这么说是不是显得更浪漫一些。
Ⅱ. 当我们在定义对称的时候,我们在定义什么
当两个运动存在真实时空变换的时候,我们称之为对称。所谓的空间平移对称性$x’=x+\epsilon$,空间旋转对称性$\theta’=\theta+\epsilon$,时间平移对称性$t’=t+\epsilon$,其实都是一个个真实变换的代名词。
对称的内涵在这里确实是被无限延申,代表着这种时空间千丝万缕的联系。
既然能存在真实变换关系,根据最小作用量原理,可以做一些数学推导。
\[S' = \int_{t_1'}^{t_2'} L(q', \frac{dq'}{dt'}, t') dt' = \int_{t_1}^{t_2} L(q, \dot{q}, t) dt\] \[dt' = \frac{dt'}{dt} dt = \frac{d(t + \delta t)}{dt} dt = \left(1 + \frac{d}{dt}(\delta t)\right) dt\]变换后的作用量可以写为:
\[S' = \int_{t_1}^{t_2} L(q', \frac{dq'}{dt'}, t') \left(1 + \frac{d}{dt}(\delta t)\right) dt\]要求 $\delta S = \delta S’ - \delta S = 0$,利用$L’(q’,\dot{q’},t)=L(q’,\dot{q’},t)$展开到 $\epsilon$ 的一阶近似(无穷小量):
\[\delta S = \delta \int_{t_1}^{t_2} \left[ \delta L + L \frac{d}{dt}(\delta t) \right] dt = 0\]所以被积函数必须是某个函数$F(q,t)$对时间的全导数
\[\delta L + L \frac{d}{dt}(\delta t) = \frac{dF(q,t)}{dt}\]Noether定理告诉我们,存在真实变换的体系,肯定有其过人之处。具体来说就是必须满足上面的方程。但这个形式没法用,我也懒得进行一些琐碎的数学推导了。具体的说,如果我们令$F(q,t)=\epsilon f(q,t)$,那么Noether定理的内容就是,
满足对称变换的体系
\[t \rightarrow t' = t + \delta t = t + \epsilon T(q, t)\] \[q_i(t) \rightarrow q_i'(t') = q_i(t) + \delta q_i = q_i(t) + \epsilon Q_i(q, t)\]天然有守恒量
\[I = \sum_{i} p_i Q_i - H T - f = \text{Constant}\]其中$p_i$是广义动量,$H$是哈密顿量。
形式理论的一个高峰。
Ⅲ. 当我们在证明守恒的时候,我们在证明什么
同样是关于守恒量,我们很容易联想到无限小正则变换
\[Q_i = q_i + \delta q_i = q_i + \epsilon \cdot f_i(q, p, t)\] \[P_i = p_i + \delta p_i = p_i + \epsilon \cdot g_i(q, p, t)\]但这种变换太任意了,坐标和动量之间是必须满足对应关系的,具体来说就是保证哈密顿方程不变(或者说满足$P_i=\frac{\partial L}{\partial \dot{Q}_i}$)。为了确保变换是正则变换,我们选择第二类生成函数 $F_2(q, P, t)$,并将其构造为:
\[F_2(q, P, t) = \sum_{i=1}^n q_i P_i + \epsilon \cdot G(q, P, t)\]注意这个构造是非普适的,也就是说不是所有的生成函数都能用生成元这么写,比如一般的坐标变换就没办法。
根据第二类生成函数的变换关系公式:
\[p_i = \frac{\partial F_2}{\partial q_i} = P_i + \epsilon \frac{\partial G}{\partial q_i}\] \[Q_i = \frac{\partial F_2}{\partial P_i} = q_i + \epsilon \frac{\partial G}{\partial P_i}\]由于是无穷小变换,$G(q,P,t)$可以直接替换为$G(q,p,t)$,也即
\[\delta q_i = Q_i - q_i = \epsilon \frac{\partial G(q, p, t)}{\partial p_i}\] \[\delta p_i = P_i - p_i = -\epsilon \frac{\partial G(q, p, t)}{\partial q_i}\]用泊松括号可以写成
\[\delta q_i = \epsilon \{q_i, G\}\] \[\delta p_i = \epsilon \{p_i, G\}\]更一般地,对于相空间中的任意物理量 $u(q, p, t)$,在由 $G$ 生成的无限小正则变换下,它的改变量为
\[\delta u = \epsilon \{u, G\}\]因此哈密顿量应该也满足
\[\delta H = \epsilon \{H, G\}\]我们知道时间演化中始终有
\[\frac{dG}{dt} = \{G, H\} + \frac{\partial G}{\partial t}\]我们将哈密顿力学体系下的对称变换定义为满足$\delta H=0$的变换,如果$G$不显含$t$,直接的结论就是
\[\frac{dG}{dt} = 0\]也即在演化过程中$G$守恒。例如动量守恒时$G=p_x$,则对应的无穷小变换是
\[\delta x = \epsilon \frac{\partial G}{\partial p_x} =\epsilon\] \[\delta p_x = -\epsilon \frac{\partial G}{\partial x} = 0\]这件事和诺特定理的无穷小变换似乎有千丝万缕的关系,不过正则变换的基本思想是广义坐标的变换(以及与之对应的广义动量的变换),而诺特定理是维持同一套广义坐标的。好像难以用一套语言统一。
但正则变换真的只是广义坐标的变换吗,例如把直角坐标换成极坐标这种。
举个极端的例子,我们知道哈密顿方程本身就是一种正则变换
\[d q_i = dt \frac{\partial H(q, p, t)}{\partial p_i}\] \[d p_i = -dt \frac{\partial H(q, p, t)}{\partial q_i}\]这意味着我们应该理解成,$dt$时间后的${q_i(t+dt)}$是一组新的广义坐标吗?这是不是有点太反直觉了。
所以说正则变换本身的内涵早已超出一开始的广义坐标变换的范畴了(尽管这依然是其中一部分主要应用)。不妨接着我们上面的极端例子接着推导
采用生成函数 $F_2(q, P, t)$:
\[F_2(q, P, t) = \sum_{i=1}^n q_i P_i + dt \cdot H(q, P, t)\]新哈密顿量 $K$ 满足
\[K = H + \frac{\partial F_2}{\partial t}\]即
\[K = H(q, p, t) + dt \cdot \frac{\partial H(q, P, t)}{\partial t}\]注意到
\[H(q, p, t + dt) = H(q, p, t) + dt \cdot \frac{\partial H(q, p, t)}{\partial t}\]所以,新哈密顿量可以写为:
\[K(Q, P, t) = H(q, p, t + dt)\]在 $t+dt$ 时刻对新变量 $(Q, P)$ 进行一阶泰勒展开:
\[H(q, p, t + dt) = H\left(Q - dt \frac{\partial H}{\partial P}, P + dt \frac{\partial H}{\partial Q}, t + dt\right)\] \[= H(Q, P, t + dt) - \sum_{i=1}^n \left[ \frac{\partial H}{\partial Q_i} \left(dt \frac{\partial H}{\partial P_i}\right) - \frac{\partial H}{\partial P_i} \left(dt \frac{\partial H}{\partial Q_i}\right) \right] + \mathcal{O}(dt^2)\]方括号内部的项
\[\frac{\partial H}{\partial Q_i} \cdot dt \frac{\partial H}{\partial P_i} - \frac{\partial H}{\partial P_i} \cdot dt \frac{\partial H}{\partial Q_i} = 0\]因此有
\[K(Q, P, t) = H(Q, P, t + dt)\]哈密顿量就是整个体系的描述者,审视一下,不难发现现在这个体系描述的是在$t+dt$时间下的原体系的状态,甚至如果哈密顿量不显含时间,对应着的就是同一个体系。
这是不是很像先前诺特定理对称性时说的,两个在完全相同体系下合理演化的真实运动之间,可能存在着显式的坐标对应。
正则变换似乎更进一步,它说,即使不用同一套坐标,由于体系的对称性理应脱离坐标选择而存在(尽管某些坐标更容易体现),我们依然可以有显式的对称变换,也依然可以有守恒量成立。
这篇感觉不该分到Note,基本是想到哪写到哪,甚至开始写的时候也没完全想明白,断断续续花了一天时间完成
有些想法很幼稚,不排除未来修改的可能
无所谓了,作为一篇散文看吧
以上



