有朋友问我能不能帮忙梳理一下物理,于是打算简单写一点。
话说,所谓梳理一下物理,这事到底要怎么做呢?物理的范畴太大了,要梳理还真是一件很大的工程啊。。。
这篇就简单从点粒子的经典物理来说吧。
首先,物理要做的事情,简单来说就是“描述对象的状态与运动规律”。
于是,就要分描述状态和描述规律这两部分来做——这点对点粒子和对更复杂的系统,或者是经典物理与量子物理,都是如此。
对点粒子来说,点粒子的状态是一件很容易描述的事情——位置x_i,速度v_i。
当然了,真要说状态的话还可以有很多别的状态,比如动量,动能,等等。所以这里其实会牵扯到哪些量是基本量,哪些量是衍生量的问题。
这个问题基本目前只有约定俗成的管理,以及根据不同的问题选择不同的量,并不是一成不变的。比如在哈密顿力学中我们选择的是位置和动量,在牛顿力学中选择位置和速度,等等。
除了上述的粒子自身所处的状态外,很多时候还要考虑粒子收到的外界给予的状态,比如收到的力F_i,或者所处的势阱V(x_i),等等。
由于粒子一般是在运动的,所以上述所有这些状态又都是函数而不单单是一个数。
比如,位置应该是x_i(t),速度是v_i(t),从而只要我们知道了粒子的运动规律,那实际上就只要知道时间t,就可以知道粒子的所处状态。
所以,所谓运动规律,就是在知道一定的初始条件的情况下,推测出在此后任意时间t,粒子的状态是什么样的。
举例来说,我们知道了粒子是匀速直线运动,知道了初始位置在x0_i,那么此后任意时刻粒子的位置就是x0_i + v_i t。
当然,实际上来说,不可能这么简单明了。
物理中的运动规律也可以分为两部分来说。
一个,是在已经知道外部环境的情况下,物理对象的状态如何改变,也就是上面所说的那种情况。
而另一部分,则是在已经知道物理对象当前状态的情况下,来给出它对外部环境状态的改变。
如果将外部环境也看作一个物理对象的话,那么所谓物理规律,就是指——在知道所有物理对象当前状态的情况下,给出下一刻所有物理对象的状态。
在点粒子的经典物理中,我们还是将点粒子和“外部环境”给分开处理。
所以,点粒子的运动规律就分为两部分——
1,在已知外力/外势的情况下获得粒子运动状态的改变情况;
2,通过粒子当下的运动状态来获得其给予环境的力/势。
第一项可以归结为牛顿三定律,而第二项则比较复杂,虽然原则上说我们都可以归结为大统一理论。。。在经典物理时代,这第二项则可以分解为四大类:碰撞、引力、电磁力,其它。
描述物体在外力/势作用下的状态改变的规律就是牛顿三定律,其实写出来主要就亮点:
1,f_i = m a_i
2,fa_i = -fb_i
第一条包含了牛一和牛二率——如果没有外力作用,物体将保持当前的运动状态;物体的加速度和质量的乘积,等于所收到的外力。
第二条方程则是牛三率:作用力与反作用力总是同时存在的且大小相等方向相反。
第二条很容易推广成更一般的形式——发生作用的所有物理对象在同一点上收到的力(矢量)的总和为0。
这就是说,力不可能无缘无故地出现或者消失,只能以相互作用的形式体现。
而第一条,包含的信息则比较大。
我们先将这个公式写成更一般的形式(这里不再写矢量下标):
f = m dv / dt
so: f dt = m dv
这里第一条是根据加速度的定义给出的:a = dv / dt
写成第二行的形式后,我们如果再做一个积分,就得到了冲量定理:I = P2 - P1
接着,我们考虑到在发生相互作用的时候有所有力的总和为0这点,也就是牛三,那么对冲量定理求和,就得到了发生相互作用前后系统总动量不变这个结论,也就是动量守恒。
再来,对这个矢量式子左右同乘一个速度v(也是矢量),就有f . v dt = m v . dv
(.这里表示矢量内积),也就是f . ds = dEm
,积分之后就是W = Em2 - Em1,即动能定理。同样的,对整个系统求和就得到动能守恒。
这些基本上就是对点粒子经典物理的所有常见内容了。
当然,上面是从牛顿力学出发所得到的。
我们下面开始从牛顿力学来得出拉氏量和哈密顿量的分析力学。
这里我们需要假定外力f可以写成某个势V的负梯度-grad V的形式。
牛二的方程我们可以做一个改写:
-dV / dx_i = m dv_i / dt
由于Em = m v^ 2 / 2
,所以上面又可以写为:
-dV / dx_i = d(dEm / dv_i) / dt
注意的是,除了dt是常微分,别的都是偏微分。
这货可以进一步写为:
d(dEm / d(dx_i / dt)) / dt + dV / dx_i = 0
而这个,“恰好”就是初始状态与结束状态固定情况下的一个变分方程:DL / Dx_i =0
,其中L = 积分(Em - V)
提醒一下:变分方程也有很多种,这里只是其中一种特定情况下使用的变分。
*变分的计算规则大家可以自己Google一下。在这里的Case中,如果变分函数L中含有自变量a和a对b的微分,那么整个变分的结果就是dL / da - d(dL / d(da / dt)) / dt
*
而,这个变分方程的意思就是:在给定势阱V下,粒子从指定的初始位置到结束位置的所有可能路径中,“实际”所走的路径的L极小或者极大。
这就是分析力学中的拉氏量极值原理。
这里就体现了牛顿力学和分析力学的一个有意思的分歧——牛顿力学认为牛二律是基本定律,拉氏量的极值原理是一个衍生推论;而分析力学则认为拉氏量的极值原理是基本,牛二律是其推论。
至于说,到底这两个家伙谁更“基本”,这个问题我们这里就不管了——而且,事实上,在经典物理这个层面恐怕是难以吵出个所以然来的。
拉氏量L是拉氏量密度l = Em - V
在整个粒子运动路径(或者更可以说是在物理系统演化构型空间)上的积分,所以本身是一个函数(路径或者说构型的函数,也是所处外部状态比如势能V的函数)。
这里的拉氏量和经典中的系统总能量的定义正好相差一个符号——在经典物理中,总能量是系统的动能Em和势能V的和(有些地方会将势能很自觉先取一个负号,于是在这种文献中总能量反而就是Em - V
了,所以一定要先看清楚所看文献中势能的定义方式哟)。
所以说,拉氏量本身并不是系统的总能量,所以拉氏量极值定理本身和能量的情况没多少关系。
拉氏量是一个很难给予直观物理印象的量,有点像DNA。
于是,有人在这个基础上,给出了代表能量的哈密顿量。
这个我们要继续回到牛二方程:f ds = dEm
,这里f和ds都是矢量,所以f ds是两者的矢量内积。
带入上面的势能与力的关系,就有:dEm + grad V ds = 0
。积分以下就得到了:Em2 - Em1 + V(x2) - V(x1) = 0
也就是说,初始状态的能量与势能的和与终止状态的能量与势能的和是相等,这就是总能量守恒。
记h = Em + V
,下面我们比较关心的就是如何从l来获得h。
这里开始我们就要认真构造动量p了(此前虽然提到过动量定理和动量守恒,但其实只是用一用)。
来看一个有趣的“变换”:
令q_i = dl / dx_i
,p_i = dl / dv_i
。
于是,现在上述运动方程(拉氏量极值方程)就可以写为:
dl / dx_i = d(dl / dv_i) / dt
q_i = dp_i / dt
这在形式上,与速度与位置的关系是相同的——v_i = dx_i / dt
。
所以,我们可以说p是变换后空间的“坐标”,而q是变换后空间的“速度”。
现在,我们就利用这两个空间(实际空间x_i和这里提到的“对偶”空间p_i)的“坐标”来构建一个更大的数学上的空间,称为相空间,并利用相空间的坐标x_i, p_i来构造一套运动学规律。
由于现在我们的目标是只要坐标(x和p)而不要有速度(v和q),所以我们建立的方程也只能包含时间、坐标、坐标对时间的一次微分,这三项。
从牛二方程我们已经有了这条:dl / dx_i = dp_i / dt
,但这条方程本身并不满足上述条件:l中是包含了v的。
所以,我们第一步是利用p_i = dl / dv_i
将所有的v用p改写v=v(x, p),从而得到l = l(x_i, p_i)。
现在,原本的拉氏量描述下的运动方程给出了我们现在所要的运动方程的一般(那个方程对自变量的约束和空间维度数相同,但现在的相空间的自由变量也就是坐标的数量是空间维度数的两倍,于是还少一半),所以我们需要另一半的方程——p = dl / dv_i
。
这个方程本身当然是不满足条件的,但如果我们将方程左面的p改写成v的形式,从而得到dx/dt的形式,而将右面的dl / dv_i改写成p的形式,那么就可以得到关于dx_i / dt和p之间关系的方程,这样就足够了。
由于Em的形式我们是知道的:Em = m v^2 / 2 = p^2 / (2m)
,所以对于大部分情况,我们可以取h = 2Em - l = pv - l
,这样就得到了所有的运动方程:
dp_i / dt = -dh / dx_i
dx_i / dt = dh / dp_i
这里第二条的证明其实很简单:
dh / dp = d(pv - l) / dp = v + p dv / dp - dl / dv * dv / dp = v + p dv / dp - p dv / dp = v = dx / dt
于是,我们相当于在相空间建立起了只通过位置就能得到运动规律的物理学,并将它和真实空间中需要位置和速度来确定的物理学建立了对应关系。
需要说明的,上述分析力学的手法都依赖于一个前提那就是物体收到的外力可以写成一个势能的负梯度的形式f = -grad V
,如果这点无法满足的话,那其实牛顿力学和拉氏量的分析力学是无法一一对应的。
而另一方面,如果这个势能本身还依赖于粒子在其中的速度(比如磁场),且这种依赖关系很复杂(磁场中的Lorentz力的依赖关系不复杂,但比如极高速下的空气阻力,这个关系就很复杂了),那拉氏力学和哈氏力学也未必是一一对应的。
另一方面,共轭动量p = dl / dv
与我们在最开始建立的动量p = m v
之间未必总是相同的。当势能V是包含速度v的时候,两者就会不同。
再来,从观念上说,拉氏力学的核心在于“极值原理”,也就是说,真实无力过程必然是让粒子运动轨迹上的拉氏量达到极值的。
但哈氏力学的核心观念则不同,它的核心观念是物理过程实际上是发生在相空间中的,且运动规律只和物体在相空间中的位置有关。这里,动量具有和坐标相同的本体地位,而不是从速度得到的次级的“导出量”——历史上相同命运的还有量子物理中通过AB和AC实验发现场的势是具有实体性的,而不是为了得到场强而引入的导出量——当然,这点在这里其实也有体现。
但最开始的牛顿力学则完全不同。牛顿力学的核心就是发生在真实物理空间中的牛顿三定律。
可见,这三者中,牛顿力学是看上去完全发生在真实空间的物理规律,哈氏力学是发生在相空间中的物理规律,而拉氏力学是发生在真实空间中的几何问题。。。
但,未来我们会看到,物理的近代与现代发展基本都是以哈氏力学和拉氏力学为基础的,比如在量子力学中,传统的正则量子化就完全是哈氏力学的一套延续,而路径积分则是拉氏力学的延续(这句话其实不是很对,至少比前面那半句更不对一点,不过,大家别在意这些细节)。
上面这所有的一切,还仅仅是在知道V的情况下如何获得粒子的运动状态,也就是说,仅仅是“描述运动规律”这个任务的一般。
另一半,就是通过粒子的运动状态(x,v)来获得V。
牛顿伟大就伟大在,它的牛顿三定律给出了上面的一般,而它的引力论给出了下面的一半(至少当时我们已知的基本力就这个了。哦,当年也是有磁场的)的大部分。
牛顿引力论,弹簧的胡克定律,电场的库仑定律,磁场的法拉第定律,还有别的各种定律,比如空气阻力定律等等,最终都给出了V的具体形式,也就是给出了物体的运动状态是如何决定V的物理规律。
至此,基本来说点粒子的物理学就都有了,剩下的就是根据各种情况来做各种计算——对于总共只有一个点的物理,能做的其实不多,只有自由运动;而当有两个点的时候,就可以有上面所说的各种V。
而当我们有三个点,三体当当当出场~~~
当我们有海量的点,比如阿伏伽德罗常数个,我们就有了统计力学。这里我们不再用上面的这套语言来说了,而要根据不同的情况给出不同的系宗,用系宗来说话。
接着,我们将物理时空从三维拓展到四维,就得到了相对论。
而量子理论则是一种完全不同的推广——我们目前其实还不能严格地说量子力学到底是什么,但至少我们很有把握这货应该怎么玩。
当然,除了分立地增加点的数量,我们也可以连续地增加,比如,本来是点粒子,我们可以构造出一根针,一块板,等等等等,这就带来了刚体力学。
接着如果我们要求这么构成的物体不是那么硬,就有了软体力学或者说柔体力学。
如果是多个刚体,并且数量又没有多到构成统计力学的地步,我们就能获得介观物理——这里的规则既和统计力学不同,也和刚体力学不同。
接着,在统计力学的基础上我们考虑各种物质状态,也就是物态方程,我们就有了从凝聚态物理、材料物理到行星物理、恒星物理的天体物理,直至宇宙学——把时空也当作一种统计系宗力的物体来看待,那么它的物态方程就是广义相对论的爱因斯坦方程。
接着,我们将统计物理本身作为研究对象,研究物理规律在不同层级上的变化,我们就有了复杂现象和涌现理论。
如果我们研究的不是连续的时空上的物理,而是某种特殊拓扑上的物理,包括基本物理对象的状态也不是(x,v)这种,而是更加负责更加一般化的状态量,那么我们就得到了一种宽泛意义上的“物理学”。
比如说,研究网络上的信息流动,这就是复杂网络。
把这东西应用到经济学上,我们有“股票市场的路径积分”和“金融市场的泛函积分”这样的东西。
应用到万维网上,简书有计算士的相关文章,这也是现在新兴的一门科学。
嗯,借由点粒子的物理开始,我们也算大致看了一下整个物理大概是一个什么样的分布了吧。。。(大雾……)
如果你觉得这篇东西写得还行,愿意打赏我一口咖啡,请戳打赏页~~
本文遵守创作共享CC BY-NC-SA 3.0协议**