这个问题烦死了。作为一个非理论物理学家,我甚至不知道该怎么问我想回答的这个问题。
大多数人都懂麦克斯韦方程和光子的概念,市面上的课程也把光的量子化讲得挺清楚。接触QFT的人少一些,但资料还是有的。
一旦你开始问更深的问题——“当初到底是怎么尝试把引力子建模成一个新粒子的”——所有课程提供者突然集体哑火。要么是新闻里那种高度概括的挥手,要么就是直接把你扔给论文让你自生自灭。这让我很烦,所以这篇文章就这么诞生了。
这是我尽力解释当我们尝试把引力子纳入标准模型时所遇到的问题。
一切从两条缝开始
双缝实验烦透了。一个电子打向一堵有两个孔的墙,在背后的探测器上产生干涉图案——和波产生的图案一模一样。但电子是粒子。那它到底穿过了哪条缝?
没有关于电子穿过哪条缝的事实,因为没有测量记录它。如果没有测量记录,排除任何一条路径都会产生与实验不符的预测。你必须对两条路径求和。
你一旦测量它穿过哪条缝,干涉图案立刻消失。很蠢。
no observation: two distributions
source
barrier
screen
classical: 2 bands
无观测 → 两条分布(每条缝各一条)
no observation: interference pattern
source
barrier
screen
quantum: interference fringes
无观测 → 干涉图案(正常的奇怪分布)
让中间态变得可观测的这一举动,摧毁了那个要求你对其求和的效应。
那么如果你面对这种情况,怎么测量光子在某个特定位置被探测到的概率?
这在数学上的表达就是路径积分。粒子从状态 A A A 到状态 B B B 的概率振幅 M \mathcal{M} M 是:
M = ∫ D [ x ] e i S [ x ] / ℏ \mathcal{M} = \int \mathcal{D}[x]\, e^{iS[x]/\hbar} M = ∫ D [ x ] e i S [ x ] /ℏ
你对连接 A A A 到 B B B 的每一条可能路径 x ( t ) x(t) x ( t ) 积分,每条路径的权重是 e i S / ℏ e^{iS/\hbar} e i S /ℏ ,其中 S S S 是沿该路径的作用量。没有路径被排除。
path integral: every path from A to B is summed
A
B
classical (dominant)
e^(iS₂/ℏ)
e^(iS₃/ℏ)
e^(iS₄/ℏ)
ℳ(A→B) = ∫𝒟[x] e^(iS[x]/ℏ) — all paths, no exceptions
与经典轨迹大相径庭的路径并不会消失——它们贡献振荡的相位,这些相位在很大程度上相互抵消。经典路径能存活下来,是因为附近路径的相位几乎完全一致,相干叠加。量子行为就在它们不相干的地方涌现。
费曼图就是为了把这个原理应用到粒子相互作用上而发展出来的。不是对空间中的路径求和,而是对所有可能的相互作用历史求和——那些与你在边界观测到的结果(粒子进,粒子出)相符的历史。每张图代表一个这样的历史。
图里出现的”虚粒子”并不是关于”真实发生了什么”的断言——它们是对未观测中间态的求和中的项,就像双缝求和里两条缝各是一项一样。唯一真实的东西——在可观测、可测量的意义上——是 ∣ M ∣ 2 |\mathcal{M}|^2 ∣ M ∣ 2 ,也就是从你看不见的一切中求和得出的概率。我们稍后会回到这个想法,但首先,我们得聊聊广义相对论的一些概念。
怎么”量子化”引力?
量子化引力的思路是这样的:我们假设这个粒子存在,然后尝试测量和观察它对我们已经理解的物理情境的贡献,从而将理论与实验对比,确定它的预测效力。
来,我们用引力试试看。广义相对论给了我们”度规” g μ ν g_{\mu\nu} g μν ,它编码时空曲率——也就是说,它定义了时空中两点之间的距离_函数_。
在平直空间里,你知道怎么用勾股定理推导两点之间的距离:
d s 2 = d x 2 + d y 2 + d z 2 ds^2 = dx^2 + dy^2 + dz^2 d s 2 = d x 2 + d y 2 + d z 2
但我们不是生活在”平直”空间里。广义相对论如此惊天动地的原因之一,就在于现实本身随着大质量天体的存在而弯曲。
度规包含了告诉你如何在弯曲空间里计算距离的系数:
d s 2 = g μ ν d x μ d x ν ds^2 = g_{\mu\nu} dx^\mu dx^\nu d s 2 = g μν d x μ d x ν
它已经把宇宙中所有质量/能量的结果都编进去了。好,回到引力子粒子。
为了量子化引力,我们假设引力子以平直时空上的小涟漪的形式存在。
所以我们从一个”基础时空”——即平直时空——开始,它这样建模:
η μ ν \eta_{\mu\nu} η μν
η μ ν = \eta_{\mu\nu} = η μν = 平直时空(我们对平直闵可夫斯基时空的基线近似)
η μ ν = ( − 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 ) \eta_{\mu\nu} = \begin{pmatrix} -1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{pmatrix} η μν = − 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1
然后我们把粒子嵌进去,这个粒子”不知为何”在整个宇宙中编码和传递引力。
h μ ν h_{\mu\nu} h μν
h μ ν = h_{\mu\nu} = h μν = 那个差值——我们尝试量子化为引力子的东西
现在我们可以从广义相对论取出我们真实宇宙的度规,把它与平直时空关联起来。自然,我们关心的是引力子的贡献。
顺带一提,目前对我们现实真实度规的最佳估计叫做FLRW度规(以其创造者命名)。注意它是时间的函数,这说得通,因为宇宙正在以加速的速度膨胀。
d s 2 = − c 2 d t 2 + a ( t ) 2 ( d r 2 1 − k r 2 + r 2 d θ 2 + r 2 sin 2 θ d ϕ 2 ) ds^2 = -c^2dt^2 + a(t)^2\left(\frac{dr^2}{1-kr^2} + r^2d\theta^2 + r^2\sin^2\theta\,d\phi^2\right) d s 2 = − c 2 d t 2 + a ( t ) 2 ( 1 − k r 2 d r 2 + r 2 d θ 2 + r 2 sin 2 θ d ϕ 2 )
总之,我们有了广义相对论给出的可用度规,把它与平直时空关联,就有了可以用来建模引力子的东西。
g μ ν = η μ ν + h μ ν g_{\mu\nu} = \eta_{\mu\nu} + h_{\mu\nu} g μν = η μν + h μν
how a massive object warps the spacetime fabric
flat spacetime (eta)
flat
flat
mass M
curvature
g_uv = eta_uv + kappa * h_uv
h_uv encodes the departure from flat spacetime
大质量天体(金球)坐落于时空织物中。平直网格(ημν )弯曲成漏斗形凹陷——曲率场 hμν 。井越深,引力越强。
从这里开始,我们所知道的只是:我们有一个定义时空如何变化的度规,可以用来精确建模空间中任意两点之间的距离。
我们_认为_——但不确定——引力子是在宇宙中传递引力的粒子。
力的载体粒子必须在任何两个有质量的粒子之间传递”信息”,引力才能”发生”。那个粒子必须被交换。这就是理论。
比如,我们可以画两个电子,就像它们之间存在其他力一样——比如普通的库仑力 k q 1 q 2 r 2 \frac{ k q_1 q_2 }{ r^2 } r 2 k q 1 q 2 ——它们之间也有引力作用。
所以我们现在需要建模这个假想相互作用可能发生的所有方式。
类似于普通概率论,为了有一个完整的图像,我们需要实际考察所有可能的情景,才能准确建模这个情况。
费曼的洞见是:粒子同时走所有可能路径,所以你必须对它们所有人的概率振幅求和。每张费曼图对应相互作用的一种可能”历史”。你把它们全部加起来,得到总振幅。
这就引出了一个著名的积分,我们将用它来对这个特定电子相互作用中所有可能动量状态的概率振幅求和。
理论上,我们可以计算这些概率,然后跑去大型强子对撞机,做实验看看结果。如果理论准确预测了实验,我们就增加了对理论的信心,如此循环。
那我们来看看这对光子是怎么成功奏效的,然后再回到引力子。
和引力子不同,光子几乎不互相作用,所以预测行为很容易
在电磁学方面我们非常幸运。我们可以单独考察光子并明确建模。
光子-光子散射存在,但被极度压制,因为它只能间接发生——通过一个虚电子环:
γ + γ → e + e − (virtual) → γ + γ \gamma + \gamma \rightarrow e^+e^- \text{ (virtual)} \rightarrow \gamma + \gamma γ + γ → e + e − (virtual) → γ + γ
每个顶点的耦合常数是 α ≈ 1 / 137 \alpha \approx 1/137 α ≈ 1/137 ,这张图需要4个顶点,所以振幅的量级是 α 2 ≈ 1 / 18000 \alpha^2 \approx 1/18000 α 2 ≈ 1/18000 。在低能量下可以忽略不计——这就是为什么日常生活中光束穿过彼此而不受影响。
这就是经典电磁学是线性的原因——叠加、干涉、衍射都运作得很干净。自相互作用很弱,不会干扰实验。
自旋与力
在我们继续之前,你需要理解”自旋”。自旋是粒子的固有属性——类似于角动量(粒子并没有真的在旋转,我们可以找个机会再去怪罪乌伦贝克和古德斯米特,不过那是1925年的事了)。它以 ℏ \hbar ℏ (自然界常数)的整数或半整数倍出现,控制着场的数学结构和相互作用的形式。
力载体粒子的自旋决定了它所传递的力的角度依赖性:
自旋 例子 场的类型 0 希格斯玻色子 标量 1/2 电子、夸克 旋量(费米子) 1 光子、W、Z、胶子 矢量 2 引力子 对称二阶张量
这意味着自旋直接影响力在多个方向上相互作用的方式。例如,自旋0没有角度依赖性。力从每个方向看起来都一样。对称的。
但更具体地说,我们谈的是可以被建模为场的粒子——基于这些粒子有什么样的相互作用,产生什么样的力。
自旋-1场(例如产生光子的场)携带一次动量,用一个4分量矢量描述:A μ = ( ϕ , A x , A y , A z ) = ( 0 , 1 , 0 , 0 ) A_\mu =(ϕ, Ax,Ay,Az) = (0,1,0,0) A μ = ( ϕ , A x , A y , A z ) = ( 0 , 1 , 0 , 0 ) 。μ \mu μ 遍历4个时空指标:μ = 0 μ = 0 μ = 0 (时间),1 , 2 , 3 1, 2, 3 1 , 2 , 3 (空间)。就这样。一个指标,四个分量。光子的动量是另一个4-矢量 p μ = ( E , p x , p y , p z ) p_\mu = (E, p_x, p_y, p_z) p μ = ( E , p x , p y , p z ) 。
A μ A_\mu A μ 只需要一个指标,因为电磁场只需要知道它在每个时空点指向哪个方向。一个指标 = 一个方向。想想你处理过的任何电磁学模型,你把力建模为三维空间中普通物体之间的直接关系。
自旋-2粒子(其场产生的所谓引力子)携带两次动量,由我们之前讨论过的 h μ ν h_{\mu\nu} h μν 描述。
程序员注:张量的阶就是矩阵。二阶张量形状可以是 [3,3]。三阶是 [3,3,3]。
我知道你在想什么:“David,如果希格斯玻色子像其他那些一样传递力,那不是说也有希格斯力吗?“简短的回答是没有,而且我没时间去读背后的数学原因。我得提醒你,你正在读一篇由风险投资人写的关于量子引力的博客文章,我已经尽力了。
微扰理论
如上所述,大多数有意思的量子场论无法用公式直接求解——相互作用太复杂了。(当然这是因为粒子彼此相互作用,所以预测和隔离活动很难。)微扰理论是一种变通方法:从一个自由理论(没有相互作用,可以精确求解)开始,然后把其余的相互作用作为叠加在上面的小修正来处理。每个修正被更高次的耦合常数 g g g 压制,所以完整答案开始看起来像一个幂级数(想想微积分里的泰勒展开):
M = M ( 0 ) + g M ( 1 ) + g 2 M ( 2 ) + ⋯ \mathcal{M} = \mathcal{M}^{(0)} + g\,\mathcal{M}^{(1)} + g^2\,\mathcal{M}^{(2)} + \cdots M = M ( 0 ) + g M ( 1 ) + g 2 M ( 2 ) + ⋯
这个级数里的每一项对应费曼图展开中的一个”圈阶”。当 g ≪ 1 g \ll 1 g ≪ 1 时(QED有 α ≈ 1 / 137 \alpha \approx 1/137 α ≈ 1/137 ,所以级数收敛很快),效果极好。当耦合很大时,或者——我们将看到——当耦合随能量增长时,就崩了。对于引力,在能量 E E E 处的有效耦合是 ∼ κ E ∼ E / M P l \sim \kappa E \sim E/M_{\rm Pl} ∼ κ E ∼ E / M Pl ,在普朗克尺度附近会爆炸。
费曼图与圈
这些图在粒子物理中会一直出现。我觉得它们在某种意义上很烦人,因为它们真的把发生了什么抽象掉了,但我理解为什么要用它们。它们是直觉上思考物理情境的简单工具。
想一个简单的例子:你有两个电子。它们互相排斥。问题是:这个相互作用的概率振幅是多少?
在QFT中,答案通过问以下问题来计算:时空中每个点存在什么场,它们如何相互作用? 这是个很大的问题。
电子有场 ψ ( x ) ψ(x) ψ ( x ) 。光子也由场 A μ ( x ) A_\mu(x) A μ ( x ) 定义。它们是耦合的——意思是光子传递电磁力,这就是排斥力在两个电子之间传递的方式。
要得到振幅,你计算:
⟨ f ∣ e − i ∫ d 4 x H ( x ) ∣ i ⟩ \langle f | e^{-i\int d^4x\, \mathcal{H}(x)} | i \rangle ⟨ f ∣ e − i ∫ d 4 x H ( x ) ∣ i ⟩
里面那个指数,展开后是个无穷级数……
1 + ( − i ∫ H ) + 1 2 ( − i ∫ H ) 2 + ⋯ 1 + (-i\int \mathcal{H}) + \frac{1}{2}(-i\int \mathcal{H})^2 + \cdots 1 + ( − i ∫ H ) + 2 1 ( − i ∫ H ) 2 + ⋯
每一项都是场算符乘积在时空上的多重积分。当你用场的已知行为实际计算这些积分时,你会得到动量空间中的积分——因为通过傅里叶变换,场在动量空间中更容易分析。
费曼图是微扰级数各项的可视化图。每张图代表某个物理过程(比如两个光子相互散射)的概率振幅中一个具体的数学贡献——一个积分。
这些图由两种成分构成:传播子 (内部线,代表在两点之间传播的虚粒子)和顶点 (粒子相遇并相互作用的点)。
传播子
传播子是费曼图中每条内部线附带的数学对象。它代表虚粒子携带动量 k k k 从一个相互作用顶点传播到另一个的振幅。
对于无质量自旋-1粒子(光子),动量空间的传播子是:
D μ ν γ ( k ) = − i η μ ν k 2 + i ϵ D_{\mu\nu}^{\gamma}(k) = \frac{-i\,\eta_{\mu\nu}}{k^2 + i\epsilon} D μν γ ( k ) = k 2 + i ϵ − i η μν
对于无质量自旋-2粒子(引力子),就……更麻烦了:
D μ ν ρ σ h ( k ) = − i k 2 + i ϵ ( 1 2 [ η μ ρ η ν σ + η μ σ η ν ρ ] − 1 2 η μ ν η ρ σ ) D_{\mu\nu\rho\sigma}^{h}(k) = \frac{-i}{k^2 + i\epsilon}\left(\frac{1}{2}[\eta_{\mu\rho}\eta_{\nu\sigma} + \eta_{\mu\sigma}\eta_{\nu\rho}] - \frac{1}{2}\eta_{\mu\nu}\eta_{\rho\sigma}\right) D μν ρ σ h ( k ) = k 2 + i ϵ − i ( 2 1 [ η μ ρ η ν σ + η μ σ η ν ρ ] − 2 1 η μν η ρ σ )
更简单地说,传播子就是费曼图计算中”粒子从A到B有多大概率”的因子。
Photon Propagator
∼ 1/k²
spin-1 boson
光子传播子:Dμν γ ∼ 1/k²
Graviton Propagator
∼ 1/k²
spin-2 boson
引力子传播子:Dμνρσ h ∼ 1/k²
1 / k 2 1/k^2 1/ k 2 这部分意味着:动量越高(距离越短),贡献越小。光子和引力子都有同样的衰减,所以两者在高能量下仅从传播子来看 都不会爆炸。
引力子额外的指标(μ ν ρ σ \mu\nu\rho\sigma μν ρ σ 对比光子的 μ ν μν μν )反映出它是自旋-2——描述二阶张量(度规微扰 h μ ν h_{\mu\nu} h μν )如何传播需要两对指标。指标更多,公式更丑,基本的 1 / k 2 1 / k^2 1/ k 2 行为不变。
两者在大动量时都以 1 / k 2 1/k^2 1/ k 2 衰减。光子和引力子传播子在高 k k k 下表现同样良好。
顶点
图中的顶点是场相互作用的点。
例如,一个电子进来,发射一个光子,电子出去。三条线相交于一点。这就是顶点。
“树图”是一个非正式术语,指的是动量在该图的相互作用中守恒的概念。
Electron-electron scattering (tree level)
tree diagram
no free momentum → no ∫d⁴k
e⁻
e⁻
e⁻
e⁻
γ (virtual)
vertex (×g)
vertex (×g)
amplitude ~ g² — one free momentum? NO. Photon momentum fully fixed.
圈
圈发生在”虚粒子”被同一张图发射并重新吸收时——形成一条闭合路径。
在树图阶(无圈):电子发射光子,另一个电子吸收它。光子的动量完全由两个电子的动量通过守恒律固定。
有圈的情况:电子发射一个光子,那个光子分裂成两个粒子,它们重新合并回光子,然后被吸收。那两个内部粒子的动量 k k k 不被守恒律固定——它们只需要加起来等于光子的动量。所以 k k k 是自由的,你对所有可能的 k k k 积分。
树图 没有闭合圈。所有内部粒子的动量完全由守恒律固定——这给出有限的、看起来像经典的结果。
圈图 有闭合的内部线圈。因为在圈里流动的动量没有 被守恒律固定,你必须对所有可能的值积分——从零到无穷大:
这是一个圈图的例子
Photon-photon scattering (one loop)
e⁻
e⁻
e⁻
e⁻
γ
γ
γ
γ
k = free
∫d⁴k over all momenta
amplitude ~ α² (4 vertices × α each)
k flows around the loop — nothing fixes it
M l o o p ∼ ∫ 0 ∞ d 4 k ( 2 π ) 4 I ( k ) \mathcal{M}_{\rm loop} \sim \int_0^\infty \frac{d^4k}{(2\pi)^4}\; \mathcal{I}(k) M loop ∼ ∫ 0 ∞ ( 2 π ) 4 d 4 k I ( k )
圈积分问的问题是:每个可能”虚粒子”的动量是多少。我的意思是,我们无法观测到它,所以我们必须假设这个假想粒子——它以极低的概率有可能参与了这个相互作用。
一个粒子有4个动量分量:(k 0 , k 1 , k 2 , k 3 k_0, k_1, k_2, k_3 k 0 , k 1 , k 2 , k 3 ),能量(k 0 k_0 k 0 )加上三个空间方向上的动量。
d 4 d^4 d 4 意味着你在4维动量空间中积分。
函数 I ( k ) \mathcal{I}(k) I ( k ) 通常在 k → ∞ k \to \infty k → ∞ 时衰减不够快,所以积分发散。图中独立圈的数量 L L L 决定了你面对多少不受约束的动量积分——对于引力,每增加一个圈情况都会急剧恶化。
这是完整积分实际看起来的样子,从简写中给出一些清晰度:
∫ − ∞ ∞ d k 0 ∫ − ∞ ∞ d k 1 ∫ − ∞ ∞ d k 2 ∫ − ∞ ∞ d k 3 1 ( k 0 ) 2 − ( k 1 ) 2 − ( k 2 ) 2 − ( k 3 ) 2 − m 2 \int_{-\infty}^{\infty} dk^0 \int_{-\infty}^{\infty} dk^1 \int_{-\infty}^{\infty} dk^2 \int_{-\infty}^{\infty} dk^3 \frac{1}{(k^0)^2 - (k^1)^2 - (k^2)^2 - (k^3)^2 - m^2} ∫ − ∞ ∞ d k 0 ∫ − ∞ ∞ d k 1 ∫ − ∞ ∞ d k 2 ∫ − ∞ ∞ d k 3 ( k 0 ) 2 − ( k 1 ) 2 − ( k 2 ) 2 − ( k 3 ) 2 − m 2 1
再次提醒,记住核心思路:你在所有维度上积分,以对所有可能的动量状态求和。
那当你的圈积分发散时怎么办?
我们决定想个办法,直接停止积分!字面意思——在某个大动量 Λ \Lambda Λ 处直接停下来,看看不考虑所有可能动量是否能搞清楚,理论只对更低的动量状态适用,而大多数生活就发生在那里。
我们设一个人为偏低的常数 k < Λ k < Λ k < Λ 。你的积分现在有限了,但依赖于 Λ Λ Λ 。
物理直觉是高动量意味着短距离。紫外截断隐含地说的是:“我不信任我的理论在能量 Λ Λ Λ 以上,但对大多数其他正常情况,我们能做出非常有用的东西。“
Tree Level: D = 0
D = 0 (finite)
amplitude ~ κ²
树图:有限,无需积分
One Loop: D = 4
∫d⁴k
D = 4 ~ Λ⁴ ln Λ
quartically divergent
一圈:∼ Λ⁴,产生新的 R² 抵消项
Two Loops: D = 6
D = 6 ~ Λ⁶
Goroff-Sagnotti (1985)
两圈:Goroff & Sagnotti 的决定性结果
电荷和质量的推导
对于我们一直在讨论的光子相互作用,你可以这样建模所有可能的相互作用:
∫ d 4 k − i g μ ν k 2 ⋅ 1 ( p − k ) 2 − m 2 \int d^4k \frac{-ig_{\mu\nu}}{k^2} \cdot \frac{1}{(p-k)^2 - m^2} ∫ d 4 k k 2 − i g μν ⋅ ( p − k ) 2 − m 2 1
从大 k k k 处(k ≫ p k \gg p k ≫ p )的被积函数开始:
( p − k ) 2 = k 2 − 2 p ⋅ k + p 2 ≈ k 2 (p-k)^2 = k^2 - 2p\cdot k + p^2 \approx k^2 ( p − k ) 2 = k 2 − 2 p ⋅ k + p 2 ≈ k 2
所以被积函数变为:
− i g μ ν k 2 ⋅ 1 k 2 = − i g μ ν k 4 \frac{-ig_{\mu\nu}}{k^2} \cdot \frac{1}{k^2} = \frac{-ig_{\mu\nu}}{k^4} k 2 − i g μν ⋅ k 2 1 = k 4 − i g μν
现在换到4D球坐标。在4D中,半径 k k k 处的球壳表面积 ∼ k 3 \sim k^3 ∼ k 3 ,所以:
d 4 k → k 3 d k d^4k \to k^3 dk d 4 k → k 3 d k
积分变为:
∫ 0 Λ k 3 d k k 4 = ∫ 0 Λ d k k = log ( Λ ) \int_0^\Lambda \frac{k^3\, dk}{k^4} = \int_0^\Lambda \frac{dk}{k} = \log(\Lambda) ∫ 0 Λ k 4 k 3 d k = ∫ 0 Λ k d k = log ( Λ )
所以完整积分分解为:
有限部分 + e 2 log ( Λ ) \text{有限部分} + e^2 \log(\Lambda) 有限部分 + e 2 log ( Λ )
发散是一个单独的对数。它与拉格朗日量中已有的电荷项具有相同的形式——所以对 e e e 重新定义一次,在每一圈阶都能吸收它。
我们不知道光子能量的真实值。我们只有这个在尝试求解该积分时”吸收”有限部分的极其精确的近似。我们实际上不知道电子的”真实”电荷,因为它永远无法被观测。
用同样的方法对引力行不通
对引力来说:
∫ d 4 k k μ k ν k ρ k σ k 4 ⋅ 1 ( p − k ) 2 − m 2 \int d^4k \frac{k^{\mu}k^{\nu}k^{\rho}k^{\sigma}}{k^4} \cdot \frac{1}{(p-k)^2 - m^2} ∫ d 4 k k 4 k μ k ν k ρ k σ ⋅ ( p − k ) 2 − m 2 1
∫ d 4 k ⋅ const ∼ ∫ k 3 d k → ∞ \int d^4k \cdot \text{const} \sim \int k^3 dk \to \infty ∫ d 4 k ⋅ const ∼ ∫ k 3 d k → ∞
这叫四次发散。每一圈阶都产生新类型的发散,需要一个新参数——无穷多个参数,没有预测能力。
在QED中,发散与拉格朗日量中已有某一项具有相同的形式,所以你只需重新定义那一个数。
长话短说,你无法把发散定义为映射到实验的常数。如果你想深入了解,我们在下面详细展开。
发散度
发散度 D D D 是对费曼图(再次说明,就是我们一直在谈的那个积分的表示)发散程度的幂次计数估计。
对于4维时空中的圈积分,你有 d 4 k d^4k d 4 k ——来自积分测度的四次动量。分母中的传播子压制它,顶点中的导数因子在分子中增加 k k k 的幂次。被积函数中 k k k 的净幂次(即指数)就是发散度:
图 ∼ ∫ d 4 k k n n u m k n d e n ⟹ D = 4 + n n u m − n d e n \text{图} \sim \int d^4k \; \frac{k^{n_{\rm num}}}{k^{n_{\rm den}}} \implies D = 4 + n_{\rm num} - n_{\rm den} 图 ∼ ∫ d 4 k k n den k n num ⟹ D = 4 + n num − n den
D > 0 D > 0 D > 0 :图以 Λ D \Lambda^D Λ D 发散(幂律发散)
D = 0 D = 0 D = 0 :对数发散,∼ ln Λ \sim \ln \Lambda ∼ ln Λ
D < 0 D < 0 D < 0 :表面上收敛(单张图有限)
在可重正化理论(如QED)中,D D D 只依赖于图中的外部 粒子——而不依赖于圈阶 L L L 。所以你只会遇到有限组的发散结构,都能被一组固定的抵消项吸收。
对于引力,D = 2 + 2 L D = 2 + 2L D = 2 + 2 L ——它随圈阶线性增长,在微扰论每一阶都产生新的、不等价的无穷大。
在所有其他成功的量子场论中——量子电动力学、弱力、量子色动力学——我们确实从虚粒子圈遇到无穷大。但这些无穷大是可控的 :它们可以通过一种叫做重正化 的程序被吸收进一小组固定的物理参数(质量和耦合常数)中。一旦你通过测量固定了这些参数,所有预测都是有限的并与实验吻合。
可重正化性意味着独立无穷大的数量等于你可以调节的自由参数数量。一个具有无穷多个不等价无穷大的理论没有预测能力 。
广义相对论,当围绕平直时空量子化(即没有引力、没有曲率)g μ ν = η μ ν + 32 π G h μ ν g_{\mu\nu} = \eta_{\mu\nu} + \sqrt{32\pi G}\, h_{\mu\nu} g μν = η μν + 32 π G h μν 时,给出更多发散的圈图。你需要无穷多次测量来固定无穷多个参数——使理论无法使用。
D = 2 + 2 L D = 2 + 2L D = 2 + 2 L 从哪来
对于有 L L L 个圈、I I I 条内部引力子线和 V n V_n V n 个 n n n 类顶点(每个携带 n d = 2 n_d = 2 n d = 2 个导数)的费曼图:
D = 4 L − 2 I + 2 ∑ n V n D = 4L - 2I + 2\sum_n V_n D = 4 L − 2 I + 2 ∑ n V n
利用 L = I − V + 1 L = I - V + 1 L = I − V + 1 :
D = 4 L − 2 I + 2 ( V − 1 ) = 4 L − 2 ( I − V ) − 2 = 4 L − 2 ( L − 1 ) − 2 = 2 L + 2 D = 4L - 2I + 2(V-1) = 4L - 2(I - V) - 2 = 4L - 2(L-1) - 2 = 2L + 2 D = 4 L − 2 I + 2 ( V − 1 ) = 4 L − 2 ( I − V ) − 2 = 4 L − 2 ( L − 1 ) − 2 = 2 L + 2
在 L L L 圈处,图以 Λ 2 + 2 L \Lambda^{2+2L} Λ 2 + 2 L 发散——在每一阶产生新的不等价无穷大。
为什么质量量纲为负 = 不可重正化
想象一个 L L L 圈的引力圈图。耦合 κ \kappa κ 出现 2 ( L + 1 ) 2(L+1) 2 ( L + 1 ) 次(每个顶点两次,每圈加外部一对)。要让振幅是无量纲的:
M l o o p ( L ) ∼ κ 2 ( L + 1 ) ⋅ Λ 2 + 2 L = ( Λ M P l ) 2 + 2 L ⋅ Λ 0 \mathcal{M}^{(L)}_{\rm loop} \;\sim\; \kappa^{2(L+1)} \cdot \Lambda^{2+2L} \;=\; \left(\frac{\Lambda}{M_{\rm Pl}}\right)^{2+2L} \cdot \Lambda^0 M loop ( L ) ∼ κ 2 ( L + 1 ) ⋅ Λ 2 + 2 L = ( M Pl Λ ) 2 + 2 L ⋅ Λ 0
发散的层级: 在每一圈阶 L L L ,我们得到一个新的发散 ∼ ( Λ / M P l ) 2 + 2 L \sim (\Lambda/M_{\rm Pl})^{2+2L} ∼ ( Λ/ M Pl ) 2 + 2 L ,乘以一个新算符。这些算符有越来越多的导数和曲率张量,每个都需要一个新的 自由参数来吸收。这个理论有无穷多个自由参数。
✓ QED(可重正化)
耦合:e ,[e] = M⁰(无量纲)
每圈发散:∼ ln Λ 或 Λ²
全部被以下吸收:δme , δe, δZψ , δZA
3个参数 → 重正化后所有阶有限
✗ 量子引力(不可重正化)
耦合:κ,[κ] = M⁻¹
L圈处发散:∼ Λ2+2L
需要新算符:R², R³, Rμν Rμν , Rμνρσ ³, …
∞ 个参数 → 理论无预测能力
有效场论的视角
还有一线希望:在普朗克尺度以下(E ≪ M P l ≈ 1.22 × 10 19 E \ll M_{\rm Pl} \approx 1.22 \times 10^{19} E ≪ M Pl ≈ 1.22 × 1 0 19 GeV),量子引力是有效的。更高圈的修正被 ( E / M P l ) 2 ∼ 10 − 38 (E/M_{\rm Pl})^2 \sim 10^{-38} ( E / M Pl ) 2 ∼ 1 0 − 38 的幂次压制——在可及能量下完全可以忽略不计。这就是经典广义相对论为什么有效的原因。
我们应该从中得出的结论是,量子引力不是一个完整的、紫外有限的理论 。它需要在普朗克尺度处得到补全(这就是”弦理论”或”圈量子引力”可以被代入的地方)。
动量积分的可视化
核心对象是对虚引力子动量 k k k 的一圈积分:
I ( L , Λ ) = ∫ 0 Λ d 4 k ( 2 π ) 4 ⋅ k 2 L ( k 2 ) 2 = 1 ( 2 π ) 4 ⋅ 2 π 2 ∫ 0 Λ d k k 3 ⋅ k 2 L k 4 = π 2 8 π 4 ∫ 0 Λ d k k 2 L − 1 I(L,\Lambda) = \int_0^\Lambda \frac{d^4k}{(2\pi)^4} \cdot \frac{k^{2L}}{(k^2)^2} = \frac{1}{(2\pi)^4} \cdot 2\pi^2 \int_0^\Lambda dk\; k^3 \cdot \frac{k^{2L}}{k^4} = \frac{\pi^2}{8\pi^4} \int_0^\Lambda dk\; k^{2L-1} I ( L , Λ ) = ∫ 0 Λ ( 2 π ) 4 d 4 k ⋅ ( k 2 ) 2 k 2 L = ( 2 π ) 4 1 ⋅ 2 π 2 ∫ 0 Λ d k k 3 ⋅ k 4 k 2 L = 8 π 4 π 2 ∫ 0 Λ d k k 2 L − 1
I ( L , Λ ) ∝ ∫ 0 Λ d k k 2 L − 1 = Λ 2 L 2 L \boxed{I(L,\Lambda) \;\propto\; \int_0^\Lambda dk\; k^{2L-1} \;=\; \frac{\Lambda^{2L}}{2L}} I ( L , Λ ) ∝ ∫ 0 Λ d k k 2 L − 1 = 2 L Λ 2 L
QED-like: Integrand ∼ 1/k
0
0.5
1.0 = Λ
10
0
Virtual momentum k
∼ 1/k
∫ dk/k = ln Λ
→ finite ✓
QED:被积函数快速衰减——积分是对数发散的,被重正化吸收
Gravity: k^(2L-1), each loop worse
0
Λ → ∞
1
0
Virtual momentum k
L=1: k¹
L=2: k³
L=3: k⁵
→ ∞
引力:每一圈阶 L 给出增长更快的被积函数——所有的都在 Λ→∞ 时发散
左侧面板显示QED被积函数 ∼ 1 / k \sim 1/k ∼ 1/ k :快速衰减,曲线下面积有限(对数发散,容易重正化)。右侧面板显示 L = 1 , 2 , 3 L=1,2,3 L = 1 , 2 , 3 的引力被积函数 k 2 L − 1 k^{2L-1} k 2 L − 1 :每条都随 k k k 增长,积分 ∝ Λ 2 L \propto \Lambda^{2L} ∝ Λ 2 L 在 Λ → ∞ \Lambda\to\infty Λ → ∞ 时爆炸——每一圈阶都比前一阶严格更糟。
对 L = 1 L=1 L = 1 (一个引力子圈),被积函数以 k k k 增长,给出 Λ 2 \Lambda^2 Λ 2 。对 L = 2 L=2 L = 2 它以 k 3 k^3 k 3 增长,给出 Λ 4 \Lambda^4 Λ 4 。对 L = 3 L=3 L = 3 是 k 5 k^5 k 5 ,给出 Λ 6 \Lambda^6 Λ 6 。每一圈阶都需要一个全新的抵消项——理论产生无穷多个不等价无穷大的塔。
为什么QED有效而引力无效
量子电动力学与微扰量子引力的幂次计数详细比较,精确说明了为什么一个理论可重正化而另一个不可以。
属性 QED(光子) 微扰引力(引力子) 自旋 1 2 耦合常数 e e e ,无量纲 [ M 0 ] [M^0] [ M 0 ] κ = 32 π G \kappa = \sqrt{32\pi G} κ = 32 π G ,[ M − 1 ] [M^{-1}] [ M − 1 ] 传播子 ∼ \sim ∼ 1 / k 2 1/k^2 1/ k 2 1 / k 2 1/k^2 1/ k 2 顶点动量增长 ∼ k 1 \sim k^1 ∼ k 1 (规范耦合)∼ k 2 \sim k^2 ∼ k 2 (曲率 = 二阶导数)表面发散度 D D D D = 4 − E D = 4 - E D = 4 − E (随外腿数 E E E 减小)D = 2 + 2 L D = 2 + 2L D = 2 + 2 L (随圈阶增长)1圈处的发散 ∼ ln Λ \sim \ln\Lambda ∼ ln Λ (对数,可重正化)∼ Λ 4 \sim \Lambda^4 ∼ Λ 4 (四次方!)产生的新算符 原始拉格朗日量之外没有 R 2 , R μ ν 2 , R 3 , … R^2, R_{\mu\nu}^2, R^3, \ldots R 2 , R μν 2 , R 3 , … (无穷多个)所需自由参数 3 个(m e , e , δ Z m_e, e, \delta Z m e , e , δ Z ) ∞(每圈阶一个) 可重正化? ✓ 是——在所有阶可预测 ✗ 否——在树图阶之上无法预测 决定性证明 Dyson 1949 Goroff & Sagnotti 1985;van de Ven 1992
这对物理学意味着什么
有效场论的裁定
Donoghue(1994)证明量子引力可以被当作普朗克尺度以下的有效场论来处理。牛顿势的领头量子修正是:
V ( r ) = − G m 1 m 2 r [ 1 + 3 G ( m 1 + m 2 ) r c 2 + 41 G ℏ 10 π r 2 c 3 + ⋯ ] V(r) = -\frac{G m_1 m_2}{r} \left[ 1 + \frac{3G(m_1+m_2)}{r c^2} + \frac{41G\hbar}{10\pi r^2 c^3} + \cdots \right] V ( r ) = − r G m 1 m 2 [ 1 + r c 2 3 G ( m 1 + m 2 ) + 10 π r 2 c 3 41 G ℏ + ⋯ ]
第二项是经典后牛顿修正。第三项,与 ℏ \hbar ℏ 成正比,是真正的量子引力修正——在普朗克尺度以下可以计算且无歧义。在 r = 1 r = 1 r = 1 米处,量级为 10 − 82 10^{-82} 1 0 − 82 ——小到无法测量。
提议的紫外补全
几种方法试图提供量子引力的紫外完整理论:
弦理论 — 用一维弦替代点粒子;引力子是弦的振动模式。通过大质量弦激发的无穷塔实现紫外有限性。
圈量子引力 — 在普朗克尺度处将时空离散化;时空本身具有量子结构,提供天然的紫外调节器。
渐近安全 — 提出牛顿常数流向非高斯紫外不动点,使理论在没有新自由度的情况下紫外完整。
因果动力学三角剖分 — 量子引力的格状表述,使用具有因果结构的Regge微积分。
N = 8 \mathcal{N}=8 N = 8 超引力
结论: 不幸的是,自然界在普朗克尺度 E P l ≈ 10 19 E_{\rm Pl} \approx 10^{19} E Pl ≈ 1 0 19 GeV 处需要新物理。这个探索是科学中最深刻的问题之一。
下次你遇到一个因为没法认真搞懂这个领域真正在发生什么而抓狂的人,把这篇文章发给他们。
1 16 π G ∫ R − g d 4 x ⏟ 广义相对论 → 量子化 ∑ L = 0 ∞ ℏ L M ( L ) ⏟ 发散: D = 2 + 2 L ⟹ ? ⏟ 量子引力 \underbrace{\frac{1}{16\pi G}\int R\,\sqrt{-g}\,d^4x}_{\text{广义相对论}} \xrightarrow{\text{量子化}} \underbrace{\sum_{L=0}^{\infty} \hbar^L \mathcal{M}^{(L)}}_{\text{发散:}D=2+2L} \implies \underbrace{?}_{\text{量子引力}} 广义相对论 16 π G 1 ∫ R − g d 4 x 量子化 发散: D = 2 + 2 L L = 0 ∑ ∞ ℏ L M ( L ) ⟹ 量子引力 ?
另外,欢迎给我发更正,我希望把这个搞对。
*不可重正化性的决定性证明来自Goroff和Sagnotti的两圈计算。他们发现了一个发散抵消项:
L d i v ( 2 -loop ) = 209 2880 ⋅ κ 4 ( 4 π ) 4 ⋅ 1 ϵ ⋅ R μ ν ρ σ R ρ σ λ κ R λ κ μ ν \mathcal{L}_{\rm div}^{(2\text{-loop})} = \frac{209}{2880}\cdot\frac{\kappa^4}{(4\pi)^4}\cdot\frac{1}{\epsilon} \cdot R_{\mu\nu}{}^{\rho\sigma} R_{\rho\sigma}{}^{\lambda\kappa} R_{\lambda\kappa}{}^{\mu\nu} L div ( 2 -loop ) = 2880 209 ⋅ ( 4 π ) 4 κ 4 ⋅ ϵ 1 ⋅ R μν ρ σ R ρ σ λκ R λκ μν
这个算符 R μ ν ρ σ 3 R_{\mu\nu\rho\sigma}^3 R μν ρ σ 3 (黎曼张量的三次方,六阶导数)不 出现在原始爱因斯坦-希尔伯特作用量中。其发散系数为 209/2880 ≈ 0.0726 ——非零,所以无法调节掉。需要一个全新的抵消项,而且没有实验手段可以确定它。
物理学:爱因斯坦-希尔伯特作用量 · Goroff & Sagnotti(1985)· van de Ven(1992)· Donoghue(1994)
参考文献:Zee,《一个坚果壳里的量子场论》· Donoghue,Phys. Rev. Lett. 72(1994)· Goroff & Sagnotti,Nucl. Phys. B 266(1986)
特别感谢AI工具提供的无限辅导和非常有帮助的图表。就是这样了。