线性代数中的量子力学

发表于 2019/02/26

不久前偶然翻出来去年写的纯粹数学前沿的课程作业,当时刚看完《Quantum Mechanics: The Theoretical Minimum》,所以写的是简单的量子力学。因为是赶制出来的,内容也不是很详细(比如甚至连密度矩阵都没提),主要是强调特征值。感觉作为简单的量子力学总结/入门可能有点用?所以就把 LaTeX 改写成 Markdown 发到博客上了。有点凑数之嫌

标题是故意这么写的,强调我完全不懂量子力学。[滑稽.jpg]

量子力学中的特征值问题

量子与经典的分野在哪里?有两个最重要的区别。

观测影响状态。 在一个经典系统中,当我们观测一个物理量(下称可观测量,observable)时,我们认为对这个被观测系统的影响足够小,可以忽略掉。 而一个量子系统由于极其微小,观测这个系统将会对这个系统造成不可忽略的影 响。这导致了量子力学中状态和观测结果的区别。

逻辑基础不同。 在经典力学中,对于命题 A 且 B,我们可以分别验证 A 和 B 的真 值,然后通过的意义,推断出 A 且 B 命题的真值。 而在量子力学中,由于观测会影响状态,如果观测 A 可以影响 B 的真值,那 么 A 且 B 和 B 且 A 就不再等价。这意味着量子力学使 用的是完全不同的一套逻辑基础。

简单起见,下文主要以最简单的离散可观测量自旋(spin,或称 qubit)为例,随后推广到连续可观测量。

状态

最简单的量子系统就是单自旋系统。在这个系统中,我们可以将可观测 量 σ 准备到一个特定方向(即放置在某种状态),使得在这个特定方向 可以一直测出 σ = 1。由于 σ 是一个 3-矢量,它由 3 个方向的成 分组成,因而可以认为上下、左右、前后三个方向的自旋是三个可观测量。这里 不妨假定我们准备的这个方向是朝上的,记为 σu = 1,反过来说,向下方 向的测量将永远是 -1,记为 σd =  − 1

那么在左右和前后方向测量呢?和经典物理大不相同,在向左方向测 量 σl 和向内方向测量的结果 σi 均会产生随机的 -1 和 +1 数 值,但如果大量测量(测量前将系统准备到之前的状态,或测量大量同状态的系 统),将发现这些 -1 和 +1 出现的机会差不多。

为此,我们引入态矢(state-vector)概念,即一个状态由复数组成的 列矢量表示。如上面的自旋向上系统,可以用态矢表示为 |ψ⟩=1|u⟩ + 0|d。可以看出,状态空间是一个复 数组成的 2 维向量空间,一组基底为 {|u⟩,|d⟩}。 这里 |u 表示自旋向上,|d 表示自旋向下。

一个一般的态矢可表示为 |ψ⟩=αu|u⟩ + αd|d (如果 αdαu 均不为 0,则称为叠加态(superposition)),那么对其中的系数有什么要求呢?物理实验证实, $_u^*_u $ 是在向上方向上测出 +1 的概率。如果我们在向上方向上观测,要么测出 +1,要么测出 -1,那么概率必定归一,即 P_u + P_d = 1,其中 $P\_u = \alpha\_u^*\alpha\_u, P\_d = \alpha\_d^\*\alpha_d$x* 表示 x 的复数共轭。这也就是说,ψ|ψ⟩ = 1

可观测量

从上节可以看到,尽管自旋在上下方向上,但我们仍可以在左右、 前后方向上测出结果,只是结果是随机的而已。根据测出 +1 的概率 为 $\frac{1}{2}$、概率归一和正交性不难算出,

$$ |r\rangle = \frac{1}{\sqrt 2}|u\rangle + \frac{1}{\sqrt 2}|d\rangle $$ $$ |l\rangle = \frac{1}{\sqrt 2}|u\rangle - \frac{1}{\sqrt 2}|d\rangle $$ $$ |i\rangle = \frac{1}{\sqrt 2}|u\rangle + \frac{i}{\sqrt 2}|d\rangle $$ $$ |o\rangle = \frac{1}{\sqrt 2}|u\rangle - \frac{i}{\sqrt 2}|d\rangle $$

这就说明了 |u⟩,|d 是一组完备的基底。为了方便起见,我们 希望有一种方法能将这两个东西“打包”放在一起。于是我们找到了矩阵这个数 学工具——显然,可以选取2 × 2矩阵,使得其特征向量为正交完备系!

我们希望选取的这个矩阵(记为 σz)的特征向量正好是 |u, |d ,而特征值本身可以用来表达测量结果,即

如果选取具体表示 |u⟩ = (1,0)T, |d⟩ = (0,1)T ,则不难算出

$$ \begin{eqnarray} \sigma_z =& \left( \begin{array}{cc} 1&0\\ 0&-1 \end{array} \right)\\ \sigma_x =& \left( \begin{array}{cc} 0&1\\ 1&0 \end{array} \right)\\ \sigma_y =& \left( \begin{array}{cc} 0&-i\\ i&0 \end{array} \right) \end{eqnarray} $$

这就是著名的Pauli 矩阵

物理学中,观测结果 r 必定是实数,换句话说 r* = r。对量子力学来说也 不例外,一个可观测量用一个线性算子 $\bf{L}$ 表示,而这个线性算子需满 足 $\bf{L}^\dagger = \bf{L}$,也就是说 $\bf{L}$ 必是 Hermitian 算子,不 难证明 Hermitian 算子的特征值均为实数,与预期相符。

从这里可以看到,线性代数理论在量子力学中占据重要地位:几乎所有物理量都 要被表示成一个线性算子,并讨论它的特征值和特征向量。

合成系统与量子纠缠

与经典系统的一个显著不同是合成量子系统可能有纠缠(entanglement)现象。

比如,可以将两个自旋系统 A 和 B 放在一起组成一个合成系统。A 和 B 的状态 空间分别为 SA, SB,那么 AB 合成系统的状态空间就是 SAB = SA ⊗ SB,这里 表示张量积。

如果 A 和 B 的状态 |A⟩, |B 均已知(它们是对易的,因此可以同时指定并获知。详见下文。),那么不难看 出

|AB⟩ = |A⟩ ⊗ |B⟩ = αuβu|uu⟩ + αuβd|ud⟩ + αdβu|du⟩ + αdβd|dd

这种可以分解为两个状态的积的状态,就叫 做积状态(product state)。

但一般的,有的状态并不能被分解,比如 $\vert sing\rangle = \frac{1}{\sqrt 2}(\vert ud\rangle - \vert du\rangle)$。下面考察这 个状态的性质。为了方便,将 A 的自旋算子记为 σ,将 B 的自旋算子记 为 τ

显然,τ 不会影响 |A,而 σ 也不会影响 |B。 计算 σz 的期望 σz⟩ = ⟨sing|σz|sing⟩ = 0,同理,σx⟩ = ⟨σy⟩ = ⟨τx⟩ = ⟨τy⟩ = ⟨τz⟩ = 0。 这意味着在这个状态下,就算我们知道了系统的状态,也对每个子系统的测量结 果无法作出任何预测!

反过来,复合可观测量 τzσz 的观测值必为 -1,这是因 为 τzσz|sing⟩ =  − |sing。这意味着,如 果 A 测出 σz =  + 1,那么 B 必然测出 τz =  − 1

也许单独看这两点并不令人惊讶,但合起来看,就发现对于复合状 态 |sing,我们对子系统一无所知,但却能找到子系统观测结果之间的 关系!像 |sing 这样的知道一个观测结果就确定性知道另一个观测结 果的状态就叫做最大纠缠态(maximally entangled state)。

从离散到连续——希尔伯特空间

为了考察运动,我们有必要研究位置和动量这种具有连续取值的可观测量。

首先引入波函数(wave function)的概念。若已知一个(离散)状 态 |ψ⟩ = ∑iλi|λi,那么就定义波函数

ψ(|λi⟩) = λi

也就是这个状态 |λi 的系数。根据系数的物理意义,容易得到

P(λi) = ψ(|λi⟩)*ψ(|λi⟩)

由归一性,可知

iψ(|λi⟩)*ψ(|λi⟩) = 1

容易看到,波函数与态矢一一对应。

由于函数易于拓展为连续的,首先需要保留归一性,

−∞+∞ψ(x)*ψ(x)dx = 1

对于连续状态,可以考虑希尔伯特空间中的内积,

Ψ|Φ⟩ = ∫−∞+∞ψ*(x)ϕ(x)dx

这样,我们将离散的普通向量,转换为希尔伯特空间中的特殊的连续向量(波函 数),自然地从离散世界进入了连续世界。

现在有两个很自然的问题:

第一个问题较为简单,只需满足公理即可称为线性算子。有两个最简单的算 子 $\bf X, D$

$$ {\bf X} \psi(x) = x\psi(x) $$

$$ {\bf D} \psi(x) = \frac{\mathrm{d} \psi(x)}{\mathrm{d} x} $$

易于验证,这两个算子是线性的。首先考察这两个算子的 Hermitian 性质。为此 将 Hermitian 推广为

$$ \langle\Psi\vert {\bf L}\vert \Phi\rangle = \langle\Phi\vert {\bf L}\vert \Psi\rangle^* $$

验证知,$\bf X$ 是 Hermitian 算子,而 $\bf D$ 是反 Hermitian 算子 ($\langle\Psi\vert {\bf D}\vert \Phi\rangle = -\langle\Phi\vert {\bf D}\vert \Psi\rangle^*$)。所以我们给 $\bf D$ 增加  − i 系数使之成 为 Hermitian 算子,记为 $\bf P$

下面考察这两个算子(${\bf X}, {\bf P}$)的特征值和特征向量。

$$ {\bf X} \psi(x) = x\psi(x) = x_0\psi(x) $$

(xx0)ψ(x) = 0

$\bf X$ 有无数个特征值 x0,考虑归一性条件,容易得到一个特征 值 x0 对应的特征向量 ψ(x) = δ(xx0)。这个物理意义十分清晰: 粒子在 x ≠ x0 处的概率为 0,即粒子只能在 x = x0 处,对应着位置。 这与我们的预期相符。

$$ {\bf P} \psi(x) = -i\hbar \frac{\mathrm{d} \psi(x)}{\mathrm{d} x} = p\psi(x) $$ $$ \psi_p(x) = \frac{1}{\sqrt {2\pi}} e^{\frac{ipx}{\hbar}} $$

$\bf P$ 有无数个特征值 p,对应的特征向量为 ψp(x)。这个算子对 应着动量。注意这里是在 x 空间中表达的向量。在这里,能看到 了的影子,也就是为什么波函数被叫做波函 数:$\psi_p(x+\frac{2\pi\hbar}{p})=\psi_p(x)$

为了将 ψp(x) 的基底换为 p(也就是转换成以 p 为自变量的函数), 注意到

$$ \psi(x) = \langle x \vert \Psi\rangle \\ \langle p\vert x \rangle = \frac{1}{\sqrt {2\pi}} e^{-\frac{ipx}{\hbar}}\\ \tilde \psi(p) = \langle p\vert \Psi\rangle = \int \mathrm{d}x \langle p\vert x \rangle \langle x\vert \Psi \rangle=\frac{1}{\sqrt {2\pi}}\int \mathrm{d}x e^{-\frac{ipx}{\hbar}} \psi(x) $$

事实上,就是对 ψ(x) 进行傅里叶变换。不难得到,

$$ \tilde \psi(p) =\frac{1}{\sqrt {2\pi}}\int \mathrm{d}x e^{\frac{-ipx}{\hbar}} \psi(x)\\ \psi(p) = \frac{1}{\sqrt {2\pi}}\int \mathrm{d}x e^{\frac{ipx}{\hbar}} \tilde\psi(x) $$

时间与变化

首先需要考察状态随时间的变化。不妨设

$$ \label{eq:psi-t} \vert \psi(t)\rangle = {\bf U}(t)\vert \psi(0)\rangle $$

这表示系统在不受外界作用下自发地进行确定性演化的过程。 若 |ΨΦ 是两个可以区分的状态,那么它们永远是 正交的,

$$ \langle\Psi(t)\vert \Phi(t)\rangle = 0\\ \langle\Phi(t)\vert \Psi(t)\rangle = 0 $$

展开来看,就是

$$ \langle\Psi(0)\vert {\bf U}(t)^\dagger {\bf U}(t)\vert \Phi(0)\rangle = 0\\ \langle\Phi(0)\vert {\bf U}(t)^\dagger {\bf U}(t)\vert \Psi(0)\rangle = 0 $$

$$ {\bf U}(t)^\dagger {\bf U}(t) = I $$ 这意味着态矢随时间的演化具有酉性质。

我们认为这个演化过程是连续的,即

$$ {\bf U}(\epsilon) = I - i \epsilon \bf H $$

根据 $\bf U$ 的酉性质,可以得到

$$ {\bf H}^\dagger = \bf H $$

$\bf H$ 是 Hermitian 算子。我们将 ${\bf H}$ 代表的物理量叫做广 义 Hamiltonian,代表系统的总能量。

${\bf U}(\epsilon) = I - i \epsilon \bf H$ 代入本节第一个方程可以得到

$$ \vert \Psi(\epsilon)\rangle = \vert \Psi(0)\rangle - i\epsilon \bf H\\ \frac{\vert \Psi(\epsilon)\rangle - \vert \Psi(0)\rangle}{\epsilon} = -i \bf H\\ \frac{\partial \vert \Psi(t)\rangle}{\partial t} = -i \bf H $$

将最后一个方程称为广义薛定谔方程,这个方程的量纲并不正确($\bf H$ 代表 能量),修正得到

$$ \hbar \frac{\partial \vert \Psi(t)\rangle}{\partial t} = -i \bf H $$

由于量子可观测量的期望一般有着直接的经典对应,所以我们想要知道一个可观 测量的期望随时间的变化,即

$$ \begin{align*} &\frac{\mathrm d}{\mathrm dt} \langle {\bf L} \rangle\\ =& \frac{\mathrm d}{\mathrm dt} \langle \Psi(t) \vert {\bf L} \vert \Psi(t) \rangle\\ =& \frac{i}{\hbar} \langle \Psi(t) \vert [{\bf HL - LH}] \vert \Psi(t) \rangle\\ =& \frac{i}{\hbar} \langle \Psi(t) \vert {\bf [H,L]} \vert \Psi(t) \rangle \end{align*} $$

即,

$$ \frac{\mathrm d}{\mathrm d t} \langle {\bf L} \rangle = -\frac{i}{\hbar} \langle {\bf [L,H]} \rangle $$

其中 $\bf [H,L] = HL-LH$ 叫做 L 关于 H 的对易子。这将可观测量 $\bf L$ 的期望随时间的变化与另一个可观测量的期望联系了起来。如果一个量 $\bf Q$ 关于 $\bf H$ 的对易子 ${\bf [H,Q]}$ 为 0,就意味着量 $\bf Q$ 不随时间变 化,即 $\bf Q$ 是守恒的。

不确定关系

假设我们要同时观测两个量 $\bf L, M$,那么考虑 $\bf L, M$ 的公共特征向 量,

$$ {\bf L} \vert \lambda_i, \mu_a\rangle = \lambda_i \vert \lambda_i, \mu_a\rangle\\ {\bf M} \vert \lambda_i, \mu_a\rangle = \mu_a \vert \lambda_i, \mu_a\rangle $$

进一步地,

$$ {\bf LM} \vert \lambda_i, \mu_a\rangle = \lambda_i \mu_a \vert \lambda_i, \mu_a\rangle\\ {\bf ML} \vert \lambda_i, \mu_a\rangle = \mu_a \lambda_i \vert \lambda_i, \mu_a\rangle $$

这意味着,

$$ {\bf [L,M]} \vert \lambda_i, \mu_a\rangle = 0 $$

我们知道 $\bf L, M$ 的公共特征向量是完备的,这就强迫 ${\bf [L,M]} = 0$。也就是说,如果我们要同时测量两个量,这两个量必须是对 易的,否则不能同时测量。

一个很自然的问题是,既然我们不能同时测量,那么在“多大程度上”我们不能 同时测量它们?也就是如何量化这个误差。为此,首先定义

$$ \bar{\mathbf{A}} = {\bf A} - \langle {\bf A} \rangle I $$

A 的方差为

$$ (\Delta \mathbf{A})^2 = \langle \Psi \vert \bar{\mathbf{A}}^2 \vert \Psi \rangle $$

在任意向量空间内,有 Cauchy-Schwarz 不等式

2|X||Y| ≥ |⟨X|Y⟩ + ⟨Y|X⟩|

$$ \vert X\rangle = \mathbf{A}\vert \Psi\rangle\\ \vert Y\rangle = i\mathbf{B}\vert \Psi\rangle $$

代入 Cauchy-Schwarz 不等式,得

$$ 2\sqrt{\langle\mathbf{A}^2\rangle \langle\mathbf{B}^2\rangle} \geq \vert \langle \Psi\vert [\mathbf{A,B}]\vert \Psi \rangle\vert $$

也就是

$$ \Delta\mathbf{A}\Delta\mathbf{B} \geq \frac{1}{2} \vert \langle \Psi\vert [\mathbf{A,B}]\vert \Psi \rangle\vert $$

这就是最通用的不确定原理。它意味着,只要量 $\bf A, B$ 不对易,那么我们 无法同时拥有关于这两个量的无歧义知识。

从上面的不等式出发,我们可以立即推导出海森堡的位置、动 量的不确定关系。

首先计算 $\bf [X,P]$

[X,P]ψ(x) = XPψ(x) − PXψ(x) = iψ(x)

${\bf [X,P]} = i\hbar$,代入通用不确定原理,即得到

$$ \Delta\mathbf{X} \Delta\mathbf{P} \geq \frac{\hbar}{2} $$

这就是著名的海森堡不确定关系。