不久前偶然翻出来去年写的纯粹数学前沿的课程作业,当时刚看完《Quantum Mechanics: The Theoretical Minimum》,所以写的是简单的量子力学。因为是赶制出来的,内容也不是很详细(比如甚至连密度矩阵都没提),主要是强调特征值。感觉作为简单的量子力学总结/入门可能有点用?所以就把 LaTeX 改写成 Markdown 发到博客上了。有点凑数之嫌

标题是故意这么写的,强调我完全不懂量子力学。[滑稽.jpg]

量子力学中的特征值问题

量子与经典的分野在哪里?有两个最重要的区别。

观测影响状态。 在一个经典系统中,当我们观测一个物理量(下称可观测量,observable)时,我们认为对这个被观测系统的影响足够小,可以忽略掉。 而一个量子系统由于极其微小,观测这个系统将会对这个系统造成不可忽略的影 响。这导致了量子力学中状态和观测结果的区别。

逻辑基础不同。 在经典力学中,对于命题 A 且 B,我们可以分别验证 A 和 B 的真 值,然后通过的意义,推断出 A 且 B 命题的真值。 而在量子力学中,由于观测会影响状态,如果观测 A 可以影响 B 的真值,那 么 A 且 B 和 B 且 A 就不再等价。这意味着量子力学使 用的是完全不同的一套逻辑基础。

简单起见,下文主要以最简单的离散可观测量自旋(spin,或称 qubit)为例,随后推广到连续可观测量。

状态

最简单的量子系统就是单自旋系统。在这个系统中,我们可以将可观测 量 $\sigma$ 准备到一个特定方向(即放置在某种状态),使得在这个特定方向 可以一直测出 $\sigma=1$。由于 $\sigma$ 是一个 3-矢量,它由 3 个方向的成 分组成,因而可以认为上下、左右、前后三个方向的自旋是三个可观测量。这里 不妨假定我们准备的这个方向是朝上的,记为 $\sigma_u=1$,反过来说,向下方 向的测量将永远是 -1,记为 $\sigma_d=-1$。

那么在左右和前后方向测量呢?和经典物理大不相同,在向左方向测 量 $\sigma_l$ 和向内方向测量的结果 $\sigma_i$ 均会产生随机的 -1 和 +1 数 值,但如果大量测量(测量前将系统准备到之前的状态,或测量大量同状态的系 统),将发现这些 -1 和 +1 出现的机会差不多。

为此,我们引入态矢(state-vector)概念,即一个状态由复数组成的 列矢量表示。如上面的自旋向上系统,可以用态矢表示为 $|\psi\rangle = 1 |u\rangle + 0 |d\rangle$。可以看出,状态空间是一个复 数组成的 2 维向量空间,一组基底为 $\lbrace|u\rangle, |d\rangle\rbrace$。 这里 $|u\rangle$ 表示自旋向上,$|d\rangle$ 表示自旋向下。

一个一般的态矢可表示为 $|\psi\rangle = \alpha_u |u\rangle + \alpha_d |d\rangle$ (如果 $\alpha_d$ 和 $\alpha_u$ 均不为 0,则称为叠加态(superposition)),那么对其中的系数有什么要求呢?物理实验证实, $\alpha_u^*\alpha_u $ 是在向上方向上测出 +1 的概率。如果我们在向上方向上观测,要么测出 +1,要么测出 -1,那么概率必定归一,即 $P_u + P_d=1$,其中 $P_u = \alpha_u^\alpha_u, P_d = \alpha_d^*\alpha_d$,$x^$ 表示 $x$ 的复数共轭。这也就是说,$\langle\psi|\psi\rangle=1$。

可观测量

从上节可以看到,尽管自旋在上下方向上,但我们仍可以在左右、 前后方向上测出结果,只是结果是随机的而已。根据测出 +1 的概率 为 $\frac{1}{2}$、概率归一和正交性不难算出,

$$ |r\rangle = \frac{1}{\sqrt 2}|u\rangle + \frac{1}{\sqrt 2}|d\rangle $$ $$ |l\rangle = \frac{1}{\sqrt 2}|u\rangle - \frac{1}{\sqrt 2}|d\rangle $$ $$ |i\rangle = \frac{1}{\sqrt 2}|u\rangle + \frac{i}{\sqrt 2}|d\rangle $$ $$ |o\rangle = \frac{1}{\sqrt 2}|u\rangle - \frac{i}{\sqrt 2}|d\rangle $$

这就说明了 $|u\rangle, |d\rangle$ 是一组完备的基底。为了方便起见,我们 希望有一种方法能将这两个东西“打包”放在一起。于是我们找到了矩阵这个数 学工具——显然,可以选取$2 \times 2$矩阵,使得其特征向量为正交完备系!

我们希望选取的这个矩阵(记为 $\sigma_z$)的特征向量正好是 $\vert u\rangle$, $\vert d\rangle$ ,而特征值本身可以用来表达测量结果,即

\begin{eqnarray} \sigma_z |u\rangle &= |u\rangle \ \sigma_z |d\rangle &= -|d\rangle \end{eqnarray}

如果选取具体表示 $\vert u\rangle = (1, 0)^T, \vert d\rangle=(0,1)^T$ ,则不难算出

$$ \begin{eqnarray} \sigma_z =& \left( \begin{array}{cc} 1&0\ 0&-1 \end{array} \right)\ \sigma_x =& \left( \begin{array}{cc} 0&1\ 1&0 \end{array} \right)\ \sigma_y =& \left( \begin{array}{cc} 0&-i\ i&0 \end{array} \right) \end{eqnarray} $$

这就是著名的Pauli 矩阵

物理学中,观测结果 $r$ 必定是实数,换句话说 $r^* = r$。对量子力学来说也 不例外,一个可观测量用一个线性算子 $\bf{L}$ 表示,而这个线性算子需满 足 $\bf{L}^\dagger = \bf{L}$,也就是说 $\bf{L}$ 必是 Hermitian 算子,不 难证明 Hermitian 算子的特征值均为实数,与预期相符。

从这里可以看到,线性代数理论在量子力学中占据重要地位:几乎所有物理量都 要被表示成一个线性算子,并讨论它的特征值和特征向量。

合成系统与量子纠缠

与经典系统的一个显著不同是合成量子系统可能有纠缠(entanglement)现象。

比如,可以将两个自旋系统 A 和 B 放在一起组成一个合成系统。A 和 B 的状态 空间分别为 $S_A, S_B$,那么 AB 合成系统的状态空间就是 $S_{AB} = S_A\otimes S_B$,这里 $\otimes$ 表示张量积。

如果 A 和 B 的状态 $\vert A\rangle, \vert B\rangle$ 均已知(它们是对易的,因此可以同时指定并获知。详见下文。),那么不难看 出

$$\vert AB\rangle = \vert A\rangle \otimes \vert B\rangle = \alpha_u\beta_u\vert uu\rangle + \alpha_u\beta_d\vert ud\rangle + \alpha_d\beta_u\vert du\rangle + \alpha_d\beta_d \vert dd\rangle$$

这种可以分解为两个状态的积的状态,就叫 做积状态(product state)。

但一般的,有的状态并不能被分解,比如 $\vert sing\rangle = \frac{1}{\sqrt 2}(\vert ud\rangle - \vert du\rangle)$。下面考察这 个状态的性质。为了方便,将 A 的自旋算子记为 $\sigma$,将 B 的自旋算子记 为 $\tau$。

显然,$\tau$ 不会影响 $\vert A\rangle$,而 $\sigma$ 也不会影响 $\vert B\rangle$。 计算 $\sigma_z$ 的期望 $\langle \sigma_z \rangle = \langle sing \vert \sigma_z \vert sing \rangle = 0$,同理,$\langle \sigma_x \rangle = \langle \sigma_y \rangle= \langle \tau_x \rangle= \langle\tau_y\rangle=\langle\tau_z\rangle = 0$。 这意味着在这个状态下,就算我们知道了系统的状态,也对每个子系统的测量结 果无法作出任何预测!

反过来,复合可观测量 $\tau_z \sigma_z$ 的观测值必为 -1,这是因 为 $\tau_z\sigma_z\vert sing\rangle = - \vert sing\rangle$。这意味着,如 果 A 测出 $\sigma_z = +1$,那么 B 必然测出 $\tau_z=-1$!

也许单独看这两点并不令人惊讶,但合起来看,就发现对于复合状 态 $\vert sing\rangle$,我们对子系统一无所知,但却能找到子系统观测结果之间的 关系!像 $\vert sing\rangle$ 这样的知道一个观测结果就确定性知道另一个观测结 果的状态就叫做最大纠缠态(maximally entangled state)。

从离散到连续——希尔伯特空间

为了考察运动,我们有必要研究位置和动量这种具有连续取值的可观测量。

首先引入波函数(wave function)的概念。若已知一个(离散)状 态 $\vert \psi\rangle = \sum_i \lambda_i\vert \lambda_i\rangle$,那么就定义波函数

$$ \psi(\vert \lambda_i\rangle) = \lambda_i $$

也就是这个状态 $\vert \lambda_i\rangle$ 的系数。根据系数的物理意义,容易得到

$$ P(\lambda_i) = \psi(\vert \lambda_i\rangle)^*\psi(\vert \lambda_i\rangle) $$

由归一性,可知

$$ \sum_i \psi(\vert \lambda_i\rangle)^*\psi(\vert \lambda_i\rangle) = 1 $$

容易看到,波函数与态矢一一对应。

由于函数易于拓展为连续的,首先需要保留归一性,

$$ \int_{-\infty}^{+\infty} \psi(x)^*\psi(x) \mathrm{d}x = 1 $$

对于连续状态,可以考虑希尔伯特空间中的内积,

$$ \langle\Psi\vert \Phi\rangle = \int_{-\infty}^{+\infty} \psi^*(x) \phi(x) \mathrm{d}x $$

这样,我们将离散的普通向量,转换为希尔伯特空间中的特殊的连续向量(波函 数),自然地从离散世界进入了连续世界。

现在有两个很自然的问题:

  • 希尔伯特空间中的线性算子是怎样的?
  • 这些线性算子在什么条件下可以叫做 Hermitian 线性算子?

第一个问题较为简单,只需满足公理即可称为线性算子。有两个最简单的算 子 $\bf X, D$,

$$ {\bf X} \psi(x) = x\psi(x) $$

$$ {\bf D} \psi(x) = \frac{\mathrm{d} \psi(x)}{\mathrm{d} x} $$

易于验证,这两个算子是线性的。首先考察这两个算子的 Hermitian 性质。为此 将 Hermitian 推广为

$$ \langle\Psi\vert {\bf L}\vert \Phi\rangle = \langle\Phi\vert {\bf L}\vert \Psi\rangle^* $$

验证知,$\bf X$ 是 Hermitian 算子,而 $\bf D$ 是反 Hermitian 算子 ($\langle\Psi\vert {\bf D}\vert \Phi\rangle = -\langle\Phi\vert {\bf D}\vert \Psi\rangle^*$)。所以我们给 $\bf D$ 增加 $-i\hbar$ 系数使之成 为 Hermitian 算子,记为 $\bf P$。

下面考察这两个算子(${\bf X}, {\bf P}$)的特征值和特征向量。

$$ {\bf X} \psi(x) = x\psi(x) = x_0\psi(x) $$

$$ (x-x_0)\psi(x) = 0 $$

即 $\bf X$ 有无数个特征值 $x_0$,考虑归一性条件,容易得到一个特征 值 $x_0$ 对应的特征向量 $\psi(x) = \delta(x-x_0)$。这个物理意义十分清晰: 粒子在 $x \neq x_0$ 处的概率为 0,即粒子只能在 $x=x_0$ 处,对应着位置。 这与我们的预期相符。

$$ {\bf P} \psi(x) = -i\hbar \frac{\mathrm{d} \psi(x)}{\mathrm{d} x} = p\psi(x) $$ $$ \psi_p(x) = \frac{1}{\sqrt {2\pi}} e^{\frac{ipx}{\hbar}} $$

即 $\bf P$ 有无数个特征值 $p$,对应的特征向量为 $\psi_p(x)$。这个算子对 应着动量。注意这里是在 $x$ 空间中表达的向量。在这里,能看到 了的影子,也就是为什么波函数被叫做波函 数:$\psi_p(x+\frac{2\pi\hbar}{p})=\psi_p(x)$。

为了将 $\psi_p(x)$ 的基底换为 $p$(也就是转换成以 $p$ 为自变量的函数), 注意到

$$ \psi(x) = \langle x \vert \Psi\rangle \ \langle p\vert x \rangle = \frac{1}{\sqrt {2\pi}} e^{-\frac{ipx}{\hbar}}\ \tilde \psi(p) = \langle p\vert \Psi\rangle = \int \mathrm{d}x \langle p\vert x \rangle \langle x\vert \Psi \rangle=\frac{1}{\sqrt {2\pi}}\int \mathrm{d}x e^{-\frac{ipx}{\hbar}} \psi(x) $$

事实上,就是对 $\psi(x)$ 进行傅里叶变换。不难得到,

$$ \tilde \psi(p) =\frac{1}{\sqrt {2\pi}}\int \mathrm{d}x e^{\frac{-ipx}{\hbar}} \psi(x)\ \psi(p) = \frac{1}{\sqrt {2\pi}}\int \mathrm{d}x e^{\frac{ipx}{\hbar}} \tilde\psi(x) $$

时间与变化

首先需要考察状态随时间的变化。不妨设

$$ \label{eq:psi-t} \vert \psi(t)\rangle = {\bf U}(t)\vert \psi(0)\rangle $$

这表示系统在不受外界作用下自发地进行确定性演化的过程。 若 $\vert \Psi\rangle$ 和 $\Phi\rangle$ 是两个可以区分的状态,那么它们永远是 正交的,

$$ \langle\Psi(t)\vert \Phi(t)\rangle = 0\ \langle\Phi(t)\vert \Psi(t)\rangle = 0 $$

展开来看,就是

$$ \langle\Psi(0)\vert {\bf U}(t)^\dagger {\bf U}(t)\vert \Phi(0)\rangle = 0\ \langle\Phi(0)\vert {\bf U}(t)^\dagger {\bf U}(t)\vert \Psi(0)\rangle = 0 $$

$$ {\bf U}(t)^\dagger {\bf U}(t) = I $$ 这意味着态矢随时间的演化具有酉性质。

我们认为这个演化过程是连续的,即

$$ {\bf U}(\epsilon) = I - i \epsilon \bf H $$

根据 $\bf U$ 的酉性质,可以得到

$$ {\bf H}^\dagger = \bf H $$

即 $\bf H$ 是 Hermitian 算子。我们将 ${\bf H}$ 代表的物理量叫做广 义 Hamiltonian,代表系统的总能量。

将 ${\bf U}(\epsilon) = I - i \epsilon \bf H$ 代入本节第一个方程可以得到

$$ \vert \Psi(\epsilon)\rangle = \vert \Psi(0)\rangle - i\epsilon \bf H\ \frac{\vert \Psi(\epsilon)\rangle - \vert \Psi(0)\rangle}{\epsilon} = -i \bf H\ \frac{\partial \vert \Psi(t)\rangle}{\partial t} = -i \bf H $$

将最后一个方程称为广义薛定谔方程,这个方程的量纲并不正确($\bf H$ 代表 能量),修正得到

$$ \hbar \frac{\partial \vert \Psi(t)\rangle}{\partial t} = -i \bf H $$

由于量子可观测量的期望一般有着直接的经典对应,所以我们想要知道一个可观 测量的期望随时间的变化,即

$$ \begin{align*} &\frac{\mathrm d}{\mathrm dt} \langle {\bf L} \rangle\ =& \frac{\mathrm d}{\mathrm dt} \langle \Psi(t) \vert {\bf L} \vert \Psi(t) \rangle\ =& \frac{i}{\hbar} \langle \Psi(t) \vert [{\bf HL - LH}] \vert \Psi(t) \rangle\ =& \frac{i}{\hbar} \langle \Psi(t) \vert {\bf [H,L]} \vert \Psi(t) \rangle \end{align*} $$

即,

$$ \frac{\mathrm d}{\mathrm d t} \langle {\bf L} \rangle = -\frac{i}{\hbar} \langle {\bf [L,H]} \rangle $$

其中 $\bf [H,L] = HL-LH$ 叫做 L 关于 H 的对易子。这将可观测量 $\bf L$ 的期望随时间的变化与另一个可观测量的期望联系了起来。如果一个量 $\bf Q$ 关于 $\bf H$ 的对易子 ${\bf [H,Q]}$ 为 0,就意味着量 $\bf Q$ 不随时间变 化,即 $\bf Q$ 是守恒的。

不确定关系

假设我们要同时观测两个量 $\bf L, M$,那么考虑 $\bf L, M$ 的公共特征向 量,

$$ {\bf L} \vert \lambda_i, \mu_a\rangle = \lambda_i \vert \lambda_i, \mu_a\rangle\ {\bf M} \vert \lambda_i, \mu_a\rangle = \mu_a \vert \lambda_i, \mu_a\rangle $$

进一步地,

$$ {\bf LM} \vert \lambda_i, \mu_a\rangle = \lambda_i \mu_a \vert \lambda_i, \mu_a\rangle\ {\bf ML} \vert \lambda_i, \mu_a\rangle = \mu_a \lambda_i \vert \lambda_i, \mu_a\rangle $$

这意味着,

$$ {\bf [L,M]} \vert \lambda_i, \mu_a\rangle = 0 $$

我们知道 $\bf L, M$ 的公共特征向量是完备的,这就强迫 ${\bf [L,M]} = 0$。也就是说,如果我们要同时测量两个量,这两个量必须是对 易的,否则不能同时测量。

一个很自然的问题是,既然我们不能同时测量,那么在“多大程度上”我们不能 同时测量它们?也就是如何量化这个误差。为此,首先定义

$$ \bar{\mathbf{A}} = {\bf A} - \langle {\bf A} \rangle I $$

A 的方差为

$$ (\Delta \mathbf{A})^2 = \langle \Psi \vert \bar{\mathbf{A}}^2 \vert \Psi \rangle $$

在任意向量空间内,有 Cauchy-Schwarz 不等式

$$ 2\vert X\vert \vert Y\vert \geq \vert \langle X\vert Y \rangle + \langle Y\vert X \rangle\vert $$

$$ \vert X\rangle = \mathbf{A}\vert \Psi\rangle\ \vert Y\rangle = i\mathbf{B}\vert \Psi\rangle $$

代入 Cauchy-Schwarz 不等式,得

$$ 2\sqrt{\langle\mathbf{A}^2\rangle \langle\mathbf{B}^2\rangle} \geq \vert \langle \Psi\vert [\mathbf{A,B}]\vert \Psi \rangle\vert $$

也就是

$$ \Delta\mathbf{A}\Delta\mathbf{B} \geq \frac{1}{2} \vert \langle \Psi\vert [\mathbf{A,B}]\vert \Psi \rangle\vert $$

这就是最通用的不确定原理。它意味着,只要量 $\bf A, B$ 不对易,那么我们 无法同时拥有关于这两个量的无歧义知识。

从上面的不等式出发,我们可以立即推导出海森堡的位置、动 量的不确定关系。

首先计算 $\bf [X,P]$ ,

$$ \mathbf{[X,P]}\psi(x) = \mathbf{XP}\psi(x) - \mathbf{PX}\psi(x) = i\hbar \psi(x) $$

即 ${\bf [X,P]} = i\hbar$,代入通用不确定原理,即得到

$$ \Delta\mathbf{X} \Delta\mathbf{P} \geq \frac{\hbar}{2} $$

这就是著名的海森堡不确定关系。