不久前偶然翻出来去年写的纯粹数学前沿的课程作业，当时刚看完《Quantum Mechanics: The Theoretical Minimum》，所以写的是简单的量子力学。因为是赶制出来的，内容也不是很详细（比如甚至连密度矩阵都没提），主要是强调特征值。感觉作为简单的量子力学总结/入门可能有点用？所以就把 LaTeX 改写成 Markdown 发到博客上了。~~有点凑数之嫌~~

标题是故意这么写的，强调我完全不懂量子力学。[滑稽.jpg]

量子力学中的特征值问题

量子与经典的分野在哪里？有两个最重要的区别。

观测影响状态。 在一个经典系统中，当我们观测一个物理量（下称可观测量，observable）时，我们认为对这个被观测系统的影响足够小，可以忽略掉。而一个量子系统由于极其微小，观测这个系统将会对这个系统造成不可忽略的影响。这导致了量子力学中状态和观测结果的区别。

逻辑基础不同。 在经典力学中，对于命题 A 且 B，我们可以分别验证 A 和 B 的真值，然后通过且的意义，推断出 A 且 B 命题的真值。而在量子力学中，由于观测会影响状态，如果观测 A 可以影响 B 的真值，那么 A 且 B 和 B 且 A 就不再等价。这意味着量子力学使用的是完全不同的一套逻辑基础。

简单起见，下文主要以最简单的离散可观测量自旋（spin，或称 qubit）为例，随后推广到连续可观测量。

状态

最简单的量子系统就是单自旋系统。在这个系统中，我们可以将可观测量 $\sigma$ 准备到一个特定方向（即放置在某种状态），使得在这个特定方向可以一直测出 $\sigma=1$。由于 $\sigma$ 是一个 3-矢量，它由 3 个方向的成分组成，因而可以认为上下、左右、前后三个方向的自旋是三个可观测量。这里不妨假定我们准备的这个方向是朝上的，记为 $\sigma_u=1$，反过来说，向下方向的测量将永远是 -1，记为 $\sigma_d=-1$。

那么在左右和前后方向测量呢？和经典物理大不相同，在向左方向测量 $\sigma_l$ 和向内方向测量的结果 $\sigma_i$ 均会产生随机的 -1 和 +1 数值，但如果大量测量（测量前将系统准备到之前的状态，或测量大量同状态的系统），将发现这些 -1 和 +1 出现的机会差不多。

一个一般的态矢可表示为 $|\psi\rangle = \alpha_u |u\rangle + \alpha_d |d\rangle$ （如果 $\alpha_d$ 和 $\alpha_u$ 均不为 0，则称为叠加态（superposition）），那么对其中的系数有什么要求呢？物理实验证实， $\alpha_u^*\alpha_u $ 是在向上方向上测出 +1 的概率。如果我们在向上方向上观测，要么测出 +1，要么测出 -1，那么概率必定归一，即 $P_u + P_d=1$，其中 $P_u = \alpha\_u^*\alpha_u, P_d = \alpha_d^*\alpha_d$ ，$x^*$ 表示 $x$ 的复数共轭。这也就是说，$\langle\psi|\psi\rangle=1$ 。

可观测量

从上节可以看到，尽管自旋在上下方向上，但我们仍可以在左右、前后方向上测出结果，只是结果是随机的而已。根据测出 +1 的概率为 $\frac{1}{2}$、概率归一和正交性不难算出，

$$ |r\rangle = \frac{1}{\sqrt 2}|u\rangle + \frac{1}{\sqrt 2}|d\rangle $$ $$ |l\rangle = \frac{1}{\sqrt 2}|u\rangle - \frac{1}{\sqrt 2}|d\rangle $$ $$ |i\rangle = \frac{1}{\sqrt 2}|u\rangle + \frac{i}{\sqrt 2}|d\rangle $$ $$ |o\rangle = \frac{1}{\sqrt 2}|u\rangle - \frac{i}{\sqrt 2}|d\rangle $$

这就说明了 $|u\rangle, |d\rangle$ 是一组完备的基底。为了方便起见，我们希望有一种方法能将这两个东西“打包”放在一起。于是我们找到了矩阵这个数学工具——显然，可以选取$2 \times 2$矩阵，使得其特征向量为正交完备系！

我们希望选取的这个矩阵（记为 $\sigma_z$）的特征向量正好是 $\vert u\rangle$, $\vert d\rangle$ ，而特征值本身可以用来表达测量结果，即

$$ \begin{align*} \sigma_z |u\rangle &= |u\rangle \\ \sigma_z |d\rangle &= -|d\rangle \end{align*} $$

如果选取具体表示 $\vert u\rangle = (1, 0)^T, \vert d\rangle=(0,1)^T$ ，则不难算出

$$ \begin{align*} \sigma_z =& \left( \begin{array}{cc} 1&0\\ 0&-1 \end{array} \right)\\ \sigma_x =& \left( \begin{array}{cc} 0&1\\ 1&0 \end{array} \right)\\ \sigma_y =& \left( \begin{array}{cc} 0&-i\\ i&0 \end{array} \right) \end{align*} $$

这就是著名的Pauli 矩阵。

物理学中，观测结果 $r$ 必定是实数，换句话说 $r^* = r$。对量子力学来说也不例外，一个可观测量用一个线性算子 $\bf{L}$ 表示，而这个线性算子需满足 $\bf{L}^\dagger = \bf{L}$，也就是说 $\bf{L}$ 必是 Hermitian 算子，不难证明 Hermitian 算子的特征值均为实数，与预期相符。

从这里可以看到，线性代数理论在量子力学中占据重要地位：几乎所有物理量都要被表示成一个线性算子，并讨论它的特征值和特征向量。

合成系统与量子纠缠

与经典系统的一个显著不同是合成量子系统可能有纠缠（entanglement）现象。

比如，可以将两个自旋系统 A 和 B 放在一起组成一个合成系统。A 和 B 的状态空间分别为 $S_A, S_B$，那么 AB 合成系统的状态空间就是 $S_{AB} = S_A\otimes S_B$ ，这里 $\otimes$ 表示张量积。

如果 A 和 B 的状态 $\vert A\rangle, \vert B\rangle$ 均已知（它们是对易的，因此可以同时指定并获知。详见下文。），那么不难看出

$$\vert AB\rangle = \vert A\rangle \otimes \vert B\rangle = \alpha_u\beta_u\vert uu\rangle + \alpha_u\beta_d\vert ud\rangle + \alpha_d\beta_u\vert du\rangle + \alpha_d\beta_d \vert dd\rangle$$

这种可以分解为两个状态的积的状态，就叫做积状态（product state）。

但一般的，有的状态并不能被分解，比如 $\vert sing\rangle = \frac{1}{\sqrt 2}(\vert ud\rangle - \vert du\rangle)$。下面考察这个状态的性质。为了方便，将 A 的自旋算子记为 $\sigma$，将 B 的自旋算子记为 $\tau$。

显然，$\tau$ 不会影响 $\vert A\rangle$，而 $\sigma$ 也不会影响 $\vert B\rangle$。计算 $\sigma_z$ 的期望 $\langle \sigma_z \rangle = \langle sing \vert \sigma_z \vert sing \rangle =0$ ，同理， $\langle \sigma_x \rangle = \langle \sigma_y \rangle=\langle \tau_x \rangle= \langle\tau_y\rangle=\langle\tau_z\rangle = 0$ 。这意味着在这个状态下，就算我们知道了系统的状态，也对每个子系统的测量结果无法作出任何预测！

反过来，复合可观测量 $\tau_z \sigma_z$ 的观测值必为 -1，这是因为 $\tau_z\sigma_z\vert sing\rangle = - \vert sing\rangle$。这意味着，如果 A 测出 $\sigma_z = +1$，那么 B 必然测出 $\tau_z=-1$！

也许单独看这两点并不令人惊讶，但合起来看，就发现对于复合状态 $\vert sing\rangle$，我们对子系统一无所知，但却能找到子系统观测结果之间的关系！像 $\vert sing\rangle$ 这样的知道一个观测结果就确定性知道另一个观测结果的状态就叫做最大纠缠态（maximally entangled state）。

从离散到连续——希尔伯特空间

为了考察运动，我们有必要研究位置和动量这种具有连续取值的可观测量。

首先引入波函数（wave function）的概念。若已知一个（离散）状态 $\vert \psi\rangle = \sum_i \lambda_i\vert \lambda_i\rangle$，那么就定义波函数

$$ \psi(\vert \lambda_i\rangle) = \lambda_i $$

也就是这个状态 $\vert \lambda_i\rangle$ 的系数。根据系数的物理意义，容易得到

$$ P(\lambda_i) = \psi(\vert \lambda_i\rangle)^*\psi(\vert \lambda_i\rangle) $$

由归一性，可知

$$ \sum_i \psi(\vert \lambda_i\rangle)^*\psi(\vert \lambda_i\rangle) = 1 $$

容易看到，波函数与态矢一一对应。

由于函数易于拓展为连续的，首先需要保留归一性，

$$ \int_{-\infty}^{+\infty} \psi(x)^*\psi(x) \mathrm{d}x = 1 $$

对于连续状态，可以考虑希尔伯特空间中的内积，

$$ \langle\Psi\vert \Phi\rangle = \int_{-\infty}^{+\infty} \psi^*(x) \phi(x) \mathrm{d}x $$

这样，我们将离散的普通向量，转换为希尔伯特空间中的特殊的连续向量（波函数），自然地从离散世界进入了连续世界。

现在有两个很自然的问题：

希尔伯特空间中的线性算子是怎样的？
这些线性算子在什么条件下可以叫做 Hermitian 线性算子？

第一个问题较为简单，只需满足公理即可称为线性算子。有两个最简单的算子 $\bf X, D$，

$$ {\bf X} \psi(x) = x\psi(x) $$

$$ {\bf D} \psi(x) = \frac{\mathrm{d} \psi(x)}{\mathrm{d} x} $$

易于验证，这两个算子是线性的。首先考察这两个算子的 Hermitian 性质。为此将 Hermitian 推广为

$$ \langle\Psi\vert {\bf L}\vert \Phi\rangle = \langle\Phi\vert {\bf L}\vert \Psi\rangle^* $$

验证知，$\bf X$ 是 Hermitian 算子，而 $\bf D$ 是反 Hermitian 算子（ $\langle\Psi\vert {\bf D}\vert \Phi\rangle = -\langle\Phi\vert {\bf D}\vert \Psi\rangle^*$ ）。所以我们给 $\bf D$ 增加 $-i\hbar$ 系数使之成为 Hermitian 算子，记为 $\bf P$。

下面考察这两个算子（ ${\bf X}, {\bf P}$ ）的特征值和特征向量。

$$ {\bf X} \psi(x) = x\psi(x) = x_0\psi(x) $$

$$ (x-x_0)\psi(x) = 0 $$

即 $\bf X$ 有无数个特征值 $x_0$，考虑归一性条件，容易得到一个特征值 $x_0$ 对应的特征向量 $\psi(x) = \delta(x-x_0)$。这个物理意义十分清晰：粒子在 $x \neq x_0$ 处的概率为 0，即粒子只能在 $x=x_0$ 处，对应着位置。这与我们的预期相符。

$$ {\bf P} \psi(x) = -i\hbar \frac{\mathrm{d} \psi(x)}{\mathrm{d} x} = p\psi(x) $$ $$ \psi_p(x) = \frac{1}{\sqrt {2\pi}} e^{\frac{ipx}{\hbar}} $$

即 $\bf P$ 有无数个特征值 $p$，对应的特征向量为 $\psi_p(x)$。这个算子对应着动量。注意这里是在 $x$ 空间中表达的向量。在这里，能看到了波的影子，也就是为什么波函数被叫做波函数：$\psi_p(x+\frac{2\pi\hbar}{p})=\psi_p(x)$。

为了将 $\psi_p(x)$ 的基底换为 $p$（也就是转换成以 $p$ 为自变量的函数），注意到

$$ \psi(x) = \langle x \vert \Psi\rangle $$

$$ \langle p\vert x \rangle = \frac{1}{\sqrt {2\pi}} e^{-\frac{ipx}{\hbar}} $$

$$ \tilde \psi(p) = \langle p\vert \Psi\rangle = \int \mathrm{d}x \langle p\vert x \rangle \langle x\vert \Psi \rangle=\frac{1}{\sqrt {2\pi}}\int \mathrm{d}x e^{-\frac{ipx}{\hbar}} \psi(x) $$

事实上，就是对 $\psi(x)$ 进行傅里叶变换。不难得到，

$$ \tilde \psi(p) =\frac{1}{\sqrt {2\pi}}\int \mathrm{d}x e^{\frac{-ipx}{\hbar}} \psi(x) $$ $$ \psi(p) = \frac{1}{\sqrt {2\pi}}\int \mathrm{d}x e^{\frac{ipx}{\hbar}} \tilde\psi(x) $$

时间与变化

首先需要考察状态随时间的变化。不妨设

$$ \vert \psi(t)\rangle = {\bf U}(t)\vert \psi(0)\rangle $$

这表示系统在不受外界作用下自发地进行确定性演化的过程。若 $\vert \Psi\rangle$ 和 $\Phi\rangle$ 是两个可以区分的状态，那么它们永远是正交的，

$$\langle\Psi(t)\vert \Phi(t)\rangle = 0$$

$$\langle\Phi(t)\vert \Psi(t)\rangle = 0$$

展开来看，就是

$$\langle\Psi(0)\vert {\bf U}(t)^\dagger {\bf U}(t)\vert \Phi(0)\rangle = 0$$

$$\langle\Phi(0)\vert {\bf U}(t)^\dagger {\bf U}(t)\vert \Psi(0)\rangle = 0$$

即

$$ {\bf U}(t)^\dagger {\bf U}(t) = I$$

这意味着态矢随时间的演化具有酉性质。

我们认为这个演化过程是连续的，即

$$ {\bf U}(\epsilon) = I - i \epsilon \bf H $$

根据 $\bf U$ 的酉性质，可以得到

$$ {\bf H}^\dagger = \bf H $$

即 $\bf H$ 是 Hermitian 算子。我们将 ${\bf H}$ 代表的物理量叫做广义 Hamiltonian，代表系统的总能量。

将 ${\bf U}(\epsilon) = I - i \epsilon \bf H$ 代入本节第一个方程可以得到

$$ \vert \Psi(\epsilon)\rangle = \vert \Psi(0)\rangle - i\epsilon \bf H $$ $$ \frac{\vert \Psi(\epsilon)\rangle - \vert \Psi(0)\rangle}{\epsilon} = -i \bf H $$ $$ \frac{\partial \vert \Psi(t)\rangle}{\partial t} = -i \bf H $$

将最后一个方程称为广义薛定谔方程，这个方程的量纲并不正确（$\bf H$ 代表能量），修正得到

$$ \hbar \frac{\partial \vert \Psi(t)\rangle}{\partial t} = -i \bf H $$

由于量子可观测量的期望一般有着直接的经典对应，所以我们想要知道一个可观测量的期望随时间的变化，即

$$ \begin{align*} &\frac{\mathrm d}{\mathrm dt} \langle {\bf L} \rangle\\ =& \frac{\mathrm d}{\mathrm dt} \langle \Psi(t) \vert {\bf L} \vert \Psi(t) \rangle\\ =& \frac{i}{\hbar} \langle \Psi(t) \vert [{\bf HL - LH}] \vert \Psi(t) \rangle\\ =& \frac{i}{\hbar} \langle \Psi(t) \vert {\bf [H,L]} \vert \Psi(t) \rangle \end{align*} $$

即，

$$ \frac{\mathrm d}{\mathrm d t} \langle {\bf L} \rangle = -\frac{i}{\hbar} \langle {\bf [L,H]} \rangle $$

其中 $\bf [H,L] = HL-LH$ 叫做 L 关于 H 的对易子。这将可观测量 $\bf L$ 的期望随时间的变化与另一个可观测量的期望联系了起来。如果一个量 $\bf Q$ 关于 $\bf H$ 的对易子 ${\bf [H,Q]}$ 为 0，就意味着量 $\bf Q$ 不随时间变化，即 $\bf Q$ 是守恒的。

不确定关系

假设我们要同时观测两个量 $\bf L, M$，那么考虑 $\bf L, M$ 的公共特征向量，

$$ {\bf L} \vert \lambda_i, \mu_a\rangle = \lambda_i \vert \lambda_i, \mu_a\rangle\\ {\bf M} \vert \lambda_i, \mu_a\rangle = \mu_a \vert \lambda_i, \mu_a\rangle $$

进一步地，

$$ {\bf LM} \vert \lambda_i, \mu_a\rangle = \lambda_i \mu_a \vert \lambda_i, \mu_a\rangle\\ {\bf ML} \vert \lambda_i, \mu_a\rangle = \mu_a \lambda_i \vert \lambda_i, \mu_a\rangle $$

这意味着，

$$ {\bf [L,M]} \vert \lambda_i, \mu_a\rangle = 0 $$

我们知道 $\bf L, M$ 的公共特征向量是完备的，这就强迫 ${\bf [L,M]} = 0$。也就是说，如果我们要同时测量两个量，这两个量必须是对易的，否则不能同时测量。

一个很自然的问题是，既然我们不能同时测量，那么在“多大程度上”我们不能同时测量它们？也就是如何量化这个误差。为此，首先定义

$$ \bar{\mathbf{A}} = {\bf A} - \langle {\bf A} \rangle I $$

A 的方差为

$$ (\Delta \mathbf{A})^2 = \langle \Psi \vert \bar{\mathbf{A}}^2 \vert \Psi \rangle $$

在任意向量空间内，有 Cauchy-Schwarz 不等式

$$ 2\vert X\vert \vert Y\vert \geq \vert \langle X\vert Y \rangle + \langle Y\vert X \rangle\vert $$

设

$$ \vert X\rangle = \mathbf{A}\vert \Psi\rangle\ \vert Y\rangle = i\mathbf{B}\vert \Psi\rangle $$

代入 Cauchy-Schwarz 不等式，得

$$ 2\sqrt{\langle\mathbf{A}^2\rangle \langle\mathbf{B}^2\rangle} \geq \vert \langle \Psi\vert [\mathbf{A,B}]\vert \Psi \rangle\vert $$

也就是

$$ \Delta\mathbf{A}\Delta\mathbf{B} \geq \frac{1}{2} \vert \langle \Psi\vert [\mathbf{A,B}]\vert \Psi \rangle\vert $$

这就是最通用的不确定原理。它意味着，只要量 $\bf A, B$ 不对易，那么我们无法同时拥有关于这两个量的无歧义知识。

从上面的不等式出发，我们可以立即推导出海森堡的位置、动量的不确定关系。

首先计算 $\bf [X,P]$ ，

$$ \mathbf{[X,P]}\psi(x) = \mathbf{XP}\psi(x) - \mathbf{PX}\psi(x) = i\hbar \psi(x) $$

即 ${\bf [X,P]} = i\hbar$，代入通用不确定原理，即得到

$$ \Delta\mathbf{X} \Delta\mathbf{P} \geq \frac{\hbar}{2} $$

这就是著名的海森堡不确定关系。