\(\)
訳書「サクライ上級量子力学」の§3.2にミスプリがあったので, 該当する原書の部分(英文)を示しておく.また, これを生成AI (Claude) に翻訳してもらった文章も付けておく.
3-2 THE DIRAC EQUATION
Derivation of the Dirac equation. Even though the Klein-Gordon equation is quite satisfactory when properly interpreted, there is reason for rejecting it for the description of an electron. The Klein-Gordon equation cannot accommodate the spin-1/2 nature of the electron as naturally as the Dirac equation can. In this connection, let us first study how to incorporate the electron spin in nonrelativistic quantum mechanics.
In nonrelativistic quantum mechanics, in order to account for the interaction of the electron spin magnetic moment with the magnetic field, it is customary to add a term
\(
\def\ppdiff#1#2{\frac{\partial #1}{\partial #2}}
\def\pdiff#1{\frac{\partial}{\partial #1}}
\def\Bppdiff#1#2{\frac{\partial^{2} #1}{\partial #2^{2}}}
\def\Bpdiff#1{\frac{\partial^{2}}{\partial #1^{2}}}
\def\mb#1{\mathbf{#1}}
\def\mr#1{\mathrm{#1}}
\def\reverse#1{\frac{1}{#1}}
\def\ds#1{\mbox{${\displaystyle\strut #1}$}}
\)
H^{(\mr{spin})} = —(e\hbar/2mc)\mb{\sigma}\cdot\mb{B}
\tag{3.16}
\end{equation*}
to the usual Hamiltonian, as done originally by W. Pauli. This procedure appears somewhat artificial, especially if we subscribe to the philosophy that the only “fundamental” electromagnetic interactions are those which can be generated by the substitution \(p_{\mu}\rightarrow p_{\mu}-eA_{\mu}/c\). There is, however, a slightly less ad hoc way of introducing the spin magnetic moment interaction. In the usual wavemechanical treatment of the electron, the kinetic energy operator in the absence of the vector potential is taken to be
H^{(\mr{KE})} = \mb{p}^2/2m.
\tag{3.17}
\end{equation*}
However, for a spin-1/2 particle we may just as well start with the expression
H^{(\mr{KE})} = (\mb{\sigma}\cdot\mb{p})(\mb{\sigma}\cdot\mb{p})/2m.
\tag{3.18}
\end{equation*}
This alternative form is indistinguishable from (3.17) for all practical purposes when there is no vector potential. There is, however, a difference when we make the substitution \(\mb{p}\to \mb{p}-e\mb{A}/c\). The expression (3.18) then becomes
\begin{align*}
\frac{1}{2m}\mb{\sigma}\cdot\left(\mb{p}-\frac{e\mb{A}}{c}\right)&\mb{\sigma}\cdot\left(\mb{p}-\frac{e\mb{A}}{c}\right)\\
&=\frac{1}{2m}\left(\mb{p}-\frac{e\mb{A}}{c}\right)^{2}+\frac{i}{2m}\mb{\sigma}\cdot\left[
\left(\mb{p}-\frac{e\mb{A}}{c}\right)\times\left(\mb{p}-\frac{e\mb{A}}{c}\right)\right]\\
&=\frac{1}{2m}\left(\mb{p}-\frac{e\mb{A}}{c}\right)^{2}-\frac{e\hbar}{2mc}\mb{\sigma}\cdot\mb{B},
\tag{3.19}
\end{align*}
where we have used
\mb{p}\times\mb{A}=-i\hbar(\nabla\times\mb{A})-\mb{A}\times\mb{p}.
\tag{3.20}
\end{equation*}
(The operator \(\mb{p}\) is assumed to act on everything that stands to the right; in contrast, the \(\nabla\) operator in (3.20) acts only on \(\mb{A}\).) Note that the spin magnetic moment generated in this way has the correct gyromagnetic ratio \(g=2\).
Our object is to derive a relativistic wave equation for a spin-1/2 particle. Just as we incorporated the electron spin into the nonrelativistic theory by using the kinetic energy operator (3.18), we can incorporate the electron spin into the general framework of relativistic quantum mechanics by taking the operator analog of the classical expression
(E^{2}/c^{2})-\mb{p}^{2} = (mc)^{2}
\tag{3.21}
\end{equation*}
to be
\left(\frac{E^{(\mr{op})}}{c} – \mb{\sigma}\cdot\mb{p}\right)\left(\frac{E^{(\mr{op})}}{c}-\mb{\sigma}\cdot\mb{p}\right)
=(mc)^{2}
\tag{3.22}
\end{equation*}
where
E^{(\mr{op})}=i\hbar\pdiff{t}=i\hbar c \pdiff{x_{0}},
\tag{3.23}
\end{equation*}
and \(\mb{p}=-i\hbar\nabla\) as before. This enables us to write a second-order equation (due to B.L. van der Waerden),
\left(i\hbar\pdiff{x_0}+\mb{\sigma}\cdot i\hbar\nabla\right)\left(i\hbar\pdiff{x_0}+\mb{\sigma}\cdot i\hbar\nabla\right)
\phi = (mc)^{2}\phi
\tag{3.24}
\end{equation*}
for a free electron, where \(\phi\) is now a two-component wave function.
We are interested in obtaining a wave equation of first order in the time derivative. Relativistic covariance suggests that the wave equation linear in \(\partial/\partial t\) must be linear in \(\nabla\) also. An analogy with the Maxwell theory may now be helpful. The free-field D’Alembertian equation \(\square A_{\mu} = 0\) is a second-order equation, while the free-field Maxwell equation \(\partial/\partial x_{\mu} F_{\mu\nu}=0\) is a first-order equation. Note that \(F_{\mu\nu}\) obtained by differentiating \(A_{\mu}\) has more components than \(A_{\mu}\). This increase in the number of components is the price we have to pay when we work with the first-order equation. Motivated by this analogy, we can define two two-component wave functions \(\phi^{(R)}\) and \(\phi^{(L)}\):
\phi^{(R)}=\frac{1}{mc}\left(i\hbar\pdiff{x_0}-i\hbar\mb{\sigma}\cdot\nabla\right)\phi,\quad \phi^{(L)}=\phi.
\tag{3.25}
\end{equation*}
The total number of components has now been increased to four. The superscripts \(R\) and \(L\) come from the fact that as \(m\to0\), \(\phi^{(R)}\) and \(\phi^{(L)}\), respectively, describe a right-handed (spin parallel to the momentum direction) and a left-handed (spin antiparallel to the momentum direction) state of the spin-1/2 particle, as we shall see later. The second-order equation (3.24) is now equivalent to two first-order equations
\begin{align*}
&\left[i\hbar\mb{\sigma}-i\hbar\pdiff{x_0}\right]\phi^{(L)}=-mc\phi^{(R)},\\
&\left[-i\hbar\mb{\sigma}\cdot\nabla-i\hbar\pdiff{x_0}\right]\phi^{(R)}=-mc\phi^{(L)}.
\tag{3.26}
\end{align*}
Note that unless the particle is massless, these first-order equations couple \(\phi^{(R)}\) and \(\phi^{(L)}\) just as the Maxwell equations, also first-order equations, couple \(\mb{E}\) and \(\mb{B}\).
Equation (3.26) is equivalent to the celebrated wave equation of Dirac (cf. Problem 3-5). To bring it to the form originally written by Dirac, we take the sum and the difference of (3.26). We then have
\begin{align*}
-i&\hbar(\mb{\sigma}\cdot\nabla)\bigl(\phi^{(R)}-\phi^{(L)}\bigr)-i\hbar\pdiff{x_0}\bigl(\phi^{(R)}+\phi^{(L)}\bigr)
=-mc\bigl(\phi^{(R)}+\phi^{(L)}\bigr),\\
&i\hbar(\mb{\sigma}\cdot\nabla)\bigl(\phi^{(R)}+\phi^{(L)}\bigr)+i\hbar\pdiff{x_0}\bigl(\phi^{(R)}-\phi^{(L)}\bigr)
=-mc\bigl(\phi^{(R)}-\phi^{(L)}\bigr),
\tag{3.27}
\end{align*}
or, denoting the sum and the difference of \(\phi^{(R)}\) and \(\phi^{(L)}\) by \(\psi_{A}\) and \(\psi_{B}\), we have
\begin{pmatrix} \ds{-i\hbar\pdiff{x_0}} & -i\hbar\mb{\sigma}\cdot\nabla \\ i\hbar\mb{\sigma}\cdot\nabla & \ds{i\hbar\pdiff{x_0}}
\end{pmatrix} = -mc \begin{pmatrix} \psi_{A} \\ \psi_{B}\end{pmatrix}
\tag{3.28}
\end{equation*}
Defining a \textit{four}-component wave function \(\psi\) by
\psi=\begin{pmatrix} \psi_{A} \\ \psi_{B}\end{pmatrix}=\begin{pmatrix} \phi^{(R)} +\phi^{(L)} \\ \phi^{(R)} -\phi^{(L)}\end{pmatrix},
\tag{3.29}
\end{equation*}
we can rewrite (3.28) more concisely as
\left(\mb{\gamma}\cdot\nabla + \gamma_{4}\pdiff{(ix_0)}\right) + \frac{mc}{\hbar}\psi = 0,
\tag{3.30}
\end{equation*}
or
\left(\gamma_{\mu}\pdiff{x_{\mu}} + \frac{mc}{\hbar}\right)\psi = 0
\tag{3.31}
\end{equation*}
where \(\gamma_{\mu}\) with \(\mu=1,2,3,4\) are \(4\times 4\) matrices given by
\gamma_{k}=\begin{pmatrix} 0 & -i\sigma_{k} \\ i\sigma_{k} & 0 \end{pmatrix}, \quad
\gamma_{4}= \begin{pmatrix} I & 0 \\ 0 & -I \end{pmatrix}
\tag{3.32}
\end{equation*}
which really mean
\gamma_{3}=\begin{pmatrix} 0 & 0 & -i & 0 \\ 0 & 0 & 0 & i \\ i & 0 & 0 & 0 \\ 0 & -i & 0 & 0 \end{pmatrix},\quad
\gamma_{4}=\begin{pmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & -1 & 0 \\ 0 & 0 & 0 & -1 \end{pmatrix},
\quad \mathrm{etc.}
\tag{3.33}
\end{equation*}
Equation (3.31) is the famous Dirac equation.
3.2 ディラック方程式
ディラック方程式の導出
クライン=ゴルドン方程式は適切に解釈すれば十分に満足のいくものであるが、電子の記述にこれを用いることを退ける理由がある。クライン=ゴルドン方程式は、ディラック方程式ほど自然な形でスピン1/2という電子の性質を取り込むことができないのである。この点に関連して、まず非相対論的量子力学においてスピンをどのように組み込むかを考えよう。
非相対論的量子力学では、電子のスピン磁気モーメントと磁場との相互作用を取り込むために、通常のハミルトニアンに
\begin{align*}
H_\text{(spin)} = -\frac{e\hbar}{2mc}\boldsymbol{\sigma}\cdot\mathbf{B} \tag{3.16}
\end{align*}
という項を加えることが慣例となっている。これはもともとW.パウリによって行われたものである。この手続きはやや人為的に見える。特に、「基本的な」電磁相互作用とは \(p_{\mu}\rightarrow p_{\mu}-eA_{\mu}/c\) という置き換えによって生成されるものだけであるという立場をとるならばなおさらである。しかしながら、スピン磁気モーメントの相互作用をより自然な形で導入する方法がある。通常の電子の波動力学的な取り扱いでは、ベクトルポテンシャルが存在しない場合の運動エネルギー演算子は
\begin{align*}
H_\text{(KE)} = \mathbf{p}^2/2m \tag{3.17}
\end{align*}
と取られる。しかし、スピン1/2の粒子に対しては、代わりに
\begin{align*}
H_\text{(KE)} = (\boldsymbol{\sigma}\cdot\mathbf{p})(\boldsymbol{\sigma}\cdot\mathbf{p})/2m \tag{3.18}
\end{align*}
という表式から出発しても全く構わない。この別の形は、ベクトルポテンシャルがなければ実用上(3.17)と区別がつかない。
しかし, \(\mb{p} \to \mb{p}\, -\, e \mb{A}/c\) という置き換えを行うと違いが生じる。(3.18)はそのとき
\begin{align*}
\frac{1}{2m}\boldsymbol{\sigma}\cdot\left(\mathbf{p}-\frac{e\mathbf{A}}{c}\right)\boldsymbol{\sigma}\cdot\left(\mathbf{p}-\frac{e\mathbf{A}}{c}\right) &= \frac{1}{2m}\left(\mathbf{p}-\frac{e\mathbf{A}}{c}\right)^{2} + \frac{i}{2m}\boldsymbol{\sigma}\cdot\left[\left(\mathbf{p}-\frac{e\mathbf{A}}{c}\right)\times\left(\mathbf{p}-\frac{e\mathbf{A}}{c}\right)\right] \\
&= \frac{1}{2m}\left(\mathbf{p}-\frac{e\mathbf{A}}{c}\right)^{2} – \frac{e\hbar}{2mc}\boldsymbol{\sigma}\cdot\mathbf{B} \tag{3.19}
\end{align*}
となる。ここで
\mb{p}\times\mb{A}=-i\hbar(\nabla\times\mb{A})-\mb{A}\times\mb{p}
\tag{3.20}
\end{equation*}
を用いた。(演算子 \(\mathbf{p}\) は右側に並ぶすべてのものに作用するとする。一方、(3.20)中の \(\nabla\) 演算子は \(\mathbf{A}\) にのみ作用する。)こうして生成されるスピン磁気モーメントは、正しいg因子 \(g=2\) を持つことに注目されたい。
我々の目的は、スピン1/2粒子に対する相対論的波動方程式を導くことである。非相対論的理論に電子スピンを組み込む際に運動エネルギー演算子(3.18)を用いたのと同様に、古典的な表式
\begin{align*}
E^2/c^2 – \mathbf{p}^2 = (mc)^2 \tag{3.21}
\end{align*}
の演算子類似として
\begin{align*}
\left(\frac{E^{(\mathrm{op})}}{c} \, – \, \boldsymbol{\sigma}\cdot\mathbf{p}\right)\left(\frac{E^{(\mathrm{op})}}{c} + \boldsymbol{\sigma}\cdot\mathbf{p}\right) = (mc)^2 \tag{3.22}
\end{align*}
を取ることで、相対論的量子力学の一般的な枠組みの中に電子スピンを組み込むことができる。ここで
\begin{align*}
E^{(\mathrm{op})} = i\hbar\frac{\partial}{\partial t} = i\hbar c\frac{\partial}{\partial x^0} \tag{3.23}
\end{align*}
であり、\(\mathbf{p} = -i\hbar\nabla\) は従来通りである。これにより、自由電子に対する(B.L.ファン・デル・ヴェールデンによる)2階の方程式
\begin{align*}
\left(i\hbar\frac{\partial}{\partial x^0} + \boldsymbol{\sigma}\cdot i\hbar\nabla\right)\left(i\hbar\frac{\partial}{\partial x^0} \,-\, \boldsymbol{\sigma}\cdot i\hbar\nabla\right)\phi = (mc)^2\phi \tag{3.24}
\end{align*}
を書くことができる。ここで \(\phi\) は2成分波動関数である。
我々は時間微分について1階の波動方程式を得ることを目指している。相対論的共変性から、\(\partial/\partial t\) について線形な波動方程式は \(\nabla\) についても線形でなければならない。ここでマクスウェル理論との類比が参考になる。自由場のダランベール方程式 \(\square A_\mu = 0\) は2階方程式であるのに対し、自由場のマクスウェル方程式 \(\partial F_{\mu\nu}/\partial x^\mu = 0\) は1階方程式である。\(A_\mu\) を微分して得られる \(F_{\mu\nu}\) は \(A_\mu\) よりも成分数が多いことに注目されたい。この成分数の増加は、1階方程式を扱う際に支払わなければならない代償である。この類比に動機づけられて、2成分波動関数 \(\phi^{(R)}\) と \(\phi^{(L)}\) を以下のように定義できる:
\begin{align*}
\phi^{(R)} = \frac{1}{mc}\left(i\hbar\frac{\partial}{\partial x^0} \,-\, i\hbar\boldsymbol{\sigma}\cdot\nabla\right)\phi, \quad \phi^{(L)} = \phi \tag{3.25}
\end{align*}
成分の総数はこれで4つに増えた。上付き文字のRとLは、\(m\to 0\) の極限で \(\phi^{(R)}\) および \(\phi^{(L)}\) がそれぞれ右巻き(スピンが運動量方向に平行)および左巻き(スピンが運動量方向に反平行)のスピン1/2粒子の状態を記述することに由来しており、これは後に示す通りである。2階の方程式(3.24)は今や2つの1階方程式
\begin{align*}
\left[i\hbar\boldsymbol{\sigma}\cdot\nabla \,-\, i\hbar\frac{\partial}{\partial x^0}\right]\phi^{(L)} &= -mc,\phi^{(R)},\\
\left[-i\hbar\boldsymbol{\sigma}\cdot\nabla \,-\, i\hbar\frac{\partial}{\partial x^0}\right]\phi^{(R)} &= -mc,\phi^{(L)} \tag{3.26}
\end{align*}
と等価である。粒子が質量を持つ限り、これらの1階方程式は \(\phi^{(R)}\) と \(\phi^{(L)}\) を結合することに注意されたい。これはマクスウェル方程式(これも1階方程式)が \(\mathbf{E}\) と \(\mathbf{B}\) を結合するのと同様である。
方程式(3.26)は、ディラックの有名な波動方程式と等価である(問題3-5参照)。ディラックが元々書いた形に持っていくために、(3.26)の和と差をとる。すると
\begin{align*}
-i\hbar(\boldsymbol{\sigma}\cdot\nabla)\left(\phi^{(R)}-\phi^{(L)}\right) \,-\, i\hbar\frac{\partial}{\partial x^0}\left(\phi^{(R)}+\phi^{(L)}\right) &= -mc\left(\phi^{(R)}+\phi^{(L)}\right),\\
i\hbar(\boldsymbol{\sigma}\cdot\nabla)\left(\phi^{(R)}+\phi^{(L)}\right) + i\hbar\frac{\partial}{\partial x^0}\left(\phi^{(R)}-\phi^{(L)}\right) &= -mc\left(\phi^{(R)}-\phi^{(L)}\right) \tag{3.27}
\end{align*}
を得る。\(\phi^{(R)}\) と \(\phi^{(L)}\) の和と差をそれぞれ \(\psi_A\)、\(\psi_B\) と表すと
\begin{align*}
\begin{pmatrix}-i\hbar\dfrac{\partial}{\partial x^0} & -i\hbar\boldsymbol{\sigma}\cdot\nabla \\ i\hbar\boldsymbol{\sigma}\cdot\nabla & i\hbar\dfrac{\partial}{\partial x^0}\end{pmatrix}\begin{pmatrix}\psi_A \\ \psi_B\end{pmatrix} = -mc\begin{pmatrix}\psi_A \\ \psi_B\end{pmatrix} \tag{3.28}
\end{align*}
となる。4成分波動関数 \(\psi\) を
\begin{align*}
\psi = \begin{pmatrix}\psi_A \\ \psi_B\end{pmatrix} = \begin{pmatrix}\phi^{(R)}+\phi^{(L)} \\ \phi^{(R)}-\phi^{(L)}\end{pmatrix} \tag{3.29}
\end{align*}
と定義すれば、(3.28)をより簡潔に
\begin{align*}
\left(\boldsymbol{\gamma}\cdot\nabla + \gamma_4\frac{\partial}{\partial(ix^0)}\right)\psi + \frac{mc}{\hbar}\psi = 0 \tag{3.30}
\end{align*}
あるいは
\begin{align*}
\left(\gamma^\mu\frac{\partial}{\partial x^\mu} + \frac{mc}{\hbar}\right)\psi = 0 \tag{3.31}
\end{align*}
と書き直すことができる。ここで \(\mu = 1,2,3,4\) に対する \(4\times 4\) 行列 \(\gamma^\mu\) は
\begin{align*}
\gamma^k = \begin{pmatrix}0 & -i\sigma^k \\ i\sigma^k & 0\end{pmatrix}, \quad \gamma^4 = \begin{pmatrix}I & 0 \\ 0 & -I\end{pmatrix} \tag{3.32}
\end{align*}
で与えられ、具体的には
\begin{align*}
\gamma^3 = \begin{pmatrix}0 & 0 & -i & 0 \\ 0&0&0&i \\ i&0&0&0 \\ 0& -i& 0 & 0 \end{pmatrix}, \quad \gamma^4 = \begin{pmatrix}1&0&0&0 \\ 0&1&0&0 \\ 0&0&-1&0 \\ 0&0&0&-1\end{pmatrix}, \quad \text{など} \tag{3.33}
\end{align*}
を意味する。方程式(3.31)が、かの有名なディラック方程式である。

