Квантовая теория поля
Ква́нтовая тео́рия по́ля (КТП), квантовая теория релятивистских систем с бесконечным числом степеней свободы (релятивистских полей), являющаяся теоретической основой описания микрочастиц, их взаимодействий и взаимопревращений.
Квантовые поля
Квантовое (квантованное) поле представляет собой синтез понятий классического поля типа электромагнитного и поля вероятностей квантовой механики. По современным представлениям, квантовое поле – наиболее фундаментальная и универсальная форма материи.
Представление о классическом электромагнитном поле возникло в теории электромагнетизма Фарадея – Максвелла и приобрело современный вид в специальной теории относительности, потребовавшей отказа от эфира как материального носителя электромагнитных процессов. При этом поле является не формой движения какой-либо среды, а специфической формой материи. В отличие от частиц, классическое поле непрерывно создаётся и уничтожается (испускается и поглощается зарядами), обладает бесконечным числом степеней свободы и не локализуется в определённых точках пространства-времени, но может распространяться в нём, передавая сигнал (взаимодействие) от одной частицы к другой с конечной скоростью, не превосходящей скорости света .
Возникновение идей о квантовании привело к пересмотру классических представлений о непрерывности механизма испускания и поглощения света и к выводу, что эти процессы происходят дискретно – путём испускания и поглощения квантов электромагнитного поля – фотонов. Возникшую противоречивую с точки зрения классической физики картину, когда с электромагнитным полем сопоставлялись фотоны и одни явления поддавались интерпретации лишь в терминах волн, а другие – только с помощью представления о квантах, назвали корпускулярно-волновым дуализмом. Это противоречие разрешилось последовательным применением к полю идей квантовой механики. Динамические переменные электромагнитного поля – потенциалы , и напряжённости электрического и магнитного полей , – стали квантовыми операторами, подчиняющимися определённым перестановочным соотношениям и действующими на волновую функцию (амплитуду или вектор состояния) системы. Так возник новый физический объект – квантовое поле, удовлетворяющее уравнениям классической электродинамики, но имеющее своими значениями квантовомеханические операторы.
Введение понятия квантового поля связано также с волновой функцией частицы , которая является не самостоятельной физической величиной, а амплитудой состояния частицы: вероятности любых относящихся к частице физических величин определяются билинейными по выражениями. Таким образом, в квантовой механике с каждой материальной частицей связано новое поле – поле амплитуд вероятностей. Обобщение на случай множества частиц, удовлетворяющих принципу неразличимости (принципу тождественности), означает, что для описания всех частиц достаточно одного поля в четырёхмерном пространстве-времени, являющегося оператором в квантовой механике. Это достигается переходом к новому квантовомеханическому представлению – представлению чисел заполнения (или представлению вторичного квантования).
Введённое таким путём операторное поле аналогично квантованному электромагнитному полю и отличается от него лишь выбором представления группы Лоренца и, возможно, способом квантования. Подобно электромагнитному полю, одно такое поле соответствует всей совокупности тождественных частиц данного сорта; например, одно операторное поле Дирака описывает все электроны (и позитроны) Вселенной.
Таким образом, на смену полям и частицам классической физики пришли единые физические объекты – квантовые поля в четырёхмерном пространстве-времени, по одному для каждого сорта частиц или полей (классических). Элементарным актом всякого взаимодействия стало взаимодействие нескольких полей в одной точке пространства-времени или – на корпускулярном языке – локальное и мгновенное превращение одних частиц в другие. Классическое же взаимодействие в виде сил, действующих между частицами, оказывается вторичным эффектом, возникающим в результате обмена квантами поля, переносящего взаимодействие.
Свободные поля и корпускулярно-волновой дуализм
Существуют полевое и корпускулярное представления КТП. При полевом подходе рассматривается теория соответствующего классического поля, которое затем квантуется по предложенному В. Гейзенбергом и В. Паули образцу квантования электромагнитного поля, и далее строится его корпускулярная интерпретация. Исходным понятием здесь является поле (индекс нумерует компоненты поля), определённое в каждой пространственно-временнóй точке и осуществляющее какое-либо представление группы Лоренца. Далее теория строится с помощью лагранжева формализма: выбирают локальный [т. е. зависящий лишь от компонент поля и их первых производных в одной точке ] квадратичный пуанкаре-инвариантный лагранжиан и из принципа наименьшего действия получают уравнения движения. Для квадратичного лагранжиана они линейны – свободные поля удовлетворяют принципу суперпозиции.
В силу теоремы Нётер из инвариантности действия относительно каждой однопараметрической группы следует сохранение (независимость от времени) одной, явно указываемой теоремой, интегральной функции от и . Поскольку сама группа Пуанкаре содержит 10 параметров, в КТП обязательно сохраняются 10 величин (которые иногда называют фундаментальными динамическими величинами): четыре компоненты вектора энергии-импульса и шесть компонент момента импульса – три компоненты трёхмерного момента импульса и три т. н. буста ( – единичный полностью антисимметричный тензор; по повторяющимся индексам подразумевается суммирование). С математической точки зрения , , – генераторы группы Пуанкаре.
Каноническое квантование, согласно общим принципам квантовой механики, состоит в том, что обобщённые координаты (т. е. набор значений всех компонент поля во всех точках пространства в некоторый момент времени ) и обобщённые импульсы объявляют операторами, действующими на амплитуду состояния (вектор состояния) системы, и налагают на них перестановочные соотношения:
причём знак плюс или минус соответствует квантованию по Ферми – Дираку или Бозе – Эйнштейну (см. ниже). Здесь – символ Кронекера, – дельта-функция Дирака.
Альтернативный вариант квантования, ковариантное квантование, состоит в установлении перестановочных соотношений на сами полевые операторы в двух произвольных точках и в релятивистски симметричной форме:
где – перестановочная функция Паули – Йордана, удовлетворяющая уравнению Клейна – Фока – Гордона (здесь и далее используется система единиц , – постоянная Планка).
При корпускулярном подходе векторы состояния свободных частиц должны образовывать неприводимое представление группы Пуанкаре, которое фиксируется заданием значений операторов Казимира (операторов, коммутирующих со всеми десятью генераторами группы , и ): оператора квадрата массы и квадрата обычного (трёхмерного) спина, а при нулевой массе – оператора спиральности (проекции спина на направление движения). Спектр непрерывен, а спектр спина дискретен, он может иметь целые или полуцелые значения: в единицах магнетона Бора. Кроме того, надо задать поведение вектора состояния при отражении нечётного числа координатных осей. Если частица обладает ещё какими-либо характеристиками (электрическим зарядом, изоспином и др.), то этому соответствуют новые квантовые числа; обозначим их буквой .
В представлении чисел заполнения состояние совокупности одинаковых частиц фиксируется числами заполнения всех одночастичных состояний. В свою очередь, вектор состояния записывают как результат действия на вакуумное состояние (состояние, в котором вовсе нет частиц) операторов рождения :
Операторы рождения и эрмитово сопряжённые им операторы уничтожения удовлетворяют перестановочным соотношениям
где знаки плюс и минус отвечают соответственно квантованию Ферми – Дирака и Бозе – Эйнштейна, а числа заполнения являются собственными значениями операторов числа частиц .
Чтобы учесть локальные свойства теории, надо перевести операторы в координатное представление и построить суперпозицию операторов рождения и уничтожения. Для нейтральных частиц это можно сделать непосредственно, определяя локальное лоренц-ковариантное поле как Но для заряженных частиц такой подход неприемлем: операторы и в (5) будут один увеличивать, а другой уменьшать заряд, и их линейная комбинация не будет обладать в этом отношении определёнными свойствами. Поэтому для образования локального поля приходится привлекать в пару к операторам рождения операторы уничтожения не тех же частиц, а новых частиц, реализующих то же представление группы Пуанкаре, т. е. обладающих в точности теми же массой и спином, но отличающихся от первоначальных знаком заряда (знаками всех зарядов ).
Из теоремы Паули следует, что для полей целочисленного спина, полевые функции которых однозначно представляют группы Лоренца, при квантовании по Бозе – Эйнштейну коммутаторы или пропорциональны функции и исчезают вне светового конуса, в то время как для осуществляющих двузначные представления полей полуцелого спина то же достигается для антикоммутаторов или при квантовании по Ферми – Дираку. Связь между удовлетворяющими линейным уравнениям функциями поля или , и операторами рождения , уничтожения и свободных частиц в стационарных квантовомеханических состояниях есть точное математическое описание корпускулярно-волнового дуализма. Новые, «рождаемые» операторами частицы, без которых нельзя было построить локальные поля, по отношению к первоначальным называются античастицами. Неизбежность существования античастицы для каждой заряженной частицы – один из главных выводов квантовой теории свободных полей.
Взаимодействие полей
Решения уравнений свободного поля пропорциональны операторам рождения и уничтожения частиц в стационарных состояниях, т. е. могут описывать лишь такие ситуации, когда с частицами ничего не происходит. Чтобы рассмотреть также случаи, когда одни частицы влияют на движение других либо превращаются в другие, нужно сделать уравнения движения нелинейными, т. е. включить в лагранжиан, кроме квадратичных по полям членов, ещё и члены с более высокими степенями. Лагранжиан взаимодействия может быть любой функцией полей и их первых производных, удовлетворяющей ряду условий: 1) локальности взаимодействия, требующей, чтобы зависел от различных полей и их первых производных только в одной точке пространства-времени ; 2) релятивистской инвариантности, для выполнения которой должен быть скаляром относительно преобразований Лоренца; 3) инвариантнoсти относительно преобразований из групп внутренних симметрий, если таковые имеются у рассматриваемой модели. Для теорий с комплексными полями существует также требование эрмитовости лагранжиана, что обеспечивает положительность вероятностей всех процессов.
Кроме того, можно требовать инвариантности теории относительно некоторых дискретных преобразований, таких как пространственная инверсия , обращение времени и зарядовое сопряжение (заменяющее частицы на античастицы). Доказано (СРТ-теорема), что всякое взаимодействие, удовлетворяющее условиям 1 – 3, обязательно должно быть инвариантным относительно одновременного выполнения этих трёх дискретных преобразований.
Многообразие лагранжианов взаимодействия, удовлетворяющих условиям 1–3, столь же широко, как многообразие функций Лагранжа в классической механике. Однако после квантования в теории возникает проблема сингулярностей при перемножении операторов в одной точке, что приводит к т. н. проблеме ультрафиолетовых расходимостей. Их устранение с помощью перенормировок в квантовой электродинамике (КЭД) выделило класс перенормируемых взаимодействий. Условие 4 – условие перенормируемости – оказывается весьма ограничивающим, и его добавление к условиям 1–3 допускает лишь взаимодействия с , имеющим вид полиномов невысокой степени по рассматриваемым полям, причём поля сколько-нибудь высоких спинов вообще исключаются из рассмотрения. Таким образом, взаимодействие в перенормируемой КТП не допускает (в отличие от классической и квантовой механики) никаких произвольных функций: как только выбран конкретный набор полей, произвол в ограничивается фиксированным числом констант взаимодействия (констант связи).
Полную систему уравнений КТП со взаимодействием (в представлении Гейзенберга) составляют уравнения движения, получающиеся из полного лагранжиана, и канонические перестановочные соотношения (1). Точное решение такой задачи удаётся найти лишь в небольшом числе случаев (например, для некоторых моделей в двумерном пространстве-времени).
Наибольшее распространение в КТП получил метод, основанный на переходе к представлению взаимодействия, в котором поля удовлетворяют линейным уравнениям движения для свободных полей, а всё влияние взаимодействия и самодействия переведено на временнýю эволюцию амплитуды состояния , которая теперь не постоянна, а изменяется в соответствии с уравнением типа уравнения Шрёдингера:
причём гамильтониан взаимодействия в этом представлении зависит от времени через поля , подчиняющиеся свободным уравнениям и релятивистски-ковариантным перестановочным соотношениям (2); таким образом, оказывается ненужным явное использование канонических коммутаторов (1) для взаимодействующих полей. Для сравнения с опытом решается задача о рассеянии частиц, в постановке которой принимается, что асимптотически, при , система пребывала в стационарном состоянии (придёт в стационарное состояние) , причём таковы, что частицы в них не взаимодействуют из-за больших взаимных расстояний, так что всё взаимное влияние частиц происходит только при конечных временах вблизи и преобразует в . Оператор называется матрицей рассеяния (или -матрицей); через квадраты его матричных элементов выражаются вероятности переходов из данного начального состояния в некоторое конечное состояние , т. е. эффективные сечения различных процессов. Таким образом, -матрица позволяет находить вероятности физических процессов, не вникая в детали временнóй эволюции, описываемой амплитудой . Тем не менее -матрицу обычно строят исходя из уравнения (6), которое допускает формальное решение в компактном виде с помощью оператора хронологического упорядочения, располагающего все операторы полей в порядке убывания времени . Выражение (8) есть символическая запись процедуры последовательного интегрирования уравнения (6) от до по бесконечно малым интервалам времени (), а не пригодное для использования решение. Для вычисления матричных элементов (7) необходимо представить матрицу рассеяния в форме не хронологического, а нормального произведения, в котором все операторы рождения стоят слева от операторов уничтожения. Преобразование одного произведения в другое и составляет истинную трудность решения задачи.
Теория возмущений
По этой причине для конструктивного решения задачи приходится прибегать к предположению о слабости взаимодействия, т. е. малости лагранжиана взаимодействия . Тогда можно разложить хронологическую экспоненту в выражении (8) в ряд теории возмущений, и матричные элементы (7) будут выражаться в каждом порядке теории возмущений через матричные элементы простых хронологических произведений соответствующего числа лагранжианов взаимодействия. Эта задача практически выполняется с помощью техники диаграмм Фейнмана и правил Фейнмана. При этом каждое поле характеризуется своей причинной функцией Грина (пропагатором, или функцией распространения) , изображаемой на диаграммах линией, а каждое взаимодействие – константой связи и матричным множителем из соответствующего слагаемого в , изображаемыми на диаграмме вершиной. Техника диаграмм Фейнмана проста в использовании и очень наглядна. Диаграммы позволяют представить процессы распространения (линии) и взаимопревращения (вершины) частиц – реальных в начальных и конечных состояниях и виртуальных в промежуточных (на внутренних линиях). Особенно простые выражения получаются для матричных элементов любого процесса в низшем порядке теории возмущений, которым соответствуют т. н. древесные диаграммы, не имеющие замкнутых петель, – после перехода к импульсному представлению в них не остаётся интегрирований. Для основных процессов КЭД такие выражения для матричных элементов были получены на заре возникновения КТП в конце 1920-х гг. и оказались в разумном согласии с опытом (уровень соответствия 10−2–10−3, т. е. порядка постоянной тонкой структуры ). Однако попытки вычисления радиационных поправок (связанных с учётом высших приближений) к этим выражениям наталкивались на специфические трудности. Таким поправкам отвечают диаграммы с замкнутыми петлями из линий виртуальных частиц, импульсы которых не фиксированы законами сохранения, и полная поправка равна сумме вкладов от всех возможных импульсов. Оказалось, что в большинстве случаев возникающие при суммировании этих вкладов интегралы по импульсам виртуальных частиц расходятся в УФ-области, т. е. сами поправки оказываются не только не малыми, но бесконечными. Согласно соотношению неопределённостей, большим импульсам отвечают малые расстояния. Поэтому можно полагать, что физические истоки расходимостей лежат в представлении о локальности взаимодействия.
Расходимости и перенормировки
Математически появление расходимостей связано с тем, что пропагаторы являются сингулярными (точнее, обобщёнными) функциями, обладающими в окрестности светового конуса при особенностями типа полюсов и дельта-функций по . Поэтому их произведения, возникающие в матричных элементах, которым на диаграммах отвечают замкнутые петли, плохо определены с математической точки зрения. Импульсные фурье-образы таких произведений могут не существовать, а формально выражаться через расходящиеся импульсные интегралы.
Проблема УФ-расходимостей была практически решена (т. е. получены конечные выражения для большинства важных физических величин) во 2-й половине 1940-х гг. на основе идеи о перенормировках (ренормировках). Суть последней состоит в том, что бесконечные эффекты квантовых флуктуаций, отвечающих замкнутым петлям диаграмм, могут быть выделены в множители, имеющие характер поправок к исходным характеристикам системы. В итоге массы и константы связи меняются за счёт взаимодействия, т. е. перенормируются. При этом из-за УФ-расходимостей ренормирующие добавки оказываются бесконечно большими. Соотношения перенормировок, связывающие исходные, т. н. затравочные, массы и затравочные заряды (константы связи) с физическими , :
(где , – множители перенормировки), оказываются сингулярными. Чтобы избежать сингулярности, вводят вспомогательную регуляризацию расходимостей. В аргументах [обозначенных в правых частях (9) многоточиями] радиационных поправок , и перенормировочных множителей , наряду с и , содержатся сингулярные зависимости от параметров вспомогательной регуляризации. Расходимости устраняют, отождествляя перенормированные массы и заряды (константы связи) с их физическими значениями.
Класс моделей КТП, для которых все без исключения УФ-расходимости удаётся «убрать» в множители перенормировки масс и констант связи, называют классом перенормируемых теорий. В этих теориях все матричные элементы и функции Грина в результате оказываются выраженными несингулярным образом через физические массы, заряды и кинематические переменные. Математическую основу этого утверждения представляет теорема Боголюбова – Парасюка о перенормируемости, на основе которой достаточно просто получаются конечные однозначные выражения для матричных элементов.
В неперенормируемых моделях не удаётся «собрать» все расходимости в перенормировки масс и зарядов. В подобных теориях в каждом новом порядке теории возмущений возникают новые расходящиеся структуры, т. е. они содержат бесконечное число параметров. К такому классу теорий относится, например, квантовая теория гравитации.
Перенормируемые модели КТП характеризуются, как правило, безразмерными константами связи, логарифмически расходящимися вкладами в перенормировку констант связи и масс фермионов и квадратично расходящимися радиационными поправками к массам скалярных частиц (если они есть). Для подобных моделей в результате перенормировки получают перенормированную теорию возмущений, которая и служит основой практических расчётов.
Преобразования (9), связывающие затравочные и перенормируемые константы взаимодействия, имеют групповой характер и образуют непрерывную группу, называемую ренормализационной группой (ренормгруппой). При изменении масштаба функции Грина умножаются на множители, которые нелинейным образом зависят от констант взаимодействия и вычисляются по теории возмущений, а сами константы взаимодействия меняются согласно (9). Решая соответствующие такому масштабному преобразованию дифференциальные уравнения ренормгруппы, можно получить замкнутые решения как функции от эффективных констант взаимодействия, зависящих от масштаба, которые соответствуют суммированию бесконечного ряда теории возмущений. Это позволяет, в частности, найти высокоэнергетические и низкоэнергетические асимптотики функций Грина.
Функциональный интеграл
В КТП важную роль играют полные функции Грина, включающие в себя эффекты взаимодействия. Они могут быть представлены бесконечными суммами членов, отвечающих всё более усложняющимся диаграммам Фейнмана с фиксированным числом и типом внешних линий. Для подобных величин можно дать формальные определения либо через вакуумные средние хронологических произведений полевых операторов в представлении взаимодействия и -матрицы (что эквивалентно вакуумным средним от -произведений полных, т. е. гейзенберговых, операторов), либо через функциональные производные от производящего функционала, представленного в виде функционального интеграла, зависящего от вспомогательных классических источников полей . Формализм производящих функционалов в КТП является аналогом соответствующего формализма статистической физики. Он позволяет для полных функций Грина и вершинных функций получить уравнения в функциональных производных, из которых, в свою очередь, можно получить бесконечную цепочку интегро-дифференциальных уравнений, подобных цепочке уравнений для корреляционной функции статистической физики.
Метод функционального интеграла, получивший значительное развитие с 1970-х гг., особенно в теории неабелевых калибровочных полей, является обобщением на КТП квантовомеханического метода интегралов по траекториям. В КТП такие интегралы можно рассматривать как формулы усреднения соответствующих классических выражений (например, классической функции Грина для частицы, движущейся в заданном внешнем поле) по квантовым флуктуациям полей.
Первоначально идея перенесения метода функционального интеграла в КТП была связана с надеждой получить компактные замкнутые выражения для основных квантовополевых величин, пригодные для конструктивных вычислений. Однако выяснилось, что из-за трудностей математического характера строгое определение можно дать лишь интегралам гауссова типа, которые только и поддаются точному вычислению. Поэтому представление функционального интеграла долгое время рассматривали как компактную формальную запись квантовополевой теории возмущений. Позднее конечнократное представление функционального интеграла в евклидовом пространстве стали использовать для проведения компьютерных расчётов на пространственной решётке, что позволяет получить результаты, не опирающиеся на теорию возмущений. Представление функционального интеграла сыграло также важную роль в работах по квантованию полей Янга – Миллса и доказательству их перенормируемости.