Луи де Бройль Революция в физике
Предисловие редактора
Предлагаемая вниманию читателей книга написана одним из знаменитых ученых, который сам принимал участие в развитии квантовой физики, еще когда она делала свои первые шаги. Это одна из немногих книг, где популярно и довольно полно излагается нерелятивистская квантовая теория, ставшая уже классической, но все еще не очень понятная и не очень знакомая тем, кто непосредственно не занимается этой областью физики.
Это образец лучшего стиля популярной литературы, где автор никогда не впадает в дурной тон снисходительного отношения к читателю, которое выражается в том, что очень примитивно при помощи объяснений «на пальцах» и вульгарных «картинок» предположительно «малоразвитому» читателю пытаются объяснить некие высокие и недоступные материи. Напротив, это серьезная беседа о серьезных и трудных вещах, предполагающая у читателя способность к такому же точно интеллектуальному напряжению, которое приходится делать автору для того, чтобы трудные вопросы изложить по возможности ясно и доступно.
Популярной книгу делает главным образом, то, что при изложении совершенно не употребляется математический аппарат и от читателя не требуется никаких специальных знаний. От него требуется только общая культура и добрая воля, которая стимулируется непосредственным интересом к предмету.
Эта книга была написана в 1936 и переиздана в 1946 г. почти без изменений. Действительно, нерелятивистская квантовая физика практически окончательно сложилась к 1930 г. Только несколько поправок внесено в текст этой книги 15-летним развитием науки и притом все они не имеют принципиального значения, а относятся к частным фактам. И больше того, к фактам не той нерелятивистской квантовой механики, которая составляет содержание книги де Бройля, а к области квантовой теории поля или теории элементарных частиц, близко с нею связанной. Эти последние области очень сильно развились за послевоенные годы, хотя мы все еще, видимо, далеки здесь от истинного понимания.
Так, например, сейчас точно установлено, что любая частица (в настоящее время насчитывают около 30 разных элементарных частиц) имеет свою античастицу, подобно тому как электрону соответствует позитрон. В отдельных редких случаях истинно нейтральных частиц частица совпадает со своей античастицей, поэтому некоторые из рассуждений де Бройля оказываются несостоятельными или сильно упрощенными. Например (см. стр. 56), «странная асимметрия», о которой говорит де Бройль в связи с протонами и электронами, воспринимается нами теперь как глубокая особенность асимметричного строения нашего мира на фоне полной симметрии физических законов по отношению к частицам и античастицам. Этот факт, очевидно, связан с выделенным характером положительного направления времени (ср. обсуждение этого факта на стр. 74, 75), поскольку при формальном обращении времени (замена t на –t) все частицы переходят в античастицы с противоположной четностью.
После фундаментальной работы Паули о так называемой СРТ-инвариантности (1942 г.) и удивительных открытий последних лет (несохранение четности – Ли и Янг, 1956 г.; комбинированная четность – Ландау, 1956 г.) эта область стала более понятной.
Другая важная область – это релятивистская квантовая механика или квантовая теория поля, которая очень интенсивно сейчас разрабатывается. Некоторые из высказываний де Бройля логически относятся именно к этой области. Например, его замечания о трудностях излагаемой им теории фотона или о трудностях релятивистской задачи многих тел (релятивистской статистической физики).
Конечно, эти пункты следовало бы изложить в свете последних открытий немного по-другому. Хотя в этой области и остались большие принципиальные трудности, но многое теперь можно объяснить и дать какое-то количественное описание некоторым фактам. Мы не считаем нужным ни изымать эти места из текста книги, ни, тем более, как-то их изменять. Для предмета книги де Бройля – нерелятивистской квантовой механики – они имеют побочное значение.
Некоторые претензии могут быть предъявлены к обоснованию в этой книге вероятностной концепции квантовой механики и к трактовке так называемого корпускулярно-волнового дуализма. Иногда создается впечатление, что точка зрения де Бройля несколько изменяется от главы к главе. Так оно, вероятно, и есть, потому что де Бройль в разные периоды своего научного творчества придерживался разных взглядов на эту очень трудную и основную концепцию квантовой механики. Всякого, кто захочет глубже разобраться в этом, мы отсылаем к дискуссии между Нильсом Бором и Альбертом Эйнштейном, опубликованной, например, в книге Бора «Атомная физика и человеческое познание». Два великих ученых придерживались разных взглядов, и их дискуссия – образец научного спора, в котором участники ищут только установления истины, а не подтверждения своей точки зрения, – много способствовала пониманию этого трудного и важного вопроса.
Читателю, который захочет продолжить свое знакомство с идеями квантовой физики и ее новыми достижениями, мы предлагаем в конце книги список литературы, из которого он может выбрать книгу по своему вкусу.
Но эта книга де Бройля очень подходит и для первого знакомства с квантовой теорией и даже, на наш взгляд, будет интересной многим физикам, работающим в этой области.
Действительно, умение де Бройля ясно изложить сложные вопросы, наметить рациональную связь идей составляет очень ценные свойства этой книги. Если же иногда в жертву ясности приносится глубина и эта связь выглядит несколько упрощенной, то для популярного изложения это еще не порок, а более искушенный читатель простит эти моменты и сам найдет способ поправить для себя отдельные черты в общей правильной картине.
М.К. Поливанов
Введение. Значение квантов
1. Зачем нужно знать о квантах?
Многие, взглянув на заглавие этой небольшой книжки, бесспорно, будут напуганы загадочным словом «кванты». Действительно, даже о теории относительности, которая довольно оживленно обсуждалась в последние несколько лет, широкие круги читателей имеют весьма смутное представление. Что же касается квантовой теории, то о ней, я полагаю, читатель имеет еще более смутное представление. Правда, это и простительно, ведь кванты довольно загадочная вещь.
Что касается меня, то я начал заниматься квантами, когда мне было около двадцати лет, и продолжал изучать их в течение четверти века. И все же я должен честно признаться, что если за все это время я и добился несколько более глубокого понимания некоторых сторон этого вопроса, то я не могу еще с полной уверенностью сказать, что таится под маской, скрывающей подлинное лицо квантов. Тем не менее мне кажется, что, несмотря на всю важность и значительность прогресса, происшедшего в физике за последние века, ученые были не в состоянии глубоко понять истинную природу явлений, пока они ничего не знали о существовании квантов. Ибо без квантов нельзя было бы представить себе ни света, ни материи.
Можно понять, какое существенное влияние было оказано на само направление развития человеческих знаний в тот день, когда кванты исподтишка вошли в науку. В тот самый день величественное и грандиозное здание классической физики было потрясено до самого основания, хотя никто тогда еще и не отдавал себе ясного отчета в этом. В истории науки не много было подземных толчков, сравнимых по силе с этим.
И только сейчас мы в состоянии понять и оценить грандиозность и важность свершившейся революции. Классическая физика, верная идеалу Декарта, изображала Вселенную в виде некоего огромного механизма, поведение которого можно совершенно точно описать, задав положения всех его частей в пространстве и изменение положения со временем; механизма, поведение которого в принципе можно было бы предсказать абсолютно точно, зная некоторое число параметров, определяющих его начальное состояние. Однако такая точка зрения основывалась на некоторых гипотезах, которые при этом делались и справедливость которых казалась очевидной. Одна из них состоит в предположении, что та область в пространстве и времени, в которую мы почти инстинктивно стремимся поместить все наши ощущения, – область совершенно жесткая и определенная и в ней каждое физическое явление может быть в принципе совершенно строго локализовано вне зависимости от всех динамических процессов, управляющих этим явлением. Поэтому все развитие физического мира сводилось к изменениям пространственного положения тел с течением времени. Именно поэтому динамические величины, такие, как энергия и количество движения, выступают в классической физике как производные, образованные с помощью понятия скорости. Таким образом, кинематика оказывается основой динамики.
Совсем иное положение в квантовой физике. Существование кванта действия приводит к противоречию между концепцией строгой локализации в пространстве и во времени и концепцией динамического развития. Каждая из них в отдельности может быть использована для описания действительного мира. Однако их нельзя одновременно применять со всей строгостью. Точная локализация в пространстве и во времени – это некая статическая идеализация, исключающая всякое развитие и всякое движение. Понятие же состояния движения, взятое в чистом виде, напротив, есть динамическая идеализация, противоречащая понятиям точного положения и момента времени.
В рамках квантовой теории физический мир нельзя описать, не пользуясь в той или иной степени каким-либо из этих двух противоречащих друг другу понятий. Таким образом, она исходит из своего рода компромисса, известные же соотношения неопределенности Гейзенберга указывают нам, в какой мере этот компромисс возможен. Среди прочих выводов из новой теории следует, что кинематика уже не является наукой, имеющей самостоятельный физический смысл. В классической механике можно было изучать перемещения в пространстве и определять таким образом скорость и ускорение, независимо от того, как физически реализуются эти перемещения. Затем от этого абстрактного изучения законов движения, вводя некоторые новые физические принципы, можно перейти к динамике. В квантовой механике подобный путь неприемлем в принципе, поскольку пространственно-временная локализация, лежащая в основе кинематики, возможна лишь в некоторых частных случаях, определяемых конкретными динамическими условиями движения. Дальше мы увидим, почему при изучении явлений в крупных масштабах вполне допустимо тем не менее пользоваться законами кинематики. Однако, когда мы переходим к рассмотрению явлений, происходящих в масштабах атома, где кванты играют главную роль, можно сказать, что кинематика, определяемая как наука о движении вне зависимости от всех динамических условий, полностью теряет свое значение.
Другая гипотеза, по существу лежащая в основе классической физики, состоит в том, что с помощью соответствующих мер предосторожности можно, в принципе, сделать пренебрежимо малым влияние вносимых процессом измерения возмущений естественного хода изучаемого явления. Иначе говоря, предполагается, что эксперимент может быть проведен таким образом, чтобы влияние вызванных им возмущений хода изучаемого процесса было как угодно малым. Такая гипотеза может считаться справедливой для явлений, протекающих в больших масштабах. Для явлений же атомного мира она оказывается неверной. Это связано с существованием кванта действия и с тем, что, как показал тонкий и глубокий анализ Гейзенберга и Бора, всякая попытка измерить какую-либо величину, характеризующую данную систему, приводит к неконтролируемому изменению других величин, определяющих свойства этой системы. Точнее, всякое измерение какой-либо величины, которое позволяет установить положение системы в пространстве и во времени, имеет своим следствием неконтролируемое изменение соответствующей сопряженной величины, определяющей динамическое состояние системы. В частности, оказывается невозможным точно измерить в один и тот же момент две взаимно сопряженные величины.
Теперь понятно, в каком смысле можно говорить, что существование кванта действия делает несовместимой пространственно-временную локализацию различных частей системы с каким-либо ее определенным динамическим состоянием, поскольку для локализации системы необходимо точно знать целый ряд величин, измерение которых исключает в свою очередь определение соответствующих сопряженных величин, характеризующих динамическое состояние системы, и наоборот. Существование квантов весьма своеобразным образом определяет нижнюю границу величины возмущений, которые физик вносит при измерении изучаемых им систем. Таким образом, одна из гипотез, которая была положена в основу классической физики, оказалась опровергнутой, и значение этого факта весьма велико.
Итак, оказывается, что никогда нельзя знать точных значений более половины величин, необходимых для полного описания системы с классической точки зрения. Значение некоторой величины, характеризующей систему, тем более неопределенно, чем с большей точностью известно значение сопряженной ей величины. Отсюда вытекает существенное различие между старой и новой физикой во взглядах на детерминизм в явлениях природы.
С точки зрения классической физики задание величин, определяющих положение различных частей системы в некоторый момент времени, и соответствующих сопряженных динамических величин вполне достаточно, по крайней мере в принципе, для точного описания состояния системы во все последующие моменты времени. Зная точные значения x0, y0…. величин, характеризующих систему в некоторый момент t0, можно было однозначно предсказать, какие значения x, y…. этих величин будут найдены, если их определять в какой-либо последующий момент времени t. Это следует из уравнений, положенных в основу механической и физической теорий, и есть прямое математическое свойство этих уравнений.
Утверждения о возможности точного предсказания будущих явлений исходя из настоящих явлений, и о том, что будущее в определенном смысле полностью содержится в настоящем и ничего к нему добавить не может, и составляют то, что носит название детерминизма явлений природы. Но такая возможность точного предвидения предполагает точное определение в некоторый момент времени переменных, описывающих положение в пространстве, и сопряженных им динамических переменных. А именно такое одновременное определение взаимно сопряженных величин и оказывается, с точки зрения квантовой механики, невозможным. И с этим связаны существенные изменения, происшедшие в понимании возможностей предвидения современной теоретической физики и взаимосвязи явлений природы.
Поскольку значения величин, которые характеризуют состояние системы в момент времени t0, возможно установить лишь с некоторой неопределенностью, неизбежной в квантовой теории, то соответственно физик уже не может точно предсказать, каковы будут значения этих величин в некоторый последующий момент времени. Он может предсказать лишь вероятность того, что при определении этих величин в последующий момент времени t мы получим те или иные их значения. Связь между результатами последовательных измерений, которая объясняет количественную сторону явлений, не будет больше причинной связью, отвечающей классическому детерминизму. Она скорее будет вероятностной связью, единственно совместимой с неопределенностью, которая вытекает из самого существования кванта действия. В этом и состоит главное изменение в наших взглядах на физические законы, изменение, все философские следствия которого, как нам кажется, еще далеко не осмыслены.
В результате развития новейшей теоретической физики появились две важные идеи: принцип дополнительности Бора и принцип ограниченности представлений. Бор был первым, кто заметил, что в новой квантовой физике, в том виде, какой ей придала волновая механика, понятия частицы и волны, пространственно-временной локализации и вполне определенного динамического состояния являются дополнительными. Под этим он понимал, что полное описание наблюдаемых явлений требует использования обоих этих понятий, но тем не менее в некотором смысле они несовместимы между собой. Вызываемые ими образы никогда нельзя одновременно использовать для описания действительности. Например, большое число явлений, наблюдаемых в атомной физике, можно объяснить только исходя из понятия частиц. Следовательно, использование этого понятия физику необходимо. Равным же образом для объяснения целого ряда других явлений необходимо пользоваться понятием волны. Последовательное применение для описания явлений природы какого-либо одного из этих двух представлений, строго говоря, исключает применение другого. Однако в действительности при описании некоторых процессов используют оба понятия, и, несмотря на их противоречивый характер, нужно применять то или иное из них в зависимости от ситуации.
Так же обстоит дело с понятиями пространственно-временной локализации и вполне определенного динамического состояния: они так же дополнительны, как и понятия частицы и волны, с которыми к тому же, как мы скоро увидим, они тесно связаны. Можно спросить, почему же применение этих противоречащих друг другу представлений никогда не приводит к абсурду. Как мы уже говорили, это связано с тем, что невозможно одновременно определить все детали, которые позволяли бы полностью уточнить эти два представления. На математическом языке это выражается соотношением неопределенности Гейзенберга, которое в конечном счете есть следствие существования кванта действия. Так выступает со всей ясностью громадное значение открытия квантов в развитии современной теоретической физики.
С принципом дополнительности Бора тесно связан принцип ограниченности представлений. Такие простые образы, как частица, волна, точка, строго локализованная в пространстве, состояние вполне определенного движения, представляют собой, в сущности, некоторые абстракции, идеализации. В большинстве случаев эти идеализации приблизительно соответствуют действительному положению вещей, хотя и имеют определенные границы применимости. Применение каждой из этих идеализаций возможно лишь до тех пор, пока не окажется необходимым использование «дополнительной» идеализации. Таким образом, можно сказать, что частицы существуют, так как большое число физических явлений может быть объяснено только в том случае, если допустить их существование. Однако в других явлениях корпускулярная природа более или менее завуалирована и явно проявляется лишь волновой характер процесса.
Созданные нами более или менее схематичные идеализации способны отразить некоторые стороны различных явлений, но они все же ограничены и в их жесткие рамки не умещается все богатство реальности.
Мы не хотим затягивать этот предварительный обзор новых перспектив, позволивший нам в общих чертах рассмотреть развитие квантовой физики. У нас еще будет случай подробно остановиться на каждом из рассматриваемых вопросов, дополняя и углубляя его по мере изложения. Сказанного здесь уже достаточно, чтобы показать читателю, как глубока и интересна квантовая теория. Она не только вызвала к жизни отрасль науки – атомную физику – наиболее живую и увлекательную, но также бесспорно расширила наши представления о мире и привела к появлению многих новых идей, которые оставят, без сомнения, глубокий след в истории человеческой мысли. Именно поэтому квантовая физика представляет интерес не только для специалистов, она заслуживает внимания каждого культурного человека.
2. Классическая механика и физика – это всего лишь приближения
Теперь обсудим вкратце вопрос о том, какую роль современная физика отводит классической механике и физике. Разумеется, они полностью сохраняют свое практическое значение в той области явлений, для описания которой они были созданы и в которой их справедливость подтверждается опытом. Открытие квантов ни в коей мере не нарушает законов падения тел или законов геометрической оптики. Всякий раз, когда с определенной степенью точности подтверждается какой-либо закон (а всякий результат может быть проверен лишь с определенной точностью), можно утверждать, что этот результат в основном является окончательным и никакие последующие теории его не смогут опровергнуть. Если бы это было не так, то никакая наука вообще не могла бы развиваться. Однако может так случиться, что появление новых экспериментальных данных или новых теорий приведет к тому, что найденные ранее законы будут рассматриваться лишь как некоторое приближение. Иными словами, при увеличении точности измерений справедливость их в конце концов нарушается. Такие случаи неоднократно встречались в истории развития науки. Из законов геометрической оптики, например, известно, что закон прямолинейности распространения света, хотя он и был проверен с большой степенью точности и считался вначале совершенно точным, оказался верным лишь приближенно. Это стало ясным после открытия явления дифракции и установления волновой природы света. Именно таким путем последовательных приближений, устраняя внутренние противоречия, и может развиваться наука. Созданные в процессе ее развития теории не будут полностью опровергнуты и уничтожены последующим развитием науки, а войдут в качестве составных частей в новые, более общие теории. С этой точки зрения механику и классическую физику можно рассматривать как введение в квантовую физику.
Механика и классическая физика были созданы для описания явлений, протекающих в масштабе наших повседневных явлений. Они остаются справедливыми и для описания процессов, происходящих в еще больших астрономических масштабах. Но как только мы переходим к масштабам атома, существование квантов сразу ограничивает область применения механики и классической физики. С чем же это связано? А с тем, что величина кванта действия, характеризуемая знаменитой постоянной Планка, чрезвычайно мала по сравнению с нашими обычными единицами измерений. Возмущения, вносимые в измерения в результате существования квантов, оказываются в обычных условиях настолько малыми, что в используемых при этом единицах их практически невозможно заметить. Эти возмущения значительно меньше ошибок измерений, неизбежно возникающих в экспериментах, поставленных для проверки того или иного классического закона.
В свете квантовой теории классическая механика и физика уже не являются абсолютно точными. Однако в обычных условиях нарушение классических законов оказывается незаметным из-за имеющихся всегда ошибок измерений. Таким образом, для явлений, протекающих в наших обычных масштабах, классические механика и физика оказываются очень хорошим приближением.
Итак, здесь мы снова встречаемся с обычным процессом развития науки. Твердо установленные принципы, надежно проверенные законы, хотя и сохраняются в дальнейшем развитии науки, но уже рассматриваются не как абсолютно точные, а лишь как некоторое приближение, пределы применимости которого определяются новой, более общей теорией.
Поскольку все же для явлений нашего масштаба классическая механика и физика, совершенно не учитывающие наличия квантов, остаются справедливыми, то некоторые, возможно, скажут, что, в сущности, кванты не имеют такого уж всеобщего значения, какое им приписывается, поскольку в чрезвычайно широкой области явлений, включающей, в частности, область практических приложений, квантовую природу явлений можно совершенно не учитывать. Однако подобная точка зрения кажется нам неправильной. Во-первых, в такой важной и перспективной области как атомная и ядерная физика, кванты играют настолько существенную роль, что без привлечения квантовой теории понять явления, относящиеся к этой области, оказывается совершенно невозможно. Во-вторых, в макроскопической физике, где благодаря малости величины квантов и неизбежным ошибкам эксперимента квантовая природа процессов не проявляется явно, наличие кванта действия влечет за собой все те следствия, на которые мы указали ранее. И если они практически не оказывают заметного влияния, то это никоим образом не умаляет их значения, как для физики, так и для философии. Поэтому в настоящее время квантовая теория является одной из существенных основ естествознания.
Глава I. Классическая механика
1. Кинематика и динамика
В этой небольшой главе мы отнюдь не собираемся делать какого-либо, даже краткого, обзора принципов классической механики и, тем более, критически анализировать эту область физики. Для этого недостаточно было бы и целой книги; к тому же эти вопросы уже рассмотрены многими выдающимися учеными. Мы остановимся здесь лишь на некоторых вопросах, которые, на наш взгляд, представляют интерес в связи с излагаемым материалом.
Аналитическая механика состоит из двух разделов, носящих совершенно различный характер: кинематики и динамики, частным случаем которой является статика. Необходимо вкратце остановиться на этом разделении, поскольку оно основывается на предположениях, не оправдавших себя с точки зрения квантовой теории.
В самом деле, что же такое кинематика и почему ее изучают обычно прежде, чем динамику? Кинематика изучает движения тел, происходящие в трехмерном пространстве в течение какого-то времени и совершенно независимо от физических причин этого движения. На первый взгляд кажется вполне естественным предпослать изучению динамики изучение кинематики, ибо представляется совершенно логичным сначала изучить in abstracto различные виды движения в пространстве, а уж затем задаваться вопросом, по какой причине и следуя каким законам то или иное движение возникает в тех или иных условиях. Но этот кажущийся естественным путь в действительности покоится на одной гипотезе, в чем до последнего времени не отдавали себе ясного отчета даже наиболее выдающиеся умы. Действительно, математики, очевидно, вправе заниматься изучением перемещений в пространстве трех измерений в зависимости от параметра, который может быть идентифицирован со временем. Однако речь здесь идет о том, можно ли, как это без всякого анализа предполагалось, применять результаты этого абстрактного изучения к случаю реального движения физических объектов.
Классический переход от кинематики к динамике, по существу, содержит в себе гипотезу о том, что локализация физических объектов в некоторой абстрактной области трехмерного пространства и времени возможна вне зависимости от внутренних свойств самих физических объектов, например от их массы. Совершенно достоверно известно, что если оставаться в пределах нашего масштаба, то окружающие нас материальные тела с большой степенью точности могут считаться локализованными в пространстве и во времени. Именно это свойство тел и, в частности твердых, позволяет нам наглядно представить себе трехмерное пространство, в котором они перемещаются. Движение этих тел дает нам возможность точно определить время и способ его измерения. Поэтому оказывается вполне естественным, что методы аналитической механики с успехом применяют для изучения движения подобного рода материальных объектов. Однако распространение, без всяких оговорок, предположения о возможности локализации физических объектов в трехмерном пространстве и во времени на элементарные частицы материи, т.е. на чрезвычайно легкие объекты, как это было сделано на заре развития атомной физики, – слишком смелая экстраполяция. В действительности, для этих элементарных объектов классические понятия пространства и времени не будут более справедливы, и мы сможем использовать их теперь лишь с ограничениями, которые и составляют наиболее своеобразные стороны квантовой теории. Ниже мы обсудим этот вопрос более подробно. Пока же нам достаточно указания, на какую гипотезу, заведомо справедливую только для объектов нашего масштаба, опирается метод изучения и описания движения материальных тел, вытекающий из классической механики.
2. Законы Ньютона и динамика материальной точки
Приняв за основу возможность локализации физических объектов в пространстве и во времени, классическая механика начинает изучение законов движения с наиболее простого случая: с изучения законов движения материальной точки, т.е. физического объекта бесконечно малых размеров, обладающего конечной массой. Эта схематическая идея элементарной частицы, которую аналитическая механика предпосылает изложению законов динамики, полностью отвечает представлению о дискретности материи. И поэтому совершенно естественно, что полвека назад, когда физики пытались представить себе материю как совокупность находящихся в движении элементарных частиц, в динамике материальной точки они нашли как раз тот инструмент, который был необходим для их теоретических построений.
Динамика материальной точки исходит из принципа инерции, согласно которому материальная точка, на которую не действуют никакие внешние силы, сохраняет со временем свое состояние движения (или покоя). Это положение строго выполняется, во всяком случае тогда, когда речь идет о так называемых галилеевых системах координат, например системе, связанной с неподвижными звездами. Особая роль галилеевых систем координат следует из их определения. Если трехмерное пространство, в котором локализуются все физические объекты, понимать как пространство, имеющее некий абсолютный смысл, то под галилеевыми системами понимаются системы координат, движущиеся прямолинейно и равномерно относительно абсолютного пространства.
Согласно принципу инерции, свободная материальная точка движется прямолинейно и равномерно, либо в частном случае, когда ее скорость равна нулю, остается в состоянии покоя. Таким образом, вполне естественно предположить, что действие некоторой силы на материальную точку сводится просто к изменению ее скорости. Наиболее простой гипотезой будет предположение, что мгновенное изменение скорости материальной точки прямо пропорционально величине, действующей на нее силы, а коэффициент пропорциональности тем меньше, чем больше ее инерция, т.е. чем сильнее она противодействует изменению ее скорости.
Естественно характеризовать материальную точку величиной коэффициента инерции – ее массой. При этом основной закон динамики материальной точки можно сформулировать следующим образом: ускорение, сообщаемое некоторой материальной точке, равно в каждый момент времени отношению силы, действующей на эту точку, к величине ее массы. Заметим, что в соответствии с методом, предполагающим, что изложение кинематики предшествует изложению динамики, масса, являющаяся в динамике характеристикой материальной точки, вводится a posteriori, тогда как существование определенных положения, траектории, скорости и ускорения точки допускается a priori.
Уравнения классической динамики материальной точки утверждают таким образом, что произведение массы материальной точки на какую-либо из компонент ее ускорения равно соответствующей компоненте силы, действующей на эту материальную точку. Если предположить, что сила есть известная функция координат и времени, то для определения координат материальной точки в зависимости от времени мы получаем систему трех обыкновенных дифференциальных уравнений второго порядка по времени.
Хорошо известная из математического анализа теорема утверждает, что решение этой системы уравнений однозначно определяется заданием координат и их первых производных по времени в какой-либо начальный момент времени. Иначе говоря, если известно положение материальной точки и ее скорость в некоторый момент времени, то можно точно определить характер ее движения во все последующие моменты времени.
Этот результат показывает, что классическая динамика материальной точки находится в полном соответствии с принципом физического детерминизма, принципом, согласно которому будущее состояние материального мира может быть полностью предсказано, если известны параметры, определяющие его состояние в какой-либо предшествующий момент времени.
Интересно отметить еще один факт. Поскольку предполагается, что материальная точка имеет бесконечно малые размеры, то ее траекторией будет линия, которая занимает в трехмерном пространстве лишь одномерный континуум. Материальная точка в каждой точке своей траектории находит определенное значение силы, которое и задает ее движение в последующий бесконечно малый промежуток времени. При этом, казалось бы, характер движения определяется лишь значением поля сил вдоль траектории и совершенно не зависит от его значений вне этой траектории. В действительности, однако, это не совсем так, и характер движения зависит также от поля сил в непосредственной близости от траектории. Последнее обстоятельство связано с тем, что, поскольку во всех физических задачах поле сил, как правило, меняется в пространстве непрерывно, значение силы в какой-либо точке траектории зависит, вообще говоря, от ее значений в области, непосредственно примыкающей к траектории. Особенно ясно это видно в часто встречающемся случае, когда сила в каждой точке пространства равна градиенту некоторой функции координат. Действительно, определение градиента предполагает, что потенциал известен не только в точке приложения силы, но и в некоторой бесконечно малой окрестности этой точки и, следовательно, сила в каждой точке траектории оказывается зависящей от значений потенциала в области, расположенной в непосредственной близости от траектории. Принцип наименьшего действия приводит к тем же выводам, поскольку он определяет действительную траекторию материальной точки, т.е. траекторию, которую в действительности описывает материальная точка, двигаясь согласно законам динамики, сравнением ее с другими, бесконечно близкими траекториями. Это также означает, что характер движения материальной точки зависит от значений силы в области, расположенной бесконечно близко от ее траектории.
Однако в рамках классической механики топологические неоднородности пространства, расположенные на конечных расстояниях от траектории материальной точки, разумеется, никоим образом не могут влиять на ее движение. Поместим, например, поперек траектории материальной точки экран с отверстием. Если траектория пересекает экран вблизи центра отверстия, то искажения топологии пространства, вызванные наличием экрана, совершенно не повлияют на ее вид. Напротив, если траектория проходит бесконечно близко от края отверстия, то она будет возмущена, и тогда говорят, что частица задела край экрана. Однако с точки зрения классической механики, совершенно невозможно понять, почему движение материальной точки, проходящей сквозь отверстие в экране, зависит от того, имеются ли в экране дополнительные отверстия, расположенные на конечном расстоянии от первого. Значение этих замечаний для объяснения опытов Юнга с отверстиями в экране с корпускулярной точки зрения скоро станет понятно; можно также почувствовать, что нового должна внести волновая механика в этот вопрос.
Уравнения классической механики материальной точки позволяют ввести две динамические величины, характеризующие движение материальной точки. Первая из них – векторная величина, количество движения, или импульс, который определяется в классической механике как произведение массы материальной точки на ее скорость. Важность этой величины для физики следует из тех же уравнений движения, поскольку их можно сформулировать следующим образом: производная по времени от вектора количества движения равна силе, действующей на материальную точку. Хотя, как легко видеть, в классической механике эта динамическая величина является производной от кинематической величины (скорости) и образуется из нее простым умножением на массу, ясно, что эти две величины имеют совершенно различную природу, ибо импульс характеризует собственно динамические свойства рассматриваемой материальной частицы. Вторая из них – скаляр, энергия. Она играет существенную роль, особенно в тех случаях, когда сила является потенциальной. Из уравнений движения непосредственно следует, что если потенциал для всех точек пространства не зависит от времени, то имеется некоторая величина, сохраняющая постоянное значение при перемещении материальной точки. Эта величина равна сумме половины произведения массы на квадрат скорости и значения потенциала в том месте, где находится материальная точка. Иными словами, эта величина равна сумме кинетической и потенциальной энергий. Таким образом, в потенциальном поле сил (консервативном поле) полная энергия, которую мы только что определили, остается постоянной или, выражаясь математическим языком, является первым интегралом движения. Здесь опять мы видим, что понятие энергии вводится с помощью кинематического понятия скорости и специфически динамических понятий массы и потенциала (последний непосредственно связан с силой). Нет необходимости отмечать, что понятие энергии, кстати, далеко выходящее за рамки классической механики, имеет огромное значение для всей физики.
Так же как остается постоянной энергия, если производная потенциала по времени тождественно равна нулю, так и компонента количества движения сохраняет постоянное значение, если производная потенциала по соответствующей координате тождественно равна нулю. Это указывает на некоторое сходство между энергией и компонентами импульса. Энергия соответствует временной координате, тогда как компоненты импульса – пространственным координатам. Сходство проявляется еще более явно в теории относительности, в которой энергия и три компоненты импульса рассматриваются как компоненты некоторого четырехмерного пространственно-временного вектора – вектора четырехмерного импульса.
В механику материальной точки входят также и несколько других величин, имеющих важное значение. Например, компоненты момента количества движения материальной точки относительно некоторой заданной точки. Они также выводятся из кинематических понятий положения и скорости, к которым добавляется динамическое понятие массы. Эти компоненты, как известно, будут первыми интегралами движения в случае центрального поля сил; важность этого случая в небесной механике общеизвестна.
Итак, в классической теории динамические величины образуются из кинематических величин скорости и координаты и собственно динамических величин массы» и потенциала.
3. Динамика системы материальных точек
В динамике материальной точки поле сил предполагается заданным в каждой точке для каждого момента времени. Но в классической механике силовое поле, действующее на какую-либо материальную точку, само создается другими материальными точками. Таким образом, вполне естественно рассмотреть совокупность взаимодействующих между собой материальных точек и определить характер движения такого ансамбля.
На первый взгляд подобная задача может показаться очень сложной, поскольку каждая материальная точка, входящая в эту систему, перемещается в результате воздействия на нее других материальных точек, что в свою очередь приводит к изменению силы, действующей на данную материальную точку со стороны остальных.
Тем не менее, с математической точки зрения задача формулируется по-прежнему просто: в каждый момент времени произведение массы какой-либо материальной точки на ее ускорение равно действующей на нее силе, которая, разумеется, зависит от положения всех остальных материальных точек системы. Таким образом, для ансамбля, состоящего из N материальных точек, мы получаем систему из 3N дифференциальных уравнений второго порядка по времени для 3N координат всех N материальных точек. Как следует из математического анализа, решение этой системы уравнений полностью определяется заданием положений и скоростей всех материальных точек системы в начальный момент времени. Так обобщается на случай системы материальных точек принцип механического детерминизма, установленный ранее для случая одиночной материальной точки.
Изучение движения системы материальных точек очень упрощается, если ввести понятие центра инерции системы, который, как известно, совпадает с центром тяжести всех материальных точек системы. Оказывается, что если на систему не действуют никакие внешние силы, то ее центр инерции движется прямолинейно и равномерно. Этот результат следует из одного общего свойства сил, вводимых в механике, свойства, которое выражается принципом равенства действия и противодействия. Согласно этому принципу, сила, действующая на материальную точку A со стороны материальной точки B, равна по величине и противоположна по направлению силе, с которой точка A действует на точку B.
В том случае, когда система обладает потенциальной энергией, можно предположить, что потенциальная энергия зависит только от взаимного положения материальных точек – гипотеза с физической точки зрения вполне естественная.
Итак, задача определения движения системы разбивается на две: сначала находится движение центра инерции, а затем – движение системы относительно ее центра тяжести. Ряд хорошо известных теорем облегчает решение этой задачи.
Количество движения системы материальных точек определяется просто как сумма (геометрическая) количеств движения всех входящих в нее материальных точек. Оно выражается в виде суммы произведений масс на соответствующие скорости, т.е. также использует понятие скорости. Что касается энергии системы, то она всегда содержит слагаемое, соответствующее кинетической энергии и равное сумме кинетических энергий всех материальных точек, т.е. полусумме произведений массы каждой материальной точки на квадрат ее скорости. Если же система консервативна, то полная энергия включает в себя также потенциальную энергию, которая в свою очередь состоит из двух слагаемых. Первое равно сумме потенциальных энергий всех материальных точек во внешнем поле, действующем на систему (если таковое имеется). Второе слагаемое, отличное от нуля и в том случае, когда внешнее поле отсутствует, есть энергия взаимодействия материальных точек. Оно равно сумме взаимных потенциальных энергий каждой пары частиц.
Весьма существенно, что взаимную потенциальную энергию нельзя представить в виде суммы потенциальных энергий, приписываемых каждой материальной точке в отдельности. Каждая пара взаимодействующих материальных точек дает вклад в полную энергию. Следовательно, индивидуальность материальной точки выражена тем слабее, чем сильнее взаимодействие между ними. Наличие этой взаимной энергии характерно для систем взаимодействующих материальных точек и отличает их, например, от ансамбля невзаимодействующих материальных точек, находящихся в заданном внешнем поле.
Динамика систем материальных точек – основа динамики твердых тел, поскольку последние можно представить в виде системы материальных точек, расстояния между которыми остаются неизменными из-за сил взаимодействия, чрезвычайно быстро возрастающих при отклонении этих точек от своего положения равновесия. Тот факт, что взаимное расположение материальных точек в таких твердых телах остается неизменным, позволяет определить его положение в каждый момент времени заданием всего лишь шести параметров.
Такими параметрами могут служить, например, три координаты какой-либо произвольной точки тела и три угла, определяющих его ориентацию относительно некоторой системы координат.
Если мы имеем задачу о движении нескольких твердых тел, каким-либо образом связанных между собой, то число параметров, необходимых для описания такой системы, возрастает. Однако при написании уравнений движения всегда можно исходить из уравнений для системы материальных точек, предполагая при этом, что твердые тела представляют собой некоторую совокупность таких материальных точек.
Таким образом, предвосхищая развитие атомной физики, механика твердых тел строилась исходя из предположения о дискретности материи. Здесь следует сделать одно замечание. В обычных экспериментах мы имеем дело, как правило, с крупномасштабными телами, а не с материальными точками, и, в частности, большинство методов измерения пространства и времени, необходимых для изучения различных явлений, основано на использовании свойств твердых тел. Именно эти понятия пространства и времени, взятые из повседневной жизни и наблюдений над крупномасштабными телами, в частности твердыми, служат нам для определения законов движения материальных точек. Определив таким образом эти законы, мы снова возвращаемся к изучению механических свойств твердых тел, рассматривая их как совокупность материальных точек. Хотя такой путь и непротиворечив, однако предположение, что понятия пространства и времени, возникшие из наблюдений над твердыми телами, можно без изменений использовать при изучении процессов, происходящих с элементарными частицами, – весьма смелая гипотеза. Можно было бы предположить, что применение этих понятий к элементарным актам потребует их серьезной модификации. Единственное условие, которое при этом на самом деле должно соблюдаться, заключается в требовании, чтобы свойства элементарных частиц были таковы, что, переходя к системам из очень многих частиц, мы имели бы возможность получать уже известные нам свойства материальных тел (в частности, свойства твердых тел) и обычные определения пространства и времени. Правда, это замечание, важность которого недавно подчеркнул Ж.Л. Детуш, не является, по-видимому, серьезным возражением против метода, используемого в классической аналитической механике, поскольку материальную точку там можно было бы определить не как элементарную частицу, а как частицу материи, имеющую пренебрежимо малые размеры, но содержащую все же в себе чрезвычайно большое число элементарных частиц. Иное дело в атомной физике, когда, допуская существование элементарных частиц, пытаются применять к ним классические законы механики материальной точки или какие-либо другие законы, предполагающие справедливость наших обычных понятий пространства и времени. Здесь это возражение становится серьезным.
4. Аналитическая механика и теория Якоби
Аналитическая механика, тесно связанная с именем великого Лагранжа, представляет собой совокупность методов, позволяющих быстро написать уравнения движения какой-либо системы, если известен набор параметров, знания которых достаточно для однозначного определения положения системы в каждый момент времени. Совершенно не собираясь подробно анализировать здесь методы аналитической механики, сделаем лишь несколько замечаний, касающихся двух хорошо известных систем уравнений: уравнений Лагранжа и уравнений Гамильтона. Отличие метода Лагранжа от метода Гамильтона заключается в том, что в методе Лагранжа энергия системы выражается через обобщенные скорости, т.е. через производные по времени от параметров, определяющих положение системы, тогда как в методе Гамильтона энергия выражается как функция обобщенных импульсов.
В рамках классических представлений можно очень просто перейти от обобщенных скоростей к обобщенным импульсам и обратно, поскольку импульсы там всегда определяются через скорости и, таким образом, уравнения Лагранжа и Гамильтона, как показывает их анализ, полностью эквивалентны и отличаются друг от друга лишь формой записи. Когда же мы перейдем к квантовой механике, то увидим, что уравнения Гамильтона, соответствующим образом записанные, сохраняют свое значение, чего нельзя сказать об уравнениях Лагранжа. Это легко объяснить, если заметить, что динамические понятия сохраняют в квантовой механике свое значение, тогда как кинематические понятия, вообще говоря, теряют свой смысл. Так, например, импульс, который, согласно классическим воззрениям, появляется как величина, выводимая из скорости, выступает в квантовой механике уже как вполне автономная величина, не зависящая более от понятия скорости, понятия уже не во всех случаях вполне определенного.
Очень важен и интересен, с точки зрения рассматриваемых здесь вопросов, раздел аналитической механики, посвященный теории Якоби. В самом деле, эта теория позволяет классифицировать различные виды движения материальной точки в заданных полях способом, который как бы подготавливает переход от классической механики к волновой. Мы не в состоянии вдаваться здесь в подробный анализ теории Якоби, требующий к тому же довольно сложного математического аппарата, и ограничимся лишь результатами, которые получаются в частном, но весьма важном случае статических, т.е. не зависящих от времени, силовых полей.
Вся совокупность возможных траекторий материальной точки в таком поле сил зависит от шести параметров, поскольку каждая из этих траекторий определяется начальным положением и начальной скоростью материальной точки. Однако все эти траектории можно объединить в семейства, зависящие только от трех параметров, причем траектории одного и того же семейства образуют семейство кривых, ортогональных некоторому семейству поверхностей. Если найти одно из них, то ортогональные этому семейству кривые будут возможными траекториями материальной точки. Теория Якоби позволяет найти семейства таких поверхностей с помощью решения некоторого дифференциального уравнения в частных производных первого порядка и второй степени, которое называется уравнением Якоби. Вывод этого уравнения основан на гамильтоновом выражении для энергии материальной точки в каждый момент времени как функции компонент ее импульса и координат в тот же момент времени.
Итак, мы видим, что теория Якоби позволяет разбить шестимерное множество траекторий материальной точки на семейства, каждое из которых содержит в себе трехмерное множество траекторий и соответствует некоторому семейству ортогональных им поверхностей. Каждое семейство траекторий и соответствующее ему семейство ортогональных поверхностей находятся точно в таком же отношении друг к другу, как лучи и волновые поверхности при рассмотрении волн в рамках геометрической оптики. Еще более века назад шотландский геометр Гамильтон отметил эту аналогию между механикой и геометрической оптикой, но только развитие квантовой теории позволило увидеть в ней нечто большее, чем простое сходство математического описания.
В связи с этим интересно отметить, что с точки зрения классической механики материальной точки связь частицы с волной, следующая из теории Якоби, не имеет физического смысла. Действительно, в рамках классических представлений материальная точка, имеющая в каждый момент времени вполне определенные положение и скорость, описывает в поле сил единственную, вполне определенную траекторию, вид которой определяется начальными условиями. Поэтому бесконечная совокупность траекторий, классифицированная, согласно теории Якоби, в семейства, представляет собой лишь возможные траектории, и только одна из них действительно реализуется в каждом конкретном случае. Эти семейства имеют скорее абстрактно математическое значение, поскольку они отображают совокупность возможностей, из которых осуществляется одна и только одна. Тем не менее им все же можно придать конкретный смысл, если представить себе, что имеется бесконечное число одинаковых и не взаимодействующих друг с другом, материальных точек. Тогда можно предположить, что различные материальные точки описывают различные траектории семейств, которые приобретают, таким образом, конкретное содержание. Следовательно, теорию Якоби можно рассматривать в некотором смысле как статистическую теорию, так как она одновременно рассматривает ансамбли из различных траекторий. В этом можно увидеть в зародыше вероятностное и статистическое толкование волновой механики.
Выше мы рассмотрели случай движения одной материальной точки в заданном силовом поле. При обобщении теории Якоби на случай системы взаимодействующих друг с другом материальных точек возникает одна особенность, о которой мы еще будет говорить, когда перейдем к волновой механике систем. Если система состоит из N материальных точек, то необходимо ввести в рассмотрение некоторое абстрактное пространство 3N координат N частиц, образующих систему, так называемое конфигурационное пространство. Действительно, если написать уравнение Якоби для системы, исходя из гамильтонова выражения для ее энергии, то мы получим дифференциальное уравнение в частных производных первого порядка и второй степени. Это уравнение, содержит 3N независимых переменных, являющихся координатами N материальных точек системы, и определяет некоторые семейства поверхностей в конфигурационном пространстве (а не в обычном трехмерном пространстве). Очевидно, что каждая конфигурация определяется заданием 3N координат точек, входящих в систему, и может быть геометрически представлена в виде точки в конфигурационном пространстве – с этим и связано такое название пространства. Последовательности же различных состояний системы изображается кривой в конфигурационном пространстве – траекторией, изображающей точки системы. Эти условные траектории системы зависят от 6N параметров – 6 начальных условий для каждой из N точек. Теория Якоби так же, как и в случае одной материальной точки, позволяет разделить это 6N-мерное множество траекторий на ряд семейств. Каждое из этих семейств определяется 3N-параметрами и образует семейство кривых, ортогональных семейству поверхностей, которые в свою очередь являются интегральными поверхностями уравнения Якоби. Именно этот случай 3N-мерного конфигурационного пространства находит аналогию в распространении волн. Можно предвидеть, что при трактовке вопросов динамики систем волновая механика, согласно теории Якоби, должна следовать этому пути и рассматривать распространение волн в конфигурационном пространстве. Это приводит к тому, что волны в волновой механике не только имеют вероятностный и статистический смысл, но и носят также отвлеченный и символический характер, сильно отличаясь от тех волн, с которыми имела дело классическая физика.
5. Принцип наименьшего действия
Уравнения динамики материальной точки в поле сил, обладающих потенциалом, можно получить, исходя из принципа, который в общем виде носит название принципа Гамильтона, или принципа стационарного действия. Согласно этому принципу, из всех движений материальной точки, которые она может совершить между теми же начальной и конечной точками за тот же самый промежуток времени t2…t1 в действительности осуществляется то движение, для которого интеграл по времени от t1 до t2 от разности кинетической и потенциальной энергий этой материальной точки принимает экстремальное, т.е. минимальное или максимальное значение. Пользуясь известными методами вариационного исчисления, легко показать, что из этого принципа вытекают классические уравнения движения.
Особенно простую форму принимает принцип стационарного действия в частном, но важном случае статических силовых полей. В этом случае он совпадает с принципом наименьшего действия Мопертюи, согласно которому для действительного пути материальной точки в консервативном (т.е. не зависящем явно от времени) силовом поле интеграл от импульса частицы, взятый по отрезку траектории между какими-либо двумя ее точками A и B, минимален по сравнению с такими же интегралами, взятыми по отрезкам других кривых, проведенных через точки A и B. Принцип Мопертюи может быть выведен из принципа Гамильтона. Его можно связать также с теорией Якоби.
Мы видели, что в случае статических полей траектории в этой теории можно рассматривать как кривые, ортогональные некоторому семейству поверхностей. Простые рассуждения показывают, что эти траектории могут быть получены из условия минимальности интеграла, совпадающего с действием по Мопертюи, т.е. криволинейного интеграла от количества движения вдоль траектории. Вывод этот весьма интересен, так как он указывает на связь, существующую между принципом наименьшего действия и принципом минимального времени Ферма.
Действительно, мы уже говорили о том, что траектории в теории Якоби можно рассматривать как аналог световых лучей в геометрической оптике. Анализ же доводов, приводимых в доказательство принципа наименьшего действия, показывает, что они полностью идентичны тем, которые в геометрической оптике приводятся для обоснования принципа минимального времени, или принципа Ферма. Вот его формулировка: в преломляющей среде, свойства которой не зависят от времени, световой луч, проходящий через точки A и B, выбирает себе такой путь, чтобы время, необходимое ему для прохождения от точки A до точки B, было минимальным, т.е. следует по кривой, которая обращает в минимум криволинейный интеграл от величины обратной фазовой скорости распространения света. Теперь сходство между принципом Мопертюи и принципом Ферма очевидно.
Однако между ними существует и важное различие. В принципе наименьшего действия подынтегральное выражение совпадает с импульсом частицы и, таким образом, интеграл имеет размерность действия (произведения энергии на время или импульса на путь). В принципе же Ферма подынтегральное выражение, наоборот, обратно пропорционально скорости распространения. Именно по этой причине аналогия между этими двумя принципами в течение длительного времени рассматривалась как чисто формальная, не имеющая под собой никакого глубокого физического обоснования. Более того, казалось даже, что с физической точки зрения между ними имеется существенное различие, поскольку импульс прямо пропорционален скорости и, следовательно, подынтегральное выражение в принципе Мопертюи содержит скорость в числителе, тогда как в принципе Ферма она в знаменателе. Это обстоятельство сыграло важную роль в эпоху, когда волновая теория света, вызванная к жизни гением Френеля, завершала свою победу над теорией истечения. Полагали как раз, что, исходя из различной зависимости от скорости подынтегральных выражений, входящих в интегралы Мопертюи и Ферма, можно сделать вывод, что известные эксперименты Фуко и Физо, согласно которым скорость распространения света в воде меньше скорости света в пустоте, дают неопровержимые и решающие аргументы в пользу волновой теории. Однако, опираясь на это различие и объясняя опыты Фуко и Физо как подтверждение факта существования световых волн, предполагали, что вполне законно отождествлять скорость материальной точки, фигурирующую в принципе Мопертюи, со скоростью распространения волн, входящей в интеграл Ферма, Волновая механика показала, что всякой движущейся материальной точке соответствует волна, скорость распространенная которой меняется обратно пропорционально скорости частицы. Только волновая механика действительно пролила свет на природу глубокого родства между двумя фундаментальными принципами и вскрыла его физический смысл. Она показала также, что эксперимент Физо не столь решающий, как это считалось раньше. Хотя он и доказывает, что распространение света есть распространение волн и что показатель преломления необходимо определять через скорость распространения, но он совсем не исключает возможности корпускулярной структуры света при условии, конечно, соответствующей связи между волнами и частицами света. Однако это уже относится к кругу вопросов, которые мы будем обсуждать ниже.
Сравнивая движение материальной точки в поле сил, не зависящем от времени, с распространением волн в преломляющих средах, состояние которых также не зависит от времени, мы показали, что между принципами Мопертюи и Ферма существует определенная аналогия. Сравнивая движение материальной точки в переменных во времени силовых полях с распространением волн в преломляющих средах с параметрами, меняющимися во времени, замечаем, что аналогия между принципом наименьшего действия в его общем виде, предложенном Гамильтоном, и принципом Ферма, обобщенном на случай преломляющих сред, состояние которых зависит от времени, сохраняется и в этом, более общем случае. Не будем останавливаться на этом вопросе. Для нас достаточно будет лишь, что эта аналогия между двумя основными принципами механики и геометрической оптики имеет место не только в рассмотренном нами выше, хотя и очень важном, но все же частном случае постоянных полей, но и в более общем случае переменных полей.
Принцип стационарного действия справедлив и для систем материальных точек. Для его формулировки нам удобно ввести конфигурационное пространство, соответствующее рассматриваемой системе. В качестве примера ограничимся случаем, когда потенциальная энергия системы не зависит явно от времени. Таков, например, случай изолированной системы, на которую не действуют внешние силы, поскольку потенциальная энергия ее при этом сводится только к энергии взаимодействия и не зависит явно от времени. В этом случае, вводя 3N-мерное конфигурационное пространство и вектор в этом пространстве, 3N компонент которого совпадает с компонентами векторов количеств движения N материальных точек системы, принцип наименьшего действия в форме Мопертюи можно сформулировать следующим образом. Траектория изображающей точки системы, проходящая через две заданные точки A и B в конфигурационном пространстве, делает минимальным криволинейный интеграл от введенного выше 3N-мерного вектора, взятый по отрезку траектории между точками A и B, по сравнению с такими же интегралами, взятыми по отрезкам других кривых в конфигурационном пространстве, проходящих через те же точки A и B. Этот принцип легко получить также из теории Якоби. Аналогия же его с принципом Ферма следует из возможности представления траекторий изображающей точки в конфигурационном пространстве в виде лучей волны, распространяющейся в этом пространстве. Итак, мы снова видим, что для систем материальных точек переход от классической механики к волновой можно осуществить лишь в рамках абстрактного конфигурационного пространства.
Глава II. Классическая физика
1. Дальнейшее развитие механики
В предыдущей главе мы не собирались давать сколько-нибудь полного обзора классической механики. Тем более мы не собираемся излагать в этой главе всю классическую физику. Мы отметим здесь лишь ее основные разделы и сделаем несколько замечаний по поводу каждого из них.
К первому разделу классической физики, развившейся на базе механики, можно отнести гидродинамику, акустику, теорию упругости. Эти области возникли раньше других, поскольку круг явлений, которые они изучают, был наиболее тесно связан с практической жизнью. С теоретической точки зрения они являются непосредственным продолжением механики, из которой они заимствовали свои основные принципы и методы, дополнив их гипотезами, подсказанными опытом. Следует, правда, сказать, что эти теории не предполагают, что твердые тела, жидкости или газы имеют дискретную структуру. Напротив, они исходят из представления о непрерывной структуре материи. При этом считается, что каждый элемент объема этой непрерывной среды взаимодействует со всеми соседними элементами согласно законам механики. Однако ничто не мешает совместить используемые при этом методы с предположением об атомной структуре вещества, если рассматривать элементы объема, хотя и достаточно малые, но все же содержащие в себе чрезвычайно большое число молекул.
Эти разделы классической физики, непосредственно продолжающие механику, хотя и основаны на принципах, вытекающих из законов классической механики, в действительности очень сложны и потребовали для своего развития немалых усилий экспериментаторов и теоретиков.
Физические явления в этих областях далеко не просты и с трудом поддаются изучению. Расчеты здесь часто требуют привлечения сложного математического аппарата. Поэтому хотя эти науки уже давно существуют, они продолжают непрерывно развиваться. Их применяют при изучении широкого круга практических вопросов, и знание этих разделов физики совершенно необходимо инженерам. Применительно к практическим требованиям, когда непосредственные приложения важнее, чем общая теория, пользуются приближенными формами этой теории, такими, как гидравлика и сопротивление материалов.
Здесь мы закончим знакомство с этими дисциплинами. Дальнейшее развитие физики, возможно, приведет к их различным модификациям, однако до сих пор кванты играли тут незначительную роль, и поэтому рассмотрение этих вопросов выходит за рамки книги.
2. Оптика
Если гидродинамика или теория упругости не представляют непосредственного интереса для изучения квантовой теории, то с оптикой дело обстоит совершенно иначе, поскольку ее прогресс тесным образом связан с развитием новейшей физики. Подобно явлениям, происходящим с твердыми и жидкими телами, световые явления также с ранних пор привлекали к себе внимание людей. Но только в XVII в. оптика начала формироваться в настоящую науку. В этот период Декарт сформулировал законы преломления и отражения света и Ферма предложил свой принцип, в котором содержится вся геометрическая оптика. В течение всего этого периода развития оптики понятие световых лучей играло в ней главную роль: изучалось прямолинейное распространение световых лучей в пустоте или в однородных средах, отражение их от зеркальных поверхностей и преломление при переходе из одной среды в другую и, наконец, искривление световых лучей при распространении света в неоднородных преломляющих средах. Тогда же Христиан Гюйгенс предложил другую интерпретацию тех же явлений, основанную на понятиях волны и волновой поверхности. Он показал, кроме того, что его метод также объясняет недавно открытое явление двойного лучепреломления в исландском шпате.
С чисто геометрической точки зрения метод, основанный на понятии световых лучей, и метод, использующий понятие волновых поверхностей, полностью эквивалентны. В рамках геометрической оптики без труда можно перейти от одного метода рассмотрения к другому и убедиться в этой эквивалентности. Лучи представляют собой кривые, ортогональные семейству волновых поверхностей, и принцип Ферма является прямым следствием этого факта.
Однако эти два формально эквивалентных метода приводят к существенно различным взглядам на физическую природу света в зависимости от того, какое из этих понятий – световой луч или волновую поверхность – принять за первичное.
Предположение о том, что понятие светового луча основное, а волновой поверхности – вспомогательное, приводит к выводу о корпускулярной природе света. Согласно этой гипотезе, свет представляет собой совокупность мельчайших частиц, движущихся вдоль определенной траектории – светового луча. Прямолинейность распространения света в однородных средах и явление отражения его от поверхности зеркал находят себе в этой теории наглядное и естественное объяснение. Исходя из этого представления, можно объяснить также, хотя и несколько сложнее, явление преломления светового луча на границе двух сред. С этой точки зрения, именно световые лучи, т.е. траектории световых частиц, имеют физический смысл. Волновые же поверхности – лишь чисто вспомогательное геометрическое понятие, позволяющее объединить лучи в некоторые семейства, подобно тому как в механике интегральные поверхности уравнения Якоби позволяют разбить совокупность различных траекторий частиц на семейства кривых, ортогональных интегральным поверхностям. Можно, однако, пойти по другому пути и считать, что первичным основным понятием является понятие волны и волновой поверхности. Этот путь приводит нас к представлению о волновой природе света. Согласно этой точке зрения, свет представляет собой волны, распространяющиеся в пространстве, лучи же оказываются чисто абстрактным понятием и определяются просто как кривые, ортогональные волновым поверхностям. Тонкий анализ Гюйгенса показал, что волновая теория объясняет явления отражения и преломления. Однако объяснение прямолинейности распространения света в однородных средах, столь очевидное в корпускулярной теории, где оно непосредственно следует из закона инерции, в волновой теории на первый взгляд отнюдь не так просто.
Эти две противоположные точки зрения – корпускулярная концепция, или теория истечения, и волновая концепция – господствовали в XVII и XVIII вв. Первая, поддерживаемая вначале Декартом, нашла себе затем чрезвычайно авторитетного защитника в лице Ньютона. Гениальный создатель небесной механики был остановлен трудностями, которые встали перед волновой теорией (особенно при попытке объяснения прямолинейности распространения света), и решительно высказался в пользу корпускулярной гипотезы. Вслед за Ньютоном в XVIII в. большинство ученых стали склоняться к корпускулярной теории, и волновая гипотеза, столь блестяще развитая в конце предыдущего века Гюйгенсом, сохранила лишь немного приверженцев (Эйлер). Казалось, что победу одержали сторонники теории, основанной на представлении о дискретной природе света.
Однако в начале XIX в. положение полностью изменилось. Причиной этого было открытие явлений интерференции и дифракции. В некоторых частных случаях эти явления были известии еще во времена Ньютона: сначала они были обнаружены Гуком и Гримальди, а затем и самим Ньютоном. В частности, явление, впервые им наблюдавшееся и носящее ныне название колец Ньютона, есть не что иное, как явление интерференции. Со свойственной ему проницательностью Ньютон отлично сознавал, что и в рамках поддерживаемой им корпускулярной теории объяснение этих явлений требует введения некоторых элементов периодичности. Поэтому он вынужден был выдвинуть гипотезу, согласно которой частицы света попеременно испытывают приступы легкого прохождения и легкого отражения. Это предположение, которое могло показаться на первый взгляд весьма странным и искусственным, явилось, тем не менее, первой попыткой объединить представления о корпускулярной и волновой природе света, попыткой, в какой-то степени предвосхитившей пути развития современной науки. Но в XVIII в. всецело господствовали представления о корпускулярной природе света и на явления интерференции не обратили должного внимания. И лишь в конце XVIII и в начале следующего века английский ученый Томас Юнг предпринял серьезное исследование интерференции и дифракции, а гениальный француз Огюстен Френель (1788…1827 гг.) дал им полное и окончательное теоретическое объяснение. Опираясь на выдвинутую Гюйгенсом волновую гипотезу, Френель полностью объяснил все известные к тому времени опыты по дифракции и интерференции и показал, и это было весьма существенно, что представления о волновой природе света не противоречат факту прямолинейности распространения света в однородных средах. Критикуемый противниками волновой теории, которые указывали ему на то, что она представляет, на первый взгляд, парадоксальные результаты, Френель провел соответствующие эксперименты, и его предсказания полностью оправдались. С этого момента успех волновой теории был обеспечен, а корпускулярная теория, хотя и поддерживаемая еще некоторыми учеными (например, Био, Лапласом), стала быстро терять своих приверженцев.
Но Френель не ограничился этим. Для объяснения явлений поляризации он выдвинул идею о поперечности световых колебаний, отвечающую на вопрос, почему свойства поляризованного света зависят от угла в плоскости, перпендикулярной направлению распространения. Изучая свойства поперечных колебаний, Френель развил теорию отражения света от поверхности преломляющих тел, вывел законы двойного лучепреломления и разработал теорию распространения света в анизотропных средах. Эти работы – настоящие шедевры теоретической физики. Они вошли без каких-либо существенных изменений во все современные учебники физической оптики. Истощенный постоянным огромным умственным напряжением, Огюстен Френель был сражен болезнью и умер в 1827 г. в возрасте 39 лет, но совершенный им поистине великий труд навсегда останется одной из самых прекрасных глав в истории развития физики.
После смерти Френеля волновая природа света становилась все более общепризнанной, и эксперименты Фуко и Физо принесли неоспоримые доказательства этой гипотезы. И только много позже, на рубеже нашего века, физики вновь были вынуждены обратиться к корпускулярным представлениям о природе света, не отвергая, однако, ни одного момента из волновой теории Френеля. Возникла необходимость в своеобразном синтезе или, скорее, последовательном сочетании волновых и корпускулярных представлений. И если Френель дал верную общую волновую интерпретацию известных к его времени или открытых им самим оптических явлений, то физики, принадлежащие к противной школе, по существу тоже не ошибались, предполагая существование дискретного аспекта в природе света. Ньютон и Био не зря подозревали какую-то глубокую аналогию между свойствами световых лучей и траекториями материальных точек в классической механике. И не случайно геометрическая оптика обнаруживает аналогии с динамикой, например принцип Ферма подобен принципу наименьшего действия. Замечательные теории аналитической механики, и в особенности теория Якоби, поясняют истинный смысл законов геометрической оптики, но и волновая оптика в свою очередь указывает путь обобщения классической механики, на котором мы обнаруживаем, что она, как и геометрическая оптика, оказывается лишь приближением, справедливым во многих случаях, но имеющим определенным образом ограниченную область применения.
В дальнейшем мы еще вернемся к этим вопросам. Однако чтобы подготовить почву, может быть полезно уже сейчас указать, каким образом волновая оптика включает в себя геометрическую и как, например, с точки зрения Френеля, можно было бы обосновать принцип Ферма. Распространение волн в волновой теории описывается уравнением в частных производных второго порядка, хорошо известным под названием волнового уравнения. Это уравнение содержит некоторый параметр, равный скорости распространения волны, который в наиболее общем случае неоднородных сред с переменными во времени параметрами будет некоторой определенной функцией пространственных координат и времени.
В важном частном случае неизменных во времени сред скорость распространения не зависит от времени и определяет постоянный в каждой точке пространства показатель преломления. Волновое уравнение при этом допускает решения, гармонически меняющиеся во времени и представляющие собой свет различной частоты, т.е. разных цветов, распространяющийся в рассматриваемой среде. Можно видеть, что если показатель преломления мало меняется на расстоянии порядка длины волны, то изменение фазы волны описывается приближенно некоторым уравнением в частных производных первого порядка и второй степени, которое называется уравнением геометрической оптики и в точности совпадает по форме с уравнением Якоби. Это уравнение для каждой распространяющейся монохроматической волны позволяет найти семейство так называемых волновых поверхностей, на которых фаза волны имеет постоянное назначение. Таким образом, можно найти кривые, ортогональные волновым поверхностям, и определить их как соответствующие световые лучи, распространяющиеся в среде.
Отсюда уже можно вывести принцип Ферма, теорему Малюса, построения Гюйгенса и все другие законы геометрической оптики. Итак, с точки зрения волновой теории геометрическая оптика справедлива во всех случаях, когда оказывается возможным приближенно заменить строгое волновое уравнение уравнением геометрической оптики. Условием этого, как мы видели, оказывается достаточно медленное изменение показателя преломления в пространстве. Однако этого недостаточно. Необходимо, чтобы на пути света не было никаких препятствий, мешающих его свободному распространению и приводящих к явлениям дифракции или интерференции.
Таким образом, с точки зрения волновой теории геометрическая оптика оказывается некоторым приближением, имеющим определенный смысл, но тем не менее всегда ограниченным.
Обратимся теперь к физическому смыслу волновой теории. Световые волны, свободно распространяющиеся в пустоте, вовсе не связаны с перемещением вещества. Что же тогда является носителем этих волн, какова среда, колебания которой представляют световые волны? Такие вопросы встали перед создателями волновой теории. Для ответа им пришлось предположить существование некоей неуловимой всепроникающей субстанции: светового эфира, распространившегося по всей Вселенной, заполнившего пустоту и пропитавшего материальные тела. Свойства этой загадочной среды и характер взаимодействия ее с материальными телами должны были объяснить особенности распространения света в пустоте и в преломляющих средах. Последователи Френеля поставили своей целью разрешить проблему эфира. Они старались уточнить его механическую природу, представить себе его структуру. Результаты этих исследований оказались весьма странными. С одной стороны, эфир, рассматриваемый как упругая среда, в которой могут распространяться только поперечные волны, должен быть во много раз более жестким, чем, скажем, сталь, а с другой стороны, эта жесткая среда, как показывает опыт, не должна оказывать никакого сопротивления движущимся в ней телам и совершенно не влияет на движение планет. Но ни одна теория, предполагающая существование среды с такими парадоксальными свойствами, какой бы совершенной она ни была, не может иметь права на существование, и все больше и больше физиков стало сомневаться в действительном существовании этой среды. Ниже мы увидим, какие изменения претерпела теория эфира сначала после появления электромагнитной теории, а затем после установления принципа относительности.
3. Электричество и электромагнитная теория
Механика и связанные с ней области, а также акустика и оптика возникли очень давно, поскольку они изучают явления, с которыми человек непрерывно сталкивается в своей повседневной жизни. Наука же об электричестве, напротив, появилась сравнительно недавно. Конечно, некоторые факты, как например, электризация тел трением или свойства природных магнитов, были известны уже и раньше. Не могли не обратить на себя внимания и такие величественные и странные явления природы, как грозы.
Однако вряд ли эти факты в достаточной степени исследовались и сопоставлялись до конца XVIII в. и вряд ли кто-либо четко представлял себе в то время, что они станут объектом изучения новой науки, составляющей одну из важнейших областей современной физики. Это стало ясно лишь в конце XVIII и начале XIX в. Интересно отметить, что в то же самое время были открыты явления интерференции и построена волновая теория. Этот замечательный период в истории развития науки, когда возникла волновая оптика и современная теория электричества, был для макроскопической физики тем же, чем были последние 50 лет для атомной физики.
Мы не будем здесь ни следовать в деталях истории развития теории электричества, ни отмечать специально вклады таких ученых, как Вольта, Кулон, Эрстед, Био, Лаплас, Гаусс, Ампер, Фарадей и многих других, живших и работавших в период становления этой новой области науки. Хотя это и было бы очень интересно, но увело бы нас слишком далеко в сторону от задач, которые мы себе поставили. Поэтому ограничимся лишь замечанием, что во второй половине XIX в. законы электрических явлений были уже настолько хорошо известны, что оказалось возможным попытаться перейти к объединению большого числа различных фактов и утверждений и к поискам единой стройной теории. Эту огромную работу проделал Джеймс Клерк Максвелл. Руководствуясь открытиями своих предшественников и своим огромным дарованием, он сумел построить полную теорию электромагнитных явлений, которая носит теперь его имя. Все разнообразие этих явлений, всю совокупность законов, которым они подчиняются, ему удалось свести в одну систему уравнений, которые называют уравнениями Максвелла. Уравнения Максвелла состоят из двух векторных уравнений, эквивалентных шести уравнениям для компонент, и двух скалярных уравнений. Эти уравнения связывают компоненты векторов электрического и магнитного полей и векторов электрической и магнитной индукции между собой и с плотностями электрического заряда и тока. Одно из векторных уравнений выражает закон индукции, открытый Фарадеем. Одно из скалярных уравнений отражает невозможность выделения магнитных зарядов или полюсов одного знака, другое формулирует электростатическую теорему Гаусса. Эти уравнения стали обобщением уже известных законов. Однако второе векторное уравнение содержит существенно новый элемент, внесенный в теорию собственно Максвеллом.
Второе векторное уравнение должно было отразить связь, существующую между магнитным полем и электрическим током, согласно закону Ампера. Согласно этому закону, ротор от вектора напряженности магнитного поля должен быть равен (с точностью до постоянной, зависящей от выбора системы единиц измерений) плотности электрического тока. Но Максвелл заметил, что если определить входящую в это уравнение плотность тока как плотность только тока, связанного с переносом заряда, то это приводит к целому ряду трудностей. Чтобы избежать их, он выдвинул блестящую идею – обобщить выражение для плотности тока, добавив к так называемому току проводимости, обусловленному переносом заряда, слагаемое, пропорциональное скорости изменения во времени вектора электрической индукции. Это слагаемое представляет собой новый вид тока, ток смещения, который в отличие от тока проводимости вовсе не обязательно связан с перемещением электрических зарядов. Так, например, в поляризуемой среде часть тока смещения связана с перемещением электрических зарядов, другая же его часть, отличная от нуля даже в пустоте, если электрическое поле переменно во времени, совершенно не связана с движением зарядов. Благодаря введению токов смещения трудности, о которых мы упоминали, исчезли. Сложный вопрос о замкнутых и незамкнутых токах, занимавший теоретиков того времени, разрешился сам собой, поскольку, если принять во внимание токи смещения, то все эти токи окажутся замкнутыми.
Но самая гениальная идея Максвелла, выдвинутая после написания общих уравнений электромагнитных явлений, состояла в том, что эти уравнения дают возможность рассматривать свет как электромагнитное возмущение. Это в свою очередь позволило объединить две казавшиеся столь различными области физики и рассматривать всю оптику как частный случай электродинамики – один из наиболее замечательных примеров синтеза, который дает нам история развития физики.
Что же помогло Максвеллу выдвинуть эту радикальную идею? Уравнения электродинамики содержат некоторую константу, равную отношению электромагнитной единицы заряда или поля к соответствующей электростатической единице. С помощью несложных преобразований основных уравнений легко показать, что распространение электромагнитного поля в пустоте описывается волновым уравнением, содержащим указанную постоянную в качестве скорости распространения.
Таким образом, если предположим, вслед за Максвеллом, что световые волны представляют собой электромагнитные возмущения, то отсюда следует: скорость распространения света в пустоте, обозначаемая обычно буквой c, должна быть равна по величине отношению, например, единиц заряда в электромагнитной и электростатической системах. И действительно, результаты соответствующих измерений, уже известные к тому времени, говорят о соблюдении этого равенства с точностью до 3…4%. Все же последующие измерения указывают на то, что это равенство, по видимому, выполняется с любой точностью. Этот факт явился блестящим подтверждением выдвинутой Максвеллом гипотезы об электромагнитной природе света.
Согласно теории Максвелла, плоская монохроматическая световая волна, распространяющаяся в пустоте, определяется двумя векторами; вектором электрического и вектором магнитного полей, колеблющимися с частотой волны. Они равны между собой по величине, перпендикулярны друг другу и направлению распространения и колеблются в одной фазе. Все результаты, следующие из теории Френеля, могут быть получены, если заменить колебания эфира электромагнитными колебаниями и повторить прежние рассуждения, но уже на другом языке – языке электромагнитной теории. Эта теория превосходно позволяет обойтись без эфира: для этого достаточно предположить, что свойства пустого пространства определяются в каждой точке заданием двух векторов электрического и магнитного полей. При этом теория принимает довольно абстрактный характер, что, впрочем, обычно для современных физических теорией. Она оказывается в основном математической теорией.
Этот отвлеченный характер электромагнитной теории становится особенно заметным в той форме, которую придал ей несколько позже Герц. И тем не менее многие из физиков того времени все еще испытывали потребность ввести некоторую среду – носитель электромагнитного поля – и рассматривать поле как некоторое состояние возбуждения этой среды. Многие, и в особенности лорд Кельвин, потратили много усилий, пытаясь получить механическое объяснение электромагнитных явлений, сводя их к натяжению или упругим деформациям эфира. Однако эти попытки никогда не приводили к удовлетворительным результатам, и со временем подобные теории эфира себя полностью дискредитировали. Эфир стал рассматриваться теперь как некоторая гипотетическая среда, позволяющая определять лишь системы координат, в которых справедлива обычная форма уравнений Максвелла. Но даже после того, как за эфиром была оставлена столь скромная роль, это понятие все еще приводило к ряду трудностей. В частности, электродинамика движущихся сред, базирующаяся на предположении, что эфир может служить для определения движения по отношению к абсолютному пространству, оказывалась весьма сложной и привела в конце концов к противоречию с экспериментом. И только теория относительности внесла полную ясность в этот вопрос, совершенно устранив из физических теорий понятие эфира.
Одним из наиболее блестящих подтверждений теории Максвелла было открытие Герцем электромагнитных волн, названных в его честь волнами Герца. Электромагнитная теория предсказывала, что при достаточно быстром изменении электрического тока в цепи возможно излучение в окружающее пространство электромагнитной волны, которая, согласно идеям Максвелла, должна иметь структуру, совершенно аналогичную структуре световой волны. Но волны, которые можно было бы получать с помощью соответствующего электрического контура, обладали всегда частотой, гораздо меньшей, и соответственно длиной волны, гораздо большей, чем частота и длина световых волн. Отсюда, естественно, вытекало и различие между свойствами этих волн: волны Герца не воздействуют на наши органы чувств и, что связано с большой длины волны, легко огибают непрозрачные препятствия, встречающиеся на их пути. Однако, несмотря на эти различия, имелась и большая общность между световыми волнами и волнами Герца. В частности, с последними можно было повторить ставшие классическими эксперименты по отражению, преломлению, интерференции или дифракции волн. Необходимые для этого экспериментальные установки должны в основном быть такими же, хотя, разумеется, и гораздо больших масштабов в соответствии с изменившейся длиной волны.
Это памятное открытие волн Герца и их свойств не оставило больше никаких сомнений в правильности основных идей Максвелла, касающихся электромагнитной природы света. И нет, пожалуй, нужды напоминать, что именно открытие волн Герца позволило осуществить беспроволочный телеграф, а позднее способствовало развитию других средств связи на расстоянии.
Электромагнитная теория позволяет также рассматривать распространение света в материальных средах. Она привела к знаменитому соотношению, связывающему диэлектрическую постоянную однородной среды с ее показателем преломления, и позволила изучить поглощение света в проводящих средах. Но только после того, как она была дополнена гипотезой о дискретной электрической структуре материи (гипотеза электронов), электромагнитная теория дала возможность по настоящему глубоко исследовать характер распространения света в материальных средах.
4. Термодинамика
Нельзя закончить этот краткий очерк истории развития классической физики, не сказав несколько слов о науке, которая целиком была создана учеными XIX в., о термодинамике.
В XVIII в. теплота представлялась в виде некоторой жидкости, общее количество которой остается в течение различных физических процессов неизменным. Для объяснения целого ряда явлений, и в особенности явления распространения тепла в материальных телах, эта гипотеза оказывалась вполне удовлетворительной. Изящная и классическая теория распространения тепла в пространстве, созданная Фурье, исходит из соотношения, которое выражает «закон сохранения теплоты». Но многочисленные явления, в которых теплота возникает в результате трения, с большим трудом объяснялись в рамках этой гипотезы, и мало-помалу физики от нее отказались и стали рассматривать теплоту не как некую вечную субстанцию, а просто как одну из форм энергии. Действительно, во всех происходящих вокруг нас чисто механических явлениях энергия сохраняется всегда, за исключением тех случаев, когда в результате трения происходит выделение тепла. Если рассматривать теплоту как одну из форм энергии, то можно выдвинуть некий общий принцип сохранения энергии. Мы не будем рассказывать здесь о том, как развивался этот принцип и как он был подтвержден измерениями механического эквивалента теплоты. Но, как известно, одного принципа сохранения энергии еще недостаточно для построения термодинамики. К нему необходимо добавить еще принцип Карно, или принцип возрастания энтропии. Впервые этот принцип был выдвинут в 1824 г. Сади Карно в заметках о тепловых машинах, где он указал на невозможность полного превращения тепла в работу. Эти соображения Карно легли в основу высказанного несколькими годами позже принципа, который остается справедливым и по настоящий день. Чтобы придать ему математическую форму, Клаузиус ввел понятие энтропии и показал, что энтропия изолированной системы может только возрастать.
На основе этих двух фундаментальных принципов была построена термодинамика – наука, позволившая объяснить и предсказать большое число явлений и играющая существенную роль в настоящее время, особенно в теории газов. Это абстрактная наука, оперирующая основном понятиями энергии, заключенной в телах, количествами совершаемой ими работы и тепла, которым они обмениваются. Она не пытается вникать в детальное описание элементарных процессов, а интересуется лишь общими характеристиками систем. Термодинамика оставляет чрезвычайно большую свободу для различных описаний элементарных процессов и устанавливает лишь общие закономерности, которым должны удовлетворять эти описания. Таким образом, не только классическая атомная физика, не учитывающая существования квантов, но и квантовая физика, базирующаяся на принципиально отличных концепциях, строятся в соответствии с законами термодинамики. С точки зрения конструктивного развития современных теорий термодинамика может в каком-то смысле играть направляющую роль, ограничивая число приемлемых гипотез, но не указывая, конечно, тот или иной определенный путь развития. Точнее, поскольку термодинамика рассматривает лишь общие свойства систем, не вдаваясь в детали отдельных процессов, она не рискует впасть в ошибки, что часто угрожает более «смелым» теориям, претендующим на детальное описание процесса. И сорок лет назад, по мнению многих физиков, считалось предпочтительным использовать термодинамические методы, не вводя более детальных и более смелых концепций. Этот осторожный метод был назван энергетическим. Но если осторожность – мать безопасности, то судьба улыбается лишь отважным. И тогда как приверженцы энергетического метода топтались на одном месте, хотя и на твердой почве, сторонники более детального описания элементарных явлений, развивая атомистические и корпускулярные концепции, открывали новые неизведанные области.
Эти концепции получили столь многочисленные экспериментальные подтверждения и привели к открытию такого большого числа новых соотношений, о существовании которых «энергетика» не могла даже подозревать, что в настоящее время старая «энергетическая» тактика уже давно оставлена.
Чтобы проследить путь развития классической физики, необходимо рассмотреть новый мир атомов и частиц.
Глава III. Атомы и частицы
1. Атомная структура материи
Хорошо известно, что древние мыслители неоднократно высказывали предположение о дискретной природе материи. Они пришли к этому, исходя из философской идеи о том, что невозможно осознать бесконечную делимость материи и при рассмотрении все более мелких количеств необходимо где-то остановиться. Для них атом был последней неделимой частью материи, после которой уже нечего было искать. Современная физика также исходит из представления об атомной структуре материи, но с ее точки зрения атом представляет собой нечто совершенно отличное от того, что понимали под этим словом древние мыслители. По современным представлениям, атом, будучи составной частью вещества, имеет весьма сложную структуру. Действительными же атомами в смысле древних являются, с точки зрения новейшей физики, так называемые элементарные частицы, например электроны, которые рассматриваются сегодня (может быть, временно) как последние неделимые составляющие атомов и, следовательно, материи.
Понятие атома было введено в современную науку, как известно, химиками. Изучение химических свойств различных тел привело ученых-химиков к мысли, что все вещества подразделяются на два класса: к одному из них относятся сложные или составные вещества, которые путем соответствующих операций могут быть разложены на более простые вещества, к другому – более простые вещества, которые уже невозможно разложить на составные части. Эти простые вещества часто называют также элементами. Изучение количественных законов образования сложных веществ из простых постепенно привело химиков последнего столетия к созданию теории, согласно которой все простейшие вещества, или элементы, состоят из мельчайших совершенно одинаковых частиц, называемых атомами соответствующего элемента, а сложные вещества образованы из молекул, представляющих собой соединение атомов различных элементов. В соответствии с этой теорией разложение сложных веществ на составляющие их элементы состоит в разрушении связей, объединяющих различные атомы в молекулы, и разделении веществ на составные части. Все элементы, включая и недавно открытые, теперь хорошо известны. Число их составляет в настоящее время 89. Однако, как мы скоро увидим, список этих элементов может быть дополнен, по крайней мере, до 92 (в настоящее время известно 104 элемента. – Прим. ред.). Таким образом, все материальные тела состоят из атомов, по крайней мере, 92 различных видов.
Атомная гипотеза оказалась очень плодотворной не только для объяснения основных химических явлений, но и для построения новых физических теорий. В самом деле, если все вещества действительно состоят из атомов, то многие их физические свойства, можно предсказать, исходя из представления об их атомной структуре. Например, хорошо известные свойства газа следовало бы объяснять, представляя газ как совокупность чрезвычайно большого числа атомов или молекул, находящихся в состоянии быстрого непрерывного движения. Давление газа на стенки содержащего его сосуда должно быть вызвано ударами атомов или молекул о стенки, температура его должна быть связана со средней скоростью движения частиц, которая возрастает с увеличением температуры газа. Основанная на подобных представлениях теория, получившая название кинетической теории газов, позволила вывести теоретически основные законы, которым подчиняются газы и которые уже были получены ранее экспериментальным путем. Более того, если предположение об атомном строении веществ соответствует действительности, то из этого следует, что для объяснения свойств твердых тел и жидкостей необходимо допустить, что в этих физических состояниях атомы или молекулы, из которых состоит вещество, должны находиться на гораздо меньших расстояниях друг от друга и быть гораздо сильнее связанными между собой, чем в газообразном состоянии. Большая величина сил взаимодействия между чрезвычайно близко расположенными атомами или молекулами, которую необходимо допустить, должна объяснить упругость, несжимаемость и некоторые другие свойства, характеризующие твердые и жидкие тела. Возникшие и разработанные на этой основе теории встретили на своем пути целый ряд трудностей (большая часть которых была устранена с возникновением квантовой теории). Однако полученные в этой теории результаты были достаточно удовлетворительными, чтобы считать, что она развивается по правильному пути.
Несмотря на то, что гипотеза об атомном строении вещества для некоторых физических теорий оказалась весьма плодотворной, для окончательного ее подтверждения было необходимо произвести более или менее прямой эксперимент, подтверждающий атомную структуру материи. И эта большая экспериментальная работа, занявшая около тридцати лет, была проделана физиками, из которых в первую очередь надо отметить Перрена и его опыты, ставшие классическими.
Невозможно непосредственно заметить движение атомов или молекул. Но то, что оно существует, установить возможно. Выражается это в перемещении под действием непрерывных соударений некоторой частицы макроскопических размеров, взвешенной в газе или жидкости. Изучение перемещения такой частицы сравнительно больших размеров, известного под названием броуновского движения, позволило Перрену оценить число молекул, содержащихся в одной грамм-молекуле какого-либо газа, находящегося при нормальной температуре и давлении. По классическому закону Авогадро известно, что это число одинаково для всех газов. Оно носит название числа Авогадро. Эксперименты Перрена показали, что его значение заключено в пределах 6·1023…7·1023. Все последующие опыты блестяще подтвердили эту оценку. Большое число других, более косвенных опытов также позволяет определить значение числа Авогадро. Эти методы основаны на изучении самых различных явлений: спектрального распределения энергии излучения при термодинамическом равновесии, диффузии света в газах, излучения радиоактивных веществ. Полученные разными путями значения числа Авогадро, а также вычисляемые с его помощью значения некоторых атомных констант (например, массы атома водорода) находятся в столь блестящем соответствии между собой, что не позволяют сомневаться в справедливости гипотезы об атомном строении материи.
Итак, существование атомов, принимаемое химиками, было экспериментально доказано физиками. Остается посмотреть, как этот факт был использован теоретиками.
2. Кинетическая теория газов. Статистическая механика
Если все материальные тела состоят из атомов, то естественно допустить, что в телах, находящихся в газообразном состоянии, частицы в среднем находятся достаточно далеко друг от друга и большую часть времени двигаются вне области влияния сил взаимодействия. Иногда атом на короткий промежуток времени подходит к какому-либо другому атому или к стенке сосуда, в котором заключен газ, настолько близко, что силы взаимодействия возрастают и начинают оказывать существенное влияние на его движение. При этом говорят, что происходит соударение атома с другим атомом либо со стенкой. Между двумя последовательными соударениями атом движется свободно, не испытывая какого-либо воздействия со стороны других атомов или стенок сосуда. Очевидно, что для всех газов, находящихся в обычных условиях, полное время всех соударений какого-либо одного атома с остальными (и стенками), происходящих, скажем, за одну секунду, будет бесконечно мало по сравнению со временем его свободного движения за то же время, хотя само число столкновений за одну секунду может быть и огромно. Если предположить далее, что движение атомов происходит по законам классической механики, то приходим к выводу, что в промежутке между двумя последовательными соударениями частицы движутся практически прямолинейно и равномерно, а соударения (единственная причина неравномерности движения) изменяют характер движения в соответствии с законами сохранения импульса и энергии. Если атомы можно представить в виде жестких абсолютно упругих шариков, чтобы иметь возможность учесть влияние соударений, то поведение газа может быть, в принципе полностью определено решением системы уравнений классической механики. Однако если представление о газе как о совокупности жестких абсолютно упругих шариков и является вполне разумным и позволяет в принципе точно решить задачу о поведении газа в тех или иных случаях, то практически подобная задача настолько сложна, что лежит за пределами всяких реальных возможностей. Это станет совершенно очевидно, если заметить, что в обычных условиях один кубический сантиметр газа содержит около 1019 атомов, каждый из которых испытывает приблизительно 1010 соударений в секунду. Таким образом, задача может показаться неразрешимой. А, тем не менее законы, которым подчиняются газы, чрезвычайно просты, во всяком случае если ограничиться первым приближением (законы идеальных газов). И казалось совершенно парадоксальным, что столь простые законы можно вывести, исходя из такой сложной модели газа, как атомарно-кинетическая модель. Но, в конечном счете именно чрезвычайная сложность этой модели и позволила построить стройную теорию, из которой следуют эти простые законы.
Громадное число динамических процессов, разыгрывающихся между молекулами газов, позволило подойти к изучению явлений с другой стороны и, пользуясь теорией вероятности, исследовать поведение этих процессов в целом, зачастую весьма просто и с большой точностью получить соотношения для усредненных величин. Отклонения от этих закономерностей очень маловероятны из-за чрезвычайно большого числа элементарных процессов, дающих вклад в средний результат.
Кинетическая теория газов развилась к началу второй половины XIX в. благодаря открытиям Максвелла и Клаузиуса. Эта теория приобрела строгую форму в трудах Больцмана. Не будем излагать здесь даже основных положений и выводов кинетической теории – они сейчас хорошо известны всякому, кто хоть немного изучал теоретическую физику. Укажем только, что давление, оказываемое газом на стенки содержащего его сосуда, обусловлено, согласно этой теории, огромным числом соударений молекул газа со стенками сосуда. Температура газа определяется средней кинетической энергией движения молекул, уравнение состояния идеального газа выводится элементарно. Наконец, кинетическая теория позволяет в первом приближении сделать некоторые заключения о характере теплоемкости газов, диффузии, величине коэффициентов вязкости, теплопроводности и т.д.
Конечно, нельзя утверждать, что кинетическая теория разрешила все вопросы, стоящие перед теорией в этой области. Осталось много нерешенных вопросов, и теперь еще появляются работы, которые прокладывают новые пути в этом направлении. Однако в целом можно сказать, что представления кинетической теории, базирующиеся на гипотезе об атомном строении материи, хорошо отражают действительность.
Одним из успехов кинетической теории газов было толкование понятия энтропии. Исследуя роль соударений между атомами газа и процесс установления под действием этих соударений состояния равновесия, Больцман определил некоторую величину, которая непрерывно возрастает до того момента, пока не достигнет своего максимального значения, характеризующего состояние равновесия.
Эта величина должна быть отождествлена, очевидно, с энтропией. Больцман показал, что она равна логарифму вероятности данного мгновенного состояния всего газа. Это в свою очередь пролило свет на физический смысл понятия энтропии, понятия, которое Пуанкаре назвал удивительно абстрактным. Теорема Клаузиуса, согласно которой энтропия изолированной системы непрерывно возрастает, означает, таким образом, что изолированная система всегда стремится перейти в свое наиболее вероятное состояние. Это великолепное объяснение понятия энтропии явилось большим успехом сторонников атомной теории. И тогда как сторонники энергетического подхода уже склонялись к тому, что принцип энтропии – необъяснимый экспериментальный факт, кинетическая теория газов позволила легко понять его статистически, рассматривая эволюцию систем, состоящих из очень большого числа частиц, находящихся в хаотическом беспрерывном движении.
Таким образом, кинетическая теория газов привела теоретиков к новой точке зрения на вещи и к статистическому рассмотрению громадного числа не связанных между собой элементарных механических процессов. Она побудила провести их систематическое изучение, опираясь одновременно на общие законы механики, с одной стороны, и на законы теории вероятности, с другой. Такая работа была проведена вначале Больцманом, а затем Гиббсом и привела к возникновению новой науки – статистической механики. Статистическая механика позволяет не только получить все наиболее существенные результаты кинетической теории, но также установить некоторые общие положения, применяемые к системам, состоящим из атомов или молекул и не являющихся газами, например к твердым телам.
Такова, в частности, известная теорема о равнораспределении энергии по степеням свободы, согласно которой в системе, состоящей из большого числа составных частей и поддерживаемой при постоянной абсолютной температуре 7, энергия распределяется между различными степенями свободы системы таким образом, что в среднем на каждую степень свободы приходится одно и то же количество энергии, пропорциональное температуре Т.
Применение этой теоремы к газам приводит к весьма интересным и неоднократно подтвержденным опытом результатам. Применение ее к твердым телам позволяет сделать вывод, что атомная теплоемкость твердых тел должна быть, как правило, равна шести (закон Дюлонга и Пти) и, во всяком случае, никогда не быть меньше трех. Это заключение также было неоднократно подтверждено фактическими измерениями. И, тем не менее если большое число следствий статистической механики блестяще подтвердилось экспериментально, то некоторые из них все же не совпадали с экспериментальными данными. Так, например, поведение теплоемкости газов (при постоянном давлении) при низких температурах не соответствовало предсказываемому теоретически, а некоторые твердые тела (алмаз) имели значение атомной теплоемкости существенно меньше трех. Это одновременно и удивляло и настораживало, поскольку чрезвычайная общность методов статистической механики, казалось бы, гарантировала ее от каких-либо ошибок. Тем не менее, наряду с блестящими победами в некоторых случаях эта теория потерпела очевидное поражение. Связано это было с существованием квантов. Открытие их и создание квантовой механики позволило выяснить причины этого несоответствия и указать пределы применимости методов классической механики и, следовательно, статистической механики Больцмана – Гиббса.
Если исходить из того, что все результаты термодинамики вытекают из статистической механики, то отсюда следует, что законы термодинамики не имеют уже характера строгой необходимости. Они носят вероятностный характер, хотя вероятность их выполнения и необычайно высока. Таким образом, например, рассчитанные методами термодинамики давление или энтропия газа, заключенного в некоторый замкнутый сосуд и поддерживаемого при постоянной температуре, представляют собой лишь наиболее вероятные значения этих величин по сравнению с другими возможными при этих условиях их значениями. Однако эти наиболее вероятные значения настолько более вероятны, чем даже очень мало отличающиеся от, них значения, что практически только они и могут наблюдаться на опыте. И, тем не менее теоретически все же возможны отклонения мгновенных значений от их наиболее вероятных значений, даваемых термодинамикой. Чаще всего эти флуктуации слишком малы или редки, чтобы их можно было заметить, однако в некоторых специальных случаях они все же проявляются. Например, флуктуации плотности газа легко могут быть обнаружены, если газ находится вблизи своей критической точки (явление критической опалесценции).
Успехи статистической механики научили физиков рассматривать некоторые законы природы как статистические. Именно потому, что в газах происходит колоссальное число механических элементарных процессов, давление или энтропия газов подчиняется простым законам. Законы термодинамики имеют характер вероятностных законов, представляющих собой статистические результаты явлений атомного масштаба, которые невозможно изучать непосредственно и анализировать детально. Строгие динамические законы, абсолютный детерминизм механических явлений ослабляются в атомном мире, где они становятся ненаблюдаемыми и где проявляются и могут наблюдаться в нашем масштабе только лишь их средние характеристики. Таким образом, физики заметили, что во многих случаях наблюдаемым законам подчиняются лишь средние значения величин. Поэтому ученые занялись изучением вероятностных законов. Волновая механика развила это направление и показала, что наблюдаемые законы, которым подчиняются элементарные частицы, также носят вероятностный характер.
3. Дискретная природа электричества. Электроны и протоны
Из только что сказанного видно, что в физике, как и в химии, гипотеза, согласно которой все тела состоят из молекул, представляющих собой в свою очередь комбинации различных атомов, оказалась чрезвычайно плодотворной и получила блестящие экспериментальные подтверждения. Перед учеными встала новая задача – узнать, из чего состоят сами атомы, и понять, чем атомы различных элементов отличаются друг от друга. Эту трудную проблему помогло разрешить дальнейшее развитие наших знаний о природе электричества.
На заре изучения электрических явлений казалось вполне естественным представлять электричество в виде некоторой особой жидкости и рассматривать, например, электрический ток, протекающий по металлической проволоке, как поток электрической жидкости, текущей вдоль этой проволоки. Однако, как было известно с давних пор, существует два вида электричества: положительное и отрицательное. Следовательно, необходимо было предположить существование двух различных видов электрической жидкости: положительной и отрицательной. Можно было предположить две кардинально отличные модели этих жидкостей: либо представить ее в виде некоей непрерывной субстанции, заполняющей электрически заряженные тела, либо, наоборот, считать, что она состоит из множества мельчайших электрических частиц, каждая из которых представляет собой элементарную частицу электричества. Результат эксперимента был в пользу второй модели. Около сорока лет назад было экспериментально показано, что отрицательное электричество образовано из мельчайших одинаковых частиц, обладающих чрезвычайно малыми значениями массы и заряда. Эти частицы отрицательного электричества получили название электронов. Как известно, впервые электроны были обнаружены в свободном состоянии, вне заряженных тел, в виде так называемых катодных лучей, возникающих в разрядной трубке. Затем их удалось обнаружить в явлениях фотоэффекта и термоэмиссии сильно разогретых тел. Открытие радиоактивности позволило получить новый источник электронов, поскольку большинство радиоактивных веществ спонтанно излучают бета-лучи, представляющие собой не что иное, как электроны, движущиеся с очень большими скоростями. Как следует из многочисленных экспериментов, все электроны, какого бы происхождения они ни были, несут всегда один и тот же чрезвычайно малый отрицательный электрический заряд. Изучая характер движения электрона в пустоте, можно установить, что он движется точно так же, как должна была бы двигаться, согласно законам механики, маленькая заряженная частица. Исследование характера движения электрона в электрическом и магнитном полях позволило измерить величину его заряда и массы, которые очень малы.
Труднее было получить доказательства корпускулярной структуры положительного электричества. Однако позже физики убедились в том, что положительное электричество в конечном счете тоже должно рассматриваться как состоящее из отдельных совершенно одинаковых частиц – протонов. Масса протона еще тоже очень мала, хотя она почти в две тысячи раз больше массы электрона. Это устанавливает любопытную асимметрию между положительным и отрицательным электричеством. Напротив, заряд протона по абсолютной величине равен заряду электрона, но, разумеется, противоположен ему по знаку. До самого последнего времени протон рассматривался как частица, представляющая собой элементарную единицу положительного электричества. Однако открытие положительного электрона несколько усложнило вопрос. Действительно, существует частица положительного электричества, имеющая массу, равную массе электрона, и заряд, равный по величине и противоположный по знаку заряду электрона, – положительный электрон, или позитрон. Какая же из этих двух частиц является на самом деле элементарной частицей положительного электричества – протон или позитрон? Или имеются две существенно различные элементарные частицы положительного электричества? Открытие нейтрона, предшествовавшее открытию положительного электрона, позволяло думать, что протоны – сложные образования, состоящие из нейтрона и положительного электрона. В настоящее время полагают, что протоны и нейтроны скорее два различных состояния одной и той же частицы. Но до самого последнего времени физики считали протон единицей положительного электричества. Этой точки зрения мы пока здесь и будем придерживаться.
Электроны и протоны имеют очень малую, но отнюдь не нулевую массу, так что полная масса большого числа протонов и электронов может стать вполне ощутимой. Поэтому казалось заманчивым предположить, что все материальные тела, обладающие весом и инерцией, т.е. массой, состоят в конечном счете из огромного числа протонов и электронов. С этой точки зрения атомы различных элементов, являющиеся первичным материалом, из которого образованы все материальные тела, сами должны состоять из протонов и электронов, и 92 вида атомов различных элементов должны представлять собой 92 различные комбинации из протонов и электронов.
Задача теперь заключалась в том, чтобы понять, что представляют собой эти комбинации из протонов и электронов, т.е. в том, чтобы построить модель атома. Были выдвинуты различные гипотезы. Некоторый успех имела, например, модель, предложенная Томсоном, знаменитым физиком, работы которого во многом способствовали углублению наших знаний о природе материи. По его модели атом представлял собой равномерно заряженное положительным электричеством шарообразное облако, в котором в равновесии находятся отрицательные электроны. Однако признание получила другая модель, известная ныне как модель Резерфорда – Бора, в которой атом представлялся, подобно миниатюрной солнечной системе, состоящим из центрального положительно заряженного ядра, вокруг которого движутся электроны. Выдвинутая вначале Перреном, эта модель атома нашла подтверждение в опытах по отклонению α–частиц, рассеиваемых на мишени. Эти эксперименты, проделанные Резерфордом и его сотрудниками, показали, что в соответствии с планетарной моделью положительный заряд атома сконцентрирован в чрезвычайно малой области пространства в центре атома. Таким образом, центральное ядро атома несет положительный заряд и окружено электронами, играющими роль планет и движущимися вокруг него под действием кулоновых сил. Каждый атом, находящийся в нормальном состоянии, характеризуется числом N электронов-планет. Поскольку атом в нормальном состоянии электрически нейтрален, то ядро этого атома должно иметь заряд, равный и противоположный по знаку суммарному заряду всех электронов. В атоме с одним единственным электроном-планетой ядро должно иметь заряд, равный и противоположный по знаку заряду электрона. Все другие ядра должны нести кратный ему положительный заряд. Таким образом, ядро атома, обладающего одним электроном (атома водорода), может рассматриваться как единица положительного электричества – тот самый протон, о котором мы уже говорили. Итак, атом каждого вида характеризуется целым числом N, которое получило название атомного номера и, следовательно, все 92 элемента можно расположить в один ряд с атомными номерами, возрастающими от 1 до 92. Вполне возможно, что полученная таким образом классификация совпадает с классификацией по атомному весу. Некоторые явления позволяют с уверенностью судить об атомном номере различных элементов. Например, смещение частотного спектра рентгеновских лучей различных элементов, которое, согласно экспериментально установленному Мозли закону (1913 г.), пропорционально квадрату атомного номера элемента.
Если не считать некоторых отклонений, то, действительно, расположение элементов по возрастающему атомному номеру хорошо соответствует расположению по возрастающему атомному весу. Следовательно, планетарная модель атома подтвердилась экспериментально. В 1913 г. Бор в своей знаменитой работе придал ей математическую форму, позволившую предсказать оптические и рентгеновские спектры различных элементов. Но, чтобы получить эти замечательные результаты. Бору пришлось дополнить планетарную модель основными положениями квантовой теории, поскольку использование классической механики и электродинамики не позволяло получить сколько-нибудь удовлетворительные результаты. Теория Бора могла быть развита только на базе квантовых представлений.
4. Излучение
С открытием нового вида волн, отличающихся от световых только длиной волны, область приложения оптики и волновой теории значительно расширилась. Эти волны долгое время оставались неизвестными, поскольку человеческий глаз нечувствителен к ним. Однако их можно заметить по некоторым физическим явлениям, которые они вызывают, например: по нагреванию облучаемых ими тел, почернению фотопластинок и т.д. Именно так физики и обнаружили их существование. Все эти волны, имеющие ту же природу, что и световые волны и отличающиеся только длиной волны, были объединены в одно большое семейство излучений, И весь видимый свет представляет собой лишь малую часть этого семейства.
Благодаря открытиям, сделанным более пятидесяти лет назад, наши знания об излучении чрезвычайно расширились. В настоящее время известны волны с длиной от сотен километров до десятимиллиардных долей миллиметра. От сотен километров до десятой миллиметра простирается область радиоволн. От десятой миллиметра до нескольких десятитысячных долей миллиметра расположена область инфракрасных волн, или теплового излучения. Более короткие волны, соответствующие длинам волн от восьми до четырех десятитысячных миллиметра, составляют диапазон видимого света от красного до фиолетового. Диапазон от четырех десятитысячных миллиметра до одной десятитысячной занимает ультрафиолетовое излучение, оказывающее сильное воздействие на фотоэмульсию. Далее, широкая область, вплоть до длины волн порядка одной стотысячной, принадлежит рентгеновским лучам. И, наконец, область еще более коротких волн занимает сильно проникающее излучение, создаваемое радиоактивными телами, называемое γ-лучами.
Мы не будем рассказывать здесь, как был открыт и изучен весь этот обширный диапазон. Единственное, что следует указать, это то, что волновая теория, которая была столь блестяще подтверждена в области видимого света, оказалась также справедливой и для волн всего диапазона. Как с волнами Герца, так и с рентгеновскими лучами и даже γ-лучами могут наблюдаться типично волновые явления (преломление, интерференция, дифракция, рассеяние). И в настоящее время нет больше сомнений в том, что для всех видов излучения волновая теория применима в той же степени, что и для света. Различные виды излучения и их свойства зависят только от длины волны.
Однако нужно отметить, что волновая теория, применяемая в равной мере ко всем видам излучений, имеет, как показало развитие новейшей физики, всякий раз одинаковые границы применения. Возвращение к корпускулярным представлениям, выражаемое введением понятия фотона, оказывается в равной степени необходимым для всех видов излучений. И это последнее замечание окончательно доказывает, что все виды излучений имеют одну и ту же физическую природу.
Открытие и классификация различных видов излучений и их одинаковая природа позволили ученым около сорока лет назад разделить весь физический мир на две различные категории. С одной стороны, это материя или вещество, состоящее из атомов, которые в свою очередь представляют собой совокупность протона и электронов, т.е. элементарных частиц электричества. С другой стороны, излучение – совокупность волн, одинаковых по своей физической природе и отличающихся друг от друга лишь длиной. Вещество и излучение представляют собой две совершенно независимые друг от друга физические категории, поскольку вещество может существовать без всякого излучения, а излучение в свою очередь может распространяться в области пространства, абсолютно свободной от вещества. И тем не менее очень важно изучить взаимодействие вещества с излучением. Необходимо исследовать воздействие излучения на вещество и обратно, реакцию вещества на излучение, понять причины, приводящие к поглощению и испусканию излучения. Первой теорией в современной физике, которая попыталась детально разрешить эти вопросы, была электронная теория.
5. Электронная теория
Электромагнитная теория Максвелла содержит уравнения, выражающие связь между измеряемыми в нашем обычном масштабе электромагнитными полями, с одной стороны, и электрическими зарядами и токами, с другой. Эти уравнения электродинамики, выведенные на основе обобщения результатов макроскопических экспериментов, были, несомненно, справедливыми для этого круга явлений. Но для детального описания электрической природы вещества и электромагнитных процессов, происходящих внутри атомов, описания процессов излучения и поглощения необходимо было экстраполировать уравнения Максвелла в область микромира и придать им форму, пригодную для описания явлений, происходящих в атоме. Это и было сделано одним из величайших создателей современной теоретической физики Г.А. Лоренцем.
В качестве отправной точки Лоренц принял гипотезу о дискретной структуре электричества. Он исходил из существования элементарных частиц электричества, которым дал общее название электронов, и предположил, что все вещества состоят из различных комбинаций этих элементарных частиц. То, что мы обычно называем электрически заряженным телом, это тело, содержащее в целом большее число частиц, несущих заряд одного знака, чем частиц, обладающих зарядом противоположного знака. Электрически же нейтральное тело содержит одинаковое число частиц разного знака. Само собой разумеется, что в материальных телах, т.е. в макроскопических, число таких заряженных частиц всегда чрезвычайно велико. Согласно этой точке зрения, электрический ток, текущий по проводнику, обусловлен перемещением большого числа электронов, содержащихся в этом проводнике, а само явление проводимости объясняется некоторой свободой движения электронов в проводящем веществе и возможностью их перемещения под действием внешнего электрического поля. Изоляторы же, напротив, характеризуются отсутствием этой свободы, в них каждый электрон имеет некое положение равновесия и может смещаться из этого положения лишь на очень малые расстояния. Каждый из электронов создает свое электромагнитное поле, и наблюдаемые и измеряемые нами обычно поля не что иное, как средние статистические суммы элементарных полей, создаваемых чрезвычайно большим числом отдельных электронов, входящих в состав всех материальных тел. Как это часто бывает, среднее суммарное поле подчиняется весьма простым законам. Эти законы, записанные в математической форме, будут просто уравнениями, которые связывают непосредственно наблюдаемые макроскопические поля с электрическими зарядами и токами. Более смелая, чем теория Максвелла, теория Лоренца пыталась описать микроскопические электромагнитные явления и с их помощью в результате усреднения получить законы, которым подчиняются крупномасштабные макроскопические явления. Лоренц пытался определить электромагнитные поля, заряды и токи в каждой точке пространства, в каждый момент времени, причем не только в пространстве между зарядами, но и внутри самих электронов. Он предположил, что все микроскопические величины, такие, как поля, заряды, токи подчиняются уравнениям того же вида, что и макроскопические уравнения Максвелла, с той лишь разницей, однако, что в них уже не остается места для различия полей и соответствующих индукций, а заряды и токи оказались зависящими от самой структуры электричества. Можно показать, что, усредняя микроскопические величины, из уравнений Лоренца можно получить систему уравнений Максвелла. При этом выясняется различие между полями и индукциями. Таким образом, электромагнитная теория Максвелла оказывается теорией «крупномасштабных» электромагнитных полей, являющихся среднестатистической суммой элементарных или мелкомасштабных полей, описываемых теорией Лоренца.
Электронная теория, основные моменты которой мы только что кратко изложили, привела к серьезным успехам и позволила предсказать и объяснить большое число новых явлений. Она раскрыла физический смысл законов дисперсии, уже полученных к тому времени с помощью других теорий. Кроме того, и это несомненно было одним из крупных ее успехов, она позволила точно предсказать нормальный эффект Зеемана, т.е. расщепление спектральных линий атомов под действием магнитного поля.
Экспериментальное подтверждение этого явления изменения частоты испускаемого атомами света под действием внешнего магнитного поля явилось замечательным подтверждением электронной теории. Стало понятно, что частицы, с движением которых связано излучение, есть не что иное, как отрицательные электроны, и, таким образом, было доказано существование их внутри вещества. Это было крупным успехом теории Лоренца. В общем, можно сказать, что электронная теория удовлетворительно объяснила все явления, в которых электрические и магнитные поля так или иначе влияют на условия излучения, распространения и поглощения света. К ним относится, например, явление вращения плоскости поляризации в магнитном поле (эффект Фарадея), которое в свете теории Лоренца можно рассматривать просто как обратный эффект Зеемана, а также явления двойного лучепреломления, вызванного электрическим или магнитным полем. Во всех этих областях, составляющих электро– и магнитооптику, теория Лоренца сыграла большую роль.
Электронная теория, казалось, ответила также на важный вопрос, что является источником излучения, испускаемого веществом. Согласно уравнениям Лоренца, электрон, движущийся прямолинейно и равномерно, полностью переносит с собой свое электромагнитное поле. Следовательно, в этом случае излучения энергии в окружающее пространство не происходит. Но если электрон движется с ускорением, то он излучает электромагнитные волны, и энергия, теряемая им в результате излучения, пропорциональна квадрату ускорения.
Излучение электромагнитных волн переменным током легко объяснить с точки зрения электронной теории, если учесть, что ток представляет собой громадное число периодически колеблющихся электронов. Сразу становится ясно, почему ток может излучать энергию. Понятным становится также излучение волн Герца токами в открытых контурах, такими, например, как ток, текущий в передающей антенне радиовещательных станций. Таким образом, мы возвращаемся к теории излучения волн Герца, основанной на уравнениях Максвелла.
Рассматривая излучение отдельных ускоренно движущихся электронов, теория Лоренца позволяет узнать первопричину излучения, понять, где находится источник излучения, испускаемого веществом. Следовательно, эта теория должна была бы в принципе объяснить возникновение электромагнитных волн в масштабе атома и показать, например, каким образом атомные спектры связаны с движением внутриатомных электронов. Электронная теория столкнулась с большими трудностями при попытке объяснить возникновение атомных спектров. Но вначале казалось, что эта теория ускорительных волн позволяет дать полное и исчерпывающее объяснение процессам испускания излучения веществом. И известное явление, заключающееся в возникновении рентгеновских лучей при резком торможении электронов на антикатоде, служило неопровержимым доказательством справедливости этой теории.
Несмотря на первые блестящие успехи, электронная теория оказалась не в состоянии объяснить явления в масштабе атома. При попытке рассмотреть вопрос о термодинамическом равновесии вещества и излучения на основании уравнений Лоренца возникают трудности, которых можно избежать лишь вводя совершенно новые представления квантовой теории. С другой стороны, для объяснения излучения атомов с точки зрения электронной теории приходится предположить, что в нормальном состоянии внутриатомные электроны неподвижны. В противном случае, двигаясь под действием кулоновских сил внутри чрезвычайно малой области пространства, они обладали бы отличным от нуля ускорением и должны были бы непрерывно терять энергию в виде электромагнитного излучения, что противоречит основному положению об устойчивости атома. Развитие наших знаний об атоме привело нас, как мы видели, к планетарной модели, исходящей из предположения о непрерывном движении электронов-планет. И тут возникло явное противоречие между теорией ускорительных волн и идеей стабильного атома. Разрешение этого противоречия может быть получено только с помощью введения новых, квантовых представлений (теория Бора).
На этих нескольких примерах, которые при желании можно было бы умножить, видно, что электромагнитная теория, дополненная и развитая Лоренцом, который учел дискретную структуру электричества, хотя и блестяще объяснила большое число различных явлений, столкнулась тем не менее с серьезными трудностями при попытке объяснить экспериментальные факты, относящиеся к атомному миру. Эти трудности можно было преодолеть только привлечением совершенно новых представлений, понятий и идей, в корне отличных от понятий и идей, называемых ныне классическими, на которых покоится электромагнитная теория.
Глава IV. Теория относительности
1. Принцип относительности
Прежде чем говорить о развитии наших представлений о квантах, нельзя не посвятить короткую главу теории относительности.
Теория относительности и кванты – это два столпа современной теоретической физики, и, хотя эта книга посвящена теории квантов, невозможно обойти молчанием и теорию относительности.
Развитие теории относительности началось с изучения некоторых вопросов, связанных с оптическими явлениями, происходящими в движущихся средах. Френелево представление о свете предполагало существование эфира, заполняющего всю Вселенную и проникающего во все тела. Такой эфир играл роль среды, в которой распространялись световые волны. Электромагнитная теория Максвелла несколько ослабила значение его, так как эта теория не требует, чтобы световые колебания были колебаниями какой-либо среды. В теории Максвелла световые колебания полностью определяются заданием векторов электромагнитного поля. После того как все попытки механической интерпретации законов электродинамики потерпели неудачу, поля в максвелловой теории в конце концов стали рассматривать как исходные понятия, которые бесполезно пытаться перевести на язык механики. С этого момента исчезла какая бы то ни была необходимость предполагать существование упругой среды, передающей электромагнитные колебания, и можно было подумать, что понятие эфира становится бесполезным. В действительности же это было не совсем так, и последователи Максвелла, в частности Лоренц, вынуждены были снова поднять вопрос об эфире. В чем же было дело? Почему пришлось продолжить разговор об эфире? Потому что уравнения электродинамики Максвелла не удовлетворяли принципу относительности классической механики. Иными словами, будучи справедливыми в одной какой-либо системе координат, они становились неверными в другой системе координат, движущейся прямолинейно и равномерно относительно первой. По крайней мере, если допустить (что представлялось тогда само собой разумеющимся), что при переходе от одной системы к другой координаты заменяются так, как это обычно делается в аналогичных случаях в классической механике. Действительно, классическая механика исходит из существования некоего абсолютного времени, единого для всех наблюдателей и для всех систем отсчета. В ней предполагается также, что расстояние между двумя точками пространства является инвариантом, т.е. должно иметь одно и то же значение во всех системах координат, которые можно использовать для определения положения точек в пространстве. Из этих двух принципов, которые казались вполне естественными, непосредственно следовали простые классические формулы преобразования координат при переходе от одной системы отсчета к другой, которая движется относительно первой прямолинейно и равномерно. Эти формулы определяют так называемое преобразование Галилея. Одним из основных положений классической механики является требование, чтобы все ее уравнения были инвариантны относительно преобразования Галилея. И действительно, пользуясь формулами преобразования Галилея, легко убедиться, что если уравнения Ньютона справедливы в системе координат, связанной с неподвижными звездами, то они будут справедливы также и во всех других системах отсчета, движущихся прямолинейно и равномерно относительно этих неподвижных звезд. Напротив, уравнения Максвелла и Лоренца, существенно отличающиеся по своей форме от уравнений классической механики, не инвариантны относительно преобразования Галилея. Следовательно, если уравнения Максвелла справедливы в какой-либо одной системе координат, то они становятся несправедливыми при переходе к другой, движущейся относительно первой прямолинейно и равномерно. Дело обстоит так, как если бы существовала некая среда, заполняющая всю Вселенную, такая, что уравнения Максвелла справедливы только в одной, связанной с этой средой системе отсчета. Именно с этой средой отсчета ассоциировали последователи Максвелла понятие эфира. Эфир не был для них уже упругой средой с особыми свойствами, способной передавать световые колебания. Он стал абстрактной, весьма условной средой, служащей лишь для фиксации систем отсчета, в которых справедливы уравнения электродинамики Максвелла.
Но даже сведенный до такой незначительной роли эфир все же оставался, как мы уже сказали, довольно неудобной концепцией. Действительно, согласно теории Максвелла – Лоренца, для наблюдателя, движущегося относительно эфира, световые явления должны были бы протекать иначе, чем для неподвижного. Следовательно, изучение этих явлений в движущейся системе координат должно было позволить определить скорость этой системы координат относительно эфира, который таким образом приобретает уже некоторое более конкретное содержание. В частности, физики, работающие в своих лабораториях на Земле, вследствие вращения Земли вокруг Солнца находятся в постоянном движении, направление которого периодически меняется со временем года, поскольку Земля движется вокруг Солнца приблизительно по круговой орбите. И если, по невероятной случайности, в какой-то момент времени земной наблюдатель находится в покое относительно эфира, то уже через несколько недель или месяцев он будет двигаться относительно него с довольно большой скоростью. Таким образом, с помощью нескольких, проведенных последовательно друг за другом экспериментов можно было бы весьма точно определить скорость Земли относительно эфира. Однако ни один из многочисленных экспериментов, поставленных учеными XIX в. с целью определения движения Земли относительно эфира, не позволил «почувствовать» движения Земли. Тем не менее в течение долгого времени это отсутствие результата можно было увязать с теорией, поскольку предсказываемый эффект был весьма мал, а точность поставленных оптических экспериментов была недостаточно высока и не позволяла сделать вполне определенных выводов. Действительно, можно показать, что движение наблюдателя по отношению к эфиру приводит к поправкам, пропорциональным квадрату отношения скорости движения наблюдателя к скорости света в пустоте. Поскольку же это отношение всегда очень мало, то и ожидаемый эффект также очень мал. Но физики, постоянно совершенствуя технику эксперимента, получили, наконец, возможность измерять столь слабые эффекты. Теперь уже с помощью опытов по интерференции с полной уверенностью можно было сказать, зависят результаты экспериментов от скорости Земли относительно эфира или нет. И опыт снова дал, на этот раз уже определенно, отрицательный ответ: ожидаемый эффект, хотя и очень малый, но все же лежащий в пределах точности наблюдений, который предсказывала теория, обнаружить не удалось. Эфир продолжал оставаться неуловимым, что теперь уже явно противоречило классической теории. Этот чрезвычайно важный вывод позволил сделать знаменитый опыт Майкельсона, проведенный в 1881 г. и повторенный им несколько позже вместе с Морли. Другие опыты, которые тоже должны были обнаружить движение Земли относительно эфира с помощью уже не оптических, но электромагнитных явлений (опыты Траутона и Нобеля), были не более успешны, чем опыт Майкельсона.
Само собой разумеется, было сделано немало попыток согласовать отрицательный результат опыта Майкельсона с существующими теориями. В частности, Фицджеральд и Лоренц выдвинули гипотезу о сокращении материальных тел при их движении относительно эфира. Это сокращение, не меняя поперечных размеров, должно приводить к сокращению линейных размеров тел в направлении их движения относительно эфира и, таким образом, точно компенсировать влияние относительного движения на скорость распространения света.
Но эта остроумная гипотеза носила, очевидно, весьма искусственный характер и, казалось, была выдвинута с единственной целью скрыть неудачу. И, как известно, лишь Альберт Эйнштейн нашел истинное решение этого вопроса (1905 г.).
Казалось совершенно очевидно, что уравнения электродинамики Максвелла – Лоренца должны позволить с помощью соответствующим образом поставленных экспериментов определить движение наблюдателя по отношению к эфиру. Причина такой уверенности заключалась в том, что уравнения Максвелла меняют свой вид при переходе от одной системы координат к другой, движущейся относительно первой. Но при этом a priori допускалось, что координаты какого-либо тела, измеренные в двух системах координат, движущихся относительно друг друга прямолинейно и равномерно, связаны между собой формулами преобразования Галилея. Итак, уравнения Максвелла – Лоренца не инвариантны относительно преобразований Галилея. А раз это так, то эксперименты должны позволить определить движение Земли относительно эфира. Но опыт свидетельствовал, что движение Земли не сказывается на электродинамических явлениях.
Как показал Лоренц, хотя уравнения электродинамики не инвариантны относительно преобразования Галилея, они инвариантны относительно некоторого другого линейного преобразования координат, имеющего несколько более сложный вид, чем преобразование Галилея, и носящего ныне название преобразований Лоренца. Вначале этот факт казался просто математическим курьезом, а преобразования Лоренца, казалось, не имели никакого физического смысла. Но Эйнштейн исходил из обратного. Он предположил, что преобразование Лоренца отражает действительную физическую реальность и связывает координаты, измеренные двумя наблюдателями, движущимися равномерно и прямолинейно друг относительно друга (если, конечно, оба они движутся прямолинейно и равномерно относительно системы координат, связанной с неподвижными звездами). И как раз не преобразование Галилея, а именно преобразование Лоренца имеет точный физический смысл. Тогда из инвариантности уравнений электродинамики относительно преобразования Лоренца следует, что они имеют одинаковый вид во всех системах координат, движущихся прямолинейно и равномерно относительно неподвижных звезд. А значит, все электромагнитные и оптические явления будут протекать совершенно одинаково независимо от того, в какой системе координат они наблюдаются, и обнаружить по этим явлениям абсолютное движение по отношению к эфиру оказывается невозможно. Таким образом, отрицательный результат опыта Майкельсона и других опытов, поставленных с целью обнаружить движение Земли относительно эфира, становится совершенно естественным. И если принять теперь относительность всех оптических и электромагнитных явлений (в том же смысле, в каком классическая механика понимает относительность всех механических явлений), то отсюда с необходимостью будет следовать, что не преобразование Галилея, а именно преобразование Лоренца выражает точную связь между двумя различными наблюдателями, движущимися прямолинейно и равномерно друг относительно друга.
Важно было понять причины, по которым преобразования Галилея необходимо заменить преобразованием Лоренца, и выяснить физические следствия этой замены. Это сделал Эйнштейн при помощи тонкой и глубокой критики понятий пространства и времени. Такая критика была совершенно необходима, поскольку преобразование Лоренца влекло за собой целый ряд следствий, казавшихся тогда совершенно парадоксальными. Действительно, из преобразования Лоренца следовало, что, с одной стороны, не существует абсолютного времени, т.е. два наблюдателя, движущихся друг относительно друга, пользуются различным временем, а с другой стороны, что расстояние между двумя материальными точками также не имеет абсолютного характера и различно для различных наблюдателей. Из постулата об абсолютности времени и пространства следует преобразование Галилея. Если же принять преобразования Лоренца, то нужно отказаться от этих, казавшихся столь естественными постулатов. Чтобы прояснить этот трудный вопрос, Эйнштейн провел глубокий критический анализ экспериментальных методов измерения пространства и времени. При этом в качестве основного положения он принял постулат, согласно которому никакая энергия, никакой сигнал не может распространяться, со скоростью, превышающей скорость света в пустоте, а скорость распространения света в пустоте постоянна и не зависит от направления распространения. Существование этой верхней границы для скорости распространения сигналов позволило вывести формулы преобразования Лоренца и понять их физический смысл.
Прежде всего, Эйнштейн поставил перед собой вопрос, каким образом должны быть синхронизованы в некоторой данной системе отсчета различные часы, по которым измеряется время в различных точках этой системы. Поскольку невозможно непосредственно сравнить между собой часы, расположенные в различных точках пространства, то для их синхронизации необходимо использовать тот или иной метод сигнализации. Синхронизовав все часы в какой-либо рассматриваемой системе координат, можно сказать, что таким образом мы определили собственное время этой системы координат. Но синхронизованные таким образом часы оказываются таковыми только в одной системе координат, именно в той, в которой проводилась синхронизация (а также, разумеется, во всех системах координат, покоящихся относительно этой). При этом, что очень существенно, оказывается невозможно ввести никакое абсолютное время, справедливое для всех систем координат. Поясним это более подробно. Пусть имеется две системы отсчета А и В, движущиеся друг относительно друга прямолинейно и равномерно. Будем предполагать, что в той и другой системе координат часы синхронизованы, т.е. будем предполагать, что часы, синхронизованные между собой, расположены как в различных точках системы А, так и в различных точках системы В. В процессе движения часы, установленные в А, будут проходить мимо часов, установленных в В. Пусть теперь наблюдатели, находящиеся в системе А, в какой-либо момент времени, скажем, когда их собственные часы показывают полдень, отметят время, показываемое проходящими в этот момент мимо них часами системы координат В. Тогда окажется, что время, определенное различными наблюдателями по движущимся часам, также различно. Иначе говоря, время, определенное в один и тот же момент собственного времени системы А по различным часам системы В, оказывается различным. С другой стороны, поскольку с тем же основанием можно считать, что система А движется относительно В, то время, определяемое в один и тот же момент собственного времени В наблюдателями, находящимися в системе В, по различным часам системы А, также будет различным. Таким образом, в теории относительности понятие одновременности теряет свой абсолютный смысл: два события, происходящие в один и тот же момент времени в некоторой системе координат, будут не одновременными в другой системе координат, движущейся относительно первой. И этот, на первый взгляд столь парадоксальный вывод, как ясно показал Эйнштейн, является непосредственным следствием невозможности синхронизовать часы с помощью сигналов, распространяющихся со скоростью, превышающей скорость распространения света в пустоте.
Продолжая тем же путем физическую интерпретацию преобразования Лоренца, Эйнштейн показал, что любое материальное тело, движущееся относительно наблюдателя, будет ему казаться короче (в направлении движения), чем наблюдателю, относительно которого это тело покоится, т.е. наблюдателю, движущемуся вместе с этим телом. Поясним это утверждение также несколько более подробно. Пусть два наблюдателя движутся друг относительно друга равномерно и прямолинейно в некотором направлении D. Предположим, что один из наблюдателей несет с собой линейку, ориентированную параллельно D. Пусть ее длина, измеренная этим наблюдателем, равна, например, одному метру. Тогда для другого наблюдателя длина этой же линейки будет меньше метра, причем это отличие будет тем значительнее, чем больше будет скорость относительного движения. Величина этого «сокращения» движущейся линейки, вообще говоря, чрезвычайно мала и становится заметной лишь при приближении скорости относительного движения к скорости света в пустоте. Именно по этой причине такое сокращение не удавалось измерить с помощью прямого эксперимента. Однако это сокращение, имеющее практически ничтожную величину, оказалось в точности равным тому, которое предполагали Фицджеральд и Лоренц, и было как раз таким, чтобы строго объяснить отрицательный результат опыта Майкельсона. И тем не менее, несмотря на это совпадение, имеется существенная разница между сокращением по Фицджеральду – Лоренцу и сокращением по Эйнштейну. Действительно, первые рассматривали его как действительное сокращение тел, находящихся в абсолютном движении по отношению к неподвижному эфиру, тогда как второй – лишь как кажущееся движущемуся наблюдателю сокращение, связанное только с процессами измерений, которыми пользуются различные наблюдатели для измерения расстояний и промежутков времени, и преобразованием Лоренца, математически выражающим связь между результатами измерений, проделанных двумя различными наблюдателями, находящимися в относительном движении.
Кажущееся сокращение размеров сопровождается кажущимся замедлением хода часов. Наблюдатели, находящиеся, например, в системе координат А, изучая ход часов, движущихся вместе с системой В, обнаружат, что они отстают от их собственных часов, покоящихся в системе А. Иначе говоря, можно утверждать, что движущиеся часы идут медленнее неподвижных. Как показал Эйнштейн, это тоже одно из следствий преобразования Лоренца. Итак, кажущееся сокращение длин и замедление хода часов однозначно следует из новых определений пространства и времени, с которыми и связано преобразование Лоренца. И обратно, постулируя сокращение размеров и замедление хода часов, можно получить формулы преобразования Лоренца.
Рассуждения, при помощи которых Эйнштейн вводит свои новые представления, порою очень хитроумны и их сложно изложить корректно. Но они совершенно безупречны, и с логической точки зрения им не может быть предъявлено ни одно серьезное возражение. В частности, теория объясняет такой на первый взгляд парадоксальный факт, что сокращение масштабов и замедление хода часов имеют взаимный характер. Если каждый из двух наблюдателей, движущихся друг относительно друга прямолинейно и равномерно, обладает одинаковыми часами и линейками, то, произведя измерения, каждый из них обнаружит, что линейка другого короче его собственной, а часы другого отстают от его часов. Эта взаимность, которая на первый взгляд кажется такой удивительной, становится легко понятной при более внимательном изучении теории, чего мы здесь, конечно, не можем сделать.
Изменение понятий о пространстве и времени, вызванное принципом относительности Эйнштейна, привело к изменению основных принципов кинематики. В частности, закон сложения скоростей приобрел иной, несколько более сложный вид. Это в свою очередь легко позволило понять результаты опытов Физо по распространению света в движущихся диспергирующих средах. На языке теории эфира эти эксперименты можно было понять, говоря о частичном увлечении эфира движущимися телами. Опыты Физо подтвердили предложенную Френелем формулу, определяющую коэффициент увлечения как функцию показателя преломления движущейся среды. Лоренц в своей теории электронов сумел подтвердить эту формулу, но теория относительности дала ей гораздо более простое и изящное объяснение, показав, что она прямо следует из нового закона сложения скоростей.
2. Пространство и время
Преобразования Галилея были основаны на гипотезе полной независимости времени и пространства. Отсюда и следовал абсолютный характер, приписывавшийся этим понятиям. В теории же относительности, как это ясно уже из самого вида преобразования Лоренца, пространственные координаты и время (т.е. временная координата) больше не могут рассматриваться независимо. Для геометрического объяснения соотношений между пространственными координатами и временем различных наблюдателей нужно ввести некоторое абстрактное четырехмерное пространство, позволяющее очень изящно отразить внутреннюю связь между пространственными координатами и временем, которая содержится в преобразованиях Лоренца. Это геометрическое толкование предложено и развито Минковским, а четырехмерное пространство получило название четырехмерного мира, или пространства-времени.
Преобразование Лоренца оставляет неизменным взаимное расстояние между двумя точками в четырехмерном мире, т.е., как говорят, расстояние между двумя мировыми точкам. Поэтому преобразование Лоренца можно рассматривать просто как поворот системы координат в четырехмерном пространстве и все физические законы записать в виде некоторых уравнений для четырехмерных тензоров.
Каждый наблюдатель по-своему выкраивает из четырехмерного мира свое пространство и свое время, и формулы преобразований Лоренца немедленно следуют из того, что два по-разному равномерно движущихся наблюдателя разными способами отделяют пространство от времени.
Таким образом, мы видим, что теория относительности позволяет в каком-то смысле объединить временную координату и пространственные координаты в единое четырехмерное многообразие. Однако из этого, разумеется, вовсе не следует делать вывод, что в теории относительности полностью стирается физическое различие между временем и пространством и они становятся совершенно равноправными. Они целиком сохраняют там свой существенно различный физический смысл. Более того, различие их находит свое отражение также в математической записи уравнений, в которые время входит иным образом, чем координаты. Так, если потребовать, чтобы указанное четырехмерное пространство было эвклидовым (в геометрическом смысле), то в качестве четвертой координаты необходимо выбрать, не само время, а произведение его на мнимую единицу. В этом и проявляется существенное различие между временем и пространством.
Одно из основных свойств времени – это его способность изменяться только в одном направлении. Отсюда вытекает своего рода неизотропность четырехмерного пространства: выделенный характер положительного направления вдоль оси времени. Каждому положению материальной точки в некоторый момент времени будет соответствовать точка в четырехмерном пространстве. Совокупность таких мировых точек, соответствующих различным положениям материальной точки для различных моментов времени, определяет некоторую кривую в четырехмерном пространстве, называемую мировой линией этой материальной точки. На каждой такой мировой линии имеется выделенное направление от прошедшего к будущему, и эта неравнозначность направлений также связана с различием между временной и пространственными координатами.
И тем не менее, несмотря на столь различный физический смысл, время и пространство в теории относительности оказываются тесно связанными и введение четырехмерного мира является математическим отражением этой связи.
Мы не будем дальше задерживаться на этом вопросе, более глубокое изучение которого требует привлечения соответствующего математического аппарата, а посмотрим теперь, к каким изменениям в законах классической механики привела теория Эйнштейна.
3. Релятивистская динамика
Классические уравнения ньютоновой механики инвариантны относительно преобразования Галилея. И если рассматривать это преобразование как соотношение, отражающее истинную связь между координатами, измеряемыми двумя наблюдателями, движущимися друг относительно друга прямолинейно и равномерно, то отсюда однозначно следует, что уравнения Ньютона справедливы во всех системах координат, движущихся прямолинейно и равномерно относительно системы неподвижных звезд. Во всех этих системах координат механические явления будут подчиняться одним и тем же законам и, следовательно, никакие механические явления не могут позволить определить скорость системы отсчета, в которой производятся измерения относительно неподвижных звезд. В этом и состоит принцип относительности старой механики. Но с тех пор как Эйнштейн показал, что связь между координатами двух движущихся систем отсчета дается не преобразованием Галилея, а преобразованием Лоренца, положение совершенно изменилось. И, в частности, принцип относительности оказался применимым к оптическим и электромагнитным явлениям, что полностью согласуется с отрицательными результатами опыта Майкельсона и аналогичных ему других экспериментов. Но уравнения ньютоновой механики оказались неинвариантными относительно преобразования Лоренца, и, следовательно, принцип относительности оказался для механических явлений, строго говоря, уже несправедливым. Однако Эйнштейн считал этот вывод неправильным и исходил из предположения о том, что принцип относительности должен быть справедлив для всех физических явлений, в частности и для механических. Но тогда уравнения механики нужно было обобщить таким образом, чтобы они стали инвариантными относительно преобразования Лоренца. При этом новые уравнения должны совпадать в первом приближении со старыми уравнениями Ньютона во всех исследованных ранее случаях, где экспериментальные данные блестяще подтверждали эту теорию. Стало понятно, каким образом необходимо было обобщить основные уравнения механики, чтобы они оказались инвариантными относительно преобразования Лоренца. Уравнения Ньютона утверждают, что производная импульса по времени равна действующей силе. В динамике Эйнштейна это утверждение сохраняет свою силу с той лишь разницей, что импульс определяется там несколько иным образом. Под импульсом материальной точки релятивистская механика понимает не просто произведение массы материальной точки на ее скорость, а произведение массы на частное от деления скорости на некоторую функцию, зависящую от квадрата отношения скорости материальной точки к скорости света в пустоте. Поскольку в обычных условиях скорость материальных тел достаточно мала и квадрат отношения ее к скорости света пренебрежимо мал по сравнению с единицей, то эта функция без заметной ошибки может быть положена равной единице, и мы снова приходим к старым нерелятивистским уравнениям механики. Однако при скоростях, сравнимых со скоростью света, эта функция отлична от единицы и существенно зависит от величины скорости. Отсюда следует отличие релятивистских законов от нерелятивистских, которое тем более заметно, чем ближе скорость тела к скорости света. Кстати, из новых уравнений механики с очевидностью следует, что скорость материальной точки никогда не может достигнуть скорости света в пустоте. Таким образом, скорость света в пустоте оказывается верхним пределом скорости передачи энергии в пространстве. И так a posteriori оказывается оправданной одна из гипотез, сделанных Эйнштейном при анализе методов синхронизации часов.
Мы не в состоянии проводить здесь подробный анализ уравнений релятивистской механики. Достаточно заметить, что весь ее аппарат можно развить точно таким же путем, как это делалось в нерелятивистской классической механике. Например, все уравнения релятивистской динамики легко могут быть получены из некоторого принципа стационарного действия, из которого в свою очередь следуют уравнения Лагранжа и Гамильтона. Таким образом, мы снова приходим к теории Якоби и в случае статических силовых полей к принципу наименьшего действия Мопертюи. Однако между старой и новой механикой имеется большая разница. Подынтегральные выражения, стоящие в интеграле действия, в обоих этих случаях существенно отличаются друг от друга и практически совпадают лишь при достаточно малых скоростях, когда квадрат отношения скорости движения материального тела к скорости света в пустоте пренебрежимо мал по сравнению с единицей. Отсюда следует, что классическая нерелятивистская механика является приближением, справедливым в громадном большинстве практически интересных случаев.
Изменения, вносимые теорией относительности в уравнения классической механики, сводятся к замене старого импульса произведением некоторой константы, характеризующей свойства материальной точки, на частное от деления ее скорости на функцию, также зависящую от скорости. При желании, однако, можно и в релятивистской механике определить импульс так же, как и в нерелявистской, т.е. как произведение массы на скорость, с той лишь разницей, что в этом случае масса будет уже зависеть от скорости. Поскольку дополнительная функция, фигурирующая в релятивистском выражении для импульса, стремится к единице, когда скорость стремится к нулю, то отсюда следует, что константа должна быть положена равной массе покоя материальной точки, или, как иногда говорят, собственной массе. Последнее название связано с тем, что именно эту величину массы измерил бы наблюдатель, движущийся с той же скоростью, что и материальная точка. Как уже было отмечено, зависимость массы от скорости становится существенной лишь для достаточно больших скоростей, сравнимых со скоростью света.
Изменения, внесенные теорией относительности в определение импульса, привели, разумеется, к соответствующему изменению выражения для энергии. И это не удивительно, поскольку три компоненты вектора количества движения и энергия представляют собой четыре компоненты четырехмерного вектора, называемого вектором энергии импульса или четырех-вектором импульса.
Это новое выражение для энергии очень интересно тем, что при скорости, равной нулю, энергия не обращается в нуль, как это следовало из старого нерелятивистского выражения для энергии, а принимает постоянное значение, равное произведению массы покоя на квадрат скорости света в пустоте. Таким образом, всякая материальная точка, всякое тело, обладающее инерцией, имеет некоторую собственную энергию или энергию покоя, независящую от скорости. Если скорость тела отлична от нуля, то его энергия превышает энергию покоя. Разность между полной энергией движущегося тела и его энергией покоя характеризует скорость движения и может быть названа кинетической энергией тела. Анализ релятивистского выражения для кинетической энергии показывает, что при скоростях движения, много меньших скорости света, оно с точностью до малых поправок переходит в выражение для кинетической энергии, используемое в старой классической механике (половина произведения массы на квадрат скорости). Таким образом, мы снова видим, что ньютонова механика – первое приближение, справедливое при скоростях движения, много меньших скорости света.
Материальное тело, покоящееся относительно некоторого наблюдателя, обладает в системе координат, связанной с этим наблюдателем, энергией, равной произведению массы покоя на квадрат скорости света. Но если тело начинает двигаться, то его масса возрастает. При приближении скорости тела к скорости света она стремится к бесконечности. Это еще раз указывает на то, что никакому материальному телу с массой покоя, отличной от нуля, невозможно сообщить скорость, равную или тем более превышающую скорость света в пустоте. Эйнштейн обобщил этот результат, показав, что всякое материальное тело, обладающее некоторой массой (измеренной каким-либо наблюдателем), имеет, с точки зрения того же самого наблюдателя, энергию, равную произведению измеренной им массы на квадрат скорости света. Эйнштейн проиллюстрировал это утверждение многочисленными примерами. Так был установлен принцип эквивалентности массы и энергии, отражающий глубокую и общую связь между массой и энергией. Из него следует, что все тела, теряя энергию, теряют и массу, и, обратно, с увеличением энергии увеличивается масса тела. Так, например, масса атома уменьшается при излучении.
Установленный теорией относительности принцип эквивалентности массы и энергии сыграл большую роль во всей теоретической физике, начиная с астрофизики и кончая атомной и ядерной физикой. В частности, стало возможно написать баланс энергии для явлений ядерного распада и получить отсюда ряд весьма общих формул, описывающих эти явления. Однако эти вопросы уже не имеют к нашей теме прямого отношения, и мы их касаться не будем.
4. Общая теория относительности
Остановимся теперь в нескольких словах на общей теории относительности. Вначале теория относительности была создана Эйнштейном лишь для инерционных систем координат, т.е. для систем координат, движущихся прямолинейно и равномерно относительно системы неподвижных звезд, и так же, как и в старой классической механике, принцип относительности был провозглашен только для прямолинейного и равномерного движения. Поэтому под теорией относительности понимают обычно совокупность наиболее существенных результатов, относящихся к инерционным системам координат. Чтобы подчеркнуть это, ее иногда называют частной или специальной теорией относительности. Но необходимо было попытаться обобщить эти результаты на случай ускоренного движения и построить теорию, справедливую в более общем случае. Для непрямолинейного или ускоренного движения, вообще говоря, принцип относительности в его прежней формулировке оказывается уже несправедливым, поскольку в системе координат, движущейся ускоренно (например, вращающейся), механические, оптические или электромагнитные явления протекают иначе, чем в инерциальных системах отсчета. В частности, для правильного описания механических явлений, протекающих в ускоренной системе координат, необходимо вводить некие фиктивные дополнительные силы, называемые центробежными и силами Кориолиса. А необходимость введения этих сил дает наблюдателю возможность определить наличие ускорения системы координат, с которой он связан. Тем не менее и в этом случае можно все же сохранить принцип относительности в его более общей форме, если допустить, что все законы природы выражаются в виде тензорных соотношений в четырехмерном пространстве и попытаться учесть влияние ускорения на физические явления введением ускоренно движущихся систем координат. Более подробный анализ показывает, что использование криволинейных координат в четырехмерном пространстве позволяет объяснить явления, наблюдаемые ускоренно движущимся наблюдателем, и, в частности, введение центробежных и других связанных с ними сил.
Развивая эти идеи, Эйнштейн выдвинул чрезвычайно красивую гипотезу, на которой основана его известная теория гравитации. Силы тяготения, или гравитационные силы, играющие столь важную роль в астрономии, обладают одной особенностью, выделяющей их из всех известных нам в природе сил. А именно, как показали чрезвычайно точные эксперименты, проведенные Эйнштейном, эти силы всегда пропорциональны массе тела, на которое они действуют, и, следовательно, все тела независимо от величины их массы или заряда движутся в гравитационном поле совершенно одинаково (разумеется, при одних и тех же начальных условиях). Иначе говоря, их траектория определяется только свойствами гравитационного поля и не зависит от свойств движущегося тела. Это позволило Эйнштейну учесть влияние гравитационных полей, действующих в некоторой области пространства, введением локальной кривизны четырехмерного пространства. Используемый в специальной теории относительности четырехмерный континуум пространства-времени представляет собой эвклидово или, как говорят, плоское пространство (в частном случае двух измерений примером эвклидова пространства может служить обычная плоскость). Однако ничто не мешает предположить, что четырехмерное пространство может обладать переменной кривизной, т.е. быть неэвклидовым. В этом случае уже нельзя ввести системы прямоугольных координат, и положение какой-либо точки в пространстве может быть определено лишь и помощью криволинейной системы координат, подобно тому как это делается в геометрии при изучении искривленных поверхностей. Таким образом, наблюдатель, находящийся в неэвклидовом пространстве, должен для описания событий обязательно пользоваться криволинейной системой координат, что и приводит к появлению гравитационных сил. Центробежные силы, возникающие во вращающейся системе координат, связаны с тем, что наблюдатель, находящийся в этой системе, использует для описания явлений, происходящих в эвклидовом четырехмерном пространстве, системы криволинейных координат. Подобно этому возникновение гравитационных сил вызвано тем, что в области действия гравитационных полей пространство оказывается неэвклидовым и наблюдатель вынужден пользоваться криволинейными координатами.
На этом закончим весьма краткий очерк теории тяготения Эйнштейна, более глубокое изучение которой невозможно без привлечения довольно сложного математического аппарата. Отметим только еще раз, что это, пожалуй, одна из самых красивых и изящных физических теорий.
Специальная теория относительности неоднократно подтверждена экспериментально. В частности, предсказываемое этой теорией заметное увеличение массы электронов при приближении их скорости к скорости света блестяще подтвердилось многими экспериментами, последние и наиболее точные из которых были проделаны Гюйе и Лаванши. Точно так же не вызывает сомнения принцип эквивалентности массы и энергии, неоспоримо доказанный экспериментами в ядерной физике. Но если специальная теория относительности достаточно проверена на опыте, то этого нельзя еще сказать об общей теории относительности. Действительно, новые эффекты, предсказываемые этой теорией, столь малы, что, обнаружив их, каждый раз приходится спрашивать себя, действительно ли это те самые эффекты, которые предсказывает общая теория относительности или же они вызваны другими неучтенными факторами. И ни чрезвычайно малое вековое смещение перигелия Меркурия, ни очень слабое отклонение световых лучей, проходящих вблизи Солнца, не могут пока служить неопровержимыми доказательствами справедливости этой теории, поскольку, хотя эти эффекты и совпадают по порядку величины с предсказываемыми теорией Эйнштейна, толкование их все же не вполне однозначно. Более убедительными кажутся эксперименты по измерению красного смещения спектральных линий, излучаемых, например, спутником Сириуса. Однако этого единственного подтверждения еще недостаточно и одно оно, без сомнения, не может служить достоверным доказательством справедливости общей теории относительности.
И тем не менее, несмотря на недостаточное экспериментальное подтверждение общей теории относительности, эта теория, созданная Эйнштейном, – впечатляющее сооружение. Она принесла в физику множество новых и плодотворных идей, научила внимательно вникать в сущность основных теоретических положений и критически относиться к очевидным и само собой разумеющимся на первый взгляд утверждениям. Благодаря самой сложности, с одной стороны, и одновременно логической стройности ее, с другой, изучение этой теории чрезвычайно полезно для всех физиков-теоретиков.
Глава V. Появление квантов в физике
1. Классическая и квантовая физика
Наступило время перейти к введению понятия квантов в физику. Однако прежде чем излагать историю появления квантов, необходимо в нескольких словах остановиться на глубоком различии между классическими, доквантовыми теориями и квантовой теорией. Общим для всех классических теорий является предположение о возможности описывать состояния физического мира, задавая точное положение отдельных его частей в трехмерном пространстве. Это положение непрерывно изменяется со временем. При этом само движение определяется характером изменения положения со временем.
Разумеется, между прежними попытками и представлениями релятивистской теории есть существенное различие. В дорелятивистской физике пространство представляет собой некоторую фиксированную область, в которой протекают все физические явления, рассматриваемые любыми мыслимыми наблюдателями в одно и то же время, абсолютное и универсальное, которое задает свой ритм всем этим наблюдателям. В теории относительности, напротив, ни пространство, ни время не имеют абсолютного характера. Абсолютен лишь четырехмерный континуум, образованный объединением пространства и времени и называемый четырехмерным миром. Каждый наблюдатель из этого четырехмерного мира разными способами выделяет свое пространство и свое время. Однако, несмотря на это существенное различие во взглядах на пространство и время, как релятивистская, так и дорелятивистская физика в равной мере исходят из предположения о том, что все физические явления независимо от их характера и природы могут быть вполне определенно и однозначно описаны в рамках трехмерного пространства и времени. Так, например, движение какой-либо частицы определяется заданием последовательности вполне определенных положений ее в различные моменты времени совершенно независимо от физической природы этой частицы, скажем, от величины ее массы. Более того, так же как и в старой классической физике, в релятивистской теории вся эволюция физических явлений определяется неумолимой игрой дифференциальных уравнений, которые однозначно предсказывают все будущее. При описании четырехмерного пространства теория относительности предполагает заданной всю совокупность событий, соответствующих любому моменту времени. И релятивистская теория лишь несовершенством человека объясняет тот факт, что наблюдатель может раскрывать события в четырехмерном мире только последовательно шаг за шагом по мере течения его собственного времени. Утверждая, что каждый наблюдатель может однозначно локализовать события в пространстве и во времени, придавая пространственный характер длительности и рассматривая любые реальные предсказания, диктуемые самим характером пространства-времени, теория относительности сохраняет в силе вплоть до самых детальных следствий генеральные идеи прежней физики. Поэтому можно сказать, что, несмотря на такой новый, почти революционный характер эйнштейновских концепций, теория относительности в определенном смысле явилась венцом именно классической физики.
Современная квантовая физика смотрит на вещи совершенно иначе. Во введении к этой книжке мы уже указали на некоторые из главных особенностей квантовой теории. Само существование кванта действия, как мы говорили, выражает своего рода взаимную связь между локализацией некоторого объекта во времени и в пространстве и его динамическим состоянием. С точки зрения классической физики эта связь представляется совершенно необъяснимой и гораздо более непонятной по следствиям, к которым она приводит, чем связь между пространственными переменными и временем, установленная теорией относительности.
Из существования этой взаимосвязи вытекает невозможность одновременного определения координаты и скорости, выражаемая на математическом языке соотношением неопределенности Гейзенберга. Это соотношение указывает на то, что нельзя в каком-либо эксперименте одновременно проводить измерения пространственно-временных координат и параметров, определяющих динамическое состояние системы.
Анализ этого сложного вопроса показывает, что с точки зрения квантовой физики пространственно-временное описание событий, принятое в классической (и даже в релятивистской) физике, должно рассматриваться лишь как приближение, справедливое только для сравнительно тяжелых тел. А под тяжелыми телами мы понимаем тела, состоящие из чрезвычайно большого числа элементарных частиц и, следовательно, обладающие полной массой, во много раз превышающей массу любой из элементарных частиц. К таким телам относятся, в частности, все используемые нами обычно в экспериментах тела. Этим и объясняется то, что при изучении крупномасштабных явлений классическая физика прекрасно могла обходиться этим пространственно-временным описанием.
Система координат, связанная с каким-либо материальным телом, и часы, синхронизованные соответствующим образом, позволяют, следуя методам классической физики, удовлетворительно описывать все макроскопические явления. Но при попытке использовать таким образом определенные пространственно-временные координаты для описания процессов, происходящих в микромире, мы сталкиваемся с соотношениями неопределенности Гейзенберга. Из этих соотношений вытекает, что понятия пространства и времени, используемые в классической физике и вполне применимые для описания макроскопических явлений, становятся неприменимыми при описании явлений атомного масштаба.
Однако мы, физики, все же упорно пытаемся описывать мир элементарных частиц с помощью прежних понятий пространства и времени, привитых нам повседневным опытом. Отсюда и трудности, возникающие при изучении квантовой теории, поэтому нам и кажется столь странным само понятие кванта действия. Быть может и окажется возможным ввести для мира атома понятия пространства и времени каким-либо более общим способом, чем это делается в классической физике. Однако эти новые понятия должны как-то отражать существование кванта действия и более тесную, чем в классической физике, связь между чисто геометрическими и динамическими понятиями. Кроме того, в случае систем, состоящих из очень большого числа элементарных частиц, т.е., иначе говоря, при описании макроскопических явлений, они должны позволить перейти к обычным понятиям пространства и времени. Интересные работы в этом направлении уже сделаны Детушем. Во всяком случае, не следует забывать о такой возможности.
Абсолютный детерминизм классической физики в значительной мере покоится на понятиях пространства и времени. Приведя к глубоким изменениям во взглядах на пространство и время, теория относительности тем не менее сохранила принцип классического детерминизма. Совершенно иначе обстоит дело в квантовой механике. Отвергая точное пространственно-временное описание явлений, во всяком случае явлений масштаба атома, она отвергает также и принцип классического детерминизма в его старом смысле.
Невозможность одновременного определения точного положения микроскопической системы и ее динамического состояния, вытекающая из существования кванта действия, приводит к тому, что никакие последовательно проводимые измерения систем атомного мира не дают возможности определить все детали процесса, позволяющие согласовать результаты этих измерений с принципом классического детерминизма.
Действительно, современная квантовая теория дает возможность определить только вероятностные законы, позволяющие по результатам первого измерения указать вероятность того, что при последующем измерении будет получен тот или иной результат. Эта замена точных законов вероятностными при описании микромира связана, конечно, с тем, что в этой области нельзя применить обычные представления о пространстве и времени. Для объектов же макромира эти представления оказываются, если так можно выразиться, асимптотически справедливыми. Вероятностный характер законов квантовой теории при этом исчезает и принимает вид достоверных однозначных законов, и принцип классического детерминизма вновь вступает в силу.
Из всего этого следует, что в теоретической физике произошел существенный переворот в тот момент, когда стала очевидна необходимость учитывать квант действия. А как все это происходило?
2. Теория излучения черного тела. Квант действия Планка
Начало развитию квантовой теории положили относящиеся к 1900 г. работы Макса Планка по теории излучения черного тела. Попытка построить теорию излучения черного тела на основе законов классической физики привела к серьезным трудностям. Объясним, прежде всего, в чем заключались эти трудности.
Рассмотрим замкнутую полость, поддерживаемую при постоянной температуре и содержащую какие-либо материальные тела, способные испускать и поглощать излучение. Если эти материальные тела имели в начальный момент какую-либо температуру, отличную от температуры полости, то с течением времени в результате процессов испускания и поглощения температура их будет стремиться к температуре полости, т.е. система будет стремиться к состоянию термодинамического равновесия, характеризуемому равновесием между поглощаемой и излучаемой в единицу времени энергией.
На основе лишь самых общих термодинамических законов Кирхгоф показал, что это состояние равновесия единственно и характеризуется определенным спектральным распределением плотности энергии излучения, заключенного в этой полости. Более того, он показал, что функция, определяющая это спектральное распределение, носит универсальный характер, т.е. совершенно не зависит ни от размеров или формы рассматриваемой полости, ни от свойств заключенных в ней материальных тел, и полностью определяется температурой полости и, разумеется, частотой. Такое равновесное излучение, характеризуемое некоторой определенной температурой, получило не совсем удачное название черного излучения, соответствующего этой температуре.
Таким образом, перед теоретической физикой встала задача найти явный вид этой функции, определяющей спектральную плотность энергии черного излучения. Сначала эту задачу пытались решить методами, опирающимися исключительно на термодинамические законы и, следовательно, гарантирующими достаточную общность и достоверность результата. При этом удалось показать, что полная плотность энергии черного излучения (т.е. энергия излучения, содержащаяся в единице объема внутренней части полости, находящейся в термодинамическом равновесии), пропорциональна четвертой степени температуры по Кельвину. Это закон Стефана – Больцмана.
Несколько позже с помощью весьма остроумного метода Вин доказал, что спектральная плотность энергии черного излучения, соответствующая данной частоте, должна быть пропорциональна произведению куба частоты на некоторую функцию, зависящую только от отношения частоты к температуре. Явный же вид этой функции установить с помощью одних только термодинамических методов Вину, к сожалению, не удалось.
Законы Стефана – Больцмана и Вина давали очень ценные сведения о функции спектрального распределения и прекрасно подтвердились экспериментом. Однако они совершенно ничего не могли сказать о конкретном характере распределения. В дальнейшем стало ясно, что с помощью одних только термодинамических методов продвинуться дальше в этом направлении не удастся. Для определения явного вида функции спектрального распределения необходимо было сделать какие-либо конкретные предположения о характере поглощения и испускания излучения – отважиться покинуть твердую почву термодинамики – и вступить на рискованный путь гипотез, касающихся атомной структуры.
На первый взгляд это не трудно было сделать, поскольку электродинамика, в частности, в том виде, который придал ей Лоренц, давала, казалось, вполне удовлетворительную модель процессов испускания и поглощения излучения материей. Оставалось лишь использовать полученные в электронной теории формулы и с их помощью определить точный закон спектрального распределения плотности энергии черного излучения. Но результат оказался совершенно неожиданным. Найденное таким образом спектральное распределение (закон Рэлея) противоречило эксперименту.
Согласно закону Рэлея спектральная плотность энергии излучения должна монотонно возрастать с увеличением частоты. В то же время эксперимент определенно указывал на то, что с увеличением частоты спектральная плотность вначале растет, а затем, начиная с некоторой частоты, соответствующей максимуму плотности, падает, стремясь к нулю, когда частота стремится к бесконечности. Иначе говоря, кривая спектральной плотности энергии имеет колоколообразный вид. Поскольку по закону Рэлея спектральная плотность оказывалась монотонно возрастающей функцией частоты, то отсюда следовал, очевидно, абсурдный вывод; полная плотность энергии черного излучения при всех температурах должна быть бесконечной!
Положение, сложившееся в результате этого расхождения между теорией и экспериментом, было очень серьезным, так как оно свидетельствовало, и многие физики это сознавали, о каком-то существенном недостатке классических теорий, непосредственным следствием которых был закон Рэлея. Легко показать (Джинс), что закон Рэлея можно получить также, применяя общие методы классической статистики к совокупности волн, заключенных внутри замкнутой полости. Все попытки получить формулу для функции спектральной плотности энергии черного излучения, отличную от формулы Рэлея и согласующуюся с экспериментом, окончились неудачей. Стало ясно, что успешно решить проблему излучения черного тела можно только, если в науку о природе будет введен какой-то совершенно новый взгляд на вещи. Честь этого революционного шага принадлежит Максу Планку.
Планк начал свое исследование, представляя вещество в виде совокупности электронных осцилляторов, т.е. электронов, колеблющихся около своего положения равновесия под действием некоторой силы, пропорциональной удалению от положения равновесия. Он поставил перед собой задачу исследования теплового равновесия, устанавливающегося в результате обмена энергией между осцилляторами и излучением. Поскольку характер спектрального распределения энергии равновесного излучения не должен зависеть от природы материальных тел, находящихся внутри полости, то полученный при таком рассмотрении результат должен носить общий характер. Применяя к этой задаче методы классической физики, Планк получил, естественно, закон Рэлея. Но, анализируя полученные результаты, ученый заметил, что неправильность закона Рэлея определяется слишком большой ролью, которую в классической картине обмена энергией между осцилляторами и излучением играют высокочастотные осцилляторы. В самом деле, именно преувеличенная роль обмена энергией между равновесным излучением и материальными осцилляторами с высокой частотой приводит к монотонному возрастанию спектральной плотности с ростом частоты и к неправильным экспериментальным следствиям или к логическим абсурдам, о которых мы упомянули выше.
Планку пришла в голову гениальная мысль, что нужно ввести в теорию некоторый новый элемент, совершенно, разумеется, чуждый классическим представлениям, который должен подавить значение осцилляторов высокой частоты, и он выдвинул знаменитый постулат: вещество не может испускать энергию излучения иначе как конечными порциями, пропорциональными частоте этого излучения. Коэффициент пропорциональности при этом есть некоторая универсальная постоянная, имеющая размерность механического действия. Это и есть знаменитая постоянная Планка h.
Введя в игру эту парадоксальную гипотезу, Планк построил теорию теплового равновесия и вывел новый закон распределения спектральной плотности энергии черного излучения, который носит его имя. Поскольку в предположениях Планка ничто не противоречило принципам термодинамики, то полученное им выражение находилось в полном согласии с законом Стефана и законом Вина. Напротив, оно существенно отличалось от формулы Рэлея, совпадая с ней только в области малых частот и высоких температур.
Для высоких частот и низких температур это выражение привело к совершенно другим результатам. Это и понятно. При низких частотах и высоких температурах в энергетическом обмене между веществом и излучением участвует большое число очень маленьких порций энергии, и таким образом с достаточной точностью можно пренебречь дискретным характером изменения энергии и считать, что она меняется непрерывно. При этом получаются, разумеется, результаты, полностью совпадающие с классическими. В случае же высоких частот и низких температур в обмене энергией участвует небольшое число сравнительно больших порций энергии и дискретность изменения энергии оказывается существенной.
Таким образом, закон спектрального распределения Планка позволяет определить область применимости закона Рэлея, ограничивая ее малыми значениями частот и высокими температурами. В области малых температур и высоких частот закон Рэлея оказывается неприменимым и необходимо пользоваться законом Планка. В противоположность закону Рэлея, который приводил к монотонному росту спектральной плотности энергии черного излучения, закон Планка указывает, что спектральная плотность энергии вначале монотонно растет с частотой, а затем, пройдя через некоторый максимум, монотонно убывает, стремясь к нулю при частоте, стремящейся к бесконечности. Кривая изменения спектральной плотности в зависимости от частоты имеет колоколообразный вид, а полная плотность энергии черного излучения, как легко показать, оказывается конечной. Таким образом, была разрешена одна из серьезнейших трудностей классической физики.
Сравнение закона Планка с результатами экспериментов, точность и число которых непрерывно возрастали, показало, что имеется полное согласие теории Планка с опытом, и позволило с большой точностью определить численное значение постоянной Планка. Выраженное в обычно используемых в физике единицах, оно оказалось чрезвычайно мало. Замечательно, что уже первое значение этой постоянной, найденное из опытов с черным излучением, было определено с большой точностью. В дальнейшем было показано, что численное значение постоянной Планка может быть найдено с помощью многих других экспериментов. И все эти измерения, проводившиеся с все большей и большей точностью, давали для постоянной h значения, очень близкие к тем, которые были найдены Планком из опытов с равновесным излучением.
В то время, когда Планк написал свои основные работы по теории черного излучения, его современники, вероятно, еще не осознали полностью всей важности совершившейся революции.
Введение предложенной Планком гипотезы казалось просто остроумным приемом, позволяющим улучшить теорию интересного, но в общем-то довольно частного явления, а отнюдь не воспринималось как гениальная мысль, которая должна привести к изменению основных концепций классической физики. Но постепенно важность идей Планка становилась все более очевидной. Теоретики стали понимать, что прерывность, вносимая гипотезой квантов, несовместима с основными положениями, лежащими в основе классической физики, и требует их полного пересмотра и можно только восхищаться гениальностью Планка, который, изучая частное физическое явление, оказался в состоянии угадать один из самых основных и наиболее загадочных законов природы. Более сорока лет прошло со дня этого замечательного открытия, но мы все еще далеки от полного понимания значения этого закона и всех его следствий. День, когда была введена постоянная Планка, останется одной из самых замечательных дат в истории развития человеческой мысли.
3. Развитие гипотезы Планка. Квант действия
При построении своей теории равновесного теплового излучения Планк исходил из предположения, что вещество представляет собой совокупность электронных осцилляторов, при посредстве которых и происходит обмен энергией между материей и излучением. Такой осциллятор представляет собой материальную точку, удерживаемую около своего положения равновесия силой. Величина этой силы возрастает пропорционально отклонению от положения равновесия, и осциллятор является механической системой, характеризуемой одним своеобразным свойством. Это свойство заключается в том, что частота колебаний осциллятора не зависит от величины его амплитуды.
Следуя Планку, определим квант энергии осциллятора как величину, равную произведению частоты этого осциллятора на постоянную h, и предположим, что при взаимодействии осциллятора с излучением он может терять или приобретать энергию только скачком, причем величина этого скачка равна соответствующему кванту энергии. Но в таком виде гипотеза квантования энергии оказывается применимой только в случае гармонических осцилляторов. Действительно, в общем случае системы, частота колебаний которой не постоянна, а зависит от амплитуды колебаний, введенное определение кванта энергии становится неоднозначным. Планк понимал необходимость дать более общую формулировку принципа квантования, применимую к любым механическим системам и совпадающую в частном случае гармонического осциллятора с приведенной выше. Он рассуждал следующим образом. Поскольку постоянная имеет размерность действия, т.е. размерность произведения энергии на время или количества движения на путь, то ее можно рассматривать как элементарное количество действия, своего рода единицу действия в атомном мире. Рассмотрим теперь механическую систему, совершающую периодическое движение и характеризуемую только одной переменной, скажем, систему, состоящую из одной частицы, совершающей периодическое движение вдоль некоторой, прямой. Для такой системы можно вычислить интеграл действия по Мопертюи, который совпадает с интегралом действия, фигурирующим в принципе наименьшего действия, взятым по полному периоду движения.
Эта величина является определенной характеристикой периодического движения. Требуя, чтобы она равнялась произведению целого числа на постоянную Планка, получаем новую формулировку принципа квантования, применимую к любому одномерному периодическому движению. Легко убедиться, что в частном случае гармонического осциллятора этот новый принцип полностью эквивалентен прежнему принципу квантования энергии. Чтобы придать принципу квантования более общую форму, Планку пришлось отказаться от первоначальной гипотезы квантования энергии и заменить ее гипотезой о квантовании действия.
То, что в общей формулировке принципа квантования фигурирует именно действие, было одновременно и естественным, и несколько странным. Естественным потому, что эта величина играет существенную роль во всей аналитической механике согласно принципу Гамильтона и принципу наименьшего действия. Это в свою очередь привело к тому, что весь аппарат аналитической механики как бы уже был готов воспринять новый принцип квантования. Странным квантование именно действия казалось потому, что с чисто физической точки зрения трудно было понять, как такая величина, как действие, носящая довольно абстрактный характер и не удовлетворяющая непосредственно никаким законам сохранения, может представлять собой характеристику дискретности процессов атомного мира.
Действие всегда выражается в виде произведения некоторых величин, имеющих геометрическую природу, на соответствующие величины, имеющие динамическую природу. Пары этих величин образуют в аналитической механике канонически сопряженные переменные. Так, интеграл, фигурирующий в принципе наименьшего действия Мопертюи, есть криволинейный интеграл от количества движения вдоль траектории. И своего рода дискретность действия, выражаемая введением постоянной Планка, указывает на наличие определенной взаимосвязи между пространством и временем, с одной стороны, и динамическими явлениями, которые мы пытаемся локализовать в этом пространстве и времени, с другой. Эта взаимосвязь носит совершенно новый характер, абсолютно чуждый концепциям классической физики. И в этом заключается глубокое и революционное значение идей, положенных Планком в основу теории равновесного излучения черного тела.
Планк исходил из предположения, что вещество может испускать излучение не непрерывно, а только отдельными конечными порциями. Это, однако, не влечет за собой однозначного предположения о дискретности структуры излучения. Можно построить две различные теории, покоящиеся на двух противоположных предположениях относительно характера поглощения излучения веществом. В основе первой, пожалуй, более последовательной и завоевавшей впоследствии всеобщее признание, лежит предположение о том, что элементы вещества, например электронные осцилляторы, могут находиться только в таких состояниях движения, которые соответствуют квантованным значениям энергии. Отсюда непосредственно следует, что как испускание, так и поглощение излучения может происходить только дискретно отдельными порциями, или квантами. Это в свою очередь необходимо влечет за собой утверждение о дискретности структуры излучения.
Смущенный этим непонятным следствием своих собственных идей, Планк долгое время пытался развивать другую, менее радикальную форму квантовой теории, в которой только испускание излучения носило дискретный характер, а поглощение оставалось непрерывным. Считалось, что вещество может непрерывно поглощать падающее на него излучение, но испускать его оно может лишь дискретно, отдельными квантами. Легко понять цель, которую Планк преследовал. Он старался защитить и сохранить прежнее представление о непрерывной природе излучения, поскольку казалось, что только в этом случае квантовая теория не будет противоречить волновой теории, нашедшей неоднократные подтверждения в многочисленных и весьма точных экспериментах.
Однако, несмотря на всю изобретательность, вложенную Планком в развитие этой формы квантовой теории, она была опровергнута дальнейшим ходом физики и, в частности, эйнштейновым объяснением фотоэффекта и успехом теории атома Бора.
4. Фотоэлектрический эффект и дискретная природа света
Открытие явления фотоэффекта и его дальнейшее изучение принесло физикам много неожиданного. Сущность фотоэффекта состоит в испускании веществом быстрых электронов под воздействием достаточно коротковолнового излучения, падающего на это вещество. При этом оказывается, и это очень существенно, что энергия испускаемых электронов совершенно не зависит от интенсивности поглощаемого излучения, а определяется только его частотой и свойствами самого вещества. От интенсивности излучения зависит только полное число испускаемых электронов. Этим простым эмпирическим законам оказалось очень трудно дать удовлетворительное теоретическое объяснение. В частности, большие трудности встретили на своем пути попытки объяснить элементарный механизм высвобождения фотоэлектрического электрона, или, как сейчас принято говорить, фотоэлектрона.
Действительно, волновая теория света, которая к 1900 г. казалась совершенно безупречной и неоспоримой, приводила к представлению о равномерном распределении энергии излучения в световой волне. Падая на электрон, световая волна непрерывно передает ему энергию, причем количество энергии, полученной электроном в единицу времени, например в секунду, согласно волновой теории должно быть пропорционально интенсивности падающей на него волны. Поэтому объяснить законы фотоэффекта казалось очень трудно.
В 1905 г. Эйнштейн высказал замечательную мысль о том, что фотоэлектрический эффект указывает на дискретное строение света, связанное с существованием квантов. Первоначально гипотеза Планка в ее наиболее смелой форме состояла в предположении, что вещество может поглощать энергию излучения только конечными порциями, пропорциональными частоте. Успех планковой теории черного излучения подтвердил справедливость этой гипотезы. Но если эта гипотеза верна, то представляется вполне вероятным, что дискретная природа света, проявляющаяся в моменты поглощения и испускания, должна сохраняться также и в остальные промежуточные моменты времени, т.е. тогда, когда излучение свободно распространяется в пространстве.
Эйнштейн допустил, что любое монохроматическое излучение состоит из совокупности квантов, причем энергия каждого кванта пропорциональна частоте, а коэффициент пропорциональности равен, разумеется, постоянной Планка. Это позволило легко объяснить законы фотоэффекта. В самом деле, электрон, находящийся внутри вещества, поглощая квант света, либо покинет вещество, либо останется внутри него. Все зависит от того, превышает ли энергия светового кванта работу, которую надо совершить электрону, чтобы покинуть вещество, т.е. как говорят, работу выхода. Следовательно, кинетическая энергия выбитого электрона будет равна энергии поглощенного светового кванта минус работа выхода.
Таким образом, кинетическая энергия испускаемых электронов должна быть линейной функцией частоты падающего излучения, а коэффициент пропорциональности численно должен быть равен постоянной Планка. Все эти выводы оказались в прекрасном соответствии с опытом. Исследования зависимости фотоэффекта от частоты падающего света показывают, что фотоэлектроны возникают лишь тогда, когда частота начинает превышать некоторое значение: порог фотоэффекта.
В области частот, превышающих пороговое значение, кинетическая энергия электронов с большой точностью оказывается линейной функцией частоты падающего света. Измерения тангенса угла наклона кривой, представляющей зависимость энергии фотоэлектронов от частоты, показали, что он численно равен постоянной Планка. С точки зрения выдвинутой Эйнштейном гипотезы интенсивность падающего света определяется, естественно, числом световых квантов, падающих в секунду на один квадратный сантиметр освещаемой поверхности. Следовательно, число фотоэлектронов, испускаемых единицей поверхности в единицу времени, должно быть пропорционально интенсивности освещения.
Таково было объяснение законов фотоэффекта, предложенное Эйнштейном в 1905 г. Эту теорию он назвал квантовой теорией света. В настоящее время кванты света называются фотонами и поэтому теория Эйнштейна получила название фотонной теории. В течение последующих тридцати лет существование фотонов было неоднократно подтверждено многими опытами. Опыты по фотоэффекту, проводившиеся со все возрастающей точностью, не только со светом, но также с рентгеновскими лучами и γ-лучами, подтвердили справедливость положений, выдвинутых Эйнштейном, и развитой им фотонной теории. Поскольку частоты, соответствующие рентгеновским и γ-лучам, сильно превышают частоту видимого света, то и энергия соответствующих квантов много больше энергии фотонов.
Таким образом, эти лучи оказываются способными вырывать не только слабо связанные электроны, находящиеся в поверхностном слое вещества, но также и внутренние электроны, прочно связанные с ядрами атомов. Поскольку изучение спектров рентгеновских лучей позволяет очень точно определить работу, необходимую для вырывания какого-либо внутреннего электрона данного атома, то измерения с рентгеновскими лучами позволяют найти работу выхода с относительной точностью, гораздо большей, чем в случае опытов со светом. Следовательно, эксперименты с рентгеновскими лучами и γ-лучами послужили еще одной серьезной проверкой правильности теоретических положений Эйнштейна. Их блестящее экспериментальное подтверждение явилось веским доводом в пользу корпускулярной теории света.
Открытие в 1923 г. еще одного явления дало новые доказательства существования фотонов. Мы имеем в виду эффект Комптона. Известно, что при падении излучения на некоторое материальное тело часть энергии излучения рассеивается во всех направлениях в виде рассеянного излучения.
Электромагнитная теория объясняла это явление следующим образом. Под действием электрического поля падающей волны электроны, входящие в состав материальных тел, начинают колебаться и, излучая, оказываются, таким образом, элементарными источниками вторичных сферических волн, распространяющихся во всех направлениях и приводящих к перераспределению энергии падающей волны. Согласно этому, если первичная волна была монохроматической, то и рассеянное излучение должно быть монохроматическим и обладать частотой, в точности равной частоте первичной волны. В течение весьма длительного времени казалось, что электромагнитная теория прекрасно объясняет не только рассеяние света материальными телами, но также и рассеяние рентгеновских лучей. Законы рассеяния, предсказываемые этой теорией, подтверждались с большой степенью точности. Но более тщательное изучение этого вопроса показало, что в опытах по рассеянию рентгеновских лучей наряду с излучением основной частоты имеется также компонента излучения с частотой, несколько меньшей, чем частота падающего излучения – факт совершенно необъяснимый с классической точки зрения. Это явление было установлено американским физиком Комптоном, который не только с достоверностью доказал существование этого нового эффекта, но также тщательно изучил законы этого явления и предложил его объяснение. Наиболее характерной особенностью открытого Комптоном явления была зависимость частоты рассеянного излучения от угла рассеяния и независимость ее от природы рассеивающего тела. Комптон и почти в то же время Дебай указали, что все основные особенности этого нового явления могут быть объяснены, если рассматривать взаимодействие между электроном и электромагнитной волной как соударение электрона с падающим квантом излучения, или фотоном.
В момент соударения между электроном и первичным фотоном происходит обмен энергией и импульсом, а поскольку электрон почти всегда можно считать неподвижным по сравнению с фотоном, то в результате такого соударения электрон приобретает, а фотон теряет энергию. Так как частота, соответствующая фотону, пропорциональна его энергии, то после соударения он должен обладать меньшей частотой, чем до соударения.
Великолепно согласующаяся с экспериментальными данными теория эффекта Комптона чрезвычайно проста и позволяет, используя лишь законы сохранения импульса и энергии, точно определить зависимость частоты рассеянного фотона от угла рассеяния. Независимость частоты рассеянного излучения от природы рассеивающего тела объясняется элементарно. Действительно, в акте рассеяния участвуют лишь падающие фотоны и электроны, свойства которых совершенно не зависят от конкретной природы вещества, в состав которого они входят.
Теория Комптона – Дебая так просто и изящно объяснила наиболее существенные особенности комптоновского рассеяния, что сразу стала еще одним блестящим доказательством справедливости фотонной теории света.
В качестве еще одного подтверждения фотонной теории можно указать, например, на эффект Рамана, открытый немного позже эффекта Комптона. Эффект Рамана заключается в изменении частоты рассеянного излучения в области видимого света. Важное отличие этого эффекта от эффекта Комптона состоит в том, что в этом случае частота рассеянного света существенно зависит от природы рассеивающего тела. Кроме того, рассеяние сопровождается также и увеличением частоты. Однако интенсивность рассеянного света с большей частотой гораздо слабее интенсивности света, рассеиваемого с уменьшением частоты. Фотонная теория очень хорошо объяснила все характерные особенности этого явления и дала простое объяснение даже преобладанию рассеяния с уменьшением частоты над рассеянием с увеличением частоты, что было совершенно не под силу классическим теориям.
Короче говоря, за тридцать лет своего существования гипотеза о дискретности природы света оказалась настолько плодотворной, что в настоящее время уже не остается сомнений в ее достоверности. Она открывает новую существенную сторону физической реальности. Но эта гипотеза встречает на своем пути также трудности и вызывает возражения, возникшие еще во времена первых работ Эйнштейна по квантовой теории света.
Прежде всего, возникает вопрос, как совместить дискретность структуры света с волновой теорией, столь неоспоримо подтвержденной многими точными экспериментами? Как совместить между собой существование неделимого кванта света и явления интерференции? В частности, как показал Лоренц, невозможно определить разрешающую способность оптических инструментов (например, телескопа), исходя из предположения о концентрации световой энергии в фотонах, локализованных в пространстве. А как объяснить с точки зрения фотонной теории те же явления интерференции?
Конечно, можно было бы предположить, что явления интерференции связаны с взаимодействием большого числа фотонов, одновременно участвующих в процессе. Но тогда интерференционные явления должны были бы зависеть от интенсивности света и в случае достаточно малой интенсивности, когда в интерференционный прибор попадает одновременно не более одного фотона, вовсе бы отсутствовали. Такой эксперимент впервые был поставлен Тейлором и привел к отрицательному результату. Опыт показал, что какова бы ни была интенсивность падающего света, интерференционная картина остается одной и той же при условии, конечно, что время экспозиции будет достаточно велико. Это указывает на то, что каждый фотон, взятый в отдельности, участвует в явлении интерференции – факт чрезвычайно странный, если считать фотоны локализованными в пространстве.
Другая трудность, которая возникает, если пытаться последовательно придерживаться гипотезы о чисто корпускулярной природе света, состоит в следующем. Самый способ, которым Эйнштейн вводит понятие кванта света, или фотона, опирается на понятие частоты, в свою очередь связанное с представлением о некотором непрерывном периодическом процессе. Чисто же корпускулярные представления об излучении как о совокупности фотонов никак не позволяют определить какую-либо периодичность, частоту. В действительности, частота, фигурирующая в определении кванта, – это частота, заимствованная у волновой теории, которая выводится из явлений дифракции и интерференции. Значит, само определение энергии фотона как произведения частоты на постоянную Планка с чисто корпускулярной точки зрения непоследовательно. Более того, оно как бы устанавливает связь между волновой концепцией света и вновь возродившейся с открытием фотоэффекта корпускулярной концепцией. Однако было бы неправильно думать, что до открытия фотоэффекта последняя не имела под собой никаких оснований.
Явления отражения света от зеркал, прямолинейность его распространения в однородных средах, да и вообще вся геометрическая оптика с ее понятием световых лучей очень естественно укладываются в баллистическую корпускулярную картину. Но теория Френеля, великолепно объяснив все эти баллистические аспекты с чисто волновой точки зрения, привела к тому, что корпускулярная картина оказалась не у дел. Открытие фотоэффекта заставило снова вернуться к представлениям такого рода, хотя, конечно, уже соотношение Эйнштейна между энергией фотона и его частотой показывало, что волновая концепция не отвергается начисто и фотонная теория должна как-то объединить волновые и корпускулярные представления таким образом, чтобы оба аспекта имели определенный физический смысл.
Наконец, следует указать еще на одну тонкость. Согласно классическим представлениям энергия материальной частицы – это величина, имеющая какое-то вполне определенное значение. В теории же излучения никакое излучение нельзя рассматривать как строго монохроматическое, поскольку оно всегда содержит компоненты, частоты которых отличаются друг от друга. Ширина этого спектрального интервала может быть очень мала, но все же всегда отлична от нуля. Этот факт Планк подчеркивал уже в первых своих работах по теории излучения черного тела. Вследствие этого соотношение Эйнштейна, приравнивающее энергию частицы света, фотона, частоте, соответствующей классической волне, умноженной на h, носит несколько парадоксальный характер, поскольку оно приравнивает одну величину, имеющую вполне определенное значение, другой, не имеющей, строго говоря, никакого определенного значения. Дальнейшее развитие квантовой механики раскрыло истинный смысл этого противоречия.
Итак, можно сказать, что фотонная гипотеза, превосходно объясняющая явления фотоэффекта и комптоновского рассеяния, не дает возможности построить последовательную корпускулярную теорию излучения. Она требует развития более глубокой теории, в которой излучение может обладать и волновым и корпускулярным аспектами, причем связь между ними должна быть установлена так, чтобы выполнялось соотношение Эйнштейна.
5. Первые приложения квантовой гипотезы
Гипотеза квантов, блестяще подтвержденная успехом теории излучения черного тела Планка и теории фотоэффекта Эйнштейна, не замедлила обнаружить свою эффективность и в других областях. Приведем несколько примеров.
Статистическая механика доказала теорему о равнораспределении энергии по степеням свободы. В общем виде ее можно сформулировать следующим образом. В механической системе, обладающей очень большим числом степеней свободы и находящейся в состоянии термодинамического равновесия при постоянной температуре, энергия теплового движения распределяется таким образом, что на каждую степень свободы приходится одинаковое ее количество.
Эта теория, совершенно строго доказанная в рамках классической статистической механики, часто очень хорошо подтверждается на опыте.
В частности, блестяще подтвердились следующие из этой теоремы выводы о средней кинетической энергии атомов и молекул в газах, а также вывод об общем характере зависимости теплоемкости газообразных тел от температуры. И тем не менее, как показало дальнейшее развитие квантовой теории, эта теорема оказывается несправедливой. Это, например, следует уже из того, что применение ее к равновесному излучению черного тела, приводит к неправильному закону спектрального распределения плотности энергии черного излучения (закон Рэлея – Джинса). И квантовая гипотеза Планка была введена, в частности, для того, чтобы обойти закон о равнораспределении энергии. Если гипотеза Планка справедлива, то она должна позволить определить также границы применимости классических законов и в других областях физики.
Рассмотрим, например, теорию твердых тел. В однородных твердых телах в отсутствие теплового движения атомы находятся в положении равновесия. При тепловом движении атомы колеблются около своих положений равновесия, причем амплитуда этих колебаний тем больше, чем выше температура тела. Согласно теореме о равнораспределении энергии по степеням свободы все атомы, входящие в состав твердого тела, должны обладать одной и той же средней энергией. Основанные на этой теореме статистической механики расчеты приводят к следующему простому и весьма общему результату: атомная теплоемкость всех твердых тел (иначе говоря, количество тепла, которое надо сообщить одному грамм-атому твердого тела, чтобы поднять его температуру на один градус) приблизительно равна шести калориям. В этом и заключается известный закон Дюлонга и Пти, экспериментально установленный ими еще до получения теоретических результатов. Этот закон так хорошо подтверждался для большинства твердых тел при обычных температурах, что химики даже использовали его для определения молекулярного веса некоторых веществ.
Однако закон Дюлонга и Пти выполняется хотя и очень часто, но не всегда. Некоторые тела, как правило, очень твердые, например алмаз, обладают атомной теплоемкостью, значение которой меньше шести. Кроме того, с понижением температуры для всех твердых тел наступает момент, когда закон Дюлонга и Пти начинает нарушаться и теплоемкость становится меньше своего нормального значения. Квантовая теория очень хорошо объяснила эти отклонения.
В общих чертах это объяснение заключается в следующем. В твердых телах атомы колеблются около своего положения равновесия с частотой, значение которой определяется массой атома и коэффициентом упругости возвращающей силы. Энергия колебаний согласно квантовой гипотезе должна быть по меньшей мере равна кванту энергии, соответствующему частоте этих колебаний. Следовательно, если температура будет настолько низка, что энергия, которую в состоянии получить атом, меньше энергии соответствующего кванта, то этот атом останется неподвижным, и, таким образом, теорема о равнораспределении энергии уже не будет иметь места. Для атомов большинства твердых тел это минимальное значение энергии достаточно мало, так что при нормальных температурах средняя энергия теплового движения оказывается много больше ее и теорема о равнораспределении энергии и, следовательно, закон Дюлонга и Пти выполняются. Однако для очень твердых тел, таких, как, например, алмаз, в которых атомы связаны между собой более жестко, величина соответствующего кванта настолько велика, что уже при нормальных температурах теорема о равнораспределении энергии не имеет места. Ясно также, что с понижением температуры для всех твердых тел рано или поздно должен наступить момент, когда энергии теплового движения будет уже недостаточно для возбуждения всех атомов, и значение теплоемкости упадет по сравнению с его нормальным значением.
Теория теплоемкостей, основанная на квантовой гипотезе, была предложена Эйнштейном и Линдеманом, а затем Дебаем, Борном и Карманом. Эта теория легко объяснила отклонения от закона Дюлонга и Пти и зависимость теплоемкостей от температуры. Более того, теория теплоемкостей оказалась применимой, mutatis mutandis, также и к газообразным телам. В частности, она позволила понять, почему внутренние степени свободы сложных молекул оказываются при низких температурах как бы «замороженными», факт совершенно необъяснимый с точки зрения классической статистической механики.
Все эти результаты были серьезным подтверждением квантовой гипотезы. Основанные на ней расчеты верхней границы непрерывного спектра рентгеновских лучей, возникающих при бомбардировке антикатода ускоренными электронами, также подтвердили ее справедливость.
Все формулы, полученные с помощью квантовой теории, содержат постоянную Планка h. Сравнение их с экспериментальными данными позволяет определить ее численное значение. Полученные всеми этими различными методами значения постоянной Планка оказались чрезвычайно близки между собой.
Итак, к 1913 г. гениальная гипотеза Планка была подтверждена многочисленными фактами. Появившаяся в это время теория атома Бора принесла ей новое, блестящее подтверждение, показав, до какой степени само строение материи связано с существованием квантов.
Глава VI. Атом Бора
1. Спектры и спектральные линии
Невозможно непосредственно изучать внутреннее строение атома, этого микромира невообразимо малых размеров, характеризуемого процессами, недоступными нашему прямому восприятию. Структура атома проявляется только косвенно в явлениях макроскопического масштаба, которые как-то связаны с его внутренним строением.
К числу этих явлений относится, в частности, излучение атомов, возбуждаемых термически или посредством внешнего электрического поля. Это излучение характеризует определенные свойства атома, поскольку оно связано с процессами, протекающими внутри него. Исследование свойств этого излучения позволяет получить некоторые сведения о внутренней структуре атома. Таким образом, изучение и классификация оптических спектров излучения различных атомов приобретает большое значение.
Эта задача, однако, отнюдь не проста, поскольку оптические спектры имеют очень сложный характер и при исследовании невидимой простым глазом инфракрасной и ультрафиолетовой частей спектра необходимо пользоваться сложной специальной аппаратурой. Однако мало-помалу, в результате тщательных и кропотливых исследований ученым удалось установить некоторые общие закономерности в характере спектров и найти эмпирические законы, которым они подчиняются. Прежде всего было замечено, что спектральные линии всех элементов можно разбить на семейства или, как говорят в физике, серии, причем структуры соответствующих серий, относящихся к различным химическим элементам, оказались очень схожи между собой. В пределах одной серии расположение различных спектральных линий имеет вполне определенный характер и может быть описано простой математической формулой.
В частности, в 1885 г. Бальмеру удалось найти формулу, описывающую распределение спектральных линий видимого спектра атома водорода, получивших название серии Бальмера. Эта формула определяет частоту, соответствующую последовательным линиям серии Бальмера, как функцию целого числа. Исследования излучения, проведенные в невидимой части спектра, показали существование серий, расположенных в ультрафиолетовой (серия Лаймана) и инфракрасной областях (серии Пашена, Бэккета, Пфунда), и в каждой из этих серий формулы, определяющие расположение спектральных линий, совершенно аналогичны формуле, полученной для серии Бальмера.
Подобные же спектральные серии, хотя и обладающие более сложной структурой, имеются не только у водорода, но и у некоторых других элементов, у щелочных металлов. В каждой такой серии расположение линий определяется формулой, аналогичной формуле Бальмера, т.е. частота, соответствующая какой-либо линии этой серии, выражается в виде разности двух слагаемых, одно из которых зависит только от номера серии и постоянно для всех линий данной серии, а второе определяется номером линии в этой серии. Такой специфический вид этой формулы и объясняет, в частности, то, что частота некоторой спектральной линии часто оказывается равной сумме частот, соответствующих каким-либо двум другим линиям спектра. Этот факт был установлен экспериментально и позволил Ритцу открыть общий закон, носящий название комбинационного принципа и ставший основой всей современной спектроскопии.
Комбинационный принцип можно сформулировать следующим образом: для каждого атома возможно найти последовательность чисел, называемых спектральными термами этого атома, таких, что частоты всех спектральных линий данного атома будут выражаться в виде разности двух каких-либо спектральных термов. Как аддитивные свойства частот, так и соотношения, определяющие расположение спектральных линий в различных сериях, легко могут быть получены из комбинационного принципа. Справедливость его можно считать неоспоримо подтвержденной многочисленными экспериментальными данными. Но обоснование его связано с разгадкой строения атома и должно объяснить, как и какими именно процессами перестройки внутренней структуры атома вызывается излучение волн с частотой, соответствующей какой-либо спектральной линии. Таким образом, перед теоретической физикой встала важная и неотложная задача теоретического обоснования комбинационного принципа Ритца.
К сожалению, классическая теоретическая физика оказалась совершенно неспособной объяснить полученные эмпирическим путем законы, которым подчиняются атомные спектры. Действительно, для объяснения спектров излучения в рамках классической электродинамики необходимо допустить внутри излучающего вещества наличие колеблющихся заряженных частиц. Например, можно предположить, что атомы вещества содержат электроны, которые в нормальном состоянии, когда нет излучения, неподвижны и находятся в равновесии, но под воздействием каких-либо внешних причин могут начать колебаться около своего положения равновесия. Однако получаемые при этом спектральные законы находятся в вопиющем противоречии с опытными данными. Именно об этом поражении классической физики писал в 1905 г. Анри Пуанкаре: «На первый взгляд изучение спектров приводит нас к мысли о гармониках, с которыми мы уже встречались в акустике. Однако имеется существенное различие: не только волновые числа не кратны одной и той же величине, но мы не находим здесь также никакой аналогии с корнями тех трансцендентных уравнений, к которым так часто приводят задачи математической физики, такие, как, например, задача о колебаниях тела определенной формы или задача о колебаниях Герца в резонаторе или, наконец, задача Фурье об охлаждении твердого тела. Эти законы проще, но они имеют совершенно иную природу… В этом не отдавали себе отчета, и я думаю, что здесь и кроется один из важнейших секретов природы».
«И я думаю, что именно здесь кроется один из важнейших секретов природы». Фраза поистине пророческая, если вспомнить, что она была написана за десять лет до появления теории Бора. И, действительно, теория Бора выяснила истинное значение спектральных законов и объяснила, как эти законы отражают квантовый характер внутриатомной структуры. Эта теория позволила заглянуть внутрь атома и показала, что как сама структура атома, так и устойчивость этой структуры неразрывно связаны с существованием квантов. Без квантов материя не могла бы существовать. В этом и заключается великий секрет, о котором говорил Пуанкаре.
2. Теория Бора
Теперь, наконец, мы можем рассказать о замечательной квантовой теории атома, которая была развита Бором в 1913 г. В это время физики склонялись к планетарной модели атома. Согласно этой модели атом состоит из находящегося в центре тяжелого положительно заряженного ядра, в котором сосредоточена почти вся масса атома и электронов-планет, вращающихся вокруг ядра. Справедливость этой модели, предложенной впервые Перреном, была подтверждена опытами Резерфорда, который показал, что внутри атома действительно находится ядро, обладающее положительным зарядом и чрезвычайно малыми размерами. К сожалению, однако, эта планетарная модель находилась в противоречии с выводами классической электродинамики, касающимися излучения ускоренно движущихся заряженных частиц. Действительно, эксперимент показывал, что спектры излучения атомов состоят из почти монохроматических линий, соответствующих некоторым неизменным частотам. Отсюда согласно классической физике с неизбежностью следовало, что в нормальном состоянии электроны, входящие в состав атома, должны быть неподвижны и находиться в состоянии устойчивого равновесия.
Выведенный воздействием каких-либо внешних причин из состояния равновесия, электрон начинает колебаться около положения равновесия, излучая при этом электромагнитную волну вполне определенной частоты. Постепенно, по мере того как его кинетическая энергия будет переходить в энергию излучения, амплитуда колебаний электрона будет уменьшаться, пока в конце концов не обратится в нуль, и электрон не вернется снова в исходное положение равновесия. Таким образом, можно было бы одновременно объяснить и наличие в спектре монохроматических линий и устойчивость атомной системы. Но планетарная модель атома не допускала такого объяснения, так как в этой модели предполагали, что электроны вращаются, подобно планетам, по кеплеровым орбитам вокруг центрального ядра и имеют частоту обращения, зависящую от их кинетической энергии и изменяющуюся вместе с ней. Поэтому если классическая теория излучения применима к внутриатомным электронам, то электроны-планеты должны постепенно терять энергию, излучая волны непрерывно меняющейся частоты, и в конце концов упасть на ядро и нейтрализовать его. Таким образом, в рамках классической теории планетарная модель не позволяла объяснить ни монохроматический характер спектральных линий, ни устойчивость атомной системы. Таковы были трудности, с которыми столкнуться Нильс Бор в начале своих исследований.
Громадная заслуга Бора состоит именно в том, что он ясно понял, что нужно сохранить планетарную модель атома, введя в нее фундаментальные идеи квантовой теории. В соответствии с этой теорией среди бесконечного множества всевозможных движений, допускаемых классической механикой, только некоторые квантованные движения оказываются устойчивыми и обычно осуществляются в природе. Для систем, совершающих одномерное периодическое движение, это условие квантования было введено Планком. Обобщение же этого условия на случай периодического движения, определяемого более чем одним параметром, к тому времени, когда Бор написал свои первые работы, еще не было известно. Бор предположил, что движение атомных систем должно быть квантованным, т.е. должно подчиняться некоторым условиям или, как иногда говорят, правилам квантования. Следовательно, каждый атом должен обладать некоторой последовательностью квантованных, или стационарных состояний. Если атом изолирован и образует замкнутую систему, то каждое из этих стационарных состояний характеризуется некоторым квантованным значением энергии. Таким образом, каждый вид атома характеризуется последовательностью квантованных значений энергии, соответствующих возможным различным стационарным состояниям. Иначе говоря, атому каждого элемента соответствует последовательность чисел, определяющих энергию различных состояний, в которых этот атом может находиться.
Придя к этому моменту в рассуждении, легко видеть, что полученная картина обнаруживает замечательную аналогию с существованием спектральных термов, вытекающим из комбинационного принципа. Чтобы получить квантовую интерпретацию спектральных термов и закона Ритца, достаточно лишь предположить, что частоты, соответствующие различным спектральным линиям атома, всегда пропорциональны разности двух квантованных значений его энергии, отвечающих разным стационарным состояниям. Бор прекрасно видел, что это последнее предположение совершенно естественно в квантовой теории атома. Действительно, так как различные квантовые состояния атома устойчивы, то ни в одном из этих состояний атом не должен излучать. Вывод, очевидно, прямо противоположный выводу классической электродинамики, согласно которой электроны-планеты, движущиеся с ускорением, должны были бы непрерывно излучать электромагнитные волны.
Итак, только переход атома из одного стационарного состояния в другое с изменением энергии сопровождается излучением. Бор предположил, что каждая спектральная линия соответствует мгновенному переходу атома из одного квантового состояния в другое, характеризуемое меньшим значением энергии. Избыток энергии уносится излучением. При этом в квантовой теории вполне естественно считать, что энергия излучается в виде отдельных квантов, или фотонов.
Таким образом, при переходе атома из одного стационарного состояния в другое он испускает фотон, энергия которого равна разности энергий начального и конечного состояний атома. Отсюда непосредственно следует так называемое правило частот Бора: частота спектральной линии, соответствующей переходу атома из некоторого состояния A в состояние B, равна разности энергии атома в состояниях A и B, деленной на постоянную Планка h.
Согласно этому правилу частот спектральные термы атома равны энергиям стационарных состояний этого атома, деленным на постоянную Планка. Тем самым становится понятным комбинационный принцип Ритца.
Итак, Бор построил свою квантовую теорию атома на двух основных положениях: 1) атом обладает последовательностью стационарных состояний, соответствующих движениям, удовлетворяющим условиям квантования Планка, и только эти состояния могут быть физически реализованы; 2) спектральное излучение может испускаться лишь при переходе атома из одного стационарного состояния в другое, причем частота этого излучения определяется вышеуказанным правилом частот. Задача заключалась теперь в определении энергий стационарных состояний различных атомов. Самым простым, очевидно, был случай атома водорода, атомный номер которого равен единице. В этом случае атом обладает всего одним единственным электроном-планетой, описывающим вокруг ядра кеплеровскую траекторию. Но даже для этого наиболее простого случая поставленная задача не была полностью решена в первых работах Бора. Это объяснялось тем, что кеплеровское движение не одномерное, а определяется двумя переменными, например величиной радиус-вектора и азимутальным углом электрона-планеты. Правила же квантования для двухмерного движения к тому времени еще не были известны. Бор обошел эту трудность, предположив, что движение чисто круговое, т.е. считая величину радиус-вектора постоянной. В этом случае движение будет целиком определяться, очевидно, только одной переменной, азимутальным углом, т.е. становится одномерным, для которого правила квантования были известны. Приравнивая интеграл действия, взятый по полному периоду движения, произведению постоянной Планка на целое число, Бор нашел выражение для энергий, соответствующих стабильным различным состояниям, как функцию целого числа, изменяющегося от единицы до бесконечности. Разделив полученное выражение для энергии на h, найдем спектральные термы атома водорода и, следовательно, частоты спектральных линий различных серий. Отсюда непосредственно следуют формулы Бальмера и аналогичные формулы для серий Лаймана, Пашена и т.д. При этом находится не только общий вид этих формул, но и все входящие туда постоянные. Например, в формулу Бальмера и аналогичные ей входит некоторая постоянная, называемая постоянной Ридберга, значение ее известно с большой степенью точности из нескольких спектральных измерений. Теория Бора позволяет получить выражение для постоянной Ридберга через универсальные физические постоянные: заряд электрона, его массу и постоянную Планка. Таким образом, эта теория позволяет теоретически вычислить значение постоянной Ридберга. Найденное при этом значение блестяще согласуется со значением, полученным на основании спектроскопических измерений. Это было большим успехом теории Бора и указывало на плодотворность развитых им идей.
Однако Бор этим не ограничился и распространил свою теорию на случай ионизованного атома гелия. Гелий занимает второе, после водорода, место в таблице Менделеева, где все элементы расположены в порядке возрастающего атомного веса. Его атомный номер равен двум, и согласно планетарной модели гелий состоит из ядра, заряд которого равен удвоенному заряду протона, и двух электронов-планет.
С математической точки зрения определение квантованных движений атома гелия представляет собой весьма сложную задачу, поскольку мы имеем здесь не два, а три тела. Однако для однократно ионизованного атома гелия, т.е. для атома, потерявшего под действием каких-либо внешних причин один из своих электронов, мы снова возвращаемся к проблеме двух тел, и все существенно упрощается. Для однократно ионизованного атома гелия задача сводится к рассмотренной в случае водорода с той лишь разницей, что заряд ядра в этом случае в два раза больше. Так Бор показал, что расположение спектральных линий в спектре однократно ионизованного гелия нужно описывать соответственно формулами Бальмера и другими, аналогичными, в которых вместо постоянной Ридберга должно стоять произведение этой постоянной на четыре. Это позволило установить, что серия Пиккеринга, открытая в спектрах некоторых звезд и неправильно приписанная ранее водороду, принадлежит однократно ионизованному гелию. Таким образом, квантовая теория атома помогла разобраться в некоторых опытных данных, толкование которых оставалось до тех пор сомнительным.
Наконец, теория Бора объясняла еще один, хотя и не столь существенный, но весьма странный на первый взгляд факт. Дело в том, что постоянная Ридберга, определенная из спектральных измерений с однократно ионизованным гелием, имела значение, хотя и весьма близкое, но все же в пределах точности эксперимента, отличное от того, которое было найдено из измерений с водородом (с учетом, конечно, четверки, о которой мы упоминали выше). Бор указал, что причина этого расхождения кроется в необходимости учитывать движения ядер водорода и гелия, имеющих различные массы.
Простейший вариант теории, исходящий из предположения о неподвижности ядра, является лишь первым приближением, тем более точным, чем больше отношение массы ядра к массе электрона. Поэтому для получения точных выражений нужно учесть движение ядра, совершающееся под влиянием сил, действующих со стороны электрона. Действительно, проведенный Бором более точный расчет, позволил получить соответствующие поправки, пропорциональные отношению массы электрона к массе ядра. А так как масса ядра гелия примерно в четыре раза превышает массу ядра водорода, то и поправка оказалась для водорода заметно отличающейся от той, которая возникает в случае гелия. Исправленные значения постоянной Ридберга блестяще совпали с определенными экспериментально. Таким образом, расхождение в численных значениях этой постоянной, полученное из опытов с гелием и водородом, было объяснено.
Теория атома, развитая Бором, позволила также, по крайней мере в общих чертах, понять структуру оптических спектров и других элементов. Однако при попытке непосредственно распространить расчеты Бора на атомы, обладающие большим числом электронов, мы сталкиваемся с серьезными трудностями, поскольку, с одной стороны, задача определения движения электронов чрезвычайно усложняется, а то и вовсе становится неразрешимой, а, с другой стороны, сами правила квантования движения в этом случае представляются сомнительными. И, тем не менее глубокая аналогия, существующая между спектрами различных элементов, свидетельствует об их единой природе и позволяет надеяться, что метод, увенчавшийся столь блестящими успехами в случае атома водорода, может быть обобщен на случай атомных систем, состоящих из большого числа электронов.
В частности, следуя теории Бора, можно предложить, например, следующий, правда весьма приближенный, метод решения этой проблемы. Пусть имеем некоторый атом с атомным номером, равным N. Будем считать, что ядро и N–1 электронов образуют систему, эквивалентную некоторому эффективному ядру, в поле которого движется N-й электрон. Иначе говоря, влияние ядра и всех остальных N–1 электронов сводится в первом приближении к созданию некоторого эффективного кулонова поля. Переходы N-го электрона из одного стационарного состояния в другое и определяют оптический спектр этого элемента. Таким образом, для спектральных термов мы получаем выражения, подобные тем, которые были получены в случае водорода. Это и объясняет, правда довольно грубо, наблюдаемую на опыте аналогию между оптическими спектрами различных элементов.
Теория Бора позволила также понять происхождение рентгеновских спектров, являющихся, подобно оптическим спектрам, характеристикой внутриатомной структуры. Не желая вдаваться в детальное обсуждение этого вопроса, отметим лишь, что идеи Бора позволили понять природу одного из основных законов, которому подчиняются рентгеновские спектры атомов – закона Мозли. Подобно оптическим спектрам, рентгеновские спектры также делятся на серии, общая структура которых одинакова для всех химических элементов. После того как фон Лауэ, Фридрих и Книппинг в 1912 г. открыли явление дифракции рентгеновских лучей в кристаллах, позволившее точно определить длину волн рентгеновского излучения, молодой английский ученый Мозли обратил внимание на тот факт, что смещение рентгеновских спектров различных элементов на шкале частот с достаточной точностью прямо пропорционально квадрату их атомного номера. Иначе говоря, частота какой-либо определенной линии некоторого элемента в четыре раза меньше частоты соответствующей линии элемента с удвоенным атомным номером. Из выражения для частот, полученного с помощью теории Бора, легко видеть, что, во всяком случае в первом приближении, частоты всех линий рентгеновских спектров действительно должны быть примерно пропорциональны квадрату атомного номера элемента. Закон Мозли нашел свое объяснение, и таким путем теория атома Бора оказалась применимой во всех областях спектра.
3. Развитие теории Бора. Теория Зоммерфельда
В своем математическом выражении теория Бора обладала одним серьезным недостатком. Действительно, даже в наиболее простом случае атома водорода, она позволяла найти энергию стационарных состояний лишь для чисто кругового движения. Причина этого заключалась в отсутствии необходимых методов квантования, поскольку метод квантования действия, предложенный Планком, годился лишь для одномерного движения. Поэтому для дальнейшего развития теории Бора необходимо было найти методы квантования, применимые в общем случае многомерного движения.
Эта задача была решена в 1916 г. почти одновременно Вильсоном и Зоммерфельдом. Они обратили внимание на то, что все механические системы, рассматриваемые в квантовой механике, относятся к классу квазипериодических систем с разделяющимися переменными. Системы такого рода характеризуются периодическим изменением всех переменных, хотя величины этих периодов, вообще говоря, отличны друг от друга. Более того, надлежащим выбором этих переменных интеграл действия удается разбить на ряд интегралов, каждый из которых зависит только от одной переменной. Проводя в каждом из этих интегралов интегрирование по полному периоду соответствующей переменной и приравнивая каждый из них произведению постоянной Планка на целое число, получаем, очевидно, условия квантования для случая систем со многими степенями свободы. В частном случае одной степени свободы они переходят, как легко видеть, в условие квантования Планка.
Метод квантования Вильсона – Зоммерфельда, который мы только что описали в общих чертах, позволяет в принципе разрешить все задачи, стоящие перед теорией атома Бора. Практически же в случае более или менее сложного атома задача, как и прежде, остается, строго говоря, неразрешимой. Но это связано уже не с отсутствием необходимых правил квантования, а с математическими трудностями, возникающими при решении уравнений движения.
Зоммерфельд использовал предложенный им метод для решения более сложных задач теории атома, которые оказались не под силу ранней теории Бора. Прежде всего, он показал, что учет эллиптичности электронных орбит в атоме водорода не изменяет выражений для энергии различных стационарных состояний и, следовательно, абсолютно не сказывается на результатах, полученных Бором. Далее он показал, что более строгий учет движения электронов приводит к замене формул типа Бальмера другими, более точно описывающими истинное расположение спектральных линий оптического спектра и совпадающими с найденными ранее эмпирическими формулами Ридберга и Ритца.
Но наибольший успех завоевала, разумеется, его теория тонкой структуры линий. Тщательное изучение спектра водорода, проведенное с помощью спектрографов, обладающих высокой разрешающей способностью, показало, что некоторые спектральные линии оказываются не простыми, а имеют более тонкую структуру и сами состоят из ряда очень близко друг от друга расположенных линий. Однако формулы Бальмера и другие, теоретически найденные Бором, не учитывали этой тонкой структуры линий. Тогда Зоммерфельд высказал предположение, что тонкая структура спектральных линий связана с релятивистскими эффектами и для учета ее необходимо вместо уравнений Ньютона воспользоваться уравнениями релятивистской механики Эйнштейна. И действительно, проведенные им расчеты показали, что учет релятивистских поправок приводит к расщеплению некоторых энергетических уровней. Иначе говоря, некоторые спектральные термы водорода, найденные Бором, распадаются на два, хотя и очень близких между собой, но все же отличных друг от друга спектральных терма. Это, очевидно, и объясняет явление тонкой структуры. Вычисленное Зоммерфельдом значение разности частот, соответствующих линиям дублета серии Бальмера, оказалось в достаточно хорошем согласии с экспериментальными данными.
Обнадеженный этими успехами Зоммерфельд попытался также объяснить тонкую структуру рентгеновских спектров, что имело еще большее значение, чем интерпретация оптических спектров, поскольку в рентгеновских спектрах наблюдаются дублеты, легко разрешимые для всех элементов таблицы Менделеева. Некоторые из этих дублетов, называемые правильными дублетами, обнаруживают по мере перехода от одного элемента к другому, определенные закономерности. В частности, разность частот, соответствующая линиям одного дублета, быстро растет с увеличением атомного номера элемента, приблизительно как его четвертая степень. Обращение к релятивистским уравнениям движения вместе с найденными им условиями квантования позволило Зоммерфельду объяснить как причину возникновения этих дублетов, так и указанную выше зависимость разности частот от атомного номера. В частности, расположение дублетов серии L очень хорошо описывалось полученными им формулами.
Замечательные результаты, полученные Зоммерфельдом и опубликованные в 1916 г., явились полным подтверждением справедливости как квантовых методов, так одновременно и релятивистской динамики и привлекли к квантовой теории всеобщее внимание. Но более глубокий анализ этой теории обнаружил в ней много недостатков. В частности, последовательное применение используемых в этой теории (которая в настоящее время известна как старая квантовая теория) принципов и методов встречает на своем пути определенные трудности принципиального характера. Но даже безотносительно к этим трудностям общего характера теория Зоммерфельда может вызывать возражения более частного порядка.
Прежде всего, тонкая действительная структура оптического и рентгеновского спектров носит более сложный характер, чем это следует из теории Зоммерфельда. Полученная им картина спектральных линий, хотя и более полная, чем у Бора, все же гораздо беднее той, которая наблюдается в действительности. Это оказывается очень серьезной трудностью, ибо теория Зоммерфельда не оставляет места для введения этих дополнительных термов, существование которых неоспоримо доказано экспериментом. Полнота и общность используемых методов не допускают, казалось бы, дальнейшего обобщения теории. Правда, Зоммерфельду удалось учесть эти дополнительные термы, введением некоторого дополнительного квантового числа, названного им внутренним квантовым числом. Однако оно было введено весьма искусственно и никак не следовало из самой теории. Только сделанное позже открытие собственного магнитного момента электрона позволило оправдать и объяснить введение этого нового квантового числа.
Таким образом, теория Зоммерфельда оказалась неспособной дать достаточно полное объяснение тонкой структуры спектральных линий. Но предсказание ее относительно дублетов в оптической и рентгеновской областях спектров, казалось, полностью оправдалось. К сожалению, проведенный позднее тщательный анализ структуры спектров показал, что совпадение не такое уж хорошее. Оказалось, что каждое устойчивое состояние атома характеризуется целой совокупностью квантовых чисел. Если это учесть, то мы приходим к следующему несколько странному выводу: теория Зоммерфельда точно предсказала дублеты серии Бальмера и рентгеновских спектров. Однако действительное положение их не совпадало с тем, которое следовало из теорий. Невозможно было приписать успех теории Зоммерфельда просто счастливой случайности и все же чувствовалось, что в этой теории что-то не так. Лишь теория Дирака, приняв во внимание новые свойства электрона, поставила все на свои места, сохранив все главные результаты теории Зоммерфельда. Таким образом, выяснилось, что направление мысли этого замечательного физика было совершенно правильным. Но в то время, когда он развивал свою теорию, квантовые представления, с одной стороны, и наши знания об электроне, с другой, не были еще достаточно полны для того, чтобы позволить ему окончательным образом завершить свое построение.
4. Теория Бора и строение атомов
Главным моментом теории Бора было утверждение, что электроны внутри атома могут находиться только лишь в стационарных состояниях, соответствующих определенным квантованным значениям энергии. Значит, существуют определенные энергетические уровни, на которых как-то располагаются различные электроны атома. Полное число элементов равно, как известно, 92. Атом каждого последующего элемента содержит на один электрон больше, чем атом предыдущего.
Таким образом, по мере возрастания атомного номера структура электронных оболочек соответствующих атомов все более и более усложняется. Знание этой структуры позволяет определить все химические и физические свойства этих элементов. Еще задолго до возникновения квантовых теорий русский химик Менделеев расположил все известные к тому времени элементы в таблицу по возрастающему атомному весу, т.е. почти точно в порядке возрастания их атомного номера. При этом он обнаружил определенную периодичность в химических свойствах расположенных таким образом элементов. Иначе говоря, свойства элементов, разделенных в этой таблице некоторыми регулярными интервалами, оказываются во многом подобными.
Однако эта периодичность не совершенно строгая. Так, например, величина периода увеличивается по мере продвижения к концу таблицы Менделеева, а сама периодичность зачастую обнаруживает нерегулярные отклонения. Все это указывает на то, что физическая природа этой периодичности отнюдь не проста. Тем не менее, периодичность свойств существует и настоящая теория атома должна объяснить ее. Чтобы объяснить эти закономерности, теория Бора была дополнена еще одним и, как мы в дальнейшем убедимся, очень важным правилом, по которому на одном энергетическом уровне может находиться лишь ограниченное число электронов, т.е. энергетические уровни как бы насыщаются электронами. Это было поистине новое и неожиданное свойство квантовых систем, глубокое содержание которого стало ясно значительно позже.
Пользуясь постулатом о насыщении уровней и опираясь на весьма общий физический принцип, согласно которому устойчивое состояние системы есть состояние с минимальной энергией, можно легко понять природу замеченной Менделеевым периодичности свойств различных элементов. В самом деле, если бы не существовало насыщения уровней, то в нормальном стабильном состоянии атома какого либо элемента все электроны находились бы на самом низшем уровне, соответствующем наименьшей энергии. Однако из-за насыщения уровней такая ситуация невозможна.
Когда по мере увеличения атомного номера, мы переходим от одного элемента к другому, новый электрон, который добавляется к структуре атома, обычно занимает место на уровне с наименьшей энергией, который еще не насыщен, или, как часто говорят, на уровне с наименьшей энергией, где еще есть свободное место. Как только низший уровень оказывается заполненным, электроны начинают располагаться на следующем, более высоком, пока его также не заполнят целиком. Затем наступает очередь следующего уровня и так далее. Таким образом, двигаясь по таблице Менделеева в направлении возрастания атомного веса элементов, мы можем заметить, как постепенно один за другим заполняются все низшие энергетические уровни. Здесь следует сделать одно существенное замечание. Тонкая структура спектральных линий указывает на то, что энергетические уровни внутриатомных электронов расщепляются на ряд очень близко расположенных подуровней. Электроны, заполняющие эти подуровни и обладающие, следовательно, почти одинаковой энергией, образуют, как говорят, оболочку.
Итак, заполняя один за другим все последующие уровни, электроны образуют постепенно различные оболочки. По мере построения одной и той же оболочки химические свойства элементов меняются вполне определенным образом. Как только эта оболочка оказывается заполненной, начинается построение следующей. Это построение протекает почти таким же образом, и химические свойства элементов в общих чертах повторяются. Следовательно, наблюдаемая при движении по таблице Менделеева периодичность свойств находит себе совершенно естественное объяснение. Различное число подуровней и, следовательно, различное число электронов, необходимых для заполнения той или иной оболочки, объясняет отмеченные выше вариации периода. Это объяснение изменения величины периода, характеризующего повторяемость химических свойств различных элементов, с помощью модели заполняющихся оболочек было предложено вначале Косселем, а затем более детально развито Бором, Стонером и Смитом.
Распределение электронов внутри отдельных оболочек и уровней тесно связано со структурой рентгеновских спектров. Действительно, согласно теории Бора их возникновение объясняется следующим образом. Пусть под влиянием каких-либо внешних причин один из электронов внутренней оболочки удален со своего уровня. Тогда в этой оболочке окажется одно свободное место, на которое теперь может перейти один из электронов внешней оболочки, обладающий, следовательно, большей энергией. Избыток этой энергии будет унесен испускаемым при таком переходе гамма-квантом. Это излучение и приводит к рентгеновским спектрам.
Таким образом, уже отсюда совершенно ясно, какое огромное значение для изучения внутреннего строения атома и структуры уровней играет детальное исследование и классификация этих спектров. В частности, можно сказать, что именно анализ рентгеновских спектров различных элементов позволил неопровержимо доказать справедливость важного принципа насыщения энергетических уровней, значение которого мы уже подчеркивали.
Гипотеза Бора о существовании квантовых энергетических уровней, а равным образом и его общая картина внутреннего строения атомов различных элементов хорошо подтвердились опытами по ударной ионизации. Явление ионизации при помощи удара, или ударной ионизации, состоит в отрыве одного из внутриатомных электронов в результате соударения атома с каким-либо другим телом, скажем, с другим атомом. При этом, чем глубже уровень, на котором находится электрон, тем большую энергию надо затратить для его удаления. Эта энергия носит название энергии ионизации данного атома. Представим себе пучок частиц с некоторой заданной энергией, падающий на газовую мишень. Тогда в результате соударений этих частиц с атомами газа будет происходить ионизация атомов, причем из них будут вырываться только те электроны, энергия ионизации которых меньше энергии падающих частиц, т.е. при малой скорости падающих частиц электроны будут вырываться только с верхних уровней. Картина почти не будет меняться при увеличении энергии частиц, но только до тех пор, пока последняя не возрастет настолько, чтобы оказался возможным отрыв электронов, находящихся на следующем, более глубоком уровне. Так с ростом энергии постепенно будут вступать в игру все более и более глубокие уровни, причем картина будет носить ясно выраженный скачкообразный характер. Таким образом, эксперименты с ударной ионизацией позволяют в принципе определить расположение различных энергетических уровней.
Действительно, результаты опытов, поставленных Франком и Герцем, не только подтвердили существование энергетических уровней, но и оказались также в хорошем соответствии с данными о расположении этих уровней в различных атомах, полученными на основании спектроскопических измерений.
5. Критика теории Бора
Того, что было сказано в этой главе, вполне достаточно, чтобы понять все значение атомной теории Бора. Рождение ее ознаменовало новый важный этап в развитии современной физики. Уже с самого начала теория позволила понять природу атомных спектров и объяснить в общих чертах законы, которым они подчиняются. Дополненная затем общими правилами квантования, она приняла в каком-то смысле законченный вид и оказалась способной объяснить большое число новых явлений атомного мира.
Тем не менее, эта теория все же обладала некоторыми недостатками. Мы не собираемся говорить здесь о тех неудачах, которые постигли ее, например, при попытке Зоммерфельда объяснить наблюдаемую экспериментально тонкую структуру спектров или о противоречии с опытом, к которому после долгих вычислений пришел Крамерс, когда он хотел применить методы старой квантовой теории, чтобы теоретически определить потенциал ионизации нейтрального атома гелия. Хотя эти неудачи и не предвещали ничего хорошего, но речь пойдет не о них. Первоначальные концепции Бора встречают возражения гораздо более общего характера, свидетельствующие о неудовлетворительности старой квантовой теории. Остановимся в нескольких словах на наиболее существенных из этих возражений.
Прежде всего, теория Бора оказалась совершенно неспособной окончательно уточнить природу излучения, возникающего при переходах внутриатомных электронов из одного стационарного состояния в другое. Разумеется, она позволяет определить частоту излучения. Однако для полного описания процесса этого еще недостаточно. Необходимо знать также интенсивность излучения и его поляризацию. Но на эти вопросы теория Бора не дает никакого ответа. И в этом смысле она оказывается гораздо более несовершенной, чем классическая теория излучения. Бор отлично сознавал этот недостаток своей теории и попытался устранить его, предложив в 1916 г. известный принцип соответствия.
Но даже помимо этого у теории Бора есть еще слабые места. В частности, в ней одновременно используются чисто классические понятия и формулы и квантовые. Так, например, вначале внутриатомные электроны рассматриваются как материальные точки (как они понимаются классической механикой), движущиеся под действием кулоновых сил по вполне определенным орбитам, а атом представляется в виде миниатюрной солнечной системы чрезвычайно малых размеров. Затем в эту чисто классическую схему извне вводятся совершенно чуждые ей условия квантования и утверждается, что среди бесконечного многообразия различных траекторий, не противоречащих уравнениям классической динамики, устойчивы и физически реализуются лишь те из них, которые удовлетворяют условиям квантования.
Следовательно, изменение состояния атома может произойти лишь в результате внезапного перехода, сопровождаемого потерей энергии и излучением, описать который в рамках чисто классических представлений оказывается невозможно. В промежутках же между этими переходами атом находится в устойчивом состоянии, иначе говоря, в одном из стационарных состояний, где он как бы совершенно ничего не знает о существовании внешнего мира, ибо в противном случае по законам электродинамики он должен был бы непрерывно терять энергию на излучение электромагнитных волн. Все это уже никак не согласуется с классическими концепциями, служившими в определенной степени отправной точкой теории Бора. И очевидно, что подобную теорию, принимающую за основу совокупность определенных понятий, а в дальнейшем их начисто отвергающую, никак нельзя считать вполне удовлетворительной и внутренне непротиворечивой.
И наконец, вся эта динамическая картина, которая вначале была введена, все эти точечные электроны, описывающие некоторые траектории, в каждой точке которых они обладают вполне определенными значениями координат и скорости, оказались нужны лишь для вычисления энергии стационарных состояний и соответствующих спектральных термов. Причем только они могут быть сравнены с экспериментальными данными, полученными из спектроскопических измерений и опытов по ударной ионизации.
Не попытаться ли представить себе, что это описание, слишком подробное и искусственное, эти формы орбит и значения координат и скоростей электронов не соответствуют никакой физической реальности и только энергия стационарных состояний, которую в конце концов дает нам вся эта квантовая небесная механика, имеет реальный физический смысл?
Как это часто бывает, сам гениальный создатель квантовой теории атома первый заметил и подчеркнул слабости предложенной им теории. Он первый указал на искусственность планетарной модели, на своеобразие и новизну понятий стационарных состояний и переходов из одного состояния в другое и на невозможность последовательного введения этих понятий в обычных рамках пространства и времени и, наконец, на необходимость поисков новых путей, кардинально отличных от прежних. Его принцип соответствия указывал на одно из таких новых направлений. А несколько лет спустя один из учеников Бора, Вернер Гейзенберг, следуя идеям своего учителя, создал новую замечательную теорию квантов – квантовую механику.
Глава VII. Принцип соответствия
1. Трудность согласования квантовой теории и теории излучения
Электромагнитная теория, дополненная теорией электронов Лоренца, дает совершенно ясную и точную картину излучения, испускаемого системой движущихся зарядов. Если заданы структура и закон движения системы электрических зарядов, то можно точно вычислить частоты, интенсивности и поляризацию излучения. Для этого поступают следующим образом. Во-первых, в прямоугольной системе координат вычисляют компоненты вектора электрического момента системы, который в каждый момент времени определяется положением всех зарядов системы. Эти компоненты зависят от времени и по общим математическим теоремам о разложении в ряд или интеграл Фурье могут быть представлены в виде суммы (конечной или бесконечной), каждый член которой гармонически зависит от времени. Согласно электромагнитной теории система будет испускать излучение со всеми теми частотами, которые фигурируют в этом разложении Фурье. Кроме того, излучение одной из этих частот с электрическим вектором, параллельным одной из координатных осей, имеет интенсивность, которая определяется коэффициентом, соответствующим данной частоте в разложении Фурье, той компоненты электрического момента, которая параллельна рассматриваемой оси.
Этого достаточно, чтобы определить частоту, интенсивность и поляризацию излучения, испускаемого рассматриваемой системой.
Если электромагнитная теория Лоренца действительно применима к элементарным частицам электричества, то она должна позволить однозначно определить излучение, испускаемое атомом Резерфорда – Бора. Но, как мы уже видели, эта теория приводит к совершенно неправильным выводам. Действительно, поскольку атом должен все время терять энергию на излучение, электроны очень быстро упадут на ядро, а частота излучения будет непрерывно изменяться. Но тогда атом был бы нестабильным, и спектральные линии строго определенной частоты не могли бы существовать – абсурдный вывод.
Чтобы обойти эту основную трудность, Бор сделал предположение, что в стационарных состояниях атом не излучает. Это равносильно утверждению, что электромагнитную теорию излучения нельзя применять к электронам, движущимся по стабильным орбитам.
Порвав таким образом с электромагнитной теорией, квантовая теория атома оказалась совершенно не в состоянии объяснить свойства спектров излучения. Мы видели, каким образом Бору с помощью допущения, что каждый переход между квантовыми состояниями сопровождается испусканием кванта энергии излучения, удалось решить вопрос о частотах. Но это правило частот далеко не полностью описывает испускаемое излучение, оно ничего не говорит об интенсивности и поляризации. В 1916 г. Бор сумел отчасти восполнить этот недостаток, следуя очень странным и даже несколько непоследовательным путем. Этот путь состоял по существу в следующем: несмотря на неприменимость электромагнитной теории к внутриатомным явлениям, надо попытаться тем не менее установить определенное соответствие между квантовыми явлениями и формулами электродинамики с тем, чтобы понять, почему классическая электромагнитная теория дает прекрасное описание явлений большого масштаба. Таким образом, Бору удалось сформулировать удивительный принцип соответствия, сыгравший важную и благотворную роль в развитии квантовой теории.
Прежде чем перейти к рассмотрению принципа соответствия, мы должны строго очертить рамки той сложной задачи, решение которой пытался получить Бор. Необходимо ясно понимать, насколько различны представления о природе излучения классической теории, с одной стороны, и квантовой теории, с другой. Согласно классической теории движущийся в атоме электрон излучает целый набор частот. Классическое излучение, таким образом, происходит непрерывно и одновременно испускается свет разных частот. В квантовой теории, наоборот, атомный электрон, находящийся на стационарной орбите, не излучает. Когда же он перескакивает из одного состояния в другое, он испускает единственный квант монохроматического излучения: различные монохроматические излучения, испущенные группой атомов одного сорта (например, различные спектральные линии, испущенные одним элементом в газообразном состоянии), соответствуют, таким образом, переходам, которые происходят в разных атомах. Иными словами согласно квантовой теории, излучение спектральных линий какого-либо элемента есть процесс дискретный, происходящий в виде отдельных элементарных актов.
Пожалуй, трудно найти два других столь отличающихся друг от друга представления, как классическое и квантовое. Поэтому прежде всего следует спросить, можно ли вообще построить между ними какое-нибудь связующее звено.
Если мы подумаем, как установить соответствие между классической картиной спектрального излучения и столь не похожей на нее картиной, вытекающей из квантовых представлений, мы сразу же заметим, что это соответствие, если оно только возможно, может быть лишь статистическим. Действительно, соответствие с классической картиной нельзя, очевидно, установить иначе, как рассматривая одновременное испускание всех спектральных линий. Между тем с квантовой точки зрения испускание каждого кванта монохроматического излучения есть индивидуальный акт, и, чтобы получить одновременное испускание всех спектральных линий, нам придется рассмотреть ансамбль очень большого числа атомов одинаковой природы, ансамбль, в котором постоянно осуществляются индивидуальные переходы всех видов, приводящие к испусканию различных спектральных линий рассматриваемого элемента. Необходимое понятие об интенсивности различных линий можно также ввести в квантовую теорию, лишь рассматривая его статистически.
Квантовый атом, в котором происходит переход, испускает только один квант, единицу монохроматического излучения. Для такого индивидуального акта бессмысленно говорить об интенсивности излучения. Чтобы определить интенсивность, необходимо снова рассмотреть ансамбль, состоящий из большого числа одинаковых атомов. В таком ансамбле в секунду происходит большое число переходов всех видов. Рассматривая все переходы определенного вида и все кванты излучения одной и той же частоты, испускаемые при этих переходах, можно определить статистическое значение интенсивности как среднюю плотность этих квантов в пространстве. Эту интенсивность можно уже сравнивать с интенсивностью, вычисленной по классической теории.
Читатель, несомненно, начинает догадываться, как можно было бы установить требуемое соответствие. Рассмотрим, с одной стороны, ансамбль фиктивных атомов, подчиняющихся законам классической электромагнитной теории, а с другой – ансамбль реальных квантовых атомов. Попытаемся установить соотношение между частотами, интенсивностями и поляризацией излучения, испущенного каждым из этих двух ансамблей, таким образом, чтобы расчет спектра излучения первой системы хорошо известным методом классической электродинамики дал некоторые сведения об излучении второй системы, т.е. об излучении реальных атомов. A priori ясно, что найти такое соотношение, конечно, нелегко. Однако необычайно проницательный ум Бора помог ему отыскать в этой труднейшей задаче, если не окончательное и вполне определенное, то по крайней мере предварительное решение, которое оказалось чрезвычайно полезным и полным глубокого физического содержания.
2. Принцип соответствия Бора
Сравним набор большого числа фиктивных атомов, которые подчиняются классическим законам, с набором такого же числа реальных квантованных атомов. Если нам известно, как движутся электроны в атомах первого типа, то мы знаем, как вычислить частоты, интенсивности и поляризацию испускаемого излучения. Теперь, воспользовавшись этими результатами, попытаемся выяснить, каковы частоты, интенсивности и поляризация излучения, испускаемого реальными атомами. Если бы мы ничего не знали об этих последних, то не существовало бы никаких средств решения этой задачи. К счастью, нам известны значения частот, излучаемых квантованными атомами. Они даются правилом Бора.
Таким образом, первое, что приходит в голову – это сравнить боровские частоты с теми, которые испускали бы фиктивные атомы согласно классической теории. Если такое сравнение проделать, то оказывается, что в общем случае между этими двумя категориями частот не существует простого соотношения. Других же путей для дальнейшего продвижения в нужном направлении мы не видим.
Именно здесь и проявилась изобретательность Бора. Он заметил, что электромагнитная теория всегда – очень хорошее приближение для описания явлений макроскопического масштаба. С квантовой же точки зрения макроскопические явления это те, в которых играют роль большие квантовые числа. Поэтому кажется вероятным, что результаты квантовой теории должны асимптотически стремиться к классическим в области больших квантовых чисел. В этой области и следует искать согласования двух рассматриваемых теорий. А так как мы знаем, как вычислять и классические, и квантовые частоты, то нужно прежде всего выяснить, совпадают ли эти частоты для случая стационарных состояний, отвечающих большим квантовым числам.
Рассмотрим теперь одну из внешних электронных траекторий квантового атома, соответствующую большому квантовому числу. Одновременно рассмотрим такую же траекторию электрона в фиктивном классическом атоме. В классическом атоме электрон непрерывно испускает целый набор частот, кратных определенным основным частотам, которые определяются движением электрона. В квантовом атоме электрон в стационарном состоянии не излучает, но он может совершать переходы, при которых произойдет излучение с частотами, определенными правилом Бора.
Оказывается, что каждой частоте, фигурирующей в классической теории фиктивного атома, соответствует определенный переход квантового атома, который приводит к испусканию излучения той же частоты. Таким образом, в области больших квантовых чисел существует хорошее согласие между частотами излучения, испускаемого по классическим законам, и частотами, которые может излучать в процессе перехода квантовый электрон. Но в то время как классический атом испускает все частоты, о которых идет речь, непрерывно и одновременно, квантовый атом может испускать при каждом отдельном акте излучения лишь одну из них. Правда, это глубокое различие механизмов испускания не мешает совпадению результатов: два мысленно сравниваемых ансамбля атомов будут испускать (в области больших квантовых чисел) одинаковые спектральные линии.
Подтвердив таким образом одинаковость предсказаний классической и квантовой теории в отношении частот при больших значениях квантовых чисел, Бор допустил, что предсказания классической теории в отношении интенсивностей и поляризации излучения ансамбля фиктивных атомов, по крайней мере в этой области, будут справедливы для ансамбля реальных атомов. В случае реальных атомов испускание спектральных линий происходит при отдельных переходах между квантованными состояниями. Интенсивность спектральной линии будет при этом зависеть от среднего числа атомов ансамбля, совершающих в единицу времени соответствующий переход, т.е. от вероятности того, что каждый квантовый атом совершит в единицу времени упомянутый переход. Если предположить, следуя Бору, интенсивность данной спектральной линии, испущенной вторым ансамблем, равной вычисленной классически интенсивности той же спектральной линии для первого ансамбля, то это позволит нам оценить с помощью формул электродинамики вероятность данного квантового перехода.
Таким образом, нам удалось решить, по крайней мере для больших квантовых чисел, проблему вычисления интенсивности спектральных линий. Единственное, чего недоставало в первоначальной теории Бора, чтобы проделать это вычисление, – метод оценки вероятности квантового перехода. Идея установления соответствия между каждым из этих квантовых переходов и спектральными составляющими классического излучения привела в рассматриваемом асимптотическом случае к простому и строгому правилу оценки вероятностей перехода. Естественно по аналогии предположить поляризацию реально излучаемых спектральных линий совпадающей с поляризацией, полученной на основе классической теории, чтобы полностью решить вопрос и о поляризации.
К сожалению, этот замечательный способ согласования несовместимых на первый взгляд представлений, нужных для дополнения квантовой теории, имел значение только для области больших квантовых чисел. Практически же для теории атома эта область представляет наименьший интерес, так как, за исключением некоторых очень редких случаев высокого возбуждения, электроны в атоме находятся в стационарных состояниях, соответствующих гораздо меньшим значениям квантовых чисел, и обычные спектральные линии испускаются при переходах именно между такими состояниями. Поэтому для атома в начальном состоянии до перехода или конечном состоянии после перехода между реальными квантовыми частотами и частотами, вычисленными по классической теории, нет простого соотношения. Бор тем не менее смело предположил, что для приближенного вычисления реальной интенсивности и поляризации можно пользоваться классическими оценками интенсивностей и поляризаций, экстраполируя на область малых квантовых чисел соответствие, установленное для больших квантовых чисел. Мы не можем здесь детально объяснить, как Бор пытался уточнить вид этого принципа соответствия. Заметим лишь, что он взял некие средние значения классических величин, вычисленных для группы состояний (нестационарных), промежуточных между начальным и конечным стационарными состояниями, соответствующими данной спектральной линии. Хотя сформулированный таким образом принцип соответствия и привел к интересным и, вообще говоря, точным результатам, создается впечатление, что его вывод носит несколько искусственный характер и что в рамках старой квантовой теории невозможно найти его окончательной формулировки. В рамках новой механики было получено выражение, которое оказалось более обоснованным.
Однако важность выдвинутой Бором идеи скоро подтвердилась. Мысль о том, что электромагнитная теория, оказавшаяся, строго говоря, неверной, сохраняет важную направляющую роль и, подобно нити Ариадны, ведет нас к дальнейшему пониманию истинных квантовых законов элементарных частиц, оказалась весьма плодотворной. Она послужила основой формулировки настоящего метода соответствия, и ученики Бора, полагаясь на этот метод и проникнутые, по словам Гейзенберга, духом Копенгагена, сумели продвинуться вперед по этому пути и сделать замечательные открытия.
3. Некоторые приложения принципа соответствия
Принцип соответствия позволяет, по крайней мере приближенно, вычислить интенсивности различных линий нормальных спектров, а также спектров, измененных эффектами Штарка и Зеемана. Результаты таких вычислений оказались в хорошем согласии с экспериментом.
Одним из самых важных применений этих расчетов интенсивности было исследование спектральных линий, которые существуют по правилу частот Бора, однако испускаются с нулевой интенсивностью, т.е. фактически отсутствуют в наблюдаемом спектре. Остановимся на этом подробнее. Если известны все стационарные состояния и, следовательно, все спектральные термы атома, то, попарно комбинируя согласно правилу Бора эти термы, мы получаем все линии спектра, которые может излучать этот атом. Если же сравнить полученные таким образом таблицы линий с таблицами реально наблюдаемых спектров, то оказывается, что не все вычисленные теоретически линии испускаются в действительности. Иными словами, комбинированием спектральных термов можно предсказать все частоты реального спектра. Обратное же утверждение неверно, ибо в реально наблюдаемой картине спектра не всегда представлены все комбинации спектральных термов.
Значит теория должна была бы дать правила отбора, позволяющие сказать, каким из комбинаций спектральных термов соответствуют реально испускаемые линии. Для этого предполагают, что отсутствие в реальных спектрах нескольких линий, предсказанных теорией, объясняется определенными обстоятельствами, при которых эти линии испускаются с нулевой интенсивностью.
Эта точка зрения подтверждается тем, что в исключительных условиях, например под действием особенно мощных электрических полей, атом начинает испускать линии, обычно в спектре отсутствующие. Принцип соответствия показывает, что при нормальных условиях интенсивность спектральных линий, отвечающих определенным переходам, равна нулю. Это означает, что равна нулю вероятность такого перехода в атоме.
Одно из квантовых чисел, определяющих стабильную орбиту электронов, носит название азимутального квантового числа. Принцип соответствия позволяет показать, что при обычных обстоятельствах отличную от нуля вероятность имеют лишь те переходы, в которых это азимутальное квантовое число увеличивается или уменьшается на единицу. Отсюда можно вывести следующее правило отбора: при обычных обстоятельствах все спектральные линии, соответствующие переходам, в которых азимутальное квантовое число не возрастает или не уменьшается на единицу, имеют нулевую интенсивность и фактически в спектре отсутствуют.
Это правило отбора, дополненное еще одним аналогичным правилом, нашло замечательное подтверждение при исследовании всех видимых и рентгеновских спектров и значительно облегчило классификацию еще не исследованных спектров. Принцип соответствия оказал неоценимую услугу, показав теоретическое значение этих правил отбора, которые были предложены еще раньше из совершенно других соображений (Рубинович).
Очень трудно было объяснить в квантовой теории явление дисперсии света. Коэффициент преломления данного вещества зависит от частоты света и очень сильно меняется вблизи некоторых критических частот, в точности равных частотам тех спектральных линий, которые может излучать это вещество. Прежние теории довольно хорошо объяснили эти изменения коэффициента преломления, и, таким образом, они давали явлению дисперсии удовлетворительное объяснение.
В частности, в электронной теории считалось, что атомы содержат электрические заряды, гармонически колеблющиеся вблизи положений равновесия (электронные осцилляторы). При этом частоты колебаний различных атомных осцилляторов должны быть равны частотам испускаемых атомом спектральных линий. Изучив, каким образом монохроматическая волна, падая на атом, вызывает вынужденные колебания его осцилляторов и каким образом эти вынужденные колебания внутриатомных вибраторов влияют на распространение падающей волны, электронная теория позволила вычислить коэффициент преломления как функцию частоты, причем формула дисперсии полностью согласовывалась с результатами эксперимента. В этой формуле критические частоты дисперсии равны собственным частотам электронных осцилляторов, т.е. частотам спектральных линий данного вещества. Этот вывод совпадал с наблюдаемыми фактами. В теории Бора строгое объяснение дисперсии было гораздо более сложным. Действительно, в атоме Бора механические частоты вращения электронов на своих орбитах не находились в простой связи с оптическими частотами спектральных линий, связанных с переходами, а не с состояниями. Таким образом, теперь было трудно понять, как изменение механического состояния атома под действием падающего света может приводить к явлению дисперсии, где принципиальную роль играют не механические частоты атома, а оптические частоты спектральных линий. Бор и его последователи заметили эту трудность. Появление принципа соответствия позволило Бору найти решение на новом пути. Два ученика Бора, Крамерс и Гейзенберг, сумели получить в 1923 г. квантовую формулу дисперсии, которая не совпадала полностью с классической формулой, но находилась в полном согласии с результатами экспериментов. Впрочем, соображения Крамерса и Гейзенберга не были абсолютно бесспорными. Однако они постоянно руководствовались и вдохновлялись духом принципа соответствия. Как мы уже сказали, полученная таким образом формула не совсем совпадала с классической формулой: она содержала дополнительные члены. Впоследствии Ладенбург показал экспериментально, что этим членам отвечает определенная физическая реальность.
При исследовании формулы дисперсии Гейзенберг убедился, что полезно исключать из теории Бора все не наблюдаемые непосредственно величины, оставляя в ней по мере возможности лишь наблюдаемые величины, например исключить частоты вращения электронов на орбитах, заменив их спектральными частотами, связанными с квантовыми переходами правилом Бора. Эти соображения, очевидно, повлияли на молодого ученого, направив его мысль по тому пути, который привел его несколько позже к открытию квантовой механики.
Квантовая теория дисперсии – высший успех старой квантовой теории – уже содержала в зародыше принципы, триумф которых мы видим в новых волновой и квантовой механиках.
Глава VIII. Волновая механика
1. Основные идеи волновой механики
В 1923 г. стало почти ясно, что теория Бора и старая теория квантов лишь промежуточное звено между классическими представлениями и какими-то очень новыми взглядами, позволяющими глубже проникнуть в исследование квантовых явлений. В старой квантовой теории условия квантования в каком-то смысле чисто внешним образом накладывались на результаты классической теории. Существенно разрывная природа квантования, которая выражалась целыми числами, так называемыми квантовыми числами, находилась в разительном противоречии с непрерывной природой движений, описываемых старой динамикой, как ньютоновой, так и эйнштейновой. Стало совершенно очевидно, что требуется построить новую механику, где квантовые идеи войдут в самую основу построения, а не будут добавлены под конец, как в старой теории квантов.
И любопытно, что эта программа начала осуществляться почти одновременно двумя совершенно различными путями в работах ученых, наклонности которых по существу были совершенно различны. Так были созданы волновая механика, с одной стороны, и квантовая механика, с другой. На первый взгляд казалось, что обе теории совершенно противоположны и по внешнему виду и по применяемому формализму. Эти теории, такие разные по виду, следует на самом деле считать одними и теми же, потому что каждая из них есть лишь перевод другой на иной математический язык. Эти столь различные вначале попытки построить новую механику, по-настоящему насыщенную квантовыми понятиями, в конце концов слились в единое целое, в теорию, которая может быть названа новой квантовой теорией.
Рождение волновой механики (1923 г.) немного опередило квантовую механику (1925 г.). Кроме того, первая оказалась лучше подготовленной к применению математического аппарата.
Прежде всего хотелось бы обрисовать причины, которые привели в 1923…1924 гг. к установлению основных идей волновой механики. Открытый к этому времени эффект Комптона и изучение фотоэффекта рентгеновских лучей лишний раз замечательно подтверждали представление Эйнштейна о световых квантах. Теперь уже едва ли можно было оспаривать дискретную природу излучения и существование фотонов. Следовательно, с еще большей остротой встала грозная дилемма: что такое свет – волны или частицы? Хочешь не хочешь, а для полного описания свойств излучения нужно было применять поочередно картину то волн, то частиц. Соотношение Эйнштейна между частотой и энергией, введенное им на основе его теории фотонов, ясно показало, что этот дуализм излучения неразрывно связан с самим существованием квантов. Тогда возникает законный вопрос, не связан ли этот странный дуализм волн и частиц, примером которого так замечательно и несомненно явился свет, с глубокой и скрытой природой кванта действия? Не следует ли ожидать, что двойственность такого типа обнаружится везде, где только появляется постоянная Планка. Но тогда почти сам собой возникает вопрос: поскольку свойства электрона в стационарном состоянии атома описываются с помощью кванта действия, не можем ли мы предположить, что и электрон так же двойствен, как и свет? На первый взгляд такая идея показалась очень дерзкой. Ведь мы всегда представляли себе электрон в виде электрически заряженной материальной точки, которая подчиняется законам классической динамики (улучшенным в некоторых случаях релятивистскими поправками, которые ввел Эйнштейн). Электрон никогда явно не проявлял волновых свойств, таких, скажем, какие проявляет свет в явлениях интерференции и дифракции. Попытка приписать волновые свойства электрону, когда этому нет никаких экспериментальных доказательств, могла выглядеть как ненаучная фантазия. И тем не менее, как только возникла идея, что электрон, возможно, обладает такими свойствами, и не только электрон, но и вообще материальные частицы, так в голову начали приходить разные беспокойные соображения.
Мы объяснили в первой главе, каким образом теория Якоби позволяет в классической динамике, сгруппировать возможные траектории материальных точек в заданном поле так, что траектории каждой группы напоминают лучи волн, распространяющихся по законам геометрической оптики. Этот замечательный параллелизм позволил рассматривать принцип наименьшего действия как одну из форм принципа Ферма. Несомненно, это формальное сходство между способами описания динамики и геометрической оптики не ускользнуло от такого блестящего математика, как Гамильтон. Однако, по-видимому, он не пытался придать этому физического смысла. Кроме того, этому препятствовали некоторые обстоятельства. Во-первых, и прежде всего, теория Якоби установила связь между распространением волны и группой возможных траекторий данной частицы. Однако согласно классическим представлениям частица в любом физически осуществляющемся случае описывает совершенно строго определенную траекторию. Группа же возможных траекторий – это абстракция, рассматривать которую математик, конечно, имеет полное право, физик же, казалось бы, не должен придавать ей какой-либо конкретный смысл.
Во-вторых, некоторое расхождение в математической форме, по-видимому, указывало на то, что движение частицы нельзя на деле физически сопоставить с распространением волны. Если приравнять скорость частицы и скорость волны, то мы столкнемся с неприятным фактом: эти две скорости по-разному войдут в формулировку принципов Мопертюи и Ферма соответственно. И хотя эти трудности были хорошо известны, но появление тех новых идей, о которых мы уже говорили, придавало волнующую остроту мысли о том, что в классической аналитической механике формальная аналогия между траекториями частиц и световыми лучами устанавливается через посредство понятия действия, т.е. в точности того самого понятия, которое послужило основой для введения квантов. Не подтверждает ли это в самом деле ту мысль, что квант действия служит соединительным звеном между корпускулярным и волновым представлениями о материальных частицах?
И, наконец, еще одно указание. Если правда, что электрон в макроскопических процессах всегда ведет себя как обычная частица, какие есть основания при описании поведения электрона внутри атома навязывать чуждые ему условия квантования, в которых появляются целые числа? Такой способ ограничения классической динамики, когда она применяется к электрону, ясно говорит о ее неполноте и указывает на то, что свойства электрона не всегда такие, как у простой частицы. Если вдуматься, то привлечение целых чисел для характеристики стационарных состояний атомных электронов оказывается уже весьма симптоматичным.
В самом деле, мы часто встречаемся с целыми числами в тех разделах физики, где рассматриваются волны: в теории упругости, акустике, оптике. Они появляются при описании стоячих волн, интерференции, резонанса. Поэтому вполне допустимо предположить, что интерпретация условий квантования может привести к волновой точке зрения на электроны внутри атома. Таким образом, попытаться приписать электрону или вообще всем частицам, подобно фотонам, двойственную природу, наделить их волновыми и корпускулярными свойствами, связанными между собой квантом действия, – такая задача представлялась крайне необходимой и плодотворной.
2. Частица и волна, связанная с ней
В чем же в основном заключалась задача? По существу в установлении определенного соответствия между распространением некоей волны и движением частицы, причем величины, описывающие волну, должны быть связаны с динамическими характеристиками частицы соотношением, которое содержит постоянную Планка h. При том желательно установить это соответствие таким образом, чтобы общие правила, выражающие связь волны и частицы, примененные к фотону, давали хорошо известные и проверенные соотношения Эйнштейна между фотоном и световой волной.
Прежде чем приступить к решению этой задачи, было естественно рассмотреть самый простой случай: задачу о равномерном и прямолинейном движении частицы с заданными постоянными значениями энергии и импульса. Из соображений симметрии следовало сопоставить ей волну, распространяющуюся в том же направлении. Теперь оставалось только определить, как связаны между собой частота и длина этой волны с динамическими характеристиками частицы. Аргументы, основанные на общих принципах теории относительности, приводят к следующему результату: частота волны, связанной с движущейся частицей, равна энергии частицы, деленной на постоянную Планка, а длина волны – частному от деления постоянной Планка на импульс частицы. Такая связь между частицей и соответствующей ей волной обладает еще и тем большим преимуществом, что она в точности совпадает с соотношением Эйнштейна для фотона и световой волны. Так был осуществлен знаменитый синтез, ибо оказалось, что для частиц материи и для света установлен один и тот же вид дуализма.
Есть еще один, совершенно независимый путь, который ведет к такому же способу установления связи между частицей и соответствующей ей волной. Мы уже говорили, что теория Якоби очень прозрачно намекает на идею о сходстве траекторий частиц с лучом некоей волны, отождествляя интеграл действия частицы с волновым интегралом Ферма, так что принцип наименьшего действия совпадает с принципом минимального времени. Если выполнить эту операцию, то мы снова тут же находим, что, с одной стороны, энергия пропорциональна частоте, с другой стороны, импульс обратно пропорционален длине волны. Остается только положить коэффициент пропорциональности равным h (что совершенно естественно и согласуется с идеей объединения этих двух сторон дуализма посредством кванта действия), чтобы снова получить соотношение, уже установленное с помощью теории относительности. Эта новая цепочка рассуждений нигде явно не обращается к понятиям теории относительности. Поэтому она может быть целиком развита в рамках ньютоновой динамики.
Из этих основных результатов легко вывести самое важное следствие, касающееся соотношения между скоростью частицы и скоростью связанной с ней волны. В волновой теории наряду с монохроматическими волнами данной частоты рассматриваются также волновые пакеты, представляющие собой совокупность различных монохроматических волн. Среди этих пакетов интересно рассмотреть те, которые образовались наложением монохроматических волн с частотами, лежащими внутри небольшого спектрального интервала вблизи основной частоты. В действительности, монохроматические волны – это абстракция, никогда не реализующаяся на практике. То, что мы называем монохроматическими волнами, всегда представляет собой группу волн, заполняющих небольшой спектральный интервал. Если изучать распространение волнового пакета в таких условиях, когда скорость распространения монохроматических волн есть функция их частоты, то оказывается, что группа волн в целом обладает скоростью, отличной от скорости распространения отдельных волн, составляющих эту группу. Эта групповая скорость определяется средней частотой группы волн и зависит от изменения индивидуальных волновых скоростей с изменением частоты. Указанная зависимость дается формулой Рэлея – знаменитого английского физика, впервые указавшего на это свойство. Можно попытаться применить эту теорию групповой скорости к волне, связанной с частицей, а затем установить соответствие между движущейся прямолинейно и равномерно частицей, обладающей заданной энергией, и распространением в том же направлении группы волн, средняя частота которых равна этой энергии, деленной на h. Применяя формулу Рэлея, мы видим тогда, что скорость волнового пакета равна скорости, которую классическая механика приписывает рассматриваемой частице. Это замечательное совпадение знаменательно, ибо оно означает, что частица в процессе движения остается связанной со своей группой волн. Но сверх того, общая теория колебаний гласит, что групповая скорость есть не что иное, как скорость переноса энергии волнами. Поскольку в нашей дуалистической концепции энергия приписывается частице, то естественно, что групповая скорость связанных с частицей волн должна быть равна скорости частицы.
Эти первые удовлетворительные результаты еще не полны. Они установлены пока только для очень специального случая прямолинейного равномерного движения частицы в отсутствии внешнего поля. Однако не составляет особого труда обобщить эти результаты. Рассмотрим, например, движение частицы в постоянном поле. Теория Якоби предлагает рассматривать траектории частиц как лучи распространения некоторых волн. Отождествляя принцип наименьшего действия и принцип Ферма, снова приходим к тому же соотношению, связывающему частицу с ее волной: энергия (постоянная) частицы равна частоте волны, умноженной на h, а импульс частицы, который меняется в поле сил от точки к точке, равен постоянной h, деленной на длину соответствующей волны, подобным же образом меняющуюся в пространстве. Можно и дальше обобщить эти результаты, рассмотрев случаи, когда поля зависят от времени. В этом случае снова обнаружим, что соотношения между динамическими характеристиками частицы и частотой и длиной связанной с ней волны остаются теми же самыми.
Обобщая таким образом параллелизм между частицей и связанной с ней волной, мы идем по правильному пути. Действительно, если мы рассмотрим, как ведут себя внутри атома Бора волны, связанные с электронами, придем к пониманию внутреннего смысла условий квантования: связанная с электроном волна оказывается резонансной как раз на длине его траектории. Иными словами, волна, соответствующая стационарному состоянию атомного электрона, сама стационарна в смысле теории колебаний.
Чтобы осознать действительную важность этого результата, напомним кратко, что такое стоячая стационарная волна. Если в ограниченной среде могут распространяться волны какого угодно сорта, то в ней устанавливаются стоячие волны, т.е. такие колебания, конфигурация которых в пространстве не меняется с течением времени. Форму этих колебаний можно сразу определить из характера уравнения, описывающего распространение, волны, геометрии границ среды и условий на этих границах. Например, часто бывает, что условия на границах среды требуют, чтобы колебания на этих границах обращались в нуль (колеблющиеся струны с закрепленными концами, радиоантенны, изолированные на обоих концах и т.д.). В этом случае мы должны искать решения волнового уравнения, периодические во времени и обращающиеся в нуль на границах среды; их амплитуды везде должны быть конечными, однозначно определенными и непрерывными внутри среды. Нахождение этого решения представляет собой математическую задачу о собственных значениях уравнения в частных производных для определенной области пространства и определенных граничных условий. Всем физикам известно много простых примеров такого рода решений. Это, например, упругие стоячие волны, возникающие в колеблющейся струне с закрепленными концами, частота которых кратна основной частоте, или стоячие электромагнитные волны в антенне, изолированной на одном конце с заземленным другим; стоячие волны, длины которых равны учетверенной длине антенны, деленной на последовательные нечетные целые числа.
Применение только что рассмотренной теории колебаний к атому требует, чтобы мы считали стационарные боровские состояния соответствующими стационарным волнам, связанным с атомными электронами.
Несомненно, что такая интерпретация проливает свет на истинный смысл условий квантования и делает весьма вероятным уточнение основных идей, которые мы обрисовали выше, и того пути, по которому они привели нас к взаимосвязи волн и частиц. Однако для лучшего понимания материала последующих глав необходимо особо подчеркнуть две трудности.
Первая возникает, когда мы хотим убедиться в стационарном характере волн, связанных со стационарным состоянием атома, и пользуемся при этом формулой, сопоставляющей движение частицы распространению волны в смысле геометрической оптики. По существу, переводя на квантовый язык идеи, хорошо известные в аналитической механике, мы устанавливаем соответствие между траекториями частицы, какими их представляем себе классически, и лучами, по которым распространяются волны. Мы уже отмечали, что геометрическая оптика с точки зрения волновых представлений – лишь первое приближение, справедливое в том случае, когда волны распространяются свободно, не встречая никаких препятствий, и когда, кроме того, скорость распространения не меняется слишком быстро от точки к точке. Теперь уже легко видеть, что второе условие для волн, связанных с электроном внутри атома, конечно, не выполняется. Следовательно, путь, каким мы пришли к стационарному характеру волны, отвечающей стационарному состоянию атома, нельзя признать строгим.
Избежать этого можно, лишь получив уравнение распространения волны, связанной с электроном, и решив задачу о собственных значениях для волн внутри атома, которая при этом возникает.
Однако необходимо особо подчеркнуть главную идею, содержащуюся в предыдущем рассуждении. Эта важная идея заключается в следующем: так как геометрическая оптика есть только приближение, верное в определенных условиях, и соответствие установлено между классической динамикой и распространением волн по законам геометрической оптики, то вполне возможно, что классическая динамика тоже лишь приближение, имеющее те же пределы применимости, что и геометрическая оптика, перефразировкой которой она, в известном смысле, является.
Во всех случаях, когда волна, связанная с частицей, распространяется не по законам геометрической оптики (а мы уже видели, что это бывает как раз в случае волн, связанных с электронами в квантованных атомных системах), динамическое поведение частицы нельзя описывать, исходя из понятий и законов классической механики. Именно поэтому механику Ньютона и даже механику Эйнштейна нужно впредь называть старой механикой, и необходимо создать новую, в рамках которой эта старая будет первым приближением, справедливым в определенных условиях. Короче говоря, возникла необходимость, как мы писали в те годы, создать новую механику волнового характера, которая будет относиться к старой механике, как волновая оптика к геометрической оптике. Точно и тщательно эта идея была осуществлена в бессмертной работе Шредингера.
В чем же заключается вторая трудность? Прежде чем перейти к существу дела, рассмотрим в качестве простого примера систему, в которой возникают стационарные волны, – струну с закрепленными концами. В такой струне может возбуждаться бесконечное число стоячих волн. Случай, когда струна несет только одно стационарное колебание, т.е. когда она движется строго по синусоиде, исключительный. Обычно струна после нескольких начальных колебаний начинает двигаться по очень сложному закону за исключением ее концов, которые, естественно, не двигаются вообще. Однако математическая теория рядов Фурье гласит, что движение струны, каким бы сложным оно ни было, может быть представлено в виде суммы стационарных колебаний. Математически этот результат выражают следующим образом: синусоидальные функции, описывающие отдельные стационарные волны, образуют полную систему ортогональных функций. Этот результат можно обобщить на случай систем более сложных, чем струна с закрепленными концами. Можно показать, что если в какой-либо области пространства возникают стационарные колебания, то, какова бы ни была их форма, ее можно представить в виде суперпозиции некоторого числа (конечного или бесконечного) стационарных колебаний.
Применение этих общих идей к квантованным атомным системам сразу же приводит к упомянутой трудности. По первоначальным представлениям Бора атом всегда находится в том или ином стационарном состоянии. При этом предполагается дискретность, как раз и означающая квантование. Такой взгляд ни в чем не противоречит классической картине состояния атома. Однако если предположить, что стационарное состояние соответствует стационарным колебаниям, то общая теория, которую мы только что бегло описали, приводит к такому выводу: состояние атома в данный момент времени может свестись к единственному стационарному состоянию только в исключительных случаях. В общем же случае оно представляет собой наложение определенного числа стационарных состояний. Можно сказать, что с точки зрения классических представлений такое утверждение лишено всякого смысла, ибо невозможно себе представить, что атом может в один и тот же момент времени находиться в нескольких состояниях. Эта трудность показывает, что развитие новой механики претендует на глубокую перестройку основных понятий классической физики, перестройку, необходимость которой, как мы уже говорили, в зародыше содержится уже в самом существовании кванта действия. И только вероятностная интерпретация новой механики позволит нам скоро придать суперпозиции нескольких состояний физический смысл.
3. Работы Шредингера
Эрвину Шредингеру в его великолепной статье, увидевшей свет в 1926 г., выпала честь первому написать в явном виде волновое уравнение волновой механики и вывести из него строгий метод решения квантовых задач. Чтобы получить уравнение для волн, связанных с частицей, можно исходить из идеи о том, что с точки зрения новой теории старая механика эквивалентна приближению геометрической оптики. В теории Якоби траектории частиц рассматриваются как световые лучи, которые соответствуют поверхности, определяемой полным интегралом уравнения первого порядка второй степени в частных производных, названного уравнением Якоби. Мы уже отмечали (см. гл. II п. 2), что уравнение Якоби по форме совершенно аналогично основному уравнению геометрической оптики и что именно это обстоятельство – причина аналогии между теорией Якоби и теорией распространения волн в ее геометрическом приближении. Поэтому волновое уравнение волновой механики нужно записать таким образом, чтобы соответствующее уравнение геометрической оптики, справедливое в условиях, которые мы уже уточнили, совпадало с уравнением Якоби. Чтобы получить уравнение распространения, удовлетворяющее этому условию, Шредингер проделал следующее: прежде всего он установил соотношение, которое для данной задачи в классической механике давало бы энергию как функцию координат частицы и компонент ее импульса. Далее в этом выражении, которое носит в механике название гамильтониана, каждая компонента импульса в декартовой системе координат заменялась символом производной по соответствующей координате, умноженной на константу, пропорциональную постоянной Планка. Таким образом, гамильтониан был превращен в некий оператор, оператор Гамильтона. Теперь достаточно было применить этот оператор к волновой функции системы (которая обычно обозначается греческой буквой ψ) и приравнять полученный результат производной волновой функции по времени, умноженной на упомянутую константу.
Полученное таким образом уравнение можно принять в качестве волнового уравнения частицы, ибо в приближении геометрической оптики оно сводится к уравнению Якоби, которое можно написать для рассматриваемой задачи в классической механике.
Здесь следует сделать несколько замечаний по поводу полученного таким способом уравнения распространения связанных с частицей волн. Во-первых, это уравнение определяет волновую функцию как функцию скалярную, а не векторную. Это приводит к существенному различию между волной, связанной с частицей, и световой волной. Правда, известно, что волновая теория света также вначале исходила из того, что световые колебания описываются скалярной функцией. Такая точка зрения и сегодня может объяснить многие явления дифракции и интерференции. И только лишь при рассмотрении поляризации нужно учитывать векторный характер волновой функции. Итак, можно предположить, что в один прекрасный день скалярная волновая функция будет заменена волновой функцией нескольких компонент при соответствующем обобщении теории. Ниже мы покажем, что это предсказание подтвердилось рождением теории электрона Дирака. Как мы увидим, эта теория не одинакова для случаев электрона и фотона.
Следует сделать еще одно замечание по поводу уравнения распространения волн. Дело в том, что оно комплексно, т.е. его коэффициенты не являются действительными числами, в них фигурирует величина i (корень из –1). Это обстоятельство, на первый взгляд совершенно случайное, показывает, насколько трудно придать ψ-волне волновой механики такой же физический смысл, какой приписывает волнам классическая физика. Действительно, в классической физике распространение волны связано с переносом свойств колеблющейся среды, существование которой либо совершенно очевидно, либо предполагается (последнее только в случае классической теории света). Они описывают действительные процессы и должны быть выражены действительными функциями. Если же, как это часто делают при описании оптических явлений, иногда полезно заменить указанные действительные функции комплексными величинами, действительной частью которых они являются, то это только вычислительный прием, без которого всегда можно обойтись.
В волновой механике все наоборот. Из-за мнимых коэффициентов в самом волновом уравнении комплексный характер ψ-функции, по-видимому, является существенным. Он приводит к тому, что все попытки рассматривать волны волновой механики как физическую реальность, соответствующую колебаниям какой-то среды, оказываются несостоятельными. В ходе развития волновой механики функцию ψ стали рассматривать как некую вспомогательную величину, значение которой позволяет вычислить другую величину. Эта последняя уже действительна, она имеет физический смысл, причем, как правило, статистического характера. Мы еще должны будем вернуться к этому пункту. Здесь же уместно было просто отметить, почему волновое уравнение волновой механики уже по своей форме вынуждает нас отказаться от идеи дать этим волнам непосредственное физическое толкование.
Мы объяснили, как Шредингер добился успеха в выводе для самого общего случая уравнения распространения связанной с частицей ψ-волны. Однако при написании этого уравнения он исходил из формул ньютоновой механики. Поэтому его уравнение распространения не удовлетворяет требованиям теории относительности и естественно ожидать, что оно справедливо лишь для частиц, обладающих очень малой скоростью, т.е. для волн не очень большой частоты. Теперь встал вопрос о том, чтобы найти уравнение распространения, имеющее релятивистский характер и содержащее уравнение Шредингера как первое приближение для низких частот. Уравнение такого типа, которое казалось естественным с точки зрения здравого смысла, было предложено почти одновременно несколькими учеными. Однако это релятивистское уравнение, будучи уравнением второго порядка по времени, приводило к ряду трудностей. Правильное релятивистское обобщение уравнения Шредингера было получено Дираком совсем другим путем.
Шредингер предложил также волновое уравнение (нерелятивистское), которое описывало систему, ансамбль взаимодействующих между собой частиц. Однако поскольку мы ввели новые понятия, требующие специального разбора, отложим изложение волновой механики систем частиц до главы XII.
Вооружившись своим волновым уравнением, Шредингер приступил к строгому решению задачи определения стационарных состояний квантовой системы, предположив в соответствии с приближенной теорией, что эти стационарные состояния соответствуют связанным с частицами стационарным волнам. Рассмотрим в качестве квантовой системы атом водорода. Мы знаем уравнение распространения волн, соответствующих этой системе. Естественно предположить, что, так как система ограничена некоторой областью пространства, ψ-функция при удалении от центра системы быстро стремится к нулю. Если мы также предположим, как это обычно делают в математической физике, что ψ-функция должна быть везде однозначна и непрерывна, то нахождение стационарных состояний сводится к отысканию монохроматических решений уравнения распространения, конечных и однозначных во всем пространстве и обращающихся в нуль на бесконечности. Шредингер, использовав известные методы анализа, блестяще решил эту задачу для нескольких типов квантовых систем. Он обнаружил, что монохроматические решения, удовлетворяющие наложенным условиям, существуют лишь для некоторых определенных значений частоты. Эти значения являются собственными значениями волнового уравнения в частных производных данной задачи с граничным условием обращения ψ в нуль на бесконечности. Собственной частоте системы в соответствии с общим соотношением между свойствами волны и характеристиками частицы сопоставляется квантованное значение энергии частицы, которое получается умножением частоты на h. Таким образом, расчеты Шредингера позволили получить квантованные значения энергии и, следовательно, значения спектральных термов. В большинстве случаев точно такой же результат был получен в старой квантовой теории. Примером может служить, скажем, атом водорода, для которого были получены в точности боровские результаты. Однако в некоторых важных случаях полученные новым методом результаты отличались от выводов старой квантовой теории, причем новые решения лучше согласовались с экспериментом, чем старые. Самым замечательным примером этого оказался линейный осциллятор. Напомним, что квантование линейного осциллятора, с которым столкнулся в своей теории излучения Планк, послужило отправной точкой всего развития квантовой теории. Старый метод квантования предполагал, что квантованные значения энергии линейного осциллятора являются целыми кратными энергии кванта, полученной умножением собственной частоты механических колебаний осциллятора на постоянную Планка h. Однако физические задачи, в которых фигурировал квантовый осциллятор (например, полосатый спектр двухатомной молекулы), по-видимому, указывали, что квантованные значения энергии осциллятора должны быть равны произведениям не целых значений кванта энергии, а полуцелых, т.е. квант энергии умножается на 1/2, 3/2, 5/2… (2n + 1)/2. Новый метод квантования, отличаясь в этом пункте от старой квантовой теории, точно предсказывает именно такое квантование полуцелыми долями. Итак, Шредингер вновь получил правильные результаты старой теории и уточнил другие результаты. Успех был полным.
Любопытное совпадение натолкнуло Шредингера на мысль, которая привела его к самым замечательным открытиям. Незадолго до этого Гейзенберг сформулировал свою квантовую механику. Его новый метод, внешне совершенно отличный от волновой механики, дал точно такие же результаты для квантованных значений энергии атомных систем, что и метод Шредингера, тем самым подтвердив и уточнив результаты старой квантовой теории. Шредингер интуитивно чувствовал, что это совпадение не случайно. Ему мастерски удалось показать, что квантовая механика Гейзенберга, несмотря на совершенно иной внешний вид представляет собой всего лишь математическую перефразировку волновой механики.
Важность эффекта Зеемана и его электрического аналога, эффекта Штарка, хорошо известна. Шредингер попытался с помощью волновой механики развить теорию этих явлений. С этой целью он разработал прекрасный метод возмущений, волновой вариант классического метода небесной механики. Действительно, магнитные и электрические поля, которые мы можем создавать, ничтожно малы по сравнению с электромагнитными полями, действующими внутри атомных систем. Чтобы получить эффект Зеемана или Штарка, на атомы воздействуют однородным магнитным или электрическим полем, и это поле можно рассматривать как очень малое возмущение собственного поля атомной системы. Если нам уже известны квантованные значения энергии данной системы в отсутствие внешнего поля, то необходимо лишь учесть очень слабое изменение этих величин, которое вызывается возмущающим полем.
Шредингер, применив свой метод возмущений, решил эту задачу и получил таким образом детальную теорию эффектов Зеемана и Штарка. Что касается эффекта Штарка, то результаты полностью совпали с предсказаниями старой квантовой теории. В некоторых отношениях теория, по-видимому, оказалась более точной. В случае эффекта Зеемана снова в согласии со старой квантовой теорией получаем результат Лоренца. Это вполне удовлетворительно, поскольку в данном случае явление протекает в основном так, как его предсказал Лоренц (нормальный эффект Зеемана).
Однако кроме нормального эффекта Зеемана, предсказанного Лоренцом, в некоторых случаях обнаруживается более сложный аномальный эффект. Ни классическая, ни старая квантовая теории не способны были объяснить эти явления. В руках Шредингера волновая механика добилась в этом пункте не большего успеха. Для объяснения аномального эффекта Зеемана понадобилось ввести еще одну характеристику – спин электрона.
4. Дифракция электронов
Итак, мы показали, как идеи автора этой книги о связи между волнами и частицами и о необходимости создания новой механики волнового характера приобрели к 1926 г. благодаря превосходным работам Шредингера необычайную полноту и точность. Однако какими бы замечательными ни были руководящие идеи и основные методы, какими бы точными ни казались подтверждения, которые были получены благодаря правильным предсказаниям атомных явлений, прямое экспериментальное доказательство этих представлений все же отсутствовало. Такое доказательство принес 1927 г., когда Дэвиссон и Джермер открыли явление дифракции электронов.
Поскольку движение частиц неразрывно связано с распространением волны, было бы очень странно, если бы материальные частицы, например электроны, не проявляли интерференционных и дифракционных свойств подобно тому, как это происходит с фотонами и изучением которых занимается физическая оптика. Чтобы выяснить, какие из этих явлений можно реально наблюдать, нужно было прежде всего оценить длину волн, связанных с электронами. Формулы волновой механики немедленно дают ответ на этот вопрос: длина волны, связанной с электронами, при обычных условиях всегда очень мала, порядка длины волны рентгеновских лучей. Поэтому можно было надеяться наблюдать у электронов те явления, которые происходят с рентгеновскими лучами.
Известно далее, что фундаментальное явление физики рентгеновских лучей – это дифракция на кристаллах. Необычайно малая длина волны рентгеновских лучей почти исключает возможность использования для наблюдения их дифракции приборов, сделанных руками человека. К счастью, сама природа позаботилась о том, чтобы создать годные для этих целей дифракционные решетки – кристаллы.
Действительно, в кристаллах атомы и молекулы расположены в правильном порядке и образуют трехмерную решетку. Причем оказалось, что расстояние между частицами в кристалле как раз порядка длины волны рентгеновских лучей. Направляя пучок рентгеновских лучей на кристалл, можно получить дифракционную картину, совершенно аналогичную картине дифракции обычного света на трехмерной точечной решетке.
Явление дифракции рентгеновских лучей было открыто в 1912 г. фон Лауэ, Фридрихом и Книппингом, и теперь оно служит основой широкого развития рентгеновской спектроскопии. Исходя из всего этого, можно было ожидать, что совершенно аналогичное явление можно наблюдать для электронов. Взяв пучок электронов с заданной кинетической энергией, мы должны были бы наблюдать явление дифракции, такое же, как дифракция рентгеновских лучей. Поскольку структура кристаллов, применяемых в экспериментах такого типа, хорошо изучена различными методами, главным образом с помощью рентгеновских лучей, мы могли бы из полученной при дифракции электронов картины вычислить длину волны, связанную с электронами, и, следовательно, подтвердить правильность соотношения, которое волновая механика предполагает для движущихся частиц и связанных с ними волн.
Дэвиссону и Джермеру, сотрудникам лаборатории «Белл-телефон» в Нью-Йорке, выпала честь открытия дифракции электронов на кристаллах. Бомбардируя кристалл никеля пучком моноэнергетических электронов, они твердо установили, что электроны дифрагируют как волны, и показали, что длина этих волн в точности совпадает с той, какую дают формулы волновой механики. Так было установлено существование этого тонкого явления, предположение о котором за несколько лет до этого вызывало удивление и недоверие физиков.
Повторенное почти одновременно в Англии Дж. П. Томсоном, сыном Дж.Дж. Томсона, применившим совершенно иной метод, явление дифракции электронов вскоре стали наблюдать почти во всех странах. Это явление в разных условиях и при различной постановке опытов изучали Понт во Франции, Рупп в Германии, Кикучи в Японии и многие другие. Вскоре стали известны все его детали. Постепенно было устранено большинство мелких трудностей объяснения этого явления, которые вначале возникли. Этого удалось добиться, когда приняли во внимание, что внутри кристалла показатель преломления волн, связанных с электроном, отличен от единицы. Дифракцию электронов удалось получить и на обычной решетке, использовав почти касательное падение (Рупп), как это было ранее проделано с рентгеновскими лучами (Комптон, Тибо). Таким путем можно прямо сравнить длину волны, связанной с электроном, с шириной линий, нанесенных на металлической поверхности механическим способом.
Как это часто бывает, явление дифракции электронов, как вначале казалось, очень трудно наблюдаемое и требующее высокого искусства экспериментатора, теперь стало относительно простым и повседневным. Приборы для наблюдения явления дифракции стали настолько совершенными, что сегодня это явление можно демонстрировать студентам на лекции. Наконец, условия этих экспериментов варьировались в таких широких пределах, что справедливость основной формулы, выражающей соотношение между свойствами волны и характеристиками частицы, можно считать теперь доказанной во всем интервале энергий от нескольких электрон-вольт до миллиона электрон-вольт. Для больших значений энергии необходимо учитывать релятивистские поправки. Таким образом, косвенно подтверждаются и результаты теории относительности.
Справедливость формулы для длины волны, связанной с частицей, считается сегодня настолько очевидной, что явление дифракции электронов используется уже не для подтверждения этой формулы, а для изучения структуры некоторых кристаллических или частично ориентированных сред. Однако это уже технические применения. Ограничимся замечанием, что эксперименты по дифракции электронов дали великолепное прямое подтверждение представления о связи волн и частиц, которое послужило исходным пунктом для создания новой механики.
Заканчивая этот параграф, уместно отметить, что была получена дифракция не только электронов, но и других частиц. Так же, как и электроны, явление дифракции испытывают протоны и атомы. Подобные эксперименты очень сложны и не столь многочисленны, однако установлено, что даже здесь подтверждаются формулы волновой механики. Это не должно нас удивлять. Связь между волнами и частицами – это, по-видимому, великий закон природы, причем такой дуализм тесно связан с существованием и внутренней сущностью кванта действия. Нет никаких причин считать, что только электроны обладают такими свойствами. Неудивительно, что мы встречаемся с дуализмом волна – частица при изучении всех физических объектов.
5. Физическое объяснение волновой механики
Попытаемся теперь показать, что можно извлечь из знания волновой функции системы. Старая механика соответствует приближению геометрической оптики, и все представления и понятия, которыми она пользуется, должны быть отброшены, когда мы выходим за пределы этого приближения. Поэтому мы уже не можем применять, во всяком случае безо всяких предосторожностей, понятия положения, скорости и траектории частицы. Мы снова должны рассмотреть эти понятия и исследовать, что можно сказать, зная волновую функцию, о величинах, характеризующих частицу. Те постулаты, которые мы сформулируем, должны удовлетворять важнейшему условию: они должны вновь приводить к понятиям и результатам старой механики, как только ψ-волна станет удовлетворять законам геометрической оптики.
Интерпретация волновой механики носит вероятностный характер. Какие же постулаты приходится принять физикам, чтобы пользоваться уравнениями волновой механики?
Прежде всего, поскольку ψ-функция существенно комплексна, она непосредственно не пригодна для изображения физических колебаний. Однако можно попытаться образовать с помощью ψ-функции действительные выражения, которые уже имеют физический смысл. Одно из них, которое в первую очередь, естественно, приходит в голову, это квадрат модуля комплексной величины ψ, который получается умножением волновой функции на комплексно сопряженную величину. Эту величину можно рассматривать как квадрат амплитуды ψ-функции, т.е. ее интенсивность в обычном смысле теории колебаний. Чтобы понять, какой смысл следует приписать этой важной величине, мы снова должны вернуться к теории света, которая нам так часто служила путеводной звездой, и выяснить с ее помощью, что означает интенсивность световых волн, если предположить существование фотонов.
Рассмотрим классический опыт по дифракции или интерференции света. Волновая теория определяет (и мы знаем, с какой огромной точностью) положение светлых и темных полос на экране. Это делается при помощи расчета интенсивности световых волн в каждой точке экрана в предположении, что энергия световых волн распределена в пространстве пропорционально их интенсивности.
Эту гипотезу, которая подтверждается различным образом в различных теориях света, упругих и электромагнитных, можно рассматривать в качестве постулата – принципа интерференции.
Теперь введем понятие фотона. Луч света можно рассматривать как поток фотонов. Тогда эксперименты по интерференции и дифракции света представляются как опыты, в которых фотоны под воздействием приборов распределяются в пространстве неравномерно, уходя из темных мест и концентрируясь в светлых. Поскольку предсказания теории подтверждаются очень точно, можно сказать, что интенсивность волн, рассчитанная по этой теории в каждой точке, пропорциональна плотности фотонов.
С другой стороны, мы уже говорили о таких удивительных экспериментах, которые обнаруживают возможность получения картины интерференции с помощью необычайно слабых световых потоков. В этих опытах интерференция происходит даже, когда фотоны проходят через интерферометр поодиночке. Поэтому для объяснения картины обычной интерференции, которая получится после большой экспозиции, нужно предположить, что интенсивность волны, связанной с каждым фотоном, в каждой точке представляет собой вероятность того, что фотон находится в этой точке. Таким образом, от статистической точки зрения мы приходим к вероятностной. Принцип же интерференции оказывается принципом, определяющим вероятность локализации фотонов. Если теперь вернемся к теории частиц, то увидим, что и здесь мы должны ввести точно такой же принцип, ибо дифракция электронов на кристалле происходит совершенно таким же образом, как дифракция фотонов той же длины волны. Таким образом, и в этом случае интенсивность волны, связанной с электронами, определяет вероятность их локализации в пространстве. Итак, мы приходим к следующему утверждению: квадрат модуля ψ-функции в каждой точке и в каждый момент времени определяет вероятность того, что соответствующая частица будет наблюдаться в этой точке в тот же момент времени.Не следует закрывать глаза на то, сколько изменений вносит подобный постулат в наши представления.
Так как ψ-функция, вообще говоря, отлична от нуля в целой области пространства, то частицу можно найти в любой точке этой области. В данный момент времени частице нельзя приписать точное положение в пространстве. Можно только сказать, что ее можно найти в данной точке с такой-то вероятностью. Вместе с отрицанием понятия строго определенного положения в пространстве исчезают и понятия скорости и траектории. Во всяком случае, они становятся весьма смутными. Вообще все достоверные представления старой механики становятся вероятностными. Здесь мы приоткрыли завесу над важным изменением метода, который наука использует для описания и предсказания явлений природы, изменением, заключающим в себе глубокие философские следствия.
Оставляя за собой право вернуться к этим вопросам в дальнейшем, сформулируем здесь второй принцип, который физики вынуждены принять в их интерпретации волновой теории. Впервые этот второй принцип, насколько нам известно, был сформулирован Борном, когда он начал свое блестящее исследование методами волновой механики задачи о столкновениях частиц. Этот принцип можно назвать принципом спектрального разложения.
Чтобы понять природу этого нового постулата, рассмотрим сначала простой случай частицы, движущейся в отсутствии внешнего поля. Если волна, связанная с частицей, является плоской монохроматической волной, то мы знаем, что энергия частицы строго определена и равна произведению частоты волны на постоянную Планка h. Однако с точки зрения волновой механики ψ-волна не обязательно будет монохроматической. Но ее можно с таким же успехом записать в виде суперпозиции плоских монохроматических волн, образующих волновой пакет. При этом она также будет удовлетворять линейному волновому уравнению. Какова же будет энергия соответствующей частицы в этом случае? Ответить на данный вопрос затруднительно, ибо ψ-волна состоит теперь уже из волн множества различных частот.
Борн предложил разрешить эту трудность, вновь обратившись к вероятности. Согласно теории Борна частица не обладает определенной энергией. Она может иметь одну из энергий, соответствующую одной из частот ψ-волны. Более точно это означает, что при определении энергии частицы можно найти одну из этих величин, не зная a priori, какую именно. Единственно, что можно сказать a priori, это какова вероятность обнаружить то или иное из возможных значений энергии. В этом заключается введенный Борном новый принцип.
В сущности утверждение, что волна, связанная с частицей, представляет собой суперпозицию плоских монохроматических волн, означает, что ψ-функция математически изображается в виде суммы членов, каждый из которых описывает монохроматическую волну. Каждый из этих членов характеризуется коэффициентом, который можно назвать парциальной амплитудой этой монохроматической компоненты спектрального разложения ψ-волны. Квадрат модуля этой амплитуды будет определять соответствующую парциальную интенсивность. Принцип, сформулированный Борном, состоит в утверждении, что вероятность того, что измерение энергии частицы даст определенную величину, соответствующую одной из монохроматических компонент ψ-волны, дается соответствующей парциальной интенсивностью в спектральном разложении этой волны. Этот принцип снова находится в полном согласии с положениями оптики.
Действительно, предположим, что на призму или дифракционную решетку падает немонохроматическая световая волна. После прохождения луча через прибор оказывается, что различные монохроматические компоненты волны отделяются друг от друга. Очевидно, вероятность того, что фотон первичного луча попадет в тот или иной отклоненный луч, пропорциональна интенсивности соответствующей монохроматической компоненты в спектральном разложении падающей волны.
Этот вопрос можно рассмотреть также с более общей точки зрения. Примененный к квантовым атомным системам, этот принцип дает ключ к разрешению трудности, о которой уже говорилось. В квантовом атоме существует набор частот, соответствующих стационарным значениям квантованной энергии. Однако для такой системы, как и для колеблющейся струны, можно легко представить себе, как некоторое состояние образуется суперпозицией стационарных состояний. В самом деле, взяв в качестве ψ-функции сумму подходящих колебаний, можно снова получить решение волнового уравнения, поскольку оно линейно. Правда, о состоянии атома, которое описывается этой ψ-функцией, уже нельзя сказать, что оно стационарно. Оно представляет собой нечто вроде нескольких стационарных состояний в один и тот же момент времени. Совершенно непонятно, что это означает с классической точки зрения.
Принцип спектрального разложения позволяет разрешить эту трудность совершенно неожиданным образом: атом в рассматриваемом состоянии может иметь любое из квантованных значений энергии, которые соответствуют спектральному разложению его ψ-волны, с вероятностью, пропорциональной интенсивности соответствующих спектральных компонент. Здесь это снова означает, что эксперимент, позволяющий нам приписать атому определенную энергию, дает ее значение, соответствующее спектральному разложению. Вероятностный характер этой трактовки позволяет вновь почувствовать ту совершенно новую форму, которую должна принять физическая теория.
Сопоставление только что установленных двух принципов ведет к соотношениям неопределенности, связанным с именем Гейзенберга. Изучение этого важнейшего вопроса будет более уместным в разделе, который посвящен вероятностной трактовке новой механики.
6. Теория Гамова
Следует сказать несколько слов об одном замечательном применении волновой механики, которое нашел Гамов. Эта теория представляет интерес не только потому, что она объяснила некоторые явления радиоактивности. Она показала так же, как видоизменяется постановка некоторых задач при переходе от старой механики к новой.
Рассмотрим частицу, движение которой тормозится некоторым силовым полем. Пусть силовое поле, которое мы предполагаем статическим, в некоторой точке обращается в нуль, а затем меняет знак. При этом потенциал, определяющий это поле, вначале растет, затем проходит через максимум и, наконец, падает. Фигурально говоря, мы имеем здесь дело с потенциальным барьером. Сможет ли поднимающаяся на этот барьер частица перейти через него? Классическая механика отвечает на этот вопрос следующим образом: да, если эта частица обладает энергией, достаточной, чтобы достигнуть вершины, она опустится по другую сторону, перевалив, таким образом, через барьер. Однако если энергии у частицы недостаточно, чтобы достигнуть вершины, то она никогда не преодолеет этот барьер, ибо, истощив весь свой запас энергии, она застрянет на подъеме и в конце концов скатится назад.
Совсем иначе обстоит дело в волновой механике. Здесь мы должны наглядно представить себе, как распространяется волна, связанная с частицей. Можно показать, что до тех пор, пока высота потенциального барьера меньше энергии частицы, для такой волны этот барьер является аналогом преломляющей среды. Если энергия частицы больше, чем значение потенциала на вершине, то она легко переходит с одной стороны на другую. С этой точки зрения нет никакой разницы между старой и новой теориями. Однако если энергия частицы ниже, чем высота потенциального барьера, то избыточная часть высоты барьера играет для волн роль поглощающей среды. Но согласно волновой теории при падении на поглощающую среду волна все же через нее проходит, правда в сильно ослабленном виде. Это затухание волны таково, что если толщина поглощающей среды достаточно мала, то некоторая часть волны, в действительности очень малая, может просочиться сквозь эту поглощающую среду. Этот факт бесспорно подтвержден в оптике. Переходя к нашей задаче волновой механики, мы видим, что частица, энергия которой слишком мала, чтобы перевалить через вершину потенциального барьера, может пройти через него, если его ширина не слишком велика. Точнее говоря, частица, отскакивающая от потенциального барьера, если ее энергии недостаточна, чтобы перевалить через вершину, имеет, однако, определенную вероятность (конечно, очень малую, но не равную нулю) появиться с другой стороны барьера. Это следует из вероятностной трактовки, связанной с частицей волны, и принципа интерференции. Описанное явление – следствие волновой природы материи часто образно называют туннельным эффектом.
Допустим теперь, что частица заключена в пространстве, со всех сторон ограниченном потенциальными барьерами, высота которых больше ее энергии. Классическая механика утверждает, что частица никогда не сможет вырваться из этой потенциальной ямы. Согласно же волновой механике частица, наоборот, имеет вполне определенную, небольшую вероятность покинуть яму. Волновая механика позволяет вычислить вероятность выхода за единицу времени.
Теперь посмотрим, как Гамов (и почти одновременно с ним Кондон и Гарни) применил эту теорию к изучению задачи радиоактивного распада. Известно, что большое число радиоактивных веществ распадается с испусканием α-частиц. Можно предположить, что α-частицы еще до распада заключены в ядрах радиоактивных атомов как в потенциальной яме. Поскольку закон Кулона действует вблизи ядра вплоть до самых близких расстояний от него, вид внешнего склона потенциальной горы известен. Весьма вероятно, что потенциал на определенном расстоянии от ядра в конце концов перестает быть кулоновским: потенциал должен пройти через максимум и затем упасть, однако закон изменения внутреннего склона барьера совершенно неизвестен. Величайшее удивление вызывал у физиков такой факт: энергия α-частиц, выходящих из распадающихся ядер, была, по-видимому, гораздо ниже той, которая позволила бы им перевалить через окружающий ядро потенциальный барьер. Действительно, можно достаточно далеко исследовать внешний склон потенциального барьера, чтобы обнаружить, что вершина его заведомо превосходит некоторую определенную высоту. Вылетающие же из ядра α-частицы не обладают энергией, достаточной, чтобы достичь этой высоты. Если исходить из классических представлений, то мы попадаем в тупик. А вот туннельный эффект сразу все объясняет. Заключенные в радиоактивном ядре α-частицы находятся в потенциальной яме с очень высокими стенками. Тем не менее они имеют определенную вероятность за единицу времени выскочить наружу. Эта вероятность, очевидно, равна постоянной распада радиоактивного вещества. Итак, волновая механика позволяет при условии, если мы точно знаем форму потенциального барьера, вычислить постоянные α-распада радиоактивных веществ. Сделав разумные предположения о форме этих барьеров, Гамов показал, что результаты теории очень близки к наблюдаемым.
Одним из важнейших успехов теории Гамова явилось объяснение закона Гейгера – Неттола, согласно которому скорость вылетающих α-частиц для элементов с малым периодом полураспада больше, чем для долгоживущих. Этот закон математически выражается соотношением между постоянной распада и энергией α-частиц, испущенных при распаде, соотношением, из которого следует, что постоянная распада очень сильно зависит от энергии α-частиц.
Теория Гамова очень хорошо объясняет этот закон. Причину такого согласия легко понять: чем больше энергии недостает частице, заключенной в потенциальной яме, чтобы достичь высоты барьера, тем меньше вероятность ее вылета. И эта вероятность очень быстро падает с уменьшением энергии заключенной в яме частицы. Но так как вероятность равна постоянной распада и так как частица, вышедшая благодаря туннельному эффекту, обладает той же энергией, что и до выхода, мы находим, таким образом, соотношение между постоянной распада и энергией α-частицы, испущенной при распаде ядра. Вид формулы согласуется с экспериментом. Правдоподобные гипотезы относительно профиля потенциала ядра позволяют достичь и численного соответствия. Конечно, теория Гамова очень неполна, ибо ядра тяжелых радиоактивных элементов гораздо более сложны, и их нельзя рассматривать просто как потенциальные ямы, наполненные α-частицами. Тем не менее, успех теории Гамова в объяснении некоторых фактов показывает значение новых понятий волновой механики и необходимость вероятностной трактовки при разрешении некоторых несомненных трудностей, возникающих в экспериментах.
Глава IX. Квантовая механика Гейзенберга
1. Основные идеи Гейзенберга
Первая работа Гейзенберга по квантовой механике появилась в 1925 г., когда уже были сформулированы первые идеи волновой механики, но еще не были опубликованы статьи Шредингера. Правда, казалось, что цель Гейзенберга совершенно отличается от той, которую ставил себе Шредингер. Основные идеи Гейзенберга не имели фактически никакой видимой связи с теми, которые положили начало успехам волновой механики, а развитый им формализм имел весьма специальный вид.
Рассмотрим идеи, которыми руководствовался Гейзенберг. Как мы знаем, Гейзенберг принадлежал к «копенгагенской школе», которая сформировалась вокруг Бора. Свои первые шаги в науке он посвятил применению метода соответствия. Поэтому вполне естественно, что сам дух этого метода, сколь оригинального, столь и глубокого, насквозь пропитал его мысли. Одна из существенных идей, возникших из изучения принципа соответствия, заключалась в следующем. В то время как классическая теория выражает величины, относящиеся к квантованной системе, в виде разложения в ряд Фурье, члены которого соответствуют непрерывному и одновременному испусканию различных излучений, квантовая теория разлагает те же величины на элементы, отвечающие различным возможным переходам атома, причем каждый из этих элементов связан с дискретными и индивидуальными актами испускания излучения. Как мы уже поясняли раньше, цель знаменитого боровского принципа заключалась в установлении соответствия, по крайней мере асимптотического, между этими двумя столь различными представлениями.
По-видимому, Гейзенберг столкнулся с тем обстоятельством, что при переходе от классической точки зрения к квантовой нужно разложить все физические величины и свести их к набору отдельных элементов, соответствующих различным возможным переходам квантованного атома. Отсюда идея, на первый взгляд весьма сомнительная: представлять каждую физическую характеристику системы таблицей чисел, аналогичной той, которую математики называют матрицей. Подобно этому в классической теории ряды Фурье представляют собой разложение физической величины на бесконечные множества дискретных элементов, причем вся совокупность этих элементов изображает рассматриваемую величину. Конечно, эти элементы должны удовлетворять некоторым условиям, а именно, для больших квантовых чисел классические и квантовые разложения должны асимптотически совпадать. Как показал Бор, этим устанавливается соответствие между различными переходами и компонентами классического ряда. Фурье.
Гейзенберг увидел еще одно преимущество этого нового представления величин набором матричных элементов; он надеялся, применяя его, исключить из теории ненаблюдаемые величины, которые обременяли прежнюю квантовую теорию. Пользуясь довольно громоздким выражением, взятым из философского словаря, он занял строго феноменологическую позицию и хотел исключить из физической теории все, что нельзя наблюдать непосредственно.
Зачем нужно вводить в наши атомные теории положение, скорость или траекторию атомных электронов, если мы все равно не можем ни измерять эти характеристики, ни наблюдать их? Единственно, что нам известно об атоме – это его стационарные состояния, переходы между ними и излучения, которые сопровождают эти переходы. Поэтому в наши расчеты нужно вводить только величины, связанные с этими реально наблюдаемыми величинами. Такую задачу поставил себе Гейзенберг. В его матрицах элементы располагаются в строки и столбцы, причем каждый из них имеет два индекса: один соответствует номеру столбца, другой – номеру строки. Диагональные элементы, т.е. те, индексы которых совпадают, описывают стационарное состояние. Недиагональные элементы с разными индексами описывают переходы между стационарными состояниями, соответствующими этим индексам. Что же касается величины этих элементов, то ее нужно связать по формулам, полученным с помощью принципа соответствия, с величинами, характеризующими излучение при этих переходах. Таким путем будет создана теория, в которой все величины будут описывать наблюдаемые явления.
Конечно, было бы удивительно, если бы Гейзенбергу действительно удалось исключить из теории все ненаблюдаемые величины. Наличие в формализме его квантовой механики матриц, изображающих координаты и импульсы атомных электронов, оставляет в этом смысле некоторые сомнения. Однако эта попытка Гейзенберга, даже если ему и не удалось полностью выполнить свою философскую программу, привела к созданию новой механики, механики совершенно особого вида. Она дала замечательные результаты и представляет собой значительную ступень в развитии новых квантовых теорий.
2. Квантовая механика
Очень трудно даже совершенно поверхностно излагать квантовую механику, не пользуясь математическим формализмом, потому что можно сказать, сущность этой новой механики заключается именно в ее формализме. Тем не менее мы попытаемся дать читателю хотя бы смутное представление о том, что такое квантовая механика, механика матриц, рождением которой мы обязаны Гейзенбергу, а дальнейшим развитием – Гейзенбергу, Борну в Иордану.
Итак, Гейзенбергу принадлежит идея замены физических величин, с которыми имеют дело в атомной теории, таблицами чисел, матрицами. Исходя из принципа соответствия, он пытался вначале установить правила сложения и умножения различных матриц, каждую из которых нужно рассматривать как единое математическое целое. Он обнаружил, что эти правила сложения и умножения в точности совпадают с правилами для матриц, которыми пользовались математики в теориях алгебраических уравнений и линейных преобразований. Этот результат, a priori, отнюдь не очевидный, очень упростил задачу, ибо свойства алгебраических матриц были уже с давних пор хорошо известны.
Необычным оказалось одно свойство этих матриц – произведение их некоммутативно, оно зависит от порядка сомножителей. Произведение первой матрицы на вторую не равно произведению второй на первую.
Таким образом, Гейзенберг представил физические величины числами, не обладающими свойством коммутативного умножения. Этот факт можно рассматривать как самую основу квантовой механики, и Дирак в своей первой работе отстаивал именно эту точку зрения. Он считал, что переход от классической физики к квантовой заключается просто в представлении физических величин не обычными числами, а квантовыми числами, произведение которых не обладает свойством коммутативности.
Огромное большинство физиков того времени находило, что произвести подобную замену далеко не так просто.
Гейзенберг должен был найти также способ введения в свою теорию кванта действия, И снова он пошел по пути, которым постоянная h была введена в классические уравнения старой квантовой теорией, и попытался с помощью принципа соответствия перенести этот способ введения h в свою новую механику.
Результат оказался очень точным, хотя на первый взгляд несколько удивительным. Нужно было предположить, что при перемножении матрицы, соответствующей координате, на матрицу, соответствующую канонически сопряженной компоненте импульса, порядок множителей не безразличен и что разность между произведением этих двух величин, взятых в одном порядке, и их произведением в противоположном порядке равна постоянной Планка, умноженной на некоторое число.
Все другие канонические переменные квантовой механики коммутируют между собой, т.е. их произведение не зависит от порядка сомножителей. Только когда рассматриваются произведения двух величин, канонически сопряженных в смысле аналитической механики, в результате их перестановки получается величина, отличающаяся от исходной так, что их разность пропорциональна h. В макроскопических явлениях, где величиной h можно пренебречь, все механические величины можно считать коммутирующими, и мы снова, как и должно быть, возвращаемся к классической механике. Такой путь введения постоянной Планка с помощью коммутационных соотношений, хотя и естественный, с точки зрения Гейзенберга, может показаться несколько странным. Ниже мы увидим, как можно его объяснить в волновой механике.
Уточнив таким образом свойства матриц, представляющих физические величины, Гейзенберг должен был вывести уравнения, описывающие их изменение со временем: иными словами, он должен был построить динамику. Он сделал это, смело предположив, что его матрицы подчиняются уравнениям, по виду совпадающим с уравнениями классической механики.
Согласно этой гипотезе для матриц можно написать канонические уравнения Гамильтона.
Однако эта идентичность динамических уравнений скорее кажущаяся, чем реальная, ибо в классической механике в уравнениях фигурируют обычные числа, а в механике Гейзенберга – матрицы. В этом корень важнейших различий. Тем не менее можно показать, что канонические уравнения квантовой механики позволяют вновь получить принцип сохранения энергии, и они не противоречат боровским соотношениям для частот. Кроме того, для атомных систем эти уравнения по причинам, на которых мы не можем здесь останавливаться, удовлетворяются лишь для некоторых определенных значений энергии. Итак, мы снова приходим к существованию стационарных состояний с квантованной энергией, и у нас есть метод вычисления этих энергий.
Сразу применив свой метод к самым классическим квантовым системам, Гейзенберг и его соратники вычислили квантованную энергию линейного осциллятора, атома водорода и т.д. Часто их результаты оказывались в полном согласии со старой квантовой теорией, однако иногда совершенно от них отличались. Так, например, в случаях линейного осциллятора, они получили вместо закона целых квантов, который предполагал Планк, закон полуцелых квантов, о котором мы уже упоминали и который лучше согласуется с экспериментальными фактами.
Воодушевленные очень интересными результатами квантовой механики, строгостью и точностью ее формализма, толпы теоретиков бросились вслед Гейзенбергу, внося в его теорию все новые важные дополнения.
Шредингер опубликовал свою работу и с изумлением заметил, что метод квантования волновой механики ведет к тем же результатам, что и метод квантовой механики, хотя они различаются по духу. Он интуитивно почувствовал, что этот факт не случаен, и блестяще сумел объяснить его.
3. Тождество квантовой и волновой механики
В своей работе Шредингер руководствовался идеей, что с помощью волновой функции волновой механики можно построить величины, обладающие свойствами матриц квантовой механики. При этом квантовая механика оказывается методом, позволяющим вычислять эти величины и оперировать ими, не обращаясь явно к волновой функции. Таким образом, можно доказать идентичность этих двух форм новой механики.
Изучая проблему квантования в волновой механике, находят различные стационарные волны рассматриваемой системы и вычисляют соответствующие волновые функции. Эти функции называются собственными функциями системы: они образуют некую, как будем предполагать, дискретную последовательность. Во многих важных случаях это действительно так. Допустим теперь, что мы скомбинировали эти собственные функции во всевозможные пары. Получим, таким образом, два типа пар: пары, построенные из одинаковых собственных функций, и пары из различных собственных функций. Первые относятся к одному стационарному состоянию, вторые – к двум различным стационарным состояниям. Поэтому можно считать, что последние описывают переход между этими двумя стационарными состояниями.
Таким образом, из этих парных комбинаций волновых функций получим набор элементов, который можно поставить в однозначное соответствие с элементами гейзенберговской матрицы. Но поскольку, согласно Гейзенбергу, каждой физической величине отвечает своя матрица, то, следовательно, для каждой величины мы должны образовать разные комбинации собственных функций.
Следовательно, возникает существенно новая и важная идея. Она заключается в том, что каждой физической величине необходимо поставить в соответствие некий символ операции, определенный оператор. Для того чтобы, не задумываясь, написать уравнение распространения волны, связанной с частицей, Шредингер заменил компоненты импульса оператором, пропорциональным производным по сопряженным координатам, причем множитель пропорциональности содержал постоянную h.
Естественно также предположить, что каждой координате соответствует умножение на эту координату. Поскольку все механические величины, характеризующие поведение частицы, можно выразить с помощью координат и компонент импульса (сопряженных импульсов Лагранжа), то только что сформулированные правила позволяют нам найти оператор, соответствующий любой механической характеристике частицы. Если образовать оператор энергии, то получим оператор Гамильтона, с которым мы встречались при построении волнового уравнения. Обобщая этот вывод, приходим к принципу, согласно которому всем физическим величинам сопоставляются операторы. Этот принцип положен в основу новой механики.
Теперь уже можно понять, как Шредингер построил матрицы, которые он хотел отождествить с матрицами квантовой механики. Пусть имеется некоторая механическая величина, характеризующая движение частицы и соответствующий ей оператор, правило построения которого мы знаем. Каждой паре собственных функций рассматриваемой системы можно, таким образом, сопоставить величину, образованную следующим образом. Оператор, о котором идет речь, действует на одну из функций пары, результат множится на комплексно сопряженное значение другой функции и интегрируется по всему пространству.
Повторяя подобную операцию со всеми парами собственных функций, получаем систему элементов, одни из которых относятся к одному стационарному состоянию, другие – к двум стационарным состояниям, т.е. к переходам. Эти элементы располагают в таблицу, причем элементы первого типа помещают на диагонали (диагональные элементы). Каждой механической величине сопоставляется, таким образом, матрица. Вопрос теперь заключается лишь в том, можно ли отождествить эти матрицы и матрицы квантовой механики.
Ответ на этот вопрос утвердительный. Шредингер прежде всего показал, что матрицы, построенные только что описанным способом, должны удовлетворять, как и матрицы Гейзенберга, правилам сложения и перемножения алгебраических матриц. Кроме того, несколько странный путь, которым постоянная Планка проникла в квантовую механику, получил в концепции Шредингера немедленное объяснение. Произведение двух операторов, вообще говоря, не коммутирует: полученный результат зависит от порядка сомножителей.
Тем не менее во многих случаях два оператора, соответствующих механическим величинам, коммутируют. Однако имеется исключение, когда этими величинами являются координата и сопряженная компонента импульса, ибо оператор, отвечающий последнему, пропорционален производной по сопряженной координате, а операция «производная по некоторой переменной» не коммутирует, как легко видеть, с операцией «умножение на эту переменную».
Отсюда немедленно следуют сформулированные Гейзенбергом правила перестановки. Чтобы завершить отождествление рассматриваемых матриц, остается лишь показать, что матрицы волновой механики подчиняются каноническим уравнениям квантовой механики. Вот как это было сделано: Шредингер показал, что из канонических уравнений строго следует, что волновые функции, использованные при конструировании матриц, обязательно удовлетворяют волновым уравнениям волновой механики. Короче говоря, канонические уравнения квантовой механики эквивалентны волновым уравнениям волновой механики.
Таким образом, оказалось, что обе формы новой механики сводятся одна к другой. Теперь больше не вызывает удивления тот факт, что они приводят в проблеме квантования к одинаковым результатам. Метод квантовой механики, оперирующий прямо с матрицами и не имеющий дела с промежуточными величинами – волновыми функциями, более компактен и часто быстрее приводит к желаемым результатам. Метод же волновой механики лучше удовлетворяет интуиции физиков и лучше согласуется с образом их мыслей. Поэтому на первый взгляд он кажется более естественным и удобным для работы. Действительно, большинство физиков пользуется волновым методом и при расчетах явно использует волновые функции.
4. Принцип соответствия в новой механике
Новая механика позволяет придать гораздо более точную форму принципу соответствия и частично устранить поводы для критики, которой он подвергался в рамках старой квантовой теории. Мы уже видели, как Бор пытался использовать разложение в ряд Фурье электрического момента, соответствующего в классической модели начальному или конечному состоянию квантового перехода, чтобы предсказать поляризацию и интенсивность излучения при этом переходе. В случае больших квантовых чисел этот метод вполне удовлетворителен и свободен от всяких неопределенностей.
Однако в случае средних и малых квантовых чисел, практически наиболее важном, возникают трудности и двусмысленности. Наоборот, в новой механике сразу получается весьма ясный способ применения принципа соответствия. Действительно, в матрице, отвечающей компоненте электрического момента, каждый переход описывается одним и только одним элементом. Рассматривая матричный элемент, соответствующий определенному переходу, как амплитуду данной компоненты дипольного момента для данного перехода, можно, пользуясь формулой, аналогичной классической формуле, дать необычайно точное и недвусмысленное предсказание характера излучения при данном переходе. Конечно, в этом способе остается недоказанным, насколько законно применять для расчета указанных интенсивностей формулы классического типа. Однако это утверждение – один из наиболее существенных постулатов метода соответствия. Если принять эту гипотезу, то больше не останется никакого произвола и нестрогости в применении принципа соответствия.
В такой строгой форме принцип соответствия был установлен Гейзенбергом при создании матричной механики. На язык волновой механики его «перевел» Шредингер. Эти выдающиеся физики даже предложили одно наглядное объяснение роли матричных элементов в расчете излучения. Электрон в атоме нельзя больше считать локализованным в каждый момент времени. Есть лишь определенная вероятность найти его в той или иной точке, вероятность, пропорциональная согласно принципу интерференции квадрату модуля волновой функции. Это позволяет нам считать электрон как бы размазанным внутри атома, а его электрический заряд – в среднем распределенным непрерывным образом. Согласно Шредингеру, можно было бы применить принцип соответствия, сказав, что все происходит таким образом, как будто электрическая система (изменяющаяся во времени) излучает в соответствии с классическими законами. На первый взгляд такая точка зрения кажется вполне удовлетворительной, ибо она позволяет нам вновь получить боровский закон частот. Однако, изучив ее внимательнее, мы видим, что на этом пути возникают серьезные трудности, и от него приходится отказаться. В действительности процесс излучения при квантовых переходах является по своей сущности настолько дискретным, что его нельзя строго представить себе как излучение некоторым, пусть фиктивным, распределением электричества, происходящим по классическим законам. Единственная поистине корректная интерпретация роли матричных элементов заключается в том, что согласно идеям, установленным в связи с принципом соответствия, матричные элементы позволяют вычислить вероятность того, что некоторое состояние претерпевает в единицу времени определенный квантовый переход.
Принцип соответствия новой механики позволяет вычислить интенсивность и поляризацию спектральных линий и, что особенно важно, вновь получить правила отбора. Он позволяет также решить огромное число задач, касающихся взаимодействия вещества и излучения, среди которых я укажу лишь на задачу рассеяния света и дисперсии. Теперь можно строго получить формулу Крамерса – Гейзенберга, выведенную ранее с помощью приближенных соображений соответствия.
Применение метода соответствия к изучению взаимодействия вещества и излучения дало вполне удовлетворительные результаты и определенно содержит большую долю истины. Тем не менее нельзя не заметить, что, систематически применяя формулы электродинамики, записанные соответствующим образом, постоянно упускают из виду корпускулярную природу света. Действительно, рассеяние света атомом можно было бы рассматривать как задачу о соударении фотона с атомом, рассмотренную методами волновой механики. Чтобы успешно решить поставленный вопрос с этой точки зрения, необходимо попытаться ввести понятие о фотонах в электромагнитные колебания, иными словами, проквантовать электромагнитное поле.
Глава X. Вероятностная интерпретация новой механики
1. Общие идеи и основные принципы
Понятие вероятности играло важную роль в первых физических трактовках волновой механики. Чувствовалось, что возникла общая теория, в которой все законы новой механики имеют вероятностный характер. К этой теории, внешне очень новой и отвергающей многие классические идеи, постепенно приковывалось внимание всех физиков. Можно сказать, что сегодня ее приняли все, даже те, кто поверил в нее временно, и не оставляют надежды в один прекрасный день возвратиться к классическим представлениям.
Начнем с внешне почти банальной идеи о том, что для точного знания какой-либо физической величины нужно ее измерить. А для ее измерения всегда нужен некий прибор, который как-то воздействует на эту величину, в результате чего она становится известной с такой-то степенью точности. В классической физике a priori предполагалось, что, приняв соответствующие меры предосторожности, всегда можно так провести эти измерения, чтобы существенно не нарушить состояния, которое было до измерения. При этих условиях процесс измерения лишь устанавливает существование некоторого состояния, не внося ничего нового.
В макроскопических масштабах этот постулат, неявно допускаемый классической физикой, правилен. В этой области способный экспериментатор всегда может количественно исследовать явление, не внося значительных искажений. Это следует из того, что возмущения, которые возникают в процессе измерения, можно всегда уменьшить настолько, чтобы сделать их пренебрежимо малыми по сравнению с измеряемыми величинами. Напротив, когда мы имеем дело с микроскопическими величинами, из существования кванта действия следует, что возмущения, возникающие в процессе измерения, бесконечно уменьшать нельзя. Поэтому каждое измерение существенно искажает исследуемое явление.
Эти идеи будут отчетливо сформулированы несколько ниже, когда мы будем приводить примеры в пользу соотношений неопределенности, данные в основном Бором и Гейзенбергом. Пока же достаточно заметить, что ниоткуда не следует, что операция измерения является простым и хорошим способом получения сведений о существовавшем до этого измерения состоянии. Вполне возможно, что операция измерения сама участвует в создании нового состояния, извлекая из существовавшего до этого состояния одну из содержащихся в нем возможностей. А теперь попытаемся строго сформулировать роль измерений с новой точки зрения.
Для этой цели будет полезно вернуться к некоторым классическим экспериментам физической оптики. Снова, как и раньше, начав с дуализма фотонов и световых волн, мы будем иметь больше возможностей разобраться в этом вопросе. Представим себе вполне обычный эксперимент: спектральный анализ сложного луча света с помощью призмы (или дифракционной решетки). Прибор разделяет (как это было известно еще со времен Ньютона) различные монохроматические компоненты, содержащиеся в падающем пучке. В XIX в. много обсуждали вопрос о том, разделяет ли призма монохроматические компоненты, существовавшие в падающем пучке уже до этого, или они образуются под воздействием призмы. На этот вопрос не было дано сколько-нибудь удовлетворительного ответа. В конце концов наиболее осторожная позиция заключалась в следующем: монохроматические компоненты существуют в падающем свете виртуально, в некоем потенциальном состоянии. Это мнение подтверждается анализом квантовой природы света.
По существу мы попытаемся ввести в объяснение разложения света призмой идею фотонов. С этой точки зрения можно сказать, что призма разделяет фотоны на строго определенные цветовые группы: она выделяет из падающего пучка красные, желтые и синие фотоны. Но можно себе представить такой эксперимент, когда пучок настолько слаб, что фотоны попадают на призму поодиночке. Каждый фотон соответствует падающей волне, которая согласно предположению не монохроматическая. Поэтому падающему фотону нельзя приписать ни определенной частоты, ни согласно соотношению Эйнштейна определенной энергии. Падающий фотон обладает как бы несколькими возможными частотами, появляющимися в спектральном разложении соответствующей световой волны. Однако, пройдя сквозь призму, падающий фотон становится одним из фотонов монохроматических пучков, разделенных воздействием призмы. Теперь, следовательно, он обладает вполне определенной частотой.
Таким образом, призма оказывается инструментом, позволяющим измерить частоту (или энергию) фотонов: этот прибор как раз и извлекает из состояния, которое существовало до измерения, одну из содержащихся в нем возможностей. Теперь необходимо вычислить вероятность такого действия призмы на падающий фотон, чтобы он имел определенный цвет. Волновая теория немедленно дает количественный ответ на этот вопрос. Падающую волну можно представить в виде разложения Фурье, в котором каждая монохроматическая компонента обладает определенной амплитудой. Действие призмы заключается в разделении этих монохроматических компонент без изменения их амплитуды. Энергия же падающего на призму света на выходе разделяется между различными выходящими монохроматическими пучками пропорционально квадратам этих амплитуд, т.е. интенсивностям различных компонент Фурье. Можно поэтому сказать: вероятность, что фотон, пройдя через призму, будет иметь определенную частоту, пропорциональна парциальной интенсивности, соответствующей этой частоте в разложении Фурье падающей световой волны. Это рассуждение, переведенное на язык волновой механики и соответствующим образом обобщенное, позволяет понять происхождение общей теории вероятностной трактовки квантовой механики.
Новая механика ставит в соответствие каждой механической величине некий оператор, который можно построить во всех случаях. Все операторы, о которых идет речь, относятся к классу линейных эрмитовских операторов. Математическая теория собственных значений позволяет поставить в соответствие этим операторам собственные значения и собственные функции. Поскольку эти операторы эрмитовские, собственные значения их будут действительными числами, образующими непрерывную, дискретную или смешанную последовательность, которая называется спектром этого оператора.
Собственные функции образуют, по крайней мере в общем случае, полный набор ортогональных функций, т.е. какой бы ни была любая непрерывная функция, ее можно разложить в ряд по этим собственным функциям. С этими свойствами собственных функций и собственных значений мы уже встречались, когда говорили о собственных значениях и собственных функциях оператора Гамильтона в шредингеровском методе квантования. В этом методе предполагалось, что лишь некоторые, значения энергии квантованной системы являются собственными значениями оператора Гамильтона, который соответствует ее энергии. Обобщая эту идею, общая вероятностная теория волновой механики выдвигает следующий первый основной постулат, который можно назвать принципом квантования: точное измерение какой-либо механической величины может дать в качестве значения этой величины лишь одно из собственных значений соответствующего оператора.
В каждом случае этот постулат фиксирует возможные значения механической величины. Очевидно, его нужно дополнить вторым постулатом, говорящим о том, каковы вероятности измерения различных значений некоторых величин для частицы, начальное состояние которой до намерения известно, т.е. какова вероятность получить возможные значения этих величин в результате измерения. В волновой механике начальное состояние частицы, известное до измерения, изображается определенной волновой функцией. Это и есть ψ-волна, которая возмущается измерительным прибором. Аналогия с разложением спектра призмой подсказывает, каким должен быть второй постулат. Действительно, ψ-волну можно разложить в ряд по собственным функциям, соответствующим измеряемой физической величине. Совершенно естественно предположить, что квадраты амплитуд компонент этого спектрального разложения служат мерой относительных вероятностей различных допустимых значений. Итак, можно сформулировать второй фундаментальный постулат, обобщенный принцип спектрального разложения: вероятности различных возможных значений некоторой механической величины, характеризующей частицу, волновая ψ-функция которой известна, пропорциональны квадратам модуля амплитуд соответствующих компонент спектрального разложения ψ-функции по собственным функциям рассматриваемой величины.
Совершенно очевидно, что метод спектрального разложения Борна, который применяется к квантованию специальной механической величины – энергии – есть частный случай этого второго принципа.
Гораздо менее очевидно, что уже упоминавшийся принцип интерференции – тоже частный случай этого принципа. Однако рассуждения, которые нельзя здесь приводить, показывают, что, применяя обобщенный принцип спектрального разложения к другой специальной механической величине – координате частицы, – мы получим принцип интерференции. Таким образом, оба принципа, которые мы ввели в одной из предыдущих глав для того, чтобы приступить к физической интерпретации волновой механики, оказываются частными случаями второго фундаментального постулата общей теории.
Два этих постулата, введенные в настоящем разделе, представляют, следовательно, достаточную основу для полной и ясной вероятностной интерпретации новой механики. Возникают, очевидно, еще мелкие дополнительные вопросы: чтобы получить значения вероятностей в абсолютной мере, необходимо нормировать собственные функции и ψ-функцию; чтобы учесть вырожденные случаи, когда имеются многократные собственные значения, необходимо расширить формулировку второго принципа и т.д. Однако это детали. Основы же теории сформулированы в логически удовлетворительной форме.
А теперь мы хотим предупредить возражение, которое может возникнуть у многих читателей при чтении этого раздела: не оказывается ли эта вероятностная интерпретация новой механики, хотя и очень красивая и очень ясная, несколько произвольной. Зачем нужны понятия, столь сложные и столь противоречащие привычным представлениям классической механики? Оказывается, что вероятностная интерпретация это единственная возможная на сегодняшний день. Это означает, что сегодня она одна позволяет объяснить в рамках волновой механики все квантовые явления, которые наблюдаются экспериментально. Ни одна из попыток, сделанных в любых других направлениях, не привела к успеху. Автору данной книги это известно лучше, чем кому-либо другому, ибо он сам предпринимал попытки такого рода, которые ему в конце концов пришлось оставить из-за возникших непреодолимых трудностей.
Итак, можно сказать, что введенные выше фундаментальные постулаты оправданы тем, что на их основе можно построить последовательную теорию, согласующуюся со всеми экспериментальными фактами, и невозможно построить никакой другой теории, обладающей такими же свойствами. Таково положение со всеми физическими теориями, ибо в основе любой физической теории лежат произвольные постулаты, и успех их в том именно и заключается, что их применение правильно описывает наблюдаемые явления.
Ниже мы строго установим глубокое различие между вероятностной интерпретацией новой механики и классическими теориями. Здесь же ограничимся указанием, что изученные в настоящем разделе принципы в более абстрактной и даже более общей форме под именем теории преобразований легли в основу работ Дирака и Иордана.
2. Соотношение неопределенностей
Физическая интерпретация новой механики ведет к очень интересным и важным следствиям, на которые впервые обратил внимание Гейзенберг. Математически они выражаются неравенствами, известными сегодня под названием соотношений неопределенности. Гейзенберг вывел эти неравенства из некоммутативности величин в своей новой квантовой механике. Чтобы пояснить их смысл, будем исходить из представления, которое дает нам волновая механика. Покажем, что эти соотношения – неизбежное следствие описанной физической интерпретации волновой механики, если предположить, что состояние частицы всегда изображается ψ-волной.
Прежде всего рассмотрим плоскую монохроматическую волну, описывающую свободную частицу. Мы знаем, что этой волне соответствует вполне определенное состояние движения, в данном случае определенное значение вектора импульса. Именно это мы имеем в виду, когда говорим, что рассматриваемое состояние есть собственное состояние оператора импульса, или чистое состояние движения с определенным импульсом и, значит, также энергией. Но плоская монохроматическая волна всюду имеет постоянную амплитуду. Поэтому из принципа интерференции следует, что положение частицы совершенно неопределенно, т.е. найти частицу в любой точке пространства можно с одинаковой вероятностью. Итак, мы утверждаем, что полная определенность состояния движения частицы означает согласно принципам новой механики совершенную неопределенность ее положения в пространстве. Конечно, случай, когда со свободной частицей связана плоская и монохроматическая ψ-волна, совершенно особый. В общем случае ψ-волны будут образовывать волновой пакет – суперпозицию некоторого числа плоских монохроматических волн. Этот волновой пакет можно локализовать в ограниченной области пространства. Таким образом, положение частицы будет определено лучше, она обязательно будет находиться в области, занятой волновым пакетом, единственной области, где амплитуда отлична от нуля.
При этом мы столкнемся с интересным свойством математического представления волнового пакета в виде интеграла Фурье. Оно заключается в том, что чем меньше размеры волнового пакета, тем шире спектральный интервал, который занимают компоненты разложения Фурье. Кратко этот вывод можно сформулировать так: чем меньше размеры волнового пакета, тем дальше он от монохроматичности. Таким образом, если обратиться к принципам интерференции и спектрального разложения, становится очевидным, что состояние движения частицы тем более неопределенно, чем лучше определено ее положение в пространстве. Сколько мы приобретаем в одном, столько теряем в другом. Наконец, обратимся к другому предельному случаю, противоположному плоской монохроматической волне. Для этого представим себе волновой пакет ψ-функции бесконечно малого размера. Положение частицы при этом известно точно: мы имеем здесь дело с чистым состоянием с определенной координатой. Но в этом предельном случае волновой пакет можно представить только интегралом Фурье по всевозможным плоским монохроматическим волнам, и, исходя из наших фундаментальных принципов, мы должны сказать, что состояние движения совершенно неопределенно.
Таким образом, точное знание положения означает полное незнание состояния движения. Общий вывод заключатся в том, что фундаментальные принципы, положенные в основу физической интерпретации волновой механики, вместе с методом представления волнового пакета в виде суперпозиции монохроматических волн означают невозможность строго в один и тот же момент времени определить положение и состояние движения частицы.
Только что мы описали, правда, скорее в качественной форме, путь, который позволяет легче понять причины, приведшие Гейзенберга к соотношениям неопределенности. В более строгой форме эти же рассуждения позволяют сформулировать следующий результат: произведение неопределенности в значении координаты на неопределенность в значении соответствующей компоненты импульса всегда не меньше, чем величина порядка постоянной Планка h. Таким образом, получаются некоторые неравенства. Они показывают, что координаты частицы и соответствующей компоненты импульса не могут быть точно известны в один и тот же момент времени, и что, если неопределенность одной из двух сопряженных величин очень мала, то непременно неопределенность другой – очень велика.
Еще раз подчеркнем, что соотношения неопределенности – неизбежное следствие, с одной стороны, возможности сопоставить частице некоторую волну, с другой – общих принципов вероятностной интерпретации. Однако вместе с тем необходимо указать, что ни одно измерение никогда не может дать значений положения и импульса частицы с большей точностью, чем это позволяют соотношения неопределенности. Не будь этого, было бы невозможно (и это можно доказать) всегда сопоставить частице определенную волну. Гейзенберг и Бор провели строгий и глубокий анализ процесса измерения и показали, что ни одно измерение не может дать результатов, противоречащих соотношениям неопределенности. И это, как мы видим, обусловлено двумя причинами, очевидно, связанными между собой: существованием кванта действия, с одной стороны, и дискретной природой вещества и излучения, с другой.
Чтобы понять, почему эксперимент не может дать большей точности, чем позволяют соотношения неопределенности, предположим, что мы пытаемся точно определить положение частицы в пространстве. Самый тонкий способ исследовать пространство в пределах очень малых размеров, который имеется в нашем распоряжении, это коротковолновое излучение.
Этот метод, гораздо более точный, чем любой механический метод, позволяет различить в пространстве две точки, расстояние между которыми порядка длины волны. Чтобы точнее определить координату частицы, нам нужно взять длину волны излучения тем короче, чем с большей точностью необходимо знать координату. Но здесь в виде кванта излучения проявляется существование кванта действия. Чем больше мы уменьшаем длину волны нашего излучения, тем больше увеличиваем его частоту, а следовательно, энергию его фотонов. Увеличивается при этом и импульс, который эти фотоны могут передать исследуемой частице. Измерительный же прибор, приспособленный для точного определения координаты частицы, оставляет нас в полном неведении относительно значения ее импульса в процессе измерения.
Таким образом, конечное состояние движения частицы, полученное после измерения, будет тем более неопределенным, чем более точно измерено ее положение в пространстве. Выражая количественно проведенное рассуждение, мы снова получим соотношение неопределенности. С другой стороны, представим себе эксперимент, имеющий целью точное определение состояния движения: например, измерение скорости электрона можно провести, изучая эффект Доплера при рассеянии света. Мы опять придем к заключению, что чем точнее прибор определяет состояние движения частицы, тем более неопределенным будет ее положение. Соотношения неопределенности оказываются математическим выражением этого обстоятельства. Мы не можем приводить здесь подробно многочисленные примеры, данные Бором, Гейзенбергом и другими, ибо для этого потребовались бы графики и формулы. Эти примеры вполне убедительны, и сегодня большинство физиков, по-видимому, согласно допускать, что невозможно построить измерительный прибор, который позволил бы нарушить ограничения, накладываемые неравенствами Гейзенберга.
Прежде чем перейти к изучению некоторых философских аспектов результатов, полученных в последних двух разделах, нам бы хотелось показать, почему соотношения неопределенности и вообще общие принципы вероятностной интерпретации, приведенные выше, не противоречат твердо установленным выводам старой механики, а, наоборот, позволяют рассматривать их как первые приближения.
3. Сопоставление со старой механикой
Уже на заре развития квантовой теории было очевидно; что классическая механика не может быть строго правильной. Причиной этого было само существование кванта действия. Иными словами, если бы постоянная Планка была равна нулю, классическая механика была бы строгой. Повсюду в старой квантовой теории, от планковской теории излучения черного тела до последних разработок идей Бора и Зоммерфельда, мы обнаруживаем, что квантовые формулы переходят в классические, если величину h устремить к нулю.
Эта фундаментальная идея снова подтверждается в новой механике. С точки зрения квантовой механики все различия между старой и новой механикой возникают из некоммутативности матриц, соответствующих каждой из координат, с матрицами, отвечающими сопряженным по Лагранжу импульсам, причем разность переставленных произведений этих матриц, пропорциональная h, исчезает, если величину h положить равной нулю. Если мы предпочтем точку зрения волновой механики, то заметим, что длина ψ-волны, пропорциональная h, обращается в нуль, когда h исчезает. Но при этом всегда оказывается справедливой геометрическая оптика, ибо легко видеть, что методы геометрической оптики можно применять во всех случаях, когда длина волны бесконечно мала. Поэтому, когда h стремится к нулю, уравнение распространения ψ-волны всегда можно заменить уравнением геометрической оптики, т.е. уравнением Якоби. Таким образом, новая и старая механика асимптотически совпадают.
Легко понять, почему классическая механика практически всегда остается справедливой, когда мы имеем дело с макроскопическими явлениями. По существу эти явления описываются столь большими значениями физических величин, что квантом действия можно при этом совершенно пренебречь, и его влияние полностью маскируется неизбежным недостатком точности физических измерений. Это легко уяснить на численных примерах и показать, скажем, что для того, чтобы подтвердить неравенство Гейзенберга для шарика весом в одну десятую миллиграмма (чрезвычайно благоприятный случай ввиду необычайной легкости шарика), было бы необходимо, даже если скорость известна с точностью до одного миллиметра в секунду, измерить положение его центра тяжести с точностью, не меньшей чем 10-20 сантиметра! Чтобы еще лучше понять, как достигается соответствие между старой и новой механикой, рассмотрим более подробно один частный случай.
Предположим, что мы изучаем крупномасштабное движение частицы, например движение электрона в магнитном поле. Мы знаем, что такое движение можно точно описать, исходя из представлений классической механики. Как это согласуется с соотношениями неопределенности? Для ответа на этот вопрос прежде всего заметим, что в условиях этого макроскопического эксперимента самые маленькие расстояния, которые мы можем измерять прямым способом, во много раз больше длины волны, соответствующей исследуемой частице. Следовательно, может существовать волновой пакет, размеры которого меньше тех, что мы можем прямо измерить, и который тем не менее будет образован волнами почти одинаковой длины.
Таким образом, точный и хорошо проведенный эксперимент может позволить, не вступая в противоречие с соотношениями Гейзенберга, представить состояние частицы после измерения в виде некоего волнового пакета. Поскольку этот пакет практически локализован в точке и практически для нас монохроматичен, мы можем в пределах точности макроскопического измерения получить строго определенные положение и скорость частицы. Кроме того, фундаментальный результат, полученный на самой заре развития волновой механики, гласит, что группа ψ-волн перемещается со скоростью, которую классическая механика, приписывает соответствующей частице. Таким образом, наш квазиточечный волновой пакет двигается в точности как классическая частица и, так как согласно принципу интерференции реальная частица должна всегда находиться внутри волнового пакета, все происходит так, будто реальная частица подчиняется законам классической механики. Как видно из этого примера, лишь недостаточная точность наших макроскопических измерений маскирует квантовую неопределенность. Итак, оказывается, нет никаких серьезных трудностей в согласовании новой механики со старой. К тому же квантовая физика построена так, что включает классическую физику в свои более широкие рамки. Снова, как во всей истории науки, прогресс идет путем последовательных приближений к истине.
4. Индетерминизм в новой механике
Уравнения классической механики целиком и полностью определяют движение системы, если в начальный момент времени известны положения и состояния движения каждой из ее частей. Таким образом, можно полностью предсказать классическое движение частицы, если известны ее положение и скорость в некоторый начальный момент времени. Эта возможность самым неумолимым образом предсказать будущее механической системы, когда имеются данные о ее состоянии в некоторый момент времени, определяет детерминизм классической механики.
Поразительные успехи, достигнутые этой механикой, особенно в области математической астрономии, привели к тому, что все физики пытались создавать теории, которые бы всегда удовлетворяли условия детерминизма. Макроскопические явления, изучавшиеся ими тогда, были подчинены этому требованию, и вся классическая теоретическая физика покоится на дифференциальных уравнениях в полных или частных произведениях, которые позволяют строго вычислить эволюцию любой произвольной физической системы, исходя из определенных данных о ее начальном состоянии. Даже в тех областях физики, где были введены вычисления вероятностей, всегда предполагали, что элементарные процессы строго детерминированы и что только очень большое число и беспорядочность элементарных процессов, из которых состоят наблюдаемые явления, позволяют обратиться к статистическим методам и понятию вероятности. Более или менее сознательно внутренний детерминизм явлений природы, требующий, чтобы их можно было полностью предсказать, по крайней мере в принципе, стал чем-то вроде научной догмы. Развитие новых квантовых теорий абсолютно изменило эту ситуацию.
Можно отдать себе отчет в различии, которое возникает в этом смысле, между старой и новой механикой. Для этого заметим, что элементы, одновременное знание которых в начальный момент времени необходимо в классической механике, чтобы строго предсказать эволюцию системы, – это как раз те самые, одновременное определение которых невозможно согласно соотношениям неопределенности. Для того чтобы строго решить классические уравнения движения системы, необходимо знать расположение и состояние движения ее частей в некоторый момент времени. Поскольку любую систему можно с точки зрения современной физики, учитывая приведенные рассуждения, свести к набору частиц, то нужно знать координаты и скорости (или импульсы) различных частиц системы в один и тот же момент времени. Сущность же соотношений неопределенности заключается в том, что точное и одновременное знание этих величин невозможно. Конечно, величина постоянной h, необычно малой по сравнению с нашими обычными масштабами, делает квантовую неопределенность физических явлений обычных масштабов пренебрежимо малой и детерминизм, по-видимому, строгим. Однако при микроскопическом изучении физических явлении неопределенность уже значительна и ее достаточно, чтобы сделать совершенно невозможным описание хода событии согласно требованиям детерминизма.
Исчезнувший или, по крайней мере, сильно ослабленный детерминизм в квантовой физике заменяется вероятностными законами. Однако обращение к вероятности имеет здесь совершенно иное значение, чем, скажем, в статистической механике. В классических теориях, где появляются вероятности, считают, что элементарные процессы подчинены строгим законам. Вероятности вводились там для описания явлений крупного масштаба, включающих огромное число элементарных процессов. В квантовой физике, наоборот, вероятности прямо вводятся для описания хода элементарных процессов. Чтобы лучше понять постановку вопроса, мы должны отчетливо показать, как новая механика описывает ход элементарных процессов с помощью волн.
Для этой цели рассмотрим одну частицу. Наши рассуждения легко можно обобщить на систему частиц, воспользовавшись методом, который описывается в гл. XII.
Задача теоретической физики заключается в том, чтобы, зная результат определенного числа наблюдений или экспериментов, предсказать результат других наблюдений или предстоящих экспериментов. В классической механике предполагается, что можно одновременно измерить координату и скорость частицы, а затем с помощью уравнений классической динамики в принципе строго предсказать результаты наблюдений или измерений, которые будут проведены с этой частицей в более поздние моменты времени. Наоборот, в новой механике мы вынуждены предполагать невозможность одновременного и точного измерения координат и импульса частицы. Даже измерения, проведенные с возможной наивысшей точностью, не могут дать об этих величинах сведений, содержащих меньшую неопределенность, чем позволяют неравенства Гейзенберга. Состояние частицы, о котором мы узнаем в результате измерения, будет описываться связанной с ней волной, которая никогда не может быть одновременно локализованной и монохроматической. Она всегда обладает некоторой протяженностью либо в пространстве, либо в спектре частот, а вообще говоря, и там и тут. Так, уравнение распространения позволяет, исходя из известной в начальный момент волновой ψ-функции, точно вычислить эволюцию волны за период, когда не производится никаких наблюдений или измерений.
Следовательно, оно позволяет установить в каждый момент времени вероятность получения того или иного значения какой-либо характеристики движения частицы, если в этот момент времени будет проведено соответствующее измерение. По существу каждое новое измерение дает сведения о новом состоянии частицы. Теперь уже совершенно нельзя говорить о вероятностях, ибо всякое понятие вероятности того или иного события исчезает, как только сведения об этом событии получены. Поэтому после этого нового измерения необходимо построить новую ψ-волну, которая будет изображать новое состояние частицы. Снова возвращаясь к идее, изложенной в начале главы, мы можем сказать, что каждый эксперимент благодаря существованию кванта действия приводит к неконтролируемому возмущению состояния частицы, которое не позволяет установить строгую причинную связь между предыдущим и последующим состояниями.
Это возмущение связано с существованием кванта действия, ибо именно он стоит на пути неограниченного уменьшения неопределенностей, возникающих в процессе измерения. Эволюция волновой функции между двумя последовательными измерениями полностью определяется ее начальным видом и уравнением распространения: ее поведение строго детерминировано. Но отсюда никоим образом не следует, что существует строгий детерминизм для наблюдаемых и измеряемых процессов. Каждое новое наблюдение и измерение добавляет новые элементы и нарушает правильную эволюцию ψ-волны.
Гейзенберг привел пример применения такого рода рассуждений. Он описал два последовательных измерения положения частицы. Первое измерение позволяет локализовать частицу в небольшой области пространства. Соответствующая волна в результате этого первого измерения будет представлять собой пакет, заключенный в этой области пространства (без этого мы бы пришли в противоречие с принципом интерференции). Этот волновой пакет, который волей-неволей далек от монохроматичности, будет сам собой расплываться согласно уравнению распространения.
Второе измерение положения, проведенное в некоторый последующий момент времени, позволит локализовать частицу в новом малом объеме, который обязательно будет лежать внутри области, занятой к этому времени волновым пакетом, и который будет гораздо меньшего размера. Иными словами, в результате распространения волны область возможных положений частицы очень быстро растет, и роль второго измерения заключается в том, чтобы резко ее ограничить. После проведения второго измерения необходимо построить новый волновой пакет ψ, размеры которого значительно меньше размеров первого пакета в конечном состоянии. Эта новая форма ψ-волны будет исходной для новой эволюции волновой функции.
Теперь мы можем понять, как представления новой квантовой физики разрушают старые требования детерминизма. По-видимому, все же существуют случаи, когда результаты измерения какой-либо характеристики можно предсказать с совершенной определенностью. Это бывает тогда, когда состояние перед измерением представляет собой чистое состояние, соответствующее этой характеристике, или, иными словами, когда разложение ψ-функции по собственным функциям, соответствующим этой величине, сводится к одному единственному члену. Так будет в случае измерения энергии или импульса частицы, которой соответствует плоская монохроматическая волна. Однако эти случаи являются исключительными. Можно было бы даже сказать, что вероятность таких состояний, строго говоря, равна нулю.
Вопрос об индетерминизме в новой механике много дискутировался. Некоторые физики все еще проявляют величайшее отвращение к требованию отказаться от детерминизма, которое выдвигает современная квантовая физика. Они даже говорят, будто бы нельзя себе представить недетерминистическую науку. Такая точка зрения кажется нам явным преувеличением, ибо квантовая физика все же существует, а она индетерминистическая.
Однако может случиться так, что в один прекрасный день физики вернутся на путь детерминизма и тогда нынешняя ступень науки будет казаться временным отходом, когда несовершенство наших знаний заставило нас на время отказаться от следования по пути строгого детерминизма явлений атомного масштаба. Вполне возможно, что неспособность следовать сегодня в микромире дорогой причинности обусловлена тем, что мы пользуемся понятиями частица, пространство, время и т.д. Эти понятия мы построили, исходя из наших сведений о макроскопических явлениях, а затем перенесли их на описание микромира.
В то же время ниоткуда не следует, что они годятся для описания реальных явлений в этой области. Скорее наоборот. Тем не менее, хотя, по-видимому, еще необходимы фундаментальные реформы, чтобы сделать понимание квантовой физики совершенно ясным, лично мне кажется невероятным, что нам полностью удастся восстановить детерминизм прошлого. Удары, которые нанесло ему развитие новой механики, представляются нам слишком глубокими, чтобы от них можно было легко оправиться. Несомненно, самое мудрое – это констатировать следующее положение: в настоящее время физические процессы, в которых играют роль кванты, не являются больше детерминистическими.
5. Дополнительность, идеализация, пространство и время
Бор, роль которого в развитии современной физики огромна, в своих всегда глубоких и часто очень тонких исследованиях много сделал для уяснения довольно необычного смысла новой механики. В частности, именно он ввел понятие дополнительности, такое любопытное с философской точки зрения.
Бор исходил из идеи, что электрон можно описать с помощью корпускулярной и волновой картины. Удивительно, каким образом два столь различных описания, можно сказать, столь противоречащих друг другу, можно использовать одновременно. Он показал, что это можно сделать только потому, что соотношения неопределенности – следствие существования кванта действия – не позволяют вступить этим двум образам в прямое противоречие. Чем более стремятся уточнить в процессе наблюдений одну картину, тем более смутной становится другая.
Когда длина волны электрона такова, что существенную роль может играть явление интерференции, его нельзя больше считать локализованным и использовать корпускулярные представления. Наоборот, когда электрон строго локализован, его интерференционные свойства исчезают и его нельзя больше описывать с волновой точки зрения.
Волновые и корпускулярные свойства никогда не вступают в конфликт, ибо они никогда не существуют одновременно. Мы пребываем в постоянном ожидании борьбы между волной и частицей, но ее никогда не происходит, так как никогда оба противника не появляются вместе. Понятие электрон, так же как и другие элементарные физические понятия, имеет, таким образом, два противоречивых аспекта, к которым, однако, нужно обращаться по очереди, чтобы объяснить все его свойства. Они подобны двум сторонам одного предмета, которые никогда нельзя увидеть одновременно, но которые, однако, нужно осмотреть по очереди, чтобы полностью описать этот предмет. Эти два аспекта Бор и назвал дополнительными, понимая под этим, что они, с одной стороны, противоречат друг другу, с другой – друг друга дополняют. Оказывается, что это понятие дополнительности играет важную роль в чисто философской доктрине.
Действительно, совсем не очевидно, что мы можем описать физические явления с помощью одной единственной картины или одного единственного представления нашего ума. Наши картины и представления мы образуем, черпая вдохновение из нашего повседневного опыта. Из него мы извлекаем определенные понятия, а затем уже, исходя из них, придумываем путем упрощения и абстрагирования некоторые простые картины, некоторые, по-видимому, ясные понятия, которые, наконец, пытаемся использовать для объяснения явлений. Таковы понятия строго локализованной частицы, строго монохроматической волны. Однако вполне возможно, что эту идеализацию, чрезмерно упрощенный и весьма грубый, по выражению Бора, продукт нашего мозга, нельзя никогда строго применять к реальным процессам. Чтобы описать всю совокупность реального мира, возможно, необходимо применять последовательно две (или больше) идеализации для одного единственного понятия. То одна, то другая будет более подходящей: иногда (в случае, о котором мы говорили в предыдущем разделе) можно считать, что одна из двух точно описывает явление. Однако этот случай будет редким исключением. Вообще же говоря, мы не можем избежать привлечения двух идеальных образов.
Если глубоко вникнуть в очень сложную мысль знаменитого физика, то это поистине одна из самых оригинальных идей, которые внушила Бору квантовая физика. Можно попытаться распространить область приложения этих философских идей за пределы физики, например исследовать, как это сделал сам Бор, не может ли понятие дополнительности найти важное применение в биологии, в понимании двойственности физико-химического и специфически жизненного аспекта в явлениях живой природы. Мы могли бы исследовать также вопрос о том, не окажутся ли все эти идеализации тем менее применимыми к реальной действительности, чем более они совершенны. Не имея склонности к парадоксам, можно утверждать, вопреки Декарту, что нет ничего более обманчивого, чем ясная и отчетливая идея. Однако разумнее остановиться у этой опасной черты и вернуться к физике.
Несомненно, конечно, что наши понятия пространства и времени даже после их углубления теорией относительности нельзя строго применять к описанию атомных явлений. Существование кванта действия обнаружило совершенно непредвиденную связь между геометрией и динамикой: оказывается, что возможность локализации физических процессов в геометрическом пространстве зависит от их динамического состояния. Общая теория относительности уже научила нас рассматривать локальные свойства пространства-времени в зависимости от распределения вещества во Вселенной. Однако существование квантов требует гораздо более глубокого преобразования и больше не позволяет нам представлять движение физического объекта вдоль определенной линии в пространстве-времени (мировой линии). Теперь уже нельзя определить состояние движения, исходя из кривой, изображающей последовательные положения объекта в пространстве с течением времени. Теперь нужно рассматривать динамическое состояние не как следствие пространственно-временной локализации, а как независимый и дополнительный аспект физической реальности.
Действительно, понятия пространства и времени взяты из нашего повседневного опыта и справедливы лишь для явлений большого масштаба. Нужно было бы заменить их другими понятиями, играющими фундаментальную роль в микропроцессах, которые бы асимптотически переходили при переходе от элементарных процессов к наблюдаемым явлениям обычного масштаба в привычные понятия пространства и времени. Стоит ли говорить, что это очень трудная задача? Было бы удивительно, если бы оказалось возможным когда-нибудь исключить из физической теории понятия, представляющие самую основу нашей повседневной жизни. Правда, история науки обнаруживает удивительную плодотворность человеческой мысли и не стоит терять надежды. Однако, пока мы не добились успеха в распространении наших представлений в указанном направлении, мы должны стараться с большими или меньшими трудностями втиснуть микроскопические явления в рамки понятий пространства и времени, хотя нас все время будет беспокоить чувство, что мы пытаемся втиснуть алмаз в оправу, которая ему не подходит.
Глава XI. Спин электрона
1. Тонкая структура и магнитные аномалии
Мы изложили принципы волновой механики электрона. Теперь мы должны показать, почему, несмотря на ее успехи, эта механика в своей первоначальной форме оказалась все же несовершенной и должна претерпеть еще существенные изменения. Причина заключается в том, что волновая механика электрона в своей первоначальной форме не позволяет объяснить некоторых фактов спектроскопических и магнитных измерений, известных уже много лет, которым старая квантовая механика не могла дать объяснения.
К первой категории трудно объяснимых фактов относятся данные спектроскопии. Мы знаем, что старая квантовая теория, а вслед за ней и новая механика, успешно и с большой точностью предсказали существование большого числа спектральных линий. Однако таблицы спектральных линий, полученные на основе этих теорий, как выяснилось, оказались неспособны передать всю сложность реальных спектров. Иными словами, в оптических и рентгеновских спектрах существуют линии, которые не находят объяснения. Мы видели, что Зоммерфельд, использовав идеи теории относительности в рамках старой квантовой теории, добился успеха в объяснении тонкой структуры водородного спектра и рентгеновских спектров. Он пошел путем, который на первый взгляд выглядит вполне удовлетворительно, однако более внимательное изучение не вполне подтверждает это благоприятное впечатление: теория Зоммерфельда правильно предсказывает образование дублетов серии Бальмера и рентгеновских серий, однако их положения она указывает неправильно. Не следует думать, что кажущийся успех Зоммерфельда был чисто случайным, однако всегда чувствовалось, что в его теории отсутствует какой-то важный элемент. Ситуация далеко не прояснилась с созданием волновой механики. Наоборот, она ухудшилась. Действительно, чтобы перевести попытки Зоммерфельда на язык волновой механики, необходимо было ввести в нее элементы теории относительности. Релятивистское волновое уравнение легко было найти. Оно представляет собой естественное релятивистское обобщение уравнения Шредингера, за исключением того, что оно второго порядка по времени. Казалось, достаточно было бы применить к этому уравнению новый метод квантования, т.е. найти его собственные значения, как мы снова сразу же получим формулу Зоммерфельда. Результат такого вычисления оказался разочаровывающим: полученная формула имела вид, аналогичный зоммерфельдовской, но тем не менее несколько отличный, и эта формула нисколько не лучше соответствовала экспериментальным фактам. Провал был полным: волновая механика не внесла того нового элемента, который был необходим и природа которого была к тому времени известна благодаря работам Уленбека и Гоудсмита. О них мы скажем несколько позже.
Но кроме вопросов, связанных с дублетами Зоммерфельда, возникли также другие трудности, касающиеся тонкой структуры. Так, в рентгеновских спектрах теория Зоммерфельда очень хорошо предсказывает некоторые из тонких структур, которые реально существуют, однако строение этих серий в значительной степени более сложно, чем следует из формул этой теории. Например, в рентгеновских спектрах элементов всегда имеется три L–серии, линии которых в шкале частот перекрываются. Теория же Зоммерфельда позволяет предсказать две, и только две L–серии, из нее никак не получается третья. Чтобы получить недостающие спектральные линии, Зоммерфельд впоследствии ввел наряду с двумя квантовыми числами, имеющимися в его теории, третье квантовое число, которое он назвал внутренним квантовым числом. Введение этого третьего квантового числа было совершенно эмпирическим. Всякие попытки его теоретически обосновать, предпринятые в то время, были отброшены. Не удалось добиться большего и квантовой механике. Она оказалась неспособной объяснить существование лишней серии и внутреннего квантового числа. Снова чувствовалась необходимость введения нового элемента, о котором мы говорили.
Обратимся теперь ко второй категории явлений, не нашедших своего объяснения в старой квантовой теории, – магнитным аномалиям. Мы уже отмечали существование аномального эффекта Зеемана, который одинаково безуспешно пытались объяснить и первая теория электрона Лоренца, и старая квантовая теория, и волновая механика. Причина этой общей неудачи заключается в том, что в основу объяснения эффекта Зеемана во всех трех теориях был положен один и тот же постулат. Предполагалось, что магнитные моменты, которыми могут обладать атомы, возникают лишь благодаря орбитальному движению внутриатомных электронов. Такая точка зрения предполагала, что полный момент количества движения атома обязательно должен иметь строго фиксированное отношение к его полному магнитному моменту, причем величина этого отношения зависит исключительно от отношения электрического заряда электрона к его массе. Этот вывод, одинаковый и в классической теории электрона, и в старой квантовой теории, и в волновой механике в ее первоначальной форме, привел во всех этих трех теориях к тому, что эффект Зеемана всегда должен быть нормальным, таким, какой был впервые предсказан Лоренцом и открыт экспериментально Зееманом.
Существование аномального эффекта Зеемана, так же как существование спектроскопических данных, о которых мы говорили, указывало на необходимость введения в теорию нового элемента и показывало, что этот элемент должен как-то влиять на магнитные свойства. Кроме того, непрерывно продолжались, начиная с памятного открытия Зеемана, экспериментальные исследования аномального эффекта Зеемана и эмпирические законы его были очень хорошо известны. Мы не можем здесь обсуждать эти эмпирические законы, а лишь ограничимся сообщением, что Ланде добился успеха, обобщив большое число таких законов введением в формулы старой квантовой теории некоего фактора, g-фактора Ланде, корректное, объяснение которого оставалось сомнительным. В то же время, безусловно, все эти исследования аномального эффекта Зеемана прокладывали дорогу к окончательной теории явления, так как заранее был известен точный математический вид законов, которые нужно объяснить.
Однако аномальный эффект Зеемана – это не единственное явление в области магнетизма, которое оставалось необъясненным. Были еще гиромагнитные аномалии. Из гипотезы о возникновении атомного магнетизма благодаря орбитальному движению электронов в атоме следовало, что если подвешенный железный цилиндр намагнитить вдоль его оси, то он начнет вращаться. И наоборот, если этот цилиндр привести во вращение вокруг его оси, то у него должен возникнуть магнитный момент. Причем отношение механического момента к магнитному моменту в обоих случаях должно быть равно упомянутой выше константе, отношению заряда электрона к его массе. Были проделаны эксперименты с целью количественного подтверждения этого вывода-теории (Эйнштейн и Де-Хааз, Вернет). Оказалось, что оба эти явления существуют: намагниченный цилиндр приходит во вращение и происходит намагничивание вращающегося цилиндра. Однако отношение магнитного момента к механическому оказалось примерно вдвое больше предсказанной величины. Этот неожиданный результат ясно показал, в каком направлении нужно предпринимать попытки введения нового элемента. Стало очевидно, что не весь магнетизм атома возникает из-за вращательного движения электронов и что есть магнитные и механические моменты, отношения которых не всегда имеют принимавшуюся до тех пор величину. Исходя из этого, Уленбек и Гоудсмит пришли к важной идее о существовании собственного вращения и собственного магнетизма электрона.
2. Гипотеза Уленбека и Гоудсмита
Уленбек и Гоудсмит в 1925 г. в работе, имеющей огромное значение, предложили считать, что электрон обладает не только электрическим зарядом, но также и магнитным и механическим моментами. Очень легко дать классическую модель такого магнитного вращающегося электрона: достаточно его себе представить в виде небольшого шарика, заполненного отрицательным электричеством и вращающегося вокруг одного из своих диаметров. Уленбек и Гоудсмит уточнили свою гипотезу, предположив, что отношение собственного магнитного момента электрона к его собственному моменту количества движения вдвое больше нормального классического значения. На мысль об этом их навели результаты гиромагнитных экспериментов. Кроме того, ее можно оправдать с помощью классической модели вращающейся электрической сферы, однако такое подтверждение из-за трудностей, возникающих в этой классической модели, с квантовой точки зрения нельзя считать очень убедительным. Тем не менее, как мы увидим, гипотеза Уленбека и Гоудсмита замечательно подтвердилась своими следствиями: элемент, отсутствующий во всех предыдущих теориях, был найден!
Какова же количественная сторона этой новой гипотезы? В квантовой теории атомные электроны в своих квантованных состояниях обладают орбитальным механическим моментом, величина которого всегда кратна постоянной Планка h, деленной на 2π, – это результат квантования. Они также обладают орбитальным магнитным моментом, величина которого кратна фундаментальной величине, носящей название магнетона Бора, играющей роль настоящего атома магнетизма и значение которой во всех современных общих теориях магнитных явлений весьма велико. Знаменитый эксперимент Штерна и Герлаха, позволивший измерить магнитный момент атома, совершенно определенно подтвердил реальное существование магнетона Бора. Частное от деления магнетона Бора на квантовую единицу момента количества движения h/2π имеет постоянное значение, о котором мы уже неоднократно говорили, Уленбек и Гоудсмит приписали электрону собственный момент количества движения, равный половине квантовой единицы h/2π. Таким образом, отношение указанных двух моментов оказалось как раз равным удвоенной классической величине. Для описания собственного вращения электрона и соответствующего момента количества движения они ввели английское слово «спин», которое вскоре стало общепринятым.
К тому времени, когда эти два голландских физика выдвинули свою замечательную идею о введении спина электрона, новая механика находилась на заре своего развития. Поэтому вполне понятно, что эта новая гипотеза сначала могла развиваться только в рамках старой квантовой теории. Сначала Уленбек и Гоудсмит, а затем и другие физики, среди которых мы смогли бы назвать Томаса и Френкеля, обратились к теории тонкой структуры и эффекта Зеемана, введя в нее новые свойства, только что приписанные электрону. Результаты оказались вполне удовлетворительными и ясно показали, что мы находимся на правильном пути. Некоторые трудности, правда, еще оставались. Но было очевидно, что они являются результатом использования методов старой квантовой механики и должны исчезнуть, как только спин электрона будет введен в волновую механику. Это введение происходило не без некоторых трудностей, но в конце концов Дирак, вдохновленный важной работой Паули, добился успеха. Он ввел спин очень интересным путем, открывшим массу новых возможностей.
3. Теория Паули
Спин электрона представляет собой некоторый аналог того свойства фотона, которое называют поляризацией света. По существу он описывает определенную асимметрию электрона, неизотропность его свойств. Конечно, полной аналогии здесь нет, ибо спин имеет направление и знак, в то время как поляризация вследствие колебаний вектора электрического поля характеризуется только направлением. Тем не менее казалось вероятным, что если ввести спин в волновую механику, то мы должны исходить из схемы, в которой в дуалистической концепции света можно говорить о поляризации наряду с существованием фотона, ибо этот индуктивный метод представляет собой естественное продолжение рассуждений, приведших нас к теории волн, связанных с частицами, когда мы исходили из известной теории световых волн. Эти соображения, по-видимому, руководили Паули в его работе о спине.
Посмотрим теперь, как следует пытаться согласовать поляризацию света с существованием фотона. Рассмотрим пучок плоскополяризованного света, падающего на призму Николя, или просто николь. Согласно классическим представлениям волновой оптики при этом происходит следующее: николь разлагает падающую плоскополяризованную волну на две компоненты, поляризованные в двух перпендикулярных направлениях D и D', которые определяются структурой кристалла. При этом D–компонента проходит через призму, а D'–компонента не проходит. Если николь повернуть на 90°, то можно считать, что оси D и D' не изменились, однако теперь уже проходит лишь D'–компонента.
Таким образом, для любой пары осей D и D', перпендикулярных направлению распространения и расположенных под прямым углом друг к другу, падающее колебание может быть разложено вдоль осей D и D', и ориентированный должным образом николь отделит одну компоненту от другой. Точно такая же ситуация будет иметь место, если падающий свет не плоско поляризован, а имеет произвольную поляризацию. Таким образом, данный падающий свет может быть разложен на компоненты, поляризованные по двум взаимно перпендикулярным направлениям (нормальным к направлению распространения) бесконечным числом способов, ибо эти два направления могут быть бесконечным числом способов ориентированы в своей плоскости. Каждое из этих разложений позволяет с помощью николя разделить два поляризованных под прямым углом друг к другу пучка.
Теперь попытаемся истолковать это явление с точки зрения существования фотонов. Поток фотонов, связанных с волной известной поляризации, попадает в николь: часть фотонов проходит через кристалл и регистрируется на выходе прибора как волна, поляризованная в направлении D, другая же часть фотонов поглощается. Согласно волновой теории энергия прошедшего света измеряется квадратом амплитуды, интенсивностью D–компоненты падающего колебания, а энергия света, поглощенного призмой, измеряется интенсивностью перпендикулярной компоненты. Поэтому мы должны предположить, что количество падающих фотонов, поляризация которых после прохождения николя направлена вдоль D, измеряется интенсивностью D–компоненты падающего светового колебания. Число же фотонов, поглощенных николем, определяется интенсивностью перпендикулярной компоненты.
Однако можно предположить, что эксперимент проводится со светом очень слабой интенсивности: фотоны при этом падают на призму поочередно и, как в случае интерференции, мы должны заменить статистическую точку зрения вероятностной и сказать, что вероятность того, что падающий фотон, пройдя николь, окажется поляризованным в направлении D, измеряется интенсивностью D–компоненты падающего колебания. Мы можем еще сказать, что для каждой пары взаимно перпендикулярных осей D и D' имеется две возможных поляризации фотона, и соответствующие вероятности этих двух возможностей определяются интенсивностями D– и D'–компонент падающего колебания. Таким образом, совершенно очевидно, что мы приходим к понятиям, аналогичным тем, которые были приняты для измерения механических величин. Николь можно рассматривать как устройство, позволяющее определять поляризацию падающего фотона, и если его состояние, определяемое соответствующей волной, известно, то мы, вообще говоря, не можем точно предсказать результат измерения, а можем только указать вероятность каждой из возможностей.
Поскольку имеется бесчисленное количество способов выбора осей D и D', то существует бесконечно большое число возможных поляризаций, потенциально заключенных в начальном состоянии фотона, точно так же, как существуют различные значения энергии, потенциально содержащиеся в состоянии частицы, соответствующая волна которой не монохроматична. Конечно, в исключительных случаях можно точно предсказать результат воздействия николя на фотон: это будет тогда, когда начальное состояние является чистым состоянием в смысле направления поляризации, иными словами, когда падающая волна плоско поляризована вдоль D и D'. Все это без труда переносится на случай, когда вместо плоского анализатора, подобного николю, используется круговой или эллиптический анализатор.
Следовательно, нельзя спросить о фотоне, связанном с какой-то световой волной: какова поляризация этого фотона? Этот вопрос не имеет смысла: на него не существует сколько-нибудь разумного ответа. Единственный вопрос, который можно задать, заключается в следующем: какова вероятность того, что эксперимент (проделанный с плоским анализатором) позволит нам приписать фотону поляризацию в данном направлении D (нормальном к направлению распространения)? Мы только что видели, как волновая теория дает нам ответ на этот вопрос, и этот ответ существенно опирается на возможность разложения волновой функции на две компоненты.
Паули, чтобы ввести спин электрона в волновую механику, считал необходимым точно так же приписать ψ-волне две компоненты, не предполагая при этом, что эти две компоненты обязательно должны иметь смысл взаимно перпендикулярных компонент вектора, как в случае света. Точно так же, как нельзя говорить о плоской поляризации фотона, нельзя говорить и о направлении спина электрона. Можно лишь спросить о том, какова вероятность, что спин электрона имеет заданное направление.
Однако спин имеет направление и знак. Предполагалось также, что величина спина равна половине квантовой единицы момента количества движения, или h/4π. Поэтому Паули предположил, что для каждого направления D (которое не перпендикулярно направлению распространения, поскольку ψ-волны не поперечны) спин может иметь два значения ±h/4π в зависимости от знака, который он имеет в данном направлении. Должна быть определенная вероятность обнаружить на опыте, что спин рассматриваемого электрона направлен вдоль D и имеет величину +h/4π; определенная вероятность, что эксперимент даст значение спина –h/4π в направлении D.
Паули по аналогии с поляризацией света предположил, что для каждого заданного направления D волну можно разложить на две компоненты, интенсивности которых являются мерой вероятностей двух возможных величин ±h/4π спина в направлении D. Конечно, если направление D меняется, разложение ψ-волны на две компоненты производится иным способом, точно так же, как для света разложение на две взаимно перпендикулярные компоненты производится различно в зависимости от того, какова система взаимно перпендикулярных осей. Паули выписал систему двух дифференциальных уравнений, которым должны удовлетворять две компоненты ψ-волны для данного направления D. Он изучил также способ преобразования этой компоненты, когда направление D меняется. При этом он заметил, что компоненты ψ-волны преобразуются не как компоненты вектора. Перед нами первый пример применения в физике особого математического понятия. Действительно, ψ-волна частицы со спином не попадает в общий класс тензоров, частным случаем которых, как известно, являются скаляры и векторы. Это математическое понятие совершенно нового типа впоследствии было хорошо изучено и получило название полувектора, или спинора.
Мы не можем здесь подробно описывать формализм теории Паули, к тому же он не получил широкого применения, ибо вскоре был заменен теорией Дирака. Кроме того, теория Паули нерелятивистская. Поэтому ее нельзя применить для предсказания тонкой структуры в смысле, указанном ранее Зоммерфельдом. Однако соображения Паули представляют огромнейший интерес. Они показывают, как можно ввести спин в волновую механику, рассмотрев вероятности двух возможных знаков спина для данного направления и введя вместо однокомпонентной ψ-функции ψ-функцию с несколькими компонентами. И Дираку в его блестящей работе удалось довести до конца эту первую черновую попытку.
4. Теория Дирака
Конечно, Дирак руководствовался идеями Паули, но у него был, кроме того, еще один руководящий принцип: создать вполне удовлетворительную релятивистскую волновую механику. Действительно, как мы видели, с самого начала развития волновой механики предполагалось, что релятивистская волновая механика должна базироваться на волновом уравнении второго порядка по времени. Дирак подверг это предположение тщательному изучению и пришел к заключению, что оно должно быть отвергнуто.
Главное возражение Дирака состояло именно в том, что уравнение распространения в релятивистской квантовой механике не может быть уравнением второго порядка по времени. Из такого уравнения в противоположность выводам нерелятивистской волновой механики следует, что если задано какое-либо начальное состояние, выраженное с помощью некоторой ψ-волны, то закон сохранения полной вероятности не выполняется автоматически. Автоматическое же сохранение полной вероятности необходимо для того, чтобы могли соблюдаться общие принципы новой механики.
Дирак проследил эти соображения с железной логикой и пришел к выводу, что уравнение или уравнения релятивистской волновой механики должны обязательно быть уравнениями первого порядка по времени и что, следовательно, в силу релятивистской симметрии пространства и времени они равным образом должны быть уравнениями первого порядка по координатам пространства. Затем с помощью соображений, на которых мы не можем здесь останавливаться, он показал, что в релятивистской волновой механике волновая функция должна иметь четыре компоненты, которые подчиняются системе четырех уравнений в частных производных, которые в целом заменяют единственное уравнение распространения нерелятивистской волновой механики.
Наконец, Дирак исследовал вопрос о том, как преобразуются уравнения распространения и компоненты волновой функции при переходе от одной системы координат к другой. Он довольно красиво показал, что эти уравнения инвариантны относительно преобразования Лоренца. Это сразу сделало его теорию удовлетворительной с релятивистской точки зрения. Он нашел формулы преобразования для четырех компонент волновой функции, которые оказались не такими, как для пространственно-временного четырехвектора, а относятся, как мы покажем, к новому типу спинорных преобразований, уже встречавшихся у Паули.
Поразительна именно эта особенность теории Дирака. Уравнения его теории, полученные только с помощью аргументов чисто релятивистской и квантовой природы, в которых нигде не появляется гипотеза о спине, сами по себе содержат все свойства магнитного вращающегося электрона. Действительно, согласно новым уравнениям распространения, электрон будет вести себя так, будто он обладает собственным магнитным моментом, равным магнетону Бора, и собственным механическим моментом, равным половине квантовой единицы момента. Появление спиновых свойств в уравнениях, полученных без привлечения гипотезы о спине, – один из замечательнейших результатов всей современной теоретической физики среди многих, которыми она богата.
Покажем теперь, как теория Дирака связана с теорией Паули. Все, касающееся спиновых свойств в теории Дирака, нужно привести к форме Паули. Иными словами, следует определить, какова вероятность того, что спин будет обладать той или иной из двух возможных величин в некотором направлении D. Чтобы ответить на этот вопрос, необходимо прежде всего выяснить, как разлагается ψ-функция на четыре компоненты, если ось z направить вдоль D. Вероятность одной из величин +h/4π будет тогда выражаться суммой интенсивностей двух четных компонент (второй и четвертой), а вероятность величины –h/4π – суммой интенсивностей нечетных компонент ψ-функции (первой и третьей). Дальнейшее исследование решений уравнения Дирака показывает, что если скорость частицы мала по сравнению со скоростью света, то первыми двумя компонентами волновой функции можно пренебречь по сравнению с двумя последними. Иными словами, если можно пренебречь релятивистскими эффектами, то ψ-функцию достаточно считать двухкомпонентной. При этом интенсивность одной компоненты определяет вероятность одного из возможных значений спина, а интенсивность второй – другого.
Таким образом, мы в точности приходим к теории Паули. Оказывается, последняя – просто нерелятивистское ньютоново приближение теории Дирака. В то же время становится понятным, почему вместо двух компонент в теории Паули ψ-функция в теории Дирака имеет четыре компоненты: существование спина приводит к расщеплению ψ-функции на две компоненты; релятивистские эффекты еще раз приводят к расщеплению каждой из этих двух компонент, причем это второе расщепление исчезает в ньютоновом приближении.
Между прочим заметим, что вся вероятностная интерпретация новой механики очень легко переносится в теорию Дирака ценой некоторого усложнения обозначений. Эта новая точка зрения оказывается здесь совершенно правильной. Прежде всего она позволяет понять проблему тонкой структуры и однозначно обосновать формулы Зоммерфельда, одновременно внося в них исправления.
Действительно, если с помощью уравнения Дирака снова проквантовать атом водорода, то оказывается, что благодаря появлению нового свойства – спина – возникают новые, доселе неизвестные квантовые числа. Они в точности совпадают с внутренними квантовыми числами, введенными эмпирически за несколько лет до этого при классификации спектральных термов, наблюдавшихся на опыте.
Полученная таким путем формула для тонкой структуры совпадает с формулой Зоммерфельда, в которой старые азимутальные квантовые числа заменены новыми квантовыми числами. В результате такой последовательной повсеместной замены достигается полное совпадение экспериментально наблюдаемых спектров с теоретическими. Аналогичные результаты получаются и для более тяжелых атомов, если, конечно, можно довести до конца все расчеты, введя некоторые упрощающие предположения. Таким образом, трудности, связанные с рентгеновскими дублетами, устраняются. Итак, важная идея Зоммерфельда о введении в квантовую теорию релятивистских понятий для объяснения тонкой структуры оказалась верной. Однако, чтобы получить вполне удовлетворительные результаты, понадобилось ввести также спин. Первый успех Зоммерфельда не случаен, однако в его теории отсутствовал еще один важный элемент: спин.
Теории Дирака удалось также полностью объяснить магнитные аномалии. При изучении эффекта Зеемана было обнаружено существование аномальных эффектов, которые вызвали большой интерес теоретиков того времени. Причину такого успеха легко понять. Чтобы добиться объяснения аномальных эффектов, нужно было приписать отношению магнитного момента атома к его механическому моменту значение, отличное от так называемого нормального. Это нормальное значение возникает из гипотезы, что магнитный момент атома – результат исключительно орбитального движения его электронов. Приписывая же электрону в соответствии с гипотезой Уленбека и Гоудсмита собственный магнитный момент, отношение которого к его собственному механическому моменту равно удвоенному по сравнению с нормальным значению, теории Дирака удалось выйти из рамок нормального эффекта Зеемана и предсказать аномальные эффекты. И это успех не только качественный, но и количественный. Действительно, расчеты позволяют подтвердить формулу Ланде и предсказать несколько эмпирически величину коэффициента, введенного им для описания аномальных эффектов.
В действительности очень красивая работа Дирака дала, таким образом, замечательные результаты. Она охватила весь комплекс спектроскопических и магнитных явлений, упорно не поддававшихся никаким попыткам объяснения, которые в конце концов с необходимостью привели к представлению о спине. Вызывает восхищение путь, которым было осуществлено объединение квантовой точки зрения с гипотезой Уленбека и Гоудсмита. Можно спросить, сколь далеко идет теория Дирака в применении и слиянии квантовых и релятивистских представлений, ибо первые требуют существенной дискретности, а вторые пронизаны представлением о непрерывности. Это трудный вопрос, который мы не хотели бы здесь обсуждать. Нам кажется, что слияние релятивистских и квантовых представлений осуществлено в теории Дирака не вполне удовлетворительно. Однако в целом здание этой теории восхитительно и представляет собой в настоящее время кульминационный пункт волновой механики электрона.
Не останавливаясь на изучении других приложений теории Дирака, например на проблеме рассеяния излучения веществом (формула Клейна – Нишины), мы хотели бы поговорить об одном странном следствии уравнений Дирака, которое на первый взгляд составляет слабый пункт теории, а на самом деле оказывается ее достижением.
5. Состояния с отрицательной энергией. Положительный электрон
Уравнения теории Дирака проявляют особые свойства, допуская решения, соответствующие состояниям частицы, энергия которой может быть отрицательной. Электрон в одном из этих состояний должен обладать довольно странными свойствами. Чтобы увеличить его скорость, у него нужно отнять энергию. И, наоборот, чтобы его остановить, нужно сообщить ему некоторую энергию. В эксперименте электрон никогда не вел себя так странно. Поэтому вполне законно было считать, что состояния с отрицательной энергией, существование которых допускает теория Дирака, в действительности в природе не реализуются. Можно было бы сказать, что в этом смысле теория дает слишком много, по крайней мере на первый взгляд.
То, что уравнения Дирака допускают возможность существования состояний с отрицательной энергией, это, несомненно, результат их релятивистского характера. Действительно, даже в релятивистской динамике электрона, развитой Эйнштейном в рамках специальной теории относительности, обнаруживается возможность движения с отрицательной энергией. Однако в то время в динамике Эйнштейна трудность была не очень серьезной, ибо она, как и все предыдущие теории, предполагала, что все физические процессы непрерывны. А так как собственная масса электрона конечна, то он всегда обладает конечной внутренней энергией в соответствии с релятивистским принципом эквивалентности массы и энергии. Поскольку эта внутренняя энергия не может исчезать, то мы не можем непрерывным образом перейти от состояния с положительной к состоянию с отрицательной энергией. Таким образом, предположение о непрерывности физических процессов полностью исключает такого рода переход.
Следовательно, достаточно предположить, что в начальный момент времени все электроны находятся в состояниях с положительной энергией, чтобы увидеть, что состояние всегда остается таким же. Трудность становится гораздо более серьезной в механике Дирака, ибо это механика квантовая, допускающая существование дискретных переходов в физических явлениях. Можно легко видеть, что переходы между состояниями с положительной и отрицательной энергией не только возможны, но и должны происходить довольно часто. Клейн привел интересный пример того, как электрон с положительной энергией, попав в область, где действует быстро меняющееся поле, может покинуть эту область в состоянии с отрицательной энергией. Следовательно, то, что экспериментально электрон с отрицательной энергией ни разу не был обнаружен, оказывалось очень опасно для теории Дирака.
Чтобы обойти эту трудность, Дирак выдвинул очень остроумную идею. Заметив, что согласно принципу Паули, о котором мы поговорим в следующей главе, в одном состоянии не может находиться более одного электрона, он предположил, что в нормальном состоянии окружающего мира все состояния с отрицательной энергией заняты электронами. Отсюда следует, что плотность электронов с отрицательной энергией везде одинакова. Дирак выдвинул предположение, что эту однородную плотность наблюдать невозможно. В то же время электронов существует больше, чем необходимо для заполнения всех состояний с отрицательной энергией.
Этот избыток и представляют собой электроны с положительной энергией, их-то мы и можем наблюдать в наших экспериментах. В исключительных случаях электрон с отрицательной энергией может под действием внешней силы перейти в состояние с положительной энергией. При этом мгновенно появляется наблюдаемый электрон и в то же время образуется дырка, пустое место, в распределении электронов с отрицательной энергией. Дирак показал, что такая дырка может наблюдаться экспериментально и должна вести себя подобно частице с массой, равной массе электрона и равным ему, но противоположным по знаку зарядом. Мы будем воспринимать его как антиэлектрон, положительный электрон. Эта неожиданно образовавшаяся дырка не может долго существовать. Она будет заполнена электроном с положительной энергией, который испытает спонтанный переход в пустое состояние с отрицательной энергией, сопровождающийся излучением. Итак, Дирак объяснил ненаблюдаемость состояний с отрицательной энергией и в то же время предсказал возможность, пусть редкого и эфемерного, существования положительных электронов.
Несомненно, гипотеза Дирака была очень проста, однако на первый взгляд она казалось несколько искусственной. Возможно, что большое число физиков оставалось бы настроенными в этом отношении несколько скептически, если бы эксперимент немедленно не доказал существования положительных электронов, характерные свойства которых только что предсказал Дирак.
Действительно, в 1932 г. сначала тонкие эксперименты Андерсона, а затем и Блэкетта и Оккиалини обнаружили, что при распаде атомов под действием космических лучей появляются частицы, которые ведут себя в точности как положительные электроны. Хотя абсолютно строго еще и нельзя было утверждать, что масса новых частиц равна массе электрона, а их электрический заряд равен и противоположен по знаку заряду электрона, последующие эксперименты делали это совпадение все более вероятным. Далее, оказалось, что положительные электроны имеют тенденцию быстро исчезать (аннигилировать), приходя в соприкосновение с веществом, причем аннигиляция сопровождается излучением. Эксперименты Тибо и Жолио-Кюри, казалось, не оставили в этом вопросе никакого сомнения.
Исключительные обстоятельства, при которых появляются положительные электроны и их способность к аннигиляции, сокращающая время их существования, – это как раз и есть те свойства, которые предвидел Дирак. Таким образом, ситуация оказалась обратной: существование решений уравнений Дирака с отрицательной энергией не только не ставит их под сомнение, но, наоборот, показывает, что эти уравнения предсказали существование и описали свойства положительных электронов.
Тем не менее мы должны признать, что дираковские представления о дырках приводят к серьезным трудностям, касающимся электромагнитных свойств вакуума. Вполне вероятно, что теория Дирака будет преобразована и установит большую симметрию между электронами обоих типов, в результате чего идея о дырках вместе со связанными с ней трудностями будет отброшена. В то же время несомненно, что экспериментальное открытие положительных электронов (ныне носящих название позитронов) представляет собой новое и замечательное подтверждение идей, лежащих в основе механики Дирака. Симметрия между обоими типами электронов, которая устанавливается в результате более тщательного исследования некоторых аналитических особенностей уравнений Дирака, представляет большой интерес и несомненно ей предстоит сыграть важную роль в дальнейшем развитии физических теорий.
Глава XII. Волновая механика систем и принцип Паули
1. Волновая механика систем частиц
До сих пор мы рассматривали новую механику только для случая, когда в заданном силовом поле движется одна частица. Иногда мы предполагали, что тот или иной принцип справедлив и для системы; а поскольку физика предполагает существенно дискретный характер элементарных физических представлений, он справедлив и для группы частиц. Теперь необходимо уточнить, как выглядит эта волновая механика систем частиц.
Отметим с самого начала, что настоящую систему образуют только взаимодействующие друг с другом частицы: невзаимодействующие частицы можно рассматривать независимо друг от друга, и мы снова приходим к случаю одной частицы. Это замечание, конечно, справедливо как в старой, так и в новой механике.
Напомним теперь, как классическая механика решает проблему движения системы взаимодействующих частиц. Для каждой из этих частиц выписываются основные уравнения Ньютона, выражающие пропорциональность между ускорением материальной точки и действующей на нее силой. Поскольку предполагаем, что между частицами имеется взаимодействие, т.е. сила, действующая на каждую частицу, зависит от положения всех остальных частиц, то полученные таким образом уравнения образуют систему дифференциальных уравнений. Если их выписать в явном виде в прямоугольных декартовых координатах, то число этих уравнений будет равно утроенному числу частиц, ибо каждая частица имеет три координаты.
Решение этой системы уравнений, если оно возможно, дает выражение для каждой координаты как функции времени, т.е. позволяет проследить положение и движение каждой частицы с течением времени. Кроме того, из всех решений этих уравнений нужно взять только то решение, которое полностью определено, если заданы положения и скорости частиц в начальный момент времени, иными словами, если задано начальное положение и состояние движения системы. Так, оказывается, что в классической динамике систем выполняется механический детерминизм.
Не вдаваясь слишком глубоко в описание классической механики систем, мы только напомним, что уравнения движения можно во многих случаях привести к хорошо известным уравнениям Лагранжа и Гамильтона. Однако благодаря более абстрактной форме указанных уравнений движения полезно рассмотреть новое геометрическое представление этой системы. Вместо того чтобы рассматривать систему в физическом пространстве трех измерений и говорить о положении каждой ее частицы в каждый момент времени, мы можем связать координаты всех частиц и мысленно сконструировать тем самым абстрактное пространство, число измерений которого втрое превышает число частиц (причем это число измерений можно уменьшить, если существуют соотношения, ограничивающие свободу движения частиц). В этом абстрактном пространстве, носящем название конфигурационного пространства, каждое состояние системы представлено в виде точки, координаты которой равны координатам частиц системы. Эволюция системы с течением времени будет, таким образом, описываться перемещением этой изображающей точки в конфигурационном пространстве. Вся задача механики состоит в этом случае в вычислении траектории и скорости изображающей точки. Группу уравнений классической динамики можно рассматривать как уравнения движения этой точки. Итак, мы свели изучение движения множества точек в физическом трехмерном пространстве к исследованию поведения единственной точки в абстрактном конфигурационном пространстве. Механический детерминизм при этом просто выражается словами, что движение изображающей точки полностью определено, если известны ее начальное положение и скорость в конфигурационном пространстве.
Использование конфигурационного пространства становится обязательным, когда хотят применить к динамике систем теорему Якоби. Говоря языком физики, сущность этой теоремы заключается в разбиении возможных движений рассматриваемой системы на группы таким образом, чтобы в каждой группе совокупность всевозможных траекторий движения соответствовала лучам распространяющихся волн. Очевидно, что если все движущиеся частицы описывать в физическом пространстве, то такого соответствия установить невозможно просто из-за обилия траекторий. С другой стороны, его легко установить, если рассматривать конфигурационное пространство, ибо в нем каждому движению соответствует единственная траектория изображающей точки. Следовательно, в этом случае теория Якоби позволяет нам классифицировать возможные движения системы, т.е. возможные движения изображающей точки в конфигурационном пространстве, таким образом, что траектории изображающей точки, принадлежащие одному классу, представляют в последнем лучи волн, распространяющихся в смысле геометрической оптики. Уравнение Якоби, зависящее от координат всех частиц системы, т.е. от всех координат конфигурационного пространства, будет уравнением геометрической оптики для распространения этих волн в рассматриваемом многомерном пространстве. Принцип наименьшего действия оказывается в этом случае эквивалентным принципу Ферма.
Поскольку теория Якоби и принцип наименьшего действия открывают самый легкий путь для перехода от старой механики к волновой, можно было ожидать, что дальнейшее развитие волновой механики будет происходить с применением представления о конфигурационном пространстве. Именно так это и произошло. Обобщая процедуру, разработанную для уравнения распространения волны одной частицы, Шредингер сумел записать в конфигурационном пространстве уравнение распространения для ψ-функции, связанной с системой. Это уравнение построено таким образом, что если выполняется приближение геометрической оптики, то получается вновь уравнение Якоби.
Однако здесь ψ-функция зависит не только от времени, но и от координат всех частиц системы, и ее изменение происходит в конфигурационном пространстве. Таким образом, здесь еще больше проявляется символический характер ψ-волны, чем в случае одной частицы. Могло бы даже показаться странным, что движение системы нельзя рассмотреть в трехмерном пространстве, ибо, чтобы это сделать, мы обязательно должны начать с представления об абстрактном конфигурационном пространстве. Ведь в классической механике использование конфигурационного пространства часто оказывается полезным, но совершенно необязательным: все частицы системы всегда можно описать в физическом пространстве.
Автор этой книги в течение долгого времени ощущал некоторое беспокойство по поводу обязательного применения конфигурационного пространства в квантовой механике: даже сегодня он надеется, что, когда мы сможем заменить наши современные представления о физическом пространстве, о частицах и т.д. представлениями, лучше соответствующими действительности, законы волновой механики систем будут выражены в менее искусственной форме. В случае систем, содержащих частицы одинаковой природы, можно избежать обязательного использования абстрактного пространства конфигураций, применив метод вторичного квантования, Этот метод основан на том, что при любых эволюциях такой системы полное число частиц должно оставаться неизменным.
Так или иначе, в настоящее время волновая механика систем формулируется в терминах волн в конфигурационном пространстве, и мы увидим, что ее методы увенчались успехом. Квантование системы заключается в исследовании того, для каких значений полной энергии системы (равной частоте ψ-волны, умноженной на h) существуют в конфигурационном пространстве стационарные ψ-волны, т.е. в поисках собственных значений уравнений распространения. Далее, для этих квантованных систем находятся дискретные спектры собственных значений, которым соответствуют собственные функции, образующие полный набор и т.д. Таким образом, производится непосредственное обобщение физического объяснения волновой механики.
Интенсивность ψ-волны дает в каждой точке конфигурационного пространства вероятность того, что эксперимент, обнаруживающий частицы системы в данных точках, позволит приписать системе конфигурацию, соответствующую данной точке. Аналогично, парциальная интенсивность компонент спектрального разложения волновой функции по собственным функциям энергии дает вероятности того, что точное измерение энергии даст то или иное собственное значение гамильтониана. Короче говоря, сюда непосредственно переносятся все принципы вероятностной интерпретации. Следует также попутно отметить, что здесь можно определить понятие центра тяжести и что некоторые классические теоремы механики, такие, как теорема Кенига, имеют свои аналоги в волновой механике.
Волновая механика систем, развитая в работах Шредингера, не является релятивистской. Это волновое обобщение ньютоновой, а не эйнштейновой механики систем по той причине, что релятивистская механика систем никогда не будет окончательно создана. Эта неспособность релятивистской механики строго описать движение систем обусловлена несколькими причинами, в частности тем, что теория относительности существенно отвергает все мгновенные воздействия на расстоянии. Релятивистская волновая механика Дирака применима только к изолированным частицам, помещенным в заданное силовое поле: ее обобщение на случай систем представляет собой сложную проблему, далекую еще от окончательного решения.
В п. 4 еще будет идти речь о нескольких замечательных приложениях волновой механики систем. Однако, прежде чем сделать это, мы должны рассмотреть один важный случай, где ярко проявляются некоторые специфические свойства новой механики: случай систем, содержащих частицы одинаковой природы.
2. Системы, состоящие из частиц одинаковой природы. Принцип Паули
Вопрос, который мы собираемся обсудить, всецело связан с важной и совершенно новой идеей, возникающей в квантовой теории в связи с введением в статистическую механику кванта действия.
В атомной физике раньше всегда предполагали, что две частицы одинаковой природы, например два электрона, тождественны. Однако эту тождественность нельзя считать абсолютной, не позволяющей, хотя бы мысленно, различить две частицы одинаковой природы. Так, например, при статистических расчетах два состояния одной и той же системы, в которых лишь переставлены две частицы одинаковой природы, считаются различными. Следовательно, если представить себе систему, образованную электронами, то коллективное состояние системы, в котором первый электрон находится в состоянии a, а второй – в состоянии b, считается отличным от коллективного состояния системы, когда первый электрон находится в состоянии b, а второй – в состоянии a. При этом индивидуальные состояния остальных электронов остаются в обоих случаях одинаковыми. Развитие квантовой статистики привело к полному отрицанию возможности различить две частицы одинаковой природы внутри одной системы. Квантовая статистика считает, что два состояния системы, отличающиеся друг от друга только перестановкой двух частиц одинаковой природы, тождественны и неразличимы.
Перестановка частиц одинаковой природы приводит в квантовой механике систем к очень важным последствиям. Рассмотрим систему, состоящую из частиц одинаковой природы. Пусть ψ – одна из возможных волновых функций системы. Согласно определению, эта волновая функция называется симметричной по отношению к двум частицам, если при перестановке координат двух частиц выражение для ψ-функции не меняется. Наоборот, она называется антисимметричной по отношению к двум частицам, если перестановка координат двух частиц меняет лишь знак ψ-функции. Важно отметить, что в общем случае ψ-функция не будет ни симметричной, ни антисимметричной. Однако взаимозаменяемость частиц одинаковой природы позволяет нам доказать следующую важную теорему: если система состоит из частиц одинаковой природы, то всегда существуют волновые функции, одни симметричные, другие антисимметричные по отношению ко всем парам частиц одинаковой природы.
Будем называть состояние, волновая функция которого симметрична, симметричным состоянием системы, а состояние, волновая функция которого антисимметрична, – антисимметричным состоянием системы. Тот факт, что потенциал взаимодействия симметрично зависит от координат каждой пары частиц, позволяет нам доказать теорему, не менее важную, чем первая: невозможно осуществить переход системы из симметричного состояния в антисимметричное и обратно.
Иными словами, невозможны никакие иные комбинации, в смысле Ритца, кроме как между состояниями одинаковой природы. Отсюда следует, что симметричные состояния, с одной стороны, и антисимметричные, с другой, образуют два совершенно отдельных ансамбля, между которыми невозможны никакие переходы. Таким образом, волновая механика допускает принцип, который утверждает, что для частиц определенного сорта существуют в природе лишь симметричные или лишь антисимметричные состояния, поскольку если в начальный момент времени существовали только состояния одного типа, то они навсегда и останутся такими. Этот принцип не является следствием волновой механики, допускающей любые состояния, однако он ей и не противоречит. Теперь мы должны пояснить, как Паули пришел к предположению о существовании этого принципа по крайней мере для электронов.
При изучении строения атома мы отмечали, что существует насыщение энергетических уровней, и подчеркивали фундаментальную важность этого явления, так как именно оно определяет эволюцию структуры атома в периодической системе элементов и все различия в химических, оптических и магнитных свойствах этих элементов. Мы также говорили о том, что порядок последовательного заполнения уровней при добавлении новых электронов был установлен эмпирически: он задается правилом Стонера, которое вначале теоретически не было подтверждено.
Благодаря правилу Стонера стало известно максимальное число электронов, которое может находиться на каждом энергетическом уровне атома. Пытаясь объяснить эти факты, Паули выдвинул замечательную идею о расщеплении уровней, происходящем в результате того, что два электрона не могут находиться в строго тождественных квантовых состояниях, т.е. описываться одними и теми же квантовыми числами. Иными словами, наличие электрона в одном квантовом состоянии запрещает появление в том же состоянии еще одного электрона. Отсюда название принцип запрета, данное этому новому физическому постулату. На языке волновой механики принцип Паули выражается следующим образом: электроны могут находиться только в антисимметричных состояниях.Мы видели, что такое утверждение не противоречит принципам новой механики. Чтобы показать, что обе приведенные формулировки принципа запрета действительно совпадают, предположим, что система содержит два электрона в одном и том же индивидуальном состоянии. Но в соответствии со второй формулировкой это предположение означает, что волновая функция антисимметрична по отношению к этой паре электронов, она должна, следовательно, менять знак при перестановке этих электронов местами. Однако, так как индивидуальные состояния электронов тождественны, то такая перестановка не должна менять волновую функцию.
Итак, поскольку волновая функция одновременно и меняет и не меняет знак при перестановке электронов, то она должна быть равна нулю. На языке волновой механики это означает, что такого состояния не существует. Таким образом, два электрона не могут находиться в одном и том же индивидуальном состоянии и мы видим, что вторая формулировка приводит нас к первой. Легко доказать также и обратное.
Принцип Паули можно, следовательно, выразить в волновой механике аналитически, записав волновые функции систем, содержащих электроны, в антисимметричной форме по отношению к электронным парам. Однако, применяя этот принцип на деле, следует помнить, что электрон обладает спином. Поэтому его индивидуальное состояние является функцией не только его координат, но также и значения его спина. Волновые функции, допускаемые принципом Паули, антисимметричны по отношению ко всем пространственным координатам и спину.
Огромная важность принципа Паули заключается в том, что он дал возможность объяснить насыщение уровней. Он позволил прямым путем получить правило Стонера. Достаточно учесть, что несколько различных состояний, т.е. состояний, соответствующих различным комбинациям квантовых чисел, обладают одинаковой энергией и, следовательно, относятся к одному энергетическому уровню. Таким образом, достаточно подсчитать для каждого энергетического уровня, сколько ему соответствует различных квантовых состояний, и мы узнаем, согласно принципу Паули, максимальное число электронов на этом уровне, ибо оно достигает максимума, когда заполнено каждое квантовое состояние. Из этого подсчета и вытекает правило Стонера. Принцип Паули имеет фундаментальное назначение при построении волновой механики систем. В частности, он приводит к статистике Ферми – Дирака для электронов.
Для электронов единственно возможными оказываются антисимметричные состояния. Возникает вопрос, а как обстоит дело с другими элементарными и неэлементарными частицами микромира? Применим ли принцип Паули также и к ним? Или, наоборот, для них возможны лишь симметричные состояния? Или, наконец, допустимы и те и другие? По-видимому, эта последняя альтернатива никогда не реализуется: в Природе осуществляются только симметричные или антисимметричные состояния.
Первый случай – это случай электронов, а также некоторых атомных ядер: в одном квантовом состоянии не может быть больше одного электрона, и они всегда подчиняются, как мы видели, статистике Ферми – Дирака.
Второй случай охватывает фотоны, α-частицы и остальные атомные ядра. При этом нет никаких препятствий для накопления любого числа частиц в одном квантовом состоянии, ибо симметричная функция не меняется при перемене местами двух частиц одной природы: поэтому в этом случае частицы подчиняются статистике Бозе – Эйнштейна. Для фотонов она изображается формулой Планка. Вообще оказывается, что частицы, спин которых нечетный в единицах h/4π, подчиняются принципу Паули и статистике Ферми – Дирака. Частицы же, спин которых равен нулю или четный в единицах h/4π, подчиняются статистике Бозе – Эйнштейна. Это очень важное правило. Вопросы спина и статистики играют большую роль в исследовании полосатых спектров, а также в изучении строения атомного ядра.
Принцип Паули выражает весьма специфическое свойство электронов и других частиц, которые ему подчиняются. Действительно, на сегодняшний день почти невозможно понять, каким образом две тождественные частицы взаимно запрещают друг другу занять одно и то же состояние. Этот тип взаимодействия совершенно отличается от взаимодействий в классической физике. Его физическая природа пока нам совершенно неизвестна. По-видимому, это одна из самых важных задач и к тому же самых трудных, которую предстоит решить физикам-теоретикам будущего, чтобы выяснить физические истоки принципа запрета.
Чтобы показать, насколько далеко мы ушли от старых представлений, рассмотрим случай газа из частиц одинаковой природы, подчиняющихся принципу Паули, например электронного газа. Согласно принципу запрета, никакие два электрона этого газа не могут находиться в одном и том же состоянии прямолинейного равномерного движения, ибо здесь состояния прямолинейного равномерного движения квантованы. С классической точки зрения это означало бы, что частица, расположенная в некоторой точке сосуда, содержащего газ, будет мешать любой другой частице газа иметь такое же состояние. Это совершенно парадоксально, так как сосуд с газом можно взять сколь угодно большим и, следовательно, расстояние между частицами может быть сколь угодно велико. Однако этот парадокс тесно связан с соотношениями неопределенности Гейзенберга и исчезает, если принять их во внимание. Действительно, прямолинейное и равномерное движение частиц соответствует вполне определенной энергии этих частиц.
Таким образом, соотношения неопределенности запрещают говорить одновременно о положении и состоянии движения двух частиц. Сам факт, что мы говорим о том, что энергетические состояния частиц вполне определены, не позволяет нам больше говорить о расстоянии между ними, ибо они при этом никак не локализованы. Этот пример показывает, что физическую интерпретацию принципа запрета нужно обязательно проводить целиком вне рамок классических представлений.
3. Приложения волновой механики систем
Волновая механика систем, развитая с учетом принципа Паули и спина, добилась многочисленных блестящих успехов. Одним из них было объяснение спектра гелия. В то время как спектр ионизованного гелия нашел свое объяснение еще в теории Бора (ионизованный гелий относится к простейшей группе систем с одним электроном), спектр нейтрального гелия оставался загадкой. Действительно, линии нейтрального гелия делились на две отдельные категории, соответствующие термам, которые, по крайней мере в первом приближении, не были взаимно связаны.
Эти две системы совершенно независимых линий получили название спектров ортогелия и парагелия. Долгое время считалось, что эти два различных типа атомов гелия реально существуют, причем каждый испускает свой спектр. Но, наконец, удалось обнаружить, что различия между парагелием и ортогелием нет: один и тот же атом гелия в зависимости от обстоятельств излучает то орто-, то пара-спектр.
Гейзенберг в своей знаменитой работе дал ключ к разгадке этого явления. Поскольку оба орбитальных электрона нейтрального атома гелия подчиняются принципу Паули, то волновая функция этого атома должна быть антисимметричной по отношению ко всем координатам и спинам обоих электронов. Но эта антисимметрия может осуществляться двумя путями: волновая функция может быть симметрична по отношению к координатам и антисимметрична по отношению к спинам или наоборот. Таким образом, существует два типа волновых функций и, следовательно, спектральных термов. Наконец, поскольку спектральные термы относятся к разным категориям, они не могут быть взаимосвязаны, по крайней мере в первом приближении. Теперь достаточно отождествить одну из категорий термов с термами ортогелия, а другую – с термами парагелия, чтобы получить вполне удовлетворительное объяснение распада спектра гелия на две независимые части. С помощью такой интерпретации Гейзенбергу удалось объяснить некоторые особенности спектров ортогелия и парагелия, в частности: в то время как линии парагелия одинарные, линии ортогелия тройные и образуют триплеты. Объяснение Гейзенбергом этого незначительного факта теории представляет само по себе прекрасное подтверждение принципа Паули, ибо такое различие между тонкой структурой этих двух серий возникает именно из-за принципа Паули. Без него мы получили бы иной результат, противоречащий эксперименту.
Другим замечательным приложением волновой механики систем стала теория молекулы водорода или, в более общем виде, теория гомеополярной молекулы. Классическая теория в некоторой степени позволяет нам понять происхождение связей, соединяющих атомы гетерополярной молекулы, т.е. молекулы, атомы которой обладают различным сродством к электрону. Действительно, в этом случае можно себе представить, что различные атомы молекулы превращаются в ионы, отдавая или присоединяя электроны. Поэтому можно думать, что стабильность молекулярной структуры обусловлена действием кулоновых сил между различными образовавшимися ионами. Однако случай гомеополярных молекул, например, весьма важный случай молекул, состоящих из двух атомов одинаковой природы, был раньше для физиков наиболее затруднительным, так как не существовало никаких причин, чтобы атомы с одинаковым сродством к электрону превращались в ионы различных знаков.
Следовательно, оставалось неясным, какого типа силы могут действовать между этими нейтральными атомами, чтобы обеспечить их связь в молекуле. Все, что приходило в голову, оказывалось для этой роли слишком слабым. Волновая механика позволяет, и это немалый успех, понять природу гомеополярных связей, введя понятие обменной энергии. Вот что означает это несколько таинственное выражение: если тщательно исследовать с помощью волновой механики поведение системы, содержащей тождественные частицы, оказывается, что в выражении для энергии системы наряду с членами, описывающими известное взаимодействие между частицами, появляются члены нового типа, связанные с тем, что тождественные частицы могут меняться местами.
Эти члены и описывают то, что мы назвали обменной энергией. Им соответствуют силы совершенно нового типа, которые невозможно представить в классической векторной форме и которые огромны по величине. Эти новые силы – неизбежное следствие формализма новой механики, однако, оказывается, их нельзя объяснить физически, в старом смысле этого слова. Мы снова оказались перед фактом, выходящим за рамки всех классических представлений и показывающим, сколь ошибочен наш обычный прием локализации физических величин в непрерывном пространстве трех измерений. Весьма поучительно следующее замечание: обменная энергия существует лишь тогда, когда вероятность найти две одинаковые частицы в одной области пространства не равна нулю. Иными словами, так как частицы в волновой механике, вообще говоря, не локализованы, то существует некоторое распределение плотностей вероятности. Обменная энергия существует в том и только в том случае, когда распределения плотности вероятности для двух частиц одного сорта перекрываются. Это замечание проливает свет на зависимость между обменной энергией и невозможностью локализовать частицу в пространстве.
Не останавливаясь больше на этих очень интересных свойствах обменной энергии, мы хотели бы показать, как объяснить образование гомеополярной молекулы. Простейший пример такой молекулы дает молекула водорода, состоящая из двух атомов, каждый из которых содержит один электрон. Когда два атома водорода, вначале находящиеся далеко друг от друга, начинают сближаться, они стремятся образовать механическую систему с двумя электронами. Поэтому между этими двумя электронами появляется обменная энергия.
Эту энергию можно вычислить методами волновой механики с учетом принципа Паули и существования спина. Это и проделали Гайтлер и Лондон. Они получили следующий результат: если спиновые векторы обоих электронов имеют одинаковые знаки, то обменная энергия соответствует отталкиванию между атомами, и молекула образоваться не может. Если, наоборот, векторы спинов имеют противоположные знаки, обменная энергия соответствует притяжению атомов, когда же атомы сближаются еще больше, снова возникает отталкивание. Это как раз и есть случаи, когда появляется тенденция к образованию стабильной молекулы.
Эта теория хорошо объясняет образование и свойства молекулы водорода. По существу ее можно трактовать следующим образом: электроны двух атомов водорода способны образовать пару с противоположно направленными векторами спина. Эта пара, обладая очень большой стабильностью, представляет собой связующее звено между двумя атомами и заставляет их соединяться в единую молекулу. В таком виде объяснение можно обобщить на случай всех двухатомных молекул и даже молекул, содержащих больше двух атомов. Рассмотрим, например, любую двухатомную молекулу. Два атома, способных объединиться в эту молекулу, содержат то или иное число электронов; определенное число этих электронов образует внутри атома пары электронов одинаковой энергии и противоположных спинов, некоторые же из них таких пар не образуют.
Электроны, не имеющие пары, остроумно названные холостыми электронами, стремятся, как только представится такая возможность, объединиться с электронами другого атома и образовать пару. Действительно, расчеты показывают, что в большинстве случаев сближение двух атомов приводит к образованию молекулы, в которой по крайней мере некоторые из холостых электронов этих двух атомов образуют пары. Образование таких пар и оказывается причиной молекулярной связи между двумя атомами. Очевидно, что это объяснение можно обобщить на случай молекул, содержащих более двух атомов.
Представление о том, что образование молекул происходит благодаря формированию электронных пар с противоположно направленными векторами спинов, позволяет нам дать объяснение понятию валентности, играющему фундаментальную роль в химии. Вообще можно сказать, что атом, содержащий в основном состоянии некоторое число n холостых электронов, будет иметь химическую валентность n. Действительно, такой атом способен присоединить к себе еще n атомов водорода, поскольку каждый из его n свободных электронов может образовать пару с электроном атома водорода.
Таким образом, валентность данного атома или по крайней мере максимальная его валентность равна n. Отсюда видно, что существование химической валентности связано с наличием обменной энергии между электронами. Теперь понятно, почему попытки объяснить валентные силы с помощью векторной схемы, применимой в остальных случаях, не дали по-настоящему удовлетворительного результата. Кроме того, тот факт, что два электрона, образуя пару, как бы нейтрализуются и не влияют больше ни на какие молекулярные взаимодействия, объясняет валентное насыщение, абсолютно несовместимое с представлением о валентностях как о силах старого типа. Отсюда уже видно, насколько удовлетворительна и разумна новая теория валентности, основанная на волновой механике.
В то время как это новое основание теории валентности кажется вполне несомненным, детальное объяснение различных фактов химии, связанных с этой теорией (многократная или направленная валентность, стереохимия, свободные связи и т.д.), остается еще трудной задачей. Решением ее уже начали заниматься серьезно, однако такая математическая химия оказывается сложной наукой, и многое еще предстоит сделать, чтобы довести ее до конца. За исключением простого случая молекулы водорода, точный расчет собственных значений и собственных функций невозможен и приходится ограничиваться вычислением собственных значений и классификацией их в соответствии со свойствами симметрии отвечающих им волновых функций, выражения для которых остаются неизвестными. Для этого приходится обращаться к весьма общим методам, основанным на теории групп. Эта теория пока еще мало известна физикам, но она оказывается незаменимой в этом разделе волновой механики. Кроме того, мы с ее помощью очень быстрым и красивым путем приходим к прекрасным весьма общим результатам. Однако, поскольку физики-теоретики, умеющие обращаться с этим сложным методом, за недостатком времени не всегда занимаются изучением даже основных многочисленных и сложных химических фактов, для успешного завершения уже начавшей развиваться теории необходимо тесное сотрудничество между физиками и химиками. Что же касается нынешнего состояния науки о квантах, то во всяком случае одним из славных успехов новой механики стало объяснение некоторых важнейших законов химии.
4. Квантовая статистика
Методы классической статистики Больцмана и Гиббса, успех которых в макроскопической физике известен, должны были претерпеть изменения в связи с развитием новой механики. Мы не можем здесь вдаваться в детали того, как видоизменились с введением кванта действия сами основы статистической механики. Рассмотрим лишь случай идеального газа с точки зрения представлений волновой механики. В идеальном газе атомы все время, не считая моментов соударений, находятся в состоянии прямолинейного равномерного движения. В классической статистике эти состояния движения образуют непрерывные наборы, ибо все значения и направления скоростей одинаково возможны. Методы Больцмана и Гиббса состоят по существу в подсчете возможных распределений атомов газа между состояниями движения с данной энергией и нахождении наиболее вероятного из них.
Хотя квант действия был введен, как и в волновой механике, при сопоставлении распространяющейся волны с движущимся атомом, ситуация здесь несколько иная, ибо в случае газа, заключенного в сосуд определенного размера, физически возможны только стационарные волны, находящиеся в резонансе с размерами сосуда (в согласии с принципами квантования в новой механике). Поэтому сначала необходимо подсчитать число этих стационарных соединений, затем рассчитать возможное распределение атомов по этим состояниям с заданной полной энергией.
Для сосуда макроскопических размеров, а это единственно реальный случай, стационарные состояния из-за малой величины постоянной Планка представляют собой дискретный, но очень тесно расположенный набор. Поэтому практически можно считать, что этот набор состояний непрерывен и, следовательно, справедлива статистическая механика. Этим и объясняется успех старых статистических методов. Тем не менее можно показать, что введение кванта действия в явления микроскопического масштаба становится существенным. Прежде всего это позволяет установить постоянную энтропии.
В классической статистической механике постоянная энтропии бесконечна, что выглядит весьма странно и, как мы теперь знаем, оказывается результатом легкомысленного пренебрежения квантом действия, обязательным элементом устойчивости физического мира. Правда, некоторые думают, что можно обойти эту трудность, заявляя, что, поскольку постоянная энтропии является в термодинамике произвольной постоянной, нет ничего страшного в том, что она бесконечна! Квантовая теория позволяет нам приписать энтропии конечное значение и вычислить ее как функцию постоянной Планка. При этом видно, что величина постоянной энтропии существенно входит в расчет равновесия между паром и его конденсатом, а это позволяет нам количественно проверить предсказания квантовой теории.
Чтобы развить квантовую статистическую механику, необходимо вычислить ряд распределений атомов или других элементов данной системы по различным возможным квантовым состояниям и, отвечая на этот вопрос, мы должны принять во внимание, что соображения, развитые в предпоследней главе, играют здесь важную роль. Мы уже видели, что тождественность одинаковых частиц заставляет нас считать два распределения, отличающиеся только перестановкой двух одинаковых частиц, совпадающими. Этот новый способ подсчета распределений дает результаты, в принципе сильно отличающиеся от результатов статистики Больцмана – Гиббса. Но он дает еще больше: нумеруя наши распределения, необходимо учесть, подчиняются или не подчиняются наши элементы принципу Паули, т.е. если их волновые функции антисимметричны, то в одном состоянии может находиться самое большее один элемент. Если, наоборот, они не подчиняются принципу Паули, т.е. их волновые функции симметричны, то ничто не ограничивает число этих элементов в каждом возможном состоянии. Поэтому в каждом из этих случаев подсчет следует проводить совершенно различным образом. В первом случае получается статистика Ферми – Дирака, которую можно с таким же успехом назвать статистикой Паули, ибо она потенциально заключена в принципе Паули. Во втором случае мы имеем статистику Бозе – Эйнштейна, потенциально содержащуюся в наших первых работах по волновой механике.
Эти две новые статистики асимптотически переходят в классическую статистику при стремлении величины h к нулю, как и следовало a priori ожидать. Если развить две термодинамики, соответствующие этим двум статистикам, то мы получим две теории, несколько отличные друг от друга, которые также перейдут в классическую термодинамику, если считать, что h бесконечно малая величина. Если для каждого из этих случаев вывести законы идеального газа, то мы получим законы, отклоняющиеся от классических в противоположных направлениях. Так, например, в одном случае газ более сжимаем, а в другом – менее сжимаем, чем следует из закона Мариотта – Гей-Люссака. К сожалению, для газов при обычных условиях эти отклонения необычайно малы. По этой причине обнаружить их совершенно невозможно, тем более, что реальные газы далеки от идеальности, и отклонения от закона Мариотта – Гей-Люссака, возникающие из-за других причин (взаимодействие между молекулами, конечный объем самих молекул и т.д.), совершенно маскируют эффекты статистик. Поэтому новые статистики не находят своего подтверждения при изучении реальных газов.
Однако, к счастью, для каждой из них существует важный объект, на котором можно доказать их справедливость. Для статистики Бозе – Эйнштейна – это излучение черного тела. Для статистики Ферми – Дирака – случай электронов в металле. Скажем несколько слов о каждом из них.
Мы видели, что фотоны не подчиняются принципу Паули, поэтому ничто не мешает любому числу фотонов пребывать в одном и том же состоянии. Фотонный газ подчиняется, таким образом, статистике Бозе – Эйнштейна. Далее, равновесное излучение в изотермическом замкнутом объеме вполне можно рассматривать как фотонный газ, с той лишь разницей, что, поскольку стенки сосуда поглощают или испускают излучение, число фотонов не обязательно остается постоянным. Применяя статистику Бозе – Эйнштейна к равновесному излучению, мы очень легко получим планковский закон спектрального распределения. Поскольку формула Планка надежно подтверждается экспериментально, то мы получаем здесь замечательное подтверждение и статистики Бозе – Эйнштейна. И это подтверждение очень убедительно, ибо ни классическая статистика, ни статистика Ферми – Дирака не позволяют получить правильного спектрального распределения фотонов равновесного излучения.
Статистика Ферми – Дирака нашла замечательное подтверждение в электронной теории металлов. Еще в старой электронной теории Друде и Лоренц нашли объяснение ряда свойств металлов, например, их способности проводить тепло и электричество. Они предположили, что атомы в металле частично ионизованы, причем в результате этой ионизации внутри металла образуется газ из свободных электронов. Применив к этому электронному газу методы статистической механики, они сумели удовлетворительно объяснить большинство свойств металлов.
Однако в этой теории еще оставалось много трудностей, Самая большая была связана с удельной теплоемкостью металлов, которая из-за наличия внутри металла свободных электронов должна была быть во много раз больше, чем это есть в действительности.
Развитие новой статистики позволило Зоммерфельду разрешить некоторые из этих трудностей. Поскольку электроны подчиняются принципу Паули, они должны описываться статистикой Ферми – Дирака. Простой численный расчет показывает, что условия, в которых находятся электроны внутри металла, весьма отличаются от условий существования атомов обычного газа. Для этих последних результаты, полученные с помощью статистики Ферми – Дирака, не сильно отличаются от результатов, которые дает классическая статистика. Что же касается электронов внутри металла, то там, наоборот, статистика Ферми приводит к иным результатам, чем статистика Больцмана.
Это различие – прямое следствие необычайно малой массы электрона по сравнению с массой атома. Если предположить, что справедлива квантовая статистика, то нужно пересмотреть теории Друде и Лоренца. Это и сделал Зоммерфельд. Он сохранил правильные результаты старой теории, внеся в них поправки, и разрешил большое число возникших в ней трудностей. Например, он легко объяснил, исходя из положений статистики Ферми – Дирака, почему свободные электроны не вносят заметного вклада в теплоемкость металлов и, следовательно, почему их теплоемкость почти не отличается от теплоемкости, найденной без учета свободных электронов. Таким образом, устранялось основное ошибочное предсказание старой теории. Многие теоретики, среди которых мы упомянем Леона Бриллюэна, Феликса Блоха и Пайерлса, встали на путь, указанный работой Зоммерфельда, и в значительной степени развили первые результаты. Это – самостоятельная важная область физики, о которой из-за ограниченного объема этой книги мы, к сожалению, не можем больше говорить. Мы лишь заметим, что наряду с этими блестящими результатами еще остаются кое-какие неясности.
Из других приложений квантовой статистики мы только укажем (без обсуждения), что Ферми блестяще применил свою статистику к исследованию свойств атомов, рассматривая каждый атом как газ из нескольких электронов, помещенный в поле центральных сил ядра.
5. Замечание о принципе тождественности
Волновая механика систем, содержащих частицы одинаковой природы, и их квантовая статистика требуют, как видно, чтобы мы в какой-то мере отказались от представления о различности частиц. Однако полный отказ от признания различности частиц мог бы показаться несколько чрезмерным требованием. Казалось, что возможность различать частицы связана с возможностью локализовать их в различных областях пространства. Последняя возможность всегда существует, поэтому всегда можно различать частицы экспериментально, локализуя их в различных областях пространства. В то же время, когда распределения плотности вероятности нескольких частиц перекрываются, т.е. когда становятся возможными обменные эффекты, то различить отдельные частицы уже невозможно: об этом мы уже говорили, когда речь шла об обменной энергии. Но именно такой случай реализуется в большинстве систем, рассматриваемых квантовой механикой, в частности, в газе, где предполагается, что частицы обладают строго определенной энергией: энергией, соответствующей плоской монохроматической волне (или почти такой), заполняющей весь сосуд. Таким образом, понятно, почему в классической механике не возникает проблема неразличимости частиц, она связана с тем, что две квантовые частицы могут занимать (по крайней мере потенциально) одну и ту же область пространства, что характерно для квантовомеханических представлений.
Если вернуться к замечаниям, сделанным в п. 3 и 4, то увидим, что и неразличимость частиц, и принцип Паули, и обменная энергия – это три внутренне связанных таинственных свойства: все они вытекают из невозможности точно описать физические явления в трехмерном непрерывном пространстве или (в более общем случае) в четырехмерном пространственно-временном континууме. Возможно, что когда-нибудь, исходя из других представлений, мы сумеем глубже проникнуть в смысл этих великих руководящих принципов новой физики. Но сегодня они еще совершенно неясны.
Мы могли бы сказать также, что физическое понятие индивидуального является дополнительным к понятию системы в том смысле, какой придавал этому термину Бор. Действительно, частицу можно различить лишь тогда, когда она изолирована. Если же она вступает во взаимодействие с другими частицами, то она теряет свою индивидуальность. Хотя в классических теориях это подчеркивается недостаточно, представление о потенциальной энергии взаимодействия системы означает некоторую потерю индивидуальности компонент системы благодаря объединению части их полной энергии в потенциальную энергию системы.
В тех случаях, которые рассматривает новая механика, когда тождественные частицы занимают, иногда в тот же самый момент времени, одну область пространства, индивидуальность отдельных частиц уменьшается до нуля. Если постепенно переходить от случая изолированных частиц без взаимодействия к только что рассмотренным случаям, то понятие индивидуальности частиц будет становиться все более и более неясным, в то время как представление о системе будет проявляться все более четко. Таким образом, оказывается, что эти два понятия являются дополнительными идеализациями. Впрочем, это всего лишь некая идея, требующая более тщательного исследования.
Литература
Мы решили привести этот небольшой список литературы для удобства тех читателей, которые захотят продолжить и углубить свое знакомство с предметом этой книги, В списке – разные книги, В некоторых из них только отдельные главы или отдельные статьи посвящены собственно квантовой физике. Другие (например, книга Э.В. Шпольского) представляют собой уже прямо руководства типа учебников. Мы рассчитываем, что заинтересованный читатель сумеет выбрать из этого списка литературу, отвечающую его вкусам.
Бор Н. Атомная физика и человеческое познание. М., Изд-во иностр. лит., 1962.
Гейзенберг В. Философские проблемы атомной физики. М. Изд-во иностр. лит., 1953.
Данин Д.С. Неизбежность странного мира. М., «Молодая гвардия», 1962.
Ежегодник «Наука и человечество». М., «Знание», 1962, 1963, 1964.
Иоффе А.Ф. Основные представления современной физики, М. – Л., Гостехиздат, 1949.
Месси Г. Новая эра в физике. М., Госатомиздат, 1963.
Сб. «Глазами ученых». М., Изд-во АН СССР, 1963.
Сб. «Над чем думают физики». Вып. 1. М., Физматгиз, 1962; вып. 2. М., Физматгиз, 1963.
Сб. «Эйнштейн и современная физика». М., Гостехиздат, 1956.
Шпольский Э.В. Атомная физика. Т. 1. М., Гостехиздат, 1949; т. 2. М., Гостехиздат, 1950.
Эйнштейн А. и Инфельд Л. Эволюция физики. М., Гостехиздат, 1956.
Комментарии к книге «Революция в физике (Новая физика и кванты)», Луи де Бройль
Всего 0 комментариев