Р. Фейнман, Р. Лейтон, М. Сэндс Фейнмановские лекции по физике Том 1. Механика, излучение и теплота
К читателям русского издания
Это лекции по общей физике, которые читал физик-теоретик. Они совсем не похожи ни на один известный курс. Это может показаться странным: основные принципы классической физики, да и не только классической, но и квантовой, давно установлены, курс общей физики читается во всем мире в тысячах учебных заведений уже много лет и ему пора превратиться в стандартную последовательность известных фактов и теорий, подобно, например, элементарной геометрии в школе. Однако даже математики считают, что их науке надо учить по-другому. А уж о физике и говорить нечего: она столь интенсивно развивается, что даже лучшие педагоги все время сталкиваются с большими трудностями, когда им надо рассказывать студентам о современной науке. Они жалуются, что им приходится ломать то, что принято называть старыми или привычными представлениями. Но откуда берутся привычные представления? Обычно они попадают в молодые головы в школе от таких же педагогов, которые потом будут говорить о недоступности идей современной науки. Поэтому прежде чем подойти к сути дела, приходится тратить много времени на то, чтобы убедить слушателей в ложности того, что было ранее внушено им как очевидная и непреложная истина. Было бы дико сначала рассказывать школьникам «для простоты», что Земля плоская, а потом, как открытие, сообщать о ее шарообразности. А так ли далек от этого абсурдного примера тот путь, по которому будущие специалисты входят в современный мир идей теории относительности и квантов? Осложняет дело также то обстоятельство, что большей частью лектор и слушатели — люди разных поколений, и лектору очень трудно уйти от соблазна вести слушателей той знакомой и надежной дорогой, по которой он сам в свое время дошел до желанных высот. Однако старая дорога не вечно остается лучшей. Физика развивается очень быстро, и, чтобы не отставать от нее, надо менять пути ее изучения. Все согласны с тем, что физика — одна из самых интересных наук. В то же время многие учебники физики никак не назовешь интересными. В таких учебниках изложено все, что следует по программе. Там обычно объясняется, какую пользу приносит физика и как важно ее изучать, но из них очень редко можно понять, почему заниматься физикой интересно. А ведь эта сторона вопроса тоже заслуживает внимания. Как же можно сделать скучный предмет и интересным и современным? Об этом прежде всего должны подумать те физики, которые сами работают с увлечением и умеют передать это увлечение другим. Пора экспериментов уже наступила. Цель их — найти наиболее эффективные способы обучения физике, которые позволили бы быстро передать новому поколению весь тот запас знаний, который накоплен наукой за всю ее историю. Поиски новых путей в преподавании также всегда были важной частью науки. Преподавание, следуя развитию науки, должно непрерывно менять свои формы, ломать традиции, искать новые методы. Здесь важную роль играет то обстоятельство, что в науке все время происходит удивительный процесс своеобразного упрощения, который позволяет просто и кратко изложить то, что когда-то потребовало много лет работы.
Чрезвычайно интересная попытка в этом направлении была предпринята в Калифорнийском Технологическом институте (США), который сокращенно называют КАЛТЕХ, где группа профессоров и преподавателей после многочисленных дискуссий разработала новую программу по общей физике, а один из участников этой группы, крупный американский физик Ричард Фейнман, прочел лекции.
Лекции Фейнмана отличаются тем, что они обращены к слушателю, живущему во второй половине XX века, который уже многое знает или слышал. Поэтому в лекциях не тратится время на объяснение «ученым языком» того, что и так известно. Зато в них увлекательно рассказывается, как человек изучает окружающую его природу, о достигнутых сегодня границах в познании мира, о том, какие проблемы наука решает сегодня и будет решать завтра.
Лекции читались в 1961—1962 и 1962—1963 учебных годах; они записывались на магнитофон, а потом (и это оказалось само по себе трудной задачей) «переводились» на «письменный английский» профессорами М. Сэндсом и Р. Лейтоном. В этом своеобразном «переводе» сохранены многие особенности живой речи лектора, ее живость, шутки, отступления. Однако это очень ценное качество лекций отнюдь не было главным и самодовлеющим. Не менее важным были созданные лектором оригинальные методы подачи материала, в которых отразилась яркая научная индивидуальность автора, его точка зрения на пути обучения студентов физике. Это, разумеется, не случайно. Известно, что и в своих научных работах Фейнман всегда находил новые методы, которые очень быстро становились общепринятыми. Работы Фейнмана по квантовой электродинамике, статистике принесли ему широкое признание, а его метод — так называемые «диаграммы Фейнмана» — используется сейчас практически во всех областях теоретической физики.
Что бы ни говорили об этих лекциях — восторгались стилем изложения или сокрушались по поводу ломки старых добрых традиций, — одно остается бесспорным: надо начинать педагогические опыты. Наверное, не все согласятся с манерой автора излагать те или иные вопросы, не все согласятся с оценкой целей и перспектив современной физики. Но это послужит стимулом к появлению новых книг, в которых получат отражение другие взгляды. Это и есть эксперимент.
Но вопрос состоит не только в том, что рассказывать. Не менее важен и другой вопрос — в каком порядке это надо делать. Расположение разделов внутри курса общей физики и последовательность изложения — вопрос всегда условный. Все части науки настолько связаны друг с другом, что часто трудно решить, что надо излагать сначала, а что потом.
Однако в большинстве вузовских программ и имеющихся учебников до сих пор сохраняются определенные традиции. Отказ от привычной последовательности изложения — одна из отличительных особенностей фейнмановских лекций. В них рассказано не только о конкретных задачах, но и о месте, которое занимает физика в ряде других наук, о путях описания и изучения явлений природы. Вероятно, представители других наук — скажем, математики — не согласятся с тем местом, которое отводит этим наукам Фейнман. Для него, как физика, «своя» наука, конечно, выглядит самой главной. Но это обстоятельство не занимает много места в его изложении. Зато в его рассказе ярко отражаются те причины, которые побуждают физика вести тяжелую работу исследователя, а также те сомнения, которые у него возникают, когда он сталкивается с трудностями, кажущимися сейчас непреодолимыми.
Молодой естествоиспытатель должен не только понять, почему интересно заниматься наукой, но и почувствовать, какой дорогой ценой достаются победы и как порой бывают тяжелы дороги, к ним ведущие.
Надо также иметь в виду, что если сначала автор обходился без математического аппарата или использовал лишь тот, который изложен в лекциях, то от читателя, по мере продвижения его вперед, будет требоваться увеличение его математического багажа. Впрочем, опыт показывает, что математический анализ (по крайней мере его основы) выучивается сейчас легче, чем физика.
Лекции Фейнмана вышли в США в трех больших томах. Первый содержит в основном лекции по механике и теории теплоты, второй — электродинамику и физику сплошных сред, а третий — квантовую механику. Чтобы книга была доступна большему числу читателей и чтобы ею было удобнее пользоваться, русское издание будет выходить небольшими выпусками. Первые четыре из них соответствуют первому тому американского издания.
Кому будет полезна эта книга? Прежде всего — преподавателям, которые ее прочтут целиком: она заставит их задуматься об изменении сложившихся взглядов на то, как начинать обучать физике. Далее, её прочтут студенты. Они найдут в ней много нового в дополнение к тому, что они узнают на лекциях. Конечно, ее попытаются читать и школьники. Большинству из них будет трудно одолеть все, но и то, что они смогут прочесть и понять, поможет им войти в современную науку, путь в которую всегда бывает трудным, но никогда не бывает скучным. Тому, кто не верит, что может пройти его, не стоит браться за изучение этой книги! И, наконец, ее могут читать все остальные. Читать просто так, для удовольствия. Это тоже очень полезно.
Фейнман в своем предисловии оценивает результаты своего опыта не очень высоко: слишком малая доля студентов, прослушавших его курс, усвоили все лекции. Но так и должно быть. Первый опыт редко приносит полный успех. Новые идеи всегда находят вначале лишь немного сторонников и лишь постепенно становятся привычными.
Я. Смородинский
Январь 1965
Предисловие Р. Фейнмана
Это — лекции по физике, которые я читал в прошлом и позапрошлом годах в Калифорнийском Технологическом институте для студентов первого и второго курсов. Но это не дословная их запись. Их пригладили — местами очень сильно, а порой не очень. К тому же это лишь часть полного курса обучения. Дважды в неделю 180 слушателей собирались в большой аудитории и, прослушав лекцию, группами по 15—20 человек проводили еще семинары под руководством ассистентов. Вдобавок раз в неделю проводились и лабораторные работы.
Чего мы хотели добиться, читая эти лекции? Мы хотели утвердить интерес к физике у молодых ее энтузиастов, у вчерашних выпускников средней школы. Перед поступлением в институт они много наслышались о том, как интересна и как увлекательна современная физика — теория относительности, квантовая механика и т. д. Но если бы этот курс читался так, как он читался раньше, весь их энтузиазм за два года мало-помалу улетучился бы — чересчур уж редко при обычном обучении встречаются действительно величественные, новые, современные идеи. Студентов заставили бы изучать наклонную плоскость, электростатику и прочее в этом роде, и все их порывы были бы сведены на нет. И весь вопрос был в том, сможем ли мы так построить курс, чтобы у самых способных, самых горячих студентов сохранился и укрепился их энтузиазм.
Не сочтите эти лекции каким-то обзорным курсом. Нет, курс этот весьма серьезен. Читая его, я ориентировался на самых сообразительных, я хотел по возможности, чтобы даже самые сильные слушатели не были в состоянии до конца усвоить все, что есть в этих лекциях. Для этого я подкидывал им мысли о возможных применениях основных идей и понятий вне основной линии наступления. Для этой цели я старался поточнее формулировать все утверждения, указывать, где только можно, какие уравнения и идеи укладываются в физическую картину мира и как при дальнейшем углублении они могут измениться. Я понимал также, что таким студентам очень важно указать, что из изучаемого они (если, конечно, у них достанет соображения) могут сами вывести из уже известного, а что, наоборот, для них совершенно ново. Формулируя новые идеи, я пытался либо вывести их, если они могли быть выведены, либо объяснить, что это действительно новая идея, что на уже изученные понятия ее опереть никак нельзя и что поэтому нельзя ее считать доказуемой, а можно лишь включить со стороны.
Приступая к лекциям, я предполагал, что студенты все же кое-что вынесли из средней школы — разные там геометрические оптики, простенькие понятия из химии и тому подобное. Я не видел также смысла в том, чтобы устанавливать какой-то определенный порядок в лекциях, чтоб нельзя было упоминать о вещах, о которых подробно будет говориться только позже. Наоборот, я часто вкратце говорю о том, что студент по-настоящему изучит намного позднее, когда он будет лучше подготовлен. Например, понятие об индуктансе или об энергетических уровнях дается на первых порах очень приблизительное и только спустя много времени развивается как следует.
Рассчитывая курс на самого активного слушателя, я все же учел интересы и такого парня, которого все эти фейерверки мыслей и многосторонние приложения могут только встревожить и отпугнуть, от кого вообще нельзя ожидать, что он усвоит большую часть материала. Я хотел, чтобы для него в лекциях оказалось по крайней мере основное ядро, или костяк, того, что он может получить. Я надеюсь, что он не очень будет нервничать, если не поймет в лекции всего. Пусть не понимает всего, пусть ухватит только самую суть, самое бьющее в глаза. Конечно, и для этого он должен проявить некоторую сообразительность, должен захотеть понять, какие теоремы и представления являются самыми главными, а что он сможет понять только позже и пока оставляет в стороне.
Была у меня одна серьезная трудность, когда я читал эти лекции: не работала обратная связь — от студента к преподавателю; я не видел, насколько хорошо эти лекции доходят. Это очень серьезная помеха, и я поныне не знаю, хороши ли эти лекции. Это по существу эксперимент, и, если бы мне пришлось его проделать еще раз, я бы его поставил иначе, но я надеюсь, что мне не придется браться за это дело вторично! И все же мне кажется, что для первого курса, по крайней мере в отношении физики, все выглядит вполне прилично.
А вот второй частью курса[1] я не очень доволен. В начале этой части, говоря об электричестве и магнетизме, я не смог придумать какого-либо особого, отличного от общепринятого способа изложения, не смог найти такого подхода к теме, который возбуждал бы к ней интерес. С электричеством и с магнетизмом, таким образом, не много мне удалось сделать. После этой темы в конце второго курса я сначала собирался прочесть несколько лекций о свойствах твердых тел, касаясь главным образом таких вещей, как нормальные колебания, решения уравнения диффузии, колебательные системы, ортогональные функции и т. д., т. е. изложить начала того, что обычно именуют «методами математической физики». Задним числом могу сознаться, что, если бы я решился читать этот курс вторично, я бы непременно вернулся к этому намерению. Но поскольку повторение этих лекций не планируется, а вместо этого мне сказали, что неплохо было бы дать введение в квантовую механику, то это вы и обнаружите в конце настоящего курса.
Совершенно ясно, что студентам, желающим хорошо разобраться в физике, можно было бы подождать с изучением квантовой механики и до третьего курса. Но, возражая, мне выдвинули довод, что многие студенты с моего курса изучают физику только в качестве основы для занятий другими науками. Обычный же способ изучения квантовой механики делает ее почти недоступной для большинства студентов, потому что у них нет возможности так долго изучать ее. А в то же время вся махина дифференциальных уравнений, весь такой подход к квантовой механике редко используется в ее применениях, в частности в таких более сложных применениях, как электроника и химия. Поэтому я попробовал описать принципы квантовой механики так, чтобы знания уравнений в частных производных вначале не требовалось. Даже физику, я думаю, будет интересно такое изложение квантовой механики (по причинам, которые станут ясны из самих лекций). И все же мне кажется, что эксперимент с квантовой механикой не очень удался главным образом из-за того, что мне не хватило времени и конец пришлось скомкать (мне бы нужно было еще 3—4 лекции, чтобы полней изложить такие вопросы, как энергетические полосы и пространственная зависимость амплитуд). Да и, кроме того, я никогда прежде не излагал материал таким способом и отсутствие обратной связи ощущал особенно остро. Теперь я думаю, что квантовую механику надо излагать все-таки позже. Не исключено, что у меня появится возможность еще раз прочесть этот курс. Тогда я сделаю это получше.
В этом курсе нет лекций, посвященных решению задач. Они решались на семинарах. Хотя на трех лекциях я решал задачи, но в курс они не вошли. После лекции о вращающихся системах была прочитана лекция об инерциальной навигации, но, к сожалению, при издании ее опустили. Пятую и шестую лекции прочитал Мэтью Сэндс (я уезжал тогда из города).
Возникает естественный вопрос, насколько этот эксперимент удался. Моя личная точка зрения, которую, впрочем, не разделяют работавшие со студентами преподаватели, довольно пессимистична. Мне не кажется, что я хорошо поступил со студентами. Когда я наблюдал, как большинство студентов решает задачки на экзаменах, я подумывал о крахе всей моей системы преподавания. Правда, мои друзья напомнили мне, что среди студентов оказался десяток-другой разобравшихся, как это ни странно, почти во всем, активно трудившихся над материалом и подолгу с увлечением мучившихся над трудными вопросами. Эти ребята, на мой взгляд, обладают сейчас первоклассной подготовкой по физике, и я попытаюсь после всего заполучить их к себе на работу. Впрочем, «обучение редко приносит плоды кому-либо, кроме тех, кто предрасположен к нему, но им оно почти не нужно» (Гиббонс).
Тем не менее я не хотел бы бросать ни одного студента на произвол судьбы, как это, видимо, бывало при чтении курса. Как все-таки помочь студентам? Может быть, надо больше поработать над составлением комплекса задач, которые могли бы пролить свет на идеи, развиваемые в лекциях? Задачи дадут хорошую возможность расширить лекционный материал и помогут сделать идеи лекций более осязаемыми и полными, лучше уложить их в голове.
Все же я думаю, что самое лучшее решение проблемы образования — это понять, что самым превосходным обучением является прямая, личная связь между учеником и хорошим учителем, когда ученик обсуждает идеи, размышляет о разных вещах и беседует о них. Невозможно многому научиться, просто отсиживая лекции или даже просто решая задачи. Но в наше время такое множество студентов должно быть обучено, что для идеалов приходится подыскивать эрзацы. Может быть, мои лекции помогут в этом. Может быть, в тех краях, где можно найти отдельного учителя для каждого ученика, эти лекции смогут вдохновить учителя и подбросить ему кое-какие идеи. Может быть, поразмыслив над ними, он только позабавится, а может, и разовьет их дальше.
Ричард Фейнман
Июнь 1963
Предисловие
В основу этой книги легли лекции по общей физике, которые профессор Р. Фейнман читал в 1961—1962 академическом году в Калифорнийском Технологическом институте. Это — первая половина двухгодичного вводного курса, обязательного для всех студентов КАЛТЕХа. В 1962—1963 академическом году был прочитан второй цикл лекций, чем завершилась основная часть рассчитанной на четыре года работы по перестройке вводного курса физики.
Необходимость такого коренного пересмотра курса вызывалась не только быстрым развитием физики за последние десятилетия, но и тем, что в последние годы первокурсники приходили в КАЛТЕХ с более глубокой математической подготовкой, чем раньше, — результат улучшения преподавания математики в средней школе. Мы хотели, используя преимущества более прочного математического фундамента, изложить побольше современного материала, что сделало бы курс более интересным, наводящим на размышления и лучше отражающим физику наших дней.
Чтобы иметь представление о том, что надо включить в курс и как это сделать, преподавателям физического факультета было предложено высказать свои идеи в виде краткой программы курса. Возникло несколько проектов перестройки, которые были обсуждены подробно и с пристрастием. Почти все сошлись в одном: перестройку курса нельзя начинать ни просто с переделки уже существующих учебников, ни даже с создания нового учебника; новый курс должен строиться на основе лекций, лекции должны читаться два или три раза в неделю. Создание соответствующих печатных руководств — это будет уже следующий шаг; эти же лекции определят и содержание будущих лабораторных работ. Вчерне были обрисованы общие контуры курса, но это был лишь предварительный набросок, многое в нем выглядело спорным и могло измениться по усмотрению того, кто взялся бы за чтение лекций.
Обсуждались и многочисленные варианты осуществления проекта. Первоначально предполагалось, что будет создана группа из N основных участников (лекторов), которые поровну распределят работу: каждый возьмет себе 1/N часть материала, прочтет лекции и подготовит их к печати. Однако отсутствие необходимого числа участников и трудность выработки среди них единой точки зрения, связанная с индивидуальными вкусами, взглядами и даже характером каждого, сделали этот план неосуществимым.
Счастливая идея о том, как все же можно создать, быть может, не просто новый курс, отличный от других, а, возможно, уникальный, пришла профессору Сэндсу. Он предложил, чтобы профессор Р. Фейнман подготовил и прочел лекции, которые будут записаны на магнитофонную ленту. После обработки и издания этих лекций получился бы новый учебник. Вот суть принятого в конце концов плана.
Сначала ожидалось, что необходимая редакторская работа сведется к подбору рисунков, расстановке запятых и исправлению грамматических ошибок; этим могли бы заняться между делом один-два студента старших курсов. К несчастью, эти надежды жили недолго. Оказалось, что даже простое приведение записей лекций к пригодному для чтения виду, даже без переработки и пересмотра материала лекций, требует много времени. Такая работа не под силу техническому редактору или студенту, она требует пристального внимания физика-профессионала, причем над каждой лекцией он должен потрудиться часов десять—двадцать.
Трудность редакторской работы, а также необходимость как можно скорее передать лекции в руки студентов сильно затруднили окончательную «доводку» материала, и мы были вынуждены ограничиться созданием предварительного, но годного для издания варианта лекций, который можно было использовать немедленно, хотя и нельзя считать окончательным. Крайняя нужда в большом количестве экземпляров лекций для наших студентов, а также интерес к лекциям студентов и преподавателей других институтов заставили нас издать лекции в их предварительном виде, не дожидаясь окончательной редакции, которой, может быть, никогда и не будет. Мы нисколько не заблуждаемся относительно полноты, связности и логической стройности материала; более того, уже в ближайшем будущем мы собираемся вновь модернизировать курс и думаем, что ни форма, ни содержание его не останутся долго без изменений.
Кроме лекций — наиболее важной части курса, — нужно было позаботиться о задачах, развивающих опыт и умение студентов, и о лабораторных работах, чтобы студенты могли «потрогать руками» изложенный в лекциях материал. Ни то, ни другое еще не достигло той законченности, которую имел материал лекций, хотя кое-что в этом направлении, конечно, сделано. Некоторые задачи были придуманы в ходе чтения лекций, они затем были улучшены, а число их увеличено при повторном чтении курса. Однако мы еще не уверены в том, что эти задачи достаточно разнообразны и углубляют содержание лекций настолько, чтобы студенты могли сами полностью понять, каким мощным аппаратом они владеют. Поэтому задачи будут опубликованы отдельно и в таком виде, который бы допускал их более или менее частую переделку.
Профессор Неер предложил включить в курс несколько новых опытов. Среди них опыты, основанные на использовании воздушных подшипников с чрезвычайно малым трением: новый линейный воздушный желоб, с помощью которого можно количественно изучить одномерное движение, соударения тел и гармоническое движение; а также поддерживаемый на воздушной подушке и движимый воздухом максвелловский волчок, с помощью которого можно изучить вращение с ускорением, прецессию и нутацию гироскопа. Разработка новых лабораторных опытов будет, по-видимому, продолжаться в течение значительного времени. Этот пересмотр учебной программы возглавляли профессора Р. Лейтон, Г. Неер и М. Сэндс. Официально в этой работе принимали участие профессора Р. Фейнман, Г. Нойгебауер, Р. Саттон, Г. Стаблер, Ф. Стронг и Р. Фогт с кафедр физики, математики и астрономии, а также профессора Т. Кофи, М. Плессет и К. Уилтс с кафедры технических наук. Мы сердечно благодарим за ценную помощь всех тех, кто принимал участие в пересмотре курса. Особенно мы обязаны фонду Форда, без финансовой помощи которого эта работа никогда не была бы осуществлена.
Роберт Б. Лейтон
Июль 1963
Выпуск 1. Современная наука о природе. Законы механики
Глава 1 АТОМЫ В ДВИЖЕНИИ
§ 1. Введение
Этот двухгодичный курс физики рассчитан на то, что вы, читатель, собираетесь стать физиком. Положим, это не так уж обязательно, но какой преподаватель не надеется на это! Если вы и впрямь хотите быть физиком, вам придется много поработать. Как-никак, а двести лет бурного развития самой мощной области знания что-нибудь да значат! Такое обилие материала, пожалуй, и не усвоишь за четыре года; вслед за этим нужно еще прослушать специальные курсы.
И все же весь результат колоссальной работы, проделанной за эти столетия, удается сконденсировать — свести в небольшое число законов, которые подытоживают все наши знания. Однако и законы эти тоже нелегко усвоить, и просто нечестно по отношению к вам было бы начинать изучение такого трудного предмета, не имея под рукой какой-нибудь схемы, какого-нибудь очерка взаимосвязи одних частей науки с другими. Первые три главы и представляют собой такой очерк. Мы познакомимся в этих главах с тем, как связана физика с остальными науками, как относятся эти остальные науки друг к другу, да и что такое сама наука. Это поможет нам «ощутить» предмет физики.
Вы спросите: почему бы сразу, на первой же странице, не привести основные законы, а после только показывать, как они работают в разных условиях? Ведь именно так поступают в геометрии: сформулируют аксиомы, а потом остается только делать выводы. (Неплохая мысль: изложить за 4 минуты то, что и в 4 года не уложишь.) Сделать это невозможно по двум причинам. Во-первых, нам известны не все основные законы; наоборот, чем больше мы узнаем, тем сильнее расширяются границы того, что мы должны познать! Во-вторых, точная формулировка законов физики связана со многими необычными идеями и понятиями, требующими для своего описания столь же необычной математики. Нужна немалая практика только для того, чтобы наловчиться понимать смысл слов. Так что ваше предложение не пройдет. Придется нам двигаться постепенно, шаг за шагом.
Каждый шаг в изучении природы — это всегда только приближение к истине, вернее, к тому, что мы считаем истиной. Все, что мы узнаем, — это какое-то приближение, ибо мы знаем, что не все еще законы мы знаем. Все изучается лишь для того, чтобы снова стать непонятным или, в лучшем случае, потребовать исправления.
Принцип науки, почти что ее определение, состоит в следующем: пробный камень всех наших знаний — это опыт. Опыт, эксперимент — это единственный судья научной «истины». А в чем же источник знаний? Откуда приходят те законы, которые мы проверяем? Да из того же опыта; он помогает нам выводить законы, в нем таятся намеки на них. А сверх того нужно еще воображение, чтобы за намеками увидеть что-то большое и главное, чтобы отгадать нежданную, простую и прекрасную картину, встающую за ними, и потом поставить опыт, который убедил бы нас в правильности догадки. Этот процесс воображения настолько труден, что происходит разделение труда: бывают физики-теоретики, они воображают, соображают и отгадывают новые законы, но опытов не ставят, и бывают физики-экспериментаторы, чье занятие — ставить опыты, воображать, соображать и отгадывать.
Мы сказали, что законы природы — это приближения; сперва открывают «неправильные» законы, а потом уж — «правильные». Но как опыт может быть «неверным»? Ну, во-первых, по самой простой причине: когда в ваших приборах что-то неладно, а вы этого не замечаете. Но такую ошибку легко уловить, надо лишь все проверять и проверять. Ну, а если не придираться к мелочам, могут ли все-таки результаты опыта быть ошибочными? Могут, из-за нехватки точности. Например, масса предмета кажется неизменной; вращающийся волчок весит столько же, сколько лежащий на месте. Вот вам и готов «закон»: масса постоянна и от скорости не зависит. Но этот «закон», как выясняется, неверен. Оказалось, что масса с увеличением скорости растет, но только для заметного роста нужны скорости, близкие к световой. Правильный закон таков: если скорость предмета меньше 100 км/сек, масса с точностью до одной миллионной постоянна. Вот примерно в такой приближенной форме этот закон верен. Можно подумать, что практически нет существенной разницы между старым законом и новым. И да, и нет. Для обычных скоростей можно забыть об оговорках и в хорошем приближении считать законом утверждение, что масса постоянна. Но на больших скоростях мы начнем ошибаться, и тем больше, чем скорость выше.
Но самое замечательное, что с общей точки зрения любой приближенный закон абсолютно ошибочен. Наш взгляд на мир потребует пересмотра даже тогда, когда масса изменится хоть на капельку. Это — характерное свойство общей картины мира, которая стоит за законами. Даже незначительный эффект иногда требует глубокого изменения наших воззрений.
Так что же нам нужно изучить сначала? Учить ли нам правильные, но необычные законы с их странными и трудными понятиями, например теорию относительности, четырехмерное пространство-время и т. д.? Или же начать с простого закона «постоянной массы»? Он хоть и приближенный, но зато обходится без трудных представлений. Первое, бесспорно, приятней, притягательней; первое очень соблазняет, но со второго начать легче, и потом ведь это первый шаг к углубленному пониманию правильной идеи. Этот вопрос встает все время, когда преподаешь физику. На разных этапах курса мы по-разному будем решать его, но на каждой стадии мы будем стараться изложить, что именно сейчас известно и с какой точностью, как это согласуется с остальным и что может измениться, когда мы узнаем об этом больше.
Давайте перейдем к нашей схеме, к очерку нашего понимания современной науки (в первую очередь физики, но также и прочих близких к ней наук), так что, когда позже нам придется вникать в разные вопросы, мы сможем видеть, что лежит в их основе, чем они интересны и как укладываются в общую структуру.
Итак, как же выглядит картина мира?
§ 2. Вещество состоит из атомов
Если бы в результате какой-то мировой катастрофы все накопленные научные знания оказались бы уничтоженными и к грядущим поколениям живых существ перешла бы только одна фраза, то какое утверждение, составленное из наименьшего количества слов, принесло бы наибольшую информацию? Я считаю, что это — атомная гипотеза (можете называть ее не гипотезой, а фактом, но это ничего не меняет): все тела состоят из атомов — маленьких телец, которые находятся в беспрерывном движении, притягиваются на небольшом расстоянии, но отталкиваются, если одно из них плотнее прижать к другому. В одной этой фразе, как вы убедитесь, содержится невероятное количество информации о мире, стоит лишь приложить к ней немного воображения и чуть соображения.
Чтобы показать силу идеи атома, представим себе капельку воды размером 0,5 см. Если мы будем пристально разглядывать ее, то ничего, кроме воды, спокойной, сплошной воды, мы не увидим. Даже под лучшим оптическим микроскопом при 2000-кратном увеличении, когда капля примет размеры большой комнаты, и то мы все еще увидим относительно спокойную воду, разве что по ней начнут шнырять какие-то «футбольные мячи». Это парамеция — очень интересная штука. На этом вы можете задержаться и заняться парамецией, ее ресничками, смотреть, как она сжимается и разжимается, и на дальнейшее увеличение махнуть рукой (если только вам не захочется рассмотреть ее изнутри). Парамециями занимается биология, а мы прошествуем мимо них и, чтобы еще лучше разглядеть воду, увеличим ее опять в 2000 раз. Теперь капля вырастет до 20 км, и мы увидим, как в ней что-то кишит; теперь она уже не такая спокойная и сплошная, теперь она напоминает толпу на стадионе в день футбольного состязания с высоты птичьего полета. Что же это кишит? Чтобы рассмотреть получше, увеличим еще в 250 раз. Нашему взору представится что-то похожее на фиг. 1.1.
Фиг. 1.1. Капля воды (увеличенная в миллиард раз).
Это капля воды, увеличенная в миллиард раз, но, конечно, картина эта условная. Прежде всего частицы изображены здесь упрощенно, с резкими краями — это первая неточность. Для простоты они расположены на плоскости, на самом же деле они блуждают во всех трех измерениях — это во-вторых. На рисунке видны «кляксы» (или кружочки) двух сортов — черные (кислород) и белые (водород); видно, что к каждому кислороду пристроились два водорода. (Такая группа из атома кислорода и двух атомов водорода называется молекулой.) Наконец, третье упрощение заключается в том, что настоящие частицы в природе беспрерывно дрожат и подпрыгивают, крутясь и вертясь одна вокруг другой. Вы должны представить себе на картинке не покой, а движение. На рисунке нельзя также показать, как частицы «липнут друг к другу», притягиваются, пристают одна к одной и т. д. Можно сказать, что целые их группы чем-то «склеены». Однако ни одно из телец не способно протиснуться сквозь другое. Если вы попробуете насильно прижать одно к другому, они оттолкнутся.
Радиус атомов примерно равен 1 или 2 на 10-8 см. Величина 10-8 см это ангстрем, так что радиус атома равен 1 или 2 ангстремам (Å). А вот другой способ запомнить размер атома: если яблоко увеличить до размеров Земли, то атомы в яблоке сами станут размером с яблоко.
Представьте теперь себе эту каплю воды с ее частичками, которые приплясывают, играют в пятнашки и льнут одна к другой. Вода сохраняет свой объем и не распадается на части именно из-за взаимного притяжения молекул. Даже катясь по стеклу, капля не растекается, опять-таки из-за притяжения. И все вещества не улетучиваются по той же причине. Движение частиц в теле мы воспринимаем как теплоту; чем выше температура, тем сильнее движение. При нагреве воды толчея среди частиц усиливается, промежутки между ними растут, и наступает миг, когда притяжения между молекулами уже не хватает, чтобы удержать их вместе, вот тогда они и улетучиваются, удаляются друг от друга. Так получают водяной пар: при повышении температуры усиливается движение и частицы воспаряют.
На фиг. 1.2 показан пар.
Фиг. 1.2. Пар под микроскопом.
Рисунок этот плох в одном — при выбранном нами увеличении на комнату придется всего несколько молекул, поэтому сомнительно, чтобы целых 21/2 молекулы оказались на таком маленьком рисунке. На такой площадке скорее всего не окажется ни одной частицы. Но ведь надо что-то нарисовать, чтоб рисунок не был совсем пустым. Глядя на пар, легче увидеть характерные черты молекул воды. Для простоты на рисунке угол между атомами водорода взят 120°. На самом же деле он равен 105°3', а промежуток между центрами атомов кислорода и водорода равен 0,957 Å. Как видите, мы довольно хорошо представляем себе эту молекулу.
Давайте рассмотрим некоторые свойства водяного пара или других газов. Разрозненные молекулы пара то и дело ударяются о стенки сосуда. Представьте себе комнату, в которой множество теннисных мячей (порядка сотни) беспорядочно и беспрерывно прыгают повсюду. Под градом ударов стенки расходятся (так что их надо придерживать). Эту неумолкаемую дробь ударов атомов наши грубые органы чувств (их-то чувствительность не возросла в миллиард раз) воспринимают как постоянный напор. Чтобы сдержать газ в его пределах, к нему нужно приложить давление. На фиг. 1.3 показан обычный сосуд с газом (без него не обходится ни один учебник) — цилиндр с поршнем.
Фиг. 1.3. Цилиндр с поршнем.
Молекулы для простоты изображены теннисными мячиками, или точечками, потому что форма их не имеет значения. Они движутся беспорядочно и непрерывно. Множество молекул беспрерывно колотит о поршень. Их непрекращаемые удары вытолкнут его из цилиндра, если не приложить к поршню некоторую силу — давление (сила, собственно, — это давление, умноженное на площадь). Ясно, что сила пропорциональна площади поршня, потому что если увеличить его площадь, сохранив то же количество молекул в каждом кубическом сантиметре, то и число ударов о поршень возрастет во столько же раз, во сколько расширилась площадь.
А если в сосуде число молекул удвоится (и соответственно возрастет их плотность), а скорости их (и соответственно температура) останутся прежними? Тогда довольно точно удвоится и число ударов, а так как каждый из них столь же «энергичен», как и раньше, то выйдет, что давление пропорционально плотности. Если принять во внимание истинный характер сил взаимодействия атомов, то следует ожидать и небольшого спада давления из-за увеличения притяжения между атомами и легкого роста давления из-за увеличения доли общего объема, занятого самими атомами. И все же в хорошем приближении, когда атомов сравнительно немного (т. е. при невысоких давлениях), давление пропорционально плотности.
Легко понять и нечто другое. Если повысить температуру газа (скорость атомов), не меняя его плотности, что произойдет с давлением? Двигаясь быстрей, атомы начнут бить по поршню сильней; к тому же удары посыплются чаще — и давление возрастет. Вы видите, до чего просты идеи атомной теории.
А теперь рассмотрим другое явление. Пускай поршень медленно двинулся вперед, заставляя атомы тесниться в меньшем объеме. Что бывает, когда атом ударяет по ползущему поршню? Ясно, что после удара его скорость повышается. Можете это проверить, играя в пинг-понг: после удара ракеткой шарик отлетает от ракетки быстрей, чем подлетал к ней. (Частный пример: неподвижный атом после удара поршня приобретает скорость.) Стало быть, атомы, отлетев от поршня, становятся «горячее», чем были до толчка. Поэтому все атомы в сосуде наберут скорость. Это означает, что при медленном сжатии газа его температура растет. Когда медленно сжимаешь газ, его температура повышается, а когда медленно расширяешь, температура падает.
Вернемся к нашей капельке воды и посмотрим, что с ней будет, когда температура понизится. Положим, что толчея среди молекул воды постепенно утихает. Меж ними, как мы знаем, существуют силы притяжения; притянувшимся друг к другу молекулам уже нелегко покачиваться и прыгать. На фиг. 1.4 показано, что бывает при низких температурах; мы видим уже нечто новое.
Фиг. 1.4. Молекулы льда.
Образовался лед. Конечно, картинка эта опять условна — у льда не два измерения, как здесь изображено, но в общих чертах она справедлива. Интересно, что в этом веществе у каждого атома есть свое место, и если каким-то образом мы расставим атомы на одном конце капли каждый на свое место, то за многие километры от него на другом конце (в нашем увеличенном масштабе) из-за жесткой структуры атомных связей тоже возникнет определенная правильная расстановка. Поэтому если потянуть за один конец ледяного кристалла, то за ним, противясь разрыву, потянется и другой — в отличие от воды, в которой эта правильная расстановка разрушена интенсивными движениями атомов. Разница между твердыми и жидкими телами состоит в том, что в твердых телах атомы расставлены в особом порядке, называемом кристаллической структурой, и даже в том случае, когда они находятся далеко друг от друга, ничего случайного в их размещении не наблюдается — положение атома на одном конце кристалла определяется положением атомов на другом конце, пусть между ними находятся хоть миллионы атомов. В жидкостях же атомы на дальних расстояниях сдвинуты как попало. На фиг. 1.4 расстановка молекул льда мною выдумана, и хотя кое-какие свойства льда здесь отражены, но в общем она неправильна. Верно схвачена, например, часть шестигранной симметрии кристаллов льда. Посмотрите: если повернуть картинку на 120°, получится то же самое расположение. Таким образом, лед имеет симметрию, вследствие которой снежинки все шестигранны. Из фиг. 1.4 можно еще понять, отчего, растаяв, лед занимает меньший объем. Смотрите, как много «пустот» на рисунке; у настоящего льда их тоже много. Когда система разрушается, все эти пустоты заполняются молекулами. Большинство простых веществ, за исключением льда и гарта (типографского сплава), при плавлении расширяется, потому что в твердых кристаллах атомы упакованы плотнее, а после плавления им понадобится место, чтобы колебаться; сквозные же структуры, наподобие льда, разрушаясь, становятся компактнее.
Но хотя лед обладает «жесткой» кристаллической структурой, его температура может тоже меняться, в нем есть запас тепла. Этот запас можно менять по своему желанию. Что же это за тепло? Атомы льда все равно не находятся в покое. Они дрожат и колеблются. Даже когда существует определенный порядок в кристалле (структура), все атомы все же колеблются «на одном месте». С повышением температуры размах их колебаний все растет, пока они не стронутся с места. Это называется плавлением. Наоборот, с падением температуры колебания все замирают, пока при абсолютном нуле температуры они не станут наименьшими из возможных (хотя полной остановки не наступит).
Этого минимального количества движения не хватает, чтобы растопить тело. Но есть одно исключение — гелий. Гелий при охлаждении тоже уменьшает движение своих атомов до предела, но даже при абсолютном нуле в них оказывается достаточный запас движения, чтобы предохранить гелий от замерзания. Гелий не замерзает и при абсолютном нуле, если только не сжимать его под высоким давлением. Повышая давление, можно добиться затвердения гелия.
§ 3. Атомные процессы
Так с атомной точки зрения описываются твердые, жидкие и газообразные тела. Но атомная гипотеза описывает и процессы, и мы теперь рассмотрим некоторые процессы с атомных позиций. Первым делом речь пойдет о процессах, происходящих на поверхности воды. Что здесь происходит? Мы усложним себе задачу, приблизим ее к реальной действительности, предположив, что над поверхностью находится воздух. Взгляните на фиг. 1.5.
Фиг. 1.5. Молекулы воды, испаряющейся в воздух.
Мы по-прежнему видим молекулы, образующие толщу воды, но, кроме того, здесь изображена и ее поверхность, а над нею — различные молекулы: прежде всего молекулы воды в виде водяного пара, который всегда возникает над водной поверхностью (пар и вода находятся в равновесии, о чем мы вскоре будем говорить). Кроме того, над водой витают и другие молекулы — то скрепленные воедино два атома кислорода, образующие молекулу кислорода, то два атома азота, тоже слипшиеся в молекулу азота. Воздух почти весь состоит из азота, кислорода, водяного пара и меньших количеств углекислого газа, аргона и прочих примесей. Итак, над поверхностью воды находится воздух — газ, содержащий некоторое количество водяного пара. Что происходит на этом рисунке? Молекулы воды все время движутся. Время от времени какая-нибудь из молекул близ поверхности получает толчок сильнее остальных и выскакивает вверх. На рисунке этого, конечно, не видно, потому что здесь все неподвижно. Но попробуйте просто представить себе, как одна из молекул только что испытала удар и взлетает вверх, а с другой случилось то же самое и т. д. Так, молекула за молекулой вода исчезает — она испаряется. Если закрыть сосуд, мы обнаружим среди молекул находящегося в нем воздуха множество молекул воды. То и дело некоторые из них снова попадают в воду и остаются там. То, что казалось нам мертвым и неинтересным (скажем, прикрытый чем-нибудь стакан воды, который, может быть, 20 лет простоял на своем месте), на самом деле таит в себе сложный и интересный, беспрерывно идущий динамический процесс. Для нашего грубого глаза в нем ничего не происходит, но стань мы в миллиард раз зорче, мы бы увидали, как все меняется: одни молекулы взлетают, другие оседают.
Почему же мы не видим этих изменений? Да потому, что сколько взлетает молекул, столько же и оседает! В общем-то там «ничего не происходит». Если раскрыть стакан и сдуть влажный воздух, на смену ему притечет уже сухой; число молекул, покидающих воду, останется прежним (оно ведь зависит только от движения в воде), а число возвращающихся молекул сильно уменьшится, потому что их уже над водой почти не будет. Число улетающих молекул превысит число оседающих, вода начнет испаряться. Поэтому, если вам нужно испарять воду, включайте вентилятор!
Но это еще не все. Давайте подумаем, какие молекулы вылетают из воды? Если уж молекула выскочила, то это значит, что она случайно вобрала в себя излишек энергии; он ей понадобился, чтобы разорвать путы притяжения соседей. Энергия вылетающих молекул превосходит среднюю энергию молекул в воде, поэтому энергия остающихся молекул ниже той, которая была до испарения. Движение их уменьшается. Вода от испарения постепенно остывает. Конечно, когда молекула пара опять оказывается у поверхности воды, она испытывает сильное притяжение и может снова попасть в воду. Притяжение разгоняет ее, и в итоге возникает тепло. Итак, уходя, молекулы уносят тепло; возвращаясь — приносят. Когда стакан закрыт, баланс сходится, температура воды не меняется. Если же дуть на воду, чтобы испарение превысило оседание молекул, то вода охлаждается. Поэтому, чтобы остудить суп, дуйте на него!
Вы понимаете, конечно, что на самом деле все происходит гораздо сложнее, чем здесь описано. Не только вода переходит в воздух, но молекулы кислорода или азота время от времени переходят в воду и «теряются» в массе молекул воды. Попадание атомов кислорода и азота в воду означает растворение воздуха в воде; если внезапно из сосуда воздух выкачать, то молекулы воздуха начнут из воды выделяться быстрее, чем проникают в нее; мы увидим, как наверх подымаются пузырьки. Вы, наверно, слыхали, что это явление очень вредно для ныряльщиков.
Перейдем теперь к другому процессу. На фиг. 1.6 мы видим, как (с атомной точки зрения) соль растворяется в воде.
Фиг. 1.6. Молекулы соли, растворяющейся в воде.
Что получается, если в воду бросить кристаллик соли? Соль — твердое тело, кристалл, в котором «атомы соли» расставлены правильными рядами. На фиг. 1.7 показано трехмерное строение обычной соли (хлористого натрия).
Фиг. 1.7. Структура кристалла соли.
Строго говоря, кристалл состоит не из атомов, а из ионов. Ионы — это атомы с излишком или с нехваткой электронов. В кристалле соли мы находим ионы хлора (атомы хлора с лишним электроном) и ионы натрия (атомы натрия, лишенные одного электрона). Ионы в твердой соли скреплены друг с другом электрическим притяжением, но в воде некоторые из них, притянувшись к положительному водороду или отрицательному кислороду, начинают свободно двигаться. На фиг. 1.6 виден освободившийся ион хлора и другие атомы, плавающие в воде в виде ионов. На рисунке нарочно подчеркнуты некоторые детали процесса. Заметьте, например, что водородные концы молекул воды обычно обступают ион хлора, а возле иона натрия чаще оказывается кислород (ион натрия положителен, а атом кислорода в молекуле воды отрицателен, поэтому они притягиваются). Можно ли из рисунка понять, растворяется ли здесь соль в воде или же выкристаллизовывается из воды? Ясно, что нельзя; часть атомов уходит из кристалла, часть присоединяется к нему. Процесс этот динамический, подобный испарению; все зависит от того, много или мало соли в воде, в какую сторону нарушено равновесие. Под равновесным понимается такое состояние, когда количество уходящих атомов равно количеству приходящих. Если в воде почти нет соли, то больше атомов уходит в воду, чем возвращается из воды: соль растворяется. Если же «атомов соли» слишком много, то приход превышает уход, и соль выпадает в кристаллы. Мы мимоходом упомянули, что понятие молекулы вещества не совсем точно и имеет смысл только для некоторых видов веществ. Оно применимо к воде, в ней действительно три атома всегда скреплены между собой, но оно не очень подходит к твердому хлористому натрию. Хлористый натрий — это ионы хлора и натрия, образующие кубическую структуру. Нельзя естественным путем сгруппировать их в «молекулы соли».
Вернемся к вопросу о растворении и осаждении соли. Если повысить температуру раствора соли, то возрастет и число растворяющихся атомов и число осаждаемых. Оказывается, что в общем случае трудно предсказать, в какую сторону сдвинется процесс, быстрей или медленней пойдет растворение. С ростом температуры большинство веществ начинает растворяться сильней, а у некоторых растворимость падает.
§ 4. Химические реакции
Во всех описанных процессах атомы и ионы не меняли своих напарников. Но, конечно, возможны обстоятельства, в которых сочетания атомов меняются, образуя новые молекулы. Это показано на фиг. 1.8.
Фиг. 1.8. Уголь, горящий в кислороде.
Процесс, в котором атомные партнеры меняются местами, называется химической реакцией. Описанные нами прежде процессы называются физическими, но трудно указать резкую границу между теми и другими. (Природе все равно, как мы это назовем, она просто делает свое дело.) На картинке мы хотели показать, как уголь горит в кислороде. Молекула кислорода состоит из двух атомов, сцепленных очень крепко. (А почему не из трех или даже не из четырех? Такова одна из характерных черт атомных процессов: атомы очень разборчивы, им нравятся определенные партнеры, определенные направления и т. д. Одна из обязанностей физики — разобраться, почему они хотят именно то, что хотят. Во всяком случае два атома кислорода, довольные и насыщенные, образуют молекулу.)
Предположим, что атомы углерода образуют твердый кристалл (графит или алмаз[2]). Одна из молекул кислорода может пробраться к углероду, каждый ее атом подхватит по атому углерода и улетит в новом сочетании углерод — кислород. Такие молекулы образуют газ, называемый угарным. Его химическое имя CO. Что это значит? Буквы CO — это фактически картинка такой молекулы: C — углерод, O — кислород. Но углерод притягивает к себе кислород намного сильнее, чем кислород притягивает кислород или углерод — углерод. Поэтому кислород для этого процесса может поступать с малой энергией, но, схватываясь с неимоверной жадностью и страстью с углеродом, высвобождает энергию, поглощаемую всеми соседними атомами. Образуется большое количество энергии движения (кинетической энергии). Это, конечно, и есть горение; мы получаем тепло от сочетания кислорода и углерода. Теплота в обычных условиях проявляется в виде движения молекул нагретого газа, но иногда ее может быть так много, что она вызывает и свет. Так получается пламя.
Вдобавок молекулы CO могут не удовольствоваться достигнутым. У них есть возможность подсоединить еще один атом кислорода; возникает более сложная реакция: кислород в паре с углеродом столкнется с другой молекулой СО. Атом кислорода присоединится к CO и в конечном счете образуется молекула из одного углерода и двух кислородов. Ее обозначают CO2 и называют углекислым газом. Когда углерод сжигают очень быстро (скажем, в моторе автомашины, где взрывы столь часты, что углекислота не успевает образоваться), то возникает много угарного газа. Во многих таких перестановках атомов выделяется огромное количество энергии, наблюдаются взрывы, вспыхивает пламя и т. д.; все зависит от реакции.
Химики изучили эти расположения атомов и установили, что любое вещество — это свой тип расположения атомов.
Чтобы объяснить эту мысль, рассмотрим новый пример. У клумбы фиалок вы сразу чувствуете их «запах». Это значит, что в ваш нос попали молекулы, или расположения атомов особого рода. Как они туда попали? Ну, это просто. Раз запах — это молекулы особого рода, то, двигаясь и сталкиваясь повсюду, они случайно могли попасть и в нос. Конечно, они не стремились попасть туда. Это просто беспомощные толпы молекул, и в своих бесцельных блужданиях эти осколки вещества, случается, оказываются и в носу.
И вот химики могут взять даже такие необычные молекулы, как молекулы запаха фиалок, проанализировать их строение и описать нам точное расположение их атомов в пространстве. Мы, например, знаем, что молекула углекислого газа пряма и симметрична: O—C—O (это легко обнаружить и физическими методами). Но и для безмерно более сложных, чем те, с которыми имеет дело химия, расположений атомов можно после долгих увлекательных поисков понять, как выглядит это расположение. На фиг. 1.9 изображен воздух над фиалками.
Фиг. 1.9. Запах фиалки.
Снова мы находим здесь азот, кислород, водяной пар... (А он-то откуда здесь? От влажных фиалок. Все растения испаряют воду.) Среди них, однако, витает «чудовище», сложенное из атомов углерода, водорода и кислорода, облюбовавших для себя особого вида расположение. Это расположение намного сложнее, чем у углекислоты. К сожалению, мы не можем его нарисовать: хотя оно известно химикам очень точно, но оно ведь трехмерное, а как его изобразишь в двух измерениях?! Как нарисовать шесть углеродов, которые образуют кольцо, но не плоское, а «гармошкой»? Все углы, все расстояния в ней известны. Так вот, химическая формула — это просто картина такой молекулы. Когда химик пишет формулу на доске, он, грубо говоря, пытается нарисовать молекулу в двух измерениях. Например, мы видим кольцо из шести углеродов; углеродную цепочку, свисающую с одного конца; кислород, торчащий на конце цепочки; три водорода, привязанные вон к тому углероду; два углерода и три водорода, прилепленные вот здесь, и т. д.
Как же химик узнает, что это за расположение? Возьмет он две пробирки с веществом, сольет их содержимое и смотрит: если смесь покраснела, значит, к такому-то месту молекулы прикреплен один водород и два углерода; если посинела, то... то это ничего не значит. Органическая химия может поспорить с самыми фантастическими страницами детективных романов. Чтобы узнать, как расположены атомы в какой-нибудь невероятно сложной молекуле, химик смотрит, что будет, если смешать два разных вещества! Да физик нипочем не поверит, что химик, описывая расположение атомов, понимает, о чем говорит. Но вот уже больше 20 лет, как появился физический метод, который позволяет разглядывать молекулы (не такие сложные, но по крайней мере родственные) и описывать расположение атомов не по цвету раствора, а по измерению расстояний между атомами. И что же? Оказалось, что химики почти никогда не ошибаются!
Оказывается, что действительно в запахе фиалок присутствуют три слегка различные молекулы, они отличаются только расстановкой атомов водорода.
Одна из проблем в химии — это придумать такое название для вещества, чтобы по нему можно было бы узнать, какое оно. Найти имя для его формы! Но оно должно описывать не только форму, а указывать еще, что здесь стоит кислород, а вон там — водород, чтобы было точно отмечено, где что стоит. Теперь вы понимаете, почему химические названия так сложны. Это не сложность, а полнота. Название молекулы запаха фиалок поэтому таково: 4-(2,2,3,6-тетраметил-5-циклогексан)-3-бутен-2-он. Оно полностью описывает строение молекулы (изображенной на фиг. 1.10), а его длина объясняется сложностью молекулы.
Фиг. 1.10. Структурная формула запаха фиалки.
Дело, значит, вовсе не в том, что химики хотят затуманить мозги, просто им приходится решать сложнейшую задачу описания молекулы словами!
Но откуда мы все-таки знаем, что атомы существуют? А здесь идет в ход уже описанный прием: мы предполагаем их существование, и все результаты один за другим оказываются такими, как мы предскажем, — какими они должны быть, если все состоит из атомов. Существуют и более прямые доказательства. Вот одно из них. Атомы так малы, что ни в какой микроскоп их не увидишь (даже в электронный, а уж в световой и подавно). Но атомы все время движутся, и если бросить в воду большой шарик (большой по сравнению с атомами), то и он начнет подрагивать. Все равно как в игре в пушбол, где большущий мяч толкают с разных сторон две команды. Толкают в разных направлениях, и куда мяч покатится, не угадаешь. Точно так же будет двигаться и «большой мяч» в воде: в разные моменты времени с разных сторон на него будут сыпаться неодинаковые удары. Поэтому когда мы глядим в хороший микроскоп на мельчайшие частички в воде, то видим их непрерывное метание — итог бомбардировки их атомами. Называется это броуновским движением.
Другие доказательства существования атомов можно извлечь из строения кристаллов. Во многих случаях их строение, определенное из опытов по прохождению рентгеновских лучей через кристаллы, согласуется по своему пространственному расположению с формой самого природного кристалла. Углы между разными гранями кристалла согласуются с точностью не до градусов, а до секунд дуги с углами, высчитанными в предположении, что кристалл сложен из множества «слоев» атомов.
Все состоит из атомов. Это самое основное утверждение. В биологии, например, самое важное предположение состоит в том, что все, что делает животное, совершают атомы. Иными словами, в живых существах нет ничего, что не могло бы быть понято с той точки зрения, что они состоят из атомов, действующих по законам физики. Когда-то это не было еще ясно. Потребовалось немало опытов и размышлений, прежде чем высказать это предположение, но теперь оно повсеместно принято и приносит огромную пользу, порождая новые идеи в области биологии.
Да посудите сами! Если уж стальной кубик или кристаллик соли, сложенный из одинаковых рядов одинаковых атомов, может обнаруживать такие интересные свойства; если вода — простые капельки, неотличимые друг от друга и покрывающие миля за милей поверхность Земли, — способна порождать волны и пену, гром прибоя и странные узоры на граните набережной; если все это, все богатство жизни вод — всего лишь свойства сгустков атомов, то сколько же еще в них скрыто возможностей? Если вместо того, чтобы выстраивать атомы по ранжиру, строй за строем, колонну за колонной, даже вместо того, чтобы сооружать из них замысловатые молекулы запаха фиалок, если вместо этого располагать их каждый раз по-новому, разнообразя их мозаику, не повторяя того, что уже было, — представляете, сколько необыкновенного, неожиданного может возникнуть в их поведении. Разве не может быть, что те «тела», которые разгуливают по улице и беседуют с вами, тоже не что иное, как сгустки атомов, но такие сложные, что уже не хватает фантазии предугадывать по их виду их поведение. Когда мы называем себя сгустками атомов, это не значит, что мы — только собрание атомов, потому что такой сгусток, который никогда не повторяется, прекрасно может оказаться способным и на то, чтобы сидеть у стола и читать эти строки.
Глава 2 ОСНОВНЫЕ ФИЗИЧЕСКИЕ ВОЗЗРЕНИЯ
§ 1. Введение
В этой главе будут рассмотрены самые основные представления о физике; здесь будет идти речь о том, как теперь мы представляем себе природу вещей. Я не буду рассказывать историю того, как стало известно, что эти представления правильны; это мы отложим до другого раза.
Предмет науки предстает перед нами во множестве проявлений, в обилии признаков. Спуститесь к морю, вглядитесь в него. Это ведь не просто вода. Это вода и пена, это рябь и набегающие волны, это облака, солнце и голубое небо, это свет и тепло, шум и дыхание ветра, это песок и скалы, водоросли и рыба, их жизнь и гибель, это и вы сами, ваши глаза и мысли, ваше ощущение счастья. И не то ли в любом другом месте, не такое ли разнообразие явлений и влияний? Вы не найдете в природе ничего простого, все в ней перепутано и слито. А наша любознательность требует найти в этом простоту, требует, чтобы мы ставили вопросы, пытались ухватить суть вещей и понять их многоликость как возможный итог действия сравнительно небольшого количества простейших процессов и сил, на все лады сочетающихся между собой.
И мы спрашиваем себя: отличается ли песок от камня? Быть может, это всего лишь множество камешков? А может, и Луна — огромный камень? Тогда, поняв что такое камни, не поймем ли мы тем самым природу песка и Луны? А ветер — что это такое? Может, это всплески воздуха, как вон те всплески воды у берега? Что общего между всяким движением? А есть ли что-нибудь общее между всевозможными звуками? Сколько получится, если пересчитать все цвета? И так далее и так далее. Вот так мы постепенно пробуем проанализировать все вокруг, связать то, что кажется несвязуемым, в надежде, что удастся уменьшить количество различных явлений и тем самым их лучше понять.
Способ получать частичные ответы на подобные вопросы был придуман еще несколько сот лет назад. Наблюдение, размышление и опыт — вот что составляет так называемый научный метод. Мы ограничимся здесь только голым описанием фундаментальных идей физики, основ мировоззрения, возникшего в физике от применения научного метода.
Что значит «понять» что-либо? Представьте себе, что сложный строй движущихся объектов, который и есть мир, — это что-то вроде гигантских шахмат, в которые играют боги, а мы следим за их игрой. В чем правила игры, мы не знаем; все, что нам разрешили, — это наблюдать за игрой. Конечно, если посмотреть подольше, то кое-какие правила можно ухватить. Под основными физическими воззрениями, под фундаментальной физикой мы понимаем правила игры. Но, даже зная все правила, можно не понять какого-то хода просто из-за его сложности или ограниченности нашего ума. Тот, кто играет в шахматы, знает, что правила выучить легко, а вот понять ход игрока или выбрать наилучший ход порой очень трудно. Ничуть не лучше, а то и хуже обстоит дело в природе. Не исключено, что в конце концов все правила будут найдены, но пока отнюдь не все они нам известны. То и дело тебя поджидает рокировка или какой-нибудь другой непонятный ход. Но, помимо того, что мы не знаем всех правил, лишь очень и очень редко нам удается действительно объяснить что-либо на их основе. Ведь почти все встречающиеся положения настолько сложны, что нет никакой возможности, заглядывая в правила, проследить за планом игры, а тем более предугадать очередной ход. Приходится поэтому ограничиваться самыми основными правилами. Когда мы разбираемся в них, то уже считаем, что «поняли» мир.
Но откуда мы знаем, что те правила, которые мы «ощущаем», справедливы на самом деле? Ведь мы не способны толково разобрать ход игры. Существует, грубо говоря, три способа проверки. Во-первых, мыслимы положения, когда природа устроена (или мы ее устраиваем) весьма просто, всего из нескольких частей; тогда можно точно предсказать все, что случится, проверив тем самым правила. (В углу доски может оказаться всего несколько фигур, и все их движения легко себе представить.)
Есть и второй довольно неплохой путь проверки правил: надо из этих правил вывести новые, более общие. Скажем, слон ходит только по диагонали; значит, сколько бы он ни ходил, он всегда окажется, например, на черном поле. Стало быть, не вникая в детали, наши представления о движении слона всегда можно проверить по тому, остается ли он все время на черном поле. Конечно, не исключено, что внезапно слон очутится на белом поле: после того как его побили, пешка прошла на последнюю горизонталь и превратилась в белопольного слона. Так же и в физике. Долгое время мы располагаем правилом, которое превосходно работает повсюду, даже когда детали процесса нам неизвестны, и вдруг иногда всплывает новое правило. С точки зрения физических основ самые интересные явления происходят в новых местах, там, где правила не годятся, а не в тех местах, где они действуют! Так открываются новые правила.
Есть и третий способ убедиться, что наши представления об игре правильны; мало оправданный по существу, он, пожалуй, самый мощный из всех способов. Это путь грубых приближений. Мы можем не знать, почему Алехин пошел именно этой фигурой. Но в общих чертах мы можем понимать, что он, видимо, собирает все фигуры для защиты короля, и сообразить, что в сложившихся обстоятельствах это самое разумное. Точно так же мы часто более или менее понимаем природу, хотя не знаем и не понимаем каждого хода отдельной фигуры.
Когда-то все явления природы грубо делили на классы — теплота, электричество, механика, магнетизм, свойства веществ, химические явления, свет (или оптика), рентгеновские лучи, ядерная физика, тяготение, мезонные явления и т. д. Цель-то, однако, в том, чтобы понять всю природу как разные стороны одной совокупности явлений. В этом задача фундаментальной теоретической физики нынешнего дня: открыть законы, стоящие за опытом, объединить эти классы. Исторически всегда рано или поздно удавалось их слить, но проходило время, возникали новые открытия, и опять вставала задача их включения в общую схему. Однажды уже возникла было слитная картина мира — и вдруг были открыты лучи Рентгена... Со временем произошло новое слияние... и тут обнаружили существование мезонов. Поэтому на любой стадии игра выглядит беспорядочно, незаконченно. Многое бывает объяснено с единой точки зрения, но всегда какие-то проволочки и нитки все же болтаются, всегда где-нибудь торчит что-то несуразное. Таково сегодняшнее положение вещей, которое мы попытаемся описать.
Вот взятые из истории примеры слияния. Во-первых, теплоту удалось свести к механике. Чем сильнее движение атомов, тем больше запас тепла системы; выходит, что теплота, да и все температурные эффекты, могут быть поняты с помощью законов механики. Другое величественное объединение было отпраздновано, когда обнаружилась связь между электричеством, магнетизмом и светом. Оказалось, что это разные стороны одной сущности; сейчас мы называем ее электромагнитным полем. А химические явления, свойства различных веществ и поведение атомных частиц объединились квантовой химией.
Возникает естественный вопрос: будет ли возможно в конце концов все слить воедино и обнаружить, что весь наш мир есть просто различные стороны какой-то одной вещи? Этого никто не знает. Мы только знаем, что по мере нашего продвижения вперед то и дело удается что-то с чем-то объединить, а после опять что-то перестает укладываться в общую картину, и мы заново принимаемся раскладывать части головоломки, надеясь сложить из них что-нибудь целое. А сколько частей в головоломке, и будет ли у нее край — это никому не известно. И не будет известно, пока мы не сложим всей картины, если только когда-нибудь это вообще будет сделано. Здесь мы хотим только показать, насколько далеко зашел процесс слияния, как сегодня обстоит дело с объяснением основных явлений за счет наименьшего количества принципов. Или, выражаясь проще, из чего все состоит и сколько всего таких элементов?
§ 2. Физика до 1920 года
Нам было бы нелегко начать прямо с сегодняшних взглядов. Посмотрим лучше, как выглядел мир примерно в 1920 г., а затем сотрем с этой картины лишнее.
До 1920 г. картина была примерно такова. «Сцена», на которой выступает Вселенная, — это трехмерное пространство, описанное еще Евклидом; все изменяется в среде, называемой временем. Элементы, выступающие на сцене, — это частицы, например атомы; они обладают известными свойствами, скажем свойством инерции: когда частица движется в каком-то направлении, то делает она это до тех пор, пока на нее не подействуют силы. Следовательно, второй элемент — это силы; считалось, что они бывают двух сортов. Первый, чрезвычайно запутанный тип — сила взаимодействия, т. е. сила, скрепляющая атомы в разных их комбинациях; она, например, и решает, быстрее или медленнее начнет растворяться соль при нагревании. Другой же сорт сил — это взаимодействие на далеких расстояниях — притяжение, спокойное и ровное; оно меняется обратно пропорционально квадрату расстояния и именуется тяготением, или гравитацией. Закон ее известен и прост. Но почему тела остаются в движении, начав двигаться, или отчего существует закон тяготения — это было неизвестно.
Продолжаем наше описание природы. С этой точки зрения газ, как, впрочем, и все вещество, это мириады движущихся частиц. Таким образом, многое из увиденного нами на морском берегу теперь запросто увязывается в единое целое. Давление сводится к ударам атомов о стенки; снос атомов (их движение в одну сторону) — это ветер; хаотические внутренние движения — это теплота. Волны — избыток давления, места, где собралось слишком много частиц; разлетаясь, они нагнетают в новых местах такие же скопления частиц; эти волны избытка плотности суть звуки. Понять все это было немаловажным достижением (кое о чем мы уже писали в предыдущей главе).
Какие сорта частиц существуют? В то время считалось, что их 92; восемьдесят девять типов атомов были к тому времени открыты. Каждый тип имел свое название.
Дальше возникала проблема: что такое силы близкодействия. Почему атом углерода притягивает один, в лучшем случае два атома кислорода, но не более? В чем механизм взаимодействия между атомами? Уж не тяготение ли это? Нет. Оно чересчур слабо для этого. Надо представить себе силу, сходную с тяготением, тоже обратно пропорциональную квадрату расстояния, но несравненно более мощную. У нее есть еще одно отличие. Тяготение — это всегда притяжение; допустим теперь, что бывают «предметы» двоякого сорта, и эта новая сила (имеется, конечно, в виду электричество) обладает таким свойством, что одинаковые сорта отталкиваются, а разные притягиваются. «Предмет», несущий с собой это сильное взаимодействие, называется зарядом.
Что же тогда получается? Положим, что два различных сорта (плюс и минус) приложены друг к другу вплотную. Третий заряд находится вдалеке. Почувствует ли он притяжение? Практически нет, если первые два одинаковы по величине: притяжение одного и отталкивание другого уравновесятся. Значит, на заметных расстояниях сила незаметна. Но когда третий заряд приблизится вплотную, то возникнет притяжение: отталкивание однородных зарядов и притяжение разнородных будут стремиться свести между собой разнородные заряды и удалить друг от друга однородные. В итоге отталкивание окажется слабее притяжения. По этой причине атомы, слагающиеся из положительных и отрицательных зарядов, мало влияют друг на друга на заметных расстояниях. Зато уж если они сблизятся, то свободно могут «разглядывать изнутри» друг друга, перестраивать расположение своих зарядов и сильно взаимодействовать. В конечном итоге именно электрическая сила объясняет взаимодействие атомов. Сила эта столь велика, что все плюсы и минусы обычно вступают в предельно тесную связь друг с другом: они стянуты насколько возможно. Все тела, даже наши собственные, состоят из мельчайших плюс- и минус- долек, очень сильно взаимодействующих друг с другом. Количество плюсов и минусов хорошо сбалансировано. Только на мгновение случайно можно соскрести несколько плюсов или минусов (обычно минусы соскребать легче); тогда электрическая сила окажется неуравновешенной и можно почувствовать действие электрического притяжения.
Чтобы дать представление о том, насколько электричество сильнее тяготения, расположим две песчинки размером в миллиметр в 30 м одна от другой. Пусть все заряды только притягиваются и их взаимодействие друг на друга внутри песчинок не погашается взаимно. С какой силой эти две песчинки притягивались бы? С силой в три миллиона тонн! Понимаете теперь, почему малейшего избытка или нехватки положительных или отрицательных зарядов достаточно, чтобы произвести заметное электрическое действие? По той же причине заряженные тела не отличаются ни по массе, ни по размеру от незаряженных: нужно слишком мало частиц, чтобы зарядить тело, чтобы почувствовалось, что оно заряжено.
Зная все это, легко было представить себе и устройство атома. Считалось, что в центре его положительно заряженное электричеством очень массивное «ядро», оно окружено некоторым числом «электронов», очень легких и заряженных отрицательно. Забегая вперед, заметим, что впоследствии в самом ядре были обнаружены два рода частиц — протоны и нейтроны, весьма тяжелые и обладающие близкими массами. Протоны заряжены положительно, а нейтроны не заряжены вовсе. Когда в ядре атома имеется шесть протонов и ядро окружено шестью электронами (отрицательные частицы обычного мира материальных тел — все электроны, они намного легче протонов и нейтронов), то этот атом в химической таблице стоит под номером 6 и называется углеродом. Атом, имеющий номер 8, называется кислородом, и т. д. Химические свойства зависят от внешней оболочки — электронов, а точнее, только от того, сколько их там; все химические особенности вещества зависят от одного-единственного числа — количества электронов. (Список названий элементов, составленный химиками, на самом деле может быть заменен нумерацией 1, 2, 3 и т. д. Вместо того чтобы говорить «углерод», можно было бы сказать «элемент шесть», подразумевая шесть электронов. Но, конечно, когда открывали элементы, не подозревали, что их можно так пронумеровать; к тому же именовать их по номерам не очень удобно. Лучше, чтобы у каждого из них было собственное имя и символ.)
И еще многое другое стало известно об электрической силе. Естественно было бы толковать электрическое взаимодействие как простое притяжение двух предметов, положительно и отрицательно заряженных. Однако выяснилось, что такой подход плохо помогает уяснению природы электрической силы. Толкование, более отвечающее положению вещей, таково: когда где-то имеется положительный заряд, то он искривляет в каком-то смысле пространство, создает в нем некоторое условие для того, чтобы минус-заряд, помещенный в это пространство, ощутил действие силы. Эта возможность порождать силы называется электрическим полем. Когда электрон помещен в электрическое поле, мы говорим, что он «притягивается». При этом действуют два правила: а) заряды создают поле и б) на заряды в поле действуют силы, заставляя их двигаться. Причина этого станет ясна, когда мы разберем следующее явление. Если мы зарядим тело, скажем расческу, электричеством, а затем положим рядом заряженный клочок бумаги и начнем водить расческой взад и вперед, то бумага будет все время поворачиваться к расческе. Ускорив движение расчески, можно обнаружить, что бумага несколько отстает от ее движения, возникает запаздывание действия. (Сперва, когда мы водим расческой медленно, дело усложняется магнетизмом. Магнитные влияния появляются, когда заряды движутся друг относительно друга, так что магнитные и электрические силы в действительности могут оказаться проявлениями одного и того же поля, двумя сторонами одного и того же явления. Изменяющееся электрическое поле не может существовать без магнитного действия.) Если бумагу отодвинуть, запаздывание возрастет. И тогда наблюдается интересная вещь. Хотя сила, действующая между двумя заряженными телами, изменяется обратно квадрату расстояния, при колебаниях заряда его влияние простирается намного дальше, чем можно было ожидать. Это значит, что оно уменьшается медленнее, чем по закону обратных квадратов.
Что-то похожее на это происходит, если в бассейн с водой брошен поплавок; можно подействовать на него «непосредственно», бросив в воду поблизости другой поплавок; при этом если вы смотрели только на поплавки (не на воду), то вы увидите лишь, что один из них сместился в ответ на движения другого, т. е. что между ними существует какое-то взаимодействие. А ведь дело только в том, что вы взволновали воду: это вода шевельнула второй поплавок. Из этого можно даже вывести «закон»: если шевельнуть чуть-чуть поплавок, все соседние поплавки зашевелятся. Будь поплавок подальше, он бы едва покачнулся, ведь мы возмутили поверхность воды один раз и в одном месте. Но когда мы начнем непрерывно покачивать поплавок, возникнет новое явление: побегут волны и влияние колебаний поплавка распространится намного дальше. Это будет колебательное влияние, и уж его не объяснить прямым взаимодействием поплавков. Мысль о непосредственном взаимодействии придется заменить предположением о существовании воды или, для электрических зарядов, того, что называется электромагнитным полем.
Электромагнитное поле может передавать волны; одни волны — это световые, другие — радиоволны, общее же их название электромагнитные волны. Частота колебаний этих волн разная. Только этим они и отличаются одна от другой. Все чаще и чаще колебля заряд вверх-вниз и наблюдая затем, что получится, мы увидим разные эффекты; все они могут быть сведены в единую систему, если дать каждому свой номер — число колебаний в секунду. Обычные помехи от тока, текущего по проводам в жилых домах, имеют частоту порядка сотни колебаний в секунду. Повысив частоту до 500—1000 килогерц (1 кгц=1000 колебаний в секунду), мы из квартиры выйдем «на воздух», потому что это — область радиочастот. (Воздух здесь, конечно, не при чем! Радиоволны распространяются и в безвоздушном пространстве.) Увеличив еще частоты, мы доберемся до ультракоротких волн и телевидения. Затем пойдут совсем короткие волны, их назначение — радиолокация. Еще дальше, и нам уже не нужно приборов, чтобы регистрировать эти волны, их можно видеть невооруженным глазом. В полосе частот от 5·1014 до 5·1015 гц колебания заряженной расчески (если наловчиться колебать ее так быстро) предстали бы перед нами в зависимости от частоты как красный, голубой или фиолетовый свет. Частоты с одной стороны полосы называются инфракрасными, а с другой — ультрафиолетовыми. Тот факт, что мы способны видеть на определенных частотах, с физической точки зрения не делает эту часть электромагнитного спектра более впечатляющей, но с человеческой точки зрения это, конечно, самая интересная часть спектра. Продвигаясь по частоте еще дальше, мы получим рентгеновские лучи; это всего лишь высокочастотный свет. А еще дальше пойдет гамма-излучение (табл. 2.1). Гамма-излучение и рентгеновские лучи — почти одно и то же. Обычно те электромагнитные волны, которые исходят от ядер, называют гамма-излучением, а те, которые исходят от атомов, — рентгеновскими лучами, но если их частота совпадет, то физически эти волны уже не отличишь, каков бы ни был их источник. Волны еще более высоких частот, скажем 1024 гц, можно, оказывается, получать искусственно, на ускорителях; на синхротроне в КАЛТЕХе это делается.
Таблица 2.1. ЭЛЕКТРОМАГНИТНЫЙ СПЕКТР
И наконец, неслыханно высокие частоты (в тысячу раз больше) обнаруживаются далее в волнах, присутствующих в космических лучах. Эти волны мы уже не умеем контролировать.
§ 3. Квантовая физика
Мы описали электромагнитное поле и поняли, что оно может передаваться как волны. Сейчас мы увидим, что на самом деле эти волны ведут себя очень странно: они отнюдь не похожи на волны. На высоких частотах они гораздо больше смахивают на частицы! Наука, которая умеет объяснять такое странное поведение, — квантовая механика — была изобретена вскоре после 1920 г. Еще до этого привычную картину трехмерного пространства и отдельно существующего времени изменил Эйнштейн; сперва он превратил ее в сочетание, называемое «пространство-время», а потом, чтобы объяснить тяготение, — еще и в «искривленное пространство-время». Таким образом, «сценой» стало уже пространство-время, а тяготение, по всей вероятности, это видоизмененное пространство-время.
А затем также выяснилось, что и законы движения частиц неверны. Механические законы «инерции» и «силы», законы Ньютона — все они оказались непригодными в мире атомов. Было обнаружено, что поведение мельчайших телец ничем не напоминает поведения обычных, больших тел. Конечно, физика от этого становится труднее, но зато намного интереснее. Труднее потому, что поведение малых телец совершенно «неестественно»; оно противоречит нашему опыту, оно вообще ни на что не похоже и его нельзя описать никаким иным путем, кроме аналитического; а ведь это требует большого воображения.
Много особенностей есть у квантовой механики. В первую очередь она запрещает считать, что частица может двигаться через определенное точно указанное место с определенной точно указанной скоростью. Чтоб показать, насколько ошибочна обычная механика, отметим, что в квантовой механике имеется правило, согласно которому никто в одно и то же время не может знать и место и быстроту движения частицы. Неопределенность в импульсе и неопределенность в положении частицы дополняют друг друга: их произведение постоянно. Мы пока напишем это правило в виде ΔxΔp≥h/2π, не вникая в подробности. Это правило представляет собой объяснение таинственного парадокса: раз атомы сделаны из плюс- и минус-зарядов, отчего бы минус-зарядам просто не усесться на плюс-заряды (они ведь притягиваются), отчего бы им не сблизиться до того тесно, что они погасят друг друга? Почему атомы столь велики? Почему ядро находится в центре, а электроны — вокруг него? Сперва объясняли это тем, что ядро очень велико; но ведь это не так, оно очень мало. Диаметр атома примерно 10-8см, а ядрa — что-то около 10-13 см. Чтобы увидеть ядро, надо было бы атом увеличить до размеров комнаты, и то ядро казалось бы малюсеньким, едва-едва различимым пятнышком; при этом все же почти весь вес атома приходился бы на бесконечно маленькое ядро. Но почему же электроны не падают на него? А вот из-за того же принципа неопределенности: если бы электроны оказались в ядре, мы бы очень точно знали их положение и, следовательно, их импульс непременно должен был бы стать очень большим (но неопределенным), а, значит, кинетическая энергия тоже резко бы возросла. С такой энергией он бы выскочил из ядра. Немудрено, что ядро идет на соглашение с электронами: они оставляют себе какое-то место для этой неопределенности и затем колеблются с некоторым наименьшим запасом движения, лишь бы не нарушить этого правила. (Вспомните еще, что когда кристалл охлажден до абсолютного нуля, мы считаем, что атомы все же не прекращают своего движения, они все еще колеблются. Почему? Да если бы атомы остановились, мы бы знали и то, что они стоят, и где стоят, а это противоречит принципу неопределенности. Мы не смеем знать и где они и сколь быстро движутся, вот атомы и вынуждены беспрерывно дрожать!)
А вот другое интереснейшее изменение в идеях и философии науки, осуществленное квантовой механикой: невозможно никогда предсказать точно, что произойдет в каких-то обстоятельствах. Например, можно приготовить атом, способный излучать свет; момент испускания света мы можем заметить, поймав фотон (будет время, мы поговорим об этом). Но мы не можем предсказать, когда он собирается излучить, или если атомов несколько, то какой из них испустит свет. Может быть, по-вашему, все это из-за того, что в атомах есть какие-то внутренние «колесики», которых мы еще не разглядели? Нет, в атоме нет потайных колес; природа, насколько мы ее сегодня понимаем, ведет себя так, что принципиально невозможно делать точные предсказания о том, что именно произойдет в данном опыте. Ужасно, не правда ли? Ведь философы прежде всегда нас учили, что одно из основных свойств науки, неотделимых от нее, — это требование, чтобы в одинаковых условиях всегда происходили одни и те же события. Но это просто неверно, это вовсе не основное условие науки. На самом деле в равных обстоятельствах одинаковые события не происходят; предсказать их можно только в среднем, только статистически. И все-таки наука еще не совсем погибает.
Кстати, философы порой много говорят о вещах, совершенно необходимых науке; и это всегда, как можно в том убедиться, весьма наивно и, по всей видимости, ошибочно. К примеру, некоторые философы, и не только философы, утверждали, что для научных открытий существенно, чтобы один и тот же опыт, сделанный, скажем, в Стокгольме и в Кито, приводил к одним и тем же результатам. Но ведь это абсолютно неверно. Для науки это условие необязательно; оно может быть установлено после опыта, но нельзя этого требовать до опыта. Если, например, в Стокгольме проделан опыт по наблюдению северного сияния, то с какой стати он должен удастся в Кито? Вы там и сияния-то не увидите. «Но это ясно, — скажете вы. — Ничего иного и не могло быть, раз вы исследуете что-то внешнее, далекое от нас. А вот вы заберитесь в Стокгольме в ящик и закройте в нем шторки, получите ли вы тогда хоть какое-нибудь различие?» Бесспорно. Подвесьте в ящике маятник на шарнирном подвесе, его плоскость во время качаний начнет в Стокгольме медленно поворачиваться, а в Кито — нет, хотя шторки и там и там опущены. И этот факт вовсе не приведет к гибели науки. Ведь в чем ее основное предположение, ее фундаментальная философия? Мы уже сказали об этом в гл. 1: единственное мерило справедливости любой идеи — это опыт. Если выясняется, что большинство экспериментов в Кито приводят к тому же, что и в Стокгольме, то из этого «большинства экспериментов» можно вывести общий закон, а про те эксперименты, которые не приводят к одинаковым результатам, мы скажем, что на них повлиял характер местности близ Стокгольма. Мы можем разными способами подытоживать опыты, но пусть нас прежде времени не учат, что это за способы. Если нам говорят, что одни и те же опыты всегда должны приводить к одним и тем же результатам, — это прекрасно; но когда проверка покажет, что это не так, стало быть, это не так. Верьте только своим глазам, а прочие свои идеи формулируйте уже на основе опыта.
Вернемся опять к квантовой механике и к основам физики. Мы не будем пока входить в детали квантовомеханических принципов, их не так просто понять. Мы их просто примем, как они есть, а остановимся на кое-каких их следствиях. Вот одно из них: то, что мы обычно считаем волнами, может вести себя как частица; частицы же ведут себя как волны; то же относится и к любым телам. Между волной и частицей просто нет различия. Квантовая механика объединяет идею поля, волн поля и частиц в одно. При низких частотах волновые свойства проявляются более явственно и поэтому оказываются полезнее для приближенного описания в образах нашего повседневного опыта. Но по мере того, как частота возрастает, становится все очевиднее, что через приборы, измеряющие наше явление, проходит не волна, а частица. На самом деле, хоть мы и говорим о высоких частотах, волновые явления, если частота их превышает 1012 гц, заметить уже нельзя. Мы только приходим к выводу о наличии высокой частоты, зная энергию частиц и предполагая, что верна идея квантовой механики о частице-волне.
Возникает к тому же и новый взгляд на электромагнитное взаимодействие. В добавление к электрону, протону и нейтрону появляется новая частица, называемая фотоном. Само это новое воззрение на взаимодействие электронов и протонов, т. е. электромагнитную теорию, правильную в квантовомеханическом смысле, называют квантовой электродинамикой. Эту фундаментальную теорию взаимодействия света и вещества, или электрического поля и зарядов, следует считать крупнейшим достижением физики. В ней одной таятся главные правила всех обычных явлений, кроме тяготения и ядерных процессов. Например, из квантовой электродинамики выводятся все известные электрические, механические и химические законы: законы соударений бильярдных шаров, движения проводников в магнитном поле, удельной теплоемкости угарного газа, цвета неоновых букв, плотности соли и реакции образования воды из водорода и кислорода. Все это поддается расчету, если условия, в каких протекает явление, просты. Практически этого никогда не случается, но все же мы более или менее понимаем, что происходит. И до сего времени не было найдено ни одного исключения из законов квантовой электродинамики, только в атомных ядрах ее оказывается недостаточно; да и про них мы не можем сказать, что здесь наблюдаются какие-то исключения, просто мы не знаем, что там происходит.
Далее, квантовая электродинамика — в принципе это также теория всей химии и всех жизненных процессов, если предположить, что жизнь сводится в конечном счете к химии, а значит, и к физике (сама химия уже свелась к физике, и та часть физики, которая включает в себя химию, уже разработана). Мало того, та же квантовая электродинамика, эта величественная наука, предсказывает немало и новых явлений. Во-первых, она говорит о свойствах фотонов очень высоких энергий, гамма-излучения и т. д. Она предсказала еще одно очень оригинальное явление, а именно, что, кроме электрона, должна существовать другая частица с той же массой, но с противоположным зарядом, так называемый позитрон, и что электрон и позитрон, повстречавшись, могут друг друга истребить, излучив при этом свет или гамма-кванты (что, собственно, одно и то же; свет и γ-излучение — лишь разные точки на шкале частот).
По-видимому, справедливо и обобщение этого правила: существование античастицы для любой частицы. Античастица электрона носит имя позитрона; у других частиц названия присвоены по другому принципу: если частицу назвали так-то, то античастицу называют анти-так-то, скажем, антипротон, антинейтрон. В квантовую электродинамику вкладывают всего два числа (они называются массой электрона и зарядом электрона) и полагают, что все остальные числа в мире можно вывести из этих двух. На самом деле, однако, это не совсем верно, ибо существует еще целая совокупность химических чисел — весов атомных ядер. Ими нам и следует сейчас заняться.
§4. Ядра и частицы
Из чего состоят ядра? Чем части ядра удерживаются вместе? Обнаружено, что существуют силы огромной величины, которые и удерживают составные части ядра. Когда эти силы высвобождаются, то выделяемая энергия по сравнению с химической энергией огромна, это все равно, что сравнить взрыв атомной бомбы со взрывом тротила. Объясняется это тем, что атомный взрыв вызван изменениями внутри ядра, тогда как при взрыве тротила перестраиваются лишь электроны на внешней оболочке атома.
Так каковы же те силы, которыми нейтроны и протоны скреплены в ядре?
Электрическое взаимодействие связывают с частицей — фотоном. Аналогично этому Юкава предположил, что силы притяжения между протоном и нейтроном обладают полем особого рода, а колебания этого поля ведут себя как частицы. Значит, не исключено, что, помимо нейтронов и протонов, в мире существуют некоторые иные частицы. Юкава сумел вывести свойства этих частиц из уже известных характеристик ядерных сил. Например, он предсказал, что они должны иметь массу, в 200—300 раз большую, чем электрон. И — о, чудо! — в космических лучах как раз открыли частицу с такой массой! Впрочем, чуть погодя выяснилось, что это совсем не та частица. Назвали ее μ-мезон, или мюон.
И все же несколько попозже, в 1947 или 1948г., обнаружилась частица — π-мезон, или пион, — удовлетворявшая требованиям Юкавы. Выходит, чтобы получить ядерные силы, к протону и нейтрону надо добавить пион. «Прекрасно! — воскликнете вы. — С помощью этой теории мы теперь соорудим квантовую ядродинамику, и пионы послужат тем целям, ради которых их ввел Юкава; посмотрим, заработает ли эта теория, и если да, то объясним все». Напрасные надежды! Выяснилось, что расчеты в этой теории столь сложны, что никому еще не удалось их проделать и извлечь из теории какие-либо следствия, никому не выпала удача сравнить ее с экспериментом. И тянется это уже почти 20 лет!
С теорией что-то не клеится; мы не знаем, верна она или нет; впрочем, мы уже знаем, что в ней чего-то не достает, что какие-то неправильности в ней таятся. Покуда мы топтались вокруг теории, пробуя вычислить следствия, экспериментаторы за это время кое-что открыли. Ну, тот же μ-мезон, или мюон. А мы до сей поры не знаем, на что он годится. Опять же, в космических лучах отыскали множество «лишних» частиц. К сегодняшнему дню их уже свыше 30, а связь между ними все еще трудно ухватить, и непонятно, чего природа от них хочет и кто из них от кого зависит. Перед нами все эти частицы пока не предстают как разные проявления одной и той же сущности, и тот факт, что имеется куча разрозненных частиц, есть лишь отражение наличия бессвязной информации без сносной теории. После неоспоримых успехов квантовой электродинамики — какой-то набор сведений из ядерной физики, обрывки знаний, полуопытных-полутеоретических. Задаются, скажем, характером взаимодействия протона с нейтроном и смотрят, что из этого выйдет, не понимая на самом деле, откуда эти силы берутся. Сверх описанного никаких особых успехов не произошло.
Но химических элементов ведь тоже было множество, и внезапно между ними удалось увидеть связь, выраженную периодической таблицей Менделеева. Скажем, калий и натрий — вещества, близкие по химическим свойствам, — в таблице попали в один столбец. Так вот, попробовали соорудить таблицу типа таблицы Менделеева и для новых частиц. Одна подобная таблица была предложена независимо Гелл-Манном в США и Нишиджимой в Японии. Основа их классификации — новое число, наподобие электрического заряда. Оно присваивается каждой частице и называется ее «странностью» S. Число это не меняется (так же как электрический заряд) в реакциях, производимых ядерными силами.
В табл. 2.2 приведены новые частицы. Мы не будем пока подробно говорить о них. Но из таблицы по крайней мере видно, как мало мы еще знаем. Под символом каждой частицы стоит ее масса, выраженная в определенных единицах, называемых мегаэлектронвольт, или Мэв (1 Мэв — это 1,782·10-27 г). Не будем входить в исторические причины, заставившие ввести эту единицу. Частицы помассивнее стоят в таблице повыше. В одной колонке стоят частицы одинакового электрического заряда, нейтральные — посерединке, положительные — направо, отрицательные — налево.
Частицы подчеркнуты сплошной линией, «резонансы» — штрихами. Некоторых частиц в таблице нет совсем: нет фотона и гравитона, очень важных частиц с нулевыми массой и зарядом (они не попадают в барион-мезон-лептонную схему классификации), нет и кое-каких новейших резонансов (φ, f, Y*' и др.). Античастицы мезонов в таблице приводятся, а для античастиц лептонов и барионов надо было бы составить новую таблицу, сходную с этой, но только зеркально отраженную относительно нулевой колонки. Хотя все частицы, кроме электрона, нейтрино, фотона, гравитона и протона, неустойчивы, продукты их распада написаны только для резонансов. Странность лептонов тоже не написана, так как это понятие к ним неприменимо — они не взаимодействуют сильно с ядрами.
Таблица 2.2 ЭЛЕМЕНТАРНЫЕ ЧАСТИЦЫ
Частицы, стоящие вместе с нейтроном и протоном, называют барионами. Это «лямбда» с массой 1115,4 Мэв и три другие — «сигмы», называемые сигма-минус, сигма-нуль, сигма-плюс, с почти одинаковыми массами. Группы частиц почти одинаковой массы (отличие на 1—2%) называются мультиплетами. У всех частиц в мультиплете странность одинакова. Первый мультиплет — это пара (дублет) протон — нейтрон, потом идет синглет (одиночка) лямбда, потом — триплет (тройка) сигм, дублет кси и синглет омега-минус. Начиная с 1961 г., начали открывать новые тяжелые частицы. Но частицы ли, они? Живут они так мало, распадаются так быстро, что неизвестно, назвать ли их новыми частицами или считать «резонансным» взаимодействием между их продуктами распада, скажем, Λ и π при некоторой фиксированной энергии.
Для ядерных взаимодействий, кроме барионов, необходимы другие частицы — мезоны. Это, во-первых, три разновидности пионов (плюс, нуль и минус), образующие новый триплет. Найдены и новые частицы — К-мезоны (это дублет К+ и К0). У каждой частицы бывает античастица, если только частица не оказывается своей собственной античастицей, скажем π+ и π- — античастицы друг друга, а π0 — сам себе античастица. Античастицы и К- с К+, и К0 с —К0. Кроме того, после 1961 г. мы начали открывать новые мезоны, или вроде-мезоны, распадающиеся почти мгновенно. Одна такая диковинка называется омега, ω, ее масса 783, она превращается в три пиона; есть и другое образование, из которого получается пара пионов.
Подобно тому как из очень удачной таблицы Менделеева выпали некоторые редкие земли, точно так же из нашей таблицы выпадают некоторые частицы. Это те частицы, которые с ядрами сильно не взаимодействуют, к ядерному взаимодействию отношения не имеют и между собой сильно тоже не взаимодействуют (под сильным понимается мощный тип взаимодействия, дающего атомную энергию). Называются эти частицы лептоны; к ним относятся электрон (очень легкая частица с массой 0,51 Мэв) и мюон (с массой в 206 раз больше массы электрона). Насколько мы можем судить по всем экспериментам, электрон и мюон различаются только массой. Все свойства мюона, все его взаимодействия ничем не отличаются от свойств электрона — только один тяжелее другого. Почему он тяжелее, какая ему от этого польза, мы не знаем. Кроме них, есть еще нейтральный лептон — нейтрино, с массой нуль. Более того, сейчас известно, что есть два сорта нейтрино: одни, связанные с электронами, а другие — с мюонами.
И наконец, существуют еще две частицы, тоже с ядрами не взаимодействующие. Одну мы знаем уже — это фотон; а если поле тяготения также обладает квантовомеханическими свойствами (хотя пока квантовая теория тяготения не разработана), то, возможно, существует и частица гравитон с массой нуль.
Что такое «масса нуль»? Массы, которые мы приводили, это массы покоящихся частиц. Если у частицы масса нуль, то это значит, что она не смеет покоиться. Фотон никогда не стоит на месте, скорость его равна всегда 300 000 км/сек. Мы с вами еще разберемся в теории относительности и попытаемся глубже вникнуть в смысл понятия массы.
Итак, мы встретились с целым строем частиц, которые все вместе, по-видимому, являются очень фундаментальной частью вещества. К счастью, эти частицы не все отличаются по своему взаимодействию друг от друга. Видимо, есть только четыре типа взаимодействий между ними. Перечислим их в порядке убывающей силы: ядерные силы, электрические взаимодействия, β-распадное взаимодействие и тяготение. Фотон взаимодействует со всеми заряженными частицами с силой, характеризуемой некоторым постоянным числом 1/137. Детальный закон этой связи известен — это квантовая электродинамика. Тяготение взаимодействует со всякой энергией, но чрезвычайно слабо, куда слабее, чем электричество. И этот закон известен. Потом идут так называемые слабые распады: β-распад, из-за которого нейтрон распадается довольно медленно на протон, электрон и нейтрино. Тут закон выяснен лишь частично. А так называемое сильное взаимодействие (связь мезона с барионом) обладает по этой шкале силой, равной единице, а закон его совершенно темен, хоть и известны кое-какие правила, вроде того, что количество барионов ни в одной реакции не меняется.
Таблица 2.3 ЭЛЕМЕНТАРНЫЕ ВЗАИМОДЕЙСТВИЯ
Положение, в котором находится современная физика, следует считать ужасным. Я бы подытожил его такими словами: вне ядра мы, видимо, знаем все; внутри него справедлива квантовая механика, нарушений ее принципов там не найдено.
Сцена, на которой действуют все наши знания, — это релятивистское пространство-время; не исключено, что с ним связано и тяготение. Мы не знаем, как началась Вселенная, и мы ни разу не ставили опытов с целью точной проверки наших представлений о пространстве-времени на малых расстояниях, мы только знаем, что вне этих расстояний наши воззрения безошибочны. Можно было бы еще добавить, что правила игры — это принципы квантовой механики; и к новым частицам они, насколько нам известно, приложимы не хуже, чем к старым. Поиски происхождения ядерных сил приводят нас к новым частицам; но все эти открытия вызывают только замешательство. У нас нет полного понимания их взаимных отношений, хотя в некоторых поразительных связях между ними мы уже убедились. Мы, видимо, постепенно приближаемся к пониманию мира заатомных частиц, но неизвестно, насколько далеко мы ушли по этому пути.
Глава 3 ФИЗИКА И ДРУГИЕ НАУКИ
§ 1. Введение
Физика — это самая фундаментальная из всех наук, самая всеобъемлющая; огромным было ее влияние на все развитие науки. Действительно, ведь нынешняя физика вполне равноценна давнишней натуральной философии, из которой возникло большинство современных наук. Не зря физику вынуждены изучать студенты всевозможных специальностей; во множестве явлений она играет основную роль.
В этой главе мы попытаемся рассказать, какого рода фундаментальные проблемы встают перед соседними науками. Жаль, что нам не придется по-настоящему заняться этими науками, их проблемами; мы не сможем прочувствовать всю их сложность, тонкость и красоту. Из-за нехватки места мы не коснемся также связи физики с техникой, с промышленностью, с общественной жизнью и военным искусством. Даже на замечательной связи, объединяющей физику с математикой, мы не задержимся. (Математика, с нашей точки зрения, не наука в том смысле, что она не относится к естественным наукам. Ведь мерило ее справедливости отнюдь не опыт.) Кстати, не все то, что не наука, уж обязательно плохо. Любовь, например, тоже не наука. Словом, когда какую-то вещь называют не наукой, это не значит, что с нею что-то неладно: просто не наука она, и всё.
§ 2. Химия
Химия испытывает на себе влияние физики, пожалуй, сильней, чем любая другая наука. Когда-то, в свои младенческие годы, когда химия почти целиком сводилась к тому, что мы сейчас называем неорганической химией (т. е. химии веществ, не связанных с живыми телами), когда кропотливым трудом химиков открывались многие химические элементы, их связь друг с другом, изучались их соединения, анализировался состав почвы и минералов, в те годы химия сыграла важную роль в становлении физики. Эти науки взаимодействовали очень сильно: вся теория атомного строения вещества получила основательную поддержку в химическом эксперименте. Химическую теорию, т. е. теорию самих реакций, подытожила периодическая система Менделеева. Она выявила немало удивительных связей между разными элементами — стало ясно, что с чем и как соединяется; все эти правила составили неорганическую химию. Сами они в свою очередь были в конечном счете объяснены квантовой механикой. Стало быть, на самом деле теоретическая химия — это физика. Однако объяснение, даваемое квантовой механикой, — это все-таки объяснение в принципе. Мы уже говорили, что знание шахматных правил — это одно, а умение играть — совсем другое. Можно знать правила, а играть неважно. Точно так же очень и очень непросто точно предсказать, что произойдет в такой-то химической реакции. И все же в самых глубинах теоретической химии лежит квантовая механика.
Есть к тому же ветвь физики и химии, и очень важная ветвь, к которой они обе приложили руки. Речь идет о применении статистики к тем случаям, когда действуют законы механики, т. е. о статистической механике. В любой химической реакции действует много атомов, а движения их случайны и замысловаты. Если бы мы могли проанализировать каждое столкновение, подробно проследить движение каждой молекулы, то мы бы всегда знали, что случится. Но нужно так много чисел, чтобы отметить путь всех молекул, что никакой емкости вычислительной машины и уж во всяком случае емкости мозга не хватит. Значит, важно научиться работать с такими сложными системами. Статистическая механика, кроме того, лежит в основе теории тепловых явлений, или термодинамики.
В наше время неорганическая химия как наука свелась в основном к физической и квантовой химии; первая изучает скорости реакций и прочие их детали (как попадает молекула в молекулу, какая из частей молекулы оторвется первой и т. д.), а вторая помогает понимать происходящее на языке физических законов.
Другая ветвь химии — органическая химия, химия веществ, связанных с жизненными процессами. Одно время думали, что подобные вещества столь необыкновенны, что их не изготовишь своими руками из неорганических веществ. Но это оказалось не так: органические вещества отличаются от неорганических только большей сложностью расположения атомов. Органическая химия, естественно, тесно связана с биологией, снабжающей ее веществами, и с промышленностью; далее, многое из физической химии и квантовой механики столь же приложимо к органическим соединениям, как и к неорганическим. Впрочем, главные задачи органической химии вовсе не в этом, а в анализе и синтезе веществ, образуемых в биологических системах, в живых телах. Отсюда можно постепенно перейти к биохимии и к самой биологии, т. е. к молекулярной биологии.
§ 3. Биология
Итак, мы пришли к науке, которая занята изучением живого, — к биологии. Когда она делала свои первые шаги, биологи решали чисто описательные задачи; им нужно было выяснить, каким бывает живое, им приходилось, скажем, подсчитывать, сколько у блохи на ноге волосков, и т. д. Когда все это (с большим интересом) было изучено, они обратились к механизму функционирования живого, сперва, естественно, очень грубо, в общих чертах, потому что в разных тонкостях разобраться было непросто.
Когда-то между биологией и физикой существовали интересные отношения: именно биология помогла физике открыть закон сохранения энергии; ведь Майер установил этот закон при изучении количества тепла, выделяемого и поглощаемого живым организмом.
Если вглядеться в биологию живых организмов, можно заметить множество чисто физических явлений: циркуляцию крови, давление и т. п. Взять, к примеру, нервы. Наступив на острый камешек, мы мгновенно узнаем об этом: что-то нам о том говорит, какая-то информация поднимается вверх по ноге. Как же это происходит? Изучая нервы, биологи пришли к выводу, что это очень нежные трубочки со сложными, очень тонкими стенками. Через эти стенки в клетку поступают ионы; получается нечто вроде конденсатора с положительными ионами снаружи и отрицательными внутри. У такой мембраны есть замечательное свойство: если в одном месте она «разряжается», т. е. если в каком-то месте ионы пройдут насквозь, так что электрическое напряжение здесь упадет, то соседние ионы почувствуют это электрическое влияние; это так подействует на мембрану в соседнем месте, что она тоже пропустит сквозь себя ионы. В свою очередь это скажется на следующем месте и т. д. Возникнет волна «проницаемости» мембраны; она побежит вдоль нервного волокна, если один конец его «возбудится» острым камнем. Выходит словно длинная цепочка костяшек домино, поставленных торчком; толкнешь крайнюю, она — следующую и т. д. Конечно, больше одного сообщения так не передашь, надо снова поднять все костяшки; и в нервной клетке тоже после этого идут процессы медленного накопления ионов и подготовки нерва к новому импульсу. Так мы узнаём, что мы делаем (или по крайней мере где мы находимся). Электрические явления при прохождении нервного импульса, конечно, можно регистрировать электрическими приборами. Поскольку эти явления существуют, то без физики электричества нельзя понять проводимость по нерву.
Обратное явление происходит, когда откуда-то из мозга по нерву передается сообщение. Что делается тогда на конце нерва? Нерв там дает разветвления, которые связаны с мышечной структурой; называют их концевые ответвления. По причинам, точно не известным, в момент, когда импульс достигает конца нерва, из него вылетают маленькие пакетики реактивов, называемых ацетилхолин (5—10 молекул за раз); они влияют на мышечное волокно, и оно сокращается — видите, как все просто! Но что же все-таки вынуждает мышцу сокращаться? Мышца — это большое число плотно расположенных волокон; в них содержатся два разных вещества — миозин и актомиозин; и все же механизм, при помощи которого химическая реакция, вызванная ацетилхолином, меняет размер молекулы, пока еще не выяснен. Иначе говоря, неизвестны самые основные процессы, ответственные за механические движения мышц.
Биология — настолько широкое поле деятельности, что есть уйма проблем, о которых мы даже не упоминаем; скажем, вопрос о том, как осуществляется зрение (что свет делает внутри глаза) или как работает ухо и т. д. (Как работает мысль, мы обсудим позже, когда будем говорить о психологии.)
Так вот, все эти вопросы, стоящие перед биологией, на самом деле для биолога отнюдь не главные, отнюдь не они лежат в основе жизни. Если мы их и поймем, нам все равно не понять сущности жизни. Вот вам пример: люди, изучающие нервы, понимают, что их работа очень нужна, ведь животных без нервов не бывает. Но жизнь без нервов возможна. У растений нет ни нервов, ни мышц, и все же они работают, живут (что одно и то же). Значит, самые фундаментальные проблемы биологии нужно искать глубже.
При этом мы установим, что у всех живых существ есть много общих черт. Самое же общее между ними то, что они состоят из клеток, внутри каждой из которых действует сложный механизм химических превращений. В растительных клетках, например, есть механизм поглощения света и выработки сахарозы, которая потом в темноте поглощается, поддерживая жизнь растения. Когда животное поедает растение, сахароза порождает в животном цепь химических реакций, тесно связанных с фотосинтезом растений (и обратной цепочкой в темноте).
В клетках живых организмов происходит множество хитро задуманных химических реакций: одно соединение превращается в другое, затем в третье, затем еще и еще. Фиг. 3.1 дает некое представление о гигантских усилиях, предпринятых в изучении биохимии; там сведены воедино наши знания о малой доле того множества цепочек реакций (может быть, примерно 1% общего количества), которые происходят в клетке.
Фиг. 3.1. Цикл Кребса.
Вы видите здесь ряд молекул, последовательно превращающихся одна в другую, — цикл с довольно мелкими шагами. Это — цикл Кребса, или дыхательный цикл. Судя по изменениям в молекулах, каждое вещество и каждый шаг в цикле довольно просты. Но эти изменения относительно трудно воспроизводятся, лабораторным путем. Это открытие необыкновенной важности в биохимии. Дело вот в чем. Если есть два сходных вещества, то как раз их-то часто нельзя превратить друг в друга, потому что эти две формы обычно отделены энергетическим барьером, «перевалом». Ведь, желая перенести предмет на новое место на том же уровне по другую сторону перевала, вы сперва должны поднять его над перевалом. Это требует добавочной затраты энергии. По той же причине многие реакции не происходят, им не хватает так называемой энергии активации. Если вы хотите присоединить к химическому соединению лишний атом, то для того, чтобы он пристал куда надо, его следует придвинуть вплотную, иначе нужная перестановка не произойдет, он лишь немного взбежит по «склону» и скатится обратно. Но если б вы могли, буквально повертев молекулу в руках, раздвинуть ее атомы, ввести в образовавшуюся дыру ваш атом и затем закрыть отверстие, то вы бы миновали подъем, никакой затраты энергии не понадобилось бы и реакция прошла бы легче. Так вот, в клетках и впрямь существуют очень большие молекулы (куда больше, чем те, чьи изменения изображены на фиг. 3.1), которые как-то умеют расставить малые молекулы так, чтобы реакция протекала без труда. Они, эти большие сложные устройства, называются ферменты (или закваска; назвали их так потому, что обнаружили их при сбраживании сахара. Кстати, первые из реакций цикла Кребса были открыты именно при сбраживании). Реакции цикла идут только в присутствии ферментов.
Сам фермент состоит из другого вещества — белка. Молекулы ферментов велики и сложны. Все ферменты отличаются друг от друга, причем каждый предназначен для контроля некоторой определенной реакции. На фиг. 3.1 возле каждой реакции обозначены названия нужного фермента (а иногда один фермент контролирует и две реакции). Подчеркнем, что сам фермент в реакцию не вовлекается. Он не изменяется, его дело только передвинуть атом с одного места в другое. Передвинет в одной молекуле и готов уже заняться следующей. Совсем как станок на фабрике, причем должен иметься запас нужных атомов и возможность избавляться от ненужных. Возьмите, например, водород: существуют ферменты, имеющие специальные ячейки для переноса водорода в любой химической реакции. Скажем, имеются три или четыре фермента, которые понижают количество водорода; они используются во многих местах цикла. Интересно, что механизм, высвобождающий водород в одном месте, придерживает этот атом, чтобы использовать его еще где-нибудь.
Важнейшая деталь цикла, приведенного на фиг. 3.1, это превращение ГДФ в ГТФ (гуаназиндифосфат в гуаназинтрифосфат), потому что во втором веществе — ГТФ — энергии намного больше, чем в первом. Подобно тому как в некоторых ферментах имеется «ящик» для переноса атомов водорода, бывают еще особые «ящики» для переноса энергии; в них входит трифосфатная группа. В ГТФ больше энергии, чем в ГДФ, и когда цикл идет в одну сторону, создаются молекулы с избытком энергии; они могут привести в действие другие циклы, которым требуется энергия, например цикл сжатия мышцы. Мышца не сократится, если нет ГТФ. Можно поместить в воду мышечное волокно и добавить туда ГТФ, тогда волокно сократится, превращая ГТФ в ГДФ (если только присутствуют нужные ферменты). Таким образом, сокращение мышцы есть превращение ГДФ в ГТФ; накопленный в течение дня ГТФ используется в темноте для того, чтобы пустить весь цикл в обратную сторону. Как видите, ферменту все равно, в какую сторону идет реакция; если б это было не так, нарушался бы один из законов физики.
Есть и другой резон, по которому для биологии и других наук важна именно физика, — это техника эксперимента. Например, нарисованная биохимическая схема не была бы еще до сего времени известна, если бы за нею не стояли большие достижения экспериментальной физики. Дело в том, что для анализа этих невообразимо сложных систем нет лучшего средства, нежели ставить метки на атомах, участвующих в реакции. Если ввести в цикл немного углекислоты с «зеленой меткой» на ней и посмотреть, где метка окажется через 3 сек, потом через 10 сек и т. д., то можно проследить течение всей реакции. Но как сделать «зеленую метку»? При помощи различных изотопов. Напомним, что химические свойства атомов определяются числом электронов, а не массой ядра. Но в атоме углерода, к примеру, может быть либо шесть, либо семь нейтронов наряду с обязательными для углерода шестью протонами. В химическом отношении атомы С12 и С13 не отличаются, но по массе и ядерным свойствам они различны, а значит, и различимы. Используя эти изотопы, можно проследить ход реакции. Еще лучше для этого радиоактивный изотоп С14; с его помощью можно весьма точно проследить за малыми порциями вещества.
Вернемся, однако, к описанию ферментов и белков. Не все белки — ферменты, но все ферменты — белки. Существует множество белков, таких, как белки мышц, структурные белки, скажем, в хрящах, волосах, коже, не являющихся ферментами. И все-таки белки — очень характерная для жизни субстанция; во-первых, это составная часть всех ферментов, а во-вторых, составная часть многих иных живых веществ. Структура белков проста и довольно занятна. Они представляют собой ряды, или цепи, различных аминокислот. Существует два десятка разных аминокислот, и все они могут сочетаться друг с другом, образуя цепи, костяком которых являются группы СО—NH и т. п. Белок — это всего лишь цепочки, сложенные из этих 20 аминокислот. Каждая аминокислота, по всей вероятности, служит для каких-то специальных целей. В некоторых аминокислотах в определенном месте находится атом серы; два атома серы в одном и том же белке образуют связь, т. е. схватывают цепь в двух точках и составляют петлю. В других есть избыточный атом кислорода, придающий им кислотные свойства; характеристики третьих — щелочные. В некоторых бывают большие группы атомов, свисающие с одной стороны и занимающие много места. Одна из аминокислот — пролин — в действительности не амино-, а иминокислота. Эта небольшая разница приводит к тому, что когда в цепи есть пролин, то цепь перекручивается. Если бы вы захотели создать какой-то определенный белок, то вам пришлось бы дать такие указания: здесь поместите серный крюк, затем добавьте чего-нибудь, чтобы заполнить место, теперь привяжите что-нибудь, чтобы цепь перекрутилась, и т. д. Получились бы скрепленные между собой замысловатые цепочки со сложной структурой; все ферменты, по-видимому, устроены именно так. Одним из триумфов современной науки было открытие (в 1960 г.) точного пространственного расположения атомов некоторых белков; в них 56—60 аминокислот подключены друг за другом. Было установлено точное местоположение свыше 1000 атомов (даже до 2000, если считать и водород), входящих в сложную структуру двух белков (один из них — гемоглобин). А одна из печальных сторон этого открытия проявилась в том, что из этой картины ничего увидеть нельзя; мы не понимаем, почему она такая. Именно эту проблему и следует сейчас атаковать.
Есть и другая проблема в биологии: откуда ферменты «знают», кем им стать? От красноглазой мухи рождается опять красноглазая мушка; значит, вся информация о ферментах, создающих красный пигмент, должна перейти к очередной мушке. Передает эту информацию не белок, а вещество в ядре клетки, ДНК (дезоксирибонуклеиновая кислота). Это — та ключевая субстанция, которая передается от одной клетки к другой (половые клетки, например, почти целиком состоят из ДНК) и уносит с собой инструкцию, как делать ферменты. ДНК — это «калька», печатная матрица. На что похожа эта калька, как она должна действовать? Первое — она должна воспроизводить самое себя; второе — она должна быть способна давать задания белку. Что до первого, то можно было бы думать, что это происходит так же, как воспроизведение клеток: клетки подрастают и делятся пополам. Может быть, молекулы ДНК тоже растут и тоже делятся? Нет, это исключено. Ведь атомы наверняка не растут и не делятся! Видимо, для репродукции молекул нужен другой путь, похитрее.
Структура ДНК долго изучалась сперва химически (составные части), затем рентгенографически (пространственная структура). В результате пришли к следующему знаменательному открытию: молекула ДНК — это пара цепочек, навитых друг на друга. Скелет каждой цепочки, хотя и похожий на белковые цепи, но химически отличный от них, — это ряд сахарных и фосфатных групп, как показано на фиг. 3.2.
Фиг. 3.2. Схема ДНК.
Из этой схемы видно, как в цепи может храниться инструкция, ибо, разняв цепочку на две нитки, вы получаете ряд веществ BAADC...; не исключено, что этот ряд у каждого организма свой. Значит, можно думать, что каждый особый ряд ДНК содержит в себе особые указания, как производить белки.
На схеме видны пары поперечных звеньев, присоединенных к сахарным группам и стягивающих между собой две нити. Эти звенья неодинаковы; есть четыре сорта звеньев — аденин, тимин, цитозин, гуанин, обозначаемые A, B, C и D. Интересно, что не всякие звенья спариваются. Например, возможны пары АВ или CD; они размещены на двух нитях так, что «подходят друг к другу», обладают сильной энергией взаимодействия. Но С к А или В к С не подходит; если в цепи стоит С, то в другой цепи в этом месте должно быть только D. Каждой букве в одной цепи соответствует определенная буква в другой.
Как же мыслится при этом воспроизведение? Пусть цепь расщеплена на две. Как сделать другую такую же? Если в веществе клетки есть фабрика, вырабатывающая фосфат, сахар и звенья A, B, C, D (пока не привязанные к цепи), то к нашей половинке цепочки присоединятся только подходящие звенья, дополняющие BAADC, т. е. ABBCD... . При делении клетки цепь разнимается посредине на две нитки, каждая переходит в свою клетку и там набирает себе дополнение.
Наконец, последний вопрос: как порядок следования A, B, C, D в ДНК определяет расстановку аминокислот в белках? Ответа пока нет. Это основная нерешенная проблема современной биологии. Пока мы располагаем только какими-то обрывками информации об этом. В клетке имеются мельчайшие частички — микросомы; сейчас известно, что в них и вырабатываются белки. Но микросомы находятся не в ядре, не там, где находится ДНК со своими инструкциями. По-видимому, в этом есть какой-то смысл. Известно, однако, что от ДНК отрываются кусочки молекул, не такие длинные, как ДНК, несущая в себе всю информацию, а нечто вроде некрупных ее долек. Называют их РНК, но не в этом дело. Это нечто вроде уменьшенной копии ДНК. Известно, что РНК как-то переносит в микросому сообщение о том, какой сорт белка нужно изготовить. (Этот факт уже известен.) После этого в микросоме образуется белок. Это тоже известно. Но различные детали того, как аминокислоты входят в белки и как они располагаются в согласии с кодом, зашифрованным в РНК, пока не известны. Мы не умеем читать этот код. Если «написано», например, AВССА, то мы не знаем, какой белок будет приготовлен.
Право же, ни одна наука, ни одна отрасль знаний не движутся так бурно по всем направлениям вперед, как биология. Но если б мы должны были назвать то самое главное, что ведет нас сейчас все вперед и вперед в наших попытках понять явление жизни, мы обязаны были бы сказать: «все тела состоят из атомов», всё, что происходит в живых существах, может быть понято на языке движений и покачиваний атомов.
§ 4. Астрономия
В нашем стремительном обзоре всей Вселенной очередь дошла до астрономии. Астрономия — старше физики. Фактически физика и возникла из нее, когда астрономия заметила поразительную простоту движения звезд и планет; объяснение этой простоты и стало началом физики. Но самым выдающимся открытием астрономии было открытие того, что звезды состоят из таких же атомов, что и Земля[3]. Как это было доказано?
Каждый атом испускает свет определенных частот, подобно тому как у каждого музыкального инструмента есть свое звучание — определенный набор частот, или высот, звука. Слыша одновременно несколько тонов, мы можем разделить их; но способности нашего глаза в этом отношении далеко не столь велики, он не может разделить смесь цветов на составляющие части. Однако с помощью спектроскопа становится возможным анализ частот световых волн, он позволяет видеть истинные тона атомов различных звезд. Ведь два химических элемента были даже обнаружены на звездах прежде, чем на Земле: гелий (он был открыт на Солнце, потому он так и назван) и технеций (его обнаружили на некоторых холодных звездах). Но раз звезды состоят из тех же атомов, что и Земля, то это сильно продвигает нас вперед в понимании сущности звезд. Нам хорошо известно поведение атомов при высоких температурах и невысоких плотностях, и это позволяет при помощи статистической механики анализировать поведение звездного вещества. Даже не умея воспроизводить звездное состояние на Земле, но опираясь на основные физические законы, мы часто указываем совершенно точно (а иногда почти точно), что происходит на звездах. Так физика помогает астрономии. Это может показаться странным, но распределение вещества внутри Солнца мы знаем куда лучше, чем его распределение внутри Земли. Казалось бы, что можно узнать, взглянув сквозь телескоп на пятнышко света? Однако недра звезд известны нам гораздо лучше, чем этого можно было бы ожидать, ибо мы умеем рассчитывать, что произойдет с атомами звезд при многих обстоятельствах.
Одно из наиболее впечатляющих открытий астрономии — это открытие источника энергии звезд, поддерживающего их горение. Один из тех, кто открыл это, отправился на прогулку с девушкой как раз в ночь после того, как понял, что на звездах происходит ядерная реакция, что в этом причина их свечения. Она сказала: «Взгляни, как чудесно сияют звезды!» А он ответил: «Да. Чудесно. А ведь сегодня я — единственный человек в мире, который знает, почему они сияют!» Она только рассмеялась. На нее не произвело впечатления, что он — единственный человек, понимающий, почему звезды светят. Что ж, как это ни печально, быть одиноким и непонятым — это в порядке вещей.
Так вот, Солнце получает энергию от ядерного «сгорания» водорода, который переходит при этом в гелий. Из водорода в глубинах звезд вырабатываются далее другие химические элементы. Вещество, из которого сделаны мы, было когда-то «испечено» в звезде и выплеснуто наружу. Но откуда это известно? А вот откуда. Содержание различных изотопов в веществе C12, C13 и т. д. — никогда не меняется при химических превращениях, ибо для обоих изотопов C химические реакции одинаковы. Эти пропорции есть результат лишь ядерных реакций. Изучая пропорцию изотопов в остывшей, мертвой золе, каковой являемся мы, можно догадаться, на что была похожа печь, в которой сформировалось наше вещество. Она была похожа на звезды, и поэтому очень вероятно, что элементы «сделаны» в звездах и выброшены оттуда при взрывах, называемых нами Новыми и Сверхновыми звездами. Астрономия столь близка к физике, что еще не один раз в этом курсе мы обратимся к ней.
§ 5. Геология
Перейдем теперь к так называемым наукам о Земле, или геологии. К ним относятся прежде всего метеорология, или наука о погоде. Метеорологическая аппаратура — это физические приборы, так что метеорология снабжена приборами благодаря развитию экспериментальной физики (мы уже об этом говорили). Иное дело теория метеорологии, она никогда не была удовлетворительно разработана никем из физиков. «Странно, — скажете вы, — ведь это всего лишь воздух, разве мы не знаем уравнений движения воздуха?» Да, знаем. «Почему же, зная, в каком состоянии воздух сегодня, мы не можем предсказать его состояние на завтра?» Во-первых, мы не знаем, каково на самом деле сегодня состояние воздуха, ибо он то и дело где-то завихряется и струится. Воздух очень чувствителен к любым изменениям и попросту неустойчив. Чтобы понять, о какой неустойчивости я говорю, взгляните, как вода спокойно течет над плотиной и вдруг, падая, превращается во множество пузырьков и капель. Вы знаете состояние воды в момент, когда она переваливает через плотину, — она совершенно спокойна; откуда же берутся капли в момент падения? От чего зависит, на какие струи разобьется поток, где они возникнут, куда упадут? Все это неизвестно, потому что течение воды неустойчиво. Точно так же даже спокойный поток воздуха, проходя между гор, прихотливо распадается на отдельные вихри. Во многих областях науки мы сталкиваемся с тем, что носит название турбулентное течение, не поддающееся пока нашему анализу. Так что давайте лучше от темы «погода» перейдем побыстрей к геологии!
Главный вопрос геологии заключается в том, что сделало Землю такой, какая она есть? Самые очевидные из таких процессов происходят у нас на глазах: реки подмывают берега, поля заносит пылью и т. д. Это понять довольно легко, но ведь кроме эрозии, помимо разрушения должно что-то и обратное происходить. В среднем горы сейчас не ниже, чем в прошлом. Следовательно, должен происходить и процесс горообразования. Изучая геологию, вы убедитесь, что действительно происходит и горообразование, и вулканизм, но никто их не понимает; не понимает того, что составляет половину геологии. Действительно, природа вулканов не понята. Отчего бывают землетрясения, тоже в конечном счете не понято. Понимают, конечно, что если что-то с чем-то столкнется, то что-то треснет, что-то сдвинется — все это хорошо. Но что толкнуло, почему толкнуло? Существует теория, что внутри Земли имеются течения — происходит циркуляция из-за различия температур снаружи и внутри — и они в своем движении слегка толкают поверхность Земли. А если где-то встречаются два противных течения, то там должно накапливаться вещество, появляться горные хребты, они окажутся в сильно напряженном состоянии, возникнут вулканы, произойдут землетрясения.
Что можно сказать о недрах Земли? Хорошо известна скорость волн землетрясений в Земле и распределение плотности внутри нашей планеты. Но физики не смогли создать хорошей теории плотности вещества при давлениях, ожидаемых в центре Земли. Иными словами, мы не представляем себе слишком хорошо свойств вещества в таких условиях. Со своей планетой мы справляемся куда хуже, нежели с состоянием вещества в звездах. Необходимый для этого математический аппарат не разработан, он, по-видимому, чрезвычайно сложен; не исключено, однако, что найдется кто-то, кто поймет важность этой проблемы и разработает ее. Другое дело, что, даже вычислив плотность, мы не сможем представить себе циркулирующие течения или разобраться в свойствах горных пород при сверхвысоких давлениях. Мы не умеем предсказывать, насколько быстро эти породы «поддадутся» давлению; только опыт ответит на эти вопросы.
§ 6. Психология
Рассмотрим, наконец, еще одну науку — психологию. Сразу же уместно заметить, что психоанализ — это не наука; в лучшем случае это медицинский процесс, а скорее всего — знахарство. В психоанализе существует теория происхождения болезней — разные там «духи» и прочее. Знахарь тоже имеет теорию, по которой болезнь, скажем малярию, вызывает дух, витающий в воздухе; ее не вылечишь, если потрясти змеей над головой больного, а вот хинин помогает. Итак, если вы заболеете, советую вам отправиться к знахарю, потому что он лучше всех в племени разбирается в болезнях; однако его знание — это не наука. Психоанализ не был достаточно проверен экспериментально, и невозможно привести перечень случаев, когда он помогает, а когда не помогает и т. д.
Другие ветви психологии, а в нее входит, например, физиология ощущения (что происходит в глазе, а что в мозге), пожалуй, не столь интересны. Но в них были достигнуты хотя и малые, но вполне реальные успехи. Вот одна из интереснейших технических задач (хотите называйте ее психологией, хотите — нет). Центральная проблема в изучении мышления, или, если угодно, нервной системы, такова: пусть животное чему-либо научилось, пусть оно умеет делать что-то, чего прежде не умело; значит, клетки его мозга, если они состоят из атомов, изменились. В чем же состоит это изменение? Мы запечатлели что-то в своей памяти. Где это? Что там можно увидеть теперь? Этого мы не знаем. Мы запомнили какое-то число. Что это значит? Что изменилось в нервной системе? Неизвестно. Это очень важная проблема, совершенно притом нерешенная. Даже если допустить, что в нас имеется какой-то механизм памяти, то все равно мозг — это столь невообразимая масса пересекающихся проводов и нервов, что, по всей вероятности, прямой анализ невозможен. Аналог этого — вычислительные машины и их элементы; в них тоже множество проводов, есть и элементы, похожие на синапсы (нервные связи). Жаль, что у нас нет времени разобрать интересный вопрос об отношении между мыслью и вычислительными машинами. Следует понимать все же, что этот вопрос очень мало скажет нам о реальной сложности повседневного поведения человека. Люди столь различны! И понадобится немало времени, чтоб в этом разобраться. Следует начать издалека. Если бы даже нам удалось представить, как действует собака, то и этого оказалось бы слишком мало. Собаку понять куда легче, но и то никто не может объяснить, как она действует.
§ 7. С чего все пошло?
Чтобы физика могла быть полезной другим наукам в отношении теории, а не только своими приборами и изобретениями, эти науки должны снабдить физика описанием их объекта на физическом языке. Если биолог спросит: «Почему лягушка прыгает?», то физик не сможет ответить. Но если он расскажет, что такое лягушка, что в ней столько-то молекул, что вот в этом месте у нее нервы и т. д., то это уже совсем иное дело. Если геолог более или менее толково объяснит нам, что такое Земля, а астроном — что такое звезды, тогда можно попробовать в этом разобраться. Чтобы был какой-то толк от физической теории, нужно знать, где расположены атомы. Чтобы понять химию, мы должны точно знать, из каких атомов состоят интересующие нас вещества, иначе мы ничего не проанализируем. Конечно, это лишь одно из ограничений.
Существует и другой тип задач в соседних науках, который в физике отсутствует. Назовем его, не имея лучшего термина, вопросом истории. С чего все пошло? Как все стало таким, как оно есть? Если, например, все в биологии будет нами понято, возникнет естественный вопрос: как появились все существа на Земле? Этим занимается теория эволюции — важная часть биологии. В геологии нам хочется знать не только, как образуются горы, но и как вначале возникла сама Земля, солнечная система и т. д. Это, естественно, приводит нас к желанию узнать, из какого рода материи складывалась тогда Вселенная. Как развились звезды? Каковы были начальные условия? Это — проблема астрономической истории. Сейчас многое прояснилось в происхождении звезд, элементов, из которых мы состоим, и даже чуточку стало ясней происхождение самой Вселенной.
В настоящее время физика не изучает вопросы истории. Мы не задаем вопрос: «Вот законы физики, как они возникли?» Мы не считаем в настоящее время, что законы физики со временем как-то изменяются, что они прежде были иными, нежели ныне. Конечно, это не исключено, и если выяснится, что это и впрямь так, то исторические вопросы физики переплетутся с остальной историей Вселенной, и тогда физик будет обсуждать те же проблемы, что и астрономы, геологи и биологи.
Наконец, существует физическая проблема, общая многим наукам, очень старая к тому же, но до сего времени не решенная. Это не проблема поиска новых элементарных частиц, нет, это другой вопрос — вопрос давно, свыше ста лет назад, отставленный наукой в сторону. Ни один физик еще не смог математически безупречно проанализировать его, несмотря на его важность для сопредельных наук. Это — анализ циркуляции, или вихревой жидкости. Если проследить эволюцию звезды, то рано или поздно мы подойдем к такому моменту, когда в звезде начинается конвекция; и с этого момента мы уже не знаем, что будет дальше. Через несколько миллионов лет происходит взрыв звезды, но причина этого для нас остается загадкой. Мы не умеем анализировать погоду. Мы не знаем картины движений, которые должны происходить внутри Земли. В простейшей форме задача такова: пропустим через очень длинную трубку на большой скорости воду. Спрашивается: какое нужно давление, чтобы прогнать сквозь трубку данное количество воды? И никто, основываясь только на первичных законах и на свойствах самой воды, не умеет ответить на этот вопрос. Если вода течет неторопливо или когда сочится вязкая жижа вроде меда, то мы прекрасно все умеем. Ответ вы можете найти, например, в любом вашем учебнике. А вот с настоящей, мокрой водой, брызжущей из шланга, справиться мы не в силах. Это — центральная проблема, которую в один прекрасный день нам понадобится решить, а мы это не умеем.
Поэт сказал однажды: «Весь мир в бокале вина». Мы, вероятно, никогда не поймем, какой смысл он в это вкладывал, ибо поэты пишут не для того, чтобы быть понятыми. Но бесспорно, что, внимательно взглянув в бокал вина, мы поистине откроем целый мир. В нем и физические явления (искрящаяся жидкость, испарение, меняющееся в зависимости от погоды и вашего дыхания, блеск стекла) и атомы (о которых нам говорит уже наше воображение). Стекло — это очищенная горная порода; в его составе кроются секреты возраста Вселенной и развития звезд. А из какого удивительного набора реактивов состоит это вино! Как они возникли? Там есть закваска, ферменты, вытяжки и разные другие продукты. Ведь в вине скрывается большое обобщение: вся жизнь есть брожение. Изучая химию вина, нельзя не открыть, как это и сделал Луи Пастер, причины многих болезней. Сколько жизни в этом кларете, если он навязывает нашему сознанию свой дух, если мы должны быть столь осторожны с ним! Наш ограниченный ум для удобства делит этот бокал вина, этот мир на части: физику, биологию, геологию, астрономию, психологию и т. д., но ведь природа на самом деле никакого деления не знает! Давайте же и мы сольем это воедино, не забывая все же, что мы увидели. Пусть этот бокал вина доставит напоследок еще одно наслаждение: выпить его и обо всем позабыть!
Глава 4 СОХРАНЕНИЕ ЭНЕРГИИ
§ 1. Что такое энергия?
С этой главы, покончив с общим описанием природы вещей, мы начнем подробное изучение различных физических вопросов. Чтобы показать характер идей и тип рассуждений, которые могут применяться в теоретической физике, мы разберем один из основных законов физики — сохранение энергии.
Существует факт, или, если угодно, закон, управляющий всеми явлениями природы, всем, что было известно до сих пор. Исключений из этого закона не существует; насколько мы знаем, он абсолютно точен. Название его — сохранение энергии. Он утверждает, что существует определенная величина, называемая энергией, которая не меняется ни при каких превращениях, происходящих в природе. Само это утверждение весьма и весьма отвлеченно; это по существу математический принцип, утверждающий, что существует некоторая численная величина, которая не изменяется ни при каких обстоятельствах. Это отнюдь не описание механизма явления или чего-то конкретного, просто-напросто отмечается то странное обстоятельство, что можно подсчитать какое-то число и затем спокойно следить, как природа будет выкидывать любые свои трюки, а потом опять подсчитать это число — и оно останется прежним. (Ну, все равно, как слон на черном шахматном поле: как бы ни разворачивались события на доске, какие бы ходы ни делались, слон все равно окажется на черном поле. Наш закон как раз такого типа.) И поскольку утверждение это отвлеченно, то мы выявим его смысл на некоторой аналогии.
Познакомимся с мальчиком, этаким Монтигомо Ястребиный Коготь; у него есть большие кубики, которые даже он не может ни сломать, ни разделить на части. Все они одинаковы. Пускай их у него 28 штук. Мама оставляет его утром дома наедине с этими кубиками. Каждый вечер она подсчитывает, сколько у него кубиков, — она немного любопытна! — и открывает поразительную закономерность: что бы ее сынишка ни вытворял с кубиками, их все равно оказывается 28! Так это тянется довольно долго, и вдруг в один прекрасный день она насчитывает только 27 штук. После недолгих поисков кубик обнаруживают под ковром: ей приходится все обыскать, чтобы убедиться в неизменности числа кубиков. В другой раз кубиков оказывается 26. Снова тщательное исследование показывает, что окно отворено; взглянув вниз, она видит два кубика в траве. В третий раз подсчет дает 30 кубиков! Это приводит маму в полное замешательство, но потом она вспоминает, что в гости приходил соседский Кожаный Чулок, видимо, он захватил с собой свои кубики и позабыл их здесь. Она убирает лишние кубики, затворяет плотно окно, не пускает больше гостей в дом, и тогда все опять идет как следует, пока однажды подсчет не дает 25 кубиков... Правда, в комнате имеется ящик для игрушек, маме хочется и в него заглянуть, но мальчик кричит: «Не открывай мой ящик!» и начинает рёв; мама к ящику не допускается. Как же быть? Но мама любопытна и хитра, она придумывает выход! Она знает, что кубик весит 500 г; она взвешивает ящик, когда все 28 кубиков на полу, он весит 1 кг. Когда в следующий раз она проверяет количество кубиков, она опять взвешивает ящик, вычитает 1 кг и делит на 500 г. Она открывает, что
(4.1)
Но опять возникают отклонения и от этой формулы. Снова в результате кропотливых изысканий выясняется, что при этом уровень воды в стиральной машине почему-то изменился. Дитя, оказывается, швыряет кубики в воду, а мать не может их увидеть — вода мыльная; но она может узнать, сколько в воде кубиков, добавив в формулу новый член. Первоначальный уровень воды 40 см, а каждый кубик подымает воду на 1/3 см, так что новая формула такова:
(4.2)
Мир представлений мамы постепенно расширяется, она находит весь ряд членов, позволяющих рассчитывать, сколько кубиков находится там, куда она заглянуть не может. В итоге она открывает сложную формулу для количества, которое должно быть рассчитано и которое всегда остается тем же самым, что бы ее дитя ни натворило.
В чем же аналогия между этим примером и сохранением энергии? Самое существенное, от чего надлежит отвлечься в этой картинке, — это что кубиков не существует. Отбросьте в выражениях (4.1) и (4.2) первые члены и вы обнаружите, что считаете более или менее отвлеченные количества. Аналогия же в следующем. Во-первых, при расчете энергии временами часть ее уходит из системы, временами же какая-то энергия появляется. Чтобы проверить сохранение энергии, мы должны быть уверены, что не забыли учесть ее убыль или прибыль. Во-вторых, энергия имеет множество разных форм и для каждой из них есть своя формула: энергия тяготения, кинетическая энергия, тепловая энергия, упругая энергия, электроэнергия, химическая энергия, энергия излучения, ядерная энергия, энергия массы. Когда мы объединим формулы для вклада каждой из них, то их сумма не будет меняться, если не считать убыли энергии и ее притока.
Важно понимать, что физике сегодняшнего дня неизвестно, что такое энергия. Мы не считаем, что энергия передается в виде маленьких пилюль. Ничего подобного. Просто имеются формулы для расчета определенных численных величин, сложив которые, мы получаем число 28 — всегда одно и то же число. Это нечто отвлеченное, ничего не говорящее нам ни о механизме, ни о причинах появления в формуле различных членов.
§ 2. Потенциальная энергия тяготения
Сохранение энергии можно понять, только если имеются формулы для всех ее видов. Я сейчас рассмотрю формулу для энергии тяготения близ земной поверхности; я хочу вывести ее, но не так, как она впервые исторически была получена, а при помощи специально придуманной для этой лекции нити рассуждений. Я хочу вам показать тот достопримечательный факт, что нескольких наблюдений и строгого размышления достаточно, чтобы узнать о природе очень и очень многое. Вы увидите, в чем состоит работа физика-теоретика. Вывод подсказан блестящими рассуждениями Карно о к. п. д. тепловых машин[4].
Рассмотрим грузоподъемные машины, способные подымать один груз, опуская при этом другой. Предположим еще, что вечное движение этих машин невозможно. (Именно недопустимость вечного движения и есть общая формулировка закона сохранения энергии.) Определяя вечное движение, нужно быть очень осторожным. Сделаем это сначала для грузоподъемных машин. Если мы подняли и опустили какие-то грузы, восстановили прежнее состояние машины и после этого обнаружили, что в итоге груз поднят, то мы получили вечный двигатель: поднятый груз может привести в движение что-то другое. Здесь существенно, чтобы машина, поднявшая груз, вернулась в первоначальное положение и чтобы она ни от чего не зависела (чтобы не получала от внешнего источника энергию для подъема груза, словом, чтобы не приходил в гости Кожаный Чулок со своими кубиками).
Очень простая грузоподъемная машина показана на фиг. 4.1.
Фиг. 4.1. Простая грузоподъемная машина.
Она подымает тройной вес. На одну чашку весов помещают три единицы веса, на другую — одну. Правда, чтобы она и впрямь заработала, с левой чашки необходимо снять хоть малюсенький грузик. И наоборот, чтобы поднять единичный груз, опуская тройной, тоже нужно немного сплутовать и убрать с правой чашки часть груза. Мы понимаем, что в настоящей подъемной машине надо создать небольшую перегрузку на одну сторону, чтобы поднять другую. Но пока махнем на это рукой. Идеальные машины, хотя их и нет на самом деле, не нуждаются в перевесе. Машины, которыми мы фактически пользуемся, можно считать в некотором смысле почти обратимыми, т. е. если они поднимают тройной вес при помощи единичного, то они могут поднять также почти единичный вес, опуская тройной.
Представим, что имеются два класса машин — необратимые (сюда входят все реальные машины) и обратимые, которых на самом деле не существует; как бы тщательно ни изготавливать подшипники, рычаги и т. д., таких машин все равно не построишь. Но мы предположим все же, что обратимая машина существует и способна, опустив единичный груз (килограмм или грамм — все равно) на единичную длину, поднять в то же время тройной груз. Назовем эту обратимую машину машиной А. Положим, что данная обратимая машина подымает тройной груз на высоту X. Затем предположим, что имеется другая машина В, не обязательно обратимая, которая тоже опускает единичный вес на единицу длины, но поднимает тройной вес на высоту Y. Теперь можно доказать, что Y не больше X, т. е. что нельзя соорудить машину, которая смогла бы поднять груз выше, чем обратимая. Почему? Посмотрите. Пусть Y выше X.
Мы берем единичный вес и опускаем его на единицу длины машиной В, тем самым поднимая тройной груз на высоту Y. Затем мы можем опустить груз с высоты Y до X, получив свободную энергию, и включить обратимую машину А в обратную сторону, чтобы опустить тройной груз на X и поднять единичный вес на единичную высоту. Единичный вес очутится там, где он был прежде, и обе машины окажутся в состоянии начать работу сызнова! Итак, если Y больше X, то возникает вечный двигатель, а мы предположили, что такого не бывает. Мы приходим к выводу, что Y не выше X, т. е. из всех машин, которые можно соорудить, обратимая — наилучшая.
Легко понять также, что все обратимые машины должны поднимать груз на одну и ту же высоту. Положим, что машина В также обратима. То, что Y не больше X, остается, конечно, верным, но мы можем пустить машину в обратную сторону, повторить те же рассуждения и получить, что X не больше Y. Это очень знаменательное наблюдение, ибо оно позволяет узнать, на какую высоту разные машины могут поднимать грузы, не заглядывая в их внутреннее устройство. Если кто-нибудь придумал невероятно запутанную систему рычагов для подъема тройного веса на какую-то высоту за счет опускания единичного веса на единицу высоты и если мы сравним эту машину с простым обратимым рычагом, способным проделать то же самое, то первая машина не поднимет вес выше второй (скорее наоборот). А если его машина обратима, то мы знаем точно, на какую высоту она будет поднимать грузы.
Вывод: каждая обратимая машина, как бы она ни действовала, опуская 1 кг на 1 м, всегда подымает 3 кг на одну и ту же высоту X. Ясно, что мы доказали очень полезный всеобщий закон. Но возникает вопрос: чему равно X?
Пусть у нас есть обратимая машина, способная поднимать 3 кг за счет 1 кг на высоту X. Поместим три шара на стеллаж (как на фиг. 4.2).
Фиг. 4.2. Обратимая машина. а — начальное положение; б — загрузка шаров; в — . 1 кг поднимает 3 кг на высоту X; г — разгрузка шаров; д — восстановление; е — конечное положение.
Четвертый лежит на подставке в одном метре от пола. Машина может поднять три шара, опустив один шар на 1 м. Устроим подвижную платформу с тремя полками высотой X, и пусть высота полок стеллажа тоже будет X (фиг. 4.2,а). Перекатим сперва шары со стеллажа на полки платформы (фиг. 4.2,б); предположим, что для этого энергии не понадобится, потому что полки и стеллаж находятся на одной высоте. Затем включим обратимую машину: она скатит одиночный шар на пол и подымет платформу на высоту X (фиг. 4.2,в). Но мы сконструировали платформу столь остроумно, что шары опять оказались в точности на уровне полок стеллажа. Разгрузим же шары с платформы на стеллаж (фиг. 4.2,г). После разгрузки машина вернется в первоначальное положение. Теперь уже три шара лежат на трех верхних полках стеллажа, а четвертый шар — на полу. Но смотрите, какая странная вещь: по существу два шара мы не поднимали вовсе, ведь на полках 2 и 3 шары как лежали вначале, так лежат и теперь. В итоге поднялся только один шар, но зато на высоту 3Х. Если бы высота ЗХ оказалась больше 1 м, то можно было бы опустить шар, чтобы вернуть машину к начальным условиям (фиг. 4.2,е) и начать работу сначала. Значит, высота 3Х не может быть больше 1 м, ибо начнется вечное движение. Точно так же можно доказать, что 1 м не может быть больше 3Х: машина обратима, пустим ее назад и докажем. Итак, 3Х ни больше, ни меньше 1 м. Мы открыли при помощи одних только рассуждений закон: Х=1/3 м. Обобщить его легко; 1 кг падает при работе обратимой машины с некоторой высоты; тогда машина способна поднять р кг на 1/р высоты. Если, другими словами, 3 кг умножить на высоту их подъема (X), то это равно 1 кг, умноженному на высоту его падения (1 м). Помножив все грузы в машине на высоту, на которой они лежат, дайте машине поработать и опять помножьте все веса на их высоты подъема; в итоге должно выйти то же самое. (Мы перешли от случая, когда двигался только один груз, к случаю, когда за счет опускания одного груза поднимается несколько грузов. Но это, надеюсь, понятно?) Назовем сумму весов, умноженных на высоту, потенциальной энергией тяготения, т. е. энергией, которой обладает тело вследствие своего положения в пространстве по отношению к земле. Формула для энергии тяготения, пока тело не слишком далеко от земли (вес при подъеме ослабляется), такова:
(4.3)
Не правда ли, очень красивое рассуждение? Вопрос только в том, справедливо ли оно. (Ведь, в конце концов, природа не обязана следовать нашим рассуждениям.) Например, не исключено, что в действительности вечное движение возможно. Или другие предположения ошибочны. Или мы просмотрели что-то в своих рассуждениях. Поэтому их непременно нужно проверить. И вот — справедливость их подтверждает опыт.
Потенциальная энергия — это общее название для энергии, связанной с расположением по отношению к чему-либо. В данном частном случае это — потенциальная энергия тяготения. Если же производится работа против электрических сил, а не сил тяготения, если мы «поднимаем» заряды «над» другими зарядами с помощью многочисленных рычагов, тогда запас энергии именуется электрической потенциальной энергией. Общий принцип состоит в том, что изменения энергии равны силе, умноженной на то расстояние, на котором она действует:
(4.4)
По мере чтения курса мы еще не раз будем возвращаться к другим видам потенциальной энергии.
Принцип сохранения энергии во многих обстоятельствах оказывается очень полезен при предсказании того, что может произойти. В средней школе мы учили немало правил о блоках и рычагах. Мы можем теперь убедиться, что все эти «законы» сводятся к одному, и нет нужды запоминать 75 правил. Вот вам простой пример: наклонная плоскость. Пусть это треугольник со сторонами 3, 4, 5 (фиг. 4.3).
Фиг. 4.3. Наклонная плоскость.
Подвесим к блочку груз весом 1 кг и положим его на плоскость, а с другой стороны подвесим груз W.
Мы хотим знать, какова должна быть тяжесть W, чтобы уравновесить груз 1 кг. Рассуждаем так. Если грузы W и 1 кг уравновешены, то это — обратимое состояние, и веревку можно двигать вверх-вниз. Пусть же вначале (фиг. 4.3,а) 1 кг находится внизу плоскости, а груз W — наверху. Когда W соскользнет вниз, груз 1 кг окажется наверху, а W опустится на длину склона (фиг. 4.3,6), т. е. на 5 м. Но ведь мы подняли 1 кг только на высоту 3 м, хотя опустили W на 5 м. Значит, W=3/5 кг. Заметьте, что этот ловкий вывод получен не из разложения сил, а из сохранения энергии. Ловкость, впрочем, относительна. Существует другой вывод, куда красивее. Он придуман Стевином и даже высечен на его надгробии. Фиг. 4.4 объясняет, почему должно получиться 3/5 кг: цепь не вращается и нижняя ее часть уравновешена сама собой, значит сила тяги пяти звеньев с одной стороны должна уравнять силу тяги трех звеньев с другой (по длине сторон).
Фиг. 4.4. Это выгравировано на надгробии Стевина.
Глядя на диаграмму, становится очевидно, что W=3/5 кг. (Неплохо было бы, если бы когда-нибудь что-нибудь подобное высекли и на вашем надгробном камне.)
А вот задача посложнее: домкрат, показанный на фиг. 4.5.
Фиг. 4.5. Домкрат.
Посмотрим, как в таком случае применять этот принцип. Для вращения домкрата служит ручка длиной 1 м, а нарезка винта имеет 4 витка на 1 см. Какую силу нужно приложить к ручке, чтобы поднять 1 т? Желая поднять 1 т на 1 см, мы должны обойти домкрат четырежды, каждый раз делая по 6,28 м (2πr), а всего 25,12 м. Используя различные блоки и т. п., мы действительно можем поднять 1 т с помощью неизвестного груза W, приложенного к концу ручки. Ясно, что W равно примерно 400 г. Это — следствие сохранения энергии.
И еще более сложный пример (фиг. 4.6).
Фиг. 4.6. Нагруженный стержень, подпертый с одного конца.
Подопрем один конец стержня (или рейки) длиной 8 м. Посредине рейки поместим груз весом 60 кг, а в 2 м от подпорки — груз весом 100 кг. Сколько надо силы, чтобы удержать рейку за другой конец в равновесии, пренебрегая ее весом? Пусть мы прикрепили блок и перекинули через него веревку, привязав ее к концу рейки. Каков же должен быть вес W, уравновешивающий стержень? Представим, что вес опустился на произвольное расстояние (для простоты пусть это будет 4 см); на сколько тогда поднимутся наши два груза? Середина рейки на 2 см, а второй груз (он лежит на четверти длины рейки) на 1 см. Значит, в согласии с правилом, что сумма весов, умноженных на высоты, не меняется, мы должны написать: вес W на 4 см вниз плюс 60 кг на 2 см вверх плюс 100 кг на 1 см вверх, что после сложения должно дать нуль:
(4.5)
Выходит, чтобы удержать рейку, хватит 55 кг. Таким же путем можно разработать законы «равновесия» — статику сложных мостовых сооружений и т. д. Такой подход именуют принципом виртуальной (т. е. возможной или воображаемой) работы, потому что для его применения мы обязаны представить себе, что наша система чуть сдвинулась, даже если она в действительности не двигалась или вовсе неспособна двигаться. Мы используем небольшие воображаемые движения, чтобы применить принцип сохранения энергии.
§ 3. Кинетическая энергия
Чтобы рассказать о другом виде энергии, рассмотрим маятник (фиг. 4.7).
Фиг. 4.7. Маятник.
Отведем его в сторону и затем отпустим. Он начнет качаться взад и вперед. Двигаясь от края к середине, он теряет высоту. Куда же девается потенциальная энергия? Когда он опускается до самого низа, энергия тяготения пропадает, однако он вновь взбирается вверх. Выходит, что энергия тяготения должна превращаться в другую форму. Ясно, что способность взбираться наверх остается у маятника благодаря тому, что он движется; значит, в наинизшей точке качания энергия тяготения переходит в другой вид энергии.
Мы должны получить формулу для энергии движения. Вспоминая наши рассуждения о необратимых машинах, мы легко поймем, что, двигаясь мимо наинизшей точки, маятник должен обладать некоторым количеством энергии, которая позволит ему подняться на определенную высоту, и при этом независимо от механизма подъема или пути подъема. Возникает формула, выражающая равноценность обоих видов энергии, подобная той, которую писала мама, подсчитывая кубики. Получается другая форма представления энергии. Легко понять, какой она должна быть. Кинетическая энергия внизу равна весу, умноженному на высоту, на которую этот вес может подняться из-за своей скорости: к. э.=WH.
Нам нужна формула, предсказывающая высоту подъема по быстроте движения тела. Если мы толкнем что-нибудь с определенной скоростью, скажем, прямо вверх, то это тело достигнет определенной высоты; мы не знаем пока, какова эта высота, но нам ясно, что она зависит от скорости и что она войдет в нужную нам формулу. Значит, чтобы найти формулу для кинетической энергии тела, движущегося со скоростью V, нужно вычислить высоту, до которой она может добраться, и умножить на тяжесть тела. В одной из следующих глав мы убедимся, что получается
(4.6)
Конечно, тот факт, что движение обладает энергией, никак не связан с полем тяготения, в котором находится тело. Неважно, откуда явилось движение. Это общая формула для любых скоростей. Кстати, и (4.3) и (4.6) — формулы приближенные; первая становится неправильной на больших высотах (настолько больших, что тяжесть тела ослабляется), а вторая — на больших скоростях (настолько больших, что требуются релятивистские поправки). Однако, когда мы вводим точные формулы для энергии, закон сохранения энергии опять соблюдается.
§ 4. Прочие формы энергии
В таком вот роде можно и дальше показывать существование энергии в разных формах. Отметим, во-первых, упругую энергию. Растягивая пружину, мы должны совершить какую-то работу, ведь растянутая пружина способна поднять груз. После растяжения она получает возможность выполнить работу. Если бы мы теперь составили сумму произведений весов на высоты, то она больше не сошлась бы, и нам пришлось бы в нее что-то вставить, чтобы учесть напряженность пружинки. Упругая энергия — это и есть формула растянутой пружины. Сколько же в ней энергии?
Когда вы отпускаете пружину, то упругая энергия при переходе пружины через точку равновесия обращается в энергию кинетическую; и далее все время совершаются переходы от сжатия и растяжения пружины к кинетической энергии движения (в переходы эти замешиваются еще изменения энергии тяготения, но если это нам мешает, то можно пружину не подвешивать, а положить). И так продолжается до тех пор, пока потери энергии... Постойте! Выходит, мы все время жульничали: то совершали обвес, чтобы рычаг наклонился, то говорили, что машины обратимы, то уверяли, что они будут работать вечно. А машина в конечном счете останавливается. Где же теперь, когда пружина перестала сжиматься-разжиматься, находится энергия? Она перешла в новую форму энергии — тепло.
В пружине или рычаге имеются кристаллы, состоящие из множества атомов; и при сборке частей машины требуется особая точность и тщательность, чтобы в работе машины ни один из атомов не сдвинулся со своего места, не поколебался. Нужно быть очень осторожным. Ведь обычно, когда машина вертится, то и дело происходят какие-то удары, покачивания, вызванные неровностями материала, и атомы начинают дрожать. Так теряются маленькие доли энергии; по мере того как движение замедляется, все сильнее становятся случайные, неожиданные дрожания атомов вещества машины. Конечно, это все еще кинетическая энергия, но не связанная с видимым движением.
Позвольте, какая кинетическая энергия? Что за сказка? Откуда известно, что это все еще кинетическая энергия? Оказывается, термометр способен обнаружить, что пружина или рычаг нагреваются, т. е. что и впрямь происходит определенный прирост кинетической энергии. Мы ее называем тепловой, а сами помним, что никакая это не новая форма энергии, а всего лишь кинетическая, но внутреннего движения. (Одна из трудностей всех опытов с большим количеством вещества в том и состоит, что невозможно взаправду показать сохраняемость энергии, сделать настоящую обратимую машину; каждый раз, когда поворачивается большой комок вещества, атомы не остаются в прежнем состоянии, в их систему включается некоторое количество случайного движения. Увидеть это нельзя, но измерить термометрами и другими приборами можно.)
Существует еще немало других форм энергии, но мы не можем сейчас описывать их более или менее подробно.
Имеется энергия электрическая, связанная с притяжением и отталкиванием электрических зарядов.
Есть энергия излучения, или энергия света, — одна из форм электрической энергии, ибо свет может быть представлен как колебания электромагнитного поля.
Бывает энергия химическая — энергия, высвобождаемая в химических реакциях. Упругая энергия в некотором роде похожа на химическую; и химическая энергия есть энергия притяжения атомов друг к другу, и упругая энергия тоже. В настоящее время мы это понимаем следующим образом: химическая энергия складывается из двух частей — энергии движения электронов внутри атомов, т. е. из кинетической части, и электрической энергии притяжения электронов к протонам, т. е. из электрической части.
Дальше, бывает ядерная энергия, связанная с расстановкой частиц в ядре; для нее тоже существует формула, хотя основные законы нам и неведомы. Мы знаем, что это не электричество, не тяготение, не чистая химия... А что это такое? А кто его знает! Видимо, это добавочная форма энергии.
И наконец, теория относительности видоизменяет формулу кинетической энергии, так что название это становится условным, сочетая ее с другим понятием: энергией массы. Любой объект обладает энергией уже потому, что он существует. Если электрон и позитрон спокойно стоят рядом, ничем не занимаясь (ни тяготением, ни чем иным), а потом сливаются и исчезают, то освобождается определенная порция энергии излучения, и эту порцию можно подсчитать. Все, что для этого нужно, — это знать массу объекта. Неважно, что это такое — два тела исчезли, определенная энергия появилась. Формулу впервые придумал Эйнштейн: это E=mc2.
Из наших рассуждений ясно, что закон сохранения энергии незаменим при анализе явления; мы уже показали это на ряде примеров, для которых мы не знали всех формул. Владей мы формулами для всех типов энергии, мы могли бы узнавать, не вдаваясь в детали, сколько процессов происходит в таком-то явлении. Оттого законы сохранения столь важны. Встает естественный вопрос: какие еще есть в физике законы сохранения.
Существуют еще два закона, сходных с законом сохранения энергии. Один называется сохранением импульса (или количества движения). Другой — сохранением момента количества движения. Позже мы подробней познакомимся с ними.
В конечном счете мы не понимаем законов сохранения достаточно глубоко. Нам непонятно сохранение энергии. Мы не можем представить себе энергию как некоторое количество неделимых порций. Вы, вероятно, слышали, что фотоны вылетают порциями и что энергия их равна постоянной Планка, умноженной на частоту. Это правда, но так как частота света может быть любой, то нет никакого закона, по которому энергия обязана иметь некоторую определенную величину. Это уже не кубики Монтигомо Ястребиного Когтя: любые количества энергии допустимы, по крайней мере в настоящее время. Для нас энергия — это не то, что можно пересчитать, а всего лишь математическая величина, абстракция, — обстоятельство довольно странное. В квантовой механике выявляется, что сохраняемость энергии тесно увязана с другим важным свойством мира — с независимостью от абсолютного времени. Мы можем поставить опыт в некоторый момент, а потом еще раз в другой момент; он будет протекать одинаково. Абсолютно ли верно это утверждение или нет — мы не знаем. Но если мы примем, что оно абсолютно верно, и добавим принципы квантовой механики, то из этого можно вывести принцип сохранения энергии. Это довольно тонкая и интересная вещь, которую нелегко пояснить. Другие законы сохранения также связаны между собой: сохранение импульса в квантовой механике — с утверждением, что неважно, где происходит опыт, его итог от этого не меняется. И подобно тому, как независимость от места связана с сохранением импульса, а независимость от времени — с сохранением энергии, точно так же от поворота наших приборов тоже ничего не должно изменяться; независимость от ориентации в пространстве имеет отношение к сохранению момента количества движения.
Кроме этого, существуют еще три закона сохранения; насколько ныне нам известно, они точные и понять их намного легче, так как по своей природе они близки к подсчету кубиков. Первый из них — сохранение заряда; он просто означает, что если подсчитать, сколько есть положительных зарядов, и из этого вычесть количество отрицательных, то число это никогда не изменится. Вы можете избавиться от положительных вместе с отрицательными, но не создадите никогда чистого избытка одних над другими. И прочие два закона похожи на этот. Один называют сохранением числа барионов. Имеется некоторое количество удивительных частиц (примеры: нейтрон и протон), называемых барионами. В любой реакции, где бы в природе она ни происходила, если подсчитать, сколько барионов было в начале процесса (считая антибарион за —1 барион), то в конце их число окажется тем же. Другой закон — сохранение числа лептонов. Группа частиц, называемых лептонами, включает электрон, мюон и нейтрино. Антиэлектрон, т. е. позитрон, считается за —1 лептон. Подсчет общего числа лептонов в реакции обнаруживает, что на входе и на выходе реакции это число одинаково, по крайней мере насколько нам сейчас известно.
Вот вам шесть законов сохранения: три замысловатых, связанных с пространством и временем, а три простых, связанных с обычным счетом.
К сохраняемости энергии доступность и полезность энергии не имеет никакого отношения. В атомах морской воды немало энергии движения, так как температура моря довольно высока, но нет никакой возможности направить эту энергию в определенное русло, не отобрав ее откуда-нибудь еще. Иначе говоря, хотя нам известен тот факт, что энергия сохраняется, но не так-то просто сохранить энергию, пригодную для человека. Законы, управляющие количеством пригодной для человека энергии, называются законами термодинамики и включают понятие, называемое энтропией необратимых термодинамических процессов.
Наконец, остановимся на том, откуда мы сегодня можем получать необходимый запас энергии. Энергией нас снабжают Солнце и дожди, уголь, уран и водород. Впрочем, и дожди, и уголь в конце концов без Солнца были бы невозможны. Хотя энергия сохраняется, природа, по всей видимости, этим ничуть не интересуется; она освобождает из Солнца множество энергии, но только одна двухмиллиардная часть ее падает на Землю. Природа сохраняет энергию, но в действительности о ней не заботится, расточая ее направо и налево. Мы уже получаем энергию из урана, мы можем получать ее и из водорода, но пока это получение связано со взрывами, с большой опасностью. Если бы мы смогли научиться управлять термоядерными реакциями, то энергия, которую можно получать, тратя по 10 л воды в секунду, равнялась бы всей электроэнергии, производимой сейчас за это время в Соединенных Штатах. Шестисот литров речной воды в минуту хватило бы, чтобы снабжать энергией всю страну! Именно физикам придется придумать, как избавить нас от нужды в энергии. И это, бесспорно, достижимо.
Глава 5 ВРЕМЯ И РАССТОЯНИЕ
§ 1. Движение
В этой главе мы рассмотрим понятия время и расстояние. Мы уже говорили, что физика, как, впрочем, любая другая наука, основывается на наблюдениях. Можно даже сказать, что развитие физических наук до их современного уровня в огромной степени зависело от фактов, основанных на количественных наблюдениях. Только с помощью количественных наблюдений можно получить количественные соотношения — сердце современной физики.
Многие считают, что физика берет свое начало с опыта, проведенного Галилеем 350 лет назад, а сам Галилей является первым физиком. До этого времени изучение движения было чисто философским и основывалось на доводах, которые были плодом фантазии. Большинство этих доводов были придуманы Аристотелем и другими греческими философами и рассматривались как «доказанные». Но Галилей был скептиком и поставил следующий опыт: по наклонной плоскости он пускал шар и наблюдал за его движением (фиг. 5.1).
Фиг. 5.1. Шарик катится по наклонной плоскости.
Галилей не просто смотрел, как катится шар, а измерял то расстояние, которое прошел шар, и определял время, в течение которого шар проходил это расстояние. Способ измерения расстояний был хорошо известен еще задолго до Галилея, однако точного способа измерения времени, особенно коротких интервалов, не было. Хотя впоследствии Галилей изобрел более совершенные часы (отнюдь не похожие на современные), но в своих первых опытах для отсчета равных промежутков времени он использовал собственный пульс. Давайте сделаем то же самое.
Будем отсчитывать удары пульса в то время, пока шарик катится вниз: «Один... два... три... четыре... пять... шесть... семь... восемь...». Пусть кто-нибудь отмечает положение шарика на каждый счет. Теперь можно измерить расстояние, которое шарик прошел за один, два, три и т. д. равных интервала времени. Галилей сформулировал результат своих наблюдений следующим образом: если отмечать положения шарика через 1, 2, 3, 4,... единицы времени от начала движения, то окажется, что эти отметки удалены от начального положения пропорционально числам 1, 4, 9,16, ... . Сейчас мы сказали бы, что расстояние пропорционально квадрату времени:
Таким образом, изучение процесса движения (основы современной физики) начинается с вопросов: где и когда?
§ 2. Время
Разберем сначала, что мы понимаем под словом время. Что же это такое? Неплохо было бы найти подходящее определение понятия «время». В толковом словаре Вебстера, например, «время» определяется как «период», а сам «период» — как «время». Однако пользы от этого определения мало. Но и в определении «время — это то, что меняется, когда больше ничего не изменяется» не больше смысла. Быть может, следует признать тот факт, что время — это одно из понятий, которое определить невозможно, и просто сказать, что это нечто известное нам: это то, что отделяет два последовательных события!
Дело, однако, не в том, как дать определение понятия «время», а в том, как его измерить. Один из способов измерить время — это использовать нечто регулярно повторяющееся, нечто периодическое. Например, день. Казалось бы, дни регулярно следуют один за другим. Но, поразмыслив немного, сталкиваешься с вопросом: периодичны ли они? Все ли дни имеют одинаковую длительность? Создается впечатление, что летние дни длиннее зимних. Впрочем, некоторые зимние дни кажутся ужасно длинными, особенно если они скучны. О них обычно говорят: «Ужасно длинный день!»
Однако, по-видимому, все дни в среднем одинаковы. Можно ли проверить, действительно ли они одинаковы и от одного дня до другого, хотя бы в среднем, проходит ли одно и то же время? Для этого необходимо произвести сравнение с каким-то другим периодическим процессом. Давайте посмотрим, как такое сравнение можно, например, провести с помощью песочных часов. С помощью таких часов мы можем создать периодический процесс, если будем стоять возле них день и ночь и переворачивать каждый раз, когда высыпятся последние крупинки песка.
Если затем подсчитать число переворачиваний песочных часов от каждого утра до следующего, то можно обнаружить, что число «часов» (т. е. число переворачиваний) в разные дни различно. Кто же виноват в этом? Может быть, Солнце? Может быть, часы? А может, и то и другое? После некоторых размышлений можно прийти к мысли, что следует считать «часы» не от утра до утра, а от полудня до полудня (полдень — это, конечно, не 12 часов, а момент, когда Солнце находится в наивысшем положении). На этот раз оказывается, что в каждых сутках число «часов» одинаково.
Теперь можно утверждать, что «час» и «сутки» имеют регулярную периодичность, т. е. отмечают последовательные равные интервалы времени, хотя нами и не доказано, что каждый из процессов действительно периодичен. Нас могут спросить: а вдруг есть некое всемогущее существо, которое замедляет течение песка ночью и убыстряет днем? Наш эксперимент, конечно, не может дать ответа на такого рода вопросы. Очевидно лишь то, что периодичность одного процесса согласуется с периодичностью другого. Поэтому при определении понятия «время» мы просто будем исходить из повторения некоторых очевидно периодических событий.
§ 3. Короткие времена
Заметим, что в процессе проверки «воспроизводимости» дней мы нашли метод измерения части дня, т. е. метод измерения меньших промежутков времени. Нельзя ли этот процесс продолжить и научиться измерять еще меньшие промежутки времени?
Галилей предположил, что каждый маятник отклоняется и возвращается назад за равные интервалы времени (если отклонения невелики). Сравнение числа отклонений маятника с «часом» показывает, что это действительно так. Таким способом можно измерять доли «часа». Если для подсчета числа колебаний маятника применить механический счетчик, то мы получим маятниковые часы наших дедов.
Договоримся теперь, что если маятник отклонится 3600 раз в час (и если в сутках 24 часа), то период колебаний такого маятника мы назовем «секундой». Итак, нашу первоначальную единицу «сутки» мы разделили приблизительно на 105 частей. Используя тот же принцип сравнения, можно и секунду разделить на все меньшие и меньшие части. Для этого оказывается более удобным использовать не простой механический, а электрический маятник, называемый осциллятором, период колебаний которого может быть очень малым. В таких электронных осцилляторах роль маятника выполняет электрический ток, который течет то в одном, то в другом направлении.
Давайте представим себе целый ряд таких осцилляторов, что период колебаний каждого последующего в десять раз меньше предыдущего. Это можно проверить путем простого подсчета числа колебаний последующего осциллятора за одно колебание предыдущего; только теперь этот подсчет трудно провести без устройства, расширяющего возможности наблюдения, своеобразного «микроскопа времени». Таким устройством может служить электронно-лучевой осциллограф, на светящемся экране которого строится график зависимости электрического тока (или напряжения) от времени.
Соединяя осциллограф сначала с одним осциллятором, а затем с другим, мы получим на экране графики зависимости тока от времени в одном и в другом осцилляторе (фиг. 5.2).
Фиг. 5.2. Две осциллограммы, снятые с экрана осциллографа. а — при осциллографе, подключенном к одному осциллятору; б — при осциллографе, подключенном к осциллятору, период колебаний которого в десять раз меньше первого.
А теперь нетрудно подсчитать, какое число периодов «быстрого» осциллятора укладывается в одном периоде «медленного».
Современная электроника позволяет создавать осцилляторы с периодами 10-12сек, которые выверяются (калибруются) методом сравнения, подобным вышеописанному, на стандартную единицу времени — секунду. В последние несколько лет в связи с изобретением и усовершенствованием «лазера», или усилителя света, появилась возможность сделать осцилляторы с еще более коротким периодом. Пока еще невозможно калибровать их тем же методом, однако, несомненно, что и это скоро будет достигнуто.
Можно измерять промежутки времени, гораздо более короткие, чем 10-12сек, но для этого используются совершенно другие методы. В сущности используется другое определение понятия «время». Один из таких методов — это измерение расстояния между двумя событиями, происходящими на движущемся объекте. Например, пусть в движущемся автомобиле сначала включают, а затем выключают фары. Если известно, где были включены и выключены фары и какова была скорость автомобиля, то можно вычислить, сколько времени они горели. Для этого нужно расстояние, на протяжении которого горели фары, разделить на скорость автомобиля.
Именно таким методом в последние годы измерялось время жизни π0-мезона. При наблюдении в микроскоп мельчайших следов, оставленных на фотоэмульсии, в которой родился π0-мезон, было обнаружено следующее: π0-мезон, двигаясь со скоростью, близкой к скорости света, прежде чем распасться, проходит в среднем расстояние около 10-7м. Таким образом, время жизни π0-мезона составляет всего лишь 10-16сек! Необходимо подчеркнуть, что здесь было использовано несколько другое определение понятия «время», но, поскольку оно не приводит к каким-либо противоречиям, можно быть уверенным в том, что эти определения в достаточной мере эквивалентны друг другу.
Развивая технику эксперимента, а если необходимо, меняя определение понятия «время», можно обнаружить еще более быстрые физические процессы. Мы, например, можем говорить о периоде вибраций ядра или о времени жизни недавно обнаруженных «странных» резонансов (частиц), которые уже упоминались в гл. 2. Время жизни этих частиц лишь ненамного больше 10-24сек! Приблизительно столько времени требуется свету (который имеет наибольшую скорость распространения), чтобы пройти расстояние, равное диаметру ядра водорода (наименьший из известных объектов).
Что можно сказать о еще более коротких интервалах времени? Имеет ли смысл вообще говорить о них, если невозможно не только измерить, но даже разумно судить о процессах, происходящих в течение столь коротких интервалов? Возможно, нет. Это один из тех вопросов, на которые нет ответа. Может быть, кому-нибудь из вас посчастливится ответить на него в ближайшие 20—30 лет.
§ 4. Большие времена
Рассмотрим теперь промежутки времени, большие «суток». Измерять большие времена легко: нужно просто считать дни, пока не придумаем что-нибудь лучшего. Первое, с чем мы сталкиваемся, это год — вторая естественная периодичность, состоящая приблизительно из 365 дней. Интересно, что в природе существуют естественные счетчики лет в виде годовых колец у деревьев или отложений речного ила. В некоторых случаях можно использовать эти естественные счетчики для определения времени, отделяющего нас от какого-либо отдаленного события в прошлом.
Но, когда невозможно считать годы для очень больших отрезков времени, нужно искать какие-то другие способы измерения. Одним из наиболее эффективных методов является использование в качестве «часов» радиоактивного вещества. Здесь мы сталкиваемся с «регулярностью» иного рода, чем в случае, скажем, маятника. Радиоактивность любого вещества для последовательных равных интервалов времени изменяется в одно и то же число раз. Если начертить график зависимости радиоактивности от времени, то мы получим кривую типа изображенной на фиг. 5.3.
Фиг. 5.3. Уменьшение радиоактивности со временем. Радиоактивность падает в два раза за каждый период полураспада Т.
Мы видим, что если радиоактивность за Т дней (период полураспада) уменьшается вдвое, то за 2Т дней она уменьшится в четыре раза и т. д. Произвольный интервал времени t содержит t/T «периодов полураспада», и, следовательно, количество начального вещества уменьшится в 2 раза.
Если мы знаем, что какой-то материал, например дерево, при своем образовании содержал некоторое количество А радиоактивного вещества, а прямые измерения показывают, что теперь он содержит количество В, то возраст этого материала можно просто вычислить, решив уравнение
А такие случаи, когда мы знаем первоначальное количество радиоактивного вещества, к счастью, существуют. Известно, например, что углекислый газ в воздухе содержит малую долю радиоактивного изотопа С14, период полураспада которого составляет 5000 лет. Количество его благодаря действию космических лучей постоянно пополняется взамен распавшегося. Если мы измеряем полное содержание углерода в каком-то предмете и знаем, что определенная доля этого углерода была первоначально радиоактивным С14, то нам известно и первоначальное количество А и мы можем пользоваться приведенной выше формулой. Если же путем точных измерений установлено, что оставшееся количество С14 соответствует 20 периодам полураспада, то можно сказать, что этот органический предмет жил приблизительно 100 000 лет назад.
Хотелось бы, однако, узнать возраст еще более древних вещей. Это можно сделать, измерив содержание других радиоактивных элементов с большими периодами полураспада. Уран, например, имеет изотоп с периодом полураспада около 109 лет, так что если какой-то материал при своем образовании 109 лет назад содержал уран, то сегодня от него осталась только половина первоначального количества. При своем распаде уран превращается в свинец. Как определить возраст горной породы, которая образовалась много-много лет назад в результате какого-то химического процесса? Свинец по своим химическим свойствам отличается от урана, поэтому они первоначально входили в разные виды горных пород. Если взять такой вид породы, который вначале должен был содержать только уран, то мы обнаружим в нем некоторое количество свинца. Сравнивая доли свинца и урана, можно определить ту часть урана, которая в результате распада превратилась в свинец. Этим методом было установлено, что возраст некоторых горных пород составляет несколько миллиардов лет. Применяя шире этот метод путем сравнения содержания урана и свинца не только в некоторых горных породах, но и в воде океанов, а затем усредняя различные данные по всему земному шару, установили, что нашей планете исполнилось примерно 5,5 миллиарда лет.
Интересно, что возраст метеоритов, падающих на Землю, вычисленный по урановому методу, совпадает с возрастом самой Земли. Более того, оказалось, что и метеориты, и горные породы Земли составлены из одного и того же материала, поэтому существует мнение, что Земля образовалась из пород, «плававших» некогда в «околосолнечном» пространстве.
Некогда, во времена, еще более древние, чем возраст Земли (т. е. 5 миллиардов лет назад), начала свою историю Вселенная. Сейчас считают, что возраст по крайней мере нашей части Вселенной достигает примерно 10—12 миллиардов лет. Нам неизвестно, что было до этого. В сущности опять можно спросить: «А есть ли смысл говорить о том, что было до этого? И имеет ли смысл само понятие «время» до «рождения» Вселенной?»
§ 5. Единицы и стандарты времени
Мы уже говорили, что счет времени удобно вести в каких-то стандартных единицах, скажем в днях или секундах, и измерять длительности в количествах этой единицы или ее долях. Но что же выбрать за основную стандартную единицу? Можно ли, например, принять за отправную единицу человеческий пульс? Очевидно, нет. Уж очень непостоянна эта единица. Лучше обстоит дело с часами. Двое часов согласуются гораздо лучше, чем пульс. Вы скажете: ладно, давайте возьмем часы. Но чьи? Существует предание об одном швейцарском мальчике, которому хотелось, чтобы все часы в его городе отзванивали полдень и в одно и то же время. Он ходил по городу и доказывал всем, насколько это важно. Каждый считал, что это действительно было бы чудесно, если бы все другие часы в городе звонили полдень по его часам! В самом деле, очень трудно решить, чьи же часы мы должны выбрать в качестве стандарта. К счастью, существуют часы, которые признают все, — это наша Земля. Долгое время в качестве стандарта выбирался период вращения Земли. Однако по мере того, как измерения становились все более точными, обнаруживалось, что вращение Земли не строго периодично, если сравнивать его с лучшими часами. А этим «лучшим часам» можно доверять, ибо они согласуются друг с другом. Сейчас известно, что по разным причинам одни дни оказываются длиннее других и, кроме того, средний период вращения Земли на протяжении столетий несколько удлиняется.
Вплоть до самого последнего времени не было найдено ничего более точного, чем вращение Земли, и поэтому все часы сверялись с длиной астрономических суток, а секунда определялась как 1/86 400 часть средних суток. Однако сейчас мы научились работать с некоторыми естественными осцилляторами, которые являются более точными стандартами времени, чем вращение Земли. Это так называемые «атомные часы». В основе их лежат колебания атомов, период которых нечувствителен к температуре и другим внешним воздействиям. Эти часы позволяют измерять время с точностью, лучшей 10-7%. В последние два года профессор Гарвардского университета Норман Рамзей спроектировал и построил улучшенные атомные часы, работающие на колебаниях атомов водорода. Он считает, что эти часы могут быть еще в сто раз более точными. Сейчас ведутся измерения, которые покажут, насколько он прав.
А поскольку оказалось возможным создать часы гораздо более точные, чем астрономические, то ученые договариваются определять единицу времени с помощью новых стандартов — атомных часов[5].
§ 6. Большие расстояния
Вернемся теперь к вопросу о расстоянии. Как далеко отстоят от нас окружающие предметы и как велики они? Всем известно, что для измерения расстояния нужно взять какую-то единицу длины и считать, сколько этих единиц укладывается на данном отрезке. Но как измерить те предметы, которые меньше единицы длины? Как подразделить выбранную единицу длины? А точно так же, как и время: мы берем меньшую единицу длины и считаем, сколько таких единиц укладывается в большей. Таким методом мы сможем измерять все меньшие и меньшие длины.
Однако под расстоянием мы понимаем не только то, что можно измерить метром. Как, например, измерить метром расстояние между вершинами двух гор? Здесь на помощь приходит уже другой метод измерения расстояний — триангуляция. Хотя это означает использование другого определения понятия «расстояние», но в тех случаях, когда есть возможность применить оба метода, они дают одинаковый результат. Пространство все же более или менее соответствует представлениям Евклида, поэтому оба определения эквивалентны. Ну, а раз они согласуются на Земле, то мы более уверены в законности применения триангуляции и для больших расстояний. Этим методом была измерена, например, высота первого спутника (фиг. 5.4).
Фиг. 5.4. Определение высоты искусственного спутника методом триангуляции.
Она оказалась равной приблизительно 5·105 м. При большей тщательности измерений тем же самым методом определялось расстояние до Луны. Направления двух телескопов в различных точках Земли дают два необходимых угла. Оказалось, что Луна удалена от нас на расстояние 4·108 м. Однако для Солнца таких измерений провести нельзя, по крайней мере до сих пор никому не удавалось. Дело в том, что точность, с которой можно сфокусировать телескоп на данную точку Солнца и с которой можно измерить углы, не достаточна для вычисления расстояния до Солнца. Как же все-таки определить его? Необходимо как-то расширить принцип триангуляции. Астрономические наблюдения позволяют измерить относительное расстояние между планетами и Солнцем и определить их относительное расположение. Таким образом, мы получаем план солнечной системы в неизвестном масштабе. Чтобы определить масштаб, требуется только абсолютное расстояние, которое было найдено многими различными способами. Один из способов, считавшийся до самого последнего времени наиболее точным, заключается в определении расстояния от Земли до Эроса — малой планеты, которая по временам проходит недалеко от Земли. С помощью триангуляции можно определить расстояние до этого небольшого объекта и получить необходимый масштаб. Зная относительные расстояния, можно определить, например, все абсолютные расстояния от Земли до Солнца или до планеты Плутон.
В последний год достигнуты большие успехи в определении масштаба солнечной системы. В Лаборатории ракетных двигателей с помощью прямой радиолокационной связи были проведены очень точные измерения расстояния от Земли до Венеры. Здесь мы имеем дело еще с одним определением понятия «расстояние». Нам известна скорость распространения света (а стало быть, и скорость распространения радиоволн), и мы предполагаем, что эта скорость постоянна на всем протяжении между Землей и Венерой. Послав радиоволну по направлению к Венере, мы считаем время до прихода обратно отраженной волны. А зная время и скорость, мы получаем расстояние.
А как измерить расстояние до еще более отдаленных объектов, например до звезд? К счастью, здесь снова можно возвратиться к нашему методу триангуляции, ибо движение Земли вокруг Солнца позволяет измерить расстояние до объектов, находящихся вне солнечной системы. Если мы направим телескоп на некую звезду один раз зимой, а другой раз летом (фиг. 5.5), то можно надеяться достаточно точно измерить углы и определить расстояние до этой звезды.
Фиг. 5.5. Определение расстояния до ближайшей звезды методом триангуляции. В качестве базы используется диаметр орбиты Земли.
Но что делать, если звезда находится настолько далеко от нас, что уже невозможно пользоваться методом триангуляции? Астрономы всегда изобретают все новые и новые способы определения расстояний. Так, они научились определять размер и яркость звезд по их цвету. Оказалось, что цвет и истинная яркость многих близлежащих звезд, расстояние до которых определялось методом триангуляции, в большинстве случаев связаны между собой гладкой зависимостью. Если теперь измерить цвет отдаленной звезды, то по этой зависимости можно определить ее истинную яркость, а измеряя видимую яркость звезды (вернее, по тому, насколько звезда нам кажется тусклой), можно вычислить расстояние до нее. (Для данной истинной яркости видимая яркость уменьшается как квадрат расстояния.) Правильность этого метода нашла неожиданное подтверждение в результатах измерений, проведенных для группы звезд, известных под названием «шарового скопления». Фотография этой группы звезд приведена на фиг. 5.6.
Фиг. 5.6. Скопление звезд вблизи центра нашей Галактики, удаленное от нас на расстояние 30 000 световых лет, или около 3·1020 м.
Достаточно взглянуть на фотографию, чтобы убедиться, что все эти звезды расположены в одном месте. Тот же результат получается и с помощью метода сравнения цвета и яркости.
Изучение многих шаровых скоплений дает еще одну важную информацию. Оказалось, что существует участок неба с большой концентрацией таких шаровых скоплений, причем большинство из них находится на одном и том же расстоянии от нас. Сравнивая эти данные с некоторыми другими, мы приходим к заключению, что эти скопления являются центром нашей Галактики. Таким образом мы определяем, что расстояние до центра Галактики составляет приблизительно 1020 м.
Данные о размере нашей Галактики дают ключ к определению еще больших межгалактических расстояний. На фиг. 5.7 приведена фотография галактики, которая по форме очень похожа на нашу Галактику.
Фиг. 5.7. Спиральная галактика, подобная нашей. Если предположить, что диаметр этой галактики равен диаметру нашей Галактики, та, исходя из ее кажущегося размера, можно подсчитать расстояние; оно оказывается равным 30 миллионам световых лет (3·1023 м).
Возможно, что и размер ее тот же. (Есть еще ряд соображений, согласно которым размеры всех галактик приблизительно одинаковы.) А если это так, то можно узнать расстояние до нее. Мы измеряем угловой размер галактики (т. е. угол, который она занимает на небесном своде), знаем ее диаметр, а стало быть, можем вычислить расстояние. Опять триангуляция!
Недавно с помощью гигантского Паломарского телескопа были получены фотографии неимоверно далеких галактик. Одна из этих фотографий приведена на фиг. 5.8.
Фиг. 5.8. Наиболее удаленный от нас объект ЗС295 в созвездии Волопаса (указан стрелкой), который измерялся в 1960 г. с помощью 200-дюймового телескопа.
Сейчас полагают, что расстояние до некоторых из них приблизительно равно половине размера Вселенной (1026 м) — наибольшего расстояния, которое можно себе представить!
§ 7. Малые расстояния
Обратимся теперь к малым расстояниям. Подразделить метр просто. Без особых трудностей можно разделить его на тысячу равных частей. Таким же путем, хотя и несколько сложнее (используя хороший микроскоп), можно разделить миллиметр на тысячу частей и получить микрон (миллионную долю метра). Однако продолжать это деление становится трудно, поскольку невозможно «увидеть» объекты, меньшие, чем длина волны видимого света (около 5·10-7 м).
Все же мы не останавливаемся на том, что недоступно глазу. С помощью электронного микроскопа можно получить фотографии, помогающие увидеть и измерить еще меньшие объекты — вплоть до 10-8м (фиг. 5.9).
Фиг. 5.9. Фотография вирусов, полученная с помощью электронного микроскопа. Видна «большая» сфера, показанная для сравнения: диаметр ее равен 2·10-7 м, или 2000 Å.
А с помощью косвенных измерений (своего рода триангуляции в микроскопическом масштабе) можно измерять все меньшие и меньшие объекты. Сначала из наблюдений отражения света короткой длины волны (рентгеновских лучей) от образца с нанесенными на известном расстоянии метками измеряется длина волны световых колебаний. Затем по картине рассеяния того же света на кристалле можно определить относительное расположение в нем атомов, причем результат хорошо согласуется с данными о расположении атомов, полученными химическим путем. Таким способом определяется диаметр атомов (около 10-10 м).
Дальше в шкале расстояний имеется довольно большая незаполненная «щель» между атомными размерами 10-10 м и в 105 раз меньшими ядерными размерами (около 10-15 м). Для определения ядерных размеров применяются уже совершенно другие методы: измеряется видимая площадь σ, или так называемое эффективное поперечное сечение. Если же мы хотим определить радиус, то пользуемся формулой σ=πr2, поскольку ядра можно приближенно рассматривать как сферические.
Эффективные сечения ядер можно определить, пропуская пучок частиц высокой энергии через тонкую пластинку вещества и измеряя число частиц, не прошедших сквозь нее. Эти высокоэнергетические частицы прорываются сквозь легкое облачко электронов, но при попадании в тяжелое ядро останавливаются или отклоняются. Предположим, что у нас имеется пластинка толщиной 1 см. На такой толщине укладывается приблизительно 108 атомных слоев. Однако ядра настолько малы, что вероятность того, что одно ядро закроет другое, очень незначительна. Можно себе представить, что высокоэнергетическая частица, налетающая на пластинку углерода толщиной 1 см, «видит» приблизительно то, что в сильно увеличенном масштабе показано на фиг. 5.10.
Фиг. 5.10. Воображаемая пластинка углерода толщиной 1 см при сильном увеличении (если бы были видны только ядра атомов).
Вероятность того, что очень малая частица столкнется с ядром, равна отношению площади, занимаемой ядрами (черные точки), к общей площади рисунка. Пусть над областью с площадью А по всей толщине пластинки находится N атомов (разумеется, каждый с одним ядром). Тогда доля площади, закрытая ядрами, будет равна Nσ/А. Пусть теперь число частиц в нашем пучке до пластинки будет равно n1, а после нее равно n2; тогда доля частиц, не прошедших через пластинку, будет (n1— n2)/n1, что должно быть равно доле площади, занимаемой ядрами. Радиус же ядер вычисляется из равенства[6]
Из таких экспериментов мы находим, что радиусы ядер лежат в пределах от 1·10-15 до 6·10-16 м. Кстати, единица длины 10-15 м называется ферми в честь Энрико Ферми (1901—1958).
Что можно ожидать в области еще меньших расстояний? Можно ли их измерять? На этот вопрос пока еще нет ответа. Может быть, именно здесь, в каком-то изменении понятия пространства или измерения на малых расстояниях, кроется разгадка тайны ядерных сил.
Несколько слов о стандарте длины. Разумно в качестве стандарта использовать какую-то естественную единицу длины, например радиус Земли или некоторую его долю. Именно таким образом возник метр. Первоначально он определялся как (π/2)·10-7 доля радиуса Земли. Однако такое определение нельзя считать ни особенно точным, ни удобным. Поэтому в течение долгого времени по международному соглашению в качестве эталона метра принималась длина между двумя метками, сделанными на особом брусе, который хранится в специальной лаборатории во Франции. Только много позднее поняли, что и такое определение метра не столь уж точно, как это необходимо, и не так уж универсально и постоянно, как этого хотелось бы. Поэтому сейчас принят новый стандарт длины как некоторое заранее установленное число длин волн определенной спектральной линии.
* * *
Результаты измерения расстояний и времени зависят от наблюдателя. Два наблюдателя, движущиеся друг относительно друга, измеряя один и тот же предмет или длительность одного и того же процесса, получат разные значения, хотя, казалось бы, мерили одно и то же. Расстояния и интервалы времени в зависимости от системы координат (т. е. системы отсчета), в которой производят измерения, имеют различную величину. В последующих главах мы будем более подробно разбирать этот вопрос.
Законы природы не позволяют выполнять абсолютно точные измерения расстояний или интервалов времени. Мы уже упоминали ранее, что ошибка в определении положения предмета не может быть меньше, чем
где h — малая величина, называемая «постоянной Планка», а Δр — ошибка в измерении импульса (массы, умноженной на скорость) этого предмета. Как уже говорилось, эта неопределенность в измерении положения связана с волновой природой частиц.
Относительность пространства и времени приводит к тому, что измерения интервалов времени также не могут быть точнее, чем
где ΔЕ — ошибка в измерении энергии того процесса, продолжительностью которого мы интересуемся. Чтобы знать более точно, когда что-то произошло, мы вынуждены довольствоваться тем, что меньше знаем, что же именно произошло, поскольку наши знания об энергии, участвующей в процессе, будут менее точными. Эта неопределенность времени, так же как и неопределенность положения, связана с волновой природой вещества.
Глава 6 ВЕРОЯТНОСТЬ
Истинная логика нашего мира — это подсчет вероятностей.
Джемс Кларк Максвелл§ 1. Вероятность и правдоподобие
«Вероятность», или «шанс», — это слово вы слышите почти ежедневно. Вот по радио передают прогноз погоды на завтра: «Вероятно, будет дождь». Вы можете сказать: «У меня мало шансов дожить до ста лет». Ученые тоже часто употребляют эти слова. Сейсмолога интересует вопрос: какова вероятность того, что в следующем году в Южной Калифорнии произойдет землетрясение такой-то силы? Физик может спросить: с какой вероятностью этот счетчик Гейгера зарегистрирует двадцать импульсов в последующие десять секунд? Дипломата или государственного деятеля волнует вопрос: каковы шансы этого кандидата быть избранным президентом? Ну, а вас, конечно, интересует: есть ли шансы что-либо понять в этой главе?
Под вероятностью мы понимаем что-то вроде предположения или догадки. Но почему и когда мы гадаем? Это делается тогда, когда мы хотим вынести какое-то заключение или вывод, но не имеем достаточно информации или знаний, чтобы сделать вполне определенное заключение. Вот и приходится гадать: может быть, так, а может быть, и не так, но больше похоже на то, что именно так. Очень часто мы гадаем, когда нужно принять какое-то решение, например: «Брать ли мне сегодня с собой плащ или не стоит?» «На какую силу землетрясения должен я рассчитывать проектируемое здание?» «Нужно ли мне делать более надежную защиту?» «Следует ли мне менять свою позицию в предстоящих международных переговорах?» «Идти ли мне сегодня на лекцию?»
Иногда мы строим догадки потому, что хотим при ограниченности своих знаний сказать как можно больше о данной ситуации. В сущности ведь любое обобщение носит характер догадки. Любая физическая теория — это своего рода догадка. Но догадки тоже бывают разные: хорошие и плохие, близкие и далекие. Тому, как делать наилучшие догадки, учит нас теория вероятностей. Язык вероятностей позволяет нам количественно говорить о таких ситуациях, когда исход весьма и весьма неопределенен, но о котором все же в среднем можно что-то сказать.
Давайте рассмотрим классический пример с подбрасыванием монеты. Если монета «честная», то мы не можем знать наверняка, какой стороной она упадет. Однако мы предчувствуем, что при большом числе бросаний число выпадений «орла» и «решки» должно быть приблизительно одинаковым. В этом случае говорят: вероятность выпадения «орла» равна половине.
Мы можем говорить о вероятности исхода только тех наблюдений, которые собираемся проделать в будущем. Под вероятностью данного частного результата наблюдения понимается ожидаемая нами наиболее правдоподобная доля исходов с данным результатом при некотором числе повторений наблюдения. Вообразите себе повторяющееся N раз наблюдение, например подбрасывание вверх монеты. Если NА — наша оценка наиболее правдоподобного числа выпадений с результатом А, например выпадений «орла», то под вероятностью Р(А) результата А мы понимаем отношение
(6.1)
Наше определение требует некоторых комментариев. Прежде всего мы говорим о вероятности какого-то события только в том случае, если оно представляет собой возможный результат испытания, которое можно повторить. Но отнюдь не ясно, имеет ли смысл такой вопрос: какова вероятность того, что в этом доме поселилось привидение?
Вы, конечно, можете возразить, что никакая ситуация не может повториться в точности. Это верно. Каждое новое наблюдение должно происходить по крайней мере в другое время или в другом месте. По этому поводу я могу сказать только одно: необходимо, чтобы каждое «повторное» наблюдение казалось нам эквивалентным. Мы должны предполагать по крайней мере, что каждый новый результат наблюдения возник из равноценных начальных условий и из одного и того же уровня начальных знаний. Последнее особенно важно. (Если вы заглянули в карты противника, то, конечно, ваши прогнозы о шансах на выигрыш будут совсем другими, чем если бы вы играли честно!)
Хочу отметить, что я не собираюсь рассматривать значения N и NА в (6.1) только как результат каких-то действительных наблюдений. Число NА — это просто наилучшая оценка того, что могло бы произойти при воображаемых наблюдениях. Поэтому вероятность зависит от наших знаний и способностей быть пророком, в сущности от нашего здравого смысла! К счастью, здравый смысл не столь уже субъективен, как это кажется на первый взгляд. Здравым смыслом обладают многие люди, и их суждения о степени правдоподобия того или иного события в большинстве случаев совпадают. Однако вероятность все же не является «абсолютным» числом. Поскольку в каком-то смысле она зависит от степени нашего невежества, постольку с изменением наших знаний она может меняться.
Отмечу еще одну «субъективную» сторону нашего определения вероятности. Мы говорили, что NА — это «наша оценка наиболее вероятного числа случаев». При этом, конечно, мы не надеялись, что число нужных нам случаев будет в точности равно NА, но оно должно быть где-то близко к NА; это число более вероятно, чем любое другое. Если подбрасывать монету вверх 30 раз, то вряд ли можно ожидать, что число выпадений «орла» будет в точности 15; скорее это будет какое-то число около 15, может быть 12, 13, 14, 15, 16 или 17. Однако если необходимо выбрать из этих чисел какое-то одно число, то мы бы решили, что число 15 наиболее правдоподобно. Поэтому мы и пишем, что Р(орел)=0,5.
Но почему все же число 15 более правдоподобно, чем все остальные? Можно рассуждать следующим образом: если наиболее вероятное число выпадений «орла» будет NО, а полное число подбрасываний N, то наиболее вероятное число выпадений «решек» равно N-NО . (Ведь предполагается, что при каждом подбрасывании должны выпасть только либо «орел», либо «решка» и ничего другого!) Но если монета «честная», то нет основания думать, что число выпадений «орла», например, должно быть больше, чем выпадений «решки»? Так что до тех пор, пока у нас нет оснований сомневаться в честности подбрасывающего, мы должны считать, что NР=NО, а следовательно, NР=NО=N/2, или P(орел)=P(решка)=0,5.
Наши рассуждения можно обобщить на любую ситуацию, в которой возможны m различных, но «равноценных» (т. е. равновероятных) результатов наблюдения. Если наблюдение может привести к m различным результатам и ни к чему больше и если у нас нет оснований думать, что один из результатов предпочтительнее остальных, то вероятность каждого частного исхода наблюдения А будет 1/m, т. е. Р(А)=1/m.
Пусть, например, в закрытом ящике находятся семь шаров разного цвета и мы наугад, т. е. не глядя, берем один из них. Вероятность того, что у нас в руке окажется красный шар, равна 1/7. Вероятность того, что мы из колоды в 36 карт вытащим даму пик, равна 1/36, такая же, как и выпадение двух шестерок при бросании двух игральных костей.
* * *
В гл. 5 мы определяли размер ядра с помощью затеняемой им площади или так называемого эффективного сечения. По существу речь шла о вероятностях. Если мы «обстреливаем» быстрыми частицами тонкую пластинку вещества, то имеется некая вероятность, что они пройдут через нее, не задев ядер, однако с некоторой вероятностью они могут попасть в ядро. (Ведь ядра столь малы, что мы не можем видеть их, мы, следовательно, не можем прицелиться, и «стрельба» ведется вслепую.) Если в нашей пластинке имеется n атомов и ядро каждого из них затеняет площадь σ, то полная площадь, затененная ядрами, будет равна nσ. При большом числе N случайных выстрелов мы ожидаем, что число попаданий NC будет так относиться к полному числу выстрелов, как затененная ядрами площадь относится к полной площади пластинки:
(6.2)
Поэтому можно сказать, что вероятность попадания каждой из выстреленных частиц в ядро при прохождении сквозь пластинку будет равна
(6.3)
где n/A — просто число атомов, приходящихся на единицу площади пластинки.
§ 2. Флуктуации
Теперь мне бы хотелось несколько подробнее показать, как можно использовать идею вероятности, чтобы ответить на вопрос: сколько же в самом деле я ожидаю выпадений «орла», если подбрасываю монету N раз? Однако, прежде чем ответить на него, давайте посмотрим, что все-таки дает нам такой «эксперимент». На фиг. 6.1 показаны результаты, полученные в первых трех сериях испытаний по 30 испытаний в каждой.
Фиг. 6.1. Последовательность выпадения «орла» и «решки». Три серии опытов подбрасывания монеты по 30 раз в каждой серии.
Последовательности выпадений «орла» и «решки» показаны в том порядке, как это происходило. В первый раз получилось 11 выпадений «орла», во второй — тоже 11, а в третий — 16. Можно ли на этом основании подозревать, что монета была «нечестной»? Или, может быть, мы ошиблись, приняв 15 за наиболее вероятное число выпадений «орла» в каждой серии испытаний?
Сделаем еще 97 серий, т. е. 100 серий по 30 испытаний в каждой. Результаты их приведены в табл. 6.1[7].
Таблица 6.1. число выпадений «орла» Проведено несколько серий испытаний, по 30 подбрасываний монеты в каждой
Взгляните на числа, приведенные в этой таблице. Вы видите, что большинство результатов «близки» к 15, так как почти все они расположены между 12 и 18. Чтобы лучше прочувствовать эти результаты, нарисуем график их распределения. Для этого подсчитаем число испытаний, в которых получилось k выпадений «орла», и отложим это число вверх над k. В результате получим фиг. 6.2.
Фиг. 6.2. Сводка результатов 100 серий по 30 испытаний е каждой. Вертикальные линии показывают число серий, в которых выпадал k раз «орел». Пунктирная кривая показывает ожидаемое число серий с выпадением k раз «орла», полученное из вычисления вероятностей.
Действительно, в 13 сериях было получено 15 выпадений «орла», то же число серий дало 14 выпадений «орла»; 16 и 17 выпадений получались больше чем 13 раз. Должны ли мы из этого делать вывод, что монетам больше нравится ложиться «орлом» вверх? А может быть, мы неправы в выборе числа 15 как наиболее правдоподобного? Может быть, в действительности более правдоподобно, что за 30 испытаний получается 16 выпадений «орла»? Минуточку терпения! Если мы сложим вместе результаты всех серий, то общее число испытаний будет 3000, а общее число выпадений «орла» в этих испытаниях достигает 1492, так что доля испытаний с выпадением «орла» в результате будет 0,497. Это очень близко к половине, но все же несколько меньше. Нет, мы все-таки не можем предполагать, что вероятность выпадения «орла» больше, чем 0,5! Тот факт, что в отдельных испытаниях «орел» чаще выпадал 16 раз, чем 15, является просто случайным отклонением, или флуктуацией. Мы же по-прежнему ожидаем, что наиболее правдоподобным числом выпадений должно быть 15.
Можно спросить: а какова вероятность того, что в серии из 30 испытаний «орел» выпадет 15 раз или 16, или какое-то другое число раз? Мы говорим, что вероятность выпадения «орла» в серии из одного испытания равна 0,5; соответственно вероятность невыпадения тоже равна 0,5. В серии из двух испытаний возможны четыре исхода: ОО, OP, PO, PP. Так как каждый из них равновероятен, то можно заключить: а) вероятность двух выпадений «орла» равна 1/4; б) вероятность одного выпадения «орла» равна 2/4; в) вероятность невыпадения «орла» равна 1/2. Это происходит потому, что существуют две возможности из четырех равных получить одно выпадение «орла» и только одна возможность получить два выпадения или не получить ни одного.
Рассмотрим теперь серию из трех испытаний. Третье испытание с равной вероятностью может дать либо «орел», либо «решку», поэтому существует только один способ получения трех выпадений «орла»: мы должны получить два выпадения «орла» в двух первых испытаниях и затем выпадение «орла» в последнем. Однако получить два выпадения «орла» можно уже тремя способами: после двух выпадений «орла» может выпасть «решка» и еще два способа — после одного выпадения «орла» в первых двух испытаниях выпадет «орел» в третьем. Так что число равновероятных способов получить 3, 2, 1 и 0 выпадений «орла» будет соответственно равно 1, 3, 3 и 1; полное же число всех возможных способов равно 8. Таким образом, получаются следующие вероятности: 1/8, 3/8, 3/8, 1/8.
Эти результаты удобно записать в виде диаграммы (фиг. 6.3).
Фиг. 6.3. Диаграмма, иллюстрирующая число различных возможностей получения 0, 1, 2 и 3 выпадений «орла» в серии из трех испытаний.
Ясно, что эту диаграмму можно продолжить, если мы интересуемся еще большим числом испытаний. На фиг. 6.4 приведена аналогичная диаграмма для шести испытаний.
Фиг. 6.4. Диаграмма, подобная изображенной на фиг. 6.3, для серии из шести испытаний.
Число «способов», соответствующих каждой точке диаграммы, — это просто число различных «путей» (т. е., попросту говоря, последовательность выпадения «орла» и «решки»), которыми можно прийти в эту точку из начальной, не возвращаясь при этом назад, а высота этой точки дает общее число выпадений «орла». Этот набор чисел известен под названием треугольника Паскаля, а сами числа называются биномиальными коэффициентами, поскольку они появляются при разложении выражения (а+b)n. Обычно эти числа на нашей диаграмме обозначаются символом (nk), или Сnk (число сочетаний из n по k), где n — полное число испытаний, а k — число выпадений «орла». Отмечу попутно, что биномиальные коэффициенты можно вычислять по формуле
(6.4)
где символ n!, называемый «n-факториалом», обозначает произведение всех целых чисел от 1 до n, т. е. 1·2·3 ... (n-1)n.
Теперь уже все готово для того, чтобы с помощью выражения (6.1) подсчитать вероятность P(k,n) выпадения k раз «орла» в серии из n испытаний. Полное число всех возможностей будет 2n (поскольку в каждом испытании возможны два исхода), а число равновероятных комбинаций, в которых выпадет «орел», будет (nk), так что
(6.5)
Поскольку P(k,n) — доля тех серий испытаний, в которых выпадение «орла» ожидается k раз, то из ста серий k выпадений «орла» ожидается 100·P(k,n) раз. Пунктирная кривая на фиг. 6.2 проведена как раз через точки функции 100·P(k,30). Видите, мы ожидали получить 15 выпадений «орла» в 14 или 15 сериях испытаний, а получили только в 13. Мы ожидали получить 16 выпадений «орла» в 13 или 14 сериях испытаний, а получили в 16. Но такие флуктуации вполне допускаются «правилами игры».
Использованный здесь метод можно применять и в более общей ситуации, где в каждом единичном испытании возможны только два исхода, которые давайте обозначим через В (выигрыш) и П (проигрыш). Вообще говоря, вероятности В и П в каждом отдельном испытании могут быть разными. Пусть р, например, будет вероятностью результата В. Тогда q (вероятность результата П) должна быть равна 1-p. В серии из n испытаний вероятность того, что результат В получится k раз, равна
(6.6)
Эта функция вероятностей называется биномиальным законом распределения вероятности.
§ 3. Случайные блуждания
Существует еще одна интересная задача, при решении которой не обойтись без понятия вероятности. Это проблема «случайных блужданий». В простейшем варианте эта задача выглядит следующим образом. Вообразите себе игру, в которой игрок, начиная от точки х=0, за каждый ход может продвинуться либо вперед (до точки х), либо назад (до точки -х), причем решение о том, куда ему идти, принимается совершенно случайно, ну, например, с помощью подбрасывания монеты. Как описать результат такого движения? В более общей форме эта задача описывает движение атомов (или других частиц) в газе — так называемое броуновское движение — или образование ошибки при измерениях. Вы увидите, насколько проблема «случайных блужданий» тесно связана с описанным выше опытом с подбрасыванием монеты.
Прежде всего давайте рассмотрим несколько примеров случайных блужданий. Их можно описать «чистым» продвижением DN за N шагов. На фиг. 6.5 показаны три примера путей при случайном блуждании. (При построении их в качестве случайной последовательности решений о том, куда сделать следующий шаг, использовались результаты подбрасывания монеты, приведенные на фиг. 6.1.)
Фиг. 6.5. Три примера случайного блуждания. По горизонтали отложено число шагов N, по вертикали — координата D(N), т. е. чистое расстояние от начальной точки.
Что можно сказать о таком движении? Ну, во-первых, можно спросить: как далеко мы в среднем продвинемся? Нужно ожидать, что среднего продвижения вообще не будет, поскольку мы с равной вероятностью можем идти как вперед, так и назад. Однако чувствуется, что с увеличением N мы все с большей вероятностью можем блуждать где-то все дальше и дальше от начальной точки. Поэтому возникает вопрос: каково среднее абсолютное расстояние, т. е. каково среднее значение |D|? Впрочем, удобнее иметь дело не с |D|, а с D2; эта величина положительна как для положительного, так и для отрицательного движения и поэтому тоже может служить разумной мерой таких случайных блужданий.
Можно показать, что ожидаемая величина DN2 равна просто N — числу сделанных шагов. Кстати, под «ожидаемой величиной» мы понимаем наиболее вероятное значение (угаданное наилучшим образом), о котором можно думать как об ожидаемом среднем значении большого числа повторяющихся процессов блуждания. Эта величина обозначается как <DN2> и называется, кроме того, «средним квадратом расстояния». После одного шага D2 всегда равно +1, поэтому, несомненно, <D12>=1. (За единицу расстояния всюду будет выбираться один шаг, и поэтому я в дальнейшем не буду писать единиц длины).
Ожидаемая величина DN2 для N>1 может быть получена из DN-1. Если после (N-1) шагов мы оказались на расстоянии DN-1, то еще один шаг даст либо DN=DN-1+1, либо DN=DN-1-1. Или для квадратов
(6.7)
Если процесс повторяется большое число раз, то мы ожидаем, что каждая из этих возможностей осуществляется с вероятностью 1/2, так что средняя ожидаемая величина будет просто средним арифметическим этих значений, т. е. ожидаемая величина DN2 будет просто DN2+1. Но какова величина DN-12, вернее, какого значения ее мы ожидаем? Просто, по определению, ясно, что это должно быть «среднее ожидаемое значение» <DN-12>, так что
(6.8)
Если теперь вспомнить, что <D12>=1, то получается очень простой результат:
(6.9)
Отклонение от начального положения можно характеризовать величиной типа расстояния (а не квадрата расстояния); для этого нужно просто извлечь квадратный корень из <DN2> и получить так называемое «среднее квадратичное расстояние» Dск:
(6.10)
Мы уже говорили, что случайные блуждания очень похожи на опыт с подбрасыванием монет, с которого мы начали эту главу. Если представить себе, что каждое продвижение вперед или назад обусловливается выпадением «орла» или «решки», то DN будет просто равно NО-NР, т. е. разности числа выпадений «орла» и «решки». Или поскольку NО-NР=N (где N — полное число подбрасываний), то DN=2NO-N. Вспомните, что раньше мы уже получали выражение для ожидаемого распределения величины NО [она обозначалась тогда через k; см. уравнение (6.5)]. Ну а поскольку N — просто постоянная, то теперь такое же распределение получил ось и для D. (Выпадение каждого «орла» означает невыпадение «решки», поэтому в связи между NО и D появляется множитель 2.) Таким образом, на фиг. 6.2 график представляет одновременно и распределение расстояний, на которые мы можем уйти за 30 случайных шагов k=15 соответствует D=0, а k=16 соответствует D=2 и т. д.).
Отклонение NО от ожидаемой величины N/2 будет равно
(6.11)
откуда для среднего квадратичного отклонения получаем
(6.12)
Вспомним теперь наш результат для Dск. Мы ожидаем, что среднее расстояние, пройденное за 30 шагов, должно быть равно √30=5,5, откуда среднее отклонение k от 15 должно быть 5,5:2=2,8. Заметьте, что средняя полуширина нашей кривой на фиг. 6.2 (т. е. полуширина «колокола» где-то посредине) как раз приблизительно равна 3, что согласуется с этим результатом.
Теперь мы способны рассмотреть вопрос, которого избегали до сих пор. Как узнать, «честна» ли наша монета? Сейчас мы можем, по крайней мере частично, ответить на него. Если монета «честная», то мы ожидаем, что в половине случаев выпадет «орел», т. е.
(6.13)
Одновременно ожидается, что действительное число выпадений «орла» должно отличаться от N/2 на величину порядка √N/2, или, если говорить о доле отклонения, она равна
т. е. чем больше N, тем ближе к половине отношение NO/N.
На фиг. 6.6 отложены числа NO/N для тех подбрасываний монеты, о которых мы говорили раньше.
Фиг. 6.6. Доля выпадений «орла» в некоторой частной последовательности N подбрасываний монеты.
Как видите, при увеличении числа N кривая все ближе и ближе подходит к 0,5. Но, к сожалению, нет никаких гарантий, что для каждой данной серии или комбинации серий наблюдаемое отклонение будет близко к ожидаемому отклонению. Всегда есть конечная вероятность, что произойдет большая флуктуация — появление большого числа выпадений «орла» или «решки», — которая даст произвольно большое отклонение. Единственное, что можно сказать, — это если отклонения близки к ожидаемому 1/2√N (скажем, со множителем 2 или 3), то нет оснований считать монету «поддельной» (или что партнер плутует).
Мы не рассматривали еще случаи, когда для монеты или какого-то другого объекта испытания, подобного монете (в том смысле, что возможны два или несколько достоверно не предсказуемых исхода наблюдения, например камень, который может упасть только на какую-то из двух сторон), имеется достаточно оснований полагать, что вероятности разных исходов не равны. Мы определили вероятность Р(O) как отношение <NO>/N. Но что принять за величину <NO>? Каким образом можно узнать, что ожидается? Во многих случаях самое лучшее, что можно сделать, это подсчитать число выпадений «орла» в большой серии испытаний и взять <NO>=NO(наблюденное). (Как можно ожидать чего-то еще?) При этом, однако, нужно понимать, что различные наблюдатели и различные серии испытаний могут дать другое значение P(О), отличное от нашего. Следует ожидать, однако, что все эти различные ответы не будут расходиться больше чем на 1/2√N [если Р(O) близко к половине]. Физики-экспериментаторы обычно говорят, что «экспериментально найденная» вероятность имеет «ошибку», и записывают это в виде
(6.14)
При такой записи подразумевается, что существует некая «истинная» вероятность, которую в принципе можно подсчитать, но что различные флуктуации приводят к ошибке при экспериментальном ее определении. Однако нет возможности сделать эти рассуждения логически согласованными. Лучше все-таки, чтобы вы поняли, что вероятность в каком-то смысле — вещь субъективная, что она всегда основывается на какой-то неопределенности наших познаний и величина ее колеблется при их изменении.
§ 4. Распределение вероятностей
Давайте вернемся к проблеме случайных блужданий, но теперь уже с некоторым изменением. Пусть в дополнение к случайному выбору направления шага (+ или -) некоторым непредсказуемым образом меняется также и его длина, причем требуется выполнение одного-единственного условия, чтобы длина шага в среднем была равна единице. Эта задача уже больше похожа на тепловое движение молекул в газе. Обозначим длину шага через S, которая, вообще говоря, может быть любой, но наиболее часто будет принимать значения где-то «вблизи» единицы. Для большей определенности давайте положим <S2>=1, или, что эквивалентно, Sск=1. Вывод выражения для <D2> при этом останется тем же, за исключением того, что уравнение (6.8) изменится теперь следующим образом:
(6.15)
Так что, как и прежде,
(6.16)
Каково же в этом случае будет распределение расстояний! Какова, например, вероятность того, что после 30 шагов D окажется равным нулю? Вероятность этого равна нулю! Вообще вероятность любой заданной величины D равна нулю. Действительно, совершенно невероятно, чтобы сумма всех шагов назад (при произвольной длине каждого из них) в точности скомпенсировалась шагами вперед. В этом случае мы уже не можем построить график типа изображенного на фиг. 6.2.
Если же, однако, не требовать, чтобы D было в точности равно, скажем, нулю, или единице, или двум, а вместо этого говорить о вероятности получения D где-то вблизи нуля, или единицы, или двух, то при этом мы можем нарисовать график, подобный приведенному на фиг. 6.2. Назовем Р(х, Δx) вероятностью того, что D будет находиться где-то внутри интервала Δx в окрестности величины х (скажем, где-то между х и х+Δx). Если Δx достаточно мало, то вероятность того, что D попадет в этот интервал, должна быть пропорциональна его ширине, т. е. Δx. Поэтому мы можем утверждать, что
(6.17)
Функция р(х) называется плотностью вероятности.
Вид кривой р(х) зависит как от числа шагов N, так и от распределения шагов по длинам (т. е. от того, какую долю составляют шаги данной длины). К сожалению, я не могу здесь заниматься доказательством этого, а только скажу, что при достаточно большом числе шагов N плотность p(х) одинакова для всех разумных распределений шагов по длинам и зависит лишь от самого N. На фиг. 6.7 показаны три графика р(х) для различных N.
Фиг. 6.7. Плотность вероятности оказаться при случайном блуждании через N шагов на расстоянии D. D измеряется в единицах средней квадратичной длины шага.
Заметьте, что «полуширины» этих кривых, как это и должно быть по нашим предыдущим расчетам, приблизительно равны √N.
Вы, вероятно, заметили также, что величина р(х) вблизи нуля обратно пропорциональна √N. Это происходит потому, что все кривые по форме очень похожи, только одни «размазаны» больше, а другие — меньше, и, кроме того, площади, ограниченные каждой кривой и осью х, должны быть равны. Действительно, ведь р(х)Δx; это вероятность того, что D находится где-то внутри интервала Δx; (Δx мало). Как определить вероятность того, что D находится где-то между x1 и х2? Для этого разобьем интервал между x1 и х2 на узкие полоски шириной Δx; (фиг. 6.8) и вычислим сумму членов р(x)Δx для каждой такой полоски.
Фиг. 6.8. Вероятность [заштрихованная область под кривой р(х)] того, что при случайном блуждании пройденное расстояние D окажется между x1 и х2.
Геометрически эта вероятность [запишем ее в виде Р(x1<D<х2)] равна площади заштрихованной области на фиг. 6.8. При этом чем уже будут наши полоски, тем точнее результат. Поэтому можно записать
(6.18)
Площадь же ограничения всей кривой просто равна вероятности того, что D принимает какое-то значение между -∞ и +∞. Ясно, что она должна быть равна единице, т. е.
(6.19)
Ну а поскольку ширина кривых на фиг. 6.7 пропорциональна √N, то, чтобы сохранить ту же площадь, их высота должна быть пропорциональна 1/√N.
Плотность вероятности, которую мы только что описали, встречается наиболее часто. Она известна также под названием нормальной, или гауссовой, плотности вероятности и записывается в виде
(6.20)
причем величина σ называется стандартным отклонением. В нашем случае σ=√N или √NSск, если средняя квадратичная длина шага отлична от единицы.
Мы уже говорили о том, что движения молекул или каких-то других частиц в газе похожи на случайные блуждания. Представьте себе, что мы открыли в комнате пузырек с духами или каким-то другим органическим веществом. Тотчас же молекулы его начнут испаряться в воздух. Если в комнате есть какие-то воздушные течения, скажем циркуляция воздуха, то они будут переносить с собой пары этого вещества. Но даже в совершенно спокойном воздухе молекулы будут распространяться, пока не проникнут во все уголки комнаты. Это можно определить по запаху или цвету. Если нам известен средний размер «шага» и число шагов в секунду, то можно подсчитать вероятность обнаружения одной или нескольких молекул вещества на некотором расстоянии от пузырька через какой-то промежуток времени. С течением времени число шагов возрастает и газ «расползается» по комнате, подобно нашим кривым на фиг. 6.7. Длина шагов и их частота, как вы узнаете впоследствии, связаны с температурой и давлением воздуха в комнате.
Вы знаете, что давление газа вызывается тем, что молекулы его бомбардируют стенки сосуда. Позднее, когда мы подойдем к количественному описанию этого явления, нам понадобится знать, с какой скоростью движутся молекулы, ударяясь о стенку, поскольку сила их ударов зависит от скорости. Однако говорить о какой-то определенной скорости молекул совершенно невозможно. В этом случае необходимо использовать вероятностное описание. Молекула может иметь любую скорость, но некоторые скорости предпочтительнее других. Все происходящее в газе можно описать, сказав, что вероятность того, что данная молекула движется с какой-то скоростью между v и v+Δv, будет равна p(v)Δv, где р(v) — плотность вероятности, которая зависит от скорости v. Позднее я расскажу, как Максвелл, используя общие понятия и идеи теории вероятности, нашел математическое выражение для функции p(v)[8]. Примерный вид функции p(v) показан на фиг. 6.9.
Фиг. 6.9. Распределение молекул газа по скоростям.
Скорость может иметь любую величину, однако больше шансов за то, что она окажется где-то в окрестности наиболее вероятного или ожидаемого значения <v>.
О кривой, показанной на фиг. 6.9, часто говорят в несколько ином смысле. Если мы возьмем газ, заключенный в каком-то сосуде (скажем, объемом 1л), то окажется, что в нем имеется огромное количество молекул (N≈1022). Поскольку р(v)Δv — вероятность того, что первая попавшаяся молекула будет лететь со скоростью, находящейся в интервале Δv, то, по определению, ожидаемое число молекул <ΔN> со скоростью, находящейся в этом же интервале, будет равно
(6.21)
Поэтому Np(v) можно назвать «распределением молекул по скоростям». Площадь под кривой между двумя значениями скоростей v1 и v2 [заштрихованная область на фиг. 6.9 для кривой Np(v)] представляет ожидаемое число молекул со скоростями между v1 и v2. Но в газе, который содержит обычно огромное число молекул, отклонения от ожидаемого значения будут очень малы (порядка 1/√N), поэтому часто мы выбрасываем слово «ожидаемое» и говорим просто: «Число молекул со скоростями между v1 и v2 равно площади заштрихованного участка». Однако нужно все-таки помнить, что речь в таких случаях всегда идет о вероятном числе.
§ 5. Принцип неопределенности
Понятия вероятности оказались очень полезны при описании поведения газа, состоящего из огромного количества молекул. Немыслимо же в самом деле пытаться определить положение и скорость каждой из 1022 молекул! Когда впервые теория вероятности была применена к таким явлениям, то это рассматривалось просто как удобный способ работы в столь сложной обстановке. Однако теперь мы полагаем, что вероятность существенно необходима для описания различных атомных процессов. Согласно квантовой механике, этой математической теории малых частичек, при определении положения частички и ее скорости всегда существует некоторая неопределенность. В лучшем случае мы можем только сказать, что существует какая-то вероятность того, что частица находится вблизи точки х.
Для описания местоположения частицы можно ввести плотность вероятности p1(x), так что p1(x)Δx будет вероятностью того, что частица находится где-то между х и х+Δx. Если положение частицы установлено достаточно хорошо, то примерный вид функции p1(x) может иллюстрировать график, приведенный на фиг. 6.10, а.
Фиг. 6.10. Плотности вероятности координаты, (а) и скорости (b) частицы.
Точно такое же положение и со скоростью частицы: она тоже неизвестна нам точно. С некоторой вероятностью р2(v)Δv частица может двигаться со скоростью, находящейся в интервале между v и v+Δv.
Один из основных результатов квантовой механики состоит в том, что эти две плотности р1(х) и р2(v) не могут быть выбраны независимо в том смысле, что они обе не могут быть сколь угодно узкими. Если мы возьмем «полуширины» кривых p1(x) и р2(v) и обозначим их соответственно [Δx] и [Δv] (см. фиг. 6.10), то природа требует, чтобы произведение этих двух полуширин было не меньше величины h/m, где m — масса частицы, а h — некоторая фундаментальная физическая постоянная, называемая постоянной Планка. Это соотношение записывается следующим образом:
(6.22)
и называется принципом неопределенности Гейзенберга.
Чтобы это соотношение выполнялось, частица должна себя вести очень курьезно. Вы видите, что правая часть соотношения (6.22) постоянна, а это означает, что если мы попытаемся «приколоть» частицу в каком-то определенном месте, то эта попытка окончится тем, что мы не сможем угадать, куда она летит и с какой скоростью. Точно также если мы попытаемся заставить частицу двигаться очень медленно или с какой-то определенной скоростью, то она будет «расплываться», и мы не сможем точно указать, где она находится.
Принцип неопределенности выражает ту неясность, которая должна существовать при любой попытке описания природы. Наиболее точное и полное описание природы должно быть только вероятностным. Однако некоторым физикам такой способ описания приходится не по душе. Им кажется, что о реальном поведении частицы можно говорить только, когда одновременно заданы импульсы и координаты. В свое время на заре развития квантовой механики эта проблема очень сильно волновала Эйнштейна. Он часто качал головой и говорил: «Но ведь не гадает же господь бог «орел — решка», чтобы решить, куда должен двигаться электрон!» Этот вопрос беспокоил его в течение очень долгого времени, и до конца своих дней он, по-видимому, так и не смог примириться с тем фактом, что вероятностное описание природы — это максимум того, на что мы пока способны. Есть физики, которые интуитивно чувствуют, что наш мир можно описать как-то по-другому, что можно исключить эти неопределенности в поведении частиц. Они продолжают работать над этой проблемой, но до сих пор ни один из них не добился сколько-нибудь существенного результата.
Эта присущая миру неопределенность в определении положения частицы является наиболее важной чертой описания структуры атомов. В атоме водорода, например, который состоит из одного протона, образующего ядро, и электрона, находящегося где-то вне его, неопределенность в местонахождении электрона такая же, как и размеры самого атома! Мы не можем поэтому с уверенностью сказать, где, в какой части атома находится наш электрон, и уж, конечно, не может быть и речи ни о каких «орбитах». С уверенностью можно говорить только о вероятности p(r)ΔV обнаружить электрон в элементе объема ΔV на расстоянии r от протона. Квантовая механика позволяет в этом случае вычислять плотности вероятности p(r), которая для невозмущенного атома водорода равна Ae-r^2/α^2. Это — колоколообразная функция наподобие изображенной на фиг. 6.8, причем число а представляет собой характерную величину радиуса, после которого функция очень быстро убывает. Несмотря на то что существует вероятность (хотя и небольшая) обнаружить электрон на большем, чем а, расстоянии от ядра, мы называем эту величину «радиусом атома». Она равна приблизительно 10-10 м.
Если вы хотите как-то представить себе атом водорода, то вообразите этакое «облако», плотность которого пропорциональна плотности вероятности. Пример такого облака показан на фиг. 6.11.
Фиг. 6,11. Воображаемый атом водорода. Плотность («белизна») облачка пропорциональна плотности вероятности обнаружения электрона.
Такая наглядная картинка, пожалуй, наиболее близка к истине, хотя тут же нужно помнить, что это не реальное «электронное облако», а только «облако вероятностей». Где-то внутри него находится электрон, но природа позволяет нам только гадать, где же именно он находится.
В своем стремлении узнать о природе вещей как можно больше современная физика обнаружила, что существуют вещи, познать которые точно ей никогда не удастся. Многому из наших знаний суждено навсегда остаться неопределенным. Нам дано знать только вероятности.
Глава 7 ТЕОРИЯ ТЯГОТЕНИЯ
§ 1. Движение планет
В этой главе речь пойдет об одном из самых далеко идущих обобщений, сделанных когда-либо человеческим разумом. Мы заслуженно восхищаемся умом человека, но неплохо было бы постоять некоторое время в благоговении и перед природой, полностью беспрекословно подчиняющейся такому изящному и такому простому закону — закону тяготения. В чем же заключается этот закон? Каждый объект Вселенной притягивается к любому другому объекту с силой, пропорциональной их массам и обратно пропорциональной квадрату расстояния между ними. Математическая запись этого утверждения такова:
Если к этому добавить, что любое тело реагирует на приложенную к нему силу ускорением в направлении этой силы, по величине обратно пропорциональным массе тела, то способному математику этих сведений достаточно для вывода всех дальнейших следствий.
Но поскольку, как мы предполагаем, вы еще не столь талантливы, вооружим вас не только этими двумя аксиомами. Давайте вместе разберем следствия из них. Мы изложим вкратце историю открытия закона тяготения, остановимся на некоторых выводах из него и на его влиянии на историю, на загадках этого закона и на уточнении его Эйнштейном; мы хотим еще обсудить связь закона тяготения с другими законами физики. Всего этого в одну главу не уложишь, но в надлежащих местах других глав мы снова будем возвращаться к этому.
История начинается с древних; наши предки наблюдали движение планет среди звезд и в конце концов поняли, что планеты движутся вокруг Солнца — факт, заново открытый позже Коперником. Немного больше труда потребовалось, чтобы открыть, как именно они вращаются. В начале XV столетия шли большие дебаты о том, действительно ли планеты обращаются вокруг Солнца или нет. У Тихо Браге на этот счет было свое представление, далекое от того, что думали древние: мысль его состояла в том, что все споры о природе движения планет разрешатся, если достаточно точно измерить положение планет на небе. Если измерения точно установят, как движутся планеты, то не исключено, что из двух точек зрения удастся отобрать одну. Это была неслыханная идея — чтобы открыть что-то, лучше-де проделать тщательные опыты, чем приводить глубокие философские доказательства. Следуя ей, Тихо Браге многие годы изучал положения планет в своей обсерватории на острове Фюн, близ Копенгагена. Он составил объемистые таблицы, впоследствии, после смерти Тихо, изученные математиком Кеплером. Из его данных Кеплер и извлек замечательные, очень красивые и простые законы, управляющие движением планет.
§ 2. Законы Кеплера
Прежде всего Кеплер понял, что все планеты движутся вокруг Солнца по кривой, называемой эллипсом, причем Солнце находится в фокусе эллипса. Эллипс — это не совсем овал, это особым образом точно определяемая кривая. Получить такую кривую можно, воткнув в фокусы по булавке, к которым привязана нить, натянутая карандашом. Выражаясь математически, это — геометрическое место точек, сумма расстояний которых от двух заданных точек (фокусов) постоянна. Или, если угодно, это — окружность, видимая под углом к своей плоскости (фиг. 7.1).
Фиг. 7.1. Эллипс.
Другое наблюдение Кеплера состояло в том, что планеты движутся не с постоянной скоростью: поблизости от Солнца — быстрее, а удаляясь — медленнее. Более точно: пусть планета наблюдается в два последовательных момента времени, скажем на протяжении недели, и к каждому положению планеты проведен радиус-вектор[9]. Дуга орбиты, пройденная планетой за неделю, и два радиус-вектора ограничивают некоторую площадь, заштрихованную на фиг. 7.2.
Фиг. 7.2. Кеплеров закон площадей.
Если такие же наблюдения в течение недели проделать в другое время, когда планета движется по дальнему участку орбиты (т. е. медленнее), то построенная таким же способом фигура окажется по площади равной прежней. Итак, в соответствии со вторым законом орбитальная скорость любой планеты такова, что радиус «заметает» равные площади в равные интервалы времени.
Третий закон был открыт Кеплером гораздо позже; он другого рода, нежели первые два: он уже касается не одной планеты, а связывает между собой разные планеты. Закон утверждает, что если сравнить между собой период обращения и размеры орбиты двух планет, то периоды пропорциональны полуторной степени размеров орбит. Здесь период — это время, нужное планете для того, чтобы обойти всю орбиту; размер же измеряется длиной наибольшего диаметра эллиптической орбиты, ее большой оси. Считая орбиты кругами (чем они почти и являются), можно сказать проще: время одного оборота по кругу пропорционально его диаметру (или радиусу) в степени 3/2. Итак, три закона Кеплера таковы:
1. Все планеты движутся вокруг Солнца по эллипсу, в одном из фокусов которого находится Солнце.
2. Радиус-вектор от Солнца до планеты «заметает» равные площади в равные интервалы времени.
3. Квадраты времен обращения двух планет пропорциональны кубам больших полуосей их орбит: Т2~а3.
§ 3. Развитие динамики
В то время, когда Кеплер открывал эти законы, Галилей изучал законы движения. Он пытался выяснить, что заставляет планеты двигаться. (В те дни одна из предлагавшихся теорий утверждала: планеты движутся потому, что за ними летят невидимые ангелы, которые взмахами своих крыльев гонят планеты вперед. Ныне эта теория, как вы вскоре увидите, несколько видоизменена! По-видимому, чтобы заставить планеты вращаться, невидимые ангелы обязаны витать во всевозможных направлениях и обходиться без крыльев. В остальном эти теории схожи!) И Галилей открыл одно знаменательное свойство движения, достаточное, чтобы понять эти законы. Это — принцип инерции: если при движении тела его ничто не касается, ничто не возмущает, то оно может лететь вечно с постоянной скоростью и по прямой. (А почему это так? Мы этого не знаем, но так уж оно повелось.)
Ньютон затем видоизменил эту мысль, говоря, что единственный способ изменить движение тела — это применить силу. Если тело разгоняется, значит сила была приложена в направлении движения. Если тело повернуло в сторону, то сила была приложена сбоку. Если, например, привязать камень к бечевке и вертеть им по кругу, то, чтобы удержать его на окружности, нужна сила. Мы должны все время натягивать бечевку. Закон состоит в следующем: ускорение, производимое силой, обратно пропорционально массе. Или иначе: сила пропорциональна массе и ускорению. Чем массивнее тело, тем большая сила необходима, чтобы создать нужное ускорение. (Массу можно измерить, привязав к веревке другой камень и вертя им по тому же кругу с той же скоростью. Так можно обнаружить, что массивным телам нужна большая сила.) Из этих рассуждений последовала блестящая мысль: чтобы удержать планету на ее орбите, никакой касательной силы не нужно (ангелам нет нужды летать по касательной), потому что планета и так будет лететь в нужном направлении. Если бы ничего ей не мешало, она бы удалилась по прямой линии. Но истинное движение уклоняется от этой прямой и отклоняется как раз поперек движения, а не по движению. Иными словами, благодаря принципу инерции сила, потребная для управления движением планет вокруг Солнца, это не сила, вращающая их вокруг Солнца, а сила, направленная к Солнцу (ну, а раз сила направлена к Солнцу, то, бесспорно, это и есть тот самый ангел!).
§ 4. Ньютонов закон тяготения
Лучше других поняв природу движения, Ньютон прикинул, что именно Солнце может явиться источником, штаб-квартирой сил, управляющих движением планет. Он убедился (вскоре, быть может, убедимся в этом и мы), что «заметание» равных площадей в равные интервалы времени есть верный знак того, что все отклонения от прямой в точности радиальны, или что закон площадей есть прямое следствие того, что все силы направлены точно к Солнцу.
Кроме того, из анализа третьего закона Кеплера можно вывести, что чем дальше от Солнца планета, тем слабее сила. Из сравнения двух планет на разных расстояниях следует, что силы обратно пропорциональны квадратам относительных расстояний. Сочетая оба закона, Ньютон пришел к заключению, что должна существовать сила, обратная квадрату расстояния и направленная по прямой между Солнцем и планетой.
Будучи человеком, склонным к обобщениям, Ньютон, конечно, предположил, что эта связь применима не только к Солнцу, удерживающему планеты, но что она носит более общий характер. Уже было известно, к примеру, что вокруг Юпитера обращаются луны, подобно тому как Луна ходит вокруг Земли, и Ньютону казалось естественным, что и планеты силой держат свои луны возле себя. Тогда он уже знал о силе, удерживающей нас на Земле, и предположил, что эта сила всеобщая и что все притягивается ко всему.
Тогда он спросил себя: притягивает ли Земля людей так же, как Луну («так же» значит обратно пропорционально квадрату расстояния). Если тело у поверхности Земли падает в первую секунду (из состояния покоя) на 4,9 м, то на сколько падает Луна? Можно возразить, что Луна вообще не падает. Но если бы на Луну не действовала сила, она бы унеслась по прямой линии, а на самом деле она обращается по круговой орбите; следовательно, она падает с того места, где она должна была бы быть, если бы сила на нее не действовала. Зная радиус орбиты Луны (около 384 000 км) и время ее оборота вокруг Земли (около 29 дней), можно подсчитать, сколько она проходит за 1 сек и затем на сколько за это время она падает[10]. Оказывается, что это расстояние примерно равно 1,36 мм. Это хорошо укладывается в закон обратных квадратов, потому что радиус Земли 6370 км, и если на этом расстоянии тела, падая, проходят в первую секунду 4,9 м, то на расстоянии в 384 тыс. км, т. е. в 60 раз дальше от центра Земли, они должны падать на 1/3600 от 4,9 м, или как раз на 1,36 мм. Желая подтвердить свою теорию тяготения подобными расчетами, Ньютон их аккуратно проделал и... получил сильнейшее несовпадение цифр. Он счел, что теория противоречит фактам, и не опубликовал ее. Шестью годами позже новые измерения радиуса Земли показали, что принятое в ту пору астрономами расстояние до Луны было неверным. Услышав об этом, Ньютон провел новый расчет с исправленными цифрами и получил уже превосходное совпадение.
Мысль, что Луна «падает», несколько смущает; почему же она тогда не приближается? Эта мысль настолько интересна, что заслуживает дальнейшего пояснения: Луна «падает» в том смысле, что отклоняется от прямой линии, по которой она бы двигалась, не будь больше никаких сил.
Рассмотрим другой, уже чисто земной пример. Тело, выпущенное из рук у земной поверхности, упадет в первую секунду на 4,9 м. Тело, брошенное горизонтально, также падает на 4,9 м.
На фиг. 7.3 показан прибор, демонстрирующий это явление.
Фиг. 7.3. Прибор для демонстрации независимости вертикальных и горизонтальных движений.
Из горизонтального желоба выскакивает и летит вперед шарик. С той же высоты вертикально падает вниз другой шарик (имеется электрическая схема, выпускающая второй шар как раз в тот момент, когда первый соскальзывает с желоба). Они сталкиваются в воздухе, т. е. это значит, что они за одинаковое время снижаются одинаково. Пуля, выпущенная горизонтально, может пройти за 1 сек даже полкилометра, а вниз за это время она упадет на 4,9 м. Что случится, если пуля будет вылетать из ствола все быстрее? Не забудьте, что поверхность Земли кривая. Пуля может вылететь с такой скоростью, что, упав на 4,9 м, она все равно останется по отношению к Земле на первоначальной высоте. Может ли такое быть? Да; хотя она падает, но и Земля искривляется, вот и получается падение «вокруг» Земли. Надо только узнать, на каком расстоянии поверхность Земли окажется на 4,9 м ниже горизонта. На фиг. 7.4 изображена Земля с ее радиусом (6370 км) и касательный прямой путь пули (в отсутствие сил).
Фиг. 7.4. Ускорение к центру на круговом пути. Из планиметрии x/s=(2R-s)/x≈2R/x, где R — радиус Земли (6370 км); х — расстояние, «пройденное горизонтально» за 1 сек; s — длина пути «падения» за 1 сек (4,9 м).
Остается вспомнить одну из занятных геометрических теорем о том, что длина полухорды, перпендикулярной диаметру, равна среднему геометрическому между длинами отрезков диаметра. Значит, расстояние, пройденное пулей, есть среднее пропорциональное между 4,9 м падения и 12 740 км диаметра Земли, т. е.
Итак, если пуля движется с быстротой 7,9 км/сек, она будет по-прежнему падать каждую секунду на 4,9 м, но никогда не приблизится к поверхности, уходящей от нее вследствие своей кривизны. Так было и с космонавтом Гагариным, который держался на одной высоте, делая примерно 8 км в секунду, т. е. 40 000 км за оборот (на самом деле чуть побольше, так как и летел он повыше).
Любое открытие нового закона полезно лишь тогда, когда из него можно извлечь больше того, что в него было вложено. Ньютон применил второй и третий законы Кеплера для того, чтобы вывести закон тяготения. Что же он предсказал? Первым предсказанием был его анализ движения Луны: движение это увязывалось с падением тел на Земле. Вторым был ответ на вопрос, являются ли орбиты эллипсами. Можно точно рассчитать движение, можно доказать и то, что это эллипс[11]; стало быть, никаких добавочных фактов для доказательства первого закона Кеплера не нужно. Так Ньютон сделал свое первое мощное предсказание.
Закон тяготения объяснил многие явления, прежде непонятные. Например, притяжение Луны вызывает на Земле приливы — явление дотоле таинственное. Люди и раньше догадывались, что Луна притягивает воду под собой и получается прилив, но они не были так умны, как Ньютон, и думали, что должен быть только один прилив в сутки. Считалось, что Луна притягивает воду, вызывая прилив, но так как Земля вращается, то в каждом месте вода должна раз в сутки подняться и опуститься. А на самом деле прилив бывает каждые 12 часов. Была и другая школа передовой мысли; по ее мнению, прилив должен быть и на противоположной стороне Земли, потому что Луна всегда отрывает сушу от воды! Обе эти теории неверны. Настоящее объяснение примерно таково: притяжение Луной суши и воды «уравновешено» в центре. Но притяжение Луной тех масс воды, которые находятся на «лунной» стороне Земли, сильнее, чем среднее притяжение всей Земли, а притяжение масс воды на обратной стороне Земли слабее среднего. Кроме того, вода в отличие от суши может течь. Истинная причина приливов и определяется этими двумя факторами.
Что мы понимаем под словом «уравновешено»? Что именно уравновешивается? А вот что. Если Луна притягивает к себе всю Землю, то почему Земля не падает «вверх» на Луну? По той же причине, почему и Луна не падает на Землю: Земля вращается вокруг точки, которая находится внутри Земли (но не в ее центре). Не Луна вращается вокруг Земли, а обе они вращаются вокруг общего центра и обе падают на него, как показано на фиг. 7.5.
Фиг. 7.5. Система Земля — Луна с приливами.
Это движение вокруг общего центра и уравновешивает падение каждого из двух небесных тел. Так что и Земля тоже движется не по прямой линии, а по круговой орбите. Массы воды на дальней стороне отбрасываются из-за «центробежной силы» сильнее, чем центр Земли, который как раз уравновешен притяжением Луны. Притяжение Луны на дальней стороне слабее и «центробежная сила» больше. В итоге равновесие воды нарушается: она удаляется от центра Земли. На ближней стороне Луна притягивает сильнее, но из-за меньшей величины радиус-вектора оказывается меньше и «центробежная сила», равновесие нарушается в обратную сторону, но по-прежнему от центра Земли. В итоге появляются два приливных «горба».
§ 5. Всемирное тяготение
Что же еще можно понять, зная о существовании тяготения? Всем известно, что Земля круглая. А почему? Ну, это понятно: конечно, благодаря тяготению. Земля круглая просто потому, что между всеми телами существует притяжение, и все, из чего возникла Земля, тоже взаимно притягивалось до тех пор, пока было куда притягиваться! Точнее говоря, Земля не совсем шар; она ведь вращается, и центробежная сила на экваторе противодействует тяготению. Выходит, что Земля должна быть эллипсоидом, и можно даже получить правильную его форму. Итак, из закона тяготения следует, что и Солнце, и Луна, и Земля должны быть (приблизительно) шарами.
Что же еще следует из закона тяготения? Наблюдая за спутниками Юпитера, можно понять все законы их движения вокруг планеты. В этой связи стоит рассказать об одной заминке, которая вышла у закона тяготения с лунами Юпитера. Эти спутники очень подробно изучались Рёмером, и вот он заметил, что временами они нарушают расписание: то опаздывают, то приходят в назначенное место раньше времени (расписание можно составить, понаблюдав за ними достаточно долго и подсчитав по многим оборотам средний период обращения). Более того, он заметил, что опоздания случаются, когда Юпитер удален от Земли, а когда мы от Юпитера близко, то движение лун опережает расписание. Такую вещь очень трудно было уложить в закон тяготения, и ему бы угрожала безвременная кончина, не найдись другого объяснения. Ведь если закону противоречит хотя бы один случай, то закон неверен. Но причина расхождения оказалась очень естественной и красивой: дело просто в том, что необходимо какое-то время, чтобы увидеть луну на нужном месте, ведь свет от нее до нас доходит не мгновенно. Время это небольшое, когда Юпитер находится близко к Земле, но оно затягивается, когда Юпитер удалится от нее. Вот почему кажется, что луны в среднем торопятся или отстают в зависимости от того, близко ли или далеко они находятся от Земли. Это явление доказало, что свет распространяется не мгновенно, и снабдило нас первой оценкой его скорости (было это в 1676 г.).
Если все планеты притягиваются друг к другу, то сила, управляющая, скажем, обращением Юпитера вокруг Солнца, это не совсем сила притяжения к Солнцу; ведь есть еще и притяжение, например, Сатурна. Оно невелико (Солнце куда больше Сатурна), но оно есть, и потому орбита Юпитера не может быть точным эллипсом; она чуть колеблется относительно эллиптической траектории, так что движение несколько усложняется. Были предприняты попытки проанализировать движение Юпитера, Сатурна и Урана на основе закона тяготения. Чтобы узнать, удастся ли мелкие отклонения и неправильности в движении планет полностью объяснить только на основе одного этого закона, рассчитали влияние каждой из них на остальные. Для Юпитера и Сатурна все сошло как следует, но Уран — что за чудеса! — повел себя очень странно. Он двигался не по точному эллипсу, чего, впрочем, и следовало ожидать из-за влияния притяжения Юпитера и Сатурна. Но и с учетом их притяжения движение Урана все равно было неправильным; таким образом, законы тяготения оказались в опасности (возможность эту нельзя было исключить). Двое ученых, Адаме и Леверрье в Англии и Франции, независимо задумались об иной возможности: нет ли там еще одной планеты, тусклой и невидимой, пока еще не открытой. Эта планета, назовем ее N, могла притягивать Уран. Они рассчитали, где эта планета должна находиться, чтобы причинить наблюдаемые возмущения пути Урана. В соответствующие обсерватории они разослали письма, в которых говорилось: «Господа, направьте свои телескопы в такое-то место — и вы увидите там новую планету». Обратят ли на вас внимание или нет, часто зависит от того, с кем вы работаете. На Леверрье обратили внимание, послушались его и обнаружили планету N! Тогда и другая обсерватория поспешила начать наблюдения — и дело увенчалось успехом.
Это открытие показывает, что в солнечной системе законы Ньютона абсолютно верны. Но верны ли они на расстояниях, больших, чем относительно малые расстояния до планет? Во-первых, можно поставить вопрос: притягивают ли звезды друг друга так же, как планеты? Положительные доказательства этого мы находим в двойных звездах. На фиг. 7.6 показана двойная звезда — две близкие звезды (третья звезда нужна, чтобы убедиться, что фотография не перевернута); вторая фотография сделана через несколько лет.
Фиг. 7.6. Система двойной звезды.
Сравнивая с «фиксированной» звездой, мы видим, что ось пары повернулась, т. е. звезды ходят одна вокруг другой. Вращаются ли они в согласии с законами Ньютона? Тщательные замеры относительной позиции двойной звезды Сириус даны на фиг. 7.7.
Фиг. 7.7. Орбита Сириуса В по отношению к Сириусу А.
Получается превосходный эллипс (измерения начаты в 1862 г. и доведены до 1904 г.; с тех пор был сделан еще один оборот). Все сходится с законами Ньютона, кроме того, что Сириус А получается не в фокусе. В чем же дело? А в том, что плоскость эллипса не совпадает с «плоскостью неба». Мы видим Сириус не под прямым углом к плоскости его орбиты, а если на эллипс посмотреть сбоку, то он не перестанет быть эллипсом, но фокус может сместиться. Так что и двойные звезды можно анализировать в согласии с требованиями закона тяготения.
Справедливость закона тяготения на больших дистанциях видна из фиг. 7.8.
Фиг. 7.8. Шаровое звездное скопление.
Нужно быть лишенным воображения, чтобы не увидеть здесь работы тяготения. Здесь показано одно из красивейших небесных зрелищ — шаровое звездное скопление. Каждая точка — это звезда. Нам кажется, будто у центра они набиты вплотную; происходит это из-за слабой чувствительности телескопа; на самом деле промежутки между звездами даже в середине очень велики, а столкновения крайне редки. Больше всего звезд в центре, а по мере удаления к краю их все меньше и меньше. Ясно, что между звездами действует притяжение, т. е. что тяготение существует и на таких гигантских расстояниях (порядка 100 000 диаметров солнечной системы).
Но отправимся дальше и рассмотрим всю галактику (фиг. 7.9).
Фиг. 7.9. Галактика.
Форма ее явственно указывает на стремление ее вещества стянуться. Конечно, доказать, что здесь действует закон обратных квадратов, нельзя; видно только, что и на таком протяжении есть силы, удерживающие всю галактику от развала. Вы можете сказать: «Ладно, все это разумно, но почему же эта штука, галактика, уже не похожа на шар?» Да потому, что она вертится, что у нее есть момент количества движения (запас вращения); если она сожмется, ей некуда будет его девать; ей остается только сплюснуться. (Кстати, вот вам хорошая задача: как образуются рукава галактики? Чем определяется ее форма? Детального ответа на эти вопросы еще нет.) Ясно, что очертания галактики определяются тяготением, хотя сложности ее структуры пока невозможно полностью объяснить. Размеры галактик — около 50 000—100 000 световых лет (Земля находится на расстоянии 81/3 световых минут от Солнца).
Но тяготение проявляется и на больших протяжениях. На фиг. 7.10 показаны какие-то скопления мелких пятен.
Фиг. 7.10. Облако галактик.
Это облако галактик, подобное звездному скоплению. Стало быть, и галактики притягиваются между собой на таких расстояниях, иначе бы они не собрались в «облако». По-видимому, и на расстояниях в десятки миллионов световых лет проявляется тяготение; насколько ныне известно, всюду все еще действует закон обратных квадратов.
Закон тяготения ведет не только к пониманию природы туманностей, но и к некоторым идеям о происхождении звезд. В большом облаке пыли и газа, подобном изображенному на фиг. 7.11, притяжение частиц пыли соберет их в комки.
Фиг. 7.11. Межзвездное пылевое облако.
На фигуре видны «маленькие» черные пятнышки — быть может, начало скопления газа и пыли, из которых благодаря их притяжению начинает возникать звезда. Приходилось ли нам когда-либо видеть рождение звезды — вопрос спорный. На фиг. 7.12 дано некоторое свидетельство того, что приходилось.
Фиг. 7.12. Образование новых звезд?
Слева показан светящийся газ, а внутри него — несколько звезд. Это снимок 1947 г. Снимок справа сделан через 7 лет; теперь видны уже два новых ярких пятна. Уж не скопился ли здесь газ, не вынудило ли его тяготение собраться в шар, достаточно большой, чтобы в нем началась звездная ядерная реакция, превращая его в звезду? Может быть, да, а может, и нет. Маловероятно, что нам повезло увидеть, как всего за семь лет звезда стала видимой, но еще менее вероятно увидать рождение сразу двух звезд.
§ 6. Опыт Кавендиша
Итак, тяготение распространяется на огромные расстояния. Но если существует притяжение между любыми двумя объектами, то должна существовать и возможность измерить силу, действующую между ними. И не обязательно следить за движением звезд; почему бы не взять два шара, свинцовый и мраморный, и не проследить, как один будет двигаться к другому? Трудность столь простого по идее опыта заключается в крайней слабости, незаметности сил. Проводить его следует с исключительной осторожностью: сначала выкачать из аппарата воздух, убедиться, что нигде нет электрических зарядов и т. д., и только тогда можно попытаться измерить силу. Впервые она была измерена Кавендишем при помощи устройства, схематически изображенного на фиг. 7.13.
Фиг. 7.13. Упрощенная схема прибора, использованного Кавендишем для проверки закона всемирного тяготения для малых тел и измерения постоянной тяготения G.
Опыт Кавендиша доказал, что существует сила, действующая между двумя большими закрепленными свинцовыми шарами и двумя меньшими (тоже из свинца); в опыте шары размещались на концах коромысла, висящего на очень тонкой упругой нити. Измеряя, насколько закрутится нить, можно было узнать величину силы и убедиться, что она обратно пропорциональна квадрату расстояния. Таким образом точно определялся коэффициент G в формуле
ибо все массы и расстояния здесь известны. Вы можете возразить: «Все это для Земли было известно и раньше». Все, кроме массы Земли. Определив из этого опыта величину G и зная силу притяжения Земли, можно было косвенно определить ее массу! Опыт поэтому называют «взвешиванием Земли». Кавендиш утверждал, что он взвесил Землю, хотя он только измерил коэффициент G; но это единственный способ определить массу Земли. Коэффициент G оказался равным
Трудно преувеличить силу влияния теории тяготения, ее величественных успехов на историю науки. Вместо царивших в прежние века неуверенности, сомнений, неполноты знаний, бесконечных споров и парадоксов перед людьми предстал новый закон во всей своей четкости и простоте. Как важно было то, что все луны, все планеты, все звезды подчиняются столь простому правилу! Но еще важнее то, что человек оказался в состоянии понять это правило и предсказывать на будущее пути планет! Это определило быстрый, успешный рост науки в последующие годы; у людей появилась надежда, что и в других явлениях мира прячутся такие же простые закономерности.
§ 7. Что такое тяготение?
Но почему закон так прост? Что можно сказать о причине этого? До сих пор мы только описывали, как Земля обращается вокруг Солнца, но ни слова не сказали о том, что заставляет ее двигаться. Ньютон не строил догадок об этом; ему было достаточно открыть, что происходит, не входя в механизм происходящего. Но и никто другой с тех пор никакого механизма не открыл. Все физические законы отличаются в этом отношении своим абстрактным характером. Закон сохранения энергии — это теорема о величинах, которые нужно вычислить и сложить, не думая о причине этого; точно так же и великие законы механики представляют собой количественные математические закономерности, о внутреннем механизме работы которых никаких данных нет. Почему мы можем пользоваться математикой для описания законов, не зная их причины? Никто и этого не знает. Мы продолжаем идти по этой дороге, потому что на ней все еще происходят открытия.
Предлагались многие механизмы тяготения. Интересно рассмотреть один из них, ибо до него время от времени додумывались то один, то другой ученый. Причем каждый сперва воспрянет духом и ходит осчастливленный своим «открытием», но потом начинает понимать, что тут что-то не так. Впервые это открытие произошло примерно в 1750 г. Представьте себе, что в пространстве носится в разных направлениях с огромной скоростью множество частиц, лишь слегка поглощаемых веществом. Поглощаясь, они передают свой импульс Земле. Но так как во всех направлениях их количество одинаково, то все импульсы уравновешиваются. Когда же неподалеку находится Солнце, то частицы, приближающиеся к Земле сквозь Солнце, частично им поглощаются, так что от Солнца их проходит меньше, чем с обратной стороны. Следовательно, Земля ощутит импульс, направленный к Солнцу, и нетрудно видеть, что он будет обратным квадрату расстояния: таков закон изменения пространственного угла, под которым видимо Солнце, с ростом расстояния. Что же плохо в этом механизме? Неверны те выводы, которые из него следуют. Появляется новая забота: Земля в своем движении вокруг Солнца будет испытывать больше столкновений с частицами спереди, чем сзади (когда бежишь навстречу дождю, лицо мокнет больше, чем затылок!). Поэтому спереди Земля получит больше импульсов, чем сзади, и должна почувствовать сопротивление своему движению, а это сказалось бы на замедлении ее движения по орбите. Можно подсчитать, сколько времени понадобится Земле, чтобы в результате такого сопротивления остановиться; оказывается, не так уж много; а раз Земля все же движется по своей орбите, то вся эта механика не годится. И не было предложено ни одного механизма, «объясняющего» тяготение, который бы не предсказывал добавочных, несуществующих явлений.
Рассмотрим еще возможную связь тяготения с прочими силами. В нынешнее время не удается свести тяготение к другим силам. Тяготение отнюдь не проявление электричества или чего-либо подобного; этим его не объяснишь. И все же тяготение похоже на другие силы, и любопытно посмотреть, в чем. К примеру, электрическая сила между двумя заряженными телами чрезвычайно похожа на тяготение: она равна со знаком минус постоянной величине, умноженной на величины зарядов тел, и изменяется обратно квадрату расстояния. Правда, она действует в обратную сторону, т. е. отталкивает. Но замечательно не столько это, сколько одинаковая зависимость от расстояния, входящая в оба закона. Не исключено, что тяготение и электричество связаны значительно сильнее, чем мы думаем. Было сделано много попыток объединить их; так называемая единая теория поля — лишь одна из очень изящных попыток сочетать электричество с тяготением. Но самая интересная вещь в сопоставлении их друг с другом — это относительная величина этих сил. Любая теория, в которой появятся обе силы, обязана будет также объяснить величину тяготения (константу G).
Если мы измерим в естественных единицах отталкивание двух электронов (возникающее из-за того, что у них есть заряд) и их притяжение (возникающее оттого, что у них есть масса), то мы можем получить и отношение электрического отталкивания к гравитационному притяжению. Отношение это не зависит от расстояния, это фундаментальная мировая константа. Изображена она на фиг. 7.14.
Фиг. 7.14. Относительная сила электрического и гравитационного взаимодействия двух электронов.
Гравитационное притяжение составляет 1/4,17·1042 от электрического отталкивания! Откуда же может возникнуть такое исполинское число в знаменателе? Оно же не случайно, ведь это не отношение объема Земли к объему тли. Мы рассматриваем два естественных свойства одного и того же предмета — электрона. Это фантастическое число есть естественная константа, и в нем таятся какие-то глубинные свойства природы. От каких же свойств оно зависит? Некоторые надеются, что если кто-нибудь однажды напишет «универсальное уравнение», то одним из его корней будет это число. Но очень трудно найти уравнение, в котором корнем было бы такое немыслимое число. Были придуманы и другие возможности; одна связывает его с возрастом Вселенной. Иначе говоря, необходимо найти в природе еще одно такое огромное число. При этом не собираются выражать возраст в годах, нет, ведь год — не «естественная» величина, она введена людьми.
Как пример чего-то естественного выберем время, за какое свет проходит сквозь протон, 10-24 сек. Разделив это число на возраст Вселенной (2·1010 лет≈1018 сек), получим 10-42 — число со столькими же нулями; потому и предлагают считать постоянную всемирного тяготения связанной с возрастом всего мира. Если бы это было так, то она изменялась бы со временем: по мере старения Вселенной отношение ее лет к промежутку, в течение которого свет проносится мимо протона, возрастало бы. Возможно ли, что постоянная тяготения и впрямь меняется с годами? Ясно, что изменения столь малы, что в этом убедиться нелегко.
Вот один из способов проверить эту мысль. Зададим вопрос: что при этом должно было измениться за последние 109 лет (время появления жизни на Земле), т. е. за 1/10 возраста Вселенной? За это время постоянная тяготения выросла бы на 10%. Оказывается, что если рассмотреть структуру Солнца — баланс между его массой и степенью генерации излучательной энергии внутри Солнца, — то при росте тяжести на 10% Солнце оказалось бы не на 10% ярче, а значительно больше: яркость его возросла бы как шестая степень постоянной тяготения! Можно подсчитать и то, на сколько при таком изменении тяжести Земля приблизится к Солнцу. В итоге выясняется, что Земля стала бы более чем на 100° горячее и, следовательно, вся вода из морей превратилась бы в пар. Поэтому мы сейчас не верим, что постоянная тяготения изменяется по мере того, как мир стареет. Все же приведенный нами аргумент не очень убедителен, и вопрос до конца не выяснен.
Как известно, сила тяготения пропорциональна массе, т. е. мере инерции тела, или мере того, насколько трудно удержать тело, вращающееся по кругу. Поэтому два тела, тяжелое и легкое, движущиеся бок о бок вокруг массивного тела по одному и тому же кругу с одной скоростью под действием тяготения, будут все время оставаться рядом, потому что движение по кругу требует для большего тела и большей силы. Иначе говоря, тяжесть у большей массы больше как раз в нужной пропорции, так что два тела будут вращаться, не удаляясь одно от другого. Если же одно тело находится внутри другого, то оно и останется там; равновесие является совершенным. Поэтому Гагарин и Титов наблюдали невесомость всех предметов внутри космического корабля; выпущенный из руки карандаш, например, вращался вокруг Земли по той же траектории, что и весь корабль, поэтому он замирал, повиснув в воздухе. Любопытно, что эта сила в точности пропорциональна массе; если бы это было не так, то должны были бы наблюдаться явления, в которых инерция и вес отличаются. Отсутствие подобных явлений было с огромной точностью проверено на опыте, выполненном впервые
Этвешем в 1909 г., а позже повторенном Дикке. У всех веществ масса и вес пропорциональны с точностью 1/1 000 000 000 или даже более того. Не правда ли, замечательный эксперимент?
§ 8. Тяготение и относительность
Заслуживает еще обсуждения видоизменение ньютонова закона тяготения, сделанное Эйнштейном. Оказывается, несмотря на вызванное им воодушевление, ньютонов закон тяготения все же неверен! Учтя требования теории относительности, Эйнштейн видоизменил этот закон. Согласно Ньютону, тяготение действовало мгновенно. Это значит вот что: сдвинув массу, мы должны в тот же миг почувствовать изменение силы в результате смещения; стало быть, таким способом можно посылать сигналы с бесконечной скоростью. А Эйнштейн выдвинул доводы, что невозможно посылать сигналы быстрее скорости света; закон тяготения, таким образом, должен быть ошибочным. Если исправить его, учтя запаздывание, то получится уже новый закон, закон тяготения Эйнштейна. Одна из особенностей нового закона легко укладывается в голове: по теории относительности Эйнштейна все, любой объект, обладающий энергией, обладает и массой в том смысле, что он должен тяготеть к другим объектам. Даже световой луч имеет «массу», ибо он обладает энергией. И когда луч света, неся с собой энергию, проходит мимо Солнца, то Солнце его притягивает. И луч уже идет не по прямой, а искривляется. Например, во время солнечных затмений звезды, окружающие Солнце, кажутся сдвинутыми с того места, где они наблюдались бы, если бы Солнца не было. И это явление и впрямь наблюдалось.
И наконец, сопоставим тяготение с другими теориями. В последние годы выяснилось, что любая масса обязана своим происхождением мельчайшим частицам и что существует несколько видов взаимодействия, например ядерные силы и т. п. Ни одна из этих ядерных или электрических сил пока тяготения не объясняет. Квантовомеханические стороны природы мы еще пока не распространили на тяготение. Когда на малых расстояниях начинаются квантовые эффекты, то тяготение оказывается еще настолько слабым, что нужды в квантовой теории тяготения не возникает. С другой стороны, для последовательности наших физических теорий было бы важно понять, должен ли закон Ньютона с внесенным Эйнштейном видоизменением быть изменен и дальше с тем, чтобы согласовываться с принципом неопределенности. Это последнее видоизменение пока не сделано.
Глава 8 ДВИЖЕНИЕ
§ 1. Описание движения
Чтобы найти законы, управляющие различными изменениями, происходящими с течением времени, нужно сначала описать эти изменения и придумать какой-то способ их записи. Начнем с самого простого изменения, которое происходит с телом, — с изменения его положения в пространстве, т. е. то, что мы называем движением. Рассмотрим движущийся предмет, на который нанесена маленькая отметка; ее мы будем называть точкой. Неважно, будет ли это кончик радиатора автомобиля или центр падающего шара. Мы будем пытаться описать тот факт, что она движется и как это происходит.
На первый взгляд это кажется совсем просто, однако в описании изменения есть много хитростей. Некоторые изменения описать труднее, нежели движение точки на твердом предмете. Например, как описать движение облака, которое не только медленно перемещается, но вдобавок еще изменяет свои очертания или испаряется? Или как описать капризы женского ума? Впрочем, поскольку изменения облака хотя бы в принципе можно описать с помощью движения всех отдельных молекул его составляющих, то вполне возможно, что и изменения мыслей обусловлены тоже какими-то перемещениями атомов в мозгу, хотя мы еще не знаем простого способа их описания.
По этой причине мы начнем с движения точек. Пожалуй, еще можно считать эти точки атомами, но сначала, вероятно, лучше не гнаться за точностью, а просто представлять себе точку как какой-то маленький объект, маленький по сравнению с тем расстоянием, которое он проходит. Например, если говорят об автомобиле, прошедшем 100 км, то какая разница, имеется ли в виду его мотор или багажник. Конечно, небольшая разница есть, но обычно мы просто говорим «автомобиль», и то, что он не является абсолютной точкой, не имеет значения. Для наших целей не нужна абсолютная точность. Ради простоты забудем на время также и о том, что наш мир трехмерный, а сконцентрируем все свое внимание на движении в одном направлении (автомобиль движется по прямой дороге). Мы еще вернемся к понятию трех измерений, когда поймем, как описывается движение в одном измерении. Вы, вероятно, скажете, что это тривиально. Действительно, это так. Как описать движение в одном измерении, скажем движение автомобиля. Это проще простого. Приведу один из многих возможных способов. Чтобы определить положение автомобиля в различные моменты времени, мы измеряем расстояние его от начальной точки и записываем наши наблюдения. В табл. 8.1 буква s означает расстояние автомобиля от начальной точки в метрах, а t — время в минутах. Первая строка — нулевое расстояние и нулевой момент времени. Автомобиль еще не начал двигаться.
Таблица 8.1 расписание движения автомобиля
Через минуту после начала движения он проходит уже 380 м. Через две минуты он продолжает двигаться. Заметьте, что за вторую минуту он прошел большее расстояние, чем за первую, — автомобиль ускоряет свое движение, но между третьей и четвертой минутами что-то произошло, более того, на пятой минуте он остановился. По-видимому, у светофора, потому что дальше он опять набирает скорость и к концу шестой минуты проходит 4050 м, к концу седьмой — 5550, а к концу восьмой — 7050. Но в течение девятой минуты опять происшествие — автомобиль прошел всего лишь 450 м и остановился. Водитель нарушил правила движения и был остановлен полицейским.
Это один способ описать движение. Есть и другой способ — графический. Если по горизонтали откладывать время, а по вертикали — расстояние, то получим кривую, подобную изображенной на фиг. 8.1.
Фиг. 8.1. График зависимости расстояния, пройденного машиной, от времени.
Из рисунка видно, что с увеличением времени расстояние тоже увеличивается, сначала очень медленно, а затем все быстрее и быстрее. В районе четырех минут происходит замедление, а затем расстояние опять увеличивается в течение нескольких минут, и, наконец, на девятой минуте машина останавливается. Все эти сведения можно получить прямо из графика, не используя таблицы. Конечно, для построения нашего графика необходимо знать, где находится автомобиль не только каждую минуту, но и каждые полминуты, а может быть, и еще точнее. Кроме того, мы предполагаем, что машина где-то находится в любой момент времени.
Так что движение автомобиля выглядит все же сложно. Давайте рассмотрим что-нибудь попроще, с более простым законом движения: например, падающий шар. В табл. 8.2 даны значения времени в секундах и расстояния в метрах.
Таблица 8.2 расписание движения падающего шара
За нулевой момент выберем момент начала падения. Через 1 сек после начала падения шарик пролетает 5м, через 2 сек — 20 м, через 3 сек — 45м. Если отложить эти числа на графике, то получим параболическую кривую зависимости расстояния от времени для падающего тела (фиг. 8.2), которая описывается формулой
(8.1)
Фиг. 8.2. График зависимости расстояния, пройденного падающим шаром, от времени.
Эта формула позволяет вычислить расстояние для любого момента времени. Вы скажете, что для первого графика (см.фиг. 8.1) тоже должна быть какая-то формула. Действительно это так. Ее можно записать в таком абстрактном виде:
(8.2)
Это означает, что s — величина, зависящая от t, или, как говорят математики, s есть функция t. Однако мы не знаем, что это за функция, точнее, мы не можем записать ее через какие-то известные нам функции.
На этих двух примерах видно, что любое движение можно описать в общей и простой форме. Казалось бы, нет ничего хитрого! Однако хитрости все же есть, и не одна! Во-первых, что мы понимаем под пространством и временем? Это, оказывается, очень глубокие философские вопросы, которые нужно внимательно проанализировать, что не так-то легко. Теория относительности показывает, что понятия пространства и времени не так просты, как это кажется на первый взгляд. Впрочем, сейчас для начала нам не нужна такая скрупулезность в определении этих понятий. Возможно, вы скажете: «Странно, мне всегда говорили, что в науке все должно определяться точно». Это не так. Мы не можем определить точно все без исключения! Если бы мы пытались это сделать, то получилось бы нечто похожее на спор двух «философов», где один говорит: «Вы сами не знаете, о чем говорите»; а второй отвечает: «А что такое «знать»? Что такое «говорить»? Что такое «вы», наконец?» Ну и так до бесконечности. Так что для пользы дела лучше сначала условиться, что мы будем говорить хотя бы приблизительно об одних и тех же вещах. Сейчас вы достаточно много знаете о времени, но помните, что здесь есть некоторые тонкости, которые мы еще обсудим в дальнейшем.
Другая хитрость (мы уже упоминали о ней) — это правильно ли думать, что наблюдаемая нами движущаяся точка всегда находится в каком-то определенном месте (т. е. где-то локализована). Разумеется, когда мы смотрим на нее, она находится в определенном месте; но можно ли это утверждать в те моменты, когда мы отвернулись. И вот оказывается, что при изучении движения атомов так думать нельзя. Невозможно посадить метку на атом и наблюдать за его движением. С этой тонкостью мы вплотную столкнемся в квантовой механике. Но сначала давайте рассмотрим те проблемы, которые возникают до введения этих усложнений, а уж после этого учтем те поправки, на которые нас вынуждают новейшие сведения о природе вещей. Итак, примем наиболее простую точку зрения о пространстве и времени. Мы приблизительно понимаем, что означают эти понятия, а тот, кому доводилось управлять автомобилем, знает и что такое скорость.
§ 2. Скорость
Хотя мы примерно представляем себе, что такое «скорость», однако здесь есть одна очень важная тонкость. Заметьте, что древние греки так и не смогли до конца разобраться в проблеме скорости. Тонкость, о которой идет речь, дает себя знать, когда пытаешься точно определить, что же подразумевается под понятием «скорость». Этот вопрос был камнем преткновения для древних греков, и потребовалось открытие новой области математики, помимо геометрии и алгебры, которые были известны и грекам, и арабам, и вавилонянам. Попробуйте-ка с помощью одной лишь алгебры решить следующую задачу. Воздушный шар надувается таким образом, что его объем увеличивается со скоростью 100 см3/сек. С какой скоростью увеличивается его радиус, когда объем шара достигает 1000 см3? Задачи такого рода были неразрешимы для древних греков. Кроме того, их сбивали с толку многочисленные «парадоксы». Вот один из них, придуманный Зеноном, который хорошо показывает, насколько была сложна в то время проблема скорости движения. «Предположим, — говорит он, — что Ахиллес бегает в десять раз быстрее черепахи. Но тем не менее он никогда не перегонит ее. Действительно, пусть в начале состязания черепаха находилась в 100 метрах впереди Ахиллеса. Тогда ко времени, когда Ахиллес пробежит эти 100 метров, черепаха окажется в 10 метрах впереди него. Пробежав и эти 10 метров, Ахиллес увидит черепаху в 1 метре впереди себя. За то время, пока он пробежит этот метр, черепаха пройдет 10 сантиметров и так далее ... до бесконечности. Следовательно, в любой момент черепаха будет впереди Ахиллеса, и он никогда не сможет перегнать ее». В чем здесь ошибка? Конечный интервал времени можно разделить на бесконечное число частей точно так же, как и конечный отрезок длины, если последовательно делить его пополам. Но бесконечное число этапов до того места, где Ахиллес поравняется с черепахой, вовсе не означает бесконечное количество времени. Этот пример хорошо показывает, с какими трудностями приходилось сталкиваться в проблеме определения скорости.
Чтобы еще яснее представить себе эти трудности, вспомним старую шутку, которую вы наверняка слышали. Вы помните, что автомобиль, о котором мы говорили в начале этой лекции, был остановлен полицейским. Он подходит к машине и говорит: «Мадам (ибо за рулем была женщина), Вы нарушили правила уличного движения. Вы ехали со скоростью 90 километров в час». Женщина отвечает: «Простите, это невозможно. Как я могла делать 90 километров в час, если я еду всего лишь 7 минут!» Как бы вы ответили на месте полицейского? Конечно, если вы действительно настоящий полицейский, то такими хитростями вас не запутаешь. Вы бы твердо сказали: «Мадам, оправдываться будете перед судьей!» Но предположим, что у вас нет такого выхода. Вы хотите честно доказать нарушительнице ее вину и пытаетесь объяснить ей, что означает скорость 90 км/час. Как это сделать? Вы скажете: «Я имел в виду, мадам, что если бы вы продолжали ехать таким же образом, то через час Вы бы проехали 90 километров». «Да, но я ведь затормозила и остановила машину, — может ответить она, — так что теперь-то я уж никак не могла бы проехать 90 километров в час».
Аналогичная проблема возникает и в случае падающего шарика. Предположим, что мы хотим определить его скорость через 3 сек, если бы он двигался таким же образом. Но что означает «двигался таким же образом»? Сохранял бы ускорение, двигался быстрее, что ли? Конечно, нет! Сохранял бы ту же самую скорость. Но ведь это как раз то, что мы пытаемся определить! Если бы шарик продолжал двигаться «таким же образом», то он падал бы так же, как падает. Так что нужно придумать что-то лучшее для определения скорости. Что же все-таки должно сохраняться? Нарушительница могла бы вам еще ответить и так: «Если бы я продолжала ехать, как ехала, еще час, то налетела бы на стену в конце улицы!» В общем, как видите, полицейский оказался бы в очень трудном положении, пытаясь объяснить, что он имел в виду.
Многие физики думают, что единственным определением любого понятия является способ его измерения. Но тогда при объяснении вы должны прибегнуть к прибору, измеряющему скорость. «Смотрите, — скажете вы в этом случае, — ваш спидометр показывает 60». «Мой спидометр сломан и давно не работает», — ответит она. Но достаточно ли этого, чтобы поверить, что машина не двигалась? Мы полагаем, что как-то нужно было бы определять скорость и без помощи спидометра. Только при этих условиях можно сказать, что спидометр не работает, что он сломан. Это было бы абсурдным, если бы скорость не имела смысла без спидометра. Очевидно, что понятие «скорость» не зависит от спидометра. Спидометр нужен только для того, чтобы измерять ее. Давайте посмотрим, нельзя ли придумать лучшее определение понятия «скорость». Вы скажете: «Разумеется, мадам, если бы вы ехали таким же образом в течение часа, то налетели бы на стену, но за 1 секунду вы бы проехали 25 метров, так что вы делали 25 метров в секунду, и если бы продолжали ехать таким же образом, то в следующую секунду опять проехали бы 25 метров, а стена стоит гораздо дальше». «Но правила запрещают делать 90 километров в час, а не 25 метров в секунду». «Да ведь это то же самое, что и 90 километров в час», — ответите вы. А если это то же самое, то к чему тогда все длинные разговоры о 25 м/сек? В действительности же падающий шар не может двигаться одинаковым образом даже 1 сек, так как он постоянно ускоряется, и, следовательно, нужно определить скорость как-то точнее.
Но теперь мы, кажется, находимся на правильном пути, который приводит нас вот к чему. Если бы машина продолжала двигаться таким же образом следующую тысячную долю часа, то она прошла бы тысячную долю 90 км. Другими словами, нет никакой необходимости ехать целый час с той же быстротой, достаточно какого-то момента. Это означает, что за какой-то момент времени машина проходит такое же расстояние, как я идущая с постоянной скоростью 90 км/час. Наши рассуждении о 25 м/сек, возможно, и правильные; мы отмечаем, сколько машина прошла в следующую секунду, и если получается расстояние 25 м, то это означает, что скорость достигает 90 км/час.
Другими словами, можно определить скорость следующим образом. Определяем расстояние, которое было пройдено за очень малый отрезок времени, и, разделив его на этот отрезок времени, получаем скорость. Однако этот отрезок должен быть как можно меньше, и чем меньше, тем лучше, потому что в этот период могут произойти снова изменения. Смешно, например, для падающего тела в качестве такого отрезка принять час. Принять в качестве отрезка секунду, может быть, удобно для автомобиля, так как за секунду его скорость изменяется не слишком сильно, но этот отрезок велик для падающего тела. Таким образом, чтобы вычислить скорость более точно, нужно брать все меньшие и меньшие интервалы времени. Если на миллионную долю секунды мы разделим расстояние, которое было пройдено в течение этого времени, то получим расстояние в секунду, т.е. как раз то, что мы понимаем под скоростью. Именно это нужно было сказать нашей нарушительнице, т. е. дать то определение скорости, которое мы и будем использовать.
Такое определение содержит некую новую идею, которая была недоступна грекам в ее общей форме.
Она заключается в том, чтобы малые расстояния разделить на соответствующие малые отрезки времени и посмотреть, что произойдет с частным, если отрезок времени брать все меньше и меньше (иными словами, брать предел отношения пройденного расстояния к интервалу времени при неограниченном уменьшении последнего). Впервые эта идея была высказана независимо Ньютоном и Лейбницем и явилась основой новой области математики — дифференциального исчисления. Оно возникло в связи с описанием движения, и первым его приложением был ответ на вопрос: «Что означает 90 км/час?»
Попытаемся теперь точнее определить скорость. Пусть за некоторое малое время ε машина или какое-то другое тело прошли малое расстояние х; тогда скорость v определяется как
причем точность будет тем больше, чем меньше ε. Математики записывают это следующим образом:
(8.3)
т. е. скорость есть предел отношения х/ε при ε, стремящемся к нулю. Для нашей машины-нарушительницы невозможно точно вычислить скорость, так как таблица неполная. Ее положение известно нам только через интервалы 1 мин. Приближенно, конечно, можно сказать, что в течение седьмой минуты, например, она шла со средней скоростью 90 км/час, однако о ее скорости в конце шестой минуты ничего сказать невозможно. Может быть, она ускорялась и скорость с 40 км/час в начале шестой минуты возросла до 90 км/час в конце ее, а может быть, она двигалась иначе. Мы не знаем этого точно, так как у нас нет детальной записи ее движения между шестой и седьмой минутами. Только когда таблица будет пополнена бесконечным числом данных, из нее можно будет действительно вычислить скорость. Если, однако, нам известна полная математическая формула, как, например, в случае падающего тела [уравнение (8.1)], то можно подсчитать скорость. Ведь по формуле можно найти положение тела в любой момент времени.
В качестве примера давайте найдем скорость падающего шара через 5 сек после начала падения. Один способ — это посмотреть по табл. 8.2, что происходило с шариком на пятой секунде. В течение этой секунды он прошел 45 м, так что, казалось бы, он падал со скоростью 45 м/сек. Однако это неверно, поскольку скорость его все время изменялась. Конечно, в среднем в течение этой секунды она составляла 45 м/сек, но в действительности шар ускорялся и в конце пятой секунды падал быстрее 45 м/сек. Наша задача состоит в том, чтобы определить скорость точно. Сделаем это следующим образом. Нам известно, где шарик находился через 5 сек. За 5 сек он прошел расстояние 125 м. К моменту 5,1 сек общее расстояние, которое прошел шарик, составит, согласно уравнению (8.1), 130,05 м. Таким образом, за дополнительную десятую долю секунды он проходит 5,05 м. А поскольку 5,05м за 0,1 сек то же самое, что и 50,5 м/сек, то это и будет его скорость. Однако это все еще не совсем точно. Для нас совершенно неважно, будет ли это скорость в момент 5 сек, или в момент 5,1 сек, или где-то посредине. Наша задача вычислить скорость точно через 5 сек, а этого мы пока не сделали. Придется улучшить точность и взять теперь на тысячную долю больше 5 сек, т. е. момент 5,001 сек. Полное расстояние, пройденное за это время, составляет
Следовательно, в последнюю тысячную долю секунды шарик проходит 0,050005 м, и если разделить это число на 0,001 сек, то получим скорость 50,005 м/сек. Это уже очень близко, но все же еще не точно. Однако теперь уже ясно, как поступить, чтобы найти скорость точно. Удобнее решать эту задачу в несколько более общем виде. Пусть требуется найти скорость в некоторый момент времени t0 (например, 5 сек). Расстояние, которое пройдено к моменту t0 (назовем его s0), будет 5t02 (в нашем случае 125 м). Чтобы определить расстояние, мы задавали вопрос: где окажется тело спустя время t0+(небольшой добавок), или t0+ε? Новое положение тела будет 5(t0+ε)2=5t20+10t0ε+5ε2. (Это расстояние больше того расстояния, которое шарик прошел за t0 сек, т. е. больше 5t02). Назовем это расстояние s0+(небольшой добавок), или s0+x. Если теперь вычесть из него расстояние, пройденное к моменту t0, то получим х — то дополнительное расстояние, которое шарик прошел за добавочное время ε, т. е. x=10t0ε+5ε2. Так что в первом приближении скорость будет равна
(8.4)
Теперь мы уже знаем, что нужно делать, чтобы получить скорость точно в момент t0: нужно брать отрезок ε все меньше и меньше, т. е. устремлять его к нулю. Таким путем из уравнения (8.4) получим
В нашей задаче t0=5 сек, следовательно, скорость равна у=10·5=50 м/сек. Это и есть нужный ответ. Раньше, когда ε бралось равным 0,1 и 0,001 сек, получалась несколько большая величина, чем 50 м/сек, но теперь мы видим, что в действительности она в точности равна 50 м/сек.
§ 3. Скорость как производная
Процедура, которую мы только что выполнили, настолько часто встречается в математике, что для величин ε и x было придумано специальное обозначение: ε обозначается как Δt, а х — как Δs. Величина Δt означает «небольшой добавок к t», причем подразумевается, что этот добавок можно делать меньше. Значок Δ ни в коем случае не означает умножение на какую-то величину, точно так же как sinθ не означает s·i·n·θ. Это просто некоторый добавок ко времени, причем значок Δ напоминает нам о его особом характере. Ну, а если Δ не множитель, то его нельзя сократить в отношении Δs/Δt. Это все равно, что в выражении sinθ/sin2θ сократить все буквы и получить 1/2. В этих новых обозначениях скорость равна пределу отношения Δs/Δt при Δt, стремящемся к нулю, т. е.
(8.5)
Это по существу формула (8.3), но теперь яснее видно, что здесь все изменяется, а, кроме того, она напоминает, какие именно величины изменяются.
Существует еще один закон, который выполняется с хорошей точностью. Он гласит: изменение расстояния равно скорости, умноженной на интервал времени, за которое это изменение произошло, т. е. Δs=vΔt. Это правило строго справедливо только тогда, когда скорость не изменяется в течение интервала Δt, а это, вообще говоря, происходит, только когда Δt достаточно мало. В таких случаях обычно пишут ds=vdt, где под dt подразумевают интервал времени Δt при условии, что он сколь угодно мал. Если интервал Δt достаточно велик, то скорость за это время может измениться и выражение Δs=vΔt будет уже приближенным. Однако если мы пишем dt, то при этом подразумевается, что интервал времени неограниченно мал и в этом смысле выражение ds=vdt точное. В новых обозначениях выражение (8.5) имеет вид
Величина ds/dt называется «производной s по t» (такое название напоминает о том, что изменяется), а сложный процесс нахождения производной называется, кроме того, дифференцированием. Если же ds и dt появляются отдельно, а не в виде отношения ds/dt, то они носят названия дифференциалов. Чтобы получше познакомить вас с новой терминологией, скажу еще, что в предыдущем параграфе мы нашли производную от функции 5t2, или просто производную от 5t2. Она оказалась равной 10t. Когда вы больше привыкнете к новым словам, вам станет более понятна сама мысль. Для тренировки давайте найдем производную более сложной функции. Рассмотрим выражение s=At3+Bt+C, которое может описывать движение точки. Буквы A, B, C, так же как и в обычном квадратном уравнении, обозначают постоянные числа. Нам нужно найти скорость движения, описываемого этой формулой в любой момент времени t. Рассмотрим для этого момент t+Δt, причем к s прибавится некоторая добавка Δs, и найдем, как выражается Δs через Δt. Поскольку
а
то
Но нам нужна не сама величина Δs, а отношение Δs/Δt. После деления на Δt получим выражение
которое после устремления Δt к нулю превратится в
В этом состоит процесс взятия производной, или дифференцирования функций. На самом деле он несколько легче, чем это кажется на первый взгляд. Заметьте, что если в разложениях, подобных предыдущим, встречаются члены, пропорциональные (Δt)2 или (Δt)3 или еще более высоким степеням, то их можно сразу вычеркнуть, поскольку они все равно обратятся в нуль, когда в конце мы будем Δt устремлять к нулю. После небольшой тренировки вы сразу будете видеть, что нужно оставлять, а что сразу отбрасывать. Существует много правил и формул для дифференцирования различных видов функций. Их можно либо запомнить, либо пользоваться специальными таблицами. Небольшой список таких правил приводится в табл. 8.3.
Таблица 8.3 НЕКОТОРЫЕ ПРОИЗВОДНЫЕ
s, u, v, w — произвольные функции;
a, b, с, n — произвольные постоянные.
§ 4. Расстояние как интеграл
Обсудим теперь обратную проблему. Пусть вместо таблицы расстояний нам дана таблица скоростей в различные моменты времени, начиная с нуля. В табл. 8.4 представлена зависимость скорости падающего шара от времени. Аналогичную таблицу можно составить и для машины, если записывать показания спидометра через каждую минуту или полминуты. Но можно ли, зная скорость машины в любой момент времени, вычислить расстояние, которое ею было пройдено?
Таблица 8.4 СКОРОСТЬ ПАДАЮЩЕГО ШАРА
Эта задача обратна той, которую мы только что рассмотрели. Как же решить ее, если скорость машины непостоянна, если она то ускоряется до 90 км/час, то замедляется, затем где-то останавливается у светофора и т.д.? Сделать это нетрудно. Нужно использовать ту же идею и выражать полное расстояние через бесконечно малые его части. Пусть в первую секунду скорость будет v1 , тогда по формуле Δs=v1Δt можно вычислить расстояние, пройденное за эту секунду. В следующую секунду скорость будет несколько другой, хотя, может быть, и близкой к первоначальной, а расстояние, пройденное машиной за вторую секунду, будет равно новой скорости, умноженной на интервал времени (1 сек). Этот процесс можно продолжить дальше, до самого конца пути. В результате мы получим много маленьких отрезков, которые в сумме дадут весь путь. Таким образом, путь является суммой скоростей, умноженных на отдельные интервалы времени, или s=∑vΔt, где греческая буква ∑(сигма) означает суммирование. Точнее, это будет сумма скоростей в некоторые моменты времени, скажем ti , умноженные на Δt:
(8.6)
причем каждый последующий момент ti+1 находится по правилу ti+1=ti+Δt. Но расстояние, полученное этим методом, не будет точным, поскольку скорость за время Δt все же изменяется. Выход из этого положения заключается в том, чтобы брать все меньшие и меньшие интервалы Δt, т. е. разбивать время движения на все большее число все меньших отрезков. В конце концов мы придем к следующему, теперь уже точному выражению для пройденного пути:
(8.7)
Математики придумали для этого предела, как и для дифференциала, специальный символ. Значок Δ превращается в d, напоминая о том, что интервал времени сколь угодно мал, а знак суммирования превращается в ∫ — искаженное большое S, первая буква латинского слова «Summa». Этот значок назван интегралом. Таким образом, мы пишем
(8.8)
где v(t) — скорость в момент t. Сама же операция суммирования этих членов называется интегрированием. Она противоположна операции дифференцирования в том смысле, что производная этого интеграла равна v(t), так что один оператор (d/dt) «уничтожает» другой (∫). Это дает возможность получать формулы для интегралов путем обращения формул для дифференциалов: интеграл от функции, стоящей в правой колонке табл.8.3, будет равен функции, стоящей в левой колонке. Дифференцируя все виды функций, вы сами можете составить таблицу интегралов.
Любая функция, заданная в аналитическом виде, т. е. выражающаяся через комбинацию известных нам функций, дифференцируется очень просто — вся операция выполняется чисто алгебраически, и в результате мы всегда получаем какую-то известную функцию. Однако интеграл не от всякой функции можно записать в аналитическом виде. Разумеется, для каждого частного интеграла всегда сначала пытаются найти такую функцию, которая, будучи продифференцирована, давала бы функцию, стоящую после знака интеграла (она называется подынтегральной). Однако это не всегда удается сделать. В таких случаях интеграл вычисляют просто суммированием, т. е. вычисляют суммы типа (8.6) со все меньшими и меньшими интервалами, пока не получат результат с достаточной точностью.
§ 5. Ускорение
Следующий шаг на пути к уравнениям движения — это введение величины, которая связана с изменением скорости движения. Естественно спросить: а как изменяется скорость движения? В предыдущих главах мы рассматривали случай, когда действующая сила приводила к изменению скорости. Бывают легковые машины, которые набирают с места за 10 сек скорость 90 км/час. Зная это, мы можем определить, как изменяется скорость, но только в среднем. Займемся следующим более сложным вопросом: как узнать быстроту изменения скорости. Другими словами, на сколько метров в секунду изменяется скорость за 1 сек. Мы уже установили, что скорость падающего тела изменяется со временем по формуле v=9,8t (см. табл. 8.4), а теперь хотим выяснить, насколько она изменяется за 1 сек. Эта величина называется ускорением.
Таким образом, ускорение определяется как быстрота изменения скорости. Всем сказанным ранее мы уже достаточно подготовлены к тому, чтобы сразу записать ускорение в виде производной от скорости, точно так же как скорость записывается в виде производной от расстояния. Если теперь продифференцировать формулу v=9,8 t, то получим ускорение падающего тела
(8.9)
(При дифференцировании этого выражения использовался результат, полученный нами раньше. Мы видели, что производная от Bt равна просто В (постоянной). Если же выбрать эту постоянную равной 9,8, то сразу находим, что производная от 9,8 t равна 9,8.) Это означает, что скорость падающего тела постоянно возрастает на 9,8 м/сек за каждую секунду. Этот же результат можно получить и из табл. 8.4. Как видите, в случае падающего тела все получается довольно просто, но ускорение, вообще говоря, непостоянно. Оно получилось постоянным только потому, что постоянна сила, действующая на падающее тело, а по закону Ньютона ускорение должно быть пропорционально силе.
В качестве следующего примера найдем ускорение в той задаче, с которой мы уже имели дело при изучении скорости:
Для скорости v — ds/dt мы получили формулу
Так как ускорение — это производная скорости по времени, то для того, чтобы найти его значение, нужно продифференцировать эту формулу. Вспомним теперь одно из правил табл. 8.3, а именно что производная суммы равна сумме производных. Чтобы продифференцировать первый из этих членов, мы не будем проделывать всю длинную процедуру, которую делали раньше, а просто напомним, что такой квадратичный член встречался нам при дифференцировании функции 5t2, причем в результате коэффициент удваивался, а t2 превращалось в t. Вы можете сами убедиться в том, что то же самое произойдет и сейчас. Таким образом, производная от ЗAt2 будет равна 6Аt. Перейдем теперь к дифференцированию второго слагаемого. По одному из правил табл. 8.3 производная от постоянной будет нулем, следовательно, этот член не даст в ускорение никакого вклада. Окончательный результат: a=dv/dt=6At.
Выведем еще две полезные формулы, которые получаются интегрированием. Если тело из состояния покоя движется с постоянным ускорением g, то его скорость v в любой момент времени t будет равна
а расстояние, пройденное им к этому моменту времени,
Заметим еще, что поскольку скорость — это ds/dt, а ускорение — производная скорости по времени, то можно написать
(8.10)
Так что теперь мы знаем, как записывается вторая производная.
Существует, конечно, и обратная связь между ускорением и расстоянием, которая просто следует из того, что a=dv/dt. Поскольку расстояние является интегралом от скорости, то оно может быть найдено двойным интегрированием ускорения.
Все предыдущее рассмотрение было посвящено движению в одном измерении, а теперь мы коротко остановимся на движении в пространстве трех измерений. Рассмотрим движение частицы Р в трехмерном пространстве. Эта глава началась с обсуждения одномерного движения легковой машины, а именно с вопроса, на каком расстоянии от начала движения находится машина в различные моменты времени. Затем мы обсуждали связь между скоростью и изменением расстояния со временем и связь между ускорением и изменением скорости. Давайте в той же последовательности разберем движение в трех измерениях. Проще, однако, начать с более наглядного двумерного случая, а уж потом обобщить его на случай трех измерений. Нарисуем две пересекающиеся под прямым углом линии (оси координат) и будем задавать положение частицы в любой момент времени расстояниями от нее до каждой из осей. Таким образом, положение частицы задается двумя числами (координатами) х и у, каждое из которых является соответственно расстоянием до оси у и до оси х (фиг. 8.3). Теперь мы можем описать движение, составляя, например, таблицу, в которой эти две координаты заданы как функции времени. (Обобщение на трехмерный случай требует введения еще одной оси, перпендикулярной двум первым, и измерения еще одной координаты z. Однако теперь расстояния берутся не до осей, а до координатных плоскостей.) Как определить скорость частицы? Для этого мы сначала найдем составляющие скорости по каждому направлению, или ее компоненты. Горизонтальная составляющая скорости, или x-компонента, будет равна производной по времени от координаты x, т. е.
(8.11)
а вертикальная составляющая, или y-компонента, равна
(8.12)
В случае трех измерений необходимо еще добавить
(8.13)
Как, зная компоненты скорости, определить полную скорость в направлении движения? Рассмотрим в двумерном случае два последовательных положения частицы, разделенных коротким интервалом времени Δt=t2-t1 и расстоянием Δs. Из фиг. 8.3 видно, что
(8.14)
(Значок ≈ соответствует выражению «приблизительно равно».)
Фиг. 8.3. Описание движения тела на плоскости и вычисление его скорости.
Средняя скорость в течение интервала Δt получается простым делением: Δs/Δt. Чтобы найти точную скорость в момент t, нужно, как это уже делалось в начале главы, устремить Δt к нулю. В результате оказывается, что
(8.15)
В трехмерном случае точно таким же способом можно получить
(8.16)
Ускорения мы определяем таким же образом, как и скорости: x-компонента ускорения ах определяется как производная от x-компоненты скорости vx (т. е. ax=d2x/dt2 — вторая производная по времени) и т. д.
Давайте рассмотрим еще один интересный пример смешанного движения на плоскости. Пусть шарик движется в горизонтальном направлении с постоянной скоростью u и в то же время падает вертикально вниз с постоянным ускорением g. Что это за движение? Так как vx=dx/dt=u и, следовательно, скорость vx постоянна, то
(8.17)
а поскольку ускорение движения вниз постоянно и равно -g, то координата у падающего шара дается формулой
(8.19)
Какую же кривую описывает наш шарик, т. е. какая связь между координатами x и y? Из уравнения (8.18), согласно (8.17), можно исключить время, поскольку t=x/u, после чего находим
(8.19)
Эту связь между координатами х и у можно рассматривать как уравнение траектории движения шарика. Если изобразить ее графически, то получим кривую, которая называется параболой (фиг. 8.4).
Фиг. 8.4. Парабола, которую описывает падающее тело, брошенное с горизонтальной начальной скоростью.
Так что любое свободно падающее тело, будучи брошенным в некотором направлении, движется по параболе.
Глава 9 ДИНАМИЧЕСКИЕ ЗАКОНЫ НЬЮТОНА
§ 1. Импульс и сила
Открытие законов динамики или законов движения стало одним из наиболее драматических моментов в истории науки. До Ньютона движение различных тел, например планет, представлялось загадкой для ученых, но после открытия Ньютона все вдруг сразу стало понятно. Смогли быть вычислены даже очень слабые отклонения от законов Кеплера, обусловленные влиянием других планет. Движение маятника, колебания груза, подвешенного на пружине, и другие непонятные до того явления раскрыли свои загадки благодаря законам Ньютона. То же самое можно сказать и об этой главе. До нее вы не могли рассчитать, как движется грузик, прикрепленный к пружине, не говоря уже о том, чтобы определить влияние Юпитера и Сатурна на движение Урана. Но после этой главы вам будет доступно и то и другое!
Первый большой шаг в понимании движения был сделан Галилеем, когда он открыл свой принцип инерции: тело, предоставленное самому себе, если на него не действует никакая сила, сохраняет свое прямолинейное движение с постоянной скоростью, как двигалось до этого, или остается в покое, если оно до этого покоилось. Конечно, в природе такого не бывает. Попробуйте толкнуть кубик, стоящий на столе. Он остановится. Причина в том, что кубик трется о стол, он не предоставлен самому себе. Нужно иметь очень богатое воображение, чтобы увидеть за этим принцип инерции.
Естественно нужно еще разрешить следующий вопрос: а как изменяется скорость тела, если на него что-то действует? Ответ был дан Ньютоном. Он сформулировал три закона. Первый закон представляет собой просто повторение принципа инерции Галилея. Второй закон говорит о том, как изменяется скорость тела, когда оно испытывает различные влияния, т. е. когда на него действуют силы. Третий закон в каком-то смысле описывает силы, но о нем мы поговорим несколько позже. Здесь будет идти речь о Втором законе, согласно которому под действием силы движение тел изменяется следующим образом: скорость изменения со временем некой величины, называемой количеством движения, или импульсом, пропорциональна силе. Позднее мы запишем короткую математическую формулировку этого закона, а сейчас давайте разберемся в его содержании.
Импульс и скорость — вещи разные. В физике употребляется много слов, и каждое из них в отличие от обычного разговорного языка имеет точный смысл. Примером может служить слово «импульс», и мы должны определить его точно. Толкните слегка рукой какой-нибудь легкий предмет — он тотчас начнет двигаться. Если с такой же силой толкнуть гораздо более тяжелый предмет, то он будет двигаться значительно медленней. В сущности нужно говорить не о «легком» или «тяжелом» предмете, а о менее массивном или более массивном, так как между весом и инерцией предмета есть разница, которую нужно понимать. (Сколько весит тело — это одно, а насколько трудно разогнать его — совсем другое.) Однако на поверхности Земли вес и инерция пропорциональны друг другу и зачастую рассматриваются как численно равные. Это часто приводит к непониманию разницы между ними. На Марсе, например, вес предметов будет отличаться от веса на Земле, но инертность останется той же самой, т. е. потребуется то же количество силы, чтобы преодолеть инерцию тела.
Количественной мерой инертности является масса. Ее можно измерять так: просто привязать предмет на веревочке, крутить его с определенной скоростью и измерять ту силу, которая необходима, чтобы удержать его. Этим способом можно измерять массу любых предметов. Импульс — это просто произведение массы тела на его скорость. Теперь можно записать Второй закон Ньютона в математической форме:
(9.1)
Давайте разберем подробнее некоторые его стороны. При написании закона, подобного этому, обычно используется много интуитивных идей; что-то подразумевается, что-то предполагается и комбинируется в приближенный «закон». Но после этого необходимо снова вернуться назад и подробно изучить, что означает каждый член. Если же пытаться сделать это с самого начала, то можно безнадежно запутаться. Так что мы считаем некоторые положения само собой разумеющимися и не требующими никакого доказательства. Во-первых, мы считаем, что массы тел постоянны. Это, вообще говоря, неправильно, но мы начнем с ньютоновского приближения, когда масса считается постоянной и не изменяющейся с течением времени. Во-вторых, если сложить вместе два предмета, то масса образовавшегося тела равна сумме их масс. Это положение неявно предполагалось Ньютоном, когда он писал свои уравнения, в противном случае они были бы бессмысленны. Пусть, например, масса изменяется обратно пропорционально скорости, но тогда импульс никогда бы не изменялся и закон потерял бы всякое содержание, за исключением только того, что вы знаете, как изменяется масса со скоростью. Так что сначала мы считаем массу неизменной.
Несколько слов о силе. В качестве первого грубого приближения мы рассматривали силу как некий толчок или тягу, которая может быть произведена с помощью наших мышц, но теперь, пользуясь уравнением движения, мы можем определить ее более точно. Очень важно помнить, что закон Ньютона включает не только изменение величины импульса, но и изменение его направления. Итак, если масса постоянна, то уравнение (9.1) можно записать в виде
(9.2)
где а — ускорение, т. е. «скорость изменения скорости». Второй закон Ньютона означает не только то, что изменения, вызванные данной силой, обратно пропорциональны массе, но и то, что направление изменения скорости совпадает с направлением действия силы. Важно понимать, что термин «ускорение» имеет в физике более широкий смысл, чем в обычной разговорной речи. Он означает не только увеличение скорости, но и замедление ( в этом случае мы говорим, что ускорение отрицательно), и перемену направления движения. В гл. 7 мы уже познакомились с ускорением, направленным под прямым углом к скорости, и мы видели, что предмет, движущийся по окружности радиусом R со скоростью v, за малый интервал времени t уклоняется от своего прямого пути на расстояние 1/2(v2/R)t2. Так что в этом случае ускорение направлено под прямым углом к направлению движения и равно
(9.3)
Таким образом, сила, действующая под прямым углом к скорости, вызывает искривление пути, причем радиус кривизны можно найти, деля силу на массу тела (при этом мы получаем ускорение) и используя затем формулу (9.3).
Термин «скорость» тоже имеет в физике более широкий смысл, чем в обыденной жизни. Это не просто некоторое количество метров в секунду, т. е. абсолютная величина скорости, но и направление перемещения в каждый момент времени. Математически мы можем описать и величину, и направление скорости, если будем задавать изменение координат тела с течением времени. Пусть, например, в некоторый момент тело движется так, как это показано на фиг. 9.1.
Фиг. 9.1. Малое перемещение тела.
Тогда за малый промежуток времени Δt оно пройдет некоторое расстояние Δx в направлении оси x, Δy в направлении оси y и Δz в направлении оси z. Результатом же этих изменений координат будет перемещение Δs вдоль диагонали параллелепипеда со сторонами Δx, Δy, Δz, которые следующим образом связаны с составляющими скорости и интервалом:
(9.4)
§ 2. Компоненты скорости, ускорения и силы
В уравнении (9.4) мы разложили скорость на составляющие (или компоненты), которые говорят нам, насколько быстро продвигается тело в направлениях x, y и z. Скорость будет полностью определена как в отношении ее направления, так и абсолютной величины, если задать числовые значения трех ее компонент:
(9.5)
При этом абсолютная величина равна
(9.6)
Теперь пусть под действием силы меняется не только величина, но и направление скорости (фиг. 9.2).
Фиг. 9.2. Скорость изменяется как по величине, так и по направлению.
Хотя это довольно сложный случай, но с помощью подсчета изменения компонент его рассмотрение сильно упрощается. Изменение x-компоненты скорости за интервал Δt будет Δvx=axΔt, где ах то, что называется x-компонентой ускорения. Совершенно аналогично Δvx=ayΔt и Δvz=azΔt. В такой формулировке Второй закон Ньютона фактически превращается в три закона. Действительно, мы говорим, что сила имеет то же направление, что и ускорение, так что каждая из составляющих силы в направлениях x, y и z равна массе, умноженной на изменение соответствующей компоненты скорости:
(9.7)
Подобно скорости и ускорению, сила тоже может быть разложена на компоненты, причем каждая из них является проекцией отрезка прямой, численно равного абсолютной величине силы и указывающего направление ее действия, на оси x, y и z:
(9.8)
где F — абсолютная величина силы, а (xF), (yF) и (zF) — углы между направлением силы и осями x, y и z соответственно.
Уравнения (9.7) представляют собой полную форму Второго закона Ньютона. Зная силы, действующие на тело, и разлагая их на компоненты, можно с помощью этих уравнений найти движение тела. Давайте рассмотрим простой пример. Пусть в направлениях х и у не действуют никакие силы, а есть сила только в направлении z (скажем, вертикально). Тогда, согласно уравнению (9.7), изменяется только одна вертикальная составляющая скорости; что же касается горизонтальных, то они будут оставаться неизменными. Пример такого движения уже рассматривался в гл. 7 (см. фиг. 7.3). Таким образом, горизонтальное движение падающего тела остается неизменным, тогда как в вертикальном направлении оно движется так, как будто никакого горизонтального движения вообще нет. Другими словами, если компоненты сил не связаны друг с другом, то и движения в направлениях осей x, y и z будут независимы.
§ 3. Что такое сила?
Чтобы пользоваться законами Ньютона, мы должны иметь какую-то формулу для сил; ведь эти законы говорят нам: подумайте о силах. Если тело ускоряется, стало быть, на него что-то действует. А как найти это «что-то»? Нашей программой на будущее должно быть отыскание законов для сил. Некоторые из таких законов были найдены самим Ньютоном. Например, формула для силы тяготения. Часть сведений о силах другого рода содержится в Третьем законе, который утверждает равенство сил действия и противодействия, но об этом более подробно пойдет речь в следующей главе.
Продолжим наш предыдущий пример. Что за силы действуют на тело вблизи поверхности Земли? Это — сила тяжести, направленная вертикально вниз, пропорциональная массе тела и для высот, много меньших, чем радиус Земли R, почти не зависящая от высоты; она равна F=GmM/R2=mg, где g=GM/R2 — так называемое ускорение силы тяжести. В горизонтальном направлении тело по-прежнему будет двигаться с постоянной скоростью, однако движение в вертикальном направлении более интересно. По Второму закону Ньютона
(9.9)
После сокращения массы m получаем, что ускорение в направлении x постоянно и равно g. Это хорошо известное движение свободно падающего тела, которое описывается уравнениями
(9.10)
Рассмотрим другой пример. Представим, что мы смогли создать устройство (фиг. 9.3), в котором сила прямо пропорциональна отклонению от положения равновесия и направлена противоположно ему, — это пружина с грузиком.
Фиг. 9.3. Грузик на пружинке.
Действительно, поскольку сила тяжести компенсируется начальным натяжением пружины, то имеет смысл говорить только об избыточной силе. Если потянуть грузик вниз, то пружина растянется и потянет его вверх, если же толкать грузик вверх, то пружина сожмется и будет толкать его вниз. При этом все устроено таким образом, что чем больше сила и чем сильнее мы оттягиваем грузик вниз, тем больше растягивается пружина и тем сильнее она тянет его вверх, и наоборот. Наблюдая за работой этого устройства, мы видим довольно интересное движение: вверх-вниз, вверх-вниз... Возникает вопрос, могут ли уравнения Ньютона правильно описать его? Если применить закон Ньютона (9.7) для такого периодического осциллятора, то получим следующее уравнение:
(9.11)
т. е. здесь мы встречаемся с таким положением, когда x-компонента скорости изменяется с быстротой, пропорциональной x. Нет смысла сейчас вводить многочисленные константы; в целях простоты предположим, что либо изменился масштаб времени, либо что-то произошло с другими единицами измерения, словом, они выбраны так, что k/m равно единице. Итак, будем пытаться решать уравнение
(9.12)
Чтобы пойти дальше, нужно сначала разобраться в том, что такое vx; то, что это быстрота изменения положения, нам, разумеется, уже известно.
§ 4. Смысл динамических уравнений
Попытаемся теперь понять, что же означает уравнение (9.12). Пусть в данный момент времени t тело находится в точке x и движется со скоростью vx. Каково будет его положение и скорость спустя небольшой промежуток времени, т. е. в момент t+ε? Если мы сможем ответить на этот вопрос, то проблема решена, так как, исходя из начальных условий, т. е. положения и скорости в некоторый начальный момент времени, можно сказать, как они изменяются в первый момент, а зная положение и скорость в первый момент, можно найти их и в следующий и т. д. Таким образом, шаг за шагом выстраивается вся картина движения. Для большей определенности предположим, что в момент t=0 положение грузика x=1, а его скорость vx=0. Почему вообще движется грузик? Да потому, что на него в любом положении, за исключением положения равновесия х=0, действует сила. Если х>0, то эта сила направлена вверх. Следовательно, скорость, которая вначале была нулем, благодаря уравнениям движения начинает изменяться. Но как только скорость начинает возрастать, грузик приходит в движение. Для любого момента времени t при очень малом е можно с достаточно хорошей точностью найти положение в момент t+ε через скорость и положение в момент t:
(9.13)
Конечно, это выражение тем точнее, чем меньше ε, но оно может быть достаточно точным, даже когда интервал ε не исчезающе мал. Что теперь можно сказать о скорости? Чтобы определить скорость в момент t+ε, очевидно, нужно знать, как она изменяется со временем, т. е. нужно знать ускорение. А как узнать его? Вот здесь-то нам на помощь приходят уравнения динамики. Именно они позволяют определить, чему равно ускорение. В нашей задаче уравнение динамики говорит, что ускорение равно -x. Поэтому
(9.14)
(9.15)
Уравнение (9.14) еще кинематическое; оно просто говорит о том, что из-за наличия ускорения скорость изменяется. Однако уравнение (9.15) уже динамическое, потому что оно связывает ускорение с силой. Оно говорит, что в данной частной задаче для данного момента времени ускорение можно заменить на -x(t). Следовательно, если в какой-то момент времени нам известны положение х и скорость vx, то мы знаем и ускорение, которое дает возможность найти скорость в следующий момент, а скорость в свою очередь определяет новое положение и т. д. Вот каким образом действует весь этот динамический механизм! Действующая сила немного изменяет скорость, а скорость приводит к небольшому изменению положения.
§ 5. Численное решение уравнений
Давайте теперь действительно решим нашу задачу. Допустим, что мы взяли ε=0,100 сек. (Если после того, как мы проделаем все вычисления, окажется, что этот интервал не достаточно мал, то необходимо повторить все сначала с меньшим интервалом времени, например 0,010 сек.) Чему будет равно х(0,1), если в начальный момент времени x(0)=1? Оно равно старому положению x(0) плюс скорость в начальный момент (которая равна нулю), умноженная на 0,10 сек. Таким образом, x(0,1) равно 1,00, ибо грузик еще не начал двигаться. Но новая скорость в момент 0,10 сек будет равна старой скорости v(0)=0 плюс ε, умноженное на ускорение. А само ускорение равно -x(0)=-1,00. Так что
и
Продолжая эту процедуру еще и еще, можно найти положение и скорость в любой момент времени, а это как раз то, что нам нужно. Однако практически мы используем нехитрый прием, который позволит увеличить точность вычислений. Если бы мы продолжали начатые нами расчеты, то они оказались бы довольно грубыми, поскольку интервал ε=0,10 сек довольно большой. Пришлось бы уменьшить его, скажем, до 0,01 сек. Но тогда, чтобы проследить движение за какой-то разумный отрезок времени, потребовалось бы сделать множество шагов. Мы же организуем процесс таким образом, что сможем увеличить точность, используя тот же интервал ε=0,10 сек. Этого можно достичь, несколько изменив метод расчета.
Заметьте, что новое положение тела равно старому плюс интервал времени ε, умноженный на скорость. Но что это за скорость? В какой момент? В начале интервала одна скорость, а в конце она совсем другая. Прием состоит в том, чтобы брать скорость в середине интервала. Если известна скорость в настоящий момент и известно, что она меняется, как же можно надеяться получить удовлетворительный результат, считая, что тело все время движется с той же скоростью, что и в настоящий момент? Более разумно использовать какую-то среднюю скорость между началом и концом интервала. Те же рассуждения применимы к изменению самой скорости: для подсчета ее изменений нужно использовать ускорение в средней точке между двумя моментами времени, в которых необходимо найти скорость. Таким образом, реально мы будем пользоваться следующими уравнениями: положение в конце интервала равно положению в начале плюс интервал ε, умноженный на скорость в середине интервала. Эта скорость в свою очередь равна скорости в середине предыдущего интервала (т. е. на отрезок ε меньше) плюс ускорение в начале интервала, умноженное на ε.
Таким образом, мы будем пользоваться уравнениями
(9.16)
Остается еще один небольшой вопрос: что такое v(ε/2)? Вначале у нас было v(0), а не v(-ε/2). Но теперь, чтобы начать наши вычисления, необходимо использовать дополнительное уравнение v(ε/2)=v(0)+(ε/2)а(0).
Таблица 9.1 решение уравнения (dvx/dt)=-x Интервал ε=0,10 сек
Ну, а теперь все готово для расчетов. Для удобства можно их выполнить в виде таблицы, в столбцах которой стоят время, положение, скорость и ускорение, причем скорость пишется в промежутках между строками (табл. 9.1). Такая таблица есть, конечно, просто удобный способ записи результатов, полученных из уравнений (9.16), и фактически полностью заменяет их. Мы просто заполняем одно за другим свободные места в ней и получаем очень интересную картину движения: сначала грузик находится в покое, затем понемногу приобретает отрицательную скорость (вверх), а это приводит к уменьшению его расстояния от точки равновесия. При этом хотя ускорение и становится меньше, оно все еще «подгоняет» скорость. Однако по мере приближения к положению равновесия (x=0) ускорение становится все меньше и меньше, скорость нарастает все медленней и медленней, но все же еще нарастает вплоть до точки x=0, которая достигается примерно через 1,5 сек. Скажем по секрету, что произойдет дальше. Грузик, конечно, не остановится в точке x=0, а пойдет дальше, но теперь все пойдет наоборот: его положение х станет отрицательным, а ускорение — положительным. Скорость начнет уменьшаться. Интересно сравнить полученные нами числа с функцией cost. Результат этого сравнения представлен на фиг. 9.4.
Фиг. 9.4. График движения грузика на пружинке.
Оказывается, что в пределах точности наших расчетов (три знака после запятой) совпадение полное! Позднее вы узнаете, что функция cos t — точное решение нашего уравнения, так что у вас теперь есть наглядное представление о мощи численного анализа: столь простой расчет дает столь точный результат.
§ 6. Движение планет
Приведенный анализ очень подходит к движению осциллирующей пружинки с грузиком, но можно ли таким же путем вычислять движение планеты вокруг Солнца? Давайте посмотрим, можно ли при некоторых приближениях получить эллиптическую орбиту. Предположим, что Солнце бесконечно тяжелое в том смысле, что его движение не будет приниматься в расчет.
Допустим, что в известной точке планета начала свое движение и имеет определенную скорость. Она движется вокруг Солнца по какой-то кривой, и мы попытаемся определить с помощью уравнений движения Ньютона и его же закона всемирного тяготения, что это за кривая. Как это сделать? В некоторый момент времени планета находится в каком-то определенном месте, на расстоянии r от Солнца; в этом случае известно, что на нее действует сила, направленная по прямой к Солнцу, которая, согласно закону тяготения, равна определенной постоянной, умноженной на произведение масс планеты и Солнца и деленной на квадрат расстояния между ними. Чтобы рассуждать дальше, нужно выяснить, какое ускорение вызывает эта сила.
Однако в отличие от предыдущей задачи нам потребуются теперь компоненты ускорения в двух направлениях, которые мы назовем х и у. Положение планеты в данный момент будет определяться координатами х и у, поскольку третья координата z всегда равна нулю.
Действительно, координатная плоскость xy выбрана нами таким образом, что z-компоненты как силы, так и начальной скорости равны нулю, а поэтому нет никаких причин, которые бы заставили планету выйти из этой плоскости. Сила при этом будет направлена по линии, соединяющей планету с Солнцем, как это показано на фиг. 9.5.
Фиг. 9.5. Сила притяжения, действующая на планету.
Из этого рисунка видно, что горизонтальная компонента силы так относится к полной ее величине, как координата x относится к расстоянию r. Это сразу следует из подобия треугольников. Кроме того, если x положительна, то Fx отрицательна, и наоборот.
Таким образом, Fx/|F|=-x/r, или Fx=-|F|x/r=-GMmx/r3 и соответственно Fy=-GMmy/r3. Теперь можно воспользоваться динамическими законами (9.7) и написать, что x- или y-компонента ускорения, умноженная на массу планеты, равна соответственно x- или y-компоненте силы:
(9.17)
Это именно та система уравнений, которую мы должны решить. Для того чтобы упростить вычисления, предположим, что либо единицы измерения времени или массы выбраны соответствующим образом, либо нам просто повезло, словом, получилось так, что GM≡1. Для нашего случая предположим, что в начальный момент t=0 планета находилась в точке с координатами x=0,500 и y=0,000, а скорость ее в этот момент направлена параллельно оси y и равна 1,6300. Как же в этом случае делаются расчеты? Снова составляется таблица со столбцами для времени t, координаты x, x-компонент скорости vx и ускорения ax. Затем идут отделенные чертой три колонки: для координаты y, y-компонент скорости и ускорения. Однако, для того чтобы подсчитать ускорения, мы должны воспользоваться уравнением (9.17), согласно которому его компоненты равны — x/r3 и — y/r3, а r=√(x2+y2). Так что, получив x и y, мы должны где-то в сторонке провести небольшие вычисления — извлечь квадратный корень из суммы квадратов и получить расстояние. Удобно также отдельно вычислить и 1/r3.
После этого все готово, чтобы определить компоненты ускорения. Всю эту работу можно сильно облегчить, если пользоваться таблицами квадратов, кубов и обратных величин. На нашу долю останется тогда только умножение x на 1/r3, которое легко выполняется на логарифмической линейке.
Перейдем к дальнейшему. Возьмем интервал времени ε=0,100. В начальный момент t=0
Отсюда находим
После этого можно вычислять компоненты vx(0,05) и vy(0,05):
А теперь начнем наш основной расчет:
и т. д.
В результате мы получим числа, приведенные в табл. 9.2, где приблизительно за 20 шагов прослежена половина пути нашей планеты вокруг Солнца.
На фиг. 9.6 отложены координаты планеты x и y, приведенные в табл. 9.2.
Фиг. 9.6. График движения планеты вокруг Солнца.
Точки представляют собой последовательные положения планеты через каждую десятую долю выбранной нами единицы времени. Видно, что сначала она двигалась быстро, а затем — все медленней и медленней. Видна также и форма кривой движения планеты. Итак, вы теперь знаете, как реально можно вычислять движение планет!
Давайте посмотрим теперь, как вычислить движение Нептуна, Юпитера, Урана и остальных планет. Можно ли сделать подробные расчеты со множеством планет, учитывая к тому же и движение Солнца? Разумеется, можно. Найдем сначала силу, действующую на каждую данную планету, например на ту, которую мы обозначим номером i и координаты которой xi, yi и zi (i=1 может означать Солнце, i=2 — Меркурий, i=3 — Венеру и т. д.). Наша задача — найти координаты всех планет. По закону тяготения x-компонента силы, действующая на i-ю планету со стороны планеты номер j с координатами xj yj, zj, будет равна — Gmimj(xi-xj)/rij3. Если же учесть силы со стороны всех планет, то получим следующую систему уравнений:
(9.18)
где rij — расстояние между i-й и j-й планетами:
(9.19)
а ∑ означает суммирование по всем остальным планетам, r. е. по всем значениям j, за исключением, конечно, j=i. Таким образом, чтобы решить это уравнение, нужно лишь значительно увеличить количество столбцов в нашей таблице. Для движения Юпитера понадобится девять столбцов, для Сатурна — тоже девять и т. д. Если нам заданы все начальные положения и скорости, то из уравнения (9.18) можно подсчитать все ускорения, вычислив, конечно, предварительно по формуле (9.19) все расстояния rij,. А сколько же времени потребуется на все эти вычисления? Если вы будете делать их сами дома, то очень много! Однако сейчас уже имеются машины, неимоверно быстро выполняющие все арифметические расчеты. Сложение, например, такая машина выполняет за 1 мксек, т. е. за одну миллионную долю секунды, а умножение — за 10 мксек. Так что если один цикл расчетов состоит из 30 операций умножения, то это займет всего лишь 300 мксек, или за 1 сек можно сделать 3000 циклов. Если мы хотим считать с точностью до одной миллиардной, то для того, чтобы покрыть все время обращения планеты вокруг Солнца, требуется 4·105 циклов. (Оказывается, что ошибка в расчетах приблизительно пропорциональна квадрату ε. Если брать интервал в тысячу раз меньший, то ошибка уменьшится в миллион раз. Так что для обеспечения нашей точности нужно взять интервал в 10 000 раз меньше.) На машине это займет 130 сек, или около 2 мин. Всего лишь 2 мин, для того чтобы «прогнать» Юпитер вокруг Солнца и при этом еще с точностью до одной миллиардной учесть все возмущения от других планет!
Итак, в начале этой главы для вас были загадкой движения грузика на пружинке, однако теперь вооруженные таким мощным орудием, как законы Ньютона, вы можете вычислять не только такие простые явления, как качание грузика, но и неимоверно сложные движения планет, причем с любой желаемой точностью! Нужна только машина, знающая арифметику.
Глава 10 ЗАКОН СОХРАНЕНИЯ ИМПУЛЬСА
§ 1. Третий закон Ньютона
Второй закон Ньютона, который связывает ускорение любого тела с действующей на него силой, позволяет хотя бы в принципе решить любую механическую задачу. Можно, например, с помощью числового метода, знакомого вам уже по предыдущей главе, определить движение нескольких частиц. Однако имеется еще достаточно причин, чтобы продолжить изучение законов Ньютона. Во-первых, существуют такие сравнительно простые случаи движения, которые можно изучать не только числовым путем, но и с помощью прямых математических методов. Вы знаете, например, что ускорение свободно падающего тела постоянно и равно 9,8 м/сек2. Исходя из этого, можно было бы численно восстановить всю картину движения, однако гораздо проще и удобнее с помощью математического анализа найти общее решение: s=s0+v0t+4,9t2. To же самое относится и к гармоническому осциллятору, расчету которого была посвящена часть предыдущей главы. Можно было бы просто аналитически доказать, что функция cost является точным решением этой задачи, поэтому нет необходимости в арифметических упражнениях, если ответ можно получить более простым и строгим методом.
Одна из таких задач — движение планеты вокруг Солнца. Можно, конечно, так же, как мы это делали в гл. 9, постепенно найти общую форму орбиты, однако и эта задача решается точно, причем в результате получается строго эллиптическая орбита.
Но, к сожалению, таких задач, которые могут быть точно решены с помощью анализа, очень мало. В том же гармоническом осцилляторе, например, если сила пружины не будет пропорциональна отклонению от положения равновесия, а окажется несколько сложнее, мы уже не сможем ничего поделать и вынуждены обращаться к численному расчету. Или, например, если вокруг Солнца вращается не одна планета, а две (т. е. имеются всего три тела, взаимодействующих друг с другом), то нам не удастся найти аналитическую форму такого движения и на деле задача тоже решается численно. Это знаменитая проблема трех тел, над которой в течение долгого времени бились лучшие умы человечества. Интересно, что, пока люди поняли ограниченные возможности математического анализа и необходимость использования числовых методов, потребовалось немало времени. Сейчас с помощью этих методов решается огромное количество задач, которые не могли быть решены аналитически. Та же знаменитая проблема трех тел, решение которой, как полагали, очень сложно, в числовом методе выглядит самой заурядной задачкой и решается способом, описанным в предыдущей главе, т. е. с помощью большого числа арифметических действий. Однако имеются ситуации, когда оба метода оказываются бессильны: простые задачи решаются аналитически, а задачи посложнее — числовым арифметическим методом, но очень сложные задачи невозможно решить ни так, ни этак. Возьмите, например, сложную задачу столкновения двух автомобилей или даже движение молекул газа. В кубическом миллиметре газа содержится бесчисленное количество частиц, и было бы безумием пытаться решать задачу со столькими переменными (около 1017, т. е. сто миллионов миллиардов!). Столь же сложна задача о движении звезд в шаровом скоплении, где вместо двух или трех планет, движущихся вокруг Солнца, собрано громадное количество звезд. Эти проблемы нельзя решить прямыми методами, и нужно изыскать какие-то другие пути.
При таком положении, когда детальное рассмотрение невозможно, полезно знать некоторые общие свойства, т. е. общие теоремы или принципы, которые являются следствием законов Ньютона. Один из таких принципов — это закон сохранения энергии, который мы обсуждали в гл. 4. Вторым принципом является закон сохранения импульса, которому посвящена настоящая глава. Другая причина необходимости дальнейшего изучения механики — это существование некоторых общих свойств движения, которые повторяются при различных обстоятельствах; так что полезно изучить это свойство на каком-то одном частном случае. Мы, например, будем изучать столкновения; различные виды столкновений имеют много общего. Или возьмем течение жидкости, неважно какой; законы течения разных жидкостей имеют много общего. Еще один пример, который мы будем изучать, это колебания, или осцилляции, в частности свойства механических волн: звука, колебания стержней и т. д.
Когда мы обсуждали законы Ньютона, то уже говорили о том, что они являются своего рода программой, которая призывает нас обратить особое внимание на силы. Но о самих силах Ньютон сказал только две вещи. Он полностью сформулировал закон для сил тяготения, но почти ничего не знал о более сложных силах, например о силах между атомами. Однако он открыл одно правило, одно общее свойство всех сил, которое составляет Третий закон. Таким образом, все, что Ньютон знал о природе сил, — это закон тяготения и общий принцип, который гласит:
Сила действия равна силе противодействия.
Означает это примерно следующее. Пусть имеются два маленьких тела, скажем две частицы, и пусть первая из них толкает вторую с некоторой силой. Тогда в соответствии с Третьим законом Ньютона вторая частица будет толкать первую с той же силой, но в противоположную сторону. Более того, эти силы будут действовать вдоль одной и той же линии. Эта гипотеза, или, если хотите, закон, предложенный Ньютоном, выполняется с большой точностью, хотя, впрочем, он не абсолютно точен (с нарушениями его мы познакомимся позднее). Сейчас, однако, мы будем считать его совершенно точным. Разумеется, если есть еще третья частица, которая расположена не на той же линии, что две первые, то закон вовсе не означает, что сила, действующая на первую частицу, равна полной силе, действующей на вторую. Ведь эта третья частица может толкать две первые, в результате чего полная сила, действующая на первую частицу, будет направлена по-другому и, вообще говоря, не будет ни равна, ни противоположна силе, действующей на вторую частицу. Однако полная сила, действующая на каждую из частиц, может быть разложена на две составляющие, которые представляют собой силы, действующие между каждой парой частиц. Эти компоненты силы для каждой пары частиц должны быть равны по величине и противоположны по направлению.
§ 2. Закон сохранения импульса
Давайте посмотрим, чем интересен Третий закон Ньютона. Предположим для простоты, что имеются только две взаимодействующие частицы — частица 1 и частица 2, масса которых может быть различна. К какому следствию приводит равенство и противоположная направленность сил между ними? Согласно Второму закону, сила равна скорости изменения импульса со временем, так что скорость изменения импульса частицы 1 равна скорости изменения импульса частицы 2, т. е.
(10.1)
Но если скорости изменения все время равны по величине и противоположны по направлению, то и полное изменение импульса частицы 1 равно и противоположно полному изменению импульса частицы 2. Это означает, что если мы сложим эти импульсы, то скорость изменения суммы под воздействием одних только взаимных сил (их обычно называют внутренними силами) будет равна нулю, т. е.
(10.2)
Напомним еще раз, что в нашей задаче мы предполагаем отсутствие каких-либо других сил, кроме внутренних. Но равенство нулю скорости изменения этой суммы означает просто, что величина (p1+p2) не изменяется с течением времени. (Эта величина записывается также в виде m1v1+m2v2 и называется полным импульсом двух частиц.) Таким образом, мы получили, что при наличии одних только внутренних сил полный импульс двух частиц остается неизменным. Это утверждение выражает закон сохранения полного импульса в данном случае. Из него следует, что если мы измеряем или подсчитываем величину m1v1+m2v2, т. е. сумму импульсов двух частиц, то для любых сил, действующих между ними, как бы сложны они ни были, мы должны получить одинаковый результат как до действия сил, так и после, т. е. полный импульс остается постоянным.
Рассмотрим теперь картину посложнее, когда есть три или большее число взаимодействующих частиц. Очевидно, что если существуют только внутренние силы, то полный импульс всех частиц остается постоянным, поскольку увеличение импульса одной частицы под воздействием другой частицы в точности компенсируется уменьшением импульса этой второй частицы из-за противодействия первой, т. е. внутренние силы так сбалансированы, что полный импульс всех частиц измениться не может. Таким образом, если нет сил, действующих на систему извне (внешних сил), то ничто не может изменить ее полный импульс и, следовательно, он остается постоянным.
Но нужно еще сказать о том, что произойдет, если будут еще существовать какие-то другие силы, кроме сил взаимодействия между частицами. Предположим, что мы изолировали систему взаимодействующих частиц. Если имеются только взаимные силы, полный импульс, как и прежде, меняться не будет, сколь бы сложны ни были эти силы. Если, однако, существуют силы, обусловленные частицами вне этой изолированной группы, то, как мы докажем позднее, сумма всех этих внешних сил равна скорости изменения полного импульса всех внутренних частиц. Это очень полезная теорема.
Закон сохранения полного импульса некоторого числа взаимодействующих частиц в отсутствие внешних сил можно записать в виде
(10.3)
где mi и vi — просто масса и скорость частицы соответствующего номера. Однако для каждой из этих частиц Второй закон Ньютона
(10.4)
пишется для любой составляющей полной силы и импульса в любом заданном направлении, так что x-компонента силы, действующей на частицу, равна скорости изменения x-компоненты импульса этой частицы
(10.5)
Точно такие же формулы можно написать для у- и z-компонент. Это означает, что уравнение (10.3) фактически представляет собой три уравнения: по одному на каждую из компонент.
Существует еще одно интересное следствие Второго закона Ньютона, кроме закона сохранения импульса. Доказательством его мы будем заниматься позднее, а сейчас я просто расскажу вам о нем. Следствие или, скорее, принцип состоит в том, что законы физики не изменяются от того, стоим ли мы на месте или движемся равномерно и прямолинейно. Пусть, например, на быстро летящем самолете ребенок играет с мячиком. Наблюдательный ребенок сразу заметит, что мячик прыгает точно так же, как и на земле. Иначе говоря, законы движения для ребенка в самолете (если только последний не меняет скорости) выглядят одинаково как на поле аэродрома, так и в полете. Этот факт известен под названием принципа относительности. В том виде, в котором он рассматривается здесь, мы будем называть его «принципом относительности Галилея» или «галилеевской относительностью», чтобы не путать его с более тщательным анализом, проделанным Эйнштейном, но об этом несколько позже.
Таким образом, из закона Ньютона мы вывели закон сохранения импульса, а теперь давайте посмотрим, какие специфические законы описывают соударение и рассеяние частиц. Однако для разнообразия, а также чтобы продемонстрировать типичные рассуждения, которыми мы часто пользуемся в физике в других случаях, когда, скажем, не известны законы Ньютона и должен быть принят иной метод рассмотрения, давайте обсудим законы рассеяния и соударения с совершенно другой точки зрения. Мы будем исходить из принципа относительности Галилея и в конце рассуждений придем к закону сохранения импульса.
Итак, начнем с утверждения, что законы природы не изменяются от того, что мы движемся прямолинейно с некоторой скоростью или стоим на месте. Однако прежде чем обсуждать процессы, в которых два тела сталкиваются и слипаются или разлетаются в стороны, давайте рассмотрим случай, когда эти два тела связаны между собой пружинкой или чем-то в этом роде, а затем вдруг освобождаются и разлетаются под действием этой пружинки или, быть может, небольшого взрыва в разные стороны. Кроме того, рассмотрим движение только в одном направлении. Предположим сперва, что эти два тела совершенно одинаковы и расположены симметрично. Когда между ними произойдет взрыв, одно из них полетит направо с некоторой скоростью v. Тогда естественно, что другое полетит налево с той же самой скоростью v, поскольку оба тела подобны и нет никаких причин считать, что левая сторона окажется предпочтительнее правой. Итак, с телами должно происходить нечто симметричное. Этот пример показывает, насколько полезны рассуждения такого рода в различных задачах. Но они не всегда столь ясны, когда затуманены формулами.
Таким образом, первый результат нашего эксперимента — одинаковые тела имеют одинаковую скорость. Но предположим теперь, что тела сделаны из различного материала, скажем один из меди, а другой из алюминия, но массы их равны. Мы будем предполагать, что если проделать наш опыт с двумя равными массами, то несмотря на то, что тела не одинаковы, скорости их тем не менее будут равны. В этом месте мне могут возразить: «Но ведь вы можете сделать и обратное. Вам незачем было это предполагать. Вы можете определить массы как равные, если они в нашем эксперименте приобретают одинаковую скорость». Давайте же примем это предложение и устроим небольшой взрыв между кусочком меди и очень большим куском алюминия, который настолько тяжел, что едва может быть сдвинут с места, тогда как медь стремительно отлетает. Это говорит о том, что алюминия слишком много. Уменьшим его количество и оставим лишь совсем маленький кусочек. Если устроить взрыв снова, то отлетит уже алюминий, а медь почти не сдвинется. Значит, сейчас слишком мало алюминия. Очевидно, что должно существовать какое-то промежуточное количество, которое можно постепенно подбирать, пока скорости разлета не станут равными. Теперь мы можем сказать, что раз равны скорости этих кусков, то массы их мы тоже будем считать равными (т. е. фактически мы переворачиваем сделанное ранее утверждение, что равные массы будут иметь одинаковую скорость). Самое интересное здесь то, что физический закон превращается просто в определение. Но тем не менее какой-то физический закон здесь все же есть, и если мы примем такое определение равенства масс, то этот закон можно найти следующим образом.
Пусть из предыдущего эксперимента нам известно, что два куска вещества А и В (медь и алюминий) имеют равные массы. Возьмем теперь третье тело, скажем кусок золота, и выровняем его массу (точно так же, как это делалось раньше) с массой меди. Если теперь в нашем эксперименте заменить медь золотом, то логически у нас нет никаких оснований утверждать, что эти массы (алюминия и золота) равны. Однако опыт показывает, что такое равенство имеет место. Таким образом, опытным путем мы обнаружили новый закон: если две массы порознь равны третьей (т. е. в нашем опыте они разлетаются с равными скоростями), то они равны между собой. (Этот закон вовсе не следует из подобного утверждения о величинах в математике; там оно просто постулируется.) Видите, как легко по неосторожности сделать безосновательное заключение. Утверждение, что массы равны, когда равны скорости, — это еще не определение; ведь при этом мы предполагаем справедливость математических законов равенства, что в свою очередь приводит к предсказанию результатов некоторых экспериментов.
Возьмем еще один пример. Пусть при некоторой силе взрыва установлено, что масса А равна массе В. А что произойдет, если увеличить силу взрыва? Будут ли равны скорости разлета в этом случае? Логика здесь снова бессильна, но опыт говорит, что это действительно так. Снова мы получаем закон, который утверждает: если из равенства скоростей двух тел делается заключение о равенстве их масс, то это равенство не зависит от величины скорости. Из этих примеров видно, что то, что сначала казалось просто определением, в действительности предполагает справедливость каких-то законов природы.
Итак, в дальнейших рассуждениях мы будем считать, что равные массы разлетаются в противоположные стороны с равными скоростями, если между ними происходит взрыв. А что произойдет, если мы обратим задачу, т. е. если два одинаковых тела, летящие навстречу друг другу с равными скоростями, сталкиваются и слипаются вместе? Как будут они двигаться? Здесь опять на помощь приходят соображения симметрии (т. е. что между левой и правой сторонами нет никакого различия), из которых следует, что образовавшееся тело должно стоять на месте. Мы будем также предполагать, что два тела с равной массой, летящих навстречу друг другу, даже если они сделаны из различного материала, после столкновения и слипания остановятся.
§ 3. Импульс всё-таки сохраняется!
Можно экспериментально проверить наши предположения о том, что, во-первых, покоящиеся два тела с равной массой, разорванные взрывом, полетят в разные стороны с равной скоростью и, во-вторых, что два тела, обладающие равными скоростями и массами, при соударении и слипании останавливаются. Такую проверку можно сделать с помощью замечательного устройства — воздушного желоба (фиг. 10.1).
Фиг. 10.1. Воздушный желоб (вид с торца).
В этом устройстве нет никаких трущихся деталей — вопрос, который очень беспокоил Галилея. Он не мог поставить эксперимента со скользящими телами, ибо они не скользили свободно, но о помощью чудесного желоба мы можем теперь избавиться от трения. Наши тела будут лететь без помех, а скорость их, согласно предвидению Галилея, будет оставаться постоянной. Это достигается тем, что тело поддерживается воздушной подушкой, а поскольку трение о воздух очень мало, то тело планирует практически с постоянной скоростью, если на него не действуют никакие силы. Возьмем сначала два скользящих бруска, вес или массы которых с большой точностью равны друг другу (практически измеряется вес, но он, как вы знаете, пропорционален массе), и поместим между ними небольшой взрыватель в закрытом цилиндре (фиг. 10.2).
Фиг. 10.2. Продольный разрез скользящего бруска, скрепленного со взрывным цилиндром.
Всю эту систему устанавливаем в центре желоба и электрической искрой поджигаем взрыватель. Что же произойдет? Если массы брусков одинаковы, то они, разлетевшись в стороны, одновременно достигнут концов желоба. Там они отскакивают от ограничителей, сталкиваются и слипаются в центре, точно в том же месте, откуда разлетелись (фиг. 10.3).
Фиг. 10.3. Схема эксперимента с равными массами.
Это интересный опыт. И в действительности происходит все так, как мы рассказали.
Теперь на очереди проблема посложнее. Допустим, мы имеем две массы, причем одна движется со скоростью v, а другая стоит на месте. Затем первая ударяет по второй и они слипаются. Что произойдет дальше? Образуется одно тело с массой 2m, которое как-то будет двигаться. Но с какой скоростью? Вот в чем вопрос. Чтобы ответить на него, предположим, что мы едем вдоль желоба на автомобиле. Все законы физики должны при этом выглядеть точно так же, как и прежде, когда мы стояли на месте. Мы начали с того, что если столкнуть два тела с равными массами и одинаковыми скоростями v, то после слипания они останавливаются. А теперь представьте, что в это время мы катим на автомобиле со скоростью —v. Какую же картину мы увидим? Ясно, что одно из тел, поскольку оно все время летит рядом с автомобилем, будет казаться нам неподвижным. Второе же, которое движется навстречу со скоростью v, покажется нам несущимся с удвоенной скоростью 2v (фиг. 10.4).
Фиг. 10.4. Неупругое соударение равных масс.
Наконец, образовавшееся после соударения и слипания тело будет казаться нам летящим со скоростью v. Отсюда мы делаем вывод, что если тело, летящее со скоростью 2v, ударяется о покоящееся тело той же массы и прилипает к нему, то образовавшееся тело будет двигаться со скоростью v, или (что математически то же самое) тело со скоростью v, ударяясь о покоящееся тело той же массы и прилипая к нему, образует тело, движущееся со скоростью v/2. Заметьте, что если умножить массы тел на их скорости и сложить их, то получим одинаковый результат как до столкновения (mv+0), так и после (2m·v/2). Вот как обстоит дело, если тело, обладающее скоростью v, столкнется с телом, находящимся в покое.
Точно таким же образом можно определить, что произойдет, когда сталкиваются два одинаковых тела, каждое из которых движется с произвольной скоростью.
Пусть одно тело летит со скоростью v1 , а другое — со скоростью v2 в том же направлении (v1>v2). Какова будет их скорость после соударения? Давайте снова сядем в машину и поедем, скажем, со скоростью v2. Тогда одно из тел будет казаться нам стоящим на месте, а второе — налетающим на него со скоростью v1-v2. Эта ситуация уже знакома нам, и мы знаем, что после соударения скорость нового тела по отношению к машине будет равна 1/2(v1-v2). Что же касается действительной скорости относительно земли, то ее можно найти, прибавив скорость автомобиля: v=1/2(v1-v2)+v2 или 1/2(v1+v2) (фиг. 10.5).
Фиг. 10.5. Другой случай неупругого соударения равных масс.
Обратите внимание, что снова
(10.6)
Таким образом, принцип относительности Галилея помогает нам разобраться в любом соударении равных масс. До сих пор мы рассматривали движение в одном измерении, однако на основе его становится ясным многое из того, что будет происходить в более сложных случаях соударения: нужно только пустить автомобиль не вдоль направления движения тел, а под каким-то углом. Принцип остается тем же самым, хотя детали несколько усложняются.
Чтобы экспериментально проверить, действительно ли тело, летящее со скоростью v после столкновения с покоящимся телом той же массы, образует новое тело, летящее со скоростью v/2, проделаем на нашей замечательной установке следующий опыт. Поместим в желоб три тела с одинаковыми массами, два из которых соединены цилиндром со взрывателем, а третье находится вблизи одного из них, хотя и несколько отделено от него. Оно снабжено клейким амортизатором, так что прилипает к тому телу, которое ударяет его. В первое мгновение после взрыва мы имеем два объекта с массами m, движущимися со скоростью v каждое. В последующее мгновение одно из тел сталкивается с третьим и образует новое тело с массой 2m, которое, как мы полагаем, должно двигаться со скоростью v/2. Но как проверить, что скорость его действительно v/2? Для этого мы вначале установим тела таким образом, чтобы расстояния до концов желоба относились как 2:1, так что первое тело, которое продолжает двигаться со скоростью v, должно пролететь за тот же промежуток времени вдвое большее расстояние, чем скрепившиеся два других тела (с учетом, конечно, того малого расстояния Δ, которое второе тело прошло до столкновения с третьим). Если мы правы, то массы m и 2m должны достичь концов желоба одновременно; так оно и происходит на самом деле (фиг. 10.6).
Фиг. 10.6. Экспериментальная проверка того факта, что масса m, ударяя со скоростью v массу m, образует тело с массой 2m и скоростью v/2.
Следующая проблема, которую мы должны решить: что получится, если тела имеют разные массы. Давайте возьмем массы m и 2m и устроим между ними взрыв. Что произойдет тогда? С какой скоростью полетит масса 2m, если масса m летит со скоростью v? Фактически нам нужно повторить только что проделанный эксперимент, но с нулевым зазором между вторым и третьим телом. Разумеется, что при этом мы получим тот же результат — скорости тел с массами m и 2m должны быть соответственно равны -v и v/2. Итак, при разлете тел с массами m и 2m получается тот же результат, что и при симметричном разлете двух тел с массами m с последующим неупругим соударением одного из этих тел с третьим, масса которого тоже равна m. Более того, отразившись от концов, каждое из этих тел будет лететь с почти той же скоростью, но, конечно, в обратном направлении, и после неупругого соударения они останавливаются.
Перейдем теперь к следующему вопросу. Что произойдет, если тело с массой m и скоростью v столкнется с покоящимся телом с массой 2m? Воспользовавшись принципом относительности Галилея, можно легко ответить на этот вопрос. Попросту говоря, нам нужно опять садиться в машину, идущую со скоростью -v/2 (фиг. 10.7), и наблюдать за только что описанным процессом.
Фиг. 10.7. Неупругое соударение между телами с массами m и 2m.
Скорости, которые мы при этом увидим, будут равны
После соударения масса 3m покажется нам движущейся со скоростью v/2. Таким образом, мы получили, что отношение скоростей до и после соударения равно 3:1, т. е. образовавшееся тело с массой 3m будет двигаться в три раза медленней. И в этом случае снова выполняется общее правило: сумма произведений массы на скорость остается той же как до, так и после соударения: mv+0 равно 3m·v/3. Вы видите, как постепенно шаг за шагом устанавливается закон сохранения импульса.
Итак, мы рассмотрели столкновение одного тела с двумя. Используя те же рассуждения, можно предсказать результаты столкновения одного тела с тремя телами, двух тел с тремя телами и т. д. На фиг. 10.8 как раз показан случай разлета масс 2m и 3m из состояния покоя.
Фиг. 10.8. Разлет тел с массами 2m и 3m.
В каждом из этих случаев выполняется одно и то же правило: масса первого тела, умноженная на его скорость, плюс масса второго тела, умноженная на его скорость, равны произведению полной массы на скорость ее движения. Все это — примеры сохранения импульса. Итак, начав с простого случая симметричных равных масс, мы установили закон сохранения для более сложных случаев. В сущности это можно сделать для любого рационального отношения масс, а поскольку любое число может быть со сколь угодно большой точностью заменено рациональным, то закон сохранения импульса справедлив для любых масс.
§ 4. Импульс и энергия
Во всех предыдущих примерах мы рассматривали только случаи, когда два тела сталкиваются и слипаются или с самого начала были скреплены вместе, а потом разделяются взрывом. Однако существует множество примеров соударений, в которых тела не сцепляются, как, например, столкновение двух тел равной массы и одинаковой скорости, которые затем разлетаются в разные стороны. На какой-то краткий миг они соприкасаются и сжимаются. В момент наибольшего сжатия они останавливаются и их кинетическая энергия полностью переходит в энергию упругого сжатия (они как две сжатые пружины). Эта энергия определяется из кинетической энергии, которой обладали тела до столкновения и которая равна нулю в момент их остановки. Однако кинетическая энергия теряется только на одно мгновение. Сжатое состояние, в котором находятся наши тела, — это все равно что заряд в предыдущих примерах, который при взрыве выделяет энергию. В следующее мгновение происходит нечто подобное взрыву — тела разжимаются, отталкиваются друг от друга и разлетаются в стороны. Эта часть процесса вам тоже хорошо знакома: тела полетят в разные стороны с одинаковыми скоростями. Однако скорости отдачи, вообще говоря, будут меньше тех начальных скоростей, при которых они столкнулись, ибо для взрыва используется не вся энергия, а только какая-то ее часть, но это уже зависит от свойств материала, из которого сделаны тела. Если это мягкий материал, то кинетическая энергия почти не выделяется, но если это что-то более упругое, то тела более охотно отскакивают друг от друга. Неиспользованный остаток энергии превращается в тепло и вибрацию, тела нагреваются и дрожат; впрочем, энергия вибрации тоже вскоре превращается в тепло. В принципе можно сделать тела из столь упругого материала, что на тепло и вибрацию не будет расходоваться никакой энергии, а скорости разлета в этом случае будут практически равны начальным. Такое соударение мы называем упругим.
Тот факт, что скорости до и после соударения равны, — заслуга не закона сохранения импульса, а закона сохранения энергии, но то, что скорости разлета после симметричного соударения равны друг другу, в этом уже повинен закон сохранения импульса.
Точно таким же способом можно разобрать случай соударения тел с различными массами, различными начальными скоростями, различными упругостями и определить конечные скорости и потерю кинетической энергии; но мы не будем сейчас подробно разбирать эти явления.
Упругое соударение особенно часто встречается между системами, у которых нет никаких внутренних механизмов, никаких «шестеренок, маховиков или других частей». В таких случаях кинетическая энергия не может ни на что растратиться: ведь разлетающиеся тела находятся в тех же условиях, что и налетающие. Поэтому между элементарными объектами соударение всегда или почти всегда упругое. Говорят, например, что соударение между атомами и молекулами абсолютно упругое. Хотя это действительно очень хорошее приближение, но и эти соударения не абсолютно упругие; в противном случае трудно было бы понять, откуда у газа берется энергия на излучение тепла и света. Иногда при столкновениях молекул газа испускаются инфракрасные лучи, однако это случается крайне редко и к тому же излученная энергия очень мала, так что для многих целей столкновения молекул газа можно рассматривать как абсолютно упругие.
Давайте разберем интересный пример упругого столкновения двух тел равных масс. Если такие тела ударяются друг о друга с какой-то равной скоростью, то по соображениям симметрии они должны разлететься в стороны с той же скоростью. Но давайте посмотрим на этот процесс в несколько другой ситуации, когда одно из тел движется со скоростью v, а другое покоится. Что произойдет в этом случае? Такая задача не нова для нас. Нужно посмотреть из автомобиля, движущегося рядом с одной из частиц, на симметричное соударение. Мы увидим, как движущееся тело столкнется с покоящимся и остановится, а то, которое раньше покоилось, полетит вперед, причем в точности с той же скоростью, с которой двигалось первое. Тела попросту обменяются своими скоростями. Это легко можно подтвердить экспериментально. Вообще если два тела движутся навстречу друг другу с различными скоростями, то при упругом соударении они просто обмениваются скоростями.
Другой пример почти абсолютно упругого взаимодействия дает нам магнетизм. Положите пару U-образных магнитов на наши скользящие бруски в воздушном желобе так, чтобы они отталкивались друг от друга. Если теперь потихоньку подтолкнуть один из брусков к другому, то он, не касаясь, оттолкнет его, а сам остановится. Второй же брусок полетит вперед.
Закон сохранения импульса — очень полезная штука. Он позволяет решить многие проблемы, не входя в детали процесса. Нас, например, совершенно не интересовали детали движения газа при взрыве заряда, но тем не менее мы могли предсказать, во сколько раз одно тело будет двигаться быстрее второго при их разлете. Другой интересный пример — это ракетный двигатель. Ракета большой массы М с огромной скоростью V (относительно самой ракеты) извергает сравнительно небольшое количество m газа. Чтобы сохранить импульс, ракета начинает двигаться с небольшой скоростью v. Используя закон сохранения импульса, можно подсчитать, что
Однако по мере извержения скорость ракеты становится все больше и больше. Механизм действия ракетного двигателя в точности сходен с явлением отдачи ружья; здесь не нужен воздух, чтобы отталкиваться от него.
§ 5. Релятивистский импульс
Уже на нашей памяти закон сохранения импульса претерпел некоторые изменения. Они, однако, не коснулись самого закона как такового, просто изменилось понятие импульса. В теории относительности, как оказалось, импульс уже не сохраняется, если его понимать так же, как и прежде. Дело в том, что масса не остается постоянной, а изменяется в зависимости от скорости, а потому изменяется и импульс. Это изменение массы происходит по закону
(10.7)
где m0 — масса покоящегося тела, c — скорость распространения света. Из этой формулы видно, что при обычных скоростях (если v не очень велико) m очень мало отличается от m0, а импульс поэтому с очень хорошей точностью выражается старой формулой.
Компоненты импульса для одной частицы можно записать в виде
(10.8)
где v2=v2x+v2y+v2z. Если просуммировать x-компоненты импульсов всех взаимодействующих частиц, то эта сумма как до столкновения, так и после окажется одной и той же. Это и есть закон сохранения импульса в направлении оси х. То же можно сделать и в любом другом направлении.
В гл. 4 мы уже видели, что закон сохранения энергии неверен, если мы не признаем эквивалентности энергии во всех ее формах, т. е. электрической энергии, механической энергии, энергии излучения, тепловой и т. д. Про некоторые из этих форм, например тепло, можно сказать, что энергия «скрыта» в них. Напрашивается вопрос: а не существуют ли также «скрытые» формы импульса, скажем «тепловой импульс»? Дело в том, что импульс утаить невозможно; скрыть его очень трудно по следующим причинам.
Мера тепловой энергии — случайного движения атомов тела — представляет собой просуммированные квадраты их скоростей. В результате получается некоторая положительная величина, не имеющая направленного характера. Так что тепло как бы заключено внутри тела независимо от того, движется ли оно как целое или нет. Поэтому сохранение энергии в тепловой форме не очень очевидно. С другой стороны, если мы просуммируем скорости, которые имеют направление, и в результате получим не нуль, то это означает, что само тело целиком движется в некотором направлении, а такое макродвижение мы уже способны наблюдать. Так что никакой случайной внутренней потери импульса не существует: тело обладает определенным импульсом, только когда оно движется целиком. В этом и состоит основная причина того, что импульс трудно скрыть. Но тем не менее скрыть его все же можно, например в электромагнитное поле. Это еще одна из особенностей теории относительности.
Ньютон считал, что взаимодействие на расстоянии должно быть мгновенным. Но это, оказывается, неверно. Возьмем, например, электрические силы. Пусть электрический заряд, расположенный в некоторой точке, вдруг начинает двигаться, тогда его действие на другой заряд в другой точке не будет мгновенным: существует небольшое запаздывание. При таком положении, даже если силы действия и противодействия равны между собой, импульсы не будут компенсироваться. Существует небольшой промежуток времени, в течение которого будет происходить нечто странное; в то время как первый заряд испытывает какое-то воздействие силы и реагирует на нее изменением своего импульса, второй стоит как ни в чем не бывало и не изменяет импульса. На передачу влияния второму заряду через разделяющее их расстояние требуется некоторое время: «влияние» распространяется не мгновенно, а с некоторой конечной (хотя и очень большой) скоростью 300 000 км/сек. В течение этого крохотного промежутка времени импульс частиц не сохраняется. Но, разумеется, после того как второй заряд испытает влияние первого, импульсы компенсируются, наступает полный порядок, но все-таки в течение некоторого момента закон был нарушен. Мы представляем дело таким образом, что в течение этого интервала существует импульс другого рода, чем импульс частиц mv, и это импульс электромагнитного поля. Если сложить его с импульсами частиц, то эта сумма в любой момент сохраняется. Однако тот факт, что электромагнитное поле может обладать импульсом и энергией, делает его реальностью, а утверждение о том, что между частицами действуют силы, переходит в утверждение о том, что частица создает поле, которое в свою очередь действует на другую частицу. Само же поле имеет многие свойства, аналогичные частицам; оно может нести энергию и импульс. Для иллюстрации рассмотрим еще один пример; в электромагнитном поле могут существовать волны, которые мы называем светом. И вот оказывается, что свет тоже несет какой-то импульс, так что когда он падает на предмет, то передает ему некоторое количество своего импульса. Это эквивалентно действию какой-то силы, ведь освещенный предмет изменяет свой импульс, как будто на него действует некоторая сила. Итак, падая на предмет, свет оказывает на него давление. Хотя это давление очень мало, но достаточно тонкими приборами его все же можно измерить.
Оказывается, что в квантовой механике импульс тоже не mv, а нечто совсем другое. Здесь уже трудно определить точно, что же такое скорость частицы, но импульс все-таки существует. Разница же состоит в том, что когда частицы действуют как частицы, то их импульс по-прежнему mv, но когда они действуют как волны, то импульс уже измеряется числом волн на 1 см: чем больше волн, тем больше импульс. Однако, несмотря на это различие, закон сохранения импульса справедлив и в квантовой механике. Неверными оказались уравнение Ньютона f=ma и все его выводы закона сохранения импульса, тем не менее в квантовой механике в конце концов этот закон продолжает действовать!
Глава 11 ВЕКТОРЫ
§ 1. Симметрия в физике
В этой главе мы вводим понятие, которое среди физиков известно под названием симметрия законов физики. Слово «симметрия» употребляется здесь в несколько необычном смысле, и поэтому нужно его определить. Как же определить симметрию какого-либо предмета? Когда мы говорим, что изображение симметрично, то этим мы хотим сказать, что одна его часть такая же, как другая. Профессор Герман Вейль дал такое определение симметрии: предмет симметричен, если его можно подвергнуть какой-либо операции, после которой он будет выглядеть как и вначале. Например, если мы повернем вазу на 180° вокруг вертикальной оси и она не изменит своего внешнего вида, то мы говорим, что обе стороны вазы симметричны. Мы будем понимать определение Вейля в более широком смысле и говорить о симметрии законов физики.
Предположим, что где-то мы установили сложную машину со множеством зацеплений, с какими-то маховиками, шатунами и т. п. Предположим теперь, что в каком-то другом месте мы собрали такое же устройство, все части которого являются точной копией частей прежней машины, причем сохранены все размеры и ориентация отдельных ее частей, все то же самое, только перенесено на некоторое расстояние. Затем мы запустим обе машины в одинаковых условиях и посмотрим, будут ли они работать совершенно одинаково? Будут ли движения отдельных частей одной машины повторять в точности соответствующие движения другой? Вообще говоря, ответ может быть отрицательным, потому что мы можем ведь выбрать для второй машины неудачное место, скажем поставить ее так, что какие-то ее части будут при работе ударяться о стенку, тогда машина вовсе не будет работать.
Любая физическая идея требует здравого смысла при своем осуществлении, ведь это не чисто математические или абстрактные идеи. Нужно понимать, что мы имеем в виду, когда говорим, что при перенесении какого-либо устройства в другое место наблюдаются те же явления. Под этим мы понимаем, что мы передвигаем все, что можно передвинуть. Если же при этом явление в чем-то изменяется, то мы предположим, что что-то послужило помехой, и займемся изучением причин. Если мы ничего не обнаружим, то объявим, что физические законы не обладают ожидаемой симметрией. Но если физические законы все-таки обладают симметрией, то мы найдем причину помех, во всяком случае мы надеемся найти ее. Осмотревшись, мы обнаружим, например, что работе машины мешает стена. Основной вопрос состоит в следующем: если мы достаточно хорошо изучим наши устройства, если все основные источники сил имеются внутри аппарата и если на другое место передвинуть все, что следовало передвинуть, то будут ли законы меняться? Будет ли машина на новом месте работать так, как раньше?
Ясно, что мы хотим передвинуть само устройство и источники основных влияний, а вовсе не все на свете — планеты, звезды и т. п., ибо если бы мы и совершили эту грандиозную работу, то наблюдали бы прежнее явление по той простой причине, что мы оказались бы на том же самом месте. Но мы и не можем передвинуть все на свете. Оказывается, что если передвигать наше устройство более или менее разумно, то оно будет работать одинаково. Другими словами, если мы не будем вламываться в стенку, будем знать происхождение внешних сил и постараемся, чтобы они были передвинуты вместе с машиной, то она будет работать на новом месте так же хорошо, как и прежде.
§ 2. Переносы начала
Мы ограничим наше рассмотрение законами механики, которую достаточно хорошо изучили. В предыдущих главах мы установили, что законы механики можно свести к трем справедливым для любой частицы уравнениям:
(11.1)
Это означает, что существует такой способ измерения расстояний х, у и z вдоль трех взаимно перпендикулярных осей и сил вдоль этих направлений, при котором определяемые уравнениями (11.1) законы верны. Расстояния должны отсчитываться от некоторого начала, но где следует расположить это начало? Ньютон сказал нам только, что такая точка, от которой можно начать отсчет, существует; может быть, это центр Вселенной, и при измерении расстояний от нее его законы верны. Но мы можем немедленно показать, что незачем искать центр Вселенной, ибо безразлично, какую точку взять за начало координат. Иными словами, предположим, что имеются два человека — Джо, который выбрал начало своей системы координат в какой-то точке, и Мик, который построил систему координат, параллельную первой, но принял за начало другую точку (фиг. 11.1), расположенную на расстоянии а по оси х в его системе.
Фиг. 11.1. Две параллельные координатные системы.
Когда Джо определяет положение произвольной точки в пространстве, он находит три ее координаты: x, y и z (обычно мы опускаем ось z, ибо ее трудно изобразить на нашем чертеже). В системе Мика эта точка будет иметь другое значение х (чтобы отличить его, введем обозначение х') и, вообще говоря, другое значение у, хотя в нашем примере они численно равны. Таким образом, мы имеем
(11.2)
Чтобы сделать наш анализ полным, нужно знать, какие силы измеряет Мик. Если сила действует вдоль произвольной линии, то под силой вдоль направления х мы понимаем некоторую часть общей силы, которая равна произведению величины силы на косинус угла между направлением силы и осью х. Легко видеть, что Мик получит те же проекции силы, какие получил Джо, т. е. мы имеем систему уравнений
(11.3)
Уравнения (11.2) и (11.3) определяют соотношения между величинами, используемыми Джо и Миком.
Теперь поставим вопрос так: если Джо знает законы Ньютона, то будут ли они верны, когда их попробует использовать Мик? Имеет ли значение выбор начала координат? Другими словами, предположим, что уравнения (11.1) верны, а (11.2) и (11.3) определяют соотношения между измеряемыми величинами; верно ли, что
(11.4)
Чтобы проверить эти уравнения, дважды продифференцируем выражение для х' по времени. Прежде всего
Предположим теперь, что начало системы координат, которой пользуется Мик, фиксировано (не движется) относительно системы координат Джо, т. е. а постоянна и da/dt=0; таким образом, получаем
и, следовательно,
Если предположить, что измеряемые Джо и Миком массы равны, то уравнение (11.4а) принимает вид
Таким образом, произведения массы на ускорение одинаковы у обоих друзей. Можно получить и формулу для Fx' . Использовав (11.1), мы обнаружим
Следовательно, законы механики, с точки зрения Мика, точно такие же: он пишет законы Ньютона в других координатах, и эти законы оказываются верными. Это означает, что центра Вселенной нет и законы движения выглядят одинаково, с какого бы места они ни наблюдались.
Верно и такое утверждение: если в каком-либо месте установить устройство с каким-то механизмом, то и в любом другом месте это устройство будет работать одинаково. Почему? Потому что любая машина, которую изучает Мик, подчиняется тем же уравнениям, которые описывают работу машины, контролируемой Джо. Поскольку уравнения одинаковы, то и явления одни и те же. Таким образом, доказательство того, что аппарат в новом месте будет работать так же, как на прежнем, сводится к доказательству, что отнесенные к новой точке пространства уравнения воспроизводят себя. Поэтому мы говорим, что законы физики симметричны относительно перемещений в пространстве, симметричны в том смысле, что законы не изменяются при перемещениях начала системы координат. Конечно, каждый интуитивно знает, что это верно, но интересно и полезно обсудить математику этого явления.
§ 3. Вращения
Разобрав вопрос о перенесении начала координат, мы рассмотрели первую задачу из серии более сложных теорем о симметрии физических законов. Следующая теорема утверждает, что и направления координатных осей можно выбрать произвольно. Другими словами, если мы сооружаем где-то какое-то устройство и наблюдаем, как оно работает, а затем по соседству соорудим аналогичное устройство, но расположим его под любым углом относительно первого, то будет ли второе устройство работать так же, как и первое? Вообще говоря, нет, если это, например, старые часы-ходики, известные еще нашим дедам. Если маятник ходиков расположен отвесно, они будут великолепно идти, но если их повернуть так, чтобы маятник уперся в стенку, верного времени они уже не покажут. Значит, нашу теорему нельзя применить к маятнику, если забыть о силе, которая заставляет его качаться. Если мы все-таки верим в симметрию физических законов относительно вращений, то мы должны сделать какие-то вполне определенные предположения о работе ходиков, например что для их работы важен не только часовой механизм, но и что-то, лежащее за его пределами, что-то, что следует обнаружить. Можно также предсказать, что ходики будут идти по-разному, если они попадут куда-то в другое место по отношению к загадочному пока источнику асимметрии (может быть, это Земля). Так и есть на самом деле. Мы знаем, что ходики на искусственном спутнике, например, вообще остановятся, ибо там отсутствует эффективная сила, а на Марсе скорость их хода будет совсем иной. Маятниковые часы содержат, помимо механизма, еще нечто вне их. Осознав этот факт, мы увидим, что вместе с ходиками нам придется повернуть и Землю. Но нам, конечно, незачем беспокоиться — сделать это очень легко. Мы просто подождем минуту или две, и Земля сама повернется, а ходики затикают уже в новом положении так же весело, как и раньше. Пока мы поворачиваемся в пространстве, измеряемые нами углы изменяются тоже; эти изменения не причиняют особых беспокойств, поскольку в новых условиях мы чувствуем себя точно так же, как и в старых. Здесь может скрываться источник ошибки; верно, что в новом, повернутом относительно старого положении законы остаются прежними, но неверно то, что во вращающейся системе координат справедливы те же законы, что и в покоящейся. Если проделать достаточно тонкие опыты, то можно установить, что Земля вращается, но ни один из этих опытов не скажет нам, что Земля повернулась. Другими словами, мы не можем при помощи этих опытов установить ориентацию Земли, но можем сказать, что ориентация изменяется.
Обсудим теперь влияние ориентации системы координат на физические законы. Давайте посмотрим, не будут ли нам снова полезны Мик и Джо. Чтобы избежать ненужных сложностей, предположим, что эти молодые люди находятся в одной точке пространства (мы уже показали, что их системы координат можно перемещать). Пусть оси системы координат Мика повернуты относительно системы координат Джо на угол θ. Обе системы координат изображены на фиг. 11.2, где мы ограничились двумя измерениями.
Фиг. 11.2. Две координатные системы, ориентированные по-разному.
Произвольная точка Р снабжается координатами (x, y) в системе Джо и (х', у') в системе Мика. Как и в предыдущем случае, начнем с того, что выразим координаты х' и у' через x, y и θ. Для этого опустим из Р перпендикуляры на все четыре координатные оси и проведем АВ перпендикулярно PQ. Из чертежа ясно, что х' можно представить как сумму двух отрезков вдоль оси х', а у' — как разность двух отрезков вдоль АВ. Длины этих отрезков выражаются через x, y и 6; мы добавляем еще уравнение для третьей координаты:
(11.5)
Теперь (мы поступали так и раньше) установим соотношения между силами, измеряемыми двумя наблюдателями. Предположим, что сила F, имеющая (с точки зрения Джо) составляющие Fx и Fy , действует на расположенную в точке Р на фиг. 11.2 частицу массы m. Для простоты сдвинем обе системы координат так, что начала их переместятся в точку Р, как показано на фиг. 11.3. Мик скажет нам, что сила, по его мнению, имеет составляющие Fx' и Fy' вдоль его осей.
Фиг. 11.3. Составляющие сил в двух системах.
Составляющая Fx, как и Fy, имеет составляющие вдоль обеих осей х' и у'. Чтобы выразить Fx' через Fx и Fy , сложим составляющие этих сил вдоль оси х'; точно таким же образом можно выразить и Fy' через Fx и Fy . В результате получим
(11.6)
Интересно отметить случайность, которая в дальнейшем окажется очень важной: формулы (11.5) и (11.6) для координат Р и составляющих F соответственно тождественны по форме.
Как и раньше, предположим, что законы Ньютона справедливы в системе координат Джо и выражаются уравнениями (11.1). Снова возникает вопрос: может ли Мик пользоваться законами Ньютона, будут ли их предписания выполняться в повернутой системе координат? Другими словами, если предположить, что уравнения (11.5) и (11.6) дают связь между измеряемыми величинами, то верно ли, что
(11.7)
Чтобы проверить эти уравнения, вычислим левые и правые части независимо, а затем сравним результаты. Чтобы вычислить левые части, умножим уравнения (11.5) на m и продифференцируем их дважды по времени, считая угол θ постоянным. Это дает
(11.8)
Вычислим правые части уравнений (11.7), подставив (11.1) в уравнения (11.6). Получаем
(11.9)
Глядите! Правые части уравнений (11.8) и (11.9) тождественны; значит, если законы Ньютона верны в одной системе координат, то ими можно пользоваться и в другой системе. Эти рассуждения заставляют нас сделать некоторые важные выводы: во-первых, никто не может утверждать, что избранная им система координат единственна, она может быть, конечно, более удобной при решении частных задач. Например, удобно, но не обязательно взять направление силы тяжести за одну из осей координат. Во-вторых, это означает, что любой механизм, если только он является самостоятельным устройством и обладает всем необходимым для создания силы, будет работать одинаково, как бы его ни повернули.
§ 4. Векторы
Насколько нам известно сейчас, не только законы Ньютона, но и все физические законы обладают двумя свойствами, которые называют инвариантностью (или симметрией) относительно перемещений и поворотов координатных осей. Эти свойства столь важны, что для учета их при изучении физических законов была разработана специальная математическая техника.
Решение поставленных в предыдущих параграфах задач потребовало довольно длинных расчетов. Чтобы свести их к минимуму, изобретен могучий математический аппарат. Эта система, называемая векторным анализом, определила название главы, хотя в ней, собственно говоря, речь идет о симметрии физических законов. Конечно, можно получить искомый результат, поступая так, как было описано раньше, но, чтобы облегчить и ускорить нашу задачу, мы применяем технику векторного анализа.
Заметим, что в физике важно знать величины двух типов (на самом деле их больше двух, но давайте начнем с двух). Величины первого типа, например число картофелин в мешке, мы будем называть обыкновенными числами, или скалярами. Еще одним примером такой величины может служить температура. Другие очень важные в физике величины имеют направление, это, например, скорость; мы должны задать не только быстроту перемещения тела, но и путь, по которому оно движется. Импульс и сила тоже имеют направление, как и смещение: когда кто-нибудь делает шаг, можно сказать не только, как далеко он шагнул, но и куда он шагает, т. е. определить направление его движения.
Все величины, имеющие направление, подобно шагу в пространстве, называются векторами.
Вектор определяется тремя числами. Чтобы описать шаг, скажем из начала координат в точку Р, определяемую координатами x, y и z, мы фактически должны задать три числа. Но мы будем использовать для этой цели один-единственный математический символ r, с которым нам чаще всего придется иметь дело в дальнейшем[12]. Это не одно число: символ r задается тремя числами: x, y и z. Символ r означает три числа, но не только эти три числа, потому что при переходе к другой системе координат нужно заменить их числами х', у' и z'. Однако мы хотим как можно более упростить нашу математику и используем один и тот же символ в качестве представителя трех чисел x, y, z и трех чисел х', у', z'. Точнее говоря, мы используем один и тот же символ в качестве представителя первого набора чисел в одной системе координат и делаем его представителем второго набора чисел, если захотим сменить систему координат. Это удобно потому, что нам не придется изменять формы уравнений при переходе от одной системы координат к другой. Если мы записываем уравнения, используя координаты x, y и r, а затем меняем систему отсчета, то появляются координаты х', у' и z', но мы пишем просто r, условившись, что этот символ служит представителем x, y, z, если мы пользуемся первой системой отсчета, и х', у', z', если мы перешли к другой системе. Три числа, которые описывают векторную величину в заданной системе отсчета, называются составляющими (компонентами) вектора в направлении координатных осей системы отсчета. Иначе говоря, мы используем один символ для обозначения трех букв, и он соответствует наблюдению одного и того же объекта с трех разных точек зрения. Произнося слова «один и тот же объект», мы обращаемся к нашей физической интуиции, которая говорит нам, что шаг в пространстве не зависит от того, какими составляющими мы его описываем. Итак, символ r представляет один и тот же объект независимо от того, как мы ориентируем оси системы отсчета.
Предположим теперь, что существует другая направленная величина, например сила — еще одна величина, которую можно определить, задав связанные с ней три числа. Эти три числа переходят при изменении системы координат в другие три числа по строго определенным математическим правилам. Эти правила должны быть теми же самыми, которые определяли переход тройки чисел x, y, z в х' , у', z'. Другими словами, вектор — это величина, определяемая тремя числами, которые преобразуются при изменениях системы координат так же, как составляющие шага в пространстве. Уравнение типа
справедливо в любой системе координат, если оно верно хотя бы в одной из них. Оно заменяет нам три уравнения
или соответственно
Тот факт, что физические соотношения между какими-либо величинами можно выразить в виде векторных уравнений, говорит о том, что эти соотношения верны в любой системе координат. Вот почему понятие вектора очень удобно в физике.
Давайте теперь рассмотрим некоторые свойства векторов. В качестве примера «вектора» можно указать скорость, импульс, силу и ускорение. Часто бывает удобно изобразить вектор в виде стрелки, указывающей направление действия. Но почему же можно представить силу стрелкой? Да потому, что она преобразуется по тем же законам, что и «шаг в пространстве». Именно поэтому можно представить силу в виде чертежа, как если бы это изображалось перемещение, причем выберем такой масштаб, чтобы единица силы, например ньютон, соответствовала некоторой длине. Проделав такую процедуру однажды, мы всегда сможем изображать силы в виде отрезков, потому что уравнение типа
(где k — некоторая постоянная) имеет вполне определенный смысл. Возможность представлять силу отрезком сулит нам большие выгоды, потому что, изобразив отрезок или стрелку, можно не заботиться о координатных осях. При этом, конечно, всегда можно быстро подсчитать, как изменяются составляющие вектора при поворотах осей, потому что дело сводится к простому геометрическому построению.
§ 5. Векторная алгебра
Теперь мы должны описать законы, или правила, регулирующие возможные сочетания различных векторов. Прежде всего мы изучим сумму двух векторов. Пусть векторы a и b задаются в какой-нибудь системе координат составляющими аx, ay, az и bx, by ,bz. Предположим, что кому-то пришло в голову составить три числа аx+bx, ay+by , аz+bz. Получим ли мы в результате вектор? Вы можете сказать: «Разумеется, ведь это три числа, а три числа образуют вектор». Нет, вектор образуют не любые три числа! Чтобы задать вектор, мы должны связать заданные нам три числа с координатной системой так, чтобы при повороте координатных осей эти числа «поворачивались» относительно друг друга и «перемешивались» по описанным ранее правилам. Таким образом, мы должны выяснить, во что превращаются числа аx+bx, аy+by, az+bz, если известно, что при изменении системы координат числа аx, ау, az переходят в а'x, а'у, a'z, а bx, bу, bz переходят в b'x, b'y, b'z? Получим ли мы после поворота координатных осей числа а'x +b'x, a'y+b'y, a'z+b'z? Ответ, конечно, будет утвердительным, потому что наше основное уравнение (11:5) определяет так называемое линейное преобразование. Если мы применим это преобразование к аx и bx и вычислим аx+bx то окажется, что преобразованное аx+bx есть то же самое, что и аx+bx. «Складывая» векторы а и b по только что описанному правилу, мы получаем новый вектор c. Мы запишем это так:
Вектор с обладает интересным свойством:
это легко проверить, написав составляющие вектора с. Кроме того,
Векторы можно складывать в любом порядке.
Каков геометрический смысл a+b? Как будет выглядеть вектор с, если мы, скажем, изобразим a и b с помощью стрелок? Ответ на этот вопрос дает фиг. 11.4.
Фиг. 11.4. Сложение векторов.
Мы видим, что прибавить составляющие вектора b к составляющим вектора а проще всего, приложив соответствующим образом прямоугольник, определяемый составляющими b, к такому же прямоугольнику, определяемому составляющими a. Поскольку a и b хорошо подогнаны к своим прямоугольникам, то это все равно, что поставить вектор b «ногами» на «голову» вектору a. Стрелка, соединяющая «ноги» вектора а и «голову» вектора b, и будет вектором с. Можно поступить иначе: поставить «ноги» a на «голову» b. Вспомнив геометрические свойства параллелограмма, можно убедиться в том, что мы снова получим тот же вектор c. Заметим, что, ставя векторы друг на друга, мы складываем их без помощи координатных осей.
Предположим, что мы умножили вектор a на число α. Что нужно понимать под таким произведением? Договоримся понимать под этим вектор с компонентами αаx, αау, αaz. Докажите сами, что это действительно вектор.
Рассмотрим теперь вычитание векторов. Можно определить вычитание тем же способом, что и сложение, но вместо того, чтобы складывать, будем вычитать составляющие. Можно также определить вычитание как сложение с отрицательным вектором -b=(-1)b. Результат будет тот же.
Вычитание векторов показано на фиг. 11.5.
Фиг. 11,5. Вычитание векторов.
На этом чертеже изображено d=a-b=a+(-b); заметим также, что, зная векторы a и b, разность a-b можно легко найти из эквивалентного соотношения a=b+d. Таким образом найти разность векторов даже легче, чем сумму: просто нужно провести вектор, соединяющий b и a, и вы получите a-b!
Перейдем теперь к скорости. Почему скорость есть вектор? Если координаты точки равны x, y, z, то скорость ее равна dx/dt, dy/dt, dz/dt. Вектор это или не вектор? Дифференцируя выражение (11.5), можно найти закон преобразования dx'/dt. Видно, что величины dx/dt, dy/dt преобразуются по тому же закону, что и х и у. Таким образом, скорость есть вектор. Выражение для скорости можно записать очень интересно:
Постараемся нагляднее представить себе, что такое скорость и почему она вектор. Далеко ли продвинется частица за малое время Δt? Ответ: на Δr, т. е. если частица находится «здесь» в первое мгновение, а «там» — во второе, то векторная разность положений частицы равна вектору Δr=r2-r1. расположенному вдоль направления движения. Как это выглядит, показано на фиг. 11.6.
Фиг. 11.6. Перемещение частиц за малое время Δt=t2-t1.
Если разделить этот вектор на промежуток времени Δt=t2-t1, то мы получим вектор «средней скорости».
Иначе говоря, под вектором скорости мы понимаем предел разности радиус-векторов, соответствующих моментам t+Δt и t, деленной на Δt при Δt, стремящемся к нулю:
(11.10)
Скорость есть вектор постольку, поскольку она равна разности двух векторов. Это верно также и потому, что составляющие этого вектора равны dx/dt, dy/dt, dz/dt. Подумав над тем, что сейчас было проделано, мы придем к выводу, что, продифференцировав любой вектор по времени, мы снова получим какой-то новый вектор. Таким образом, имеется несколько способов получать новые векторы: 1) умножая вектор на постоянное число; 2) дифференцируя вектор по времени; 3) складывая два вектора или вычитая.
§ 6. Законы Ньютона в векторной записи
Чтобы записать законы Ньютона в векторной форме, мы должны поучиться еще кое-чему и определить вектор ускорения. Этот вектор равен производной по времени вектора скорости, причем легко показать, что его составляющие равны вторым производным x, y и z по t:
(11.11)
(11.12)
После этого законы Ньютона можно записать таким образом:
(11.13)
(11.14)
Теперь задача о доказательстве инвариантности законов Ньютона относительно вращений сводится к следующему: нужно доказать, что а (ускорение) есть вектор; это мы уже сделали. Затем нужно доказать, что F(сила) есть вектор; это мы предполагаем. Следовательно, если сила есть вектор, то уравнение (11.13) будет выглядеть одинаково во всех системах координат, ибо нам известно, что ускорение тоже вектор. Запись уравнений в виде, не содержащем явно x, y, z, привлекательна тем, что нам нет необходимости выписывать три уравнения каждый раз, когда мы хотим написать законы Ньютона или другие законы физики. Мы записываем то, что выглядит как один закон, хотя фактически, конечно, это три закона для каждой оси системы координат, потому что любое векторное уравнение содержит в себе утверждение, что все составляющие равны.
Тот факт, что ускорение — это скорость изменения вектора скорости, помогает найти ускорение в любых, казалось бы, трудных обстоятельствах. Предположим, например, что частица, двигаясь по какой-то сложной кривой (фиг. 11.7), имеет в момент t1 скорость v1, а несколько позже, в момент t2,скорость v2.
Фиг. 11 .7. Криволинейная траектория.
Чему равно ускорение? Ответ: ускорение равно разности скоростей, деленной на малый промежуток времени; значит, нужно знать разность скоростей. Как же найти эту разность? Чтобы найти разность двух векторов, проведем вектор через концы векторов v2 и v1, иначе говоря, начертим вектор Δ в качестве разности этих двух векторов. Верно? Нет! Мы можем поступать так только тогда, когда начала векторов расположены в одной точке! Вычитать векторы, приложенные к разным точкам, бессмысленно. Остерегайтесь этого! Чтобы вычесть векторы, нужно начертить другую схему. На фиг. 11. 8 векторы v1 и v2 перенесены параллельно и равны их двойникам, изображенным на фиг. 11.7.
Фиг. 11.8. Диаграмма для вычисления ускорения.
Теперь можно поговорить об ускорении. Ускорение, конечно, просто равно Δv/Δt. Интересно заметить, что разность скоростей можно разделить на две части: можно представить себе, что ускорение состоит из двух составляющих: Δv║ —вектора, параллельного касательной к пути, и вектора Δv┴, перпендикулярного к этой касательной. Эти векторы показаны на фиг. 11.8. Касательное к пути ускорение равно, естественно, лишь изменению длины вектора, т. е. изменению величины скорости v:
(11.15)
Другую, поперечную составляющую ускорения легко вычислить, взглянув на фиг. 11.7 и 11.8. За короткое время Δt изменение угла между v1 и v2 равно малому углу Δθ. Если величина скорости равна v, то
а ускорение а равно
Теперь нам нужно знать Δθ/Δt. Эту величину можно найти так: если в данный момент кривую можно приблизительно заменить окружностью радиусом R, то, поскольку за время Δt частица пройдет расстояние s=vΔt, изменение угла равно
Таким образом, как мы уже установили ранее,
(11.16)
§ 7. Скалярное произведение векторов
Давайте еще немного займемся свойствами векторов. Легко понять, что длина шага в пространстве одинакова во всех координатных системах. Следовательно, если какому-то шагу r соответствуют составляющие x, y, z в одной системе координат и составляющие х', у', z' в другой системе, то расстояние r=|r| одно и то же в обеих системах. Сначала мы, конечно, должны ввести два расстояния,
а затем проверить, что эти обе величины равны. Чтобы не возиться с квадратным корнем, будем сравнивать квадраты расстояний. Мы должны, таким образом, показать, что
(11.17)
Подставив в это уравнение определяемые соотношением (11.5) значения x', у', z', мы увидим, что это действительно так. Значит, кроме уже изученных нами векторных уравнений, существуют еще какие-то соотношения, верные в любой системе координат.
Незаметно мы получили новый тип величин. Мы можем построить функцию x, y и z, называемую скалярной функцией, — величину, которая не имеет направления, и одинакова в обеих системах координат. Из вектора можно построить скаляр. Хорошо бы найти общее правило для этого построения. Собственно говоря, мы уже нашли это правило: надо возвести в квадрат каждую из составляющих вектора и сложить их. Определим теперь новую величину, которую обозначим а·а. Это не вектор, а скаляр; это число, одинаковое во всех координатных системах и определяемое как сумма квадратов трех составляющих вектора:
(11.18)
Вы спросите: «В какой системе координат?» Но раз это число не зависит от системы координат, то ответ одинаков в любой системе координат. Мы имеем дело с новым видом величины, с инвариантом, или скаляром, полученным «возведением вектора в квадрат». Если теперь определить, исходя из векторов а и b, величину
(11.19)
то можно убедиться, что эта величина совпадает в штрихованной и нештрихованной системах координат. Чтобы доказать это, заметим, что это верно для величин a·a, b·b и c·c, где c=a+b. Сумма квадратов (ax+bx)2+(ay+by)2+(az+bz)2 — инвариант:
(11.20)
Раскроем скобки в обеих сторонах этого уравнения. Перекрестные произведения дадут нам выражения типа (11.19), а суммы квадратов составляющих а и b — выражения (11.18). Инвариантность слагаемых типа (11.18) приводит к инвариантности перекрестных произведений типа (11.19).
Величина а·b называется скалярным произведением двух векторов а и b и имеет много интересных и полезных свойств. Например, легко доказать, что
(11.21)
Есть еще очень простой геометрический способ вычисления а·b, при котором не надо определять составляющих а и b; просто а·b есть произведение длин векторов а и b на косинус угла между ними. Почему? Предположим, что мы выбрали такую систему координат, в которой вектор а направлен вдоль оси х; в этом случае вектор а имеет единственную ненулевую составляющую аx, которая равна длине вектора а. Таким образом, уравнение (11.19) сводится в этом случае к a·b=axbx, что равно произведению длины вектора а на составляющую вектора b по направлению а, которая в свою очередь равна bcosθ, т. е.
Таким образом, в этой частной системе координат мы доказали, что a·b равно произведению длин векторов а и b на косинус угла между ними θ. Но если это верно в одной системе координат, то это верно и во всех системах, потому что а·b не зависит от выбора системы координат.
Что хорошего может дать нам эта новая величина? Нужно ли физику скалярное произведение? Да, оно необходимо ему постоянно. Например, в гл. 4 мы назвали кинетической энергией величину 1/2mv2, но если частица движется в пространстве, то нужно возвести в квадрат отдельно составляющие скорости x, y и z, так что формулу для кинетической энергии можно записать в виде
(11.22)
Энергия не имеет направления. Импульс же направление имеет, это — вектор, и он равен произведению массы на вектор скорости.
Другим примером скалярного произведения может служить работа, произведенная силой при перемещении какого-нибудь предмета с одного места на другое. Мы еще не дали определения работы, она равна изменению энергии, прибавке в весе, после того как сила F поработает вдоль пути s:
(11.23)
Иногда целесообразно говорить о составляющей вдоль определенного направления (например, вдоль вертикали, потому что это направление силы тяжести). Для этого удобно ввести единичный вектор вдоль интересующего нас направления. Под единичным вектором мы будем понимать вектор, скалярное произведение которого на себя равно единице. Пусть это будет вектор i; тогда i·i=1. Скалярное произведение i·a равно acosθ, т. е. оно равно составляющей вектора а вдоль направления i. Это наилучший способ получить составляющую вектора. Поступая так, мы можем найти все составляющие вектора и получить забавную формулу.
Предположим, что нам задана какая-то система координат x, y и z. Введем три вектора: i — единичный вектор вдоль оси х, j — единичный вектор вдоль оси y и k— единичный вектор вдоль оси z. Ясно, что i·i=l. Чему же равно произведение i·j? Если угол между векторами прямой, то их скалярное произведение равно нулю. Таким образом,
(11.24)
Используя эти свойства векторов i, j, k, можно записать любой вектор a в виде
(11.25)
Таким образом, можно от составляющих вектора легко перейти к самому вектору.
Мы изучили далеко не все свойства векторов. Однако, прежде чем углубиться в этот вопрос, научимся сперва применять обсужденные сейчас идеи в физике. И тогда, когда мы хорошо овладеем основным материалом, будет легче продвинуться дальше, не впадая в ошибки. Позднее мы увидим, что удобно определить еще одно произведение двух векторов, которое называется векторным произведением и записывается в виде а×b. Однако обсуждение этого вопроса лучше отложить до следующей главы.
Глава 12 ХАРАКТЕРИСТИКИ СИЛЫ
§ 1. Что есть сила?
Хотя изучение законов физики интересно и поучительно, хотя они и помогают нам понимать природу и овладевать ее силами, все же порой стоит остановиться и поразмыслить: что же они на самом деле значат? Смысл любого утверждения — вещь, которая издавна, с незапамятных времен, интересовала и тревожила философов, а уж смысл физических законов тем более должен волновать нас, ведь повсеместно считается, что в этих законах таятся некоторые реальные знания. Смысл истины — это глубочайший философский вопрос; всегда важно вовремя спросить: что это значит?
Спросим же: в чем смысл физических законов Ньютона, в чем смысл формулы F=ma? В чем смысл силы, массы и ускорения? Мы интуитивно понимаем, что такое масса; мы можем также определить ускорение, если нам понятно, что такое место и что такое время. Смысл этих понятий мы поэтому не будем обсуждать, а сосредоточимся на новом понятии силы. И здесь ответ тоже весьма прост: если тело ускоряется, значит на него действует сила. Так говорят законы Ньютона, и самое точное и красивое из мыслимых определений силы состояло бы в том, что сила есть масса тела, умноженная на его ускорение.
Имеется, положим, закон, что импульс сохраняется тогда, когда сумма внешних сил равна нулю. И вот у нас спрашивают: «А что это значит: сумма внешних сил равна нулю?» И мы любезно отвечаем: «Когда полный импульс постоянен, то сумма внешних сил равна нулю». Нет, здесь что-то не то. Ведь ничего нового мы при этом не сказали. Обнаружив основной закон, утверждающий, что сила есть масса на ускорение, а потом определив силы как произведение массы на ускорение, мы ничего нового не открываем. Можно также определить силу и на другой манер: движущееся тело, на которое сила не действует, продолжает двигаться по прямой с постоянной скоростью. Тогда, увидев, что тело не движется по прямой с постоянной скоростью, мы можем утверждать, что на него действует сила. Но такие высказывания не могут составить содержание физики: зачем же ей гонять определения по кругу? Несмотря на это, приведенное выше положение Ньютона, по-видимому, самое точное из всех определений силы, одно из тех, которые так много говорят сердцу математика. И все же оно совершенно бесполезно, потому что из одного определения никогда ничего никто не выводил. Можно день-деньской просиживать в кресле, определяя слова по своему хотению, но совсем иное дело — понять, что происходит при столкновении двух шаров или что бывает, когда груз висит на пружинке. Поведение тел и выбор определений — между этими вещами нет ничего общего.
Пусть, например, мы бы решились говорить, что тело, предоставленное самому себе, лежит на месте и не движется; тогда, заметив, что что-то движется, мы бы стали утверждать, будто на него действует «жила» — мера охоты к перемене мест. Мы получили бы прекрасный новый закон, все было бы хорошо, кроме тех случаев, когда действует «жила». Как видите, все было бы подобно нашему определению силы и точно так же не несло бы в себе никакой информации. Истинное же содержание законов Ньютона таково: предполагается, что сила обладает независимыми свойствами в дополнение к закону F=ma; но характерные независимые свойства сил не описал полностью ни Ньютон, ни кто-нибудь еще; поэтому физический закон F=ma — закон неполный. Он подразумевает, что, изучив характеристики величины, определяемой как произведение m на а, мы обнаружим в них некоторую простоту; закон этот дает нам хорошую программу анализа природы, он подсказывает нам, что свойства этой величины — силы — могут оказаться простыми, что ее стоит изучать.
Первый пример таких сил — полный закон тяготения, предложенный Ньютоном. Формулируя свой закон, он отвечал на вопрос: что такое сила? Если бы ничего, кроме тяготения, не существовало, то сочетание этого закона и закона силы (второго закона движения) оказалось бы завершенной теорией. Но, кроме тяготения, существует и многое другое, и мы собираемся пользоваться законами Ньютона во всевозможных положениях. Поэтому нам придется кое-что порассказать о свойствах сил.
К примеру, говоря о силе, мы всегда неявно предполагаем, что когда нет физических тел, то сила равна нулю. Если мы видим, что сила не равна нулю, мы ищем по соседству ее источник. Это предположение совсем не то, что введенная нами «жила».
Одна из важнейших характеристик силы — ее материальное происхождение; и это свойство как раз нельзя считать определением.
Ньютон привел еще одно правило, касающееся сил: силы между взаимодействующими телами равны и противоположны; действие равно противодействию. И это правило, оказывается, не совсем верно. Да и сам закон F=ma не совсем верен; будь он определением, мы бы должны были утверждать, что он точно верен всегда; а на самом деле это не так.
Вы можете заявить: «А мне не нравится эта неточность, я хочу, чтобы все определялось точно, да и во многих книжках написано, что наука — вещь точная, что в ней все определено». Но сколько бы вы ни настаивали на точном определении силы, вы его никогда не получите! Во-первых, и сам Второй закон Ньютона не точен, а во-вторых, чтобы понять физические законы, вы должны усвоить себе раз и навсегда, что все они — в какой-то степени приближения.
Любое простое высказывание является приближенным; в виде примера рассмотрим некоторый предмет... кстати, что такое предмет? «Философы» всегда отвечают: «Ну, например, стул».
Стоит услышать это и сразу становится ясно, что они сами не понимают того, о чем говорят. Что есть стул? Стул имеет определенную массу... Определенную? Насколько определенную? Из него время от времени вылетают атомы — немного, но все же! На него садится пыль, из него сыплется труха, да и лак со временем сходит. Четко определить стул, сказать точно, какие атомы принадлежат ему, какие — воздуху, а какие — лаку, невозможно. Значит, массу стула можно определить лишь приближенно. Точно так же невозможно определить массу отдельного предмета, ибо таких предметов не существует, в мире нет одиноких, обособленных объектов; любая вещь есть смесь множества других, и мы всегда имеем дело с рядом приближений и идеализации. Вся суть в идеализации. В очень хорошем приближении (около 1 к 1010) количество атомов стула за минуту не меняется. Если вас эта точность устраивает, вы имеете право считать массу стула постоянной. Точно так же можно идеально изучить и характеристики силы, стоит только не гнаться за точностью. Вас может не удовлетворить этот приближенный взгляд на природу, который пытается выработать физика (все время стремясь повысить точность приближений), вы можете предпочесть математическое определение, но оно никогда не действует в реальном мире. Математические определения хороши для математики — там можно полностью и до конца следовать логике, а физический мир сложен. Мы об этом уже говорили, приводя такие примеры, как океанские волны и бокал вина. Пытаясь разделить их на части, мы толкуем отдельно о массе вина и отдельно о массе бокала. Но как можно узнать, где одно, где другое, раз одно растворимо в другом? И сила, действующая на обособленный предмет, уже включает неточность, и всякая система рассуждений о реальном мире, по крайней мере сегодня, предполагает разного рода приближения.
Эта система ничем не похожа на математические рассуждения. В них все может быть определено, и в итоге всегда не известно, о чем говорят.
Действительно, ведь все великолепие математики в том и состоит, что в ней мы не знаем, о чем толкуем. Ее законы, ее доказательства, ее логика не зависят от того, чего они касаются, — и в этом своя, особая красота. Когда вы имеете другую совокупность объектов, подчиняющихся той же системе аксиом, что и евклидова геометрия, то вы можете выдвинуть новые определения и делать выводы, сообразуясь с правильной логикой, — все следствия окажутся правильными, и совершенно неважно, чего они касаются. А в природе? Когда вы проводите линию или провешиваете ее при помощи луча света и теодолита (как это делается на геодезических съемках) — следует ли природа Евклиду? Нет, вы делаете приближение; крест на объективе имеет определенную толщину, а геометрическая линия — никакой; значит, применять ли в съемках евклидову геометрию или нет — это вопрос физики, а не математики.
Конечно, с экспериментальной (а не математической) точки зрения вам нужно знать, применимы ли законы Евклида к тому роду геометрии, которую вы используете, измеряя окрестности; вы предполагаете, что да, применимы. И, действительно, они прекрасно работают; прекрасно, но не точно, потому что ваши съемочные линии — это не настоящие геометрические линии. Приложимы или нет абстрактные евклидовы прямые к линиям, провешиваемым на опыте, — есть дело самого опыта; на этот вопрос чистым рассуждением не ответить.
Точно таким же образом вы не можете назвать F=ma определением, вывести из него все чисто математически и сделать механику математической теорией: механика — это описание природы. Выдвигая подходящие постулаты, всегда можно создать математическую систему вроде евклидовой, но вы не можете создать математики мира; рано или поздно вам пришлось бы отвечать на вопрос: выполняются ли эти аксиомы на объектах природы? И вы немедленно завязли бы среди этих запутанных, «нечистых» реальных предметов, — правда, добиваясь все большей и большей точности приближений.
§ 2. Трение
Итак, чтобы по-настоящему понять законы Ньютона, мы должны обсудить свойства сил; цель этой главы — начать это обсуждение и составить своего рода дополнение к законам Ньютона. Мы уже знакомы со свойствами ускорения и с другими сходными представлениями, теперь же нам предстоит заняться свойствами сил. Из-за сложности их мы в этой главе (в отличие от прежних) не будем гнаться за точными формулировками. Чтобы начать с конкретной силы, рассмотрим сопротивление, которое воздух оказывает летящему самолету. Каков закон этой силы? (Мы обязаны найти его; ведь закон существует для каждой силы!) Едва ли только он будет прост. Стоит представить себе торможение воздухом самолета — свист ветра в крыльях, вихри, порывы, дрожание фюзеляжа и множество других сложностей, — чтобы понять, что этот закон вряд ли выйдет простым и удобным. Тем замечательней тот факт, что у силы очень простая закономерность: F≈cv2 (постоянная, умноженная на квадрат скорости).
Каково же положение этого закона среди других? Подобен ли он закону F=ma? Отнюдь. Во-первых, он эмпирический, и получен он грубыми измерениями в аэродинамической трубе. Но вы возразите: «Что ж, закон F=ma тоже мог бы быть эмпирическим». Но разве в этом дело? Различие не в эмпиричности, а в том, что, насколько мы понимаем, этот закон трения есть результат множества влияний и в основе своей ничуть не прост. Чем больше мы станем его изучать, чем точнее мерить, тем сложней (а не проще) представится он нам. Иными словами, все глубже вникая в закон торможения самолета, мы все ясней будем понимать его «фальшь». Чем глубже взгляд, чем аккуратней измерения, тем усложненней становится истина; она не предстанет перед нами как итог простых фундаментальных процессов (впрочем, мы и с самого начала об этом догадывались). На очень слабых скоростях (самолету, например, они даже недоступны) закон меняется: торможение уже зависит от скорости почти линейно. Или, к примеру, торможение шара (или пузырька воздуха или чего-нибудь еще) за счет трения о вязкую жидкость (наподобие меда), — оно тоже при малых скоростях пропорционально скорости, а на больших, когда образуются вихри (не в меде, конечно, а в воде или воздухе), опять возникает примерная пропорциональность квадрату скорости (F=cv2); при дальнейшем росте скорости и это правило не годится. Можно, конечно, говорить: «Ну, здесь слегка меняется коэффициент». Но ведь это просто уловка.
Во-вторых, есть и другие сложности: можно ли, скажем, эту силу делить на части — на силу трения крыльев, фюзеляжа, хвоста и т. д.? Конечно, когда нужно бывает узнать вращательные моменты, действующие на части самолета, то так делать можно, но тогда уж надо иметь специальный закон трения для крыльев и т. д. И выясняется тот удивительный факт, что сила, действующая на крыло, зависит от другого крыла, т. е. если убрать самолет и оставить в воздухе одно крыло, то сила будет совсем не такой, какой она была бы, если бы в воздухе был весь самолет. Причина, конечно, в том, что ветер, бьющий в нос самолета, стекает на крылья и меняет силу торможения. И хотя кажется чудом, что существует такой простой, грубый эмпирический закон, пригодный для создания самолетов, но он не из тех законов физики, которые называют основными: по мере углубления он становится все сложней и сложней. Какое-нибудь изучение зависимости коэффициента c от формы носа самолета сразу разрушает его простоту. Никакой простой зависимости не остается. То ли дело — закон тяготения: он прост, и дальнейшее его углубление только подчеркивает это.
Мы только что говорили о двух типах трения, возникающих в результате быстрого движения в воздухе или медленного в меде. Но есть еще вид трения — сухое, или трение скольжения: о нем говорят тогда, когда одно твердое тело скользит по другому. Чтобы продолжать движение, такому телу нужна сила. Ее называют силой трения. Происхождение ее — вопрос очень запутанный. Обе соприкасающиеся поверхности неравномерны, если разглядывать их на атомном уровне. В точках соприкосновения атомы сцепляются; при нажиме на тело сцепка рвется и возникают колебания (во всяком случае, происходит нечто похожее). Прежде думали, что механизм трения несложен: поверхность покрыта неровностями и трение есть результат подъема скользящих частей на эти неровности; но это неправильно, ведь тогда бы не было потерь энергии, а на самом деле энергия на трение тратится. Механизм потерь иной: неровности при скольжении сминаются, возникают колебания и движение атомов, и тепло растекается по обоим телам. И здесь крайне неожиданным оказывается, что эмпирически это трение можно приближенно описать простым законом. Сила, нужная для того, чтобы преодолевать трение и тащить один предмет по поверхности другого, зависит от силы, направленной по нормали (по перпендикуляру) к поверхностям соприкосновения. В довольно хорошем приближении можно считать, что сила трения пропорциональна нормальной силе с более или менее постоянным коэффициентом:
(12.1)
где μ — коэффициент трения (фиг. 12.1).
Фиг. 12.1. Соотношение между силой трения и нормальной составляющей силы при скольжении.
Хотя коэффициент μ не очень постоянен, эта формула оказывается хорошим эмпирическим правилом, позволяющим прикидывать, какая сила понадобится в тех или иных практических или инженерных обстоятельствах. Только когда нормальная сила или быстрота движения очень уж велика, закон отказывает: выделяется чересчур много тепла. Важно понимать, что у любого из этих эмпирических законов есть ограничения, вне которых они не работают.
Приближенную справедливость формулы F=μN можно засвидетельствовать простым опытом. Положим брусок весом W на плоскость, наклоненную под углом θ. Подымем плоскость круче, пока брусок под тяжестью собственного веса не соскользнет с нее. Составляющая веса вниз вдоль плоскости Wsinθ равна силе трения F, раз брусок скользит равномерно. Слагающая веса, нормальная к плоскости, это Wcosθ; она и есть нормальная сила N. Формула превращается в Wsinθ=μWcosθ, откуда μ=sinθ/cosθ=tgθ. Согласно этому закону, при определенном наклоне плоскости брусок начинает скользить. Если брусок нагрузить дополнительным весом, то все силы в формуле возрастут в той же пропорции, и W из формулы выпадет. Если величина μ не изменилась, то нагруженный брусок опять соскользнет при таком же наклоне. Определив из опыта угол θ, убедимся, что при большем весе бруска скольжение все равно начинается на том же угле наклона. Даже если вес возрос многократно, это правило соблюдается. Мы приходим к заключению, что от веса коэффициент трения не зависит.
Когда проделываешь этот опыт, легко заметить, что при правильном угле наклона θ брусок скользит не непрерывно, а с остановками: на одном месте он застрянет, а на другом рванется вперед. Такое поведение есть признак того, что коэффициент трения только грубо можно считать постоянным: он меняется от места к месту. Столь же неуверенное поведение наблюдается и при изменении нагрузки бруска. Различия в трении возникают от разной гладкости или твердости частей поверхности, от грязи, ржавчины и прочих посторонних влияний. Таблицы, в которых перечислены коэффициенты трения «стали по стали», «меди по меди» и прочее, — все это сплошное надувательство, ибо в них этими мелочами пренебрегают, а ведь они-то и определяют значение μ. Трение «меди о медь» и т. д. — это на самом деле трение «о загрязнения, приставшие к меди».
В опытах описанного типа трение от скорости почти не зависит. Многие верят, что трение, которое нужно преодолеть, чтобы привести предмет в движение (статическое), больше силы, необходимой для поддержания уже возникшего движения (трение скольжения). Но на сухих металлах трудно заметить какую-либо разницу. Мнение это порождено, вероятно, опытами, в которых присутствовали следы масла или смазки, а может быть, там бруски закреплялись пружинкой или чем-нибудь гибким, как бы привязываясь к опоре.
Очень трудно добиться точности в количественных опытах по трению, и до сей поры трение не очень хорошо проанализировано, несмотря на огромное значение такого анализа для техники. Хотя закон F=μN для стандартных поверхностей почти точен, причину такого вида закона на самом деле не понимают. Чтобы показать, что μ мало зависит от скорости, нужны особо тонкие эксперименты, потому что от быстрых колебаний нижней поверхности видимое трение сильно падает. В опытах на больших скоростях надо заботиться, чтобы тела не дрожали, а то видимое трение сразу уменьшается. Во всяком случае, этот закон трения относится к тем полуопытным законам, которые поняты не до конца и не становятся понятней, несмотря на огромные усилия. Оценить коэффициент трения между двумя веществами сейчас практически никому не под силу.
Раньше было уже сказано, что попытки измерить μ при скольжении чистых веществ (медь по меди) ведут к сомнительным результатам, потому что соприкасающиеся поверхности — не чистая медь, а смеси окислов и прочих загрязнений. Если мы хотим получить совершенно чистую медь, если мы вычистим и отполируем поверхности, дегазируем вещество в вакууме и соблюдем все необходимые предосторожности, то все равно μ мы не получим. Потому что два куска меди слипнутся, и тогда хоть ставь плоскость торчком! Коэффициент μ, для умеренно жестких поверхностей обычно меньший единицы, тут вырастает до нескольких единиц! Причина такого неожиданного поведения вот в чем: когда соприкасаются атомы одного сорта, то они не могут «знать», что они принадлежат разным кускам меди. Будь там между ними другие атомы (атомы окислов, смазки, тонких поверхностных слоев загрязнений), тогда атомам меди было бы «ясно», находятся ли они на одном куске или на разных. Вспомните теперь, что именно из-за сил притяжения между атомами медь является твердым веществом, и вам станет понятно, почему невозможно правильно определить коэффициент трения для чистых металлов.
То же явление наблюдается в простом домашнем опыте со стеклянной пластинкой и бокалом. Поставьте бокал на пластинку, накиньте на него петлю и тяните; он неплохо скользит и коэффициент трения чувствуется; конечно, этот коэффициент слегка нерегулярен, но все же это коэффициент. Увлажните теперь пластинку и ножку бокала и потяните; вы почувствуете, что они слиплись. Внимательно вглядевшись, можно обнаружить даже царапины. Дело в том, что вода может удалять жир и прочие вещества, засоряющие поверхность; остается чистый контакт стекло — стекло. Этот контакт настолько хорош, что разорвать его не так-то просто: нарушить его трудней, чем вырвать кусочки стекла, вот и возникают царапины.
§ 3. Молекулярные силы
А теперь перейдем к характеристике молекулярных сил. Это силы, действующие между атомами; ими в конечном счете и вызывается трение. Классической физике так и не удалось удовлетворительно объяснить молекулярные силы. Чтобы их полностью понять, понадобилась квантовая механика. Эмпирически, однако, силу, действующую между двумя атомами, можно изобразить примерно так, как на фиг. 12.2, где эта сила F представлена как функция расстояния r между атомами.
Фиг. 12.2. Сила, действующая между двумя атомами, как функция расстояния между ними.
Бывают и другие случаи: в молекуле воды, например, отрицательные заряды размещены главным образом на атоме кислорода и центры положительных и отрицательных зарядов оказываются не в одной точке, поэтому соседние молекулы испытывают действие сравнительно больших сил. Называют эти силы диполь-дипольными. Но во многих системах заряды сбалансированы куда лучше, в частности в газообразном кислороде они почти симметричны. В этом случае, хоть минус- и плюс-заряды рассеяны по молекуле, распределение их таково, что центры минус- и плюс-зарядов совпадают. Молекулы, центры которых не совпадают, называются полярными; произведение заряда на промежуток между центрами называется дипольным моментом. У неполярных молекул центры зарядов совпадают. Для них для всех оказывается, что, хотя суммарный общий заряд равен нулю, сила на больших расстояниях ощущается как притяжение и изменяется обратно пропорционально седьмой степени удаления, т. е. F=k/r7, где k — постоянная, зависящая от типа молекул. Почему это так, вы узнаете тогда, когда выучите квантовую механику. У диполей силы притяжения еще заметнее. И наоборот, если атомы или молекулы тесно сблизить, они очень сильно отталкиваются; именно по этой причине мы не проваливаемся на нижний этаж!
Эти молекулярные силы можно увидеть почти непосредственно и в опыте со скольжением бокала по стеклу, и в опыте с двумя тщательно отшлифованными и пригнанными плоскими поверхностями. Примером таких поверхностей могут служить плитки Иоганссона, которыми пользуются в машиностроении как стандартами для точных измерений длин. Если, прижав одну из плиток к другой, осторожно поднять верхнюю плитку, то нижняя тоже поднимется. Ее поднимут молекулярные силы, демонстрируя прямое притяжение атомов одной плитки к атомам другой.
И все же эти молекулярные силы притяжения не являются фундаментальными в том смысле, в каком фундаментально тяготение; они возникают в итоге неимоверно сложного взаимодействия всех электронов и ядер одной молекулы со всеми электронами и ядрами другой. Никакой простой формулы, которая бы учитывала все эти сложности, нельзя получить, так что это явление не фундаментальное.
Именно потому, что молекулярные силы притягивают на большом удалении и отталкивают на малом (см. фиг. 12.2), и существуют твердые тела; их атомы скреплены воедино взаимным притяжением, но держатся все же на расстоянии друг от друга (если их сблизить, сразу включается отталкивание). На том расстоянии d, где кривая на фиг. 12.2 пересекает ось r, сила равна нулю, т. е. наступает равновесие; на этом расстоянии и располагается молекула от молекулы. Если молекулы сблизить теснее, чем на расстояние d, то возникает отталкивание, изображенное частью кривой выше оси r. Но даже для ничтожного сближения требуются огромные силы, потому что кривая круто идет вверх на расстояниях, меньших d. А стоит чуть развести молекулы, как начинается слабое притяжение, возрастающее по мере удаления. Если же их резко потянуть, то они навсегда отделятся и связь разорвется.
Когда молекулы лишь слегка сводят или слегка разводят от положения равновесия d, то маленький участок кривой близ этого положения можно считать за прямую линию. Поэтому часто обнаруживается, что при небольших сдвигах сила пропорциональна смещению. Этот принцип известен как закон Гука, или закон упругости; он утверждает, что силы, стремящиеся после деформации тела вернуть его в начальное состояние, пропорциональны этой деформации. Закон, конечно, соблюдается лишь тогда, когда деформации малы; когда они велики, тело либо разорвется, либо сломается, смотря по характеру деформаций. Величина силы, до которой закон Гука еще действует, зависит от материала; скажем, у теста или замазки она очень мала, у стали — относительно велика. Закон Гука легко можно продемонстрировать на длинной стальной спиральной пружине, подвешенной вертикально. Грузик на нижнем конце пружины слегка раскручивает витки проволоки и тем самым немного оттягивает вниз каждый виток, приводя в общем на большом числе витков к заметному смещению. Если измерить общее удлинение пружины, скажем от гирьки весом 100 г, то окажется, что каждые добавочные 100 г груза вызовут примерно такое же удлинение, что и первые 100 г. Это постоянство отношения силы к смещению нарушается, когда пружина перегружена; тогда закон Гука больше не выполняется.
§ 4. Фундаментальные силы. Поля
Мы хотим побеседовать теперь об оставшихся фундаментальных силах. Называем мы их фундаментальными потому, что законы их действия фундаментально просты. Сперва рассмотрим электрическую силу.
Тела несут в себе электрические заряды, которые состоят просто из электронов и протонов. Если два тела заряжены, меж ними действует электрическая сила; если величины зарядов равны соответственно q1 и q2, то сила изменяется обратно пропорционально квадрату расстояния между зарядами
Для разноименных зарядов этот закон похож на закон тяготения, но для одноименных сила становится отталкивающей и ее знак (направление) меняется. Сами заряды q1 и q2 могут быть и положительными и отрицательными; практически, пользуясь формулой, можно получить правильный знак силы, если поставить возле q их знаки. Сила направлена вдоль отрезка, соединяющего заряды. Коэффициент в формуле зависит, конечно, от выбора единиц силы, заряда и длины. Обычно заряд измеряют в кулонах, промежуток — в метрах, а силу — в ньютонах. Чтобы получить силу в ньютонах, константа (по историческим причинам ее пишут в виде 1/4πε0) должна принимать численное значение
(а)
т. е.
(б)
Итак, закон силы для покоящихся зарядов имеет вид
(12.2)
В природе самый важный из всех зарядов — это заряд отдельного электрона, он равен 1,60·10-19 кулон. Кто работает не с большими зарядами, а с электрическими силами между фундаментальными частицами, те предпочитают как-то выделить сочетание (qэл)2/4πε0, в котором qэл определяется как заряд электрона. Это сочетание часто встречается, и для упрощения расчетов его обозначают ε2; его численное значение в системе СИ оказывается равным (1,52·10-14)2. Удобство пользования константой в этой форме заключается в том, что сила в ньютонах, действующая между двумя электронами, запишется просто как ε2/r2 (r дано в метрах), без каких-либо коэффициентов. На самом деле электрические силы намного сложней, чем следует из этой формулы, потому что формула относится к покоящимся телам. Сейчас мы рассмотрим более общий случай.
Анализ фундаментальных сил (не сил трения, а электрических сил или сил тяготения) связан с интересным и очень важным понятием.
Теория этих сил намного сложнее, чем об этом следует из закона обратных квадратов. Закон этот действует лишь тогда, когда взаимодействующие тела находятся в покое. Поэтому нужен усовершенствованный метод обращения с очень сложными силами — силами, которые возникают, когда тела начинают двигаться запутанным образом. Как оказалось, для анализа сил такого типа очень полезен подход, основанный на введении понятия «поля». Чтобы пояснить мысль на примере, скажем, электрической силы, положим, что в точке Р находится заряд q1, а в точке R — заряд q2. Сила, действующая между зарядами, равна
(12.3)
Чтобы проанализировать эту силу при помощи понятия поля, мы говорим, что заряд q1 в точке Р создает в точке R такие «условия», при которых заряд q2, попадая в R, «ощущает» действие силы. Это один из мыслимых путей описания действия силы. Может быть, он выглядит странно: мы говорим, что действие силы F на заряд q2 в точке R можно разбить на две части — на q2 и Е, причем величина Е существует в точке R безотносительно к тому, есть ли там заряд или нет (лишь бы все прочие заряды были на своих местах). Величина Е есть «условие», созданное зарядом q1, а F — ответ, отклик заряда q2 на Е. Величину Е называют электрическим полем. Это — вектор. Формула для электрического поля Е, созданного в точке R зарядом q1 находящимся в точке Р, такова: заряд q1, умноженный на постоянную 1/4πε0, деленный на r2 (r — расстояние от Р до R); поле действует по направлению радиус-вектора (вектор направления радиус-вектора — это радиус-вектор, деленный на свою длину). Таким образом, выражение для Е таково:
(12.4)
А затем мы пишем
(12.5)
т. е. связываем силу, поле и заряд в поле. В чем же суть всего этого? Суть в том, что анализ разделяется на две части. Одна часть говорит, что что-то создает поле, а другая — что оно действует на что-то. Позволяя нам рассматривать две части независимо, это разделение упрощает во многих случаях расчеты трудных задач. Когда зарядов много, то сперва мы рассчитываем суммарное электрическое поле, создаваемое этими зарядами в R, а потом, зная величину заряда, помещенного в R, находим силу, действующую на него.
Да и в случае тяготения мы можем сделать то же самое. Сила теперь F=-Gm1mzr/r3. Анализ полностью совпадает: сила притяжения тела в поле тяготения равна произведению массы тела на поле С. Сила, действующая на m2, равна массе m2, умноженной на поле С, созданное массой m1, т. е. F=m2G. Значит, поле С, создаваемое массой m1, есть С=-Gm1r/r3; оно, как и электрическое поле, направлено по радиусу.
Такое разделение на две части не так уж тривиально, как могло бы показаться на первый взгляд. Оно было бы тривиальным, было бы просто иной записью того же самого, если бы законы действия сил были совсем просты, но они очень сложны, и оказывается, что поле настолько реально, что почти не зависит от объектов, создающих его. Можно колебать заряд, и влияние этого (поле) скажется на расстоянии. Если колебания прекратятся, в поле все равно будут ощущаться следы этих колебаний, потому что взаимодействие двух частиц не происходит мгновенно. Оттого и желательно уметь запоминать, что здесь раньше происходило. Если сила действия на заряд зависит от того, где другой заряд был вчера и каким он тогда был, то должна быть возможность проследить за тем, что было вчера; в этом и состоит сущность поля. Чем сложнее силы, тем реальней поле, и наша техника разделения становится все менее и менее искусственной.
Желая анализировать силы при помощи полей, мы нуждаемся в законах двоякого рода. Первые — это отклик на поле. Они дают нам уравнения движения. Например, закон отклика массы на поле тяжести состоит в том, что сила равна массе, умноженной на поле тяжести, или если тело еще и заряжено, то отклик заряда на электрическое поле равен заряду, умноженному на электрическое поле. Вторая часть анализа природы в таких положениях — это формулировка законов, определяющих напряженность поля и способ его возникновения. Эти законы иногда называют уравнениями поля. В нужный момент мы с ними познакомимся, а пока скажем о них лишь несколько слов.
Вот вам для начала самое замечательное свойство поля, оно абсолютно точно и легко усваивается. Общее электрическое поле, создаваемое группой источников, есть векторная сумма полей, создаваемых по отдельности первым, вторым и т. д. источниками. Иными словами, когда поле создано множеством зарядов и если отдельное поле первого есть Е1, а второго — Е2 и т. д., то мы должны просто сложить эти векторы, чтобы получить общее поле. Принцип этот выражается в виде
(12.6)
или, в согласии с определением поля,
(12.7)
Можно ли эти методы применить к тяготению? Силу притяжения двух масс m1 и m2 Ньютон выразил в виде F=-Gm1m2r/r3. Но в соответствии с понятием поля можно сказать, что m1 создает поле С во всем окружающем пространстве и сила, притягивающая m2, равна
(12.8)
По аналогии с электричеством
(12.9)
и тогда поле тяжести нескольких масс равно
(12.10)
В гл. 7, где рассматривалось движение планет, мы по существу использовали именно этот принцип. Мы складывали все векторы сил, чтобы обнаружить общую силу, действующую на планету. Разделив на ее массу, мы и получим (12.10).
Уравнения (12.6) и (12.10) выражают так называемый принцип суперпозиции, или наложения полей. Этот принцип провозглашает, что общее поле нескольких источников есть сумма полей, создаваемых каждым из них. Насколько нам ныне известно, закон этот в электричестве наверняка выполняется даже тогда, когда заряды движутся и закон сил усложняется. Бывают иногда кажущиеся нарушения, но внимательный анализ всегда доказывает, что просто забыли какой-нибудь из движущихся зарядов. Но в отличие от электрических зарядов для сильных полей тяжести он не совсем точен. В теории тяготения Эйнштейна доказывается, что уравнение Ньютона (12.10) соблюдается лишь приближенно.
С электричеством тесно связана сила другого рода, называемая магнитной; ее тоже можно анализировать через понятие поля. Некоторые из качественных связей между этими силами видны в опыте с электронной трубкой (фиг. 12.3).
Фиг. 12.3. Электронная трубка.
На одном конце трубки помещен источник, испускающий поток электронов, а внутри имеется устройство, разгоняющее электроны до большой скорости и посылающее часть их на светящийся экран на другом конце трубки. Световое пятно в центре экрана, в месте ударов электронов, позволяет проследить за их путем. На пути к экрану пучок проходит сквозь узкую щель между параллельными металлическими пластинами, расположенными, допустим, плашмя. К пластинам подведено напряжение, позволяющее любую из них заряжать отрицательно. Напряжение создает между пластинами электрическое поле.
В первой части опыта отрицательное напряжение подается на нижнюю пластину, т. е. на ней образуется избыток электронов. Одноименные заряды отталкиваются, и поэтому светящееся пятно на экране взлетает внезапно вверх. (Можно сказать и иначе: электроны «чувствуют» поле и отвечают отклонением вверх.) Затем переключим напряжение и зарядим отрицательно уже верхнюю пластину. Световое пятно на экране опустится вниз, показывая, что электроны пучка отталкиваются электронами верхней пластины. (Иначе говоря, электроны «ответили» на изменение направления поля.)
Во второй части опыта напряжение на пластины уже не подается, а вместо этого проверяется влияние магнитного поля на электронный пучок. Для этого необходим подковообразный магнит, достаточно широкий, чтобы «оседлать» практически всю трубку. Предположим, что мы подвели магнит снизу к трубке, обхватили им ее и направили полюсы кверху (в виде буквы U). Мы замечаем, что пятно на экране смещается, скажем, кверху, когда магнит приближается снизу. Выходит, что магнит отталкивает пучок. Но не так все просто: если мы перевернем магнит, не переставляя его сторон, и приблизим его к трубке сверху, то пятно снова сдвинется вверх, т. е. вместо отталкивания наступило притяжение. А теперь вернем магнит в первоначальное положение, когда он обхватывал трубку снизу. Да, пятно по-прежнему отклоняется кверху; но повернем магнит на 180° вокруг вертикальной оси, чтобы он имел вид буквы U, но уже с переставленными полюсами. Смотрите-ка, пятно прыгает вниз и остается там, даже если мы переворачиваем теперь U вверх ногами.
Чтобы понять такое своеобразное поведение, нужно придумать какую-то иную комбинацию сил. Объясняется все это вот как. Вдоль магнита, от полюса к полюсу, тянется магнитное поле. Оно направлено всегда от одного определенного полюса (который можно снабдить какой-нибудь меткой) к другому. Вращение магнита вокруг его оси не меняет направления поля, а перестановка полюсов местами меняет. Например, если электроны летят горизонтально по оси х, а магнитное поле тоже горизонтально, но направлено по оси у, то магнитная сила, действующая на движущийся электрон, направлена по оси z (вверх или вниз, это уже зависит от того, как направлено поле — по оси у или против нее).
Мы пока не дадим полного закона сил взаимодействия зарядов, движущихся друг относительно друга в произвольных направлениях, потому что он чересчур сложен, но зато приведем формулы для случая, когда поля известны. Действие силы на заряженный предмет зависит от его движения; когда предмет неподвижен, сила, действующая на него, считается пропорциональной заряду с коэффициентом, называемым электрическим полем. Когда тело движется, сила изменяется, и поправка, новый «кусок» силы, оказывается линейно зависящей от скорости и направленной поперек скорости v и поперек другой векторной величины — магнитной индукции В. Когда составляющие электрического поля Е и магнитной индукции В суть соответственно (Ex, Eу, Ez,) и (Вx, By, Bz), а составляющие скорости v суть (vx, vy, vz), то составляющие суммарной электрической и магнитной сил, действующих на движущийся заряд q, таковы:
(12.11)
Если случайно магнитное поле имеет только компоненту By, а скорость — только vx, то у магнитной силы остается составляющая вдоль z, поперек В и у.
§ 5. Псевдосилы
Очередной тип сил, который нам предстоит рассмотреть, — это псевдосилы.
В гл. 11 мы обсудили взаимоотношение двух молодых людей, Джо и Мика, обладателей различных систем координат. Пусть положение частицы по измерениям Мика есть x, а Джо дает для нее х'; тогда связь между ними такова:
где s показывает, насколько сместилась система Джо относительно системы Мика. Пусть у Мика в системе выполняются законы движения. Как они выглядят для Джо? Сперва мы обнаружим, что
Раньше мы считали s постоянной и убедились, что законы движения при этом не меняются, так как ds/dt=0; в конечном счете в обеих системах все законы физики одинаковы. Но пусть s=ut, где u — постоянная скорость движения по прямой. Тогда s непостоянна и ds/dt — не нуль, а u, т. е. константа. Но ускорение d2x/dt2 такое же, как d2x'/dt2, потому что du/dt=0. Этим доказывается закон, использованный в гл. 10, а именно: когда мы движемся по прямой с постоянной скоростью, все законы физики выглядят так, как если бы мы стояли. Это преобразование Галилея. А теперь мы хотим рассмотреть случай поинтереснее, когда s зависит от времени еще сложнее, например s=at2/2. Тогда ds/dt=at, а d2s/dt2=a, т. е. ускорение постоянно; можно рассмотреть также случай, когда ускорение само оказывается функцией времени. Это значит, что хотя закон силы с точки зрения Джо выглядит как
но закон силы, по мнению Мика, иной:
Иначе говоря, поскольку система координат Мика ускоряется по отношению к системе Джо, появляется добавочный член ma. Чтобы работать с законами Ньютона, Мик обязан подправить силы, ввести в них этот член. Другими словами, появляется кажущаяся, мистическая, новая сила неведомого происхождения; она возникает, конечно, из-за того, что у Мика координатная система неправильна. Это — пример псевдосилы; с другими примерами можно встретиться, если система координат вращается.
Примером псевдо- (как бы-, вроде-) силы является хорошо известная «центробежная сила». Наблюдатель во вращающейся системе координат (во вращающемся ящике) обнаружит таинственные силы, не вызываемые ни одним из известных источников сил; они отбрасывают предметы к стенке ящика. А объясняются они просто тем, что у наблюдателя нет ньютоновой системы координат — простейшей из всех.
Псевдосилы обнаруживаются на любопытном опыте, состоящем в том, что мы толкаем с ускорением кувшин с водой по столу. Тяжесть действует на воду вниз, но из-за горизонтального ускорения есть еще и псевдосила в горизонтальном направлении, назад по отношению к ускорению. Сумма силы тяжести и псевдосилы образует угол с вертикалью, во время ускорения поверхность воды перпендикулярна к этой сумме сил, т. е. наклонена под углом к столу, и вода приподнята к задней стенке кувшина. Когда мы перестаем толкать кувшин, когда он замедляется вследствие трения, псевдосила меняет свое направление и вода приливает к передней стенке кувшина (фиг. 12.4).
Фиг. 12.4. Иллюстрация к псевдосилам
Очень важным свойством псевдосил следует считать то, что они всегда пропорциональны массам; то же справедливо и для тяжести. Существует поэтому возможность, что тяжесть — это тоже псевдосила. Не может ли статься, что тяготение вызывается отсутствием правильной системы координат? Ведь мы всегда можем получить силу, пропорциональную массе, стоит только представить, что тело ускоряется. Например, человек, помещенный в ящик, который стоит на земле, обнаруживает, что его что-то прижимает к полу с силой, пропорциональной его массе. Если бы земли не было вовсе, а ящик все еще покоился, то человек плавал бы в пространстве. С другой стороны, если бы опять не было земли, а ящик кто-то тащил бы вверх с ускорением g, то человек в ящике, анализируя физику этого явления, обнаружил бы псевдосилу, прижимающую его к полу точно так же, как это делает тяжесть.
Эйнштейн выдвинул знаменитую гипотезу, что ускорение вызывает имитацию (подобие) тяготения, что силы ускорения (псевдосилы) нельзя отличить от сил тяготения; нельзя сказать, какая часть данной силы — тяжесть, а какая — псевдосила.
Казалось бы, ничто не мешает считать тяжесть псевдосилой, говорить, что нас прижимает вниз оттого, что нас ускоряет вверх; но как быть с жителями Новой Зеландии, на другой стороне Земли — их-то куда ускоряет? Эйнштейн понял, что тяготение можно считать псевдосилой одновременно только в одной точке; его рассуждения привели к предположению, что геометрия мира сложнее обычной геометрии Евклида. Наше обсуждение вопроса чисто качественное и не претендует ни на что, кроме общей идеи.
Чтобы пояснить в общих чертах, как тяготение может быть результатом действия псевдосил, мы приведем чисто геометрический пример, ничего общего не имеющий с истинным положением вещей. Предположим, что мы с вами обитаем в двумерном мире и ничего о третьем измерении не знаем. Мы бы считали, что живем на плоскости, а на самом деле, предположим, жили бы на шаре; пускай теперь мы бросили предмет вдоль нашей поверхности, не действуя больше на него никакими силами. Как бы он двигался? Нам казалось бы, что он движется по прямой линии, но поскольку третьего измерения нет и он должен был бы оставаться на поверхности шара, то он двигался бы по кратчайшему расстоянию на сфере, т. е. по окружности большого круга. Бросим точно так же другой предмет, но в ином направлении; он направится тоже по дуге большого круга. Мы думаем, что находимся на плоскости, и надеемся поэтому, что расстояние между двумя предметами будет расти линейно с течением времени. Но тщательные наблюдения вдруг обнаружат, что на достаточно большом расстоянии предметы снова начнут сближаться, как если бы они притягивали друг друга. Но они не притягиваются один к другому; все дело в геометрии, это с нею происходит что-то «чудное». Хотя эта картинка и не касается геометрии Евклида (не показывает нам, что в ней есть «чудного»), но она показывает, что, заметно исказив геометрию, можно все тяготение отнести за счет псевдосилы. В этом и состоит общая идея теории тяготения Эйнштейна.
§ 6. Ядерные силы
Мы заключим эту главу кратким обзором единственных ныне известных сил, отличающихся от перечисленных, — ядерных сил. Эти силы действуют внутри ядра атома, и, хотя их много изучали, никто ни разу еще не смог рассчитать силу, действующую между двумя ядрами; и фактически закон ядерных сил сейчас не известен. Эти силы имеют крайне незначительную протяженность действия — они действуют только на размерах ядра около 10-13 см. Поскольку частицы столь малы, а расстояния так коротки, нам нечего надеяться на законы Ньютона — здесь действуют только законы квантовой механики. Анализируя ядра, мы больше не говорим о силах; мы заменяем понятие силы понятием энергии взаимодействия двух частиц (позже об этом будет сказано подробнее). Любые формулы, которые можно написать для ядерных сил, представляют довольно грубые приближения, в которых опущены многие детали взаимодействия; выглядят они примерно так: силы внутри ядер убывают не обратно квадрату расстояния, а отмирают экспоненциально за некоторым расстоянием r0 (порядка 10-13 см) как F=(1/r2) exp(-r/r0). Иначе говоря, чуть частицы удалятся, как силы тут же исчезают, хотя ближе 10-13 см они очень велики. По-видимому, законы ядерных сил сложны до чрезвычайности; мы их не понимаем, и вся задача анализа фундаментального механизма, стоящего за ними, не решена. Попытки решить эту задачу привели к открытию множества необычных частиц, например π-мезонов, но происхождение сил все равно остается темным.
Глава 13 РАБОТА И ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ (I)
§ 1. Работа падающего тела
В гл. 4 мы разобрали вопрос о сохранении энергии. При этом законами Ньютона мы не пользовались. Интересно теперь посмотреть, как возникает сохранение энергии из-за того, что действуют эти законы. Для ясности мы начнем с самых простых примеров и постепенно будем их усложнять.
Простейший пример сохранения энергии — это тело, падающее вниз, т. е. тело, движущееся только в вертикальном направлении. Если оно меняет свою высоту под влиянием только тяжести, то из-за движения оно обладает кинетической энергией Т (или к. э.) Кроме того, у него есть потенциальная энергия mgh (сокращенно U, или п. э.). Их сумма постоянна:
или
(13.1)
Мы хотим показать, что это утверждение правильно. Что значит доказать его правильность? Второй закон Ньютона говорит, как движется тело, как со временем изменяется его скорость (а именно, что в падении она растет пропорционально времени, а высота падения меняется как квадрат времени). Если поэтому отмерять высоту от нулевой точки (где тело покоилось), то не будет ничего странного в том, что она окажется равной квадрату скорости, умноженному на какие-то постоянные. Однако все же рассмотрим это повнимательней.
Попробуем вычислить прямо из второго закона Ньютона, как обязана меняться кинетическая энергия; мы продифференцируем кинетическую энергию по времени и потом применим закон Ньютона. Дифференцируя 1/2 mv2 по времени, получаем
(13.2)
потому что m считается постоянной. Но по второму закону Ньютона m(dv/dt)=F, так что
(13.3)
В общем случае получается F·v, но для нашего одномерного случая лучше оставить просто произведение силы на скорость.
Сила в нашем простом примере постоянна, равна — mg и направлена вниз (знак минус именно это и показывает), а скорость есть степень изменения положения по вертикали (высоты h) со временем. Поэтому степень изменения кинетической энергии равна — mg(dh/dt). Взгляните: что за чудо! Перед нами снова чья-то скорость изменения — скорость изменения со временем величины mgh! Поэтому выходит, что с течением времени изменения в кинетической энергии и в величине mgh остаются равными и противоположными, так что их сумма остается неизменной. Что и требовалось доказать.
Мы только что показали, пользуясь Вторым законом Ньютона, что для постоянных сил энергия сохраняется, если только прибавлять потенциальную энергию mgh к кинетической 1/2mv2. Исследуем этот вопрос дальше; посмотрим, можно ли его обобщить, можно ли еще продвинуться в его понимании. Действует ли этот закон только для свободно падающих тел или является более общим? Из того, что мы знаем о сохранении энергии, можно ожидать, что он будет верен для тела, движущегося из одной точки в другую по кривой без трения и под действием одной лишь тяжести (фиг. 13.1).
Фиг. 13.1. Тело, движущееся под действием тяжести по кривой без трения.
Когда тело, начав двигаться с высоты Н, достигает высоты h, то опять должна быть верной та же формула, хотя бы скорость уже не была направлена по вертикали. Нам надо понять, почему она все еще правильна. Проведем тот же анализ; отыщем скорость изменения кинетической энергии во времени. Опять будет получаться mv(dv/dt) — скорость изменения величины импульса, т. е. сила в направлении движения — касательная сила Ft . Итак,
Скорость — это скорость изменения расстояния вдоль кривой ds/dt, а касательная сила Ft теперь оказывается меньше mg в отношении, равном отношению расстояния ds вдоль пути к вертикальному расстоянию dh. Иными словами,
так что
(ds выпадает). И опять, как прежде, мы получили величину —mg(dh/dt), равную скорости изменения mgh.
Чтобы точно уяснить себе, как вообще соблюдается сохранение энергии в механике, рассмотрим сейчас некоторые полезные понятия.
Во-первых, рассмотрим скорость изменения кинетической энергии в общем трехмерном случае. Кинетическая энергия, когда движение имеет три измерения, равна
Дифференцируя ее по времени, получаем три устрашающих члена:
(13.4)
Но ведь m(dvx/dt) — это сила Fx, действующая на тело в направлении х. Значит, в правой части формулы (13.4) стоит Fxvx+Fyvy+Fzvz. Призвав на помощь векторный анализ, вспоминаем, что это F·v. Итак,
(13.5)
А можно это вывести и быстрей: если а и b — два вектора, зависящих от времени, то производная от a·b равна
(13.6)
Подставим сюда а=b=v:
(13.7)
Так как понятие кинетической энергии и вообще энергии очень важно, то различным величинам в этих уравнениях присвоены разные имена: 1/2mv2 называется, как известно, кинетической энергией; F·v называется мощностью: сила, действующая на тело, умноженная («скалярно») на скорость тела, — это мощность, сообщаемая телу этой силой. Получается великолепная теорема: скорость изменения кинетической энергии тела равна мощности, затраченной силами, действующими на тело. Но для изучения сохранения энергии анализ следует продолжить. Давайте оценим изменение кинетической энергии за очень короткое время dt. Умножив обе части уравнения (13.7) на dt, найдем, что изменение кинетической энергии равно силе, скалярно умноженной на дифференциал пройденного расстояния
(13.8)
А интегрируя, получаем
(13.9)
Что это значит? Это значит, что, как бы и по какой бы кривой траектории ни двигалось тело под действием силы, все равно изменение в к. э. при переходе от одной точки кривой к другой равно интегралу от компоненты силы вдоль кривой, умноженной на дифференциал смещения ds (интегрирование от первой точки до второй). И у этого интеграла есть имя: его называют работой, совершенной силой над телом. Немедленно мы обнаруживаем, что мощность — это работа за секунду. И еще мы замечаем, что работу производит только составляющая силы вдоль направления движения. В нашем первом простом примере участвовали только вертикальные силы с одной-единственной составляющей Fz, равной — mg. В этих обстоятельствах совершенно неважно, как тело движется, прямо вниз или по параболе, все равно от F·ds (которое можно написать как Fxdx+Fydy+Fzdz) остается только Fzdz=-mgdz, потому что прочие составляющие силы — нули. Значит, в этом случае
(13.10)
так что в потенциальную энергию входит только высота, с которой тело падает.
Несколько слов о единицах. Так как сила измеряется в ньютонах, а для получения работы ее умножают на расстояние, то работу измеряют в единицах ньютон·метр, но большинство людей этого названия не любит, предпочитая название джоуль (дж). Это только другое слово, а единица та же. Итак, работу измеряют в джоулях. Мощность же — в джоулях в секунду; эту единицу называют ватт(вт). Если умножить ватты на время, то получим произведенную работу. Работу, которую местная энергосистема производит в наших квартирах (в техническом смысле), оценивается в ваттах, умноженных на время. Например, киловатт-час — это 1000 вт×3600 сек, т. е. 3,6·106 дж.
Приведем еще несколько примеров работы и сохранения энергии. Рассмотрим тело, которое вначале имеет кинетическую энергию и быстро двигается, скользя по полу с трением. Оно останавливается. В начале кинетическая энергия не равна нулю, а в конце она равна нулю; существует работа, произведенная силами, потому что раз есть трение, то есть и составляющая силы в направлении, противоположном направлению движения, и энергия постепенно теряется. Теперь рассмотрим массу на конце маятника, который качается в вертикальной плоскости в поле тяжести без трения. Здесь наблюдается нечто другое, потому что, когда масса опускается, сила направлена тоже вниз, а когда подымается, сила направлена в обратную сторону, так что у F·ds на спуске и на подъеме разные знаки. В соответствующих точках спуска и подъема значения F·ds равны по величине, но противоположны по знаку, так что в итоге интеграл есть чистый нуль. Поэтому кинетическая энергия в конце спуска в точности такая же, какой она была в начале подъема; это и есть принцип сохранения энергии. (Заметьте, что в присутствии сил трения сохранение энергии на первый взгляд не выполняется. Значит, нужно искать другую форму энергии. И действительно, оказывается, что когда два тела трутся друг о друга, то возникает тепло, мы же сейчас делаем вид, что об этом не знаем.)
§ 2. Работа, выполняемая тяжестью
Теперь займемся задачей потруднее, когда силы уже не постоянны и не направлены вниз, как раньше. Мы рассмотрим, например, движение планеты вокруг Солнца или спутника вокруг Земли.
Сперва мы рассмотрим движение тела, которое падает из точки 1 прямо на Солнце или на Землю (фиг. 13.2).
Фиг. 13.2. Падение малой массы m под действием тяжести на большую массу М.
Будет ли в этих обстоятельствах сохраняться энергия? Единственное отличие от того, что было раньше, — что теперь сила не постоянна, она меняется по мере падения. Мы знаем, что сила равна произведению GM/r2 на массу m падающего тела. Конечно, и теперь кинетическая энергия при падении возрастает, как возрастала и тогда, когда нас еще не волновало изменение силы с высотой. Вопрос только в том, можно ли отыскать иную, отличную от mgh, формулу для потенциальной энергии, найти другую функцию расстояния от Земли, чтобы для нее сохранение энергии не нарушалось.
Этот одномерный случай рассматривать легко, потому что мы знаем, что изменение кинетической энергии равно интегралу от начала движения до конца от силы —GMm/r2 по перемещению dr
(13.11)
В формуле нет никакого косинуса, потому что сила и перемещение направлены одинаково. Интегрировать dr/r2 легко; получается (—1/r), так что
(13.12)
Перед нами другая формула для потенциальной энергии. Уравнение (13.12) говорит нам, что величина 1/2mv2—GMm/r, вычисленная в точке 1, в точке 2 или в любой другой, остается постоянной.
У нас теперь есть формула для потенциальной энергии в поле тяготения для вертикального движения. Здесь возникает интересный вопрос: можно ли добиться вечного движения в поле тяготения? Поле-то меняется, в разных местах у него разная напряженность и разное направление. Нельзя ли взять бесконечную ленту без трения и запустить ее, скажем, так: пусть она сперва поднимает тело из одной точки в другую, потом проводит его по дуге окружности в третью точку, опускает на некоторый уровень, сдвигает по наклонному направлению и выводит на новый путь и т. п., так что по возвращении в начальную точку оказывается, что поле тяготения совершило некоторую работу и кинетическая энергия тела возросла? Нельзя ли так начертить эту траекторию, чтобы, обойдя по ней, тело приобрело чуть-чуть больше скорости, чем имело вначале? Так получится вечное движение. Но ведь оно невозможно, значит, мы обязаны доказать, что такая траектория немыслима.
Фиг. 13.3. Замкнутый путь обхода в поле тяготения.
Мы должны доказать следующее предположение: раз трения нет, тело должно вернуться ни с меньшей, ни с большей скоростью, а как раз с такой, чтобы еще и еще делать круги по этому замкнутому пути. Или, другими словами, вся работа, произведенная в движении по замкнутому пути, должна быть нулем для сил тяжести, потому что если бы она не была нулем, то можно было бы получить энергию за счет такого движения тела. (Если бы работа оказалась меньше нуля, так что скорость в конце обхода уменьшилась бы, то для получения энергии стоило бы только повернуть обратно; силы ведь зависят не от направления движения, а только от положения. Если в одном направлении работа получится с плюсом, то в обратном она будет с минусом; любая ненулевая работа означает создание вечного двигателя.) Так что же, действительно ли работа равна нулю? Попробуем показать, что да. Сперва мы лишь на пальцах поясним, почему это так, а уж потом оформим математически. Положим, мы выдумали траекторию, показанную на фиг. 13.3; масса падает от 1 к 2, поворачивает до 3, обратно поднимается к 4, затем через 5, 6, 7, 8 движется обратно к 1. Все линии идут либо по радиусу, либо по кругу с центром М. Какая работа совершается на таком пути? Между 1 и 2 она равна произведению GMm на разность 1/r в этих точках:
От 2 до 3 сила в точности направлена поперек движения, и W23=0. От 3 к 4
Так же получаются W45=0, W56=— GMm(1/r6— 1/r5), W67=0, W78=— GMm(1/r8— 1/r7) и W81=0. Всего
Но ведь r2=r3, r4=r5, r6=r7, r8=r1. Поэтому W=0.
Но возникает подозрение, не слишком ли эта кривая проста. А что даст настоящая траектория? Что ж, попробуем настоящую. Сразу же ясно, что ее можно достаточно точно представить как ряд зазубрин (фиг. 13.4) и поэтому... и т. д., что и требовалось доказать.
Фиг. 13.4. «Плавный» путь обхода. Показан увеличенный отрезок этого пути и близкая к нему траектория, состоящая из радиальных и круговых участков, а также один из зубцов этой траектории.
Но надо еще посмотреть, действительно ли работа обхода вокруг маленького треугольника тоже равна нулю. Увеличим один из треугольников (см. фиг. 13.4). Равны ли работы по пути от a к b и от b к c работе, совершаемой, когда идешь напрямик от a к c? Пусть сила действует в каком-то направлении. Расположим треугольник так, чтобы у его катета bc было как раз такое направление. Предположим также, что сам треугольник так мал, что сила всюду на нем постоянна. Какова работа на отрезке ac? Она равна
(поскольку сила постоянна). Теперь определим работу на двух катетах. На вертикальном катете ab сила перпендикулярна к ds, так что работа равна нулю. На горизонтальном катете bc
Мы убеждаемся таким образом, что работа обхода по бокам маленького треугольника такая же, как и по склону, потому что scosθ равно х. Мы уже показали прежде, что работа при движении по зазубринам (как на фиг. 13.3) равна нулю, а теперь видим, что производимая работа одинакова, независимо от того, движемся ли мы по зазубринам или срезаем путь между ними (если только зазубрины малы, но ведь ничто не мешает сделать их такими); поэтому работа обхода по любому замкнутому пути в поле тяготения равна нулю.
Это очень примечательный результат. Благодаря ему нам становятся известны такие подробности о движении планет, о которых мы раньше и не догадывались. Выясняется, что когда планета вертится вокруг Солнца одна, без спутников и в отсутствие каких-либо других сил, то квадрат ее скорости минус некоторая константа, деленная на расстояние до Солнца, вдоль орбиты не меняется. Например, чем ближе планета к Солнцу, тем быстрее она движется. Но насколько быстрее? А вот насколько: если вместо движения вокруг Солнца вы толкнете ее к Солнцу с той же скоростью и подождете, пока она не упадет на нужное расстояние, то приобретенная скорость будет как раз такой, какой планета обладает на этой орбите, потому что получился просто другой пример сложного пути обхода. Если планета вернется по такому пути обратно, ее кинетическая энергия окажется прежней. Поэтому независимо от того, движется ли она по настоящей невозмущенной орбите или же по сложному пути (но без трения), кинетическая энергия в момент возвращения на орбиту оказывается как раз такой, какой нужно.
Значит, когда мы проводим численный анализ движения планеты по орбите (как мы делали раньше), мы можем проверить, не сделали ли заметных ошибок при расчете этой постоянной величины, энергии, на каждом шаге; она не должна меняться. Для орбиты, приведенной в табл. 9.2, энергия меняется[13] примерно на 1,5% с начала движения до конца. Почему? То ли потому, что в численном методе мы пользовались конечными приращениями, то ли из-за мелких погрешностей в арифметике.
Рассмотрим энергию в другой задаче: задаче о массе, подвешенной на пружине. Когда отклоняют массу от положения равновесия, сила, восстанавливающая ее положение, пропорциональна смещению. Можно ли в этих условиях вывести закон сохранения энергии? Да; потому что работа, совершаемая этой силой, равна
Значит, у массы, подвешенной на пружине, сумма кинетической энергии ее колебаний и 1/2kx2 постоянна. Посмотрим, как это происходит. Оттянем массу вниз; она неподвижна и скорость ее равна нулю, но х не равно нулю, теперь величина х максимальна, так что имеется и некоторый запас энергии (потенциальной). Отпустим теперь массу: начнется какой-то процесс (в детали мы не вникаем), но в любое мгновение кинетическая плюс потенциальная энергии будут постоянны. Например, когда масса проходит через точку первоначального равновесия, то х=0, но тогда значение v2 наибольшее, и чем больше величина x2, тем меньше v2 и т. д. Значит, во время колебаний соблюдается равновесие между величинами x2 и r2. Мы получили, таким образом, новое правило: потенциальная энергия пружины равна 1/2kx2, если сила равна -kx.
§ 3. Сложение энергий
Перейдем теперь к более общему случаю и рассмотрим, что произойдет, если тел много. Предположим, что имеется несколько тел; пронумеруем их: i=1, 2, 3, ... и пусть все они притягивают друг друга. Что тогда произойдет? Можно доказать, что если сложить кинетические энергии всех тел и добавить сюда сумму (по всем парам частиц) их взаимных потенциальных энергий тяготения — GMm/rij, то все вместе даст постоянную:
(13.14)
Как же это доказать? Мы продифференцируем обе стороны по времени и докажем, что получится нуль. При дифференцировании 1/2mivi2 мы получим производные скорости — силы [как в (13.5)], а потом эти силы заменим их величиной, известной нам из закона тяготения, и увидим в конце концов, что останется как раз производная по времени от
Начинаем доказательство. Производная кинетической энергии по времени есть
(13.15)
Производная по времени от потенциальной энергии есть
но
так что
потому что rij=-rji, хотя rij=rji . Итак,
(13.16)
Теперь внимательно посмотрим, что значит ∑i{∑j} и ∑пары В (13.15) ∑i{∑j} означает, что i принимает по порядку все значения i=1, 2, 3,..., и для каждого i индекс j принимает все значения, кроме i. Если, например, i=3, то j принимает значения 1, 2, 4, ....
С другой стороны, в (13.16) ∑пары означает, что каждая пара i и j встречается лишь однажды. Скажем, частицы 1 и 3 дают только один член в сумме. Чтобы отметить это, можно договориться, что i принимает значения 1, 2, 3, ..., а j для каждого i — только значения, большие чем i Если, скажем, i=3, то j равно 4, 5, 6, .... Но вспомним, что каждая пара i,j дает два слагаемых в сумме, одно с vi, а другое с vj, и что оба эти члена выглядят так же, как член в уравнении (13.14) [но только в последнем в сумму входят все значения i и j (кроме i=j)]. В уравнениях (13.16) и (13.15) член за членом совпадут по величине. Знаки их, однако, будут противоположны, так что производная по времени от суммы потенциальной и кинетической энергий действительно равна нулю. Итак, мы видим, что и в системе многих тел кинетическая энергия составляется из суммы энергий отдельных тел и что потенциальная энергия тоже состоит из взаимных потенциальных энергий пар частиц. Почему она складывается из энергий пар? Это можно уяснить себе следующим образом: положим, мы хотим найти всю работу, которую нужно совершить, чтобы развести тела на определенные расстояния друг от друга. Можно это сделать не за один раз, а постепенно, доставляя их одно за другим из бесконечности, где на них никакие силы не влияли. Сперва мы приведем тело 1, на что работы не потребуется, потому что, пока нет других тел, силы отсутствуют. Доставка тела 2 потребует работы W12=-Gm1m2/r12. И вот теперь самый существенный момент: мы доставляем тело 3 в точку 3. В любой момент сила, действующая на 3, слагается из двух частей: из силы, действующей со стороны 1, и силы со стороны 2. Значит, и вся произведенная работа равна сумме работ каждой из сил, потому что раз F3 разбивается на сумму сил
то работа равна
Стало быть, вся работа равна сумме работ, произведенных против силы 1 и против силы 2, как если бы они действовали независимо. Продолжая рассуждать таким образом, мы увидим, что полная работа, которую необходимо выполнить, чтобы собрать данную конфигурацию тел, в точности равна значению (13.14) для потенциальной энергии. Именно из-за того, что тяготение подчиняется принципу наложения сил, можно потенциальную энергию представить в виде суммы по всем парам частиц.
§ 4. Поле тяготения больших тел
Теперь рассчитаем поля, встречающиеся во многих физических задачах, когда речь идет о распределении масс. Мы пока не рассматривали распределения масс, а занимались только отдельными частицами. Но интересно рассчитать и поля, образуемые более чем одной частицей. Для начала найдем силу притяжения со стороны плоского пласта вещества бесконечной протяженности. Сила притяжения единичной массы в данной точке Р (фиг. 13.5), конечно, направлена к плоскости.
Фиг. 13.5. Сила притяжения материальной точки материальной плоскостью.
Расстояние от точки до плоскости есть a, а масса единицы площади этой плоскости есть μ. Пусть μ будет постоянной: слой однороден. Какой же величины поле dC создается массой dm, удаленной от О не ближе, чем на p, и не дальше, чем на p+dp (О — это точка плоскости, ближайшая к Р)? Ответ: dC=G(dmr/r3). Но оно, это поле, направлено вдоль r, а мы понимаем, что из трех составляющих С после сложения всех dC должна остаться лишь x-составляющая. Она равна
Все массы dm, которые находятся на одном и том же расстоянии r от Р, дадут одно и то же значение dCx, так что за dm можно сразу принять массу всего кольца между p и p+dp, т. е. dm=μ2πpdp (2πpdp — это площадь кольца радиусом p и шириной dp при dp≪p). Итак,
Но pdp=rdr из-за того, что r2=p2+a2. Поэтому
(13.17)
Стало быть, сила не зависит от расстояния а! Почему? Не ошиблись ли мы? Казалось бы, чем дальше от плоскости, тем сила слабее. Но нет! Если точка находится вплотную к плоскости, то большая часть вещества притягивает ее под неудачными углами, а если вдалеке, то у большей части вещества притяжение направлено прямее к плоскости. На любом расстоянии самая «влиятельная» часть плоскости лежит в некотором конусе. С удалением сила ослабляется обратно пропорционально квадрату расстояния, но в том же конусе под тем же углом оказывается больше вещества, а рост количества вещества тоже пропорционален квадрату расстояния! Этот анализ может быть сделан более строгим, если заметить, что дифференциал вклада любого данного конуса не зависит от расстояния в результате противоположных изменений напряженности поля данной массы и количества самой этой массы (с ростом расстояния). Впрочем, на самом деле сила не постоянна, ибо на другой стороне плоскости она меняет знак.
Мы решили, кстати, и задачу по электричеству: мы доказали, что у заряженной пластины, каждая единица площади которой несет заряд σ, электрическое поле равно σ/2ε0 и направлено от пластины, если она заряжена положительно, и к ней, если она заряжена отрицательно. Чтобы доказать это, надо просто вспомнить, что в законе тяготения G играет ту же роль, что 1/4πε0 в электричестве.
А теперь пусть имеются две пластины, одна с положительным зарядом +σ, а другая с отрицательным -σ (на единицу площади), и пусть промежуток между ними равен D. Каково поле этих пластин? Снаружи пластин поле равно нулю. Отчего? Оттого, что одна из них отталкивает, а другая притягивает и у обеих сила не зависит от расстояния; значит, силы всюду уничтожаются! А вот поле между пластинами вдвое больше, чем поле одной пластины, направлено оно от положительной пластины к отрицательной и равно Е=σ/ε0.
Перейдем теперь к еще более интересному и важному вопросу; впрочем, мы давно уже ответили на него, предположив, что сила притяжения Земли в точке на ее поверхности или над нею такая же, как если бы вся масса Земли сосредоточилась в ее центре. Справедливость этого предположения не очевидна: ведь когда мы находимся у самой земли, какая-то часть ее массы очень к нам близка, а другая далека и т. д. Когда мы складываем действие всех таких масс, то кажется чудом, что в конце концов сила сводится к тому, что вся Земля сжалась в одну точку, стянулась к своему центру!
Мы теперь покажем, что это чудо обыкновенное; чтобы продемонстрировать это, разобьем Землю на тонкие сферические слои. Пусть вся масса сферы равна m. Давайте рассчитаем потенциальную энергию частицы массы m' на расстоянии R от центра сферы (фиг. 13.6).
Фиг. 13.6. Тонкий сферический слой масс (или зарядов).
Мы увидим, что потенциальная энергия как раз такая, как если бы масса m сферы вся собралась в ее центре. (Легче иметь дело с потенциальной энергией, чем с напряженностью поля: не нужно думать об углах, а просто складывать потенциальные энергии всех частей сферы.) Нарежем сферу на узкие пояски, и пусть x — расстояние плоскости пояска от центра сферы; тогда вся масса пояска толщиной dx находится на одном и том же расстоянии r от точки P, а потенциальная энергия притяжения этого пояска равна —Gm'dm/r. Сколько же массы содержится в пояске dx? Вот сколько:
где μ=m/4πa2 — поверхностная плотность массы. (Вообще площадь поверхности шарового пояса пропорциональна его высоте.) Поэтому потенциальная энергия притяжения массы dm есть
Но мы видим, что
Значит,
или
Поэтому
и получается
(13.18)
Стало быть, для тонкого слоя потенциальная энергия массы m', внешней по отношению к слою, такова, как если бы масса слоя собралась в его центре. Землю же можно представить в виде ряда таких слоев, и притяжение каждого из слоев зависит только от его массы; сложив их, получим всю массу планеты; значит, и вся Земля действует так, словно все ее вещество находится в ее центре!
Но посмотрим, что произойдет, если точка Р окажется внутри слоя. Проделывая те же расчеты вплоть до интегрирования, мы получим разность двух значений r, но уже в другой форме: (a+R)-(а-R)=2R (двойное расстояние от Р до центра). Другими словами, теперь W становится равной W=-Gmm'/a, что не зависит от R, т. е. точка Р всюду внутри сферы обладает одной и той же энергией тяготения. А значит, на нее не действует никакая сила, и не нужно никакой работы, чтобы двигать ее внутри. Когда потенциальная энергия тела всюду, в любой точке внутри сферы, одинакова, то на тело не действует никакая сила. Внутри сферы тело не испытывает действия сил, сила действует только снаружи.
Глава 14 РАБОТА И ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ (II)
§ 1. Работа
В предыдущей главе мы ввели много новых понятий и идей, играющих важную роль в физике. Идеи эти столь важны, что, пожалуй, стоит посвятить целую главу внимательному ознакомлению с ними. Мы не будем здесь повторять «доказательства» и красивые приемы, позволяющие просто получать важные результаты, а вместо этого сосредоточим наше внимание на обсуждении самих идей.
Штудируя любой вопрос технического характера, для понимания которого нужна математика, мы всегда сталкиваемся с необходимостью понять и отложить в памяти массу фактов и идей, объединенных определенными связями. Существование этих связей можно «доказать или «показать». Ничего не стоит спутать само доказательство с тем соотношением, которое оно устанавливает. Конечно, куда важнее выучить и запомнить не доказательство, а само соотношение. Тогда уж в любом случае мы сможем сказать: «Легко показать, что...» то-то и то-то верно, а то и действительно показать это. Приводимые доказательства почти всегда состряпаны, сфабрикованы с таким расчетом, чтобы, во-первых, их легко было воспроизвести мелом на доске или пером на бумаге и, во-вторых, чтобы они выглядели поглаже. В итоге доказательство выглядит обманчиво просто, хотя, быть может, на самом деле автор много часов искал разные пути расчета, пока не нашел самый изящный — тот, который приводит к результату за кратчайшее время! Глядя на вывод формулы, надо вспоминать не этот вывод, а скорее сам факт, что то-то и то-то можно доказать. Конечно, если доказательство требует особых математических выкладок или «трюков», никогда прежде не виденных, то надо обратить внимание... впрочем, не на сами трюки, а на их идею.
Ни одно из доказательств, приведенных в этом курсе, автор не запомнил с тех времен, когда сам учил физику. Наоборот, он просто вспоминает, что то-то является верным, и, пытаясь пояснить, как это доказывается, сам придумывает доказательство в тот момент, когда оно необходимо. И всякий, кто действительно изучил предмет, должен быть в состоянии поступать так же, не запоминая доказательств. Вот почему в этой главе мы будем избегать вывода различных положений, сделанных ранее, а просто будем подводить итоги.
Первая идея, которую нужно будет переварить, — это то, что работа производится силой. Физический термин «работа» ничего общего не имеет с общежитейским ее смыслом...
Физическая работа выражается в виде ∫F·ds, или «контурный интеграл от F по ds скалярно»; последнее означает, что если сила направлена, скажем, в одну сторону, а тело, на которое сила действует, перемещается в другую сторону, то работу совершает только составляющая силы в направлении перемещения. Если бы, например, сила была постоянна, а смещение произошло на конечный отрезок Δs, то работа, выполненная постоянной силой на этом пути, была бы равна произведению составляющей силы вдоль Δs на Δs. Правило гласит: «работа есть сила на путь», но подразумевается лишь составляющая силы в направлении перемещения, умноженная на Δs, или, что одно и то же, составляющая перемещения в направлении силы, умноженная на F.
Очевидно, что сила, направленная под прямым углом к перемещению, никакой работы не произведет.
Если, далее, вектор смещения Δs разложить на составляющие, т. е. если истинное смещение есть Δs и мы хотим считать, что оно состоит из составляющих смещения Δx в направлении х, Δy в направлении у и Δz в направлении z, то вся произведенная работа перемещения тела из одного места в другое может быть рассчитана по трем частям: отдельно работа смещения вдоль х, вдоль у и вдоль z. Работа перемещения вдоль х требует знания только соответствующей составляющей силы Fx и т. д., так что работа равна FxΔx+FyΔy+FzΔz. Когда сила не постоянна, а движение запутанное, криволинейное, то нужно разбить путь на множество малых Δs, сложить работы переноса тела вдоль каждого Δs и перейти к пределу при Δs, стремящемся к нулю. В этом смысл понятия «контурный интеграл».
Все, что мы только что сказали, содержится в формуле W=∫F·ds. Но одно дело назвать эту формулу прекрасной, и совсем другое — понять ее смысл и ее следствия.
Смысл слова «работа» в физике настолько отличается от того, что подразумевают под этим словом в обычных обстоятельствах, что надо тщательно проследить это различие. Например, по точному смыслу физического определения работы, если вы держите в руках двухпудовую гирю, вы не совершаете никакой работы. Вас бросает в пот, ваши руки дрожат, вы дышите тяжело, как будто взбежали по лестнице, а работы вы не совершаете. Когда вы взбегаете по лестнице, то считается, что вы совершаете работу; когда вы сбегаете по лестнице вниз, то, согласно физике, мир производит работу над вами, а вот когда вы держите предмет, стоя неподвижно, никакой работы не производится. Физическое определение работы отличается от физиологического по причинам, которые мы сейчас кратко изложим.
Когда вы держите груз, вы, конечно, выполняете «физиологическую» работу. Отчего вас бросает в пот? Почему для такого занятия вам необходимо хорошо питаться? Почему все механизмы внутри вас работают в полную силу, когда вы подставили спину под груз? Ведь можно на этот груз не тратить никаких усилий, стоит лишь положить его на стол, и стол спокойно и мирно, не нуждаясь ни в какой энергии, будет держать себе тот же груз на той же высоте! Физиология дает примерно следующее объяснение. У человека и у других животных есть два рода мышц. Одни, называемые поперечнополосатыми, или скелетными, контролируются нашей волей; таковы, например, мышцы рук. Другие мышцы называются гладкими (например, мышцы внутренностей или у моллюсков большой замыкающий мускул, который закрывает створки). Гладкие мышцы работают очень медленно, но способны «оцепенеть»; это значит, что если, скажем, моллюску нужно удержать свои створки в определенном положении, то он их удержит, какая бы сила на них ни нажимала. Многие часы способен он без устали держать створки под нагрузкой, подобно столу, на который положен груз; мышца «застывает» в определенном положении, молекулы ее как бы схватываются друг с другом, не совершая никакой работы, не требуя от моллюска никаких усилий. Нам же нужны непрерывные усилия, чтобы удержать вес. Это объясняется просто устройством поперечнополосатых мышц. Когда нервный импульс достигает мышечного волокна, оно несколько сокращается и затем опять расслабляется; когда мы держим груз, то в мышцу сплошным и обильным потоком текут нервные импульсы, множество волокон сокращается, пока другие отдыхают. Это даже можно увидеть: когда рука устает держать тяжесть, она начинает дрожать. Происходит это потому, что поток импульсов нерегулярен и уставшие мышцы не успевают вовремя на них ответить. Почему же мышцы собраны по такой неудачной схеме? Неизвестно почему, но природа не сумела создать быстродействующих гладких мышц. А куда удобнее было бы поднимать грузы именно гладкими мышцами: они способны замирать на месте, они могут цепенеть и для этого не нужно было бы совершать никакой работы и не нужна никакая энергия. Правда, у этих мышц есть один недостаток: они очень медленно работают.
Но вернемся к физике и зададим еще один вопрос: зачем нам подсчитывать выполненную работу? Ответ: потому что это интересно и полезно. Потому что работа, которую производит над частицей равнодействующая всех приложенных к ней сил, в точности равна изменению кинетической энергии этой частицы. Если тело толкнуть, оно наберет скорость, и
§ 2. Движение при наложенных связях
Силы и работа обладают еще одним интересным свойством. Пусть имеется некоторый уклон, какая-то криволинейная колея, по которой частица должна двигаться без трения. Или имеется маятник — груз на ниточке; нить маятника вынуждает груз двигаться по кругу вокруг точки подвеса. Намотав нить на колышек, можно в качании менять точку подвеса, так что траектория груза будет складываться из двух окружностей разного радиуса. Все это примеры так называемых неподвижных связей без трения.
В движении с неподвижными связями без трения эти связи не производят никакой работы, потому что реакции связей всегда прилагаются к телу под прямым углом к самим связям; так обстоит дело и с реакцией колеи и с натяжением нити.
Силы, возникающие при движении частицы вниз по склону под действием тяжести, весьма и весьма запутаны: здесь и реакции связи, и сила тяжести, и т. п. И все же, если основывать свои расчеты движения лишь на сохранении энергии и на учете только силы тяжести, получается правильный результат. Это выглядит довольно странно, потому что это не совсем правильно; надо было бы пользоваться равнодействующей силой. Тем не менее работа, произведенная только силой тяжести, оказывается равной изменению кинетической энергии, потому что работа сил связей равна нулю (фиг. 14.1).
Фиг. 14.1. Силы, действующие на тело, скользящее без трения.
Важное свойство сил, о котором мы говорили, состоит в том, что если силу можно разбить на две или несколько «частей», то работа, выполняемая самой силой при движении по некоторой кривой, равна сумме работ, произведенных каждой «частью» силы. Если мы представляем силу в виде векторной суммы нескольких сил (силы тяжести, реакции связей и т. д., или x-составляющих всех сил плюс y-составляющие и т.д., или еще как-нибудь), то работа всей силы равна сумме работ тех частей, на которые мы ее разделили.
§ 3. Консервативные силы
В природе существуют силы, скажем сила тяжести, обладающие замечательным свойством — «консервативностью» (никаких политических идей, ничего двусмысленного в этом понятии нет). Когда мы подсчитываем, какую работу выполняет сила, двигая тело от одной точки к другой, то вообще работа зависит от траектории; но в особых случаях эта зависимость пропадает. Если работа не зависит от траектории, мы говорим, что сила консервативна. Иными словами, если интеграл от произведения силы на приращения смещений между точками 1 и 2 (фиг. 14.2) один раз вычислен вдоль кривой А, а другой — вдоль кривой В, и оба раза получается одинаковое количество джоулей, и если это выполнено для любой кривой, соединяющей эту пару точек, и если это же справедливо для любой пары точек, то говорят, что сила консервативна. В таких обстоятельствах интеграл работы между точками 1 и 2 можно легко подсчитать и дать для него формулу. А в других случаях это не так просто: нужно задавать еще форму кривой; но когда работа не зависит от кривой, то, ясное дело, остается только зависимость от положений точек 1 и 2.
Чтобы доказать это, рассмотрим фиг. 14.2.
Фиг. 14.2. Возможные пути, соединяющие две точки в поле сил.
Фиксируем произвольную точку Р. Криволинейный интеграл работы на участке (1,2) можно вычислить, разбив его на две части: работу на участке (1, P) и работу на участке (P, 2), потому что сейчас у нас всюду консервативные силы, и по какому пути ни пойти, значение работы одно и то же. Работа перемещения из точки Р в любую точку пространства является функцией положения конечной точки. Она зависит и от Р, но мы во всем дальнейшем анализе точку Р закрепим, так что работа перемещения тела от точки Р к точке 2 будет некоторой функцией положения точки 2. Она зависит от того, где находится точка 2; если переместить тело в другую точку, ответ будет другой.
Обозначим эту функцию положения через -U(x, у, z); желая отметить, что речь идет именно о точке 2 с координатами x2, y2, z2, мы будем просто писать U(2), сокращая обозначение U(х2, у2, z2). Работу перемещения из точки 1 в точку Р можно написать, обратив направление интегрирования (переменив знаки всех ds). Другими словами, работа на участке (1,Р) равна работе на участке (P,1) со знаком минус:
Значит, работа на участке (Р,1) есть -U(1), а на участке (Р,2) есть -U(2). Поэтому интеграл от 1 до 2 равен -U(2) плюс [-U(1) назад], т. е. +U(1)-U(2):
(14.1)
Величина U(1)-U(2) называется изменением потенциальной энергии, а U можно назвать потенциальной энергией. Мы будем говорит, что когда предмет находится в положении 2, то он обладает потенциальной энергией U(2), а в положении 1 — потенциальной энергией U(1). Когда он находится в положении Р, его потенциальная энергия равна нулю. Если бы вместо Р взять любую другую точку Q, то оказалось бы (это предоставляется доказать вам самим), что потенциальная энергия всех точек изменилась бы только на постоянную добавку. Так как сохранение энергии зависит только от изменений ее, то эта добавочная постоянная никакого значения не имеет. Вот поэтому точка Р произвольна.
Итак, у нас имеются два утверждения: 1) работа, выполняемая силой, равна изменению кинетической энергии системы, но 2) математически для консервативных сил выполненная работа равна минус изменению функции U, называемой потенциальной энергией. Как следствие этих утверждений возникает еще одно: если действуют только консервативные силы, сумма потенциальной U и кинетической Т энергий остается постоянной:
(14.2)
Рассмотрим формулу потенциальной энергии для ряда случаев. Если поле тяготения однородно, если мы не поднимаемся до высот, сравнимых с радиусом Земли, то сила постоянна и направлена вертикально, а работа равна просто произведению силы на расстояние по вертикали. Стало быть,
(14.3)
и за точку Р с нулевой потенциальной энергией можно принять любую точку на поверхности z=0. Но можно также говорить, что потенциальная энергия равна mg(z-6), если нам так уж этого хочется! Все результаты в нашем анализе останутся теми же, кроме того что потенциальная энергия на поверхности z=0 будет равна -mg6. Разницы никакой, ведь в расчет надо принимать только разности потенциальных энергий.
Энергия, необходимая для сжатия пружины на расстояние х от точки равновесия, равна
(14.4)
и нуль потенциальной энергии приходится на точку х=0, т. е. на равновесное состояние пружины. И здесь тоже мы можем добавить любую константу.
Потенциальная энергия тяготения точечных масс M и m на расстоянии r друг от друга равна
(14.5)
Константа здесь выбрана так, чтобы потенциал исчезал на бесконечности. Конечно, эту же формулу можно применить и к электрическим зарядам, поскольку закон один и тот же:
(14.6)
Давайте теперь поработаем с одной из этих формул, посмотрим, поняли ли мы их смысл.
Вопрос: С какой скоростью должна отправиться ракета с Земли, чтобы покинуть ее?
Ответ: Сумма кинетической и потенциальной энергий должна быть постоянной; покинуть Землю — значит удалиться от нее на миллионы километров; если у ракеты только-только хватает сил, чтобы покинуть Землю, то надо предположить, что там, вдалеке, ее скорость будет равна нулю и что на бесконечности она будет едва-едва двигаться. Пусть а — радиус Земли, а M — ее масса. Кинетическая плюс потенциальная энергии первоначально были равны 1/2 mv2-GmM/a. В конце движения эти обе энергии должны сравняться. Кинетическую энергию в конце движения мы считаем нулевой, потому что тело еле движется (почти с нулевой скоростью), а потенциальная энергия равна величине GmM, деленной на бесконечность, т. е. опять нулевая. Значит, с одной стороны стоит разность двух нулей; поэтому квадрат скорости должен быть равен 2GM/a. Но GM/a2 это как раз то, что называют ускорением силы тяжести g. Итак,
С какой скоростью должен двигаться искусственный спутник, чтобы не падать на Землю? Мы когда-то решали эту задачу и получили v2=GM/a. Значит, чтобы покинуть Землю, нужна скорость, в √2 большая, чем скорость вращения спутника вокруг Земли. Иными словами, чтобы улететь с Земли, нужно вдвое больше энергии (энергия пропорциональна квадрату скорости), чем чтобы облететь вокруг нее. Поэтому исторически сначала были совершены облеты искусственных спутников вокруг Земли, для чего понадобились скорости около 7,8 км/сек. И только потом космические корабли были заброшены в мировое пространство; для этого потребовалось уже вдвое больше энергии, т. е. скорости около 11,2 км/сек.
Продолжим теперь наш обзор характеристик потенциальной энергии. Давайте рассмотрим взаимодействие двух молекул или двух атомов, например двух атомов кислорода. Когда они находятся далеко друг от друга, они притягиваются с силой, обратно пропорциональной седьмой степени расстояния, а при тесном сближении они сильно отталкиваются. Проинтегрировав минус седьмую степень расстояния, чтобы получить работу, мы увидим, что потенциальная энергия U (функция расстояния между атомами кислорода) изменяется как минус шестая степень расстояния (на больших расстояниях).
Если мы чертим некую кривую потенциальной энергии U(r) (фиг. 14.3), то при больших r она выглядит как r-6, а при достаточно малых r достигает минимума.
Фиг. 14.3. Потенциальная энергия взаимодействия двух атомов как функция расстояния между ними.
Минимум потенциальной энергии в точке r=d означает, что если мы сдвинемся от нее на малое расстояние, на очень малое расстояние, то произведенная работа, равная изменению потенциальной энергии на этом промежутке, почти равна нулю, потому что на донышке кривой энергия почти не меняется. Значит, в этой точке сила равна нулю, и это есть точка равновесия. Условие равновесия можно высказать и иначе: для удаления из точки равновесия в любую сторону нужно затратить работу. Когда два атома кислорода расположены так, что никакой энергии из их силы взаимодействия больше выжать нельзя, то они находятся в наинизшем энергетическом состоянии и промежуток между ними равен d. Так выглядит молекула кислорода, когда она не нагрета. При нагревании атомы колеблются и расходятся; их можно и совсем развести, но для этого нужно определенное количество работы или энергии, равное разности потенциальных энергий в точках r=d и r=∞. При попытке сблизить атомы энергия быстро возрастает вследствие их взаимного отталкивания.
Почему мы говорим о потенциальной энергии? Потому что идея силы не очень пригодна для квантовой механики, там более естественна идея энергии. Когда мы рассматриваем более сложные взаимодействия: ядерного вещества, молекул и т. д., то, хотя понятия силы и скорости «рассасываются» и исчезают, оказывается, что понятие энергии все же остается. Поэтому в книгах по квантовой механике мы находим кривые потенциальной энергии, но очень редко увидим график силы взаимодействия двух молекул, потому что те, кто изучает эти явления, больше уже привыкли думать об энергии, чем о силе.
Заметим еще, что, когда на тело одновременно действуют несколько консервативных сил, потенциальная энергия тела есть сумма потенциальных энергий от каждой силы. Это то, что мы утверждали и раньше, потому что, когда сила представляется векторной суммой сил, работа, производимая ею, равна сумме работ, производимых отдельными силами; поэтому ее можно представить как изменения потенциальных энергий от каждой силы по отдельности. Значит, общая потенциальная энергия равна сумме всех частей.
Мы можем обобщить это на случай системы многих тел, как, например, Юпитера, Сатурна, Урана и т. д. или атомов кислорода, азота, углерода и т. д., взаимодействующих друг с другом попарно, причем силы взаимодействия каждой пары консервативны. В таких условиях кинетическая энергия всей системы есть просто сумма кинетических энергий всех отдельных атомов, или планет, или частиц, а потенциальная энергия системы есть сумма потенциальных энергий взаимодействия отдельных пар, рассчитанных в предположении, что других частиц нет. (На самом деле для молекулярных сил это неверно, и формула получается несколько сложнее; для ньютонова тяготения это определенно справедливо, а для молекулярных сил годится лишь как приближение. Можно, конечно, говорить о потенциальной энергии молекулярных сил, но она иногда оказывается более сложной функцией положений атомов, чем простая сумма попарных взаимодействий.) Поэтому потенциальная энергия в частном случае тяготения представляется суммой по всем парам i и j членов — Gmimj/rij [как было показано в уравнении (13.14)]. Уравнение (13.14) выражает математически следующее предложение: общая потенциальная плюс общая кинетическая энергии не меняются со временем. Пусть себе различные планеты вращаются, обращаются и покачиваются, все равно если подсчитать общую потенциальную и общую кинетическую энергии, то окажется, что их сумма всегда остается постоянной.
§ 4. Неконсервативные силы
Мы потратили немало времени, обсуждая свойства консервативных сил. Что же мы теперь скажем о неконсервативных силах? Мы хотим разобраться в этом вопросе более подробно, чем это обыкновенно делают, и показать, что неконсервативных сил не бывает! Оказывается, все основные силы природы, по-видимому, консервативны. Не подумайте, что это следствие из законов Ньютона. На самом деле, насколько представлял себе это сам Ньютон, силы могут быть неконсервативными, как, например, трение, которое кажется неконсервативным. Употребляя слово «кажется», мы проводим современную точку зрения, которая доказывает, что все глубинные силы, все силы взаимодействия между частицами на самом фундаментальном уровне суть силы консервативные.
Когда мы, например, анализируем систему наподобие большого шарового звездного скопления (фотографию такого скопления мы показывали) с тысячами взаимодействующих звезд, то формула для общей потенциальной энергии состоит просто из суммы слагаемых, каждое из которых выражает взаимодействие какой-то пары звезд; точно так же и кинетическая энергия есть сумма кинетических энергий всех отдельных звезд. Но шаровое скопление как целое движется и в пространстве, и окажись мы от него так далеко, что не смогли бы различать отдельных деталей, мы бы приняли его за единый предмет. Если бы при этом к нему были приложены какие-то силы, то часть из них могла бы двигать его как целое и мы бы увидели, как центр этого тела движется. С другой стороны, прочие силы могли бы, если так можно выразиться, «тратиться» на повышение потенциальной или кинетической энергии «частиц» внутри «тела». Положим, например, что действие этих сил привело бы к расширению всего скопления и увеличению скоростей «частиц». Общая энергия «тела» на самом деле сохранялась бы. Но, глядя издалека нашими слабыми глазами, не различающими беспорядочных внутренних движений, мы бы видели только кинетическую энергию всего тела и нам бы казалось, что энергия не сохраняется, хотя все дело было бы в том, что мы не различаем деталей. Оказывается, что это всегда так: общая энергия Вселенной, кинетическая плюс потенциальная, если как следует посмотреть, всегда постоянна.
Изучая тончайшие свойства вещества на атомном уровне, не всегда легко разделить общую энергию на две части, потенциальную и кинетическую, и не всегда такое разделение необходимо. Во всяком случае, оно возможно почти всегда, так что давайте говорить, что оно всегда возможно и что потенциальная плюс кинетическая энергии мира постоянны. Итак, общая потенциальная плюс кинетическая энергии внутри целого мира постоянны, и если «мир» — это изолированный кусок вещества, то энергия его постоянна, если только нет внешних сил. Но, как мы видели, часть кинетической и потенциальной энергий предмета может быть внутренней (например, внутренние молекулярные движения), внутренней в том смысле, что мы ее не замечаем. Мы знаем, что в стакане воды все колеблется, все части беспрерывно движутся, так что внутри имеется определенная кинетическая энергия, на которую мы обычно никакого внимания не обращаем. Мы не замечаем движения атомов, рождающего теплоту, и поэтому не называем его кинетической энергией, но основа тепла — все-таки кинетическая энергия. Точно так же и внутренняя потенциальная энергия может, например, иметь форму химической энергии: когда мы сжигаем бензин, выделяется энергия, потому что потенциальные энергии атомов при новом их размещении оказываются ниже, чем при прежнем расположении. Строго говоря, теплоту нельзя считать чисто кинетической энергией, в нее входит и часть потенциальной энергии; то же относится и к химической энергии, так что лучше объединить их и говорить, что общая кинетическая и потенциальная энергии внутри тела — это частично тепло, частично химическая энергия и т. д. Во всяком случае, все эти различные формы внутренней энергии иногда рассматривают как «потерянную» энергию в том смысле, как сказано выше; когда мы изучим термодинамику, нам все это станет яснее.
В качестве другого примера возьмем трение. Неверно, что кинетическая энергия в результате трения исчезает; это неверно, хотя скользящее тело и впрямь останавливается и кажется, что кинетическая энергия пропала. Но она не пропадает, ибо атомы внутри тела начинают двигаться с большим запасом кинетической энергии; хоть мы этого и не можем увидеть, но можно догадаться об этом по повышению температуры. Конечно, если не обращать внимания на тепловую энергию, то теорема о сохранении энергии покажется неправильной.
Еще в одном случае может показаться, что энергия не сохраняется: когда мы изучаем часть всей системы. Вполне естественно, что если что-то взаимодействует с чем-то внешним и мы пренебрегаем этим взаимодействием, то теорема о сохранении энергии будет выглядеть неверной.
В классической физике в потенциальную энергию включались только тяготение и электричество, но теперь у нас есть и атомная энергия и многое другое. В классической теории, например, свет — это особая форма энергии, но можно, если нам этого хочется, представить себе энергию света как кинетическую энергию фотонов, и тогда наша формула (14.2) опять окажется справедливой.
§ 5. Потенциалы и поля
Теперь обратимся к некоторым идеям, связанным с потенциальной энергией и с понятием поля. Пусть два больших тела А и В притягивают к себе третье малое тело с суммарной силой F. Мы уже отмечали в гл. 12, что сила притяжения частицы может быть представлена как произведение ее массы m на вектор С, зависящий лишь от положения частицы:
Тяготение можно анализировать, считая, что в каждом месте пространства имеется вектор С, который «действует» на массу, помещенную в это место, но который присутствует там безотносительно к тому, поместили ли мы туда массу или нет. Вектор С имеет три составляющие, и каждая из них является функцией от (х, y, z) — функцией положения в пространстве. Такую вещь мы называем полем и говорим, что тела А и В создают поле, т. е. «делают» вектор С. Когда тело помещено в поле, то сила действия на это тело равна его массе, умноженной на величину вектора поля в той точке, куда тело попало.
С потенциальной энергией можно сделать то же самое. Так как потенциальная энергия, интеграл от (Сила)·(ds), может быть записана в виде массы m, умноженной на интеграл от (Поле)·(ds) — это простое изменение масштаба, — то потенциальную энергию U(x, у, z) тела, расположенного в точке (x, y, z), можно записать как произведение m на другую функцию. Назовем ее потенциалом Ψ. Интеграл ∫C·ds равен -Ψ, подобно тому как ∫F·ds=-U; они отличаются только масштабом:
(14.7)
Зная в каждой точке пространства эту функцию Ψ(х, y, z), можно немедленно вычислить потенциальную энергию тела в любой точке, а именно U(x, у, z)=mΨ(x, y, z). Теперь, как видите, это стало делом пустяковым. Но на самом деле это отнюдь не пустяк, потому что иногда намного приятнее описать поле, задав распределение потенциала во всем пространстве, чем задавать С. Вместо трех сложных компонент векторной функции проще задать скалярную функцию Ψ. Кроме того, когда поле создается многими массами, величину Ψ рассчитывать легче, чем три компоненты С: потенциалы — скаляры, их можно просто складывать, не заботясь о направлениях сил. А поле С, как мы сейчас увидим, легко восстановить, зная Ψ. Пусть у нас есть точечные массы m1, m2,... в точках 1, 2..., и мы хотим знать потенциал Ψ в некоторой произвольной точке Р. Тогда он оказывается простой суммой потенциалов отдельных масс в точке Р:
(14.8)
Этой формулой, представляющей потенциал в виде суммы потенциалов отдельных масс, мы пользовались в предыдущей главе, чтобы вычислить потенциал сферического слоя (мы тогда сложили потенциалы всех поясков, на какие был нарезан слой). Итог расчета показан на фиг. 14.4.
Фиг. 14.4. Потенциал тяготеющего сферического слоя радиусом а.
Потенциал отрицателен, равен нулю на бесконечности, падает как 1/r, пока r не станет равным а, и затем внутри слоя становится постоянным. Вне слоя потенциал равен — Gm/r (m — масса слоя), что полностью совпадает с потенциалом точки с массой m, помещенной в центре сферического слоя. Но такое совпадение существует только для точек снаружи слоя, а во внутренних точках потенциал оказывается равным — Gm/a и больше не меняется! А когда потенциал постоянен, то поля нет: если потенциальная энергия не меняется, то сила отсутствует, потому что, когда мы двигаем тело из одной внутренней точки в другую, работа, выполняемая силой, в точности равна нулю. Почему? Да потому, что работа передвижения тела из одной точки в другую равна минус изменению потенциальной энергии (или соответствующий интеграл от поля равен изменению потенциала). Но потенциальная энергия в обеих точках одинакова, значит, ее изменение равно нулю, и поэтому никакой работы при любых движениях внутри сферического слоя не производится. А это возможно лишь тогда, когда внутри слоя нет никаких сил.
В этих рассуждениях кроется ключ к вычислению силы или напряженности поля, когда потенциальная энергия известна.
Пусть потенциальная энергия тела в точке (x, y, z) дана, а мы хотим узнать, какая сила действует на него в этой точке. Для этого нужно знать потенциал не только в этой точке, но и в соседних. Почему? Попробуем вычислить x-компоненту силы (если мы это сумеем сделать, то точно таким же способом мы вычислим и у- и z-компоненты, определив тем самым всю силу). Если б мы сдвинули тело на малое расстояние Δx, то работа, произведенная силой над телом, равнялась бы x-компоненте силы, умноженной на Δx (если Δx достаточно мало), и должна была бы быть равна изменению потенциальной энергии при переходе от одной точки к другой:
(14.9)
Мы просто применили формулу ∫F·ds=-ΔU для очень малых расстояний. Теперь разделим на Δx и обнаружим, что сила равна
(14.10)
Конечно, это не совсем точно. На самом деле нам нужно перейти в (14.10) к пределу при Δx, стремящемся к нулю, потому что (14.10) точно соблюдается только для бесконечно малых Δx. Мы узнаем в правой части (14.10) производную U по х и хотим написать -dU/dx. Но U зависит и от х, и от у, и от z, и для такого случая математики придумали другое обозначение, которое рассчитано на то, чтобы напоминать нам, что надо быть очень осторожным, дифференцируя такую функцию. Этот символ напоминает, что только х считается изменяющимся, а у и z — нет. Вместо d они просто пишут «6 навыворот», или ∂. (По-моему, когда начинаешь изучать дифференциальные исчисления, то вообще лучше работать с ∂, а не с d; d всегда хочется сократить, а вот на ∂ как-то рука не поднимается!) Итак, они пишут ∂U/∂x, а иногда в припадке строгости, желая быть очень бдительными, они ставят за ∂х скобку с маленькими у, z внизу (∂U/∂x)yz, что означает: «Продифференцируй U по х, считая у и z постоянными». Но мы чаще всего не будем отмечать, что осталось постоянным, из контекста это всегда можно понять. Но зато всегда будем писать ∂ вместо d как предупреждение о том, что эта производная берется при постоянных значениях прочих переменных. Ее называют частной производной, т. е. производной, для вычисления которой меняют часть переменных, х.
Итак, мы обнаруживаем, что сила в направлении х равна минус частной производной U по х:
(14.11)
Точно так же и сила в направлении у получается дифференцированием U по у при постоянных х и z, а третья составляющая силы опять-таки есть производная по z при х и у постоянных:
(14.12)
В этом и состоит способ получать силу из потенциальной энергии. Поле получается из потенциала в точности так же:
(14.13)
Заметим, кстати, что существует и другое обозначение (впрочем, пока оно нам не понадобится). Так как С есть вектор с компонентами x, y, z, то символы ∂/∂х, ∂/∂y, ∂/∂z, дающие х-, у-, z-компоненты поля, чем-то напоминают векторы. Математики изобрели знаменитый символ ∇, или grad, называемый «градиентом»; это не величина, а оператор, он делает из скаляра вектор. У него есть три составляющие: x-компонента этого grad есть ∂/∂x, y-компонента — ∂/∂y, а z-компонента — ∂/∂z, и мы можем позабавиться, переписав наши формулы в виде
(14.14)
Глядя на ∇; мы мгновенно узнаем, что наши уравнения векторные; но на самом деле уравнение (14.14) означает в точности то же, что и (14.11) и (14.12); просто это другой способ записи. Не желая писать каждый раз три уравнения, мы пишем одно лишь ∇U.
Еще один пример полей и потенциалов связан с электричеством. В этом случае сила, действующая на неподвижное тело, равна заряду, умноженному на поле: F=qЕ. (В x-составляющую силы входят, вообще говоря, и члены, которые зависят от магнитного поля. Но из уравнения (12.10) легко увидеть, что сила, действующая на частицу со стороны магнитных полей, всегда направлена поперек поля и поперек ее скорости. Благодаря этому свойству магнетизм не производит никакой работы над движущимся зарядом, потому что сила перпендикулярна перемещению. Значит, вычисляя кинетическую энергию в электрическом и магнитном полях, можно пренебречь вкладом магнитного поля, так как оно не изменяет кинетической энергии.) Положим, что имеется только электрическое поле. Тогда мы можем рассчитать энергию или произведенную работу точно таким же способом, как и для тяготения: вычислить величину φ, равную минус интегралу от Е·ds от произвольной фиксированной точки Р до точки, в которой вычисляется потенциал; тогда потенциальная энергия в электрическом поле равна просто произведению заряда на эту величину φ:
В качестве примера рассмотрим две параллельные металлические пластины с поверхностным зарядом ±σ (на единицу площади) каждая. Такая штука называется плоским конденсатором. Мы уж убедились раньше, что снаружи пластин сила равна нулю, а между ними существует постоянное электрическое поле. Оно направлено от плюса к минусу и равно σ/ε0 (фиг. 14.5).
Фиг. 14.5. Поле между параллельными пластинами.
Мы хотим знать, какую работу надо совершить, чтобы перенести заряд от одной пластины к другой. Работа равна интегралу от (Сила.)·(ds). Его можно записать как произведение заряда на значение потенциала на пластине 1 минус та же величина на пластине 2:
Интеграл здесь легко вычислить, так как сила постоянна, и если обозначить толщину конденсатора d, то интеграл равен
Разница в потенциалах Δφ=σd/ε0 называется напряжением и φ измеряют в вольтах. Когда мы говорим, что пара пластин заряжена до определенного напряжения, мы хотим этим сказать, что разность электрических потенциалов двух пластин равна стольким-то вольтам. У конденсатора, сделанного из двух параллельных пластин с поверхностным зарядом ±σ, напряжение (или разность потенциалов этой пары пластин) равно σd/ε0.
ПРИЛОЖЕНИЕ
НЕКОТОРЫЕ ФИЗИЧЕСКИЕ ПОСТОЯННЫЕ
ЭЛЕМЕНТАРНЫЕ ЧАСТИЦЫ, ИХ МАССЫ
И ВРЕМЕНА ЖИЗНИ (ДАННЫЕ 1974. г)
Выпуск 2. Пространство. Время. Движение
Глава 15 СПЕЦИАЛЬНАЯ ТЕОРИЯ ОТНОСИТЕЛЬНОСТИ
§ 1. Принцип относительности
Свыше двухсот лет считалось, что уравнения движения, провозглашенные Ньютоном, правильно описывают природу. Потом в них была обнаружена ошибка. Обнаружена и тут же исправлена. И заметил ошибку, и исправил ее в 1905 г. один и тот же человек — Эйнштейн.
Второй закон Ньютона, выражаемый уравнением
безмолвно предполагал, что m — величина постоянная. Но теперь мы знаем, что это не так, что масса тела возрастает со скоростью. В формуле, исправленной Эйнштейном, m появилась в таком виде:
(15.1)
Здесь «масса покоя» m0— это масса неподвижного тела, а c — скорость света (примерно 3·105 км/сек).
Для кого теория нужна лишь для решения задач, тому этой формулы будет вполне достаточно. Больше ничего от теории относительности ему не понадобится; он просто введет в законы Ньютона поправку на изменяемость массы. Из самой формулы очевидно, что рост массы в обычных условиях незначителен.
Даже если v — скорость спутника (около 8 км/сек), то и при этих условиях v/c=3/105; подстановка этой величины в формулу показывает, что поправка к массе составит не более одной двухмиллиардной части самой массы, что, пожалуй, заметить невозможно. На самом деле, правильность формулы подтверждена наблюдением движения разнообразных частиц, скорость которых практически вплотную подходила к скорости света. В обычных условиях рост массы незаметен; тем замечательней, что он сперва был обнаружен теоретически, а уж после открыт на опыте. Хотя для достаточно больших скоростей рост может быть как угодно велик, открыт он был не таким путем. Закон этот в момент своего открытия означал лишь едва заметное изменение в некоторых цифрах. Тем интереснее разобраться, как сочетание физического размышления и физического эксперимента вызвало его к жизни. Вклад в это дело внесло немалое число людей, но конечным итогом их деятельности явилось открытие Эйнштейна.
У Эйнштейна, собственно говоря, есть две теории относительности. Мы будем здесь говорить только о специальной теории относительности, ведущей свое начало с 1905 г. В 1915 г. Эйнштейн выдвинул еще одну теорию, называемую общей теорией относительности. Она обобщает специальную теорию на случай тяготения; мы не будем ее здесь обсуждать.
Принцип относительности впервые высказал Ньютон в одном из следствий из Законов Движения: «Относительные движения друг по отношению к другу тел, заключенных в каком-либо пространстве, одинаковы, покоится ли это пространство или движется равномерно и прямолинейно без вращения». Это означает, к примеру, что при свободном полете межпланетного корабля с постоянной скоростью все опыты, поставленные на этом корабле, все явления, наблюдаемые на нем, будут таковы, как будто он покоится (конечно, при условии, что наружу из корабля выходить не будут). В этом смысл принципа относительности. Мысль эта — довольно проста; вопрос только в том, верно ли, что во всех опытах, производимых внутри движущейся системы, законы физики выглядят такими же, какими они были бы, если бы система стояла на одном месте. Давайте же сначала посмотрим, так ли выглядят законы Ньютона в движущейся системе. Для этого нам снова понадобится помощь наших молодых людей — Мика и Джо.
Пускай Мик отправился вдоль по оси х с постоянной скоростью u и измеряет свое положение в какой-то точке, показанной на фиг. 15.1.
Фиг. 15.1. Две системы координат, находящиеся в равномерном относительном движении вдоль оси х.
Он обозначает «x-расстояние» точки в своей системе координат как х'. Джо стоит на месте и измеряет положение той же точки, обозначая ее x-координату в своей системе через х. Связь между координатами в двух системах ясна из рисунка. За время t начало системы Мика сдвинулось на ut, и если обе системы вначале совпадали, то
(15.2)
Если подставить эти преобразования координат в законы Ньютона, то законы эти превращаются в такие же законы, но в штрихованной системе; это значит, что законы Ньютона имеют одинаковый вид в движущейся и в неподвижной системах; потому-то, проделав любые опыты по механике, и нельзя сказать, движется система или нет.
Принцип относительности применялся в механике уже издавна. Многие, в частности Гюйгенс, пользовались им для вывода законов столкновения биллиардных шаров почти так же, как мы в гл. 10 доказывали сохранение импульса.
В прошлом столетии в результате исследования явлений электричества, магнетизма и света интерес к принципу относительности возрос. Максвелл подытожил в своих уравнениях электромагнитного поля многие тщательные исследования этих явлений. Его уравнения сводят воедино электричество, магнетизм, свет. Однако уравнения Максвелла, по-видимому, не подчиняются принципу относительности: если преобразовать их подстановкой (15.2), то их вид не останется прежним. Значит, в движущемся межпланетном корабле оптические и электрические явления не такие, как в неподвижном; их можно использовать для определения его скорости, в частности определить и абсолютную скорость корабля, сделав подходящие электрические или оптические измерения. Одно из следствий уравнений Максвелла заключается в том, что если возмущение поля порождает свет, то эти электромагнитные волны распространяются во все стороны одинаково и с одинаковой скоростью с=300 000 км/сек. Другое следствие уравнений: если источник возмущения движется, то испускаемый свет все равно мчится сквозь пространство со скоростью с. Так же бывает и со звуком: скорость звуковых волн тоже не зависит от движения источника.
Эта независимость от движения источника света ставит интересный вопрос. Положим, что мы едем в автомашине со скоростью и, а свет от задних фар распространяется со скоростью с. Дифференцируя первую строчку в (15.2), получаем
Это означает, что, в согласии с преобразованиями Галилея, видимая скорость света по измерениям, проведенным из автомашины, будет не с, а с — u. Например, скорость автомашины 100 000 км/сек, а скорость света 300 000 км/сек, тогда свет от фар будет удаляться с быстротой 200 000 км/сек. Во всяком случае, измерив скорость света, испускаемого фарами (если только справедливы преобразования Галилея для света), можно узнать скорость автомашины. На этой идее основывалось множество опытов по определению скорости Земли, но ни один из них не удался: никакой скорости обнаружено не было. Вы скоро познакомитесь очень подробно с одним из таких опытов. Вы разберетесь, что в нем случилось и в чем было дело. Что-то неладное творилось в ту пору с уравнениями физики. Но что именно?
§ 2. Преобразование Лоренца
Когда стало ясно, что с уравнениями физики не все ладится, первым долгом подозрение пало на уравнения электродинамики Максвелла. Они только-только были написаны, им было всего 20 лет от роду; казалось почти естественным, что они неверны. Их принялись переписывать, видоизменять и подгонять к тому, чтобы оказался выполненным принцип относительности в галилеевой форме (15.2). При этом в уравнениях электродинамики появились новые члены; они предсказывали новые электрические явления, но эксперимент никаких таких явлений не обнаружил, и пришлось отказаться от попыток изменить уравнения Максвелла. Постепенно всем становилось ясно, что максвелловы законы электродинамики абсолютно правильны, а загвоздка в чем-то другом.
Между тем Лоренц заметил одно замечательно любопытное явление: когда он делал в уравнениях Максвелла подстановку
(15.3)
то форма уравнений после подстановки не менялась! Уравнения (15.3) теперь называют преобразованием Лоренца. А Эйнштейн, следуя мысли, впервые высказанной Пуанкаре, предположил, что все физические законы не должны меняться от преобразований Лоренца. Иными словами, надо менять не законы электродинамики, а законы механики. Но как же изменять законы Ньютона, чтобы они при преобразованиях Лоренца не менялись? Когда такая цель поставлена, то остается только переписать уравнения Ньютона так, чтобы выполнялись поставленные условия. Как оказалось, единственное, что нужно от них потребовать,— это, чтоб масса m в уравнениях Ньютона приобрела вид (15.1). Стоит внести это изменение, и наступает полная гармония между уравнениями Ньютона и Максвелла. Если вы теперь, желая согласовать измерения, проведенные Миком и Джо, используете преобразования Лоренца, то вы ни за что не узнаете, кто из них движется, ибо форма всех уравнений в обеих системах координат будет одной и той же!
Интересно понять, что означает эта замена старых преобразований координат и времени на новые. Старые (галилеевы) кажутся очевидными, новые (лоренцевы) выглядят необычно. Как же это может быть, с логической и с экспериментальной точек зрения, что справедливы не старые преобразования, а новые? Чтобы разобраться в этом, мало изучить законы механики, надо (как это и сделал Эйнштейн) проанализировать и наши представления о пространстве и времени, иначе этих преобразований не поймешь. В течение некоторого времени мы будем изучать эти представления и следствия из них. Покамест же стоит отметить, что такой анализ оказывается вполне оправданным — его результаты согласуются с данными опыта.
§ 3. Опыт Майкельсона— Морли
Мы уже говорили, что в свое время были сделаны попытки определить абсолютную скорость движения Земли сквозь воображаемый «эфир», который, как думали тогда, пропитывает собой все пространство. Самый известный из таких опытов проделали в 1887 г. Майкельсон и Морли. Но только через 18 лет отрицательные результаты их опыта объяснил Эйнштейн.
Для опыта Майкельсона — Морли использовался прибор, схема которого показана на фиг. 15.2.
Фиг. 15.2. Схема опыта Майкельсона — Морли.
Главные части прибора: источник света А, посеребренная полупрозрачная стеклянная пластинка В, два зеркала С и Е. Все это жестко укрепляется на тяжелой плите. Зеркала С и Е размещены были на одинаковом расстоянии L от пластинки В. Пластинка В расщепляет падающий пучок света на два, перпендикулярных один к другому; они направляются на зеркала и отражаются обратно на пластинку В. Пройдя снова сквозь пластинку В, оба пучка накладываются друг на друга (D и F). Если время прохождения света от В до Е и обратно равно времени прохождения от В до С и обратно, то возникающие пучки D и F окажутся в фазе и усилятся взаимно; если же эти времена хоть немного отличаются, то в пучках возникает сдвиг по фазе и, как следствие,— интерференция. Если прибор в эфире «покоится», то времена в точности равны, а если он движется направо со скоростью и, то появится разница во времени. Давайте посмотрим, почему.
Сначала подсчитаем время прохождения света от В к Е и обратно. Пусть время «туда» равно t1, а время «обратно» равно t2. Но пока свет движется от В до зеркала, сам прибор уйдет на расстояние ut1, так что свету придется пройти путь L+ut1 со скоростью с. Этот путь можно поэтому обозначить и как ct1; следовательно,
(этот результат становится очевидным, если учесть, что скорость света по отношению к прибору есть с — и; тогда как раз время равно длине L, деленной на с — u). Точно так же можно рассчитать и t2. За это время пластинка В приблизится на расстояние ut2, так что свету на обратном пути придется пройти только L-ut2. Тогда
Общее же время равно
удобнее это записать в виде
(15.4)
А теперь подсчитаем, сколько времени t3 свет будет идти от пластинки В до зеркала С. Как и прежде, за время t3 зеркало С сдвинется направо на расстояние ut3 (до положения С'), а свет пройдет по гипотенузе ВС' расстояние ct3. Из прямоугольного треугольника следует
или
откуда
При обратной прогулке от точки С' свету приходится пройти то же расстояние; это видно из симметрии рисунка. Значит, и время возвращения то же (t3), а общее время равно 2t3. Мы запишем его в виде
(15.5)
Теперь мы можем сравнить оба времени. Числители в (15.4) и (15.5) одинаковы — это время распространения света в покоящемся приборе. В знаменателях член u2/с2 мал, если только и много меньше c. Знаменатели эти показывают, насколько изменяется время из-за движения прибора. Заметьте, что эти изменения неодинаковы — время прохождения света до С и обратно чуть меньше времени прохождения до Е и обратно. Они не совпадают, даже если расстояния от зеркал до В одинаковы. Остается только точно измерить эту разницу.
Здесь возникает одна техническая тонкость: а что если длины L не точно равны между собой? Ведь точного равенства все равно никогда не добьешься. В этом случае надо просто повернуть прибор на 90°, расположив ВС по движению, а BE — поперек. Различие в длинах тогда перестает играть роль, и остается только наблюдать за сдвигом интерференционных полос при повороте прибора.
Во время опыта Майкельсон и Морли расположили прибор так, что отрезок BE оказался параллельным движению Земли по орбите (в определенный час дня и ночи). Орбитальная скорость равна примерно 30 км/сек, и «снос эфира» в определенные часы дня или ночи и в определенное время года должен достигать этой величины. Прибор был достаточно чувствителен, чтобы заметить такое явление. Но никакого различия во временах обнаружено не было — скорость движения Земли сквозь эфир оказалось невозможно обнаружить. Результат опыта был нулевой.
Это было загадочно. Это настораживало. Первую плодотворную идею, как выйти из тупика, выдвинул Лоренц. Он допустил, что все материальные тела при движении сжимаются, но только в направлении движения. Таким образом, если длина покоящегося тела есть L0, то длина тела, движущегося со скоростью u (назовем ее L║, где значок ║ показывает, что движение происходит вдоль длины тела), дается формулой
(15.6)
Если эту формулу применить к интерферометру Майкельсона — Морли, то расстояние от В до С останется прежним, а расстояние от В до E укоротится до L√(1-u2/с2). Таким образом, уравнение (15.5) не изменится, но L в уравнении (15.4) изменится в соответствии с (15.6). В результате мы получим
(15.7)
Сравнивая это с (15.5), мы видим, что теперь t1+t2=2t3. Стало быть, если прибор действительно сокращается так, как мы предположили, то становится понятным, почему опыт Майкельсона — Морли никакого эффекта не дал.
Хотя гипотеза сокращения успешно объясняла отрицательный итог опыта, она сама оказалась беззащитной перед обвинением, что ее единственная цель — избавиться от трудностей в объяснении опыта. Она была чересчур искусственной. Однако сходные трудности возникали и в других опытах по обнаружению эфирного ветра. В конце концов стало казаться, что природа вступила в «заговор» против человека, что она прибегла к конспирации и то и дело вводит какие-то новые явления, чтобы свести к нулю каждое явление, с помощью которого человек пытается измерить u.
И наконец, было признано (на это указал Пуанкаре), что полная конспирация — это и есть закон природы! Пуанкаре предположил, что в природе есть закон, заключающийся в том, что нельзя обнаружить эфирный ветер никаким способом, т. е. абсолютную скорость обнаружить невозможно.
§ 4. Преобразование времени
При проверке, согласуется ли идея о сокращении расстояний с фактами, обнаруженными в других опытах, оказывается, что все действительно согласуется, если только считать, что время тоже преобразуется и притом так, как это высказано в уравнении (15.3). По этой-то причине время t3, которое затратит свет на путешествие от В к С и обратно, оказывается неодинаковым, если его вычисляет человек, делающий этот опыт в движущемся межпланетном корабле, или же неподвижный наблюдатель, который следит со стороны за этим кораблем. Для первого время t3 равно просто 2L/c, а для второго оно равно 2L/c√(1-u2/с2) [уравнение (15.5)]. Иными словами, если вы со стороны наблюдаете, как космонавт закуривает папиросу, вам кажется, что он делает это медленнее, нежели обычно, хотя сам он считает, что все происходит в нормальном темпе. Стало быть, не только длины должны сокращаться, но и приборы для измерения времени («часы») должны замедлить свой ход. Иначе говоря, когда часы на космическом корабле отсчитывают, по мнению космонавта, 1 сек, то, по мнению стороннего наблюдателя, пройдет 1/√(1-u2/с2) сек.
Замедление хода часов в движущейся системе — явление весьма своеобразное, и его стоит пояснить. Чтобы понять его, давайте проследим, что бывает с часовым механизмом, когда часы движутся. Так как это довольно сложно, то лучше часы выбрать попроще. Пусть это будет стержень (метровой длины) с зеркалами на обоих концах. Если пустить световой сигнал между зеркалами, то он будет без конца бегать туда-сюда, а часы будут тикать каждый раз, как только свет достигнет нижнего конца. Конструкция довольно глупая, но в принципе такие часы возможны. И вот мы изготовим двое таких часов со стержнями равной длины и синхронизуем их ход, пустив их одновременно; ясно, что они всегда будут идти одинаково: ведь длина стержней одна и та же, а скорость света с — тоже. Дадим одни часы космонавту; пусть он возьмет их с собой на межпланетный корабль и поставит их поперек направления движения, тогда длина стержня не изменится. Да, но откуда мы знаем, что поперечная длина не меняется? Наблюдатель может договориться с космонавтом, что на высоте у в тот момент, когда стержни поравняются, каждый сделает другому на его стержне метку. Из симметрии следует, что отметки придутся на те же самые координаты у и y', в противном случае одна метка окажется ниже или выше другой и, сравнив их, можно будет сказать, кто из них двигался на самом деле.
Так что же происходит в движущихся часах? Входя на борт корабля, космонавт убедился, что это вполне приличные стандартные часы и ничего особенного в их поведении на корабле он не заметил. Если бы он что-то заметил, то сразу понял бы, что он движется; если хоть что-то меняется в результате движения, то ясно, что он движется. Принцип же относительности утверждает, что в равномерно движущейся системе это невозможно; стало быть, в часах никаких изменений не произошло. С другой стороны, когда внешний наблюдатель взглянет на пролетающие мимо часы, он увидит, что свет, перебегая от зеркала к зеркалу, на самом деле движется зигзагами, потому что стержень все время перемещается боком. Мы уже анализировали такое зигзагообразное движение в связи с опытом Майкельсона — Морли. Когда за заданное время стержень сдвинется на расстояние, пропорциональное u (фиг. 15.3), то расстояние, пройденное за то же время светом, будет пропорционально с, и поэтому расстояние по вертикали пропорционально √(с2-u2).
Фиг. 15.3. Опыт со «световыми часами». а, — «световые часы» покоятся в системе S '; б—те же часы движутся через систему S; в — диагональ, по которой движется пучок света в движущихся «световых часах».
Значит, свету понадобится больше времени, чтобы пройти движущийся стержень из конца в конец,— больше, чем когда стержень неподвижен. Поэтому кажущийся промежуток времени между тиканьями движущихся часов удлинится в той же пропорции, во сколько гипотенуза треугольника длиннее катета (из-за этого в формуле и появляется корень). Из рисунка также видно, что чем и больше, тем сильнее видимое замедление хода часов. И не только такие часы начнут отставать, но (если только теория относительности правильна!) любые часы, основанные на любом принципе, также должны отстать, причем в том же отношении. За это можно поручиться, не проделывая дальнейшего анализа. Почему?
Чтобы ответить и на этот вопрос, положим, что у нас есть еще двое часов, целиком сходных между собой, скажем, с зубчатками и камнями, или основанных на радиоактивном распаде, или еще каких-нибудь. Опять согласуем их ход с нашими первыми часами. Пусть, пока свет прогуляется до конца и обратно, известив о своем прибытии тиканьем, за это время новая модель завершит свой цикл и тоже возвестит об этом какой-нибудь вспышкой, звонком или любым иным сигналом. Захватим с собой на космический корабль новую модель часов. Может быть, эти часы уже не отстанут, а будут идти так же, как их неподвижный двойник. Ах, нет! Если они разойдутся с первой моделью (которая тоже находится на корабле), то человек сможет использовать этот разнобой между показаниями обоих часов, чтобы определить скорость корабля. А ведь считается, что скорость узнать немыслимо. Смотрите, как ловко! Нам не нужно ничего знать о механизме работы новых часов, не нужно знать, что именно в них замедляется, мы просто знаем, что, какова бы ни была причина, ход часов будет выглядеть замедленным, и притом в любых часах одинаково.
Что же выходит? Если все движущиеся часы замедляют свой ход, если любой способ измерения времени приводит к замедленному темпу течения времени, нам остается только сказать, что само время, в определенном смысле, кажется на движущемся корабле замедленным. На корабле все: и пульс космонавта, и быстрота его соображения, и время, потребное для зажигания папиросы, и период возмужания и постарения — все это должно замедлиться в одинаковой степени, ибо иначе можно будет узнать, что корабль движется. Биологи и медики иногда говорят, что у них нет уверенности в том, что раковая опухоль будет в космическом корабле развиваться дольше. Однако с точки зрения современного физика это случится почти наверняка; в противном случае можно было бы по быстроте развития опухоли судить о скорости корабля!
Очень интересным примером замедления времени при движении снабжают нас мю-мезоны (мюоны) — частицы, которые в среднем через 2,2·10-6 сек самопроизвольно распадаются. Они приходят на Землю с космическими лучами, но могут быть созданы и искусственно в лаборатории. Часть космических мюонов распадается еще на большой высоте, а остальные — только после того, как остановятся в веществе. Ясно, что при таком кратком времени жизни мюон не может пройти больше 600 м, даже если он будет двигаться со скоростью света. Но хотя мюоны возникают на верхних границах атмосферы, примерно на высоте 10 км и выше, их все-таки обнаруживают в земных лабораториях среди космических лучей. Как это может быть? Ответ состоит в том, что разные мюоны летят с различными скоростями, иногда довольно близкими к скорости света. С их собственной точки зрения они живут всего лишь около 2 мксек, с нашей же — их жизненный путь несравненно более долог, достаточно долог, чтобы достигнуть поверхности Земли. Их жизнь удлиняется в 1/√(1-u2/c2) раз. Среднее время жизни мюонов разных скоростей было точно измерено, причем полученное значение хорошо согласуется с формулой.
Мы не знаем, почему мезон распадается и каков его внутренний механизм, но зато мы знаем, что его поведение удовлетворяет принципу относительности. Тем и полезен этот принцип — он позволяет делать предсказания даже о тех вещах, о которых другим путем мы мало чего узнаем. К примеру, еще не имея никакого представления о причинах распада мезона, мы все же можем предсказать, что если его скорость составит 9/10 скорости света, то кажущаяся продолжительность отведенного ему срока жизни будет равна 2,2·10-6/√(1-92/102) сек. И это предсказание оправдывается. Правда, неплохо?
§ 5. Лоренцево сокращение
Теперь мы вернемся к преобразованию Лоренца (15.3) и попытаемся лучше понять связь между системами координат (x, y, z, t) и (х', у', z', t'). Будем называть их системами S и S', или соответственно системами Джо и Мика. Мы уже отметили, что первое уравнение основывается на предположении Лоренца о том, что по направлению х все тела сжимаются. Как же можно доказать, что такое сокращение действительно бывает? Мы уже понимаем, что в опыте Майкельсона — Морли по принципу относительности поперечное плечо ВС не может сократиться; в то же время нулевой результат опыта требует, чтобы времена были равны. Чтобы получился такой результат, приходится допустить, что продольное плечо BE кажется сжатым в отношении √(1-u2/с2). Что означает это сокращение на языке Джо и Мика? Положим, что Мик, двигаясь с системой S' в направлении х', измеряет метровой линейкой координату х' в некоторой точке. Он прикладывает линейку х' раз и думает, что расстояние равно х' метрам. С точки же зрения Джо, (в системе S) линейка у Мика в руках укорочена, а «на самом деле» отмеренное им расстояние равно x'√(1-u2/с2) метров. Поэтому если система S' удалилась от системы S на расстояние ut, то наблюдатель в системе S должен сказать, что эта точка (в его координатах) удалена от начала на x=x'√(1-u2/c2)+ut, или
Это и есть первое уравнение из преобразований Лоренца.
§ 6. Одновременность
Подобным же образом из-за различия в масштабах времени появляется и знаменатель в уравнении (15.Зг) в преобразованиях Лоренца. Самое интересное в этом уравнении — это новый и неожиданный член в числителе, член ux/с2. В чем его смысл? Внимательно вдумавшись в положение вещей, можно понять, что события, происходящие, по мнению Мика (наблюдателя в системе S'), в разных местах одновременно, с точки зрения Джо (в системе S), вовсе не одновременны. Когда одно событие случилось в точке x1 в момент t0, а другое — в точке х2 в тот же момент t0, то соответствующие моменты t'1 и t'2 отличаются на
Это явление можно назвать «нарушением одновременности удаленных событий». Чтобы пояснить его, рассмотрим следующий опыт.
Пусть человек, движущийся в космическом корабле (система S'), установил в двух концах корабля часы. Он хочет знать, одинаково ли они идут. Как синхронизовать ход часов? Это можно сделать по-разному. Вот один из способов, он почти не требует вычислений. Расположимся как раз где-то посредине между часами. Из этой точки пошлем в обе стороны световые сигналы. Они будут двигаться в обоих направлениях с одинаковой скоростью и достигнут обоих часов в одно и то же время. Вот этот-то одновременный приход сигналов и можно применить для согласования хода. Положим, что человек в S' таким способом согласует ход часов. Посмотрим, согласится ли наблюдатель в системе S, что эти часы идут одинаково. Космонавт в системе S' имеет право верить, что их ход одинаков; ведь он не знает, что он движется. Но наблюдатель в системе S сразу рассудит, что раз корабль движется, то часы на носу корабля удалились от светового сигнала и свету пришлось пройти больше половины длины корабля, прежде чем он достиг часов; часы на корме, наоборот, двигались к световому сигналу — значит, его путь сократился. Поэтому сигнал сперва дошел до часов на корме, хотя космонавту в системе S' показалось, что сигналы достигли обоих часов одновременно. Итак, выходит, что когда космонавт считает, что события в двух местах корабля произошли одновременно (при одном и том же значении t' в его системе координат), то в другой системе координат одинаковым t' отвечают разные значения t!
§ 7. Четырехвекторы
Что еще можно обнаружить в преобразованиях Лоренца? Любопытно, что в них преобразование х и t по форме похоже на преобразование х и у, изученное нами в гл. 11, когда мы говорили о вращении координат. Тогда мы получили
(15.8)
т. е. новое х' перемешивает старые х и y, а у' тоже их перемешивает. Подобным же образом в преобразовании Лоренца новое х' есть смесь старых х и t, а новое t' — смесь t и х. Значит, преобразование Лоренца похоже на вращение, но «вращение» в пространстве и времени. Это весьма странное понятие. Проверить аналогию с вращением можно, вычислив величину
В этом уравнении три первых члена в каждой стороне представляют собой в трехмерной геометрии квадрат расстояния между точкой и началом координат (сферу). Он не меняется (остается инвариантным), несмотря на вращение осей координат. Аналогично, уравнение (15.9) свидетельствует о том, что существует определенная комбинация координат и времени, которая остается инвариантной при преобразовании Лоренца. Значит, имеется полная аналогия с вращением; аналогия эта такого рода, что векторы, т. е. величины, составленные из «компонент», преобразуемых так же, как и координаты, оказываются полезными и в теории относительности.
Итак, мы расширим понятие вектора. Пока он у нас мог иметь только пространственные компоненты. Теперь включим в это понятие и временную компоненту, т. е. мы ожидаем, что существуют векторы с четырьмя компонентами: три из них похожи на компоненты обычного вектора, а к ним привязана четвертая — аналог времени.
В следующих главах мы проанализируем это понятие. Мы увидим, что если идеи этого параграфа приложить к импульсу, то преобразование даст три пространственные составляющие, подобные обычным компонентам импульса, и четвертую компоненту — временную часть (которая есть не что иное, как энергия).
§ 8. Релятивистская динамика
Теперь мы готовы к тому, чтобы с более общей точки зрения исследовать, как преобразования Лоренца изменяют законы механики. [До сих пор мы только объясняли, как изменяются длины и времена, но не объяснили, как получить измененную формулу для m, уравнение (15.1). Это будет сделано в следующей главе.] Изучение следствий формулы Эйнштейна для массы m в механике Ньютона мы начнем с закона силы. Сила есть быстрота изменения импульса, т. е.
Импульс по-прежнему равен mv, но теперь
(15.10)
Это законы Ньютона в записи Эйнштейна. При этом видоизменении, если действие и противодействие по-прежнему равны (может, не в каждый момент, но по крайней мере после усреднения по времени), то, как и раньше, импульс должен сохраняться, но сохраняющейся величиной является не старое mv при постоянном m, а выражение (15.10) с переменной массой. С таким изменением в формуле для импульса сохранение импульса по-прежнему будет существовать.
Посмотрим теперь, как импульс зависит от скорости. В ньютоновой механике он ей пропорционален. В релятивистской механике в большом интервале скоростей (много меньших с) они также примерно пропорциональны [см. (15.10)], потому что корень мало отличается от единицы. Но когда v почти равно с, то корень почти равен нулю и импульс поэтому беспредельно растет.
Что бывает, когда на тело долгое время воздействует постоянная сила? В механике Ньютона скорость тела беспрерывно будет возрастать и может превысить даже скорость света. В релятивистской же механике это невозможно. В теории относительности беспрерывно растет не скорость тела, а его импульс, и рост этот сказывается не на скорости, а на массе тела. Со временем ускорение, т. е. изменения в скорости, практически исчезает, но импульс продолжает расти. Поскольку сила приводит к очень малым изменениям в скорости тела, мы, естественно, считаем, что у тела громадная инерция. Но как раз это самое и утверждает релятивистская формула (15.10) для массы тела; она говорит, что инерция крайне велика, когда v почти равно с. Разберем пример. Чтобы отклонить быстрые электроны в синхротроне Калифорнийского Технологического института, необходимо магнитное поле, в 2000 раз более сильное, чем следует из законов Ньютона. Иными словами, масса электронов в синхротроне в 2000 раз больше их нормальной массы, достигая массы протона! Если m в 2000 раз больше m0, то 1-v2/с2 равно 1/4 000 000, или v отличается от с на 1/8 000 000, т.е. скорость электронов вплотную подходит к скорости света. Если электроны и свет одновременно отправятся в соседнюю лабораторию (находящуюся, скажем, в 200 м), то кто явится первым? Ясное дело, свет: он всегда движется быстрее[14]. Но насколько быстрее? Трудно сказать, насколько раньше во времени, но зато можно сказать, на какое расстояние отстанут электроны: на 1/30 мм, т. е. на 1/3 толщины этого листка бумаги! Масса электронов в этих состязаниях чудовищна, а скорость не выше скорости света.
На чем еще скажется релятивистский рост массы? Рассмотрим движение молекул газа в баллоне. Если газ нагреть, скорость молекул возрастет, а вместе с нею и их масса. Газ станет тяжелее. Насколько?
Разлагая m0/√(1-v2/c2)=m0(1-v2/с2)-1/2 в ряд по формуле бинома Ньютона, можно найти приближенно рост массы при малых скоростях. Получается
Из формулы ясно, что при малых v ряд быстро сходится и первых двух-трех членов здесь вполне достаточно. Значит, можно написать
(15.11)
где второй член и выражает рост массы за счет повышения скорости. Когда растет температура, v2 растет в равной мере, значит, увеличение массы пропорционально повышению температуры. Но 1/2m0v2 — это кинетическая энергия в старомодном, ньютоновом смысле этого слова. Значит, можно сказать, что прирост массы газа равен приросту кинетической энергии, деленной на с2, т. е. Δm=Δ(к.э.)/с2.
§ 9. Связь массы и энергии
Это наблюдение навело Эйнштейна на мысль, что массу тела можно выразить проще, чем по формуле (15.1), если сказать, что масса равна полному содержанию энергии в теле, деленному на с2. Если (15.11) помножить на с2, получается
(15.12)
Здесь левая часть дает полную энергию тела, а в последнем члене справа мы узнаем обычную кинетическую энергию. Эйнштейн осмыслил первый член справа (очень большое постоянное число m0с2) как часть полной энергии тела, а именно как его внутреннюю энергию, или «энергию покоя».
К каким следствиям мы придем, если вслед за Эйнштейном предположим, что энергия тела всегда равна mс2? Тогда мы сможем вывести формулу (15.1) зависимости массы от скорости, ту самую, которую до сих пор мы принимали на веру. Пусть тело сперва покоится, обладая энергией m0с2. Затем мы прикладываем к телу силу, которая сдвигает его с места и поставляет ему кинетическую энергию; раз энергия примется возрастать, то начнет расти и масса (это все заложено в первоначальном предположении). Пока сила действует, энергия и масса продолжают расти. Мы уже видели (см. гл. 13), что быстрота роста энергии со временем равна произведению силы на скорость
(15.13)
Кроме того, F=d(mv)/dt [см. гл. 9, уравнение (9.1)]. Связав все это с определением Е и подставив в (15.13), получим
(15.14)
Мы хотим решить это уравнение относительно m. Для этого помножим обе части на 2m. Уравнение обратится в
(15.15)
Теперь нам нужно избавиться от производных, т. е. проинтегрировать обе части равенства. В величине (2m) dm/dt можно узнать производную по времени от m2, а в (2mv)·d(mv)/dt— производную по времени от (mv)2. Значит, (15.15) совпадает с
(15.16)
Когда производные двух величин равны, то сами величины могут отличаться не больше чем на константу С. Это позволяет написать
(15.17)
Определим теперь константу С явно. Так как уравнение (15.17) должно выполняться при любых скоростях, то можно взять v=0 и обозначить в этом случае массу через m0. Подстановка этих чисел в (15.17) дает
Это значение С теперь можно подставить в уравнение (15.17). Оно принимает вид
(15.18)
Разделим на с2 и перенесем члены с m в левую часть
откуда
(15.19)
А это и есть формула (15.1), т. е. как раз то, что необходимо, чтобы в уравнении (15.12) было соответствие между массой и энергией.
В обычных условиях изменения в энергии приводят к очень малым изменениям в массе: почти никогда не удается из данного количества вещества извлечь много энергии; но в атомной бомбе с энергией взрыва, эквивалентной 20 000 тонн тринитротолуола, весь пепел, осевший после взрыва, на 1 г легче первоначального количества расщепляющегося материала. Это потому, что выделилась энергия, которая имела массу 1 г, в согласии с формулой ΔE=Δ(mc2). Вывод об эквивалентности массы и энергии прекрасно подтвердился в опытах по аннигиляции материи — превращению вещества в энергию. Электрон с позитроном могут взаимодействовать в покое, имея каждый массу покоя m0. При сближении они исчезают, а вместо них излучаются два γ-луча, каждый опять с энергией m0с2. Этот опыт прямо сообщает нам о величине энергии, связанной с существованием массы покоя у частицы.
Глава 16 РЕЛЯТИВИСТСКАЯ ЭНЕРГИЯ И РЕЛЯТИВИСТСКИЙ ИМПУЛЬС
§ 1. Относительность и «философы»
В этой главе мы продолжим обсуждение принципа относительности Эйнштейна — Пуанкаре, его влияния на наши физические воззрения и на весь характер человеческого мышления.
Пуанкаре следующим образом сформулировал принцип относительности: «Согласно принципу относительности, законы физических явлений обязаны быть одинаковыми для неподвижного наблюдателя и для наблюдателя, который относительно него переносится равномерным движением, так что у нас нет и не может быть никаких способов отличить, уносит ли нас такое движение или не уносит».
Когда эта мысль обрушилась на человечество, среди философов началась суматоха. Особенно среди «философов за чашкой чая», которые говорят: «О, это очень просто: теория Эйнштейна утверждает, что все относительно!» Поразительное множество таких «философов»— и не только рассуждающих за чашкой чая (впрочем, не желая их обижать, я буду говорить только о «философах за чашкой чая»)—твердят: «Из открытий Эйнштейна следует, что все относительно; это оказало глубокое влияние на нашу мысль». И еще потом добавляют: «В физике было доказано, что явления зависят от системы отсчета». Можно услышать немало подобных вещей, но трудно понять их смысл. По-видимому, системы отсчета, о которых идет речь, — это те системы координат, которыми мы пользовались в анализе теории относительности. Итак, тот факт, что «все зависит от системы отсчета», оказывает могучее влияние на современную мысль. Остается только удивляться, почему? Ведь прежде всего сама идея: «все зависит от точки зрения» — настолько проста, что, несомненно, не было нужды обременять себя анализом трудностей физической теории относительности, чтобы открыть ее. Всякий, кто идет по тротуару, знает, что все, что он видит, зависит от его системы отсчета. Сперва он видит лица прохожих, а уж потом — их затылки. И почти во всех философских заключениях, о которых говорят, что они проистекли из теории относительности, нет ничего более глубокого, чем утверждения типа: «Пешеход выглядит спереди иначе, нежели сзади». Известный рассказ о нескольких слепых, споривших, на что похож слон, тоже весьма напоминает теорию относительности с точки зрения таких философов.
Но в теории относительности, пожалуй, есть кое-что и поглубже, чем наблюдение, что человек спереди выглядит иначе, чем сзади. Принцип относительности куда глубже этого, ведь с его помощью мы можем делать определенные предсказания. Но было бы более чем странно, если бы только это наблюдение позволило нам предсказывать поведение природы.
Есть и другая школа «философов». Эти чувствуют себя очень неуютно из-за теории относительности, которая заявляет, что нельзя определить свою абсолютную скорость, не глядя ни на что снаружи корабля. Они восклицают: «Вполне понятно, что никто не может измерить своей скорости, не выглядывая наружу. Само собой очевидно, что бессмысленно говорить о чьей-то скорости, если не глядеть по сторонам. Глупцы были те физики, которые думали иначе. Их вдруг осенило, вот они и рады; но если бы мы, философы, представляли, какие проблемы стояли перед физиками, мы их давно решили бы чисто мозговым усилием и сразу же поняли бы, что невозможно определить скорость, не выглянув наружу. И мы сделали бы громадный вклад в эту их физику». Эти философы всегда топчутся около нас, они мельтешат на обочинах науки, то и дело порываясь сообщить нам что-то. Но никогда на самом деле они не понимали всей тонкости и глубины наших проблем.
Наша неспособность засечь абсолютное движение — это результат опытов, а не итог плоского философствования. Это легко пояснить. Начать с того, что еще Ньютон считал, что действительно невозможно узнать свою скорость, если движешься прямолинейно и равномерно. Ведь первым-то провозгласил принцип относительности именно Ньютон (мы цитировали его слова в предыдущей главе). Почему же в те, ньютоновы времена философы не поднимали такого шума о том, что «все относительно» и так далее и тому подобное? А потому, что пока Максвелл не развил свою электродинамику, существовали физические законы, позволявшие утверждать, что можно измерить свою скорость, даже и не выглянув наружу; но вскоре после Максвелла экспериментально было установлено, что это невозможно.
А теперь скажите, действительно ли так уж абсолютно и определенно необходимо с философской точки зрения, чтобы невозможно было знать свою скорость, не посмотрев по сторонам? Одним из следствий теории относительности явилось развитие философии, которая утверждала: «Определять можно только то, что поддается измерению! Так как ясно, что нельзя измерить скорость, не видя, по отношению к чему она измеряется, то естественно, что понятие абсолютной скорости смысла не имеет. Физики обязаны понять, что можно говорить только о том, что поддается измерению». Но в этом-то и весь вопрос: сказать, можем ли мы определить абсолютную скорость,— это все равно, что решить, можно или нельзя выяснить из эксперимента, движется ли корабль, не выглядывая в иллюминатор. Иными словами, нельзя априори утверждать, что что-то измеримо, а что-то нет; это решает не рассуждение, а эксперимент. Немного найдется философов, которые хладнокровно объявят очевидным, что если скорость света внутри автомобиля равна 300 000 км/сек, а скорость самого автомобиля достигает 100 000 км/сек, то свет проносится мимо наблюдателя на дороге тоже со скоростью 300 000 км/сек. Для них это потрясающий факт; даже те из них, для кого относительность разумеется сама собой, обнаруживают, когда вы предъявляете им конкретный факт, что это совсем не так уж очевидно.
И наконец, есть даже «философы», утверждающие, что вообще мы не в состоянии обнаруживать никакого движения, не выглядывая наружу. А уж это просто неверно. Действительно, нельзя заметить равномерного движения по прямой линии, но если бы вся комната вертелась, мы бы определенно об этом знали, потому что все в ней разлеталось бы к стенкам — наблюдались бы всяческого рода «центробежные» эффекты. Тот факт, что Земля наша вращается вокруг своей оси, можно обнаружить, не глядя на звезды, скажем, с помощью так называемого маятника Фуко. Стало быть, неверно, что «все относительно»; нельзя обнаружить только равномерное движение, не выглядывая наружу. Равномерное вращение вокруг фиксированной оси обнаружить можно. А когда вы это скажете философу, он очень огорчится, что прежде этого не понимал; ему, видите ли, казалось, что просто невозможно установить вращение вокруг оси, не наблюдая внешний мир. Правда, если он достаточно сообразителен, то через некоторое время он может вернуться и заявить: «Понял! На самом деле никакого абсолютного вращения не существует. Видите ли,— скажет он,— на самом деле мы вращаемся относительно звезд. И вследствие какого-то невыясненного влияния, оказываемого на тела звездами, возникает центробежная сила».
Ну что ж! Судя по всему, это верно; в настоящее время у нас нет способа узнать, существовала бы центробежная сила, если бы не было звезд и туманностей. Не в наших силах сделать такой эксперимент — убрать все туманности, а затем измерить наше вращение; значит, тут мы ничего сказать не можем. Мы должны допустить, что философ может оказаться прав. Он тогда расцветает от удовольствия и изрекает: «И вообще совершенно необходимо, чтобы все в мире в конечном счете подчинялось тому же принципу: абсолютное вращение — это бессмысленно, можно говорить только о вращении по отношению к туманностям». И тут-то мы ему ответим: «А тогда скажи, друг мой, само собой или не само собой разумеется, что равномерное движение по прямой линии относительно туманностей не должно никак чувствоваться внутри автомобиля?» И теперь, когда движение уже больше не абсолютное, когда оно стало движением относительно туманностей, вопрос оказывается темным и на него можно ответить, лишь поставив эксперимент.
Но в чем же в таком случае выразились философские влияния теории относительности? Какие новые идеи и предложения внушил физикам принцип относительности? Если ограничиться только этого рода влияниями, то их можно описать следующим образом. Первое открытие, по существу, состояло в том, что даже те идеи, которые уже очень долго держатся и очень точно проверены, могут быть ошибочными. Каким это было большим потрясением — открыть, что законы Ньютона неверны, и это после того, как все годы они казались точными! Теперь, конечно, ясно, что не опыты были неправильными, а просто все они проделывались в слишком ограниченном интервале скоростей — таком узком, что релятивистские эффекты невозможно было заметить. И все же теперь мы взираем на наши законы физики куда более смиренно — ведь любой из них может оказаться ошибочным!
Во-вторых, если возникают некие «странные» идеи, вроде того, что когда идешь, то время тянется медленнее и т. д., то неуместен вопрос: нравится ли это нам? Единственно уместен здесь другой вопрос: согласуются ли эти идеи с тем, что показал опыт? Иначе говоря, «странные идеи» должны быть согласны только с экспериментом. Единственный резон, почему мы должны обсуждать поведение часов и т. п., состоит в следующем: мы должны доказать, что, хотя определение растяжения времени и очень странно, с нашим способом измерять время оно вполне согласуется.
И наконец, теория относительности подсказала нам еще кое-что; может быть, это был чисто технический совет, но он оказался чрезвычайно полезным при изучении других физических законов. Совет состоял в том, что надо обращать внимание на симметрию законов, или, более определенно, искать способы, с помощью которых законы можно преобразовать, сохраняя при этом их форму. Когда мы обсуждали теорию векторов, мы отмечали, что основные законы движения не меняются, когда мы особым образом изменяем пространственные и временные переменные (пользуемся преобразованием Лоренца). Идея изучать операции, при которых основные законы не меняются, оказалась и впрямь очень полезной.
§ 2. Парадокс близнецов
Чтобы продолжить наше изучение преобразований Лоренца и релятивистских эффектов, рассмотрим известный «парадокс» — парадокс близнецов, скажем, Петера и Пауля. Подросши, Пауль улетает на космическом корабле с очень высокой скоростью. Петер остается на Земле. Он видит, что Пауль уносится с огромной скоростью, и ему кажется, что часы Пауля замедляют свой ход, сердце Пауля бьется реже, мысли текут ленивее. С точки зрения Петера, все замирает. Сам же Пауль, конечно, ничего этого не замечает. Но когда после долгих странствий он возвратится на Землю, он окажется моложе Петера! Верно ли это? Да, это одно из тех следствий теории относительности, которые легко продемонстрировать. Мю-мезоны живут дольше, если они движутся; так и Пауль проживет дольше, если будет двигаться. «Парадоксом» это явление называют лишь те, кто считает, что принцип относительности утверждает относительность всякого движения. Они восклицают: «Хе-хе-хе! А не можем ли мы сказать, что с точки зрения Пауля двигался Петер и что именно Петер должен был медленнее стареть? Из симметрии тогда следует единственный возможный вывод: при встрече возраст обоих братьев должен оказаться одинаковым».
Но ведь чтобы встретиться и помериться годами, Пауль должен либо остановиться в конце путешествия и сравнить часы, либо, еще проще, вернуться. А возвратиться может только тот, кто двигался. И он знает о том, что двигался, потому что ему пришлось повернуть, а при повороте на корабле произошло много необычных вещей: заработали ракеты, предметы скатились к одной стенке и т. д. А Петер ничего этого не испытал.
Поэтому можно высказать такое правило: тот, кто почувствовал ускорение, кто увидел, как вещи скатывались к стенке, и т. д.,— тот и окажется моложе. Разница между братьями имеет «абсолютный» смысл, и все это вполне правильно. Когда мы обсуждали долгую жизнь движущегося мю-мезона, в качестве примера мы пользовались его прямолинейным движением сквозь атмосферу. Но можно породить мю-мезоны и в лаборатории и заставить с помощью магнита их двигаться по кругу. И даже при таком ускоренном движении они проживут дольше, причем столько же, сколько и при прямолинейном движении с этой скоростью. Можно было бы попытаться разрешить парадокс опытным путем: сравнить покоящийся мю-мезон с закрученным по кругу. Несомненно, окажется, что закрученный мю-мезон проживет дольше. Такого опыта еще никто не ставил, но он и не нужен, потому что и так все прекрасно согласуется. Конечно, те, кто настаивает на том, что каждый отдельный факт должен быть непосредственно проверен, этим не удовлетворятся. А мы все же уверенно беремся предсказать результат опыта, в котором Пауль кружится по замкнутому кругу.
§ 3. Преобразование скоростей
Главное отличие принципа относительности Эйнштейна от принципа относительности Ньютона заключается в том, что законы преобразований, связывающих координаты и времена в системах, движущихся относительно друг друга, различны.
Правильный закон преобразований (Лоренца) таков:
(16.1)
Эти уравнения отвечают сравнительно простому случаю, когда наблюдатели движутся относительно друг друга вдоль общей оси х. Конечно, мыслимы и другие направления движения, но самое общее преобразование Лоренца выглядит довольно сложно: в нем перемешаны все четыре числа. Мы и впредь будем пользоваться этой простой формулой, так как она содержит в себе все существенные черты теории относительности.
Рассмотрим теперь дальнейшие следствия этого преобразования. Прежде всего интересно разрешить эти уравнения относительно x, y, z, t. Это система четырех линейных уравнений для четырех неизвестных, и их можно решить — выразить x, y, z, t через х', у', z', t'. Результат этот потому интересен, что он говорит нам, как «покоящаяся» система координат выглядит с точки зрения «движущейся». Ясно, что из-за относительности движения и постоянства скорости тот, кто «движется», может, если пожелает, счесть себя неподвижным, другого — движущимся. А поскольку он движется в обратную сторону, то получит то же преобразование, но с противоположным знаком у скорости. Это в точности то, что дает и прямое решение системы, так что все сходится. Вот если бы не сошлось, было бы от чего встревожиться!
(16.2)
Теперь займемся интересным вопросом о сложении скоростей в теории относительности. Напомним, что первоначально загадка состояла в том, что свет проходит 300 000 км/сек во всех системах, даже если они движутся друг относительно друга. Это — частный случай более общей задачи. Приведем пример. Пусть предмет внутри космического корабля движется вперед со скоростью 200 000 км/сек; скорость самого корабля тоже 200 000 км/сек. С какой скоростью перемещается предмет с точки зрения внешнего наблюдателя? Хочется сказать: 400 000 км/сек, но эта цифра уж больно подозрительна: получается скорость большая, чем скорость света! Разве можно себе это представить?
Общая постановка задачи такова. Пусть скорость тела внутри корабля равна v (с точки зрения наблюдателя на корабле), а сам корабль имеет скорость и по отношению к Земле. Мы желаем знать, с какой скоростью vx это тело движется с точки зрения земного наблюдателя. Впрочем, это тоже не самый общий случай, потому что движение происходит в направлении х. Могут быть формулы для преобразования скоростей в направлении у или в любом другом; если они будут нужны, их всегда можно вывести. Внутри корабля скорость тела равна vx'. Это значит, что перемещение х' равно скорости, умноженной на время:
(16.3)
Остается только подсчитать, какие у тела значения х и t с точки зрения внешнего наблюдателя, если х' и t' связаны соотношением (16.3). Подставим (16.3) в (16.2) и получим
(16.4)
Но здесь х выражено через t'. А скорость с точки зрения внешнего наблюдателя — это «его» расстояние, деленное на «его» время, а не на время другого наблюдателя! Значит, надо и время подсчитать с его позиций
(16.5)
А теперь разделим х на t. Квадратные корни сократятся, останется же
(16.6)
Это и есть искомый закон: суммарная скорость не равна сумме скоростей (это привело бы ко всяким несообразностям), но «подправлена» знаменателем 1+uv/c2.
Что же теперь будет получаться? Пусть ваша скорость внутри корабля равна половине скорости света, а скорость корабля тоже равна половине скорости света. Значит, и u равно 1/2с, и v равно 1/2c, но в знаменателе uv равно 1/4, так что
Выходит по теории относительности, что 1/2 и 1/2 дают не 1, а 4/5. Небольшие скорости, конечно, можно складывать, как обычно, потому что, пока скорости по сравнению со скоростью света малы, о знаменателе (1+uv/с2) можно забыть, но на больших скоростях положение меняется.
Возьмем предельный случай. Положим, что человек на борту корабля наблюдает, как распространяется свет. Тогда v=c. Что обнаружит земной наблюдатель? Ответ будет такой:
Значит, если что-то движется со скоростью света внутри корабля, то, с точки зрения стороннего наблюдателя, скорость не изменится, она по-прежнему будет равна скорости света! Это именно то, ради чего в первую очередь предназначал Эйнштейн свою теорию относительности.
Конечно, бывает, что движение тела не совпадает по направлению с равномерным движением корабля. Например, тело движется «вверх» со скоростью vy' по отношению к кораблю, а корабль движется «горизонтально». Проделывая такие же манипуляции (только х надо заменить на у), получаем
так что при vx'=0
(16.7)
Итак, боковая скорость тела уже не vy', а vy'√(1-u2/с2). Этот результат мы получили, пользуясь формулами преобразований. Но он вытекает и прямо из принципа относительности по следующей причине (всегда бывает полезно докопаться до первоначальной причины). Мы уже раньше рассуждали (см. фиг. 15.3) о том, как могут работать движущиеся часы; свет кажется распространяющимся наискось со скоростью с в неподвижной системе, в то время как в движущейся системе он просто движется вертикально с той же скоростью. Мы нашли, что вертикальная компонента скорости в неподвижной системе меньше скорости света на множитель √(1-u2/с2) [см. уравнение (15.3)]. Пусть теперь материальная частица движется в тех же «часах» взад-вперед со скоростью, равной 1/n скорости света (фиг. 16.1).
Фиг. 16.1. Траектории светового луча и частицы внутри движущихся часов.
Пока частица пройдет туда и обратно, свет пройдет этот путь ровно n раз (n — целое число). Значит, каждое тиканье «часов с частицей» совпадет с n-м тиканьем «световых часов». Этот факт должен остаться верным и тогда, когда тело движется, потому что физическое явление совпадения остается совпадением в любой системе. Ну а поскольку скорость су меньше скорости света, то скорость vy частицы должна быть меньше соответствующей скорости в том же отношении (с квадратным корнем)! Вот почему в любой вертикальной скорости появляется корень.
§ 4. Релятивистская масса
Из предыдущей главы мы усвоили, что масса тела растет с увеличением его скорости. Но никаких доказательств этого, похожих на те рассуждения с часами, которыми мы обосновали замедление времени, мы не привели. Сейчас, однако, мы можем доказать, что (как следствие принципа относительности и прочих разумных соображений) масса должна изменяться именно таким образом. (Мы должны говорить о «прочих соображениях» по той причине, что нельзя ничего доказать, нельзя надеяться на осмысленные выводы, не опираясь на какие-то законы, которые предполагаются верными.) Чтобы не изучать законы преобразования силы, обратимся к столкновениям частиц. Здесь нам не понадобится закон действия силы, а хватит только предположения о сохранении энергии и импульса. Кроме того, мы предположим, что импульс движущейся частицы — это вектор, всегда направленный по ее движению. Но мы не будем считать импульс пропорциональным скорости, как это делал Ньютон. Для нас он будет просто некоторой функцией скорости. Мы будем писать вектор импульса в виде вектора скорости, умноженного на некоторый коэффициент
(16.8)
Индекс v у коэффициента будет напоминать нам, что это функция скорости v. Будем называть этот коэффициент «массой». Ясно, что при небольших скоростях это как раз та самая масса, которую мы привыкли измерять. Теперь, исходя из того принципа, что законы физики во всех системах координат одинаковы, попробуем показать, что формула для mv должна иметь вид m0/√(1-v2/c2).
Пусть у нас есть две частицы (к примеру, два протона), которые между собой совершенно одинаковы и движутся навстречу друг другу с одинаковыми скоростями. Их общий импульс равен нулю. Что с ними случится? После столкновения их направления движения должны все равно остаться противоположными, потому что если это не так, то их суммарный вектор импульса будет отличен от нуля, т. е. не сохранится. Раз частицы одинаковы, то и скорости их должны быть одинаковы; более того, они просто должны остаться прежними, иначе энергия при столкновении изменится. Значит, схема такого упругого обратимого столкновения будет выглядеть, как на фиг. 16.2,а: все стрелки одинаковы, все скорости равны. Предположим, что такие столкновения всегда можно подготовить, что в них допустимы любые углы θ и что начальные скорости частиц могут быть любыми.
Фиг. 16.2. Упругое столкновение одинаковых тел, движущихся с равными скоростями в противоположных направлениях, при различном выборе систем координат.
Далее, напомним, что одно и то же столкновение выглядит по-разному, смотря по тому, как повернуты оси. Для удобства мы так повернем оси, чтобы горизонталь делила пополам угол между направлениями частиц до и после столкновения (фиг. 16.2,б). Это то же столкновение, что и на фиг. 16.2,а, но с повернутыми осями.
Теперь начинается самое главное: взглянем на это столкновение с позиций наблюдателя, движущегося на автомашине со скоростью, совпадающей с горизонтальной компонентой скорости одной из частиц. Как оно будет выглядеть? Наблюдателю покажется, что частица 1 поднимается прямо вверх (горизонтальная компонента у нее пропала), а после столкновения падает прямо вниз по той же причине (фиг. 16.3, а).
Фиг. 16.3. Еще две картины того же столкновения (видимые из движущихся автомашин).
Зато частица 2 движется совсем иначе, она проносится мимо с колоссальной скоростью и под малым углом (но этот угол и до и после столкновения одинаков). Обозначим горизонтальную компоненту скорости частицы 2 через и, а вертикальную скорость частицы 1 — через w.
Чему же равна вертикальная скорость utgα частицы 2? Зная это, можно получить правильное выражение для импульса, пользуясь сохранением импульса в вертикальном направлении. (Сохранение горизонтальной компоненты импульса и так обеспечено: у обеих частиц до и после столкновения эта компонента одинакова, а у частицы 1 она вообще равна нулю. Так что следует требовать только сохранения вертикальной скорости utgα.) Но вертикальную скорость можно получить, просто взглянув на это столкновение с другой точки зрения! Посмотрите на столкновение, изображенное на фиг. 16.3, а из автомашины, которая движется теперь налево со скоростью и. Вы увидите то же столкновение, но перевернутое «вверх ногами» (фиг. 16.3, б). Теперь уже частица 2 упадет и подскочит со скоростью w, а горизонтальную скорость и приобретет частица 1. Вы уже, конечно, догадываетесь, чему равна горизонтальная скорость utgα; она равна w√(1-u2/c2) [см. уравнение (16.7)]. Кроме того, нам известно, что изменение вертикального импульса вертикально движущейся частицы равно
(двойка здесь потому, что движение вверх перешло в движение вниз). У частицы, движущейся косо, скорость равна v, ее компоненты равны u и w√(1-u2/c2), а масса ее mv. Изменение вертикального импульса этой частицы Δр'=2mvw√(1—u2/с2), так как в соответствии с нашим предположением (16.8) любая компонента импульса равна произведению одноименной компоненты скорости на массу, отвечающую этой скорости. Но суммарный импульс равен нулю. Значит, и вертикальные импульсы должны взаимно сократиться, отношение же массы, движущейся со скоростью w, к массе, движущейся со скоростью v, должно оказаться равным
(16.9).
Перейдем к предельному случаю, когда w стремится к нулю. При очень малых w величины v и u практически совпадут, mw→m0, а mv→mu. Окончательный результат таков:
(16.10)
Проделайте теперь такое интересное упражнение: проверьте, будет ли выполнено условие (16.9) при произвольных w, когда масса подчиняется формуле (16.10). При этом скорость v, стоящую в уравнении (16.9), можно найти из прямоугольного треугольника
Вы увидите, что (16.9) выполняется тождественно, хотя выше нам понадобился только предел этого равенства при w→0. Теперь перейдем к дальнейшим следствиям, считая уже, что, согласно (16.10), масса зависит от скорости. Рассмотрим так называемое неупругое столкновение. Для простоты предположим, что из двух одинаковых тел, сталкивающихся с равными скоростями w, образуется новое тело, которое больше не распадается (фиг. 16.4,а).
Фиг. 16.4. Две картины неупругого соударения тел равной массы.
Массы тел до столкновения равны, как мы знаем, m0/√(1- w2/c2). Предположив сохраняемость импульса и приняв принцип относительности, можно продемонстрировать интересное свойство массы вновь образованного тела. Представим себе бесконечно малую скорость u, поперечную к скоростям w (можно было бы работать и с конечной скоростью и, но с бесконечно малым значением и легче во всем разобраться), и посмотрим на это столкновение, двигаясь в лифте со скоростью -u. Перед нами окажется картина, изображенная на фиг. 16.4, а. Составное тело обладает неизвестной массой М. У тела 1, как и у тела 2, есть компонента скорости и, направленная вверх, и горизонтальная компонента, практически равная w. После столкновения остается масса М, движущаяся вверх со скоростью u, много меньшей и скорости света и скорости w. Импульс должен остаться прежним; посмотрим поэтому, каким он был до столкновения и каким стал потом. До столкновения он был равен p~=2mwu, а потом стал р'=Muu. Но Mu из-за малости u, по существу, совпадает с М0. Благодаря сохранению импульса
(16.11)
Итак, масса тела, образуемого при столкновении двух одинаковых тел, равна их удвоенной массе. Вы, правда, можете сказать: «Ну и что ж, это просто сохранение массы». Но не торопитесь восклицать: «Ну и что ж!», потому что сами-то массы тел были больше, чем когда тела неподвижны. Они вносят в суммарную массу М не массу покоя, а больше. Не правда ли, поразительно! Оказывается, сохранение импульса в столкновении двух тел требует, чтобы образуемая ими масса была больше их масс покоя, хотя после столкновения эти тела сами придут в состояние покоя!
§ 5. Релятивистская энергия
Немного выше мы показали, что зависимость массы от скорости и законы Ньютона приводят к тому, что изменения в кинетической энергии тела, появляющиеся в результате работы приложенных к нему сил, оказываются всегда равными
(16.12)
Потом мы продвинулись дальше и обнаружили, что полная энергия тела равна полной его массе, умноженной на с2. Продолжим эти рассуждения.
Предположим, что наши два тела с равными массами (те, которые столкнулись) можно «видеть» даже тогда, когда они оказываются внутри тела М. Скажем, протон с нейтроном столкнулись, но все еще продолжают двигаться внутри М. Масса тела М, как мы обнаружили, равна не 2m0, а 2mw. Этой массой 2mw снабдили тело его составные части, чья масса покоя была 2m0; значит, избыток массы составного тела равен привнесенной кинетической энергии. Это означает, конечно, что у энергии есть инерция. Ранее мы говорили о нагреве газа и показали, что поскольку молекулы газа движутся, а движущиеся тела становятся массивнее, то при нагревании газа и усилении движения молекул газ становится тяжелее. Но на самом деле такое рассуждение является совершенно общим; наше обсуждение свойств неупругого соударения тоже показывает, что добавочная масса появляется всегда, даже тогда, когда она не является кинетической энергией. Иными словами, если две частицы сближаются и при этом образуется потенциальная или другая форма энергии, если части составного тела замедляются потенциальным барьером, производя работу против внутренних сил, и т. д.,— во всех этих случаях масса тела по-прежнему равна полной привнесенной энергии. Итак, вы видите, что выведенное выше сохранение массы равнозначно сохранению энергии, поэтому в теории относительности нельзя говорить о неупругих соударениях, как это было в механике Ньютона. Согласно механике Ньютона, ничего страшного не произошло бы, если бы два тела, столкнувшись, образовали тело с массой 2m0, не отличающееся от того, какое получилось бы, если их медленно приложить друг к другу. Конечно, из закона сохранения энергии мы знаем, что внутри тела имеется добавочная кинетическая энергия, но по закону Ньютона на массу это никак не влияет. А теперь выясняется, что это невозможно: поскольку до столкновения у тел была кинетическая энергия, то составное тело окажется тяжелее; значит, это будет уже другое тело. Если осторожно приложить два тела друг к другу, то возникает тело с массой 2m0; когда же вы их с силой столкнете, то появится тело с большей массой. А если масса отличается, то мы можем это заметить. Итак, сохранение импульса в теории относительности с необходимостью сопровождается сохранением энергии.
Отсюда вытекают интересные следствия. Пусть имеется тело с измеренной массой М, и предположим, что что-то стряслось и оно распалось на две равные части, имеющие скорости w и массы mw. Предположим теперь, что эти части, двигаясь через вещество, постепенно замедлились и остановились. Теперь их масса m0. Сколько энергии они отдали веществу? По теореме, доказанной раньше, каждый кусок отдаст энергию (mw-m0)с2. Она перейдет в разные формы, например в теплоту, в потенциальную энергию и т. д. Так как 2mw=M, то высвободившаяся энергия Е=(М-2m0)с2. Это уравнение было использовано для оценки количества энергии, которое могло бы выделиться при ядерном расщеплении в атомной бомбе (хотя части бомбы не точно равны, но примерно они равны). Масса атома урана была известна (ее измерили заранее), была известна и масса атомов, на которые она расщеплялась,— иода, ксенона и т. д. (имеются в виду не массы движущихся атомов, а массы покоя). Иными словами, и М и m0 были известны. Вычтя одно значение массы из другого, можно прикинуть, сколько энергии высвободится, если М распадется «пополам». По этой причине все газеты считали Эйнштейна «отцом» атомной бомбы. На самом же деле под этим подразумевалось только, что он мог бы заранее подсчитать выделившуюся энергию, если бы ему указали, какой процесс произойдет. Энергию, которая должна высвободиться, когда атом урана подвергнется распаду, подсчитали лишь за полгода до первого прямого испытания. И как только энергия действительно выделилась, ее непосредственно измерили (не будь формулы Эйнштейна, энергию измерили бы другим способом), а с момента, когда ее измерили, формула уже была не нужна. Это отнюдь не принижение заслуг Эйнштейна, а скорее критика газетных высказываний и популярных описаний развития физики и техники. Проблема, как добиться того, чтобы процесс выделения энергии прошел эффективно и быстро, ничего общего с формулой не имеет.
Формула имеет значение и в химии. Скажем, если бы мы взвесили молекулу двуокиси углерода и сравнили ее массу с массой углерода и кислорода, мы бы могли определить, сколько энергии высвобождается, когда углерод и кислород образуют углекислоту. Плохо только то, что эта разница масс так мала, что технически опыт очень трудно проделать.
Теперь обратимся к такому вопросу: нужно ли отныне добавлять к кинетической энергии m0c2 и говорить с этих пор, что полная энергия объекта равна mc2? Во-первых, если бы нам были видны составные части с массой покоя m0 внутри объекта M, то можно было бы говорить, что часть массы M есть механическая масса покоя составных частей, а другая часть — их кинетическая энергия, третья — потенциальная. Хотя в природе и на самом деле открыты различные частицы, с которыми происходят как раз такие реакции (реакции слияния в одну), однако никакими способами невозможно при этом разглядеть внутри M какие-то составные части. Например, распад K-мезона на два пиона происходит по закону (16.11), но бессмысленно считать, что он состоит из 2π, потому что он распадается порой и на Зπ!
А поэтому возникает новая идея: нет нужды знать, как тела устроены изнутри; нельзя и не нужно разбираться в том, какую часть энергии внутри частицы можно считать энергией покоя тех частей, на которые она распадется. Неудобно, а порой и невозможно разбивать полную энергию mc2 тела на энергию покоя внутренних частей, их кинетическую и потенциальную энергии; вместо этого мы просто говорим о полной энергии частицы. Мы «сдвигаем начало отсчета» энергий, добавляя ко всему константу m0c2, и говорим, что полная энергия частицы равна ее массе движения, умноженной на с2, а когда тело остановится, его энергия есть его масса в покое, умноженная на с2.
И наконец, легко обнаружить, что скорость v, импульс Р и полная энергия Е довольно просто связаны между собой. Как это ни странно, формула m=m0/√(1-v2/c2) очень редко употребляется на практике. Вместо этого незаменимыми оказываются два соотношения, которые легко доказать:
(16.13)
и
(16.14)
Глава 17 ПРОСТРАНСТВО-ВРЕМЯ
§ 1. Геометрия пространства-времени
Теория относительности показывает, что связь между местоположением события и моментом, в какой оно происходит, при измерениях в двух разных системах отсчета совсем не такая, как можно было ожидать на основе наших интуитивных представлений. Очень важно ясно представить себе связь пространства и времени, возникающую из преобразований Лоренца. Поэтому мы глубже рассмотрим этот вопрос.
Координаты и время (х, y, z, t), измеренные «покоящимся» наблюдателем, преобразуются в координаты и время (х', y', z', t'), измеренные внутри «движущегося» со скоростью u космического корабля:
(17.1)
Давайте сравним эти уравнения с уравнением (11.5), которое тоже связывает измерения в двух системах, только одна из них теперь вращается относительно другой
(17.2)
В этом частном случае у Мика и Джо оси х' и x повернуты на угол θ. Но и в том и в другом случае мы замечаем, что «штрихованные» величины — это «перемешанные» между собой «нештрихованные»: новое х' есть смесь х и у, а новое у' — другая смесь x и y.
Проведем следующую аналогию: когда мы глядим на предмет, мы различаем его «видимую ширину» и «видимую толщину». Но эти два понятия — «ширина» и «толщина» — отнюдь не основные свойства предмета. Отойдите в сторону, взгляните на предмет под другим углом — видимая ширина и видимая толщина предмета станут другими. Можно написать формулы, позволяющие узнать новые ширину и толщину по известным старым и по углу поворота. Уравнения (17.2) — как раз эти формулы. Можно сказать, что данная толщина есть своего рода «смесь» всех ширин и всех толщин. Если б мы не могли сдвинуться с места, если б мы на данный предмет всегда глядели из одного и того же положения, то нам все эти рассуждения показались бы неуместными; мы ведь и так всегда видели бы пред собой «настоящую» ширину и «настоящую» толщину и знали бы, что это совершенно разные качества предмета: один связан с углом, под каким виден предмет, другой требует фокусирования глаза и даже интуиции. Они казались бы абсолютно различными, их незачем было бы смешивать. Только потому, что мы в состоянии обойти вокруг предмета, мы понимаем, что ширина и толщина — это разные стороны одного и того же предмета.
Нельзя ли взглянуть на преобразование Лоренца таким же способом? Ведь и здесь перед нами смесь — смесь местоположения и момента времени. Из значений координаты и времени получается новая координата. Иначе говоря, в измерениях пространства, сделанных одним человеком, есть с точки зрения другого малая примесь времени. Наша аналогия позволяет высказать следующую мысль: «реальность» предмета, на который мы смотрим, включает нечто большее (говоря грубо и образно), чем его «ширину» и его «толщину», потому что обе они зависят от того, как мы смотрим на предмет. Оказавшись на новом месте, наш мозг немедленно пересчитывает и ширину, и толщину. Но когда мы будем двигаться с большой скоростью, наш мозг не сможет немедленно пересчитать координаты и время: у нас нет опыта движений со скоростями, близкими к световой, мы не ощущаем время и пространство как явления одной природы. Все равно как если бы нас усадили на какое-то место, заставили бы разглядывать ширину какого-то предмета и при этом не разрешали бы даже поворачивать голову. Мы теперь понимаем, что, будь у нас такая возможность, мы могли бы увидеть немножко от времени другого человека, как бы «заглянуть» сзади него.
Итак, мы должны попытаться представить себе предметы в мире нового типа, в котором время с пространством смешано в том же смысле, в каком предметы нашего привычного пространственного мира можно разглядывать с разных направлений. Мы должны считать, что предметы, занимающие некоторое место и существующие некоторый период времени, занимают некую «дольку» мира нового типа и что мы смотрим на эту «дольку» с разных точек зрения, когда движемся с разной скоростью. Этот новый мир, эта геометрическая реальность, в которой имеются «дольки», занимающие некоторое пространство и существующие некоторое время, называется пространством-временем. Данная точка (x, y, z, t) в пространстве-времени носит название события. Представьте, например, что ось х мы поместили горизонтально, оси у и z — в двух других направлениях, взаимно перпендикулярных и перпендикулярных к странице (!), а ось t направили вертикально. Как на такой диаграмме изобразится, скажем, движущаяся частица? Когда частица неподвижна, у нее есть какая-то координата х; время течет, а х остается все тем же, и тем же, и тем же. Значит, ее «путь» — это прямая, параллельная оси (а на фиг. 17.1).
Фиг. 17.1. Пути трех частиц в пространстве-времени. a — частица покоится в точке х=х0; b — частица отправилась из точки х=х0 с постоянной скоростью; с — частица начала было двигаться, но затормозила; d — распространение света.
С другой стороны, если она равномерно удаляется, то с течением времени растет и х (b на фиг. 17.1). Таким образом, частица, которая сперва двигалась, а потом стала замедлять свой ход, изобразится чем-то похожим на кривую с на фиг. 17.1. Другими словами, всякая устойчивая, нераспадающаяся частица изображается линией в пространстве-времени. А распадающаяся частица изобразится вилкой, потому что она превращается в две частицы, выходящие из одной точки.
А как обстоит дело со светом? Скорость света всегда одна и та же, значит, свет можно изображать прямыми линиями одинакового наклона (d на фиг. 17.1).
Итак, согласно высказанной нами идее, если происходит некое событие, например частица внезапно распадается в какой-то пространственно-временной точке (х, t) на две, то, если это для чего-нибудь нужно, поворотом осей можно получить значения х и t в новой системе (фиг. 17.2, а).
Фиг. 17.2. Два изображения распада частицы. а — неверное; 6 — верное.
Но это не так: ведь уравнение (17.1) не совпадает с преобразованием (17.2), в них по-разному расставлены знаки, в одном встречаются sinθ и cosθ, а в другом — некоторые алгебраические величины. (Вообще-то иногда алгебраические величины выражаются через косинус и синус, но в данном случае это невозможно.) А все-таки эти выражения очень похожи. Как мы с вами увидим, нельзя представлять себе пространство-время в виде реальной обычной геометрии, и все из-за этой разницы в знаках. На самом деле, хотя мы этого пока не подчеркивали, оказывается, что движущийся наблюдатель должен пользоваться осями, равнонаклоненными к линии светового луча, и проектировать точку на эти оси при помощи отрезков, им параллельных. Это показано на фиг. 17.2, б. Мы не будем заниматься этой геометрией, она не особенно помогает; легче работать прямо с уравнениями.
§ 2. Пространственно-временные интервалы
Хотя геометрия пространства-времени не обычная (не евклидова), тем не менее эта геометрия очень похожа на евклидову, но в некоторых отношениях весьма своеобразная. Если это представление о геометрии правильно, то должны существовать такие функции координат и времени, которые не зависят от системы координат. К примеру, при обычных вращениях, если взять две точки, одну для простоты в начале координат обеих систем, а другую в любом другом месте, то в обеих системах координат расстояние между точками будет одинаково. Это первое свойство точек, которое не зависит от частного способа измерения: квадрат расстояния, или x2+y2+z2, не меняется при поворотах. А как с пространством-временем? Не трудно показать, что и здесь есть нечто, не зависящее от способа измерения, а именно комбинация c2t2-х2-у2-z2 одинакова до и после преобразования
(17.3)
Поэтому эта величина, подобно расстоянию, «реальна» в том смысле, который был придан этому слову выше; ее называют интервалом между двумя пространственно-временными точками, одна из которых в этом случае совпадает с началом координат. (Точнее говоря, это не интервал, а квадрат интервала, точно так же как и х2+у2+z2 — квадрат расстояния.) Это название подчеркивает различие в геометриях; обратите внимание, что в формуле присутствует с, а некоторые знаки обращены.
Давайте избавимся от с, оно нам не нужно, если мы хотим иметь удобное пространство, в котором х и t можно переставлять. Представьте, к какой путанице приведет измерение ширины по углу, под которым виден предмет, а толщины — по сокращению мышц при фиксировании глаза на предмет и выражение толщины в метрах, а ширины в радианах. При преобразованиях уравнений типа (17.2) тогда получится страшная неразбериха и ни за что не удастся разглядеть всю простоту и ясность предмета по той технической причине, что одно и то же будет измеряться двумя различными единицами. С помощью уравнений (17.1) и (17.3) природа говорит нам, что время равнозначно пространству; время становится пространством; их надо измерять в одинаковых единицах. Какое расстояние измеряет секунда? Из уравнения (17.3) это легко понять: секунда — это 3·108 м, расстояние, которое свет проходит за 1 сек. Иначе говоря, если бы расстояния и время мы измеряли в одинаковых единицах (секундах), то единицей длины было бы 3·108 м и уравнения упростились бы. А другой способ уравнять единицы — это измерять время в метрах. Чему равен метр времени? Метр времени — это время, за какое свет проходит расстояние в 1 м, т. е. (1/3)·10-8 сек, или 3,3 миллиардных доли секунды! Иными словами, нам нужно записать все уравнения в системе единиц, где с=1. Когда время и пространство станут измеряться в одинаковых единицах, уравнения, естественно, упростятся:
(17.4)
(17.5)
Может быть, вы сомневаетесь в законности этого или вас «пугает», что, положив с=1, вы не сможете вернуться к правильным уравнениям? Напротив, без с их гораздо легче запомнить, а с легко поставить на нужные места, если присмотреться к размерностям. Скажем, в √(1—u2) мы видим, что из неименованного числа 1 приходится вычитать именованное (квадрат скорости u2); естественно, этот квадрат нужно разделить на с2, чтобы сделать вычитаемое безразмерным. Таким путем можно расставить с, где полагается.
Очень интересно различие между пространством-временем и обыкновенным пространством, различие между интервалом и расстоянием. Посмотрите на формулу (17.5). Если два события произошли в какой-то системе координат в одно и то же время, но в разных точках пространства, то, поместив начало координат в точку, изображающую одно из событий, мы получим, что t=0, а, например, х≠0. Значит, квадрат интервала получится отрицательным, а сам интервал — мнимым (корень квадратный из отрицательного числа). Интервалы в этой теории бывают и действительные, и мнимые, потому что их квадраты могут быть и положительными, и отрицательными (в отличие от расстояния, квадрат которого бывает только положительным). Когда интервал мнимый, говорят, что интервал между двумя событиями (точками) пространственно-подобный (а не мнимый), потому что такой интервал получался бы всегда, если бы весь мир застыл на одном времени. С другой стороны, если два предмета в данной системе координат попадают в одно и то же место в разные моменты времени, тогда t≠0, а x=y=z=0 и квадрат интервала положителен; это называется времени-подобным интервалом. Далее, если провести на диаграмме пространства-времени две прямые под углом 45° (в четырех измерениях они обратятся в «конус», называемый световым), то точки на этих прямых будут отделены от начала координат нулевым интервалом. Куда бы из начала координат ни распространялся свет, все равно x2+y2+z2=c2t2, т. е. интервал между событием прихода света в любую точку и началом всегда равен нулю [как легко видеть из (17.5)]. Кстати, мы сейчас доказали, что скорость света в любых системах координат одинакова: ведь если интервал в обеих системах одинаков, то, будучи равен нулю в одной из них, он равен нулю и в другой, и квадрат скорости света — отношение x'2+y'2+z'2 к t'2— опять равен с2.
Сказать, что скорость распространения света — инвариант,— это все равно, что сказать, что интервал равен нулю.
§ 3. Прошедшее, настоящее, будущее
Пространственно-временную область, окружающую данную точку пространства-времени, можно разделить на три области, как показано на фиг. 17.3.
Фиг. 17.3. Область пространства-времени, окружающая начало координат.
В одной из них интервалы пространственно-подобны, в остальных двух — времени-подобны. Эти три области, на которые распадается окружающее точку пространство-время, в физическом отношении связаны с самой точкой очень интересно.
Из области 2 физический объект или сигнал, двигаясь со скоростью, меньшей скорости света, может прийти в точку О. Поэтому события в этой области могут воздействовать на событие в точке O, могут влиять на него из прошлого (t<0). Действительно, предмет в точке Р на оси отрицательных t оказывается точно в «прошлом» по отношению к точке О; Р — это та же пространственно-временная точка О, но в более ранний момент времени. Что в ней когда-то случилось, теперь сказывается на точке О. (К сожалению, именно такова наша жизнь.) Другой предмет из Q попадет в О, двигаясь с определенной скоростью, меньшей, чем с; значит, если бы этот предмет двигался в космическом корабле, он мог бы тоже оказаться прошлым той же точки О пространства-времени. Это означает, что в какой-то другой системе координат ось времени могла бы пройти через О и Q. Таким образом, все точки области 2 оказываются по отношению к О в «прошлом»; все, что в этой области происходит, может сказаться на О. Поэтому область 2 можно назвать воздействующим прошлым; это геометрическое место всех событий, которые хоть каким-то образом могут повлиять на событие в точке О.
А зато область 3 — это та область, на которую в свою очередь могут повлиять события в О; в тела, расположенные внутри области 3, можно «попасть пулей», скорость которой меньше скорости света. Это тот мир, чье будущее в наших руках (если мы сами находимся в точке О); область 3 можно назвать воздействуемым будущим. Остальное пространство-время (область 1) интересно тем, что на события в нем из точки О влиять нельзя и, обратно, ничто, происходящее в этой области, никак не может повлиять на положение в точке О, потому что ничто не может обогнать свет. Конечно, если что-то произойдет в точке R, это может сказаться позднее; если, например, Солнце «сию минуту» взорвется, то мы узнаем об этом лишь через 8 минут, и раньше этого времени взрыв никак отразиться на нас не может.
То, что происходит «сейчас», «сию минуту» — это на самом деле нечто таинственное; оно не поддается определению, не поддается и воздействию, однако несколько позже оно может воздействовать на нас (или мы на него, если какое-то время тому назад мы позаботились об этом). Когда мы смотрим на звезду Альфа Центавра, мы видим ее такой, какой она была 4 года тому назад; нам может захотеться узнать, на что она похожа «сейчас». «Сейчас» — это значит в этот же момент в нашей системе координат. Альфу Центавра мы можем видеть только при помощи световых лучей, явившихся к нам из нашего прошлого, прошлого четырехлетней давности, но что на ней происходит «сейчас», мы не знаем. Происходящее на ней «сейчас» сможет воздействовать на нас только через четыре года. «Альфа Центавра сейчас» — это идея, или понятие, существующее в нашем мозге; никакого физического определения для такого понятия в этот момент нет, потому что надо подождать, прежде чем «сейчас» удастся увидеть; для Альфы Центавра даже правильное понятие «сейчас» не поддается определению сию минуту. Ведь «сейчас» зависит от системы координат. Если бы, к примеру, Альфа Центавра двигалась, то наблюдатель на ней не согласился бы с нашим пониманием его «сейчас», потому что его оси координат были бы повернуты на какой-то угол, а его «сейчас» было бы совсем другим временем. Мы уже говорили, что одновременность не определяется однозначно.
Встречаются порой предсказатели судьбы, гадалки, люди, утверждающие, что они могут узнавать будущее; немало чудесных историй рассказывается и о людях, которые внезапно видят перед собой свое воздействуемое будущее. От этого возникает множество парадоксов: ведь если мы знаем, что что-то случится, то наверняка сможем избежать этого, если захотим. На самом же деле ни один провидец будущего не способен узнать даже настоящее! Нам никто не скажет, что сию минуту происходит достаточно далеко от нас, потому что это ненаблюдаемо.
Напоследок я задам вопрос, ответить на который предоставляю вам самим. Если бы внезапно появилась возможность знать, что происходит в области 1 пространства-времени,— возник бы от этого парадокс или нет?
§ 4. Еще о четырехвекторах
Вернемся опять к аналогии между преобразованием Лоренца и вращением пространственных осей. Мы уже убедились, что полезно собирать воедино отличные от координат величины, которые преобразуются так же, как и координаты; эти соединенные величины называют векторами, или направленными отрезками. При обычных вращениях немало величин преобразуется в точности так же, как х, y, z (например, скорость с тремя компонентами x, y, z); при переходе из одной системы координат в другую ни одна из компонент не остается прежней, все они приобретают новые значения. Но «сама» скорость, во всяком случае, более реальна, чем любая из ее компонент, и изображаем мы ее направленным отрезком.
Теперь мы спросим: существуют ли величины, которые преобразуются при переходе от неподвижной системы к движущейся так же, как и x, y, z, t? Наш опыт обращения с векторами подсказывает, что три из этих величин, подобно x, y, z, могли бы представлять собой три компоненты обычного пространственного вектора, а четвертая могла бы оказаться похожей на обычный скаляр относительно пространственных вращений: она бы не изменялась, пока мы не перейдем в движущуюся систему координат. Возможно ли, однако, связать с одним из известных «тривекторов» некоторый четвертый объект (который можно назвать «временной компонентой») таким образом, чтобы вся четверка «вращалась» точно так же, как изменяются пространство и время в пространстве-времени? Мы сейчас покажем, что действительно существует по крайней мере одна такая четверка (на самом деле далеко не одна): три компоненты импульса и энергия в качестве временной компоненты преобразуются вместе и образуют так называемый «четырехвектор». Доказывая это, мы избавимся от с тем же приемом, какой употреблялся в уравнении (17.4). Например, энергия и масса отличаются только множителем с2 и при надлежащем выборе единиц измерения энергия совпадет с массой. Вместо того чтобы писать Е=тс2, мы положим Е=т. Если понадобится, в окончательных уравнениях можно опять расставить с в нужных степенях.
Итак, уравнения для энергии и импульса имеют вид
(17.6)
Значит, при таком выборе единиц получится
(17.7)
Скажем, если энергия выражена в электронвольтах (эв), то чему равна масса в 1 эв? Она равна массе с энергией покоя 1 эв, т. е. m0c2=1 эв. У электрона, например, масса покоя равна 0,511·106 эв.
Как же будут выглядеть импульс и энергия в новой системе координат? Чтобы узнать это, надо преобразовать уравнения (17.6). Это преобразование легко получить, зная, как преобразуется скорость. Пусть некоторое тело имело скорость v, а мы наблюдаем за ним из космического корабля, который сам имеет скорость u, и обозначаем соответствующие величины штрихами. Для простоты сперва мы рассмотрим случай, когда скорость v направлена по скорости u. (Более общий случай мы рассмотрим позже.) Чему равна скорость тела v' по измерениям из космического корабля? Эта скорость равна «разности» между v и u. По прежде полученному нами закону
(17.8)
Теперь подсчитаем, какой окажется энергия Е' по измерениям космонавта. Он, конечно, воспользуется той же массой покоя, но зато скорость станет v'. Он возведет v' в квадрат, вычтет из единицы, извлечет квадратный корень и найдет обратную величину
Поэтому
(17.9)
Энергия Е' просто равна массе m0, умноженной на это выражение. Но нам хочется выразить энергию через нештрихованные энергию и импульс. Мы замечаем, что
или
(17.10)
Мы узнаем в этом выражении знакомое нам преобразование
Теперь мы должны найти новый импульс р'x. Он равен энергии Е', умноженной на v', и так же просто выражается через Е и р:
Итак,
(17.11)
и мы опять распознаем в этой формуле знакомое нам
Итак, преобразование старых энергии и импульса в новые энергию и импульс в точности совпало с преобразованием t и х в t' и х и t в х': если мы в уравнениях (17.4) будем писать Е каждый раз, когда увидим t, а вместо x: всякий раз будем подставлять рx, то уравнения (17.4) превратятся в уравнения (17.10) и (17.11). Если все верно, то это правило предполагает добавочные равенства р'у=-рy и р'z=рz. Чтобы их доказать, надо посмотреть, как преобразуется движение вверх или вниз. Но как раз в предыдущей главе мы рассмотрели такое движение. Мы анализировали сложное столкновение и заметили, что поперечный импульс действительно не меняется при переходе в движущуюся систему координат. Стало быть, мы уже убедились, что р'у=ру и pz=pz. Итак, полное преобразование равно
(17.12)
Таким образом, эти преобразования выявили четыре величины, которые преобразуются подобно x, y, z, t. Назовем их четырехвектор импульса. Так как импульс — это четырехвектор, его можно изобразить на диаграмме пространства-времени движущейся частицы в виде «стрелки», касательной к пути (фиг. 17.4).
Фиг. 17.4. Четырехвектор импульса частицы.
У этой стрелки временная компонента дает энергию, а пространственные — тривектор импульса; сама стрелка «реальнее», чем один только импульс или одна лишь энергия: ведь и импульс, и энергия зависят от нашей точки зрения.
§ 5. Алгебра четырехвекторов
Четырехвекторы обозначаются иначе, чем тривекторы. Например, тривектор импульса обозначают р. Если хотят дать более детальную запись, то говорят о трех компонентах рx, pу, рz; можно писать и короче рi, оговаривая, что i принимает три значения x, y и z. Для четырехвекторов мы будем применять похожее обозначение: будем писать рμ, а μ пусть заменяет собой четыре направления t, x, у, z.
Конечно, можно пользоваться любыми обозначениями. Не улыбайтесь, что мы так много говорим об обозначениях; учитесь изобретать их: в них вся сила. Ведь и сама математика в значительной степени состоит в изобретении лучших обозначений. Идея четырехвектора — это тоже усовершенствование обозначений с таким расчетом, чтобы преобразования было легче запомнить.
Итак, Aμ — это общий четырехвектор, рμ — четырехимпульс, pt — энергия, рx— импульс в направлении х, рy— в направлении у, pz— в направлении z. Складывая четырехвекторы, складывают их соответствующие компоненты.
Если четырехвекторы связаны каким-то уравнением, то это значит, что уравнение выполняется для любой компоненты. Например, если закон сохранения тривектора импульса соблюдается в столкновении частиц, т. е. сумма импульсов множества взаимодействующих или сталкивающихся частиц постоянна, то это означает, что сумма всех компонент импульсов постоянна и в направлении х, и в направлении у, и в направлении z. Сам по себе такой закон в теории относительности невозможен: он неполон; это все равно, что говорить только о двух компонентах тривектора. Неполон он потому, что при повороте осей разные компоненты смешиваются, значит, в закон сохранения должны войти все три компоненты. Таким образом, в теории относительности нужно дополнить закон сохранения импульса, включив в него сохранение временной компоненты. Абсолютно необходимо, чтобы сохранение первых трех компонент сопровождалось сохранением четвертой, иначе не получится релятивистской инвариантности. Четвертое уравнение — это как раз сохранение энергии; оно должно сопровождать сохранение импульса для того, чтобы четырехвекторные соотношения в геометрии пространства-времени были справедливы.
Итак, закон сохранения энергии и импульса в четырехмерном обозначении таков:
или в чуть измененных обозначениях:
(17.14)
где i=1, 2,... относится к сталкивающимся частицам, j=1, 2,... — к частицам, возникающим при столкновении, а μ=x, у, z или t. Вы спросите: «А что по осям координат?» Это неважно. Закон верен для любых компонент, при любых осях.
В векторном анализе нам встретилось одно понятие — скалярное произведение двух векторов. Что соответствует ему в пространстве-времени? При обычных вращениях неизменной остается величина x2+y2+z2. В четырехмерном мире таким свойством при преобразованиях обладает величина t2-х2-у2-z2 [уравнение (17.3)]. Как можно это записать? Можно было бы, например, пользоваться значком наподобие Aμ<·>Bμ, но обычно пишут
(17.15)
Штрих при ∑ напоминает, что первый, «временной» член положителен, а остальные три отрицательны. Эта величина одна и та же в любой системе координат, и можно назвать ее квадратом длины четырехвектора. Чему равен, например, квадрат длины четырехвектора импульса отдельной частицы? Ответ: р2t-р2x-Р2у-p2z, или, иначе, E2-р2, потому что pt это и есть Е. Чему равно Е2 -р2? Должно по условию получиться что-то, что одинаково в любой системе координат, в частности и в системе координат, которая движется вместе с частицей, так что частица в этой системе покоится. Но если частица неподвижна, значит, у нее нет импульса. Значит, у нее остается только энергия, совпадающая в этом случае с ее массой. Итак, E2-р2=m20, т. е. квадрат длины четырехвектора импульса равен m20.
Пользуясь выражением для квадрата вектора, легко изобрести скалярное произведение двух четырехвекторов: если один из них аμ, а другой bμ, то скалярное произведение определяется так:
(17.16)
Это выражение не меняется при преобразовании системы координат.
Следует еще упомянуть о частицах с нулевой массой покоя, например о фотоне — частице света. Фотон похож на частицу тем, что он переносит энергию и импульс. Энергия фотона равна произведению некоторой постоянной (постоянная Планка) на частоту света: E=hv. Такой фотон несет с собой и импульс, который (как у всякой частицы) равен постоянной h, деленной на длину волны света: p=h/λ. Но у фотона связь между частотой и длиной волны вполне определенна: v=c/λ. (Количество волн, проходящих за 1 сек, помноженное на их длину, даст расстояние, проходимое светом в 1 сек, т. е. с.) Мы сходу получаем, что энергия фотона равна его импульсу, умноженному на с, и, далее, полагая с=1, что энергия равна импульсу. Но это и значит, что масса покоя равна нулю. Давайте вдумаемся в это любопытное обстоятельство. Если фотон — частица с нулевой массой покоя, то что с ним бывает, когда он останавливается? Но он никогда не останавливается! Он всегда движется со скоростью с. Обычная формула для энергии — это m0/√(1-v2). Можно ли утверждать, что при m0=0 и v=1 энергия фотона равна нулю? Нет, нельзя; на самом деле фотон может обладать (и обладает) энергией, хоть и не имеет массы покоя, за счет того, что всегда движется со скоростью света!
Мы знаем также, что импульс любой частицы равен произведению полной энергии на скорость: p=vE при с=1, или, в обычных единицах, p=vE/c2. Для любой частицы, движущейся со скоростью света, р=Е, если с=1. Формулы для энергии фотона в движущейся системе даются по-прежнему уравнением (17.12), но вместо импульса туда нужно подставить энергию, умноженную на с (на 1). Изменение энергии при преобразовании означает изменение частоты света. Это явление называется эффектом Допплера; формулу для него легко получить из уравнения (17.12), положив Е=р и E=hv.
Как сказал Минковский: «Пространство само по себе и время само по себе погрузятся в реку забвенья, а останется жить лишь своеобразный их союз».
Глава 18 ДВУМЕРНЫЕ ВРАЩЕНИЯ
§ 1. Центр масс
В предыдущих главах мы изучали механику точек, или маленьких частиц, внутренняя структура которых нас совершенно не интересовала. В последующих нескольких главах мы изучим применение законов Ньютона к более сложным вещам. Но ведь чем сложнее объект, тем он интереснее, и вы сами увидите, что явления, связанные с такими более сложными объектами, поистине поразительны. Разумеется все эти явления не содержат ничего большего, чем комбинации законов Ньютона, однако временами просто трудно поверить, что все это произошло из F=ma!
Что это за более сложные объекты, с которыми мы будем иметь дело в дальнейшем? Это может быть течение воды, вращение галактик и т. д. Но сначала давайте разберемся с наиболее простым из сложных объектов—твердым телом. Этим термином мы будем называть монолитный объект, который одновременно с изменением положения может еще и вращаться как целое. Впрочем, даже такой простой объект может двигаться достаточно сложно, поэтому давайте сначала рассмотрим наиболее простой случай движения, когда тело крутится вокруг неподвижной оси, причем каждая точка этого тела движется в плоскости, перпендикулярной к этой оси. Такое вращение тела вокруг неподвижной оси называется плоским, или двумерным. Позднее, когда мы обобщим наш результат на случай трех измерений, вы увидите, что вращение гораздо более хитрая штука, чем механика частицы, и без достаточного опыта в двух измерениях понять трехмерные вращения очень трудно.
К первой интересной теореме о движении сложного тела можно прийти следующим образом: попробуйте бросить какой-нибудь предмет, состоящий из множества скрепленных между собой кубиков и стержней. Вы знаете, конечно, что он полетит по параболе; это мы обнаружили еще, когда изучали движение точки. Однако теперь наш объект не точка. Он поворачивается, покачивается и все же летит по параболе; вы можете в этом убедиться. Какая же точка тела описывает параболу? Ну разумеется, не угол кубика, потому что он поворачивается, не конец стержня, не его середина и не центр кубика. Но все-таки что-то движется по параболе, существует некий эффективный «центр», который движется по параболе. Таким образом, первая теорема о сложных объектах говорит, что существует какая-то «средняя» точка, вполне определенная математически, которая движется по параболе. Точка эта не обязательно находится в самом теле, она может лежать и где-то вне его.
Это так называемая теорема о центре масс, и доказывается она следующим образом.
Любой объект можно рассматривать как множество маленьких частичек, атомов, связанных различными силами. Пусть i обозначает номер одной из таких частиц (их страшно много, поэтому i может быть равно, например, 1023). Сила, действующая на i-ю частицу, равна массе, умноженной на ускорение этой частицы:
(18.1)
В последующих главах наши движущиеся объекты и все их части будут двигаться со скоростями, много меньшими, чем скорость света, и поэтому для всех величин мы будем рассматривать только нерелятивистское приближение. Масса при этих условиях будет постоянна, так что
(18.2)
Если теперь сложить все силы, действующие на частицы, т. е. сложить все Fi со всеми значениями индекса, то в результате мы должны получить полную силу F. Складывая же правые части уравнения (18.2) для всех частиц и вспоминая, что производная от суммы равна сумме производных, получаем
(18.3)
Поэтому полная сила равна второй производной от суммы произведений масс частиц на их положение.
Но полная сила, действующая на все частицы,— это то же самое, что и внешняя сила. Почему? Да потому что, какие бы силы ни действовали между частицами, пусть это будет притяжение или отталкивание, или атомные силы, все равно, когда мы складываем их вместе и применяем Третий закон Ньютона, по которому силы действия и противодействия между любыми двумя частицами равны друг другу, то эти взаимные силы сокращаются друг с другом и в результате останутся только силы, действующие со стороны атомов, находящихся вне тела. Так что, если уравнение (18.3) представляет собой сумму по некоторому числу частиц, образующих наш объект, то внешняя сила, действующая на него, равна просто сумме всех сил, действующих на все частицы, образующие этот объект. Уравнение (18.3) неплохо было бы записать в виде полной массы тела, умноженной на какое-то ускорение. Сделать это можно. Пусть М будет суммой масс всех частиц, т. е. полной массой тела. Если теперь определить вектор R как
(18.4)
то, поскольку М постоянна, уравнение (18.3) перейдет в
(18.5)
Таким образом, внешняя сила равна полной массе, умноженной на ускорение некоторой точки R; эта точка и называется центром масс тела. Она расположена где-то в «середине» тела — некое среднее r, в котором различные ri учитываются в зависимости от их важности, т. е. в зависимости от того, какую долю вносят они в полную массу.
Мы подробно обсудим эту важную теорему несколько позднее, а сейчас остановимся на двух примерах. Пусть на тело не действуют никакие внешние силы, скажем, оно плавает где-то в пустом пространстве. Оно может делать все, что ему угодно: крутиться, покачиваться, изгибаться, но при этом его центр масс, эта искусственно выделенная нами математическая точка, должен двигаться с постоянной скоростью. В частности, если вначале этот центр покоился, то он так и будет покоиться все время. Поэтому если мы возьмем какой-то космический корабль со всеми его пассажирами, вычислим его центр масс и обнаружим, что он стоит на месте, то можно быть уверенным, что центр масс так и останется на месте, если только на корабль не будут воздействовать какие-то внешние силы. Сам корабль, конечно, может немного перемещаться, но это потому, что пассажиры внутри корабля ходят взад и вперед. Так, если все пассажиры одновременно перейдут в носовую часть, то корабль немного подастся назад, чтобы среднее положение всех масс осталось в точности на том же самом месте.
Означает ли это, что в результате неподвижности центра масс ракета не может двигаться вперед? Конечно, нет, но, чтобы продвинуть вперед интересующую нас часть ракеты, мы что-то должны выбросить назад. Иными словами, если вначале ракета покоилась, а затем выбросила из сопла некоторое количество газа, то газ этот полетит назад, а сама ракета полетит при этом вперед, однако центр масс останется точно на том же месте, где он был и раньше. Так что в ракете интересующая нас часть продвинется вперед за счет другой, которая улетит назад.
Второе замечание относительно движения центра масс. Его можно рассматривать отдельно от всех «внутренних» движений тела и, следовательно, его можно не учитывать при изучении вращения. Собственно поэтому мы начали изучать вращения с центра масс.
§ 2. Вращение твердого тела
Поговорим теперь о вращении. Как известно, обычные предметы не вращаются просто так: они колеблются, вибрируют, изгибаются. Поэтому, чтобы упростить рассуждения, рассмотрим движение несуществующего идеального объекта, который мы назвали твердым телом. В таком объекте связи между атомами столь сильны, что те небольшие силы, которые необходимы, чтоб привести его в движение, не могут деформировать тело. Форма его все время остается одной и той же. Если мы хотим изучить движение такого тела и условимся не принимать во внимание движение его центра масс, то ему остается лишь вращаться. Вот это вращение мы и должны описать. Каким образом? Предположим, что в теле существует какая-то воображаемая неподвижная линия (она может проходить через центр масс, а может и не проходить); вокруг этой линии, как вокруг оси, вращается наше тело. Но как все-таки определить, что такое вращение? Сделать это совсем просто. Отметив какую-то точку на теле, где угодно, только не на оси, и зная, куда она перешла через некоторый промежуток времени, мы точно можем сказать, в каком положении находится тело. Единственное, что нужно знать для описания положения точки, — это угол. Таким образом, изучение вращения заключается в изучении изменения угла со временем.
Чтобы описать вращение, измерим угол, на который поворачивается тело. Разумеется, речь идет не об угле между двумя точками внутри самого тела или на теле, а об угловом изменении положения всего тела как целого от одного момента времени до другого.
Сначала давайте разберемся с кинематикой вращения. Изменение угла со временем очень похоже на изменение положения при одномерном движении; для плоского вращения мы можем говорить об угловом положении и угловой скорости. Между этими двумя движениями — плоским вращением и одномерным перемещением — существует очень интересная связь: почти каждая величина в одном случае имеет свой аналог в другом. Прежде всего угол θ, указывающий, насколько повернулось тело, соответствует пройденному точкой расстоянию s. Угловая скорость ω=dθ/dt, которая показывает, с какой быстротой изменяется угол, соответствует обычной скорости v=ds/dt, описывающей быстроту изменения положения. Если угол измеряется в радианах, то угловая скорость ω равна какому-то числу радиан в секунду. Чем больше угловая скорость, тем быстрее вращается объект и тем быстрее изменяется угол. Если продифференцировать угловую скорость по времени, то получим величину α=dω/dt, которую мы будем называть угловым ускорением. Оно может служить аналогом обычного ускорения.
Теперь нам следует связать динамику вращения с динамикой частиц, из которых сделано тело, т. е. выяснить, как движется каждая данная частица, если угловая скорость составляет столько-то радиан в секунду. Для этого давайте возьмем какую-то частицу, расположенную на расстоянии r от оси, и будем, как обычно, говорить, что в данный момент времени она находится в определенном положении Р(x, y) (фиг. 18.1).
Фиг. 18.1. Кинематика двумерного вращения.
Через промежуток времени Δt тело целиком повернется на угол Δθ, а вместе с ним повернется и наша частица. Хотя расстояние от нее до оси вращения О остается тем же самым, она уже переместится в другую точку, Q. Первое, что хотелось бы знать, это насколько изменятся расстояния х и y. Если обозначить через r длину ОР, то длина PQ будет равна rΔθ (просто по определению угла). Тогда изменение расстояния х будет равно проекции rΔθ на ось х
(18.6)
Аналогично,
(18.7)
Если тело вращается с угловой скоростью ω, то, деля обе части равенства (18.6) и (18.7) на Δt, найдем компоненты скорости частицы
(18.8)
Если же нам требуется абсолютная величина скорости, то мы просто пишем
(18.9)
Не удивительно, что абсолютная величина скорости получилась равной ωr; это же очевидно; ведь полное пройденное расстояние равно rΔθ, а поэтому расстояние, пройденное за 1 сек, будет rΔθ/Δt, или rω.
Перейдем теперь к рассмотрению динамики вращения. Здесь следует ввести новое понятие — силу. Давайте посмотрим, нельзя ли изобрести нечто, играющее ту же роль, что и сила в линейном движении. Это нечто мы будем называть моментом силы, или просто моментом. Обычно под силой мы понимаем нечто, заставляющее покоящееся тело двигаться, а то, что заставляет тело вращаться, есть «вращающая», или «крутящая», сила; ее мы называем моментом. Таким образом, качественно момент силы — это кручение; но что такое момент силы количественно? Количественную теорию момента можно получить, изучая работу, затраченную на поворот тела. Этот подход очень хорош и для определения силы: если мы знаем, какая требуется работа, чтобы совершить данное перемещение, то знаем и силу. Чтобы продолжить соответствие между угловыми и линейными величинами, мы должны приравнять работу, которая производится при повороте тела на какой-то угол, к произведению момента на этот угол. Другими словами, при таком определении момента теорема о работе имеет абсолютный аналог: работа есть сила на перемещение, или момент на угол. Это сразу говорит нам, что такое момент количественно. Рассмотрим, например, твердое тело, вращающееся вокруг оси, на которое действуют различные силы. Сконцентрируем сначала наше внимание на одной силе, приложенной к некоторой точке (x, y). Какую работу мы затрачиваем, поворачивая тело на некоторый малый угол Δθ? Нетрудно понять, что она равна
(18.10)
Теперь нужно только подставить выражения (18.6) и (18.7) для Δx и Δy и получить
(18.11)
т. е. работа, которую мы проделали, равна углу, на который было повернуто тело, умноженному на какую-то странную комбинацию сил и расстояний. Эта «странная комбинация» и есть момент. Таким образом, определяя изменение работы как момент, умноженный на угол поворота, мы получаем формулу, выражающую момент через силы. (Это понятно. Поскольку момент не является полностью новым понятием, не зависящим от механики Ньютона, то он должен определенным образом выражаться через силу.)
Пусть теперь на тело действует несколько сил. Тогда работа, производимая этими силами, равна сумме работ от каждой силы, так что ΔW будет иметь вид суммы множества членов: по одному для каждой из сил, однако каждый из них пропорционален Δθ. Эту величину Δθ можно вынести за скобку и получить, что работа равна сумме моментов от всех действующих сил, умноженной на Δθ. Эту сумму можно назвать полным моментом сил и обозначить τ. Как видите, моменты складываются по обычным законам алгебры, однако, как вы узнаете после, это происходит из-за того, что мы ограничиваемся только плоскими вращениями. Эта ситуация напоминает одномерное движение, в котором силы просто складываются алгебраически; ведь все они в этом случае действуют вдоль одной и той же прямой. В трехмерном пространстве все более сложно. Таким образом, для двумерного вращения
(18.12)
и
(18.13)
Нужно только помнить, что это справедливо лишь для вращения вокруг одной оси. Если брать различные оси, то все хi и yi изменятся, соответственно изменяются (обычно) и величины моментов.
Отвлечемся теперь на минуту и заметим, что предыдущий способ введения момента дает очень важный результат для тела, находящегося в равновесии: если сбалансированы все силы, действующие на объект, и перемещающие и вращающие, то нужно, чтобы не только полная сила была равна нулю, но и полный момент, так как при малом перемещении объекта, находящегося в равновесии, никакой работы не производится. Следовательно, из того, что ΔW=τΔθ=0, можно заключить, что сумма всех моментов должна быть равна нулю. Таким образом, для равновесия необходимо выполнение двух условий: а) сумма всех сил равна нулю и б) сумма всех моментов тоже равна нулю. Попробуйте доказать сами, что в двумерном случае достаточно равенства нулю суммы моментов сил относительно какой-либо одной оси.
Вернемся теперь к случаю одной силы, действующей на тело, и попытаемся выяснить, что же геометрически означает странное выражение xFy-yFx. На фиг. 18.2 вы видите силу F, приложенную в точке Р.
Фиг. 18.2. Вращающий момент, создаваемый силой.
Когда тело поворачивается на малый угол Δθ, то естественно, что произведенная при этом работа равна составляющей в направлении перемещения, умноженной на величину перемещения. Иначе говоря, работает только тангенциальная составляющая силы, которая умножается на расстояние rΔθ. Поэтому момент равен тангенциальной составляющей силы (перпендикулярной к радиусу), умноженной на радиус. Это хорошо согласуется с нашим первоначальным понятием момента, потому что полностью радиальная сила не может крутить тело. Крутящее действие силы, очевидно, происходит только от той ее части, которая не тянет тело от центра. Она и называется тангенциальной составляющей. Ясно, кроме того, что данная сила закручивает тело тем сильнее, чем дальше от центра она приложена. Попробуйте раскрутить тело давлением прямо на его ось! Таким образом, тот факт, что момент силы пропорционален как радиальному расстоянию, так и тангенциальной составляющей силы, имеет свой смысл.
Существует еще третье, очень интересное выражение для момента силы. Как вы только что узнали, момент силы равен силе, умноженной на радиус и на синус угла α (см. фиг. 18.2). Если теперь продолжить линию действия силы и провести прямую, перпендикулярную к ней, то нетрудно видеть, что длина OS (она часто называется плечом силы) во столько раз короче радиуса, во сколько тангенциальная составляющая силы меньше полной ее величины. Поэтому можно записать, что момент равен произведению величины силы на длину ее плеча.
Мы не знаем точно, откуда произошел термин «момент силы» — по-видимому, от латинского movimentum, что означает способность силы двигать объект (используя какой-либо рычаг), тем более заметную, чем длинней плечо силы. Кстати, в математике слово «момент» означает усреднение с весом, в качестве которого взято расстояние до оси.
§ 3. Момент количества движения
Хотя до сих пор мы рассматривали только специальный случай твердого тела, свойства момента и его математическое выражение интересны даже тогда, когда тело не твердое. Можно доказать очень интересную теорему: подобно тому как внешняя сила равна скорости изменения величины р, которая называется полным импульсом системы частиц, так и момент силы равен скорости изменения некоторой величины L, называемой моментом количества движения, или угловым моментом группы частиц.
Чтобы доказать это, рассмотрим систему частиц, на которую действуют силы, и посмотрим, что произойдет с системой в результате действия вращающих моментов, созданных этими силами. Для начала давайте возьмем только одну частицу. Такая частица с массой m и осью О изображена на фиг. 18.3.
Фиг. 18.3. Движение частиц относительно оси вращения С
Она не обязательно должна вращаться по окружности вокруг оси О, а может двигаться и по эллипсу, подобно планете вокруг Солнца, или по какой-нибудь другой кривой. Главное то, что она движется, что на нее действует сила, которая ускоряет ее в соответствии с обычными законами: x-компонента силы равна массе, умноженной на x-компоненту ускорения, и т. д. Но посмотрим теперь, как действует момент силы. Он, как вы знаете, равен xFy-yFx, а х- и у-компоненты силы в свою очередь равны массе, умноженной соответственно на х- и y-компоненту ускорения, так что
(18.14)
Хотя сразу и не видно, что это выражение является производной от какой-то простой величины, но на самом деле оно равно производной от xm(dy/dt)-ym(dx/dt). Действительно,
(18.15)
Оказывается, таким образом, что момент силы равен скорости изменения со временем некоторой величины! Давайте обратим внимание на эту величину и прежде всего дадим ей имя. Она будет называться моментом количества движения, или угловым моментом, и обозначаться буквой L
(18.16)
Хотя во всех наших рассмотрениях мы не принимали в расчет теорию относительности, тем не менее второе выражение для L верно и при учете ее. Итак, мы нашли, что у обычного импульса также существует вращательный аналог — угловой момент, который связан с компонентами импульса точно так же, как и момент силы связан с компонентами силы! Так что если мы хотим вычислить момент количества движения относительно какой-то оси, то должны взять тангенциальную составляющую импульса и умножить ее на радиус. Другими словами, угловой момент показывает, насколько быстро движется частица вокруг какого-то центра, ведь он учитывает только тангенциальную часть импульса. Более того, чем дальше от центра удалена линия, по которой направлен импульс, тем больше будет угловой момент. Точно так же, поскольку геометрия в этом случае та же, что и в случае момента силы, существует плечо импульса (оно, разумеется, не совпадает с плечом силы, действующей на частицу), которое равно расстоянию линии импульса от оси. Таким образом, угловой момент равен просто величине импульса, умноженного на его плечо. Точно так же, как и для момента силы, для углового момента мы можем написать следующие три формулы:
(18.17)
Момент количества движения, как и момент силы, зависит от положения оси, относительно которой он вычисляется.
Прежде чем перейти к рассмотрению более чем одной частицы, применим полученные выше результаты к движению планеты вокруг Солнца. В каком направлении действует сила? Конечно, по направлению к Солнцу. А какой при этом будет момент силы? Разумеется, все зависит от того, в каком месте мы выберем ось, однако результат получится совсем простым, если в качестве точки вращения выбрать само Солнце. Поскольку момент силы равен силе, умноженной на ее плечо, или компоненте силы, перпендикулярной к радиусу r, умноженной на r, то в этом случае нет никакой тангенциальной составляющей силы, а поэтому момент силы относительно оси, проходящей через Солнце, равен нулю. Следовательно, момент количества движения должен оставаться постоянным. Давайте-ка посмотрим, что это означает. Произведение тангенциальной компоненты скорости на массу и радиус, будучи моментом количества движения, должно оставаться постоянным, потому что скорость его изменения есть момент силы, который в нашем случае равен нулю. Это означает, что остается постоянным произведение тангенциальной компоненты скорости на радиус, поскольку масса-то уж, конечно, не изменяется. Но такая величина, характеризующая движение планеты, уже вычислялась нами раньше. Предположим, что мы взяли маленький промежуток времени Δt. Какое расстояние пройдет планета при своем движении из точки Р в точку Q (фиг. 18.3)? Как велика площадь той области, которую «заметает» прямая, соединяющая планету с Солнцем? Пренебрегая площадью QQ'P, которая очень мала по сравнению с OPQ, находим, что площадь этой области равна половине основания PQ, умноженного на высоту OR. Другими словами, «заметенная» площадь равна половине произведения скорости на ее плечо. Так что скорость изменения этой площади пропорциональна моменту количества движения, который остается постоянным. Итак, мы получим, что закон Кеплера о равных площадях за равные промежутки времени является просто словесным описанием закона сохранения момента количества движения, когда моменты внешних сил отсутствуют.
§ 4. Закон сохранения момента количества движения
Посмотрим теперь, что получается в случае большого количества частиц, т. е. когда тело состоит из множества частичек со множеством сил, действующих между ними и извне. Разумеется, мы уже знаем, что момент силы, действующий на любую i-ю частицу (т. е. произведение силы, действующей на i-ю частицу, на ее плечо), равен скорости изменения момента количества движения этой частицы, а момент количества движения i-й частицы в свою очередь равен произведению импульса частицы на его плечо. Допустим теперь, что мы сложили моменты сил τi- всех частиц и назвали это полным моментом сил τ. Эта величина должна быть равна скорости изменения суммы моментов количества движения всех частиц Li. Эту сумму можно принять за определение новой величины, которую мы назовем полным моментом количества движения L. Точно так же, как импульс тела равен сумме импульсов составляющих его частиц, момент количества движения тела тоже равен сумме моментов составляющих его частиц. Таким образом, скорость изменения полного момента количества движения L равна полному моменту сил
(18.18)
С непривычки может показаться, что полный момент сил — ужасно сложная штука. Ведь нужно учитывать все внутренние и внешние силы. Однако если мы вспомним, что по закону Ньютона силы действия и противодействия не только равны, но и (что особенно важно!) действуют по одной и той же прямой в противоположных направлениях (неважно, говорил ли об этом сам Ньютон или нет, неявно он подразумевал это), то два момента внутренних сил между двумя взаимодействующими частицами должны быть равны друг другу и направлены противоположно, поскольку для любой оси плечи их будут одинаковы. Поэтому все внутренние моменты сил взаимно сокращаются и получается замечательная теорема: скорость изменения момента количества движения относительно любой оси равна моменту внешних сил относительно этой же оси!
(18.19)
Итак, мы получили в руки мощную теорему о движении большого коллектива частиц, которая позволяет нам изучать общие свойства движения, не зная деталей его внутреннего механизма. Эта теорема верна для любого набора частиц, независимо от того, образуют ли они твердое тело или нет.
Особенно важным частным случаем этой теоремы является закон сохранения, момента количества движения, который гласит: если на систему частиц не действуют никакие внешние моменты сил, то ее момент количества движения остается постоянным.
Рассмотрим один очень важный частный случай набора частиц, когда они образуют твердое тело, т. е. объект, который всегда имеет определенную форму и геометрический размер и может только крутиться вокруг какой-то оси. Любая часть такого объекта в любой момент времени расположена одинаковым образом относительно других его частей. Попытаемся теперь найти полный момент количества движения твердого тела. Если масса i-й частицы его равна mi, а положение ее (xi,yi), то задача сводится к определению момента количества движения этой частицы, поскольку полный момент количества движения равен сумме моментов количества движения всех таких частиц, образующих тело. Для движущейся по окружности точки момент количества движения равен, конечно, произведению ее массы на скорость и на расстояние до оси вращения, а скорость в свою очередь равна угловой скорости, умноженной на расстояние до оси:
(18.20)
Суммируя li для всех частиц, получаем
(18.21)
где
(18.22)
Это выражение очень похоже на формулу для импульса, который равен произведению массы на скорость. Скорость при этом заменяется на угловую скорость, а масса, как видите, заменяется на некоторую новую величину, называемую моментом инерции I. Вот что играет роль массы при вращении! Уравнения (18.21) и (18.22) говорят нам, что инерция вращения тела зависит не только от масс составляющих его частичек, но и от того, насколько далеко расположены они от оси. Так что если мы имеем два тела равной массы, но в одном из них массы расположены дальше от оси, то его инерция вращения будет больше. Это легко продемонстрировать на устройстве, изображенном на фиг. 18.4.
Фиг. 18.4. Зависимость «инерции вращения» от плеча масс.
Масса M в этом устройстве не может падать слишком быстро, потому что она должна крутить тяжелый стержень. Расположим сначала массы m около оси вращения, причем грузик M будет как-то ускоряться. Однако после того, как мы изменим момент инерции, расположив массы m гораздо дальше от оси, мы увидим, что грузик M ускоряется гораздо медленнее, чем прежде. Происходит это вследствие возрастания инертности вращения, которая составляет физический смысл момента инерции — суммы произведений всех масс на квадраты их расстояний от оси вращения.
Между массой и моментом инерции имеется существенная разница, которая проявляется удивительным образом. Дело в том, что масса объекта обычно не изменяется, тогда как момент инерции легко изменить. Представьте себе, что вы встали на стол, который может вращаться без трения, и держите в вытянутых руках гантели, а сами медленно вращаетесь. Можно легко изменить момент инерции, согнув руки; при этом наша масса останется той же самой. Когда мы проделаем все это, то закон сохранения момента количества движения будет творить чудеса, произойдет нечто удивительное. Если моменты внешних сил равны нулю, то момент количества движения равен моменту инерции I1, умноженному на угловую скорость ω1, т. е. ваш момент количества движения равен I1ω1. Согнув затем руки, вы тем самым уменьшили момент инерции до величины I2. Но поскольку из-за закона сохранения момента количества движения произведение Iω должно остаться тем же самым, то I1ω1 должно быть равно I2ω2. Так что если вы уменьшили момент инерции, то ваша угловая скорость в результате этого должна возрасти.
Глава 19 ЦЕНТР МАСС; МОМЕНТ ИНЕРЦИИ
§ 1. Свойства центра масс
В предыдущей главе мы установили факт существования некоторой замечательной точки, называемой центром масс. Она замечательна тем, что если на частицы, образующие тело (неважно, будет ли оно твердым или жидким, звездным скоплением или чем-то другим), действует великое множество сил (конечно, имеются в виду только внешние силы, поскольку все внутренние силы компенсируют друг друга), то результирующая сила приводит к такому ускорению этой точки, как будто в ней сосредоточена вся масса тела М. Давайте теперь обсудим свойство центра масс несколько подробнее.
Положение центра масс (сокращенно ц. м.) определяется уравнением
(19.1)
Это, разумеется, векторное уравнение, т. е. фактически три уравнения — по одному для каждого из трех направлений. Но мы будем рассматривать только x-направление; если вы поймете, что происходит в x-направлении, то поймете и два остальных. Что означает равенство Хц.м.=∑mixi/∑mi? Предположим на минуту, что тело разделено на маленькие кусочки с одинаковой массой m, причем полная масса будет равна числу таких кусочков N, умноженному на массу одного кусочка, скажем 1 г, или какую-то другую единицу. Тогда наше уравнение просто означает, что нужно взять координаты х всех кусочков, сложить их и результат разделить на число кусочков, т. е. Xц.м.=m∑xi/mN=∑xi/N. Иными словами, если массы кусочков равны, то Хц.м.- будет просто средним арифметическим x-координат всех кусочков. Но предположим, что один из кусочков вдвое тяжелее, чем каждый из остальных. Тогда в нашу формулу его координата будет входить с коэффициентом 2, т. е. в суммах ее нужно учитывать дважды. Нетрудно понять, почему это происходит. Ведь тяжелый кусочек можно представить себе как бы состоящим из двух легких, таких же, как и все остальные, так что, когда мы вычисляем среднее, его координату х нужно учитывать дважды: ведь кусочков-то в этом месте два. Таким образом, Xц.м. равно просто среднему арифметическому х-координат всех масс, причем каждая координата считается некоторое число раз, пропорциональное массе, как будто она разделена на маленькие кусочки единичной массы. Исходя из этого, легко доказать, что Хц.м. должна находиться где-то между самой близкой и самой далекой частичкой. Вообще центр масс должен лежать где-то внутри многогранника, проведенного через крайние точки тела. Однако вовсе не обязательно, чтобы центр масс находился в самом теле; ведь могут быть тела, подобные окружности, например обруч, центр масс которого находится в геометрическом центре, а не на самом обруче.
Конечно, если объект симметричен, например прямоугольник, обладающий линией симметрии, то его центр масс должен лежать где-то на этой линии. Кстати, прямоугольник имеет еще одну линию симметрии и это однозначно определяет положение его центра масс. Для просто симметричного объекта центр масс должен лежать где-то на оси симметрии: ведь отрицательных х в этом случае ровно столько же, сколько и положительных.
Существует еще один очень забавный способ нахождения центра масс. Вообразите себе тело, состоящее из двух кусков А и В (фиг, 19.1).
Фиг. 19.1. Центр масс сложного тела лежит на линии, соединяющей центры масс двух составляющих его частей.
Центр масс в этом случае можно найти следующим образом. Находим сначала отдельно центры масс составных частей А и В и их полные массы МА и МB. После этого находим центр масс двух точечных тел, одно из которых имеет массу МА и расположено в центре масс части А, а другое — массу МB и расположено в центре масс части В. Полученная точка и будет центром масс всего тела. Другими словами, если нам известны центры масс всех частей сложного тела, то, чтобы найти его центр масс, не нужно повторять все сначала, а достаточно просто найти центр масс системы точечных тел с массами, равными массам каждой из частей и расположенными в их центрах масс. Посмотрим, как это получается.
Пусть мы хотим определить центр масс сложного тела, одни из частиц которого принадлежат части А, а другие — части В. При этом мы можем разбить полную сумму ∑mixi на сумму по части А, т. е. ∑Amixi и сумму по части В, т. е. ∑Bmixi. Если бы мы находили центр масс только части А, то нам потребовалась бы первая из этих сумм, которая, как вы знаете, равна МАХА, т. е. полной массе части А на x-координату ее центра масс: это просто следствие теоремы о центре масс, примененной к части A. То же самое можно сказать и о части В. Сумма ∑Bmixi должна быть равна МВХВ. Сложив эти два результата, мы, конечно, должны получить MX, т. е.
(19.2)
Полная же масса М, очевидно, равна МА+МB, так что выражение (19.2) представляет собой не что иное, как определение центра масс двух точек, одна из которых имеет массу МА и координату ХА, а другая — массу МB и координату ХB.
Теорема о движении центра масс интересна не только сама по себе, она еще играет очень важную роль в развитии нашего понимания физики. Если мы предположим, что законы Ньютона верны только для маленьких частей, составляющих большое тело, то эта теорема показывает, что они верны также и для большого тела. Мы можем не знать его детального строения и нам известны лишь общая масса и полная сила, действующая на него. Другими словами, законы Ньютона имеют ту особенность, что если они справедливы в малом масштабе, то справедливы и в большом. Нет никакой нужды рассматривать футбольный мяч как ужасно сложную вещь, состоящую из мириада взаимодействующих частиц, а достаточно изучить только движение его центра масс под действием внешней силы F, чтобы получить F=ma, где а — ускорение центра масс, а m — полная масса мяча. Итак, закон F=ma воспроизводит сам себя в большом масштабе. (Наверное, должно быть какое-нибудь хорошее греческое слово, которым можно было бы назвать подобные воспроизводящие себя в большом масштабе законы.)
Нетрудно, конечно, догадаться, что первый открытый человеком закон должен быть именно таким законом, воспроизводящим самого себя в большом масштабе. Почему? Да просто потому, что истинный размер фундаментальных «винтиков и колесиков» Вселенной есть атомный размер, который настолько меньше размеров окружающих нас вещей, что только сейчас начинает входить в обычную жизнь. Итак, первая открытая человеком закономерность не могла иметь отношения к размерам атомного масштаба. Если бы законы для малых частиц не воспроизводили себя в большом масштабе, то открыть их было бы не так-то легко. А что можно сказать об обратной проблеме? Должны ли законы микромира быть теми же самыми, что и для больших тел? Никакой необходимости в этом, конечно, нет.
Давайте, однако, предположим, что истинное движение атомов описывается неким странным уравнением, которое не воспроизводит себя при переходе к большему масштабу. Вместо этого оно обладает тем свойством, что при таком переходе его можно приближенно заменить каким-то выражением, которое при все большем и большем увеличении масштаба воспроизводит само себя. Это вполне может случиться, и в действительности так оно и происходит. Законы Ньютона являются как бы «кончиком хвоста» атомных законов, продолженных до очень больших размеров. Истинные законы движения частиц очень малых размеров весьма специфичны, но если мы возьмем большое число частиц и скомбинируем законы их движения, то приближенно, и только приближенно, получим законы Ньютона. После этого законы Ньютона позволяют нам двигаться ко все большим размерам, оставаясь при этом теми же самыми законами. В сущности, при переходе ко все большим и большим размерам они все точнее и точнее описывают природу. Так что факт самовоспроизводимости законов Ньютона — отнюдь не фундаментальное свойство природы, а важная историческая особенность.
Основываясь на своих первых наблюдениях, мы никоим образом не смогли бы открыть фундаментальные атомные законы, поскольку наблюдения эти были слишком грубыми. Действительно, фундаментальные атомные законы, которые мы называем квантовой механикой, так сильно отличаются от законов Ньютона, что понять их не просто. Ведь у нас есть только опыт обращения с телами больших размеров, а крохотные атомы ведут себя совершенно невиданным для таких тел образом. Мы не можем сказать: «Электроны в атомах напоминают планеты, крутящиеся вокруг Солнца», или что-то в этом роде. Они не похожи ни на что известное нам, ибо мы не видим ничего похожего на них. Если мы применяем квантовую механику ко все большим и большим объектам, то законы поведения такого коллектива атомов не воспроизводят поведения одного атома, а дают новый закон — закон Ньютона, который уже воспроизводит сам себя, начиная с объектов весом в 1 миллионную микрограмма, содержащих еще миллиарды и миллиарды атомов, и вплоть до тел величиной с Землю и даже еще больших.
Вернемся, однако, к центру масс. Часто его называют центром тяжести, так как во многих случаях для силы тяготения можно провести точно такие же рассуждения, как и для масс. Если размеры достаточно малы, то силу тяжести можно считать не только пропорциональной массе, но и направленной всюду параллельно некоторой фиксированной линии.
Возьмем тело, в котором сила тяжести действует на каждую из составляющих его частей, а mi — масса одной из этих частей. Действующая на нее сила тяжести будет тогда равна произведению mi на g. Возникает вопрос: в какой точке нужно приложить одну-единственную силу, чтобы сбалансировать притяжение всего тела так, чтобы оно (если это твердое тело) не вращалось? Ответ: сила должна проходить через центр масс. Доказывается это следующим образом. Чтобы тело не вращалось, сумма моментов всех сил должна быть равна нулю, ибо если нет момента сил, то нет и изменения момента количества движения, а поэтому нет и вращения. Таким образом, мы должны подсчитать сумму всех моментов, действующих на все частицы, и посмотреть, какой получится полный момент относительно любой данной оси: он должен быть равен нулю, если ось проходит через центр масс. Направив ось х горизонтально, а ось у вертикально, мы найдем, что моменты сил равны силам, направленным вниз, умноженным на плечо х (т. е. сила на плечо относительно той оси, для которой измеряется момент силы). Полный же момент равен сумме
(19.3)
Чтобы полный момент отсутствовал, сумма ∑mixi должна быть равна нулю. Но эта сумма равна MX — полной массе, умноженной на расстояние от оси х до центра масс. Итак, это расстояние должно быть равно нулю.
Разумеется, мы провели проверку только для x-направления, однако если мы действительно взяли центр масс, то тело должно быть уравновешено в любом положении, поэтому, повернув его на 90°, мы вместо оси х получим ось у. Другими словами, если держать тело за центр масс, то параллельное гравитационное поле не дает никакого момента сил. Если же объект настолько велик, что становится существенной непараллельность сил притяжения, то точку, в которой должна быть приложена уравновешивающая сила, описать не просто: она несколько отклоняется от центра масс. Вот почему нужно помнить, что центр масс и центр тяжести — разные вещи. Тот факт, что тело, поддерживаемое точно за центр масс, уравновешено в любом положении, имеет еще одно интересное следствие. Если вместо гравитационных сил взять инерционные псевдосилы, возникающие вследствие ускорения, то, чтобы найти точку, уцепившись за которую мы уравновесим все моменты этих сил, можно использовать ту же самую математическую процедуру. Предположим, что мы заключили тело внутрь ящика, который ускоряется вместе со всем его содержимым. Тогда, с точки зрения наблюдателя, сидящего в этом ящике, на тело вследствие инерции будет действовать некая эффективная сила. Иначе говоря, чтобы заставить тело двигаться вместе с ящиком, нужно подталкивать и ускорять его. Эта сила «уравновешивается силой инерции», которая равна массе тела, умноженной на ускорение ящика. Наблюдателю в ящике будет казаться, будто тело находится в однородном гравитационном поле, величина g которого равна ускорению ящика а. Таким образом, инерционные силы, возникающие вследствие ускорения тела, не имеют момента относительно центра масс.
Этот факт имеет очень интересное следствие. В инерционной системе, движущейся без ускорения, момент сил всегда равен скорости изменения момента количества движения. Однако равенство момента силы и скорости изменения момента количества движения остается справедливым даже для ускоряющегося тела, если взять ось, проходящую через центр масс. Таким образом, теорема о равенстве момента сил скорости изменения момента количества движения верна в двух случаях: 1) ось фиксирована — в инерциальной системе; 2) ось проходит через центр масс — даже когда тело ускоряется.
§ 2. Положение центра масс
Математическая техника вычисления центра масс относится к области курсов математики; там подобные задачи служат хорошими примерами по интегральному исчислению. Но, даже умея интегрировать, полезно знать некоторые трюки для вычисления положения центра масс. Один из таких трюков основан на использовании так называемой теоремы Паппа, которая работает следующим образом. Если мы возьмем какую-то замкнутую фигуру и образуем твердое тело, вращая эту фигуру в пространстве так, чтобы каждая точка двигалась перпендикулярно к плоскости фигуры, то объем образующегося при этом тела равен произведению площади фигуры на расстояние, пройденное ее центром тяжести! Разумеется, эта теорема верна и в том случае, когда плоская фигура движется по прямой линии, перпендикулярной к ее площади, однако если мы движем ее по окружности или какой-то другой кривой, то при этом получается гораздо более интересное тело. При движении по кривому пути внутренняя часть фигуры продвигается меньше, чем внешняя, и эти эффекты компенсируют друг друга. Так что если мы хотим определить центр масс плоской фигуры с однородной плотностью, то нужно помнить, что объем, образуемый вращением его относительно оси, равен расстоянию, которое проходит центр масс, умноженному на площадь фигуры.
Например, если нам нужно найти центр масс прямоугольного треугольника с основанием D и высотой H (фиг. 19.2), то это делается следующим образом.
Фиг. 19.2. Прямоугольный треугольник и прямой круговой конус, образованный вращением этого треугольника.
Вообразите себе ось, проходящую вдоль H, и поверните треугольник на 360° вокруг этой оси. Это дает нам конус. Расстояние, которое проходит x-координата центра масс, равно 2πх, а площадь области, которая двигалась, т. е. площадь треугольника, равна 1/2HD. Произведение расстояния, пройденного центром масс, на площадь треугольника равно объему конуса, т. е. 1/3πD2H. Таким образом, (2πх)(1/2HD)=1/3πD2H, или x=D/3. Совершенно аналогично вращением вокруг второго катета или просто по соображениям симметрии находим, что у=Н/3. Вообще центр масс любого однородного треугольника находится в точке пересечения трех его медиан (линий, соединяющих вершину треугольника с серединой противоположной стороны), которая отстоит от основания на расстоянии, равном 1/3 длины каждой медианы.
Как это увидеть? Рассеките треугольник линиями, параллельными основанию, на множество полосок. Заметьте теперь, что медиана делит каждую полоску пополам, следовательно, центр масс должен лежать на медиане.
Возьмем теперь более сложную фигуру. Предположим, что требуется найти положение центра масс однородного полукруга, т. е. круга, разрезанного пополам. Где будет находиться центр масс в этом случае? Для полного круга центр масс расположен в геометрическом центре, но для полукруга найти его положение труднее. Пусть r — радиус круга, а x — расстояние центра масс от прямолинейной границы полукруга. Вращая его вокруг этого края как вокруг оси, мы получаем шар. При этом центр масс проходит расстояние 2πх, а площадь полукруга равна 1/2πr2 (половине площади круга). Так как объем шара равен, конечно, 4πr3/3, то отсюда находим
или
Существует еще другая теорема Паппа, которая фактически является частным случаем сформулированной выше теоремы, а потому тоже справедлива. Предположим, что вместо твердого полукруга мы взяли полуокружность, например кусок проволоки в виде полуокружности с однородной плотностью, и хотим найти ее центр масс. Оказывается, что площадь, которая «заметается» плоской кривой при ее движении, аналогичном вышеописанному, равна расстоянию, пройденному центром масс, умноженному на длину этой кривой. (Кривую можно рассматривать как очень узкую полоску и применять к ней предыдущую теорему.)
§ 3. Вычисление момента инерции
Рассмотрим теперь проблему определения момента инерции различных тел. Общая формула для нахождения момента инерции объекта относительно оси z имеет вид
или
(19.4)
Иными словами, нужно сложить все массы, умножив каждую из них на квадрат ее расстояния до оси (xi2+yi2). Заметьте, что это верно даже для трехмерного тела, несмотря на то, что расстояние имеет такой «двумерный вид». Впрочем, в большинстве случаев мы будем ограничиваться двумерными телами.
В качестве простого примера рассмотрим стержень, вращающийся относительно оси, проходящей через его конец и перпендикулярной к нему (фиг. 19.3).
Фиг. 19.3. Прямой стержень, вращающийся вокруг оси, проходящей через один из его концов.
Нам нужно просуммировать теперь все массы, умноженные на квадраты расстояния х (в этом случае все у — нулевые). Под суммой, разумеется, я имею в виду интеграл от x2, умноженный на «элементики» массы. Если мы разделим стержень на кусочки длиной dx, то соответствующий элемент массы будет пропорционален dx, а если бы dx составляло длину всего стержня, то его масса была бы равна М. Поэтому
и
(19.5)
Размерность момента инерции всегда равна массе, умноженной на квадрат длины, так что единственная существенная величина, которую мы вычислили, это множитель 1/3.
А чему будет равен момент инерции I, если ось вращения проходит через середину стержня? Чтобы найти его, нам снова нужно взять интеграл, но уже в пределах от -1/2L до +1/2L. Заметим, однако, одну особенность этого случая. Такой стержень с проходящей через центр осью можно представлять себе как два стержня с осью, проходящей через конец, причем масса каждого из них равна М/2, а длина равна L/2. Моменты инерции двух таких стержней равны друг другу и вычисляются по формуле (19.5). Поэтому момент инерции всего стержня равен
(19.6)
Таким образом, стержень гораздо легче крутить за середину, чем за конец.
Можно, конечно, продолжить вычисление моментов инерции других интересующих нас тел. Но поскольку такие расчеты требуют большого опыта в вычислении интегралов (что очень важно само по себе), они как таковые не представляют для нас большого интереса. Впрочем, здесь имеются некоторые очень интересные и полезные теоремы. Пусть имеется какое-то тело и мы хотим узнать его момент инерции относительно какой-то оси. Это означает, что мы хотим найти его инертность при вращении вокруг этой оси. Если мы будем двигать тело за стержень, подпирающий его центр масс так, чтобы оно не поворачивалось при вращении вокруг оси (в этом случае на него не действуют никакие моменты сил инерции, поэтому тело не будет поворачиваться, когда мы начнем двигать его), то для того, чтобы повернуть его, понадобится точно такая же сила, как если бы вся масса была сосредоточена в центре масс и момент инерции был бы просто равен I1=MR2ц.м., где Rц.м.— расстояние от центра масс до оси вращения. Однако формула эта, разумеется, неверна. Она не дает правильного момента инерции тела. Ведь в действительности при повороте тело вращается. Крутится не только центр масс (что давало бы величину I1), само тело тоже должно поворачиваться относительно центра масс. Таким образом, к моменту инерции I1 нужно добавить Iц — момент инерции относительно центра масс. Правильный ответ состоит в том, что момент инерции относительно любой оси равен
(19.7)
Эта теорема называется теоремой о параллельном переносе оси. Доказывается она очень легко. Момент инерции относительно любой оси равен сумме масс, умноженных на сумму квадратов х и у, т. е. I=∑mi(x2i+y2i). Мы сейчас сосредоточим наше внимание на х, однако все в точности можно повторить и для у. Пусть координата х есть расстояние данной частной точки от начала координат; посмотрим, однако, как все изменится, если мы будем измерять расстояние х' от центра масс вместо х от начала координат. Чтобы это выяснить, мы должны написать
Возводя это выражение в квадрат, находим
Что получится, если умножить его на mi и просуммировать по всем i? Вынося постоянные величины за знак суммирования, находим
Третью сумму подсчитать легко; это просто МХ2ц.м.. Второй член состоит из двух сомножителей, один из которых ∑mixi; он равен x'-координате центра масс. Но это должно быть равно нулю, ведь х' отсчитывается от центра масс, а в этой системе координат среднее положение всех частиц, взвешенное их массами, равно нулю. Первый же член, очевидно, представляет собой часть х от Iц. Таким образом, мы и приходим к формуле (19.7).
Давайте проверим формулу (19.7) на одном примере. Просто проверим, будет ли она применима для стержня. Мы уже нашли, что момент инерции стержня относительно его конца должен быть равен ML2/3. А центр масс стержня, разумеется, находится на расстоянии L/2. Таким образом, мы должны получить, что МL2/3=МL2/12+М(L/2)2. Так как одна четвертая+одна двенадцатая=одной третьей, то мы не сделали никакой грубой ошибки.
Кстати, чтобы найти момент инерции (19.5), вовсе не обязательно вычислять интеграл. Можно просто предположить, что он равен величине ML2, умноженной на некоторый неизвестный коэффициент γ. После этого можно использовать рассуждения о двух половинках и для момента инерции (19.6) получить коэффициент 1/4γ. Используя теперь теорему о параллельном переносе оси, докажем, что γ=1/4γ+1/4, откуда γ=1/3. Всегда можно найти какой-нибудь окольный путь!
При применении теоремы о параллельных осях важно помнить, что ось Iц должна быть параллельна оси, относительно которой мы хотим вычислять момент инерции.
Стоит, пожалуй, упомянуть еще об одном свойстве, которое часто бывает очень полезно при нахождении момента инерции некоторых типов тел. Оно состоит в следующем: если у нас есть плоская фигура и тройка координатных осей с началом координат, расположенным в этой плоскости, и осью z, направленной перпендикулярно к ней, то момент инерции этой фигуры относительно оси z равен сумме моментов инерции относительно осей х и у. Доказывается это совсем просто. Заметим, что
(поскольку все zi=0). Аналогично,
но
Момент инерции однородной прямоугольной пластинки, например с массой М, шириной w и длиной L относительно оси, перпендикулярной к ней и проходящей через ее центр, равен просто
поскольку момент инерции относительно оси, лежащей в плоскости пластинки и параллельной ее длине, равен Mw2/12, т. е. точно такой же, как и для стержня длиной w, а момент инерции относительно другой оси в той же плоскости равен ML2/12, такой же, как и для стержня длиной L.
Итак, перечислим свойства момента инерции относительно данной оси, которую мы назовем осью z:
1. Момент инерции равен
2. Если предмет состоит из нескольких частей, причем момент инерции каждой из них известен, то полный момент инерции равен сумме моментов инерции этих частей.
3. Момент инерции относительно любой данной оси равен моменту инерции относительно параллельной оси, проходящей через центр масс, плюс произведение полной массы на квадрат расстояния данной оси от центра масс.
4. Момент инерции плоской фигуры относительно оси, перпендикулярной к ее плоскости, равен сумме моментов инерции относительно любых двух других взаимно перпендикулярных осей, лежащих в плоскости фигуры и пересекающихся с перпендикулярной осью.
Таблица 19.1 простые примеры моментов инерции
В табл. 19.1 приведены моменты инерции некоторых элементарных фигур, имеющих однородную плотность масс, а в табл. 19.2 — моменты инерции некоторых фигур, которые могут быть получены из табл. 19.1 с использованием перечисленных выше свойств.
Таблица 19.2 моменты инерции, полученные из табл. 19.1
§ 4. Кинетическая энергия вращения
Продолжим изучение динамики вращения. При обсуждении аналогии между линейным и угловым движением в гл. 18 мы использовали теорему о работе, но ничего не говорили о кинетической энергии. Какова будет кинетическая энергия твердого тела, вращающегося вокруг некоторой оси с угловой скоростью ω? Используя нашу аналогию, можно немедленно угадать правильный ответ. Момент инерции соответствует массе, угловая скорость соответствует обычной скорости, так что кинетическая энергия должна быть равна 1/2 Iω2. Так оно и есть на самом деле, и сейчас мы покажем это. Предположим, что тело вращается вокруг некоторой оси, так что каждая точка движется со скоростью ωri, где ri — расстояние от данной точки до оси. Если масса этой точки равна mi, то полная кинетическая энергия всего тела равна просто сумме кинетических энергий всех частиц
а поскольку ω — постоянная, одна и та же для всех точек, то
(19.8)
В конце гл. 18 мы отмечали, что существуют очень интересные явления, связанные с вращением не абсолютно твердого тела, способного изменять свой момент инерции. Именно, в примере с вращающимся столом у нас был момент инерции I1 и угловая скорость ω1 при вытянутых руках. Согнув руки, мы изменили момент инерции до I2, а угловую скорость — до ω2. Так как у нас нет никаких моментов сил относительно оси вращения стола, то момент количества движения должен остаться постоянным. Это означает, что I1ω1=I2ω2. А что можно сказать об энергии? Это очень интересный вопрос. Согнув руки, мы начинаем вращаться быстрее, но момент инерции при этом уменьшается и может показаться, что кинетическая энергия должна остаться той же самой. Это, однако, неверно, потому что в действительности сохраняется Iω, а не Iω2. Сравним теперь кинетические энергии в начале и в конце. В начале кинетическая энергия равна 1/2/I1ω12=1/2Lω1, где L=I1ω1=I2ω2— момент количества движения. Точно таким же образом кинетическая энергия в конце равна Т=1/2Lω2, а поскольку ω2>ω1, то кинетическая энергия в конце оказывается большей, чем в начале. Итак, вначале, когда руки были вытянуты, мы вращались с какой-то кинетической энергией, затем, согнув руки, мы стали вращаться быстрее и наша кинетическая энергия возросла. А как быть с законом сохранения энергии? Ведь должен же кто-то произвести работу, чтобы увеличить энергию? Это сделали мы сами! Но когда, в какой момент? Когда мы держим гантели горизонтально, то никакой работы не производим. Выпрямляя руки в стороны и сгибая их, мы тоже не можем произвести никакой работы. Это, однако, верно только, пока нет никакого вращения! При вращении же на гантели действует центробежная сила. Они стремятся вырваться из наших рук, так что, сгибая во время вращения руки, мы преодолеваем противодействие центробежной силы. Работа, которая на это затрачивается, и составляет разницу в кинетических энергиях вращения. Вот откуда берется этот добавок.
Существует еще одно очень интересное явление, которое мы рассмотрим только описательно, чтобы просто иметь о нем представление. Хотя изучение этого явления требует несколько большего опыта, но упомянуть о нем стоит, ибо оно очень любопытно и дает много интересных эффектов.
Возьмем снова эксперимент с вращающимся столиком. Рассмотрим отдельно тело и руки, с точки зрения человека, вращающегося на столике. Согнув руки с гантелями, мы стали вращаться быстрее, но заметьте, что тело при этом не изменило своего момента инерции; тем не менее оно стало вращаться быстрее, чем прежде. Если бы мы провели вокруг тела окружность и рассмотрели только предметы внутри этой окружности, то их момент количества движения изменился бы; они закрутились бы быстрее. Следовательно, когда мы сгибаем руки, на тело должен действовать момент силы. Однако центробежная сила не может дать никакого момента, так как она направлена по радиусу. Это говорит о том, что среди сил, возникающих во вращающейся системе, центробежная сила не одинока: есть еще и другая сила. Эта другая сила носит название кориолисовой силы, или силы Кориолиса. Она обладает очень странным свойством: оказывается, что если мы во вращающейся системе двигаем какой-то предмет, то она толкает его вбок. Как и центробежная сила, эта сила кажущаяся. Но если мы живем во вращающейся системе и хотим что-то двигать по радиусу, то для этого мы должны тянуть его несколько вбок. Именно эта «боковая» сила создает момент, который раскручивает наше тело.
Перейдем теперь к формулам и покажем, как кориолисова сила работает на практике. Пусть Мик сидит на карусели, которая кажется ему неподвижной. С точки зрения Джо, который стоит на земле и знает истинные законы механики, карусель крутится. Предположим, что мы провели радиальную прямую на карусели и пусть Мик двигает прямо по этой линии какую-то массу. Я хочу показать, что для того, чтобы все было так, как мы описали, необходима боковая сила. Это можно увидеть, обратив внимание на момент количества движения вращающейся массы. Она крутится все время с одной и той же угловой скоростью ω, поэтому ее момент количества движения равен
Если масса расположена близко к центру, то он сравнительно мал, но если мы передвигаем ее в новое положение и если мы увеличиваем r, то масса m приобретает больший момент количества движения, т. е. во время движения по радиусу на нее должен действовать некоторый момент силы. (Чтобы на карусели двигаться по радиусу, нужно наклониться и толкаться вбок. Попробуйте как-нибудь сами проделать это.) Поскольку момент силы равен скорости изменения L во время движения массы m по радиусу, то
где через FK обозначена сила Кориолиса. В действительности мы хотели узнать, какую боковую силу должен прилагать Мик, чтобы двигать массу m со скоростью vr=dr/dt. Как видите, она равна FK=τ/r=2mωvr.
Теперь, имея формулу для кориолисовой силы, давайте рассмотрим несколько более подробно всю картину в целом. Как можно понять причину возникновения этой силы из элементарных соображений? Заметьте, что кориолисова сила не зависит от расстояния до оси и поэтому действует даже на оси! Оказывается, что легче всего понять именно силу, действующую на оси вращения. Для этого нужно просто посмотреть на все происходящее из инерциальной системы Джо, который стоит на земле. На фиг. 19.4 показаны три последовательных положения массы m, которая при t=0 проходит через ось.
Фиг. 19.4. Три последовательных положения движущейся по радиусу точки вращающегося столика.
Из-за вращения карусели масса, как мы видим, движется не по прямой линии, а по некоторому кривому пути, касающемуся диаметра в точке r=0. Но для того чтобы она двигалась по кривому пути, должна действовать ускоряющая сила. Это и есть кориолисова сила.
Однако с кориолисовой силой мы встречаемся не только в подобных ситуациях. Можно показать, что если предмет движется с постоянной скоростью по краю диска, то на него тоже действует кориолисова сила. Почему? Мик видит предмет движущимся со скоростью vм, а Джо видит его движущимся по окружности со скоростью vд=vм+ωr, поскольку предмет вдобавок переносится каруселью. Как мы уже знаем, действующая в этом случае сила будет, в сущности, полностью центробежной силой скорости vд, равной mv2Д/r. Но, с точки зрения Мика, она должна состоять из трех частей. Все это можно записать в следующем виде:
Итак, Fr — это сила, которую измеряет Мик. Попытаемся понять, откуда что берется. Может ли Мик признать первый член? «Конечно,— сказал бы он,— даже если бы я не вращался, то такая центробежная сила должна возникнуть, если побежать по кругу со скоростью vм». Итак, это просто центробежная сила, появления которой Мик ожидает и которая не имеет ничего общего с вращением карусели. Вдобавок Мик думает, что должна быть еще одна центробежная сила, действующая даже на неподвижные предметы на его карусели. Это дает третий член. Однако в дополнение к ним существует еще один член — второй, который опять равен 2mωvм. Раньше, при радиальной скорости, кориолисова сила FK была тангенциальна. Теперь же, при тангенциальной скорости, она радиальна. В самом деле, одно выражение отличается от другого только знаком. Сила всегда имеет одно и то же направление по отношению к скорости независимо от того, куда направлена скорость. Она действует под прямым углом к скорости и равна по величине 2mωv.
Глава 20 ВРАЩЕНИЕ В ПРОСТРАНСТВЕ
§ 1. Моменты сил в трехмерном пространстве
В этой главе мы рассмотрим одно из наиболее замечательных и забавных следствий законов механики — поведение крутящегося колеса. Для этого нам прежде всего нужно расширить математическое описание вращения, понятие момента количества движения, момента силы и т. д. на трехмерное пространство. Однако мы не будем использовать эти уравнения во всей их общности и изучать все следствия, ибо это займет многие годы, а нас ждут другие разделы, к которым мы вскоре должны перейти. В вводном курсе можно остановиться только на основных законах и их приложениях к весьма ограниченному числу особенно интересных случаев.
Прежде всего хочу отметить, что для вращения в трех измерениях твердого тела или какого-то иного объекта остается верным все, что мы получили для двух измерений. Иначе говоря, xFy-yFx так и остается моментом силы «в плоскости ху», или моментом силы «относительно оси z». Остается справедливым также, что этот момент силы равен скорости изменения величины хрy-урx; если вы вспомните вывод уравнения (18.15) из законов Ньютона, то увидите, что фактически мы не использовали того обстоятельства, что движение плоское, и просто дифференцировали величину хру-урx и получали xFy-yFx, так что эта теорема остается верной. Величину хру-урx мы называли моментом количества движения в плоскости ху, или моментом количества движения относительно оси z. Кроме плоскости ху, можно использовать другие пары осей и получить другие уравнения. Возьмем, например, плоскость yz. Уже из симметрии ясно, что если мы просто подставим у вместо х, а z вместо у, то для момента силы получим выражение yFz-zFy и ypz-zpy будет угловым моментом в этой плоскости. Разумеется, можно еще взять и плоскость zx и получить для нее
Совершенно ясно, что для движения одной частицы мы получаем и три уравнения для трех плоскостей. Более того, если мы складывали такие величины, как хру—урx, для многих частиц и называли это полным угловым моментом, то теперь у нас есть три сорта подобных выражений для трех плоскостей: ху, yz и zx, а сделав то же самое с моментами сил, мы можем также говорить и о полных моментах сил в этих плоскостях. Таким образом, появляются законы о том, что внешний момент сил в некоторой плоскости равен скорости изменения углового момента в той же плоскости. Это просто обобщение того, что писалось для двух измерений.
Однако теперь можно сказать: «Но ведь есть еще и другие плоскости. Разве нельзя в конце концов взять плоскость под каким-то углом и вычислять действующие в ней моменты сил. Для каждого такого случая нужно писать другие системы уравнений, так что в результате их наберется масса!» Здесь следует отметить очень интересное обстоятельство. Оказывается, что если мы в комбинации x'Fy'-y'Fx' для «косой» плоскости выразим величины x', Fy' и т. д. через их компоненты, то результат можно записать в виде некоторой комбинации трех моментов в плоскостях ху, yz и zx. В этом нет ничего нового. Другими словами, если нам известны три момента сил в плоскостях ху, yz и zx, то момент сил в любой другой плоскости, как и угловой момент, может быть записан в виде их комбинации: скажем, 6% одного, 92% другого и т. д. Этим свойством мы сейчас и займемся.
Пусть Джо для своих координатных осей x, y, z определял все моменты сил и все угловые моменты во всех плоскостях. Однако Мик направил свои оси х', у', z' по-другому. Чтобы немного облегчить задачу, предположим, что повернуты только оси x и y. Мик выбрал другие оси х' и у', а его ось z осталась той же самой. Это означает, что плоскости yz и zx у него новые, а поэтому моменты сил и угловые моменты у него тоже окажутся новыми. Например, его момент сил в плоскости х'у' окажется равным x'Fy'-y'Fx' и т. д. Следующая задача — найти связь между новыми и старыми моментами сил. Ее вполне можно решить, установив связь одного набора осей с другим. «Да это же напоминает то, что мы делали с векторами»,— скажете вы. Действительно, я собираюсь делать в точности то же самое. «А не вектор ли он, этот момент сил?» — спросите вы. Действительно, он — вектор, однако этого нельзя сказать просто так, без всякого математического анализа. Так что следующим этапом должен быть анализ. Однако мы не будем подробно обсуждать каждый шаг, а только покажем, как это все работает. Моменты сил, вычисленные Джо, равны
(20.1)
* * *
В этом месте мы сделаем отступление и заметим, что в подобных случаях, если оси координат выбраны неправильно, для некоторых величин получается неверный знак. Почему бы не написать τyz=zFy-yFz? Этот вопрос связан с тем обстоятельством, что система координат может быть либо «левая», либо «правая». Однако выбрав (произвольно) знак, скажем, у τxy, можно всегда определить правильное выражение для остальных двух величин путем замены по какой-либо из двух схем:
* * *
Теперь Мик подсчитывает моменты сил в своей системе.
(20.2)
Пусть одна система координат повернута на угол θ по отношению к другой, так что ось z осталась той же самой. (Угол θ ничего не имеет общего с вращением объекта или с чем-то происходящим внутри системы координат. Это просто связь между осями, используемыми одним человеком, и осями, используемыми другим. Мы предполагаем, что он остается постоянным.) При этом координаты в двух системах связаны так:
(20.3)
Точно таким же образом, поскольку сила является вектором, она преобразуется в новой системе координат так же, как x, y и z. Просто, по определению, объект называется вектором тогда и только тогда, когда различные его компоненты преобразуются как x, y и z
(20.4)
Теперь можно определить, как преобразуется момент силы. Для этого в уравнение (20.2) нужно просто подставить вместо х', у' и z' выражение (20.3), а для Fx', Fy', и Fz'-— выражение (20.4). В результате для τx'y' получается длинный ряд членов, но оказывается (и на первый взгляд это удивительно), что все сводится просто к выражению xFy-yFx, которое, как известно, является моментом силы в плоскости ху:
(20.5)
Результат совершенно ясен: ведь мы только повернули оси, лежащие в плоскости ху, при этом момент относительно оси z в этой плоскости не отличается от прежнего: ведь плоскость-то осталась той же самой! Более интересно выражение для τV'Z'. Здесь уже мы имеем дело с новой плоскостью. Если теперь повторить то же самое с плоскостью y'z', то получим
(20.6)
И наконец, для плоскости z'x'
(20.7)
Мы хотели найти правило для определения момента сил в новой системе через момент сил в старой и нашли его. Как можно запомнить это правило? Если внимательно посмотреть на уравнения (20.5)—(20.7), то нетрудно увидеть, что между ними и уравнениями для x, y и z существует тесная связь. Если каким-то образом мы бы могли назвать τxу z-компонентой чего-то, скажем z-компонентой вектора τ, то все было бы в порядке: уравнение (20.5) мы бы понимали как преобразование вектора τ, ибо z-компонента его, как это и должно быть, оставалась бы неизменной. Аналогично, если связать плоскость yz с x-компонентой новоиспеченного вектора, а плоскость zx с у-компонентой, то закон преобразования будет выглядеть так:
(20.8)
что в точности соответствует закону преобразования векторов.
Мы, следовательно, доказали, что комбинацию xFy-yFx можно отождествить с тем, что обычно называется z-компонентой некоторого искусственно введенного вектора. Хотя момент сил является своего рода «кручением» в плоскости и, казалось бы, не имеет векторного характера, математически он все-таки ведет себя как вектор. Этот вектор направлен под прямым углом к плоскости кручения, а его длина пропорциональна силе кручения. Три компоненты такой величины будут преобразовываться при вращении как самый настоящий вектор.
Итак, мы представляем момент силы в виде вектора. Согласно правилу, с каждой плоскостью, в которой он действует, мы связываем прямую, перпендикулярную к этой плоскости. Однако перпендикулярность к плоскости оставляет неопределенный знак вектора. Чтобы определить его, необходимо еще одно дополнительное правило, которое говорило бы нам, что если момент силы действует определенным образом в плоскости ху, то соответствующий ему вектор направлен «вверх» по оси z. Это означает, что предварительно кто-то должен сказать нам, где «право», а где «лево». Предположим, что система координат xyz правосторонняя; тогда правило должно быть таким: если представить себе кручение как ввертывание болта с правовинтовой резьбой, то направление вектора, связанного с этим кручением, определяется поступательным движением болта.
Почему же момент можно отождествить с вектором? А это счастливая случайность: с каждой плоскостью можно связать только одну ось и, следовательно, с моментом можно связать только один вектор. Это свойство — особенность трехмерного пространства. В двумерном пространстве, например, момент — самый обычный скаляр, не нуждающийся в направлении. В трехмерном пространстве он — вектор. Если бы у нас было четыре измерения, то возникло бы большое затруднение, ибо (если, например, в качестве четвертого измерения взять время) дополнительно к трем плоскостям xy, yz и zx появятся также плоскости tx, ty и tz. Всего, следовательно, получается шесть плоскостей, а представить шесть величин в виде одного четырехмерного вектора невозможно.
Однако нам еще долго предстоит оставаться в трехмерном пространстве, поэтому стоит отметить, что в предыдущих математических рассмотрениях совершенно не существенно то, что х — координата, а F — сила, а существен только закон преобразования векторов. Поэтому не будет никакой разницы, если мы вместо координаты х подставим x-компоненту любого другого вектора. Иначе говоря, если мы хотим вычислить величину axby-aybx, где а и b — векторы, и назвать ее z-компонентой некоторой новой величины cz, то эта величина будет вектором с. Было бы хорошо для такой связи трех компонент нового вектора с с векторами а и b придумать какое-то математическое обозначение. Для такой связи пользуются обозначением: c=a×b. Таким образом, в дополнение к обычному скалярному произведению в векторном анализе мы получили произведение нового сорта, так называемое векторное произведение. Итак, запись c=a×b это то же самое, что
(20.9)
Если переменить порядок векторов а и b, т. е. вместо a×b взять b×a, то знак вектора с при этом изменится, ибо cz равно bxау-bуаx. Векторное произведение поэтому не похоже на обычное умножение, для которого аb=bа. Для векторного произведения b×a=-a×b. Отсюда немедленно следует, что если а=b, то векторное произведение равно нулю, т. е. a×a=0.
Векторное произведение очень хорошо передает свойство вращения, поэтому важно понимать геометрическую связь векторов а, b и с. Связь между компонентами определяется уравнениями (20.9), исходя из которых можно получить следующие геометрические соотношения. Во-первых, вектор с перпендикулярен как к вектору а, так и к вектору b. (Попробуйте вычислить c×a и вы увидите, что в результате получится нуль.) Во-вторых, величина вектора с оказывается равной произведению абсолютных величин векторов b и а, умноженному на синус угла между ними. А куда направлен вектор с? Вообразите, что мы доворачиваем вектор а до вектора b в направлении угла, меньшего 180°; если крутить в ту же сторону болт с право-винтовой резьбой, то он должен двигаться в направлении вектора с. То, что мы берем правовинтовой болт, а не левовинтовой,— простая договоренность, которая постоянно напоминает нам, что в отличие от настоящих, «честных» векторов а и b вектор нового типа a×b по своему характеру слегка отличается от них, ибо строится он искусственно, по особому рецепту. У обычных векторов а и b, кроме того, есть специальное название: мы называем их полярными векторами. Примерами таких векторов служат координата r, сила F, импульс р, скорость v, электрическое поле Е и т. д. Все это обычные полярные векторы. Векторы же, содержащие одно векторное произведение обычных векторов, называются аксиальными векторами, или псевдовекторами. Примерами псевдовекторов, несомненно, могут служить момент силы τ и момент импульса L. Кроме того, оказывается, что угловая скорость ω, как и магнитное поле В, тоже псевдовектор.
Чтобы расширить наши сведения о математических свойствах векторов, нужно знать все правила их умножения, как векторного, так и скалярного. В настоящий момент нам нужны лишь очень немногие из них, однако в целях полноты мы выпишем все правила с участием векторного произведения. Впоследствии мы будем ими пользоваться. Эти правила таковы:
§ 2. Уравнения вращения в векторном виде
Возникает вопрос: можно ли с помощью векторного произведения записать какое-нибудь уравнение физики? Да, конечно, с его помощью записываются очень многие уравнения. Сразу же видно, например, что момент силы равен векторному произведению радиус-вектора на силу
(20.11)
Это просто краткая запись трех уравнений: τx=yFz-zFy и т. д. С помощью того же символа можно представить момент количества движения одной частицы в виде векторного произведения вектора расстояния от начала координат (радиус-вектора) на вектор импульса
(20.12)
Векторная форма динамического закона вращения в трехмерном пространстве напоминает уравнение Ньютона F=dp/dt; именно вектор момента силы равен скорости изменения со временем вектора момента количества движения
(20.13)
Если мы сложим (20.13) для многих частиц, то получим, что внешний момент сил, действующий на систему, равен скорости изменения полного момента количества движения
(20.14)
Еще одна теорема: если полный момент внешних сил равен нулю, то вектор полного момента количества движения системы остается постоянным. Эта теорема называется законом сохранения момента количества движения. Если на данную систему не действуют никакие моменты сил, то ее момент количества движения не изменяется.
А что можно сказать об угловой скорости? Вектор ли она? Мы уже рассматривали вращение твердого тела вокруг некоторой фиксированной оси, а теперь давайте на минуту предположим, что оно одновременно вращается вокруг двух осей. Тело может находиться, например, в коробке и вращаться там вокруг некоторой оси, а сама коробка в свою очередь вращается вокруг какой-то другой оси. Результатом же такого сложного движения будет вращение тела вокруг некоторой новой оси. Самое удивительное здесь то, что эта новая ось может быть найдена следующим образом. Если вращение в плоскости ху представить как вектор, направленный вдоль оси z, длина которого равна скорости вращения, а в виде другого вектора, направленного вдоль оси y, изобразить скорость вращения в плоскости, то, сложив их по правилу параллелограмма, получим результат, величина которого говорит о скорости вращения тела, а направление определяет плоскость вращения. Попросту говоря, угловая скорость в самом деле есть вектор, для которого скорость вращения в трех плоскостях представляет прямоугольные проекции на эти плоскости[15].
В качестве простого примера с использованием вектора угловой скорости подсчитаем мощность, затрачиваемую моментом сил, действующим на твердое тело. Так как мощность — это скорость изменения работы со временем, то в трехмерном пространстве она оказывается равной Р=τ·ω.
Все формулы, которые мы писали для плоского вращения, могут быть обобщены на три измерения. Если взять, например, твердое тело, вращающееся вокруг некоторой оси с угловой скоростью ω, то можно спросить: «Чему равна скорость точки с радиус-вектором r?» В качестве упражнения попытайтесь доказать, что скорость частицы твердого тела задается выражением v=ω×r, где ω — угловая скорость, а r — положение частицы. Другим примером векторного произведения служит формула для кориолисовой силы, которую можно записать как FK=2mv×ω. Иначе говоря, если в системе координат, вращающейся со скоростью ω, частица движется со скоростью v и мы все хотим описать через величины этой вращающейся системы, то необходимо добавлять еще псевдосилу FK.
§ 3. Гироскоп
Вернемся теперь снова к закону сохранения момента количества движения. Его можно продемонстрировать с помощью быстро вращающегося колеса, или гироскопа (фиг. 20.1).
Фиг. 20.1. Быстро вращающийся гироскоп. а — ось направлена горизонтально, момент количества движения относительно вертикальной оси равен пулю; б — ось направлена вертикально, момент количества движения относительно вертикальной оси должен остаться равным нулю; человек и стул крутятся в направлении, противоположном вращению колеса.
Если стать на крутящийся стул и держать вращающееся колесо в горизонтальном положении, то его момент количества движения будет направлен горизонтально. Момент количества движения относительно вертикальной оси нельзя изменить из-за фиксированного направления оси стула (трением пренебрегаем). Если теперь повернуть ось с колесом вертикально, то колесо приобретет момент количества движения относительно вертикальной оси. Однако система в целом (колесо, вы сами и стул) не может иметь вертикальной компоненты, поэтому вы вместе со стулом должны крутиться в направлении, обратном вращению колеса, чтобы скомпенсировать его.
Прежде всего давайте более подробно проанализируем явление, которое мы только что описали. Самое удивительное, в чем нам следует разобраться, это откуда берутся силы, раскручивающие нас вместе со стулом, когда мы поворачиваем ось гироскопа вертикально. На фиг. 20.2 показано колесо, быстро вращающееся вокруг оси у, т. е. его угловая скорость направлена по этой оси.
Фиг. 20.2. Гироскоп.
В ту же сторону направлен и момент количества движения. Предположим теперь, что мы хотим вращать колесо относительно оси х с малой угловой скоростью Ω; какая сила для этого требуется? Через малый промежуток времени Δt ось займет новое положение, отклонившись от горизонтального положения на угол Δθ. Поскольку основная часть момента количества движения происходит от вращения колеса (медленное вращение вокруг оси х дает очень малый вклад), мы видим, что вектор момента количества движения изменяется. Каково же изменение этого вектора? Он остается тем же самым по величине, однако направление его меняется на угол Δθ. Величина вектора ΔL поэтому равна ΔL=L0Δθ; в результате возникает момент силы, равный скорости изменения момента количества движения τ=ΔL/Δt=L0(Δθ/Δt)=L0Ω. Учитывая направление различных величин, мы видим, что
(20.15)
Таким образом, если Ω и L0 направлены горизонтально, как это показано на фигуре, то τ направлен вертикально. Чтобы уравновесить такой момент, к концам оси в горизонтальном направлении должны быть приложены силы F и -F. Откуда берутся эти силы, кто их прикладывает? Да мы сами, собственными руками, когда стараемся повернуть ось колеса в вертикальное положение. Но Третий закон Ньютона требует, чтобы равные и противоположно направленные силы (и равный, но противоположно направленный момент) действовали на нас. Они и заставляют нас крутиться вокруг вертикальной оси z в противоположном направлении.
Этот результат можно обобщить на быстро вращающийся волчок. В обычном вращающемся волчке сила тяжести, действующая на его центр масс (ц.м.), создает момент относительно точки соприкосновения волчка с полом (фиг. 20.3).
Фиг. 20.3. Быстро вращающийся волчок. Заметьте, что направление вектора момента силы совпадает с направлением прецессии.
Этот момент действует в горизонтальном направлении и заставляет волчок прецессировать, т. е. ось его будет описывать круговой конус вокруг вертикальной оси. Если Ω — угловая скорость прецессии (направленная вертикально), то мы снова находим
Таким образом, если к быстро вращающемуся волчку приложить момент сил, то возникнет прецессия в направлении этого момента, т. е. под прямым углом к силам, создающим момент.
Итак, теперь мы можем утверждать, что поняли прецессию гироскопа, и математически мы действительно поняли ее. Однако вся эта математика может показаться нам в каком-то смысле «колдовством». Между прочим, по мере углубления во все более сложную физику многие простые вещи легче вывести математически, чем действительно понять их фундаментальный или простой смысл. По мере того как вы будете переходить ко все более и более современным работам по физике, то обнаружите одно странное обстоятельство: математика дает результаты, которые никто не может понять непосредственно. В качестве примера можно взять уравнение Дирака, которое получается очень просто и красиво, но понять его следствия трудновато. В нашем частном случае прецессия волчка кажется чудом, каким-то тайнодействием с прямыми углами, окружностями, крутящимися силами и правовинтовыми болтами. Но давайте все-таки попытаемся понять ее физическую сущность.
Как можно объяснить этот момент сил с помощью реально действующих сил и ускорений? Заметьте, что, когда колесо прецессирует, частицы колеса в действительности не движутся уже в одной плоскости (фиг. 20.4).
Фиг. 20.4. Движение частицы вращающегося колеса, показанного на фиг. 20.2. При повороте оси эти частицы движутся по кривой линии.
Мы показали ранее (см. фиг. 19.4), что частица, которая пересекает ось прецессии, движется по кривому пути. Но для этого требуется какая-то боковая сила, которая возникает благодаря производимому нами давлению на ось колеса. Это давление по спицам передается частицам обода. «Постойте,— скажете вы,— а как относительно частиц на другой стороне колеса, которые движутся в обратном направлении?» Нетрудно догадаться, что действующие на них силы должны быть направлены в противоположную сторону, поэтому полная сила должна быть равна нулю. Таким образом, силы уравновешиваются, но одна из них приложена на одной стороне колеса, а другая — на другой. Эти силы можно было бы приложить непосредственно к колесу, однако из-за того, что колесо твердое, их можно приложить к оси, а через спицы они передаются на колесо.
До сих пор мы доказали, что, если колесо прецессирует, оно может скомпенсировать моменты сил, вызванные силой притяжения или какой-то другой причиной. Однако мы только показали, что прецессия есть одно из возможных решений уравнения. Другими словами, только при том условии, что действует момент и колесо запущено правильно, мы получим чистую прецессию. Но мы не доказали (и это вообще неверно), что чистая прецессия — наиболее общее движение вращающегося тела под действием момента сил. Общее движение включает, кроме того, какие-то колебания и отклонения от главной прецессии. Эти колебания называются нутацией.
Кое-кто любит говорить, что когда на гироскоп действует момент, то он поворачивается и прецессирует, что момент сил приводит к прецессии. Кажется очень странным, что, будучи запущенным, гироскоп не падает под действием силы тяжести, а движется вбок! Как это может случиться, что направленная вниз сила тяжести, которую мы хорошо знаем и чувствуем, заставляет его двигаться вбок? Ни одна из формул в мире, подобная (20.15), не скажет нам этого, потому что формула (20.15)— это особый случай, верный только тогда, когда прецессия гироскопа уже установилась. Если же говорить о деталях, то в действительности происходит следующее. Когда мы держим гироскоп за ось, так что он никак не может прецессировать (но сохраняет свое вращение), то на него не действуют никакие моменты сил, даже момент силы тяжести, поскольку своими пальцами мы компенсируем его. Но стоит только освободить ось, как в тот же момент на нее подействует момент силы тяжести. По простоте душевной каждый решит, что конец оси должен при этом падать, и он действительно начинает падать. Это можно просто видеть, если гироскоп вращается не слишком быстро.
Итак, как и ожидается, конец оси гироскопа действительно начинает падать. Но поскольку он падает, то, стало быть, он вращается и тем самым создает момент сил. Это сообщает оси гироскопа движение вокруг вертикальной оси такое же, как и при постоянной прецессии. Однако вскоре скорость начинает превышать скорость при постоянной прецессии, поэтому ось начинает подниматься вверх до прежнего уровня. В результате конец оси описывает циклоиду (кривую, которую описывает камень, застрявший в шине автомобиля). Обычно это очень быстрое, незаметное для глаз движение, к тому же оно скоро затухает благодаря трению в подшипниках, а выживает только «чистая» прецессия (фиг. 20.5).
Фиг. 20.5. Истинное движение конца оси гироскопа под действием силы тяжести тотчас же после его освобождения.
Однако чем медленнее крутится колесо, тем нутация более заметна.
После того как движение устанавливается, ось гироскопа оказывается несколько ниже, чем она была вначале. Почему? (Это более сложная деталь, и мы упоминаем о ней только для того, чтобы не оставлять у читателя впечатления, что гироскоп — это чудо. Он действительно удивительная штука, но все же не чудо.) Если мы держали ось абсолютно горизонтально, а затем внезапно отпустили ее, то с помощью уравнения прецессии мы можем установить, что ось начинает прецессировать, т. е. двигаться по кругу в горизонтальной плоскости. Но это невозможно! Хотя мы и не обращали на это внимания раньше, колесо обладает каким-то моментом инерции относительно прецессирующей оси, и если оно даже медленно вращается вокруг этой оси, то оно имеет слабый момент количества движения. Отчего это происходит? Ведь если опора идеальная (т. е. если нет никакого трения), то относительно вертикальной оси никакого момента сил не может возникнуть. Тогда каким же образом прецессия все же возникает, если нет никаких моментов? Ответ: движение по циклоиде конца оси стремится к среднему стационарному движению, которое эквивалентно движению центра катящегося колеса, т. е. он устанавливается несколько ниже горизонтали. По этой причине собственный угловой момент гироскопа имеет небольшую вертикальную компоненту, которая в точности компенсирует момент количества движения прецессии. Как видите, ось должна немного опуститься, немного поддаться силе тяжести, чтобы иметь возможность крутиться вокруг вертикальной оси. Так работает гироскоп.
§ 4. Момент количества движения твердого тела
Прежде чем расстаться с вопросом о вращении в трехмерном пространстве, обсудим еще, хотя бы качественно, некоторые неочевидные явления, возникающие при трехмерных вращениях.
Главное из них: момент количества движения твердого тела не обязательно направлен в ту же сторону, что и угловая скорость. Рассмотрим колесо, прикрепленное наклонно к оси, однако ось по-прежнему проходит через его центр тяжести (фиг. 20.6).
Фиг. 20.6. Момент количества движения вращающегося тела не обязательно параллелен угловой скорости.
Если вращать колесо вокруг оси, то всем известно, что из-за наклонной посадки оно будет трясти подшипники. Качественно мы знаем, что при вращении на колесо должна действовать центробежная сила, которая старается оттянуть его массу подальше от оси. Она старается выпрямить плоскость колеса так, чтобы оно было перпендикулярно к оси. Чтобы уравновесить это стремление, в подшипниках должен возникнуть момент сил. Но если в подшипниках возникает момент сил, то должна быть какая-то скорость изменения момента количества движения. Как может изменяться момент количества движения, если колесо просто вращается вокруг оси? Предположим, что мы разбили угловую скорость ω на компоненты ω1 и ω2 — перпендикулярную и параллельную плоскости колеса. Чему при этом будет равен момент количества движения? Так как моменты инерции относительно этих двух осей различны, то отношение компонент момента количества движения, которые (при таком частном выборе осей) равны произведениям моментов инерции на соответствующие компоненты угловых скоростей, отличается от отношения компонент угловой скорости. Поэтому вектор момента количества движения не направлен вдоль оси. Поворачивая вал, мы должны поворачивать и вектор момента количества движения, что приводит к возникновению момента силы, действующего на ось.
Момент инерции имеет еще одно очень важное и интересное свойство (я не буду доказывать его здесь, так как это очень сложно), которое легко описать и использовать. Наше предыдущее рассмотрение основано именно на этом свойстве. Оно состоит в следующем: любое твердое тело, даже неправильной формы, как, например, картошка, имеет такие три взаимно перпендикулярные проходящие через центр масс оси, что момент инерции относительно одной из них имеет наибольшую возможную величину из всех осей, проходящих через центр масс, а момент инерции относительно другой оси имеет наименьшую величину. Момент инерции относительно третьей имеет какую-то промежуточную величину между двумя первыми или равную одной из них. Эти оси, называемые главными осями тела, обладают тем важным свойством, что, если тело вращается вокруг одной из них, его момент количества движения имеет то же направление, что и угловая скорость. Если тело имеет оси симметрии, то направление главных осей совпадает с осями симметрии.
Если в качестве осей x, y и z выбрать главные оси тела и назвать соответствующие моменты инерции через A, B и C, то нетрудно подсчитать момент количества движения и кинетическую энергию вращения тела при любой угловой скорости ω (фиг. 20.7).
Фиг. 20.7. Угловая скорость и момент количества движения твердого тела (А>В>С),
Разлагая ω на компоненты ωx, ωy, и ωz по осям x, y и z и используя направленные вдоль этих осей единичные векторы i, j, k, можно записать момент количества движения в виде
(20.16)
причем кинетическая энергия будет равна
(20.17)
Глава 21 ГАРМОНИЧЕСКИЙ ОСЦИЛЛЯТОР
§ 1. Линейные дифференциальные уравнения
Обычно физику как науку делят на несколько разделов: механику, электричество и т. п., и мы «проходим» эти разделы один за другим. Сейчас, например, мы «проходим» в основном механику. Но то и дело происходят странные вещи: переходя к новым разделам физики и даже к другим наукам, мы сталкиваемся с уравнениями, почти не отличающимися от уже изученных нами ранее. Таким образом, многие явления имеют аналогию в совсем других областях науки. Простейший пример: распространение звуковых волн во многом похоже на распространение световых волн. Если мы достаточно подробно изучим акустику, то обнаружим потом, что «прошли» довольно большую часть оптики. Таким образом, изучение явлений в одной области физики может оказаться полезным при изучении других ее разделов. Хорошо с самого начала предвидеть такое возможное «расширение рамок раздела», иначе могут возникнуть недоумения, почему мы тратим столько времени и сил на изучение небольшой задачи механики.
Гармонический осциллятор, к изучению которого мы сейчас переходим, будет встречаться нам почти всюду; хотя мы начнем с чисто механических примеров грузика на пружинке, малых отклонений маятника или каких-то других механических устройств, на самом деле мы будем изучать некое дифференциальное уравнение. Это уравнение непрестанно встречается в физике и в других науках и фактически описывает столь многие явления, что, право же, стоит того, чтобы изучить его получше. Такое уравнение описывает колебания грузика на пружинке, колебания заряда, текущего взад и вперед по электрической цепи, колебания камертона, порождающие звуковые волны, аналогичные колебания электронов в атоме, порождающие световые волны. Добавьте сюда уравнения, описывающие действия регуляторов, например поддерживающих заданную температуру термостата, сложные взаимодействия в химических реакциях и (уже совсем неожиданно) уравнения, относящиеся к росту колонии бактерий, которых одновременно и кормят и травят ядом, или к размножению лис, питающихся кроликами, которые в свою очередь едят траву, и т. д. Мы привели очень неполный список явлений, которые описываются почти теми же уравнениями, что и механический осциллятор. Эти уравнения называются линейными дифференциальными уравнениями с постоянными коэффициентами. Это уравнения, состоящие из суммы нескольких членов, каждый из которых представляет собой производную зависимой величины по независимой, умноженную на постоянный коэффициент. Таким образом,
(21.1)
называется линейным дифференциальным уравнением n-го порядка с постоянными коэффициентами (все аn — постоянные).
§ 2. Гармонический осциллятор
Пожалуй, простейшей механической системой, движение которой описывается линейным дифференциальным уравнением с постоянными коэффициентами, является масса на пружинке. После того как к пружинке подвесят грузик, она немного растянется, чтобы уравновесить силу тяжести. Проследим теперь за вертикальными отклонениями массы от положения равновесия (фиг. 21.1).
Фиг. 21.1. Грузик, подвешенный на пружинке. Простой пример гармонического осциллятора.
Отклонения вверх от положения равновесия мы обозначим через х и предположим, что имеем дело с абсолютно упругой пружиной. В этом случае противодействующие растяжению силы прямо пропорциональны растяжению. Это означает, что сила равна -kx (знак минус напоминает нам, что сила противодействует смещениям). Таким образом, умноженное на массу ускорение должно быть равно -kx
(21.2)
Для простоты предположим, что вышло так (или мы нужным образом изменили систему единиц), что k/m=1. Нам предстоит решить уравнение
(21.3)
После этого мы вернемся к уравнению (21.2), в котором k и m содержатся явно.
Мы уже сталкивались с уравнением (21.3), когда только начинали изучать механику. Мы решили его численно [см. вып. 1, уравнение (9.12)], чтобы найти движение. Численным интегрированием мы нашли кривую (см. фиг. 9.4, вып. 1), которая показывает, что если частица m в начальный момент выведена из равновесия, но покоится, то она возвращается к положению равновесия. Мы не следили за частицей после того, как она достигла положения равновесия, но ясно, что она на этом не остановится, а будет колебаться (осциллировать). При численном интегрировании мы нашли время возврата в точку равновесия: t=1,570. Продолжительность полного цикла в четыре раза больше: t0=6,28 «сек». Все это мы нашли численным интегрированием, потому что лучше решать не умели. Но математики дали в наше распоряжение некую функцию, которая, если ее продифференцировать дважды, переходит в себя, умножившись на -1. (Можно, конечно, заняться прямым вычислением таких функций, но это много труднее, чем просто узнать ответ.)
Эта функция есть: x=cost. Продифференцируем ее: dx/dt=-sint, а d2x/dt2=-cost=-x. В начальный момент t=0, x=1, а начальная скорость равна нулю; это как раз те предположения, которые мы делали при численном интегрировании. Теперь, зная, что x=cost, найдем точное значение времени, при котором z=0. Ответ: t=π/2, или 1,57108. Мы ошиблись раньше в последнем знаке, потому что численное интегрирование было приближенным, но ошибка очень мала!
Чтобы продвинуться дальше, вернемся к системе единиц, где время измеряется в настоящих секундах. Что будет решением в этом случае? Может быть, мы учтем постоянные k и m, умножив на соответствующий множитель cost? Попробуем. Пусть x=Acost, тогда dx/dt=-Asint и d2t/dt2=-Acost=-x. К нашему огорчению, мы не преуспели в решении уравнения (21.2), а снова вернулись к (21.3). Зато мы открыли важнейшее свойство линейных дифференциальных уравнений: если умножить решение уравнения на постоянную, то мы снова получим решение. Математически ясно — почему. Если х есть решение уравнения, то после умножения обеих частей уравнения на А производные тоже умножатся на A и поэтому Ах так же хорошо удовлетворит уравнению, как и х. Послушаем, что скажет по этому поводу физик. Если грузик растянет пружинку вдвое больше прежнего, то вдвое возрастет сила, вдвое возрастет ускорение, в два раза больше прежней будет приобретенная скорость и за то же самое время грузик пройдет вдвое большее расстояние. Но это вдвое большее расстояние — как раз то самое расстояние, которое надо пройти грузику до положения равновесия. Таким образом, чтобы достичь равновесия, требуется столько же времени и оно не зависит от начального смещения. Иначе говоря, если движение описывается линейным уравнением, то независимо от «силы» оно будет развиваться во времени одинаковым образом.
Ошибка пошла нам на пользу — мы узнали, что, умножив решение на постоянную, мы получим решение прежнего уравнения. После нескольких проб и ошибок можно прийти к мысли, что вместо манипуляций с х надо изменить шкалу времени. Иначе говоря, уравнение (21.2) должно иметь решение вида
(21.4)
(Здесь ω0 — вовсе не угловая скорость вращающегося тела, но нам не хватит всех алфавитов, если каждую величину обозначать особой буквой.) Мы снабдили здесь ω индексом 0, потому что нам предстоит встретить еще много всяких омег: запомним, что ω0 соответствует естественному движению осциллятора. Попытка использовать (21.4) в качестве решения более успешна, потому что dx/dt=-ω0sinω0t и d2x/dt2=-ω02ωcosω0t=-ω02x. Наконец-то мы решили то уравнение, которое и хотели решить. Это уравнение совпадает с (21.2), если ω02=k/m.
Теперь нужно понять физический смысл ω0. Мы знаем, что косинус «повторяется» после того, как угол изменится на 2π. Поэтому x=cosω0t будет периодическим движением; полный цикл этого движения соответствует изменению «угла» на 2π. Величину ω0t часто называют фазой движения. Чтобы изменить ω0t на 2π, нужно изменить t на t0 (период полного колебания); конечно, t0 находится из уравнения ω0t0=2π. Это значит, что ω0t0 нужно вычислять для одного цикла, и все будет повторяться, если увеличить t на t0; в этом случае мы увеличим фазу на 2π. Таким образом,
(21.5)
Значит, чем тяжелее грузик, тем медленнее пружинка будет колебаться взад и вперед. Инерция в этом случае будет больше, и если сила не изменится, то ей понадобится большее время для разгона и торможения груза. Если же взять пружинку пожестче, то движение должно происходить быстрее; и в самом деле, период уменьшается с увеличением жесткости пружины.
Заметим теперь, что период колебаний массы на пружинке не зависит от того, как колебания начинаются. Для пружинки как будто безразлично, насколько мы ее растянем. Уравнение движения (21.2) определяет период колебаний, но ничего не говорит об амплитуде колебания. Амплитуду колебания, конечно, определить можно, и мы сейчас займемся этим, но для этого надо задать начальные условия.
Дело в том, что мы еще не нашли самого общего решения уравнения (21.2). Имеется несколько видов решений. Решение x=cosω0t соответствует случаю, когда в начальный момент пружинка растянута, а скорость ее равна нулю. Можно иначе заставить пружинку двигаться, например улучить момент, когда уравновешенная пружинка покоится (х=0), и резко ударить по грузику; это будет означать, что в момент t=0 пружинке сообщена какая-то скорость. Такому движению будет соответствовать другое решение (21.2) — косинус нужно заменить на синус. Бросим в косинус еще один камень: если x=cosω0t—решение, то, войдя в комнату, где качается пружинка, в тот момент (назовем его «t=0»), когда грузик проходит через положение равновесия (x=0), мы будем вынуждены заменить это решение другим. Следовательно, x=cosω0t не может быть общим решением; общее решение должно допускать, так сказать, перемещение начала отсчета времени. Таким свойством обладает, например, решение x=acosω0(t-t1), где t1 — какая-то постоянная. Далее, можно разложить
и записать
где A=acosΔ и В=-asinΔ. Каждую из этих форм можно использовать для записи общего решения (21.2): любое из существующих в мире решений дифференциального уравнения d2x/dt2=-ω20x можно записать в виде
(21.6а)
или
(21.6б)
или
(21.6в)
Некоторые из встречающихся в (21.6) величин имеют названия: ω0 называют угловой частотой; это число радианов, на которое фаза изменяется за 1 сек. Она определяется дифференциальным уравнением. Другие величины уравнением не определяются, а зависят от начальных условий. Постоянная а служит мерой максимального отклонения груза и называется амплитудой колебания. Постоянную Δ иногда называют фазой колебания, но здесь возможны недоразумения, потому что другие называют фазой ω0t+Δ и говорят, что фаза зависит от времени. Можно сказать, что Δ — это сдвиг фазы по сравнению с некоторой, принимаемой за нуль. Не будем спорить о словах. Разным Δ соответствуют движения с разными фазами. Вот это верно, а называть ли Δ фазой или нет — уже другой вопрос.
§ 3. Гармоническое движение и движение по окружности
Косинус в решении уравнения (21.2) наводит на мысль, что гармоническое движение имеет какое-то отношение к движению по окружности. Это сравнение, конечно, искусственное, потому что в линейном движении неоткуда взяться окружности: грузик движется строго вверх и вниз. Можно оправдаться тем, что мы уже решили уравнение гармонического движения, когда изучали механику движения по окружности. Если частица движется по окружности с постоянной скоростью v, то радиус-вектор из центра окружности к частице поворачивается на угол, величина которого пропорциональна времени. Обозначим этот угол θ=vt/R (фиг. 21.2).
Фиг. 21.2. Частица, движущаяся по кругу с постоянной скоростью.
Тогда dθ/dt=ω0=v/R. Известно, что ускорение а=v2/R=ω20R и направлено к центру. Координаты движущейся точки в заданный момент равны
Что можно сказать об ускорении? Чему равна x-составляющая ускорения, d2x/dt2. Найти эту величину можно чисто геометрически: она равна величине ускорения, умноженной на косинус угла проекции; перед полученным выражением надо поставить знак минус, потому что ускорение направлено к центру:
(21.7)
Иными словами, когда частица движется по окружности, горизонтальная составляющая движения имеет ускорение, пропорциональное горизонтальному смещению от центра. Конечно, мы знаем решения для случая движения по окружности: x=Rcosω0t. Уравнение (21.7) не содержит радиуса окружности; оно одинаково при движении по любой окружности при одинаковой ω0.
Таким образом, имеется несколько причин, по которым следует ожидать, что отклонение грузика на пружинке окажется пропорциональным cosω0t и движение будет выглядеть так, как если бы мы следили за x-координатой частицы, движущейся по окружности с угловой скоростью ω0. Проверить это можно, поставив опыт, чтобы показать, что движение грузика вверх-вниз на пружинке в точности соответствует движению точки по окружности. На фиг. 21.3 свет дуговой лампы проектирует на экран тени движущихся рядом воткнутой во вращающийся диск иголки и вертикально колеблющегося груза.
Фиг. 21.3. Демонстрация эквивалентности простого гармонического движения и равномерного движения по окружности.
Если вовремя и с нужного места заставить грузик колебаться, а потом осторожно подобрать скорость движения диска так, чтобы частоты их движений совпали, тени на экране будут точно следовать одна за другой. Вот еще способ убедиться в том, что, находя численное решение, мы почти вплотную подошли к косинусу.
Здесь можно подчеркнуть, что поскольку математика равномерного движения по окружности очень сходна с математикой колебательного движения вверх-вниз, то анализ колебательных движений очень упростится, если представить это движение как проекцию движения по окружности. Иначе говоря, мы можем дополнить уравнение (21.2), казалось бы, совершенно лишним уравнением для у и рассматривать оба уравнения совместно. Проделав это, мы сведем одномерные колебания к движению по окружности, что избавит нас от решения дифференциального уравнения. Можно сделать еще один трюк — ввести комплексные числа, но об этом в следующей главе.
§ 4. Начальные условия
Давайте выясним, какой смысл имеют А и В или а и Δ. Конечно, они показывают, как началось движение. Если движение начнется с малого отклонения, мы получим один тип колебаний; если слегка растянуть пружинку, а потом ударить по грузику — другой. Постоянные А и В или а и Δ, или какие-нибудь две другие постоянные определяются обстоятельствами, при которых началось движение, или, как обычно говорят, начальными условиями. Нужно научиться определять постоянные, исходя из начальных условий. Хотя для этого можно использовать любое из соотношений (21.6), лучше всего иметь дело с (21.6в). Пусть в начальный момент t=0 грузик смещен от положения равновесия на величину х0 и имеет скорость v0. Это самая общая ситуация, какую только можно придумать. (Нельзя задать начального ускорения, потому что оно зависит от свойств пружины; мы можем распорядиться только величиной х0.) Вычислим теперь А и В. Начнем с уравнения для
поскольку нам понадобится и скорость, продифференцируем х и получим
Эти выражения справедливы для всех t, но у нас есть дополнительные сведения о величинах х и v при t=0. Таким образом, если положить t=0, мы должны получить слева х0 и v0, ибо это то, во что превращаются х и v при t=0. Кроме того, мы знаем, что косинус нуля равен единице, а синус нуля равен нулю. Следовательно,
и
Таким образом, в этом частном случае
Зная А и В, мы можем, если пожелаем, найти а и Δ.
Итак, задача о движении осциллятора решена, но есть одна интересная вещь, которую надо проверить. Надо выяснить, сохраняется ли энергия. Если нет сил трения, то энергия должна сохраняться. Сейчас нам удобно использовать формулы
и
Давайте найдем кинетическую энергию Т и потенциальную энергию U. Потенциальная энергия в произвольный момент времени равна 1/2kx2, где х — смещение, а k — постоянная упругости пружинки. Подставляя вместо х написанное выше выражение, найдем
Разумеется, потенциальная энергия зависит от времени; она всегда положительна, это тоже понятно: ведь потенциальная энергия — это энергия пружины, а она изменяется вместе с х. Кинетическая энергия равна 1/2mv2; используя выражение для v, получаем
Кинетическая энергия равна нулю при максимальном х, ибо в этом случае грузик останавливается; когда же грузик проходит положение равновесия (x=0), то кинетическая энергия достигает максимума, потому что именно тогда грузик движется быстрее всего. Изменение кинетической энергии, таким образом, противоположно изменению потенциальной энергии. Полная энергия должна быть постоянной. Действительно, если вспомнить, что k=mω20, то
Энергия зависит от квадрата амплитуды: если увеличить амплитуду колебания вдвое, то энергия возрастет вчетверо. Средняя потенциальная энергия равна половине максимальной и, следовательно, половине полной; средняя кинетическая энергия также равна половине полной энергии.
§ 5. Колебания под действием внешней силы
Нам остается рассмотреть колебания гармонического осциллятора под действием внешней силы. Движение в этом случае описывается уравнением
(21.8)
Давайте подумаем, как будет вести себя грузик при этих обстоятельствах. Внешняя движущая сила может зависеть от времени каким угодно образом. Начнем с простейшей зависимости. Предположим, что сила осциллирует
(21.9)
Обратите внимание, что ω — это не обязательно ω0: будем считать, что можно изменять ω, заставляя силу действовать с разной частотой. Итак, надо решить уравнение (21.8) в случае специально подобранной силы (21.9). Каким будет решение (21.8)? Одно из частных решений (общим решением мы еще займемся) выглядит так:
(21.10)
где постоянную С еще надо определить. Иначе говоря, пытаясь найти решение в таком виде, мы предполагаем, что, если тянуть грузик взад и вперед, он в конце концов начнет качаться взад и вперед с частотой действующей силы. Проверим, может ли это быть. Подставив (21.10) в (21.9), получим
(21.11)
Мы уже заменили k на mω20, потому что удобнее сравнивать две частоты. Уравнение (21.11) можно поделить на содержащийся в каждом члене косинус и убедиться, что при правильно подобранном значении С выражение (21.10) будет решением. Эта величина С должна быть такой:
(21.12)
Таким образом, грузик m колеблется с частотой действующей на него силы, но амплитуда колебания зависит от соотношения между частотой силы и частотой свободного движения осциллятора. Если ω очень мала по сравнению с ω0, то грузик движется вслед за силой. Если же чересчур быстро менять направление толчков, то грузик начинает двигаться в противоположном по отношению к силе направлении. Это следует из равенства (21.12), которое говорит нам, что величина С отрицательна, если ω больше собственной частоты гармонического осциллятора ω0. (Мы будем называть ω0 собственной частотой гармонического осциллятора, а ω — приложенной частотой.) При очень высокой частоте знаменатель становится очень большим и грузик практически не движется.
Найденное нами решение справедливо только в том случае, когда уже установилось равновесие между осциллятором и действующей силой; это происходит после того, как вымрут другие движения. Эти вымирающие движения называют переходным откликом на силу F(t), а движение, описываемое (21.10) и (21.12),— равновесным откликом.
Приглядевшись к формуле (21.12), мы заметим любопытную вещь: если частота со почти равна ω0, то С приближается к бесконечности. Таким образом, если настроить силу «в лад» с собственной частотой, отклонения грузика достигнут гигантских размеров. Об этом знает всякий, кому когда-либо приходилось раскачивать ребенка на качелях. Это довольно трудно сделать, если закрыть глаза и беспорядочно толкать качели. Но если найти правильный ритм, то раскачать качели легко, однако, как только мы опять собьемся с ритма, толчки начнут тормозить качели и от такой работы будет мало проку.
Если частота ω будет в точности равна ω0, то амплитуда должна стать бесконечной, что, разумеется, невозможно. Мы ошиблись, потому что решали не совсем верное уравнение. Составляя уравнение (21.8), мы забыли о силе трения и о многих других силах. Поэтому амплитуда никогда не достигнет бесконечности; пожалуй, пружинка порвется гораздо раньше!
Глава 22 АЛГЕБРА
§ 1. Сложение и умножение
Изучая осциллятор, нам придется воспользоваться одной из наиболее замечательных, пожалуй самой поразительной из формул, какие можно найти в математике. Физик обычно расправляется с этой формулой примерно за две минуты, даже не обратив на нее внимания. Но наука ведь не только приносит практическую пользу, а служит источником удовольствия, поэтому давайте не будем торопиться проходить мимо этой драгоценности, а посмотрим, как она выглядит в великолепном окружении, которое обычно называют элементарной алгеброй.
Вы можете спросить: «Зачем нужна математика в книге по физике?» Вот несколько уважительных причин: прежде всего математика— очень важный рабочий инструмент, но этим можно оправдать затрату всего лишь двух минут на вывод этой формулы. Однако при изучении теоретической физики мы обнаруживаем, что все физические законы можно записать в виде математических формул, именно это придает законам простоту и красоту. Таким образом, глубокое понимание математических соотношений в конце концов необходимо для понимания природы. Но главная причина — это красота темы: ведь хотя люди разрезали природу на много кусков и продолжают кромсать ее, изучая очень много предметов на различных факультетах, такое разделение искусственно, и мы всегда будем получать наслаждение, собирая вместе отдельные куски.
Еще одна причина, по которой следует заняться поглубже алгеброй: хотя многие из вас уже знакомились с алгеброй в средней школе, но это было только первым знакомством и многие формулы еще непривычны, поэтому стоит еще раз вспомнить алгебру, чтобы не тратить на формулы столько же сил, сколько их уйдет на изучение самой физики.
То, чем мы займемся, с точки зрения математики, не будет настоящей алгеброй. Математик главным образом интересуется тем, как изложить то или иное математическое утверждение и какие предположения обязательны при выводе теоремы, а какие нет. Для нас важнее результат доказательства. Например, теорема Пифагора интересна для нас потому, что в ней сообщается, что сумма квадратов катетов прямоугольного треугольника равна квадрату гипотенузы; это очень интересный факт, и мы будем использовать его, не заботясь о том, действительно ли это доказанная Пифагором теорема или просто аксиома. В том же самом духе мы изложим элементарную алгебру, по возможности чисто качественно. Мы говорим элементарная алгебра потому, что существует ветвь математики, называемая высшей алгеброй, где может оказаться неверным, что ab=ba, но таких вещей мы касаться не будем.
Изучение алгебры начнем с середины. Предположим, что нам уже известно, что существуют целые числа, что есть нуль и что значит увеличить число на единицу. Не говорите, пожалуйста: «Вот так середина!», потому что для математика это середина, ведь он знает теорию множеств и может вывести все эти свойства целых чисел. Но мы не будем вторгаться в область философии математики и математической логики, а ограничимся предположением, что нам известны целые числа и мы умеем считать. Если взять целое число а и прибавить к нему b раз по единице, мы получим число a+b; этим определяется сложение целых чисел.
Определив сложение, проделаем вот что: начнем с нуля и прибавим к нему b раз число а; таким образом мы определим умножение целых чисел и будем называть результат произведением а на b.
Теперь можно проделать ряд последовательных умножений: если умножить единицу b раз на число а, то мы возведем а в степень b и запишем результат в виде аb. Исходя из этих определений, легко доказать такие соотношения
(22.1)
Эти результаты хорошо известны, мы не хотим долго на них останавливаться, а выписаны они больше для порядка. Конечно, 1 и 0 обладают особыми свойствами, например a+0=а, а·1=а и а в первой степени равно а.
Составляя табличку формул (22.1), мы пользовались такими свойствами, как непрерывность и соотношение порядка; дать им определение очень трудно: для этого создана целая наука. Кроме того, мы выписали, конечно, слишком много «правил»; некоторые из этих правил можно вывести из других, но не будем на этом останавливаться.
§ 2. Обратные операции
Кроме прямых операций сложения, умножения и возведения в степень, существуют обратные операции. Их можно определить так. Предположим, что нам заданы а и с; как найти b, удовлетворяющее уравнениям a+b=с, ab=c, ba=с? Если a+b=с, то b определяется при помощи вычитания: b=с-а. Столь же проста операция деления: если ab=c, то b=с/а; это решение уравнения ab=c «задом наперед». Если вам встретится степень: ba=с, то надо запомнить, что b называется корнем а-й степени из с. Например, на вопрос: «Какое число, будучи возведенным в куб, дает 8?» — следует отвечать: «Кубический корень из 8, т. е. 2». Обратите внимание, что, когда дело доходит до степени, появляются две обратные операции. Действительно, ведь раз аb и bа— различные числа, то можно задать и такой вопрос: «В какую степень надо возвести 2, чтобы получить 8?» В этом случае приходится брать логарифм. Если аb=с, то b=logac. He надо пугаться громоздкой записи числа b в этом случае; находить его так же просто, как и результаты других обратных операций. Хотя логарифм «проходят» гораздо позже корня, это такая же простая вещь: просто-напросто это разного сорта решения алгебраических уравнений. Выпишем вместе прямые и обратные операции:
(22.2)
В чем же идея? Выписанные соотношения верны для целых чисел, потому что они выводятся из определений сложения, умножения и возведения в степень. Подумаем, нельзя ли расширить класс объектов, которые по-прежнему будут обозначаться буквами а, b и с и для которых по-прежнему будут верны все сформулированные нами правила, хотя сложение уже нельзя будет понимать как последовательное увеличение числа на единицу, а возведение в степень — как последовательное перемножение целых чисел.
§ 3. Шаг в сторону и обобщение
Если кто-нибудь, усвоив наши определения, приступит к решению алгебраических уравнений, он быстро натолкнется на неразрешимые задачи. Решите, например, уравнение b=3-5. Вам придется в соответствии с определением вычитания найти число, которое дает 3, если к нему добавить 5. Перебрав все целые положительные числа (а ведь в правилах говорится только о таких числах), вы скажете, что задача не решается. Однако можно сделать то, что потом станет системой, великой идеей: наткнувшись на неразрешимую задачу, надо сначала отойти в сторону, а затем обобщить. Пока алгебра состоит для нас из правил и целых чисел. Забудем о первоначальных определениях сложения и умножения, но сохраним правила (22.1) и (22.2) и предположим, что они верны вообще не только для целых положительных чисел (для них эти правила были выведены), а для более широкого класса чисел. Раньше мы записывали целые положительные числа в виде символов, чтобы вывести правила; теперь правила будут определять символы, а символы будут представителями каких-то более общих чисел. Манипулируя правилами, можно показать, что 3-5=0-2. Давайте определим новые числа: 0-1, 0-2, 0-3, 0-4 и т. д. и назовем их целыми отрицательными числами. После этого мы сможем решить все задачи на вычитание. Теперь вспомним и о других правилах, например a(b+c)=ab+ac; это даст нам правило умножения отрицательных чисел. Перебрав все правила, мы увидим, что они верны как для положительных, так и для отрицательных чисел.
Мы значительно расширили область действия наших правил, но достигли этого ценой изменения смысла символов.
Уже нельзя, например, сказать, что умножить 5 на -2 — значит сложить 5 минус два раза. Эта фраза бессмысленна. Тем не менее, пользуясь правилами, вы всегда получите верный результат.
Возведение в степень приносит новые хлопоты. Кто-нибудь обязательно захочет узнать, что означает символ а(3-5). Мы знаем, что 3-5 это решение уравнения (3-5)+5=3. Следовательно, мы знаем, что а(3-5)а5=а3. Теперь можно разделить на а5, тогда а(3-5)=а3/а5. Еще одно усилие, и вот окончательный результат: а(3-5)=1/а2. Таким образом, мы установили, что возведение числа в отрицательную степень сводится к делению единицы на число, возведенное в положительную степень. Все было бы хорошо, если бы 1/а2 не было бессмысленным символом. Ведь а — это целое положительное или отрицательное число, значит, а2 больше единицы, а мы не умеем делить единицу на числа, большие чем единица!
Система так система. Натолкнувшись на неразрешимую задачу, надо расширить царство чисел. На этот раз нам трудно делить: нельзя найти целого числа ни положительного, ни отрицательного, которое появилось бы в результате деления 3 на 5. Так назовем это и другие подобные ему числа рациональными дробями и предположим, что дроби подчиняются тем же правилам, что и целые числа. Тогда мы сможем оперировать дробями так же хорошо, как и целыми числами.
Еще один пример на степень: что такое а3/5? Мы знаем только, что (3/5)5=3, ибо это определение числа 3/5, и еще, что (а3/5)5=a(3/5)5, ибо это одно из правил. Вспомнив определение корня, мы получим а(3/5)=5√a3. Определяя таким образом дроби, мы не вводим никакого произвола. Сами правила следят за тем, чтобы подстановка дробей вместо написанных нами символов не была бессмысленной процедурой. Замечательно, что эти правила справляются с дробями так же хорошо, как и с целыми числами (положительными и отрицательными)!
Пойдем дальше по пути обобщения. Существуют ли еще уравнения, которых мы не научились решать? Конечно. Например, нам не под силу уравнение b=21/2=√2. Невозможно найти рациональную дробь, квадрат которой равен 2. В наше время это выяснить довольно просто. Мы знаем десятичную систему и не пугаемся бесконечной десятичной дроби, которую можно использовать для приближения корня из двух. Хотя идея такого приближения появилась еще у древних греков, однако усваивалась она с большим трудом. Чтобы точно сформулировать суть такого приближения, надо постичь такие высокие материи, как непрерывность и соотношения порядка, а это очень трудный шаг. Это сделал Дедекинд очень точно и очень формально. Однако, если не заботиться о математической строгости, легко понять, что числа типа √2 можно представить в виде целой последовательности десятичных дробей (потому что если остановиться на какой-нибудь десятичной дроби, то получится рациональное число), которая все ближе и ближе подходит к желанному результату. Этих знаний нам вполне достаточно; они позволят свободно обращаться с иррациональными числами и вычислять числа типа √2 с нужной точностью.
§ 4. Приближенное вычисление иррациональных чисел
Теперь такой вопрос: как возвести число в иррациональную степень? Например, нам хочется узнать, что такое 10√2. Ответ в принципе очень прост. Возьмем вместо √2 его приближение в виде конечной десятичной дроби — это рациональное число. Возводить в рациональную степень мы умеем; дело сводится к возведению в целую степень и извлечению корня. Мы получим приближенное значение числа 10√2. Можно взять десятичную дробь подлиннее (это снова рациональное число). Тогда придется извлечь корень большей степени; ведь знаменатель рациональной дроби увеличится, но зато мы получим более точное приближение. Конечно, если взять приближенное значение √2 в виде очень длинной дроби, то возведение в степень будет делом очень трудным. Как справиться с этой задачей?
Вычисление квадратных корней, кубичных корней и других корней невысокой степени — вполне доступный нам арифметический процесс; вычисляя, мы последовательно, один за другим, пишем знаки десятичной дроби. Но для того, чтобы возвести в иррациональную степень или взять логарифм (решить обратную задачу), нужен такой труд, что применить прежнюю процедуру уже не просто. На помощь приходят таблицы. Их называют таблицами логарифмов или таблицами степеней, смотря по тому, для чего они предназначены. Они экономят время: чтобы возвести число в иррациональную степень, мы не вычисляем, а только перелистываем страницы.
Хотя вычисление собранных в таблицы значений — процедура чисто техническая, а все же дело это интересное и имеет большую историю. Поэтому посмотрим, как это делается. Мы вычислим не только x=10√2, но решим и другую задачу: 10x=2, или x=log102. При решении этих задач мы не откроем новых чисел; это просто вычислительные задачи. Решением будут иррациональные числа, бесконечные десятичные дроби, а их как-то неудобно объявлять новым видом чисел.
Подумаем, как решить наши уравнения. Общая идея очень проста. Если вычислить 101 и 101/10, и 101/100, и 101/1000, и т. д., а затем перемножить результаты, то мы получим 101,414..., или 10 √2. Поступая так, мы решим любую задачу такого рода. Однако вместо 101/10 и т. д. мы будем вычислять 101/2, 101/4 и т. д. Прежде чем начинать вычисления, объясним еще, почему мы обращаемся к числу 10 чаще, чем к другим числам. Мы знаем, что значение таблиц логарифмов выходит далеко за рамки математической задачи вычисления корней, потому что
(22.3)
Это хорошо известно всем, кто пользовался таблицей логарифмов, чтобы перемножить числа. По какому же основанию b брать логарифмы? Это безразлично; ведь в основу таких вычислений положен только принцип, общее свойство логарифмической функции. Вычислив логарифмы один раз по какому-нибудь произвольному основанию, можно перейти к логарифмам по другому основанию при помощи умножения. Если умножить уравнение (22.3) на 61, то оно останется верным, поэтому если перемножить все числа в таблице логарифмов по основанию b на 61, то можно будет пользоваться и такой таблицей. Предположим, что нам известны логарифмы всех чисел по основанию b. Иначе говоря, можно решить уравнение bа=с для любого с; для этого существует таблица. Задача состоит в том, как найти логарифм этого же числа с по другому основанию, например х. Нам нужно решить уравнение ха'=с. Это легко сделать, потому что х всегда можно представить так: x=bt. Найти t, зная х и b, просто: t=logbx. Подставим теперь х=bt в уравнение xa'=с; оно перейдет в такое уравнение: (bt)а'=bta'=с. Иными словами, произведение ta' есть логарифм с по основанию b. Значит, a'=a/t. Таким образом, логарифмы по основанию х равны произведениям логарифмов по основанию b на постоянное число 1/t. Следовательно, все таблицы логарифмов эквивалентны с точностью до умножения на число 1/logbx. Это позволяет нам выбрать для составления таблиц любое основание, но мы решили, что удобнее всего взять за основание число 10. (Может возникнуть вопрос: не существует ли все-таки какого-нибудь естественного основания, при котором все выглядит как-то проще? Мы попытаемся ответить на этот вопрос позднее. Пока все логарифмы будут вычисляться по основанию 10.)
Теперь посмотрим, как составляют таблицу логарифмов. Работа начинается с последовательных извлечений квадратного корня из 10. Результат можно увидеть в табл. 22.1.
Таблица 22.1 последовательные извлечения КВАДРАТНОГО КОРНЯ ИЗ 10
Показатели степеней записаны в ее первом столбце, а числа 10S— в третьем. Ясно, что 101=10. Возвести 10 в половинную степень легко — это квадратный корень из 10, а как извлекать квадратный корень из любого числа, знает каждый[16]. Итак, мы нашли первый квадратный корень; он равен 3,16228. Что это дает? Кое-что дает. Мы уже можем сказать, чему равно 100,5, и знаем по крайней мере один логарифм. Логарифм числа 3,16228 очень близок к 0,50000. Однако нужно еще приложить небольшие усилия: нам нужна более подробная таблица. Извлечем еще один квадратный корень и найдем 101/4,что равно 1,77828. Теперь мы знаем еще один логарифм: 1,250— это логарифм числа 17,78; кроме того, мы можем сказать, чему равно 100,75: ведь это 10(0,5+0,25), т. е. произведение второго и третьего чисел из третьего столбца табл. 22.1. Если сделать первый столбец таблицы достаточно длинным, то таблица будет содержать почти все числа; перемножая числа из третьего столбца, мы получаем 10 почти в любой степени. Такова основная идея таблиц. В нашей таблице содержится десять последовательных корней из 10; основной труд по составлению таблицы вложен в вычисления этих корней.
Почему же мы не продолжаем повышать точность таблиц дальше? Потому что мы кое-что уже подметили. Возведя 10 в очень малую степень, мы получаем единицу с малой добавкой. Это, конечно, происходит потому, что если возвести, например, 101/1000 в 1000-ю степень, то мы снова получим 10; ясно, что 101/1000 не может быть большим числом: оно очень близко к единице. Более того, малые добавки к единице ведут себя так, будто их каждый раз делят на 2; поглядите-ка на таблицу повнимательнее: 1815 переходит в 903, потом в 450, 225 и т. д. Таким образом, если вычислить еще один, одиннадцатый, квадратный корень, он с большой точностью будет равен 1,00112, и этот результат мы угадали еще до вычисления. Можно ли сказать, какова будет добавка к единице, если возвести 10 в степень Δ/1024, когда Δ стремится к нулю? Можно. Добавка будет приблизительно равна 0,0022511Δ. Конечно, не в точности 0,0022511 Δ; чтобы вычислить эту добавку поточнее, делают такой трюк: вычитают из 10S единицу и делят разность на показатель степени s. Отклонения полученного таким образом частного от его точного значения одинаковы для любой степени s. Видно, что эти отношения (см. четвертый столбец табл. 22.1) примерно равны. Сначала они все-таки сильно отличаются друг от друга, но потом все ближе подходят друг к другу, явно стремясь к какому-то числу. Что это за число? Проследим, как меняются числа четвертого столбца, если опускаться вниз по столбцу. Сначала разность двух соседних чисел равна 0,0211, потом 0,0104, потом 0,0053 и, наконец, 0,0026. Разность каждый раз убывает наполовину. Сделав еще один шаг, мы доведем ее до 0,0013, потом до 0,0007, 0,0003, 0,0002 и, наконец, примерно до 0,0001; надо последовательно делить 26 на 2. Таким образом, мы спустимся еще на 26 единиц и найдем для предела 2.3025. (Позднее мы увидим, что правильнее было бы взять 2.3026, но давайте возьмем то, что у нас получилось.) Пользуясь этой таблицей, можно возвести 10 в любую степень, если ее показатель каким угодно способом выражается через 1/1024.
Теперь легко составить таблицу логарифмов, потому что все необходимое для этого мы уже припасли. Процедура этого изображена в табл. 22.2, а нужные числа берутся из второго и третьего столбцов табл. 22.1.
Таблица 22.2 ВЫЧИСЛЕНИЯ log102
Предположим, что мы хотим знать логарифм 2. Это значит, что мы хотим знать, в какую степень надо возвести 10, чтобы получить 2. Может быть, возвести 10 в степень 1/2? Нет, получится слишком большое число. Глядя на табл. 22.1, можно сказать, что нужное нам число лежит между 1/4 и 1/2. Поиск его начнем с 1/4; разделим 2 на 1,788..., получится 1,124...; при делении мы отняли от логарифма двух 0,250000, и теперь нас интересует логарифм 1,124.... Отыскав его, мы прибавим к результату 1/4=256/1024. Найдем в табл. 22.1 число, которое бы при движении по третьему столбцу сверху вниз стояло сразу за 1,124... . Это 1,074607. Отношение 1,124... к 1,074607 равно 1,046598. В конце концов мы представим 2 в виде произведения чисел из табл. 22.1:
Для последнего множителя (1,000573) в нашей таблице места не нашлось; чтобы найти его логарифм, надо представить это число в виде 10Δ/1024≈1+2,3025Δ/1024. Отсюда легко найти, что Δ=0,254. Таким образом, наше произведение можно представить в виде десятки, возведенной в степень 1/1024 (256+32+16+4+0,254). Складывая и деля, мы получаем нужный логарифм: log102=0,30103; этот результат верен до пятого десятичного знака!
Мы вычисляли логарифмы точно так же, как это делал мистер Бриггс из Галифакса в 1620 г. Закончив работу, он сказал: «Я вычислил последовательно 54 квадратных корня из 10». На самом деле он вычислил только 27 первых корней, а потом сделал фокус с Δ. Вычислить 27 раз квадратный корень из 10, вообще-то говоря, немного сложнее, чем 10 раз, как это сделали мы. Однако мистер Бриггс сделал гораздо большее: он вычислял корни с точностью до шестнадцатого десятичного знака, а когда опубликовал свои таблицы, то оставил в них лишь 14 десятичных знаков, чтобы округлить ошибки. Составить таблицы логарифмов с точностью до четырнадцатого десятичного знака таким методом — дело очень трудное. Зато целых 300 лет спустя составители таблиц логарифмов занимались тем, что уменьшали таблицы мистера Бриггса, выкидывая из них каждый раз разное число десятичных знаков. Только в последнее время при помощи электронных вычислительных машин оказалось возможным составить таблицы логарифмов независимо от мистера Бриггса. При этом использовался более эффективный метод вычислений, основанный на разложении логарифма в ряд.
Составляя таблицы, мы натолкнулись на интересный факт: если показатель степени ε очень мал, то очень легко вычислить 10ε; это просто 1+2,3025ε. Это значит, что 10n/2,3025=1+n для очень малых n. Кроме того, мы говорили с самого начала, что вычисляем логарифмы по основанию 10 только потому, что у нас на руках 10 пальцев и по десяткам нам считать удобнее. Логарифмы по любому другому основанию получаются из логарифмов по основанию 10 простым умножением. Теперь настало время выяснить, не существует ли математически выделенного основания логарифмов, выделенного по причинам, не имеющим ничего общего с числом пальцев на руке. В этой естественной шкале формулы с логарифмами должны выглядеть проще. Составим новую таблицу логарифмов, умножив все логарифмы по основанию 10 на 2,3025.... Это соответствует переходу к новому основанию — натуральному, или основанию е. Заметим, что logε (l+n)≈n или еn≈1+n, когда n→0.
Легко найти само число е; оно равно 101/2,3025 или 100,434294... Это 10 в иррациональной степени. Для вычисления е можно воспользоваться таблицей корней из 10. Представим 0,434294... сначала в виде 444,73/1024, а числитель этой дроби в виде суммы 444,73=256+128+32+16+2+0,73. Число е поэтому равно произведению чисел
(Числа 0,73 нет в нашей таблице, но соответствующий ему результат можно представить в виде 1+2,3025Δ/1024 и вычислить, чему равна Δ.) Перемножив все 7 сомножителей, мы получим 2,7184 (на самом деле должно быть 2,7183, но и этот результат хорош). Используя такие таблицы, можно возводить число в иррациональную степень и вычислять логарифмы иррациональных чисел. Вот как надо обращаться с иррациональностями.
§ 5. Комплексные числа
Хотя мы хорошо поработали, все-таки есть еще уравнения, которые нам не под силу! Например, чему равен квадратный корень из -1? Предположим, что это х, тогда х2=-1. Нет ни рационального, ни иррационального числа, квадрат которого был бы равен -1. Придется снова пополнить запас чисел. Предположим, что уравнение х2=-1 все же имеет решение, и обозначим это решение буквой i; число i имеет пока только одно свойство: будучи возведенным в квадрат, оно дает -1. Вот пока и все, что можно о нем сказать. Однако уравнение х2=-1 имеет два корня. Буквой i мы обозначили один из корней, но кто-нибудь может сказать: «А я предпочитаю иметь дело с корнем -i; моя буква i просто минус ваша i». Возразить ему нечего, потому что число i определяется соотношением i2=-1; это соотношение останется верным, если изменить знак i. Значит, любое уравнение, содержащее какое-то количество i, останется верным, если сменить знаки у всех i. Такая операция называется комплексным сопряжением. Далее, ничто не мешает нам получать новые числа вот так: сложить i несколько раз, умножить i на какое-нибудь наше старое число, прибавить результат умножения к старому числу и т. д. Все это можно сделать, не нарушая ранее установленных правил. Таким образом мы приходим к числам, которые можно записать в виде p+iq, где p и q — числа, с которыми мы имели дело ранее, их называют действительными числами. Число i называют мнимой единицей, а произведение действительного числа на мнимую единицу — чисто мнимым числом. Самое общее число а имеет вид a=p+iq, и его называют комплексным числом. Обращаться с комплексными числами несложно; например, нам надо вычислить произведение (r+is)(p+q). Вспомнив о правилах, мы получим
(22.4)
потому что i·i=i2=-1. Теперь мы получили общее выражение для чисел, удовлетворяющих правилам (22.1).
Умудренные опытом, полученным в предыдущих разделах, вы скажете: «Рано говорить об общем выражении, надо еще определить, например, возведение в мнимую степень, а потом можно придумать много алгебраических уравнений, ну хотя бы x6+3x2=-2, для решения которых потребуются новые числа». В том-то и дело, что, кроме действительных чисел, достаточно изобрести только одно число — квадратный корень из -1, после этого можно решить любое алгебраическое уравнение! Эту удивительную вещь должны доказывать уже математики. Доказательство очень красиво, очень интересно, но далеко не самоочевидно. Действительно, казалось бы, естественнее всего ожидать, что по мере продвижения в дебри алгебраических уравнений придется изобретать снова, снова и снова. Но самое чудесное, что больше ничего не надо изобретать. Это последнее изобретение. Изобретя комплексные числа, мы установим правила, по которым с этими числами надо обращаться, и больше ничего изобретать не будем. Мы научимся возводить комплексные числа в комплексную степень и выражать решение любого алгебраического уравнения в виде конечной комбинации уже известных нам символов. К новым числам это не приведет. Например, квадратный корень из i, или ii— опять те же комплексные числа. Сейчас мы рассмотрим это подробнее.
Мы уже знаем, как надо складывать и умножать комплексные числа; сумма двух комплексных чисел (р+iq)+(r+is) — это число (p+r)+i(q+s). Но вот возведение комплексных чисел в комплексную степень — уже задача потруднее. Однако она оказывается не труднее задачи о возведении в комплексную степень действительных чисел. Посмотрим поэтому, как возводится в комплексную степень число 10, не в иррациональную, а комплексную; нам надо знать число 10(r+is). Правила (22.1) и (22.2) несколько упрощают задачу
(22.5)
Мы знаем, как вычислить 10r, перемножить числа мы тоже умеем, не умеем только вычислить 10is. Предположим, что это комплексное число x+iy. Задача: дано s, найти х и у. Если
то должно быть верным и комплексно сопряженное уравнение
(Некоторые вещи можно получить и без вычислений, надо просто использовать правила.) Перемножая эти равенства, можно получить еще один интересный результат
(22.6)
Если мы каким-то образом найдем х, то определить у будет очень легко.
Однако как все-таки возвести 10 в мнимую степень? Где искать помощи? Правила нам уже не помогут, но утешает вот что: если удастся возвести 10 в какую-нибудь одну мнимую степень, то ничего не стоит возвести 10 уже в любую степень. Если известно 10is для одного значения s, то вычисление в случае вдвое большего s сводится к возведению в квадрат и т. д. Но как же возвести 10 в хотя бы одну мнимую степень? Для этого сделаем дополнительное предположение; его, конечно, нельзя ставить в один ряд с правилами (22.1) и (22.2), но оно приведет к разумным результатам и позволит нам шагнуть далеко вперед. Предположим, что «закон» 10ε=1+2,3025ε (когда ε очень мало) верен не только для действительных, но и для комплексных ε. Если это так, то 10is=1+2,3025·is при s→0. Предполагая, что s очень мало (скажем, равно 1/1024), мы получаем хорошее приближение числа 10is.
Теперь можно составить таблицу, которая позволит вычислить все мнимые степени 10, т. е. найти числа x и y. Надо поступить так. Начнем с показателя 1/1024, который мы считаем равным примерно 1+2,3025 i/1024. Тогда
(22.7)
Умножая это число само на себя много раз, мы дойдем до степеней более высоких. Мы просто-напросто перевернули процедуру составления таблицы логарифмов и, вычислив квадрат, 4-ю степень, 8-ю степень и т. д. числа (22.7), составили табл. 22.3. Интересно, что сначала все числа х были положительными, а потом вдруг появилось отрицательное число. Это значит, что существует число s, для которого действительная часть 10is равна нулю. Значение iу в этом случае равно i, т. е. 10is=i, или is=log10i. В качестве примера (см. табл. 22..3) вычислим с ее помощью log10i. Процедура поиска log10i в точности повторяет то, что мы делали, вычисляя log102.
Произведение каких чисел из табл. 22.3 равно чисто мнимому числу? После нескольких проб и ошибок мы найдем, что лучше всего умножить «512» на «128». Их произведение равно 0,13056+0,99144i. Приглядевшись к правилу умножения комплексных чисел, можно понять, что надежду на успех сулит умножение этого числа на число, мнимая часть которого приблизительно равна действительной части нашего числа. Мнимая часть «64» равна 0,14349, что довольно близко к 0,13056. Произведение этих чисел равно -0,01350+0,99993i. Мы перескочили через нуль, поэтому результат нужно разделить на 0,99996+0,00900 i. Как это сделать? Изменим знак i и умножим на 0,99996-0,00900 i (ведь x2+y2=1). В конце концов обнаружим, что если возвести 10 в степень i(1/1024) (512+128+64-4-2+0,20) или 698,20i/1024, то получится мнимая единица. Таким образом, log10i=0,068226i.
Таблица 22.3. последовательное: вычисление квадратов 10i/1024=1+0,0022486i
§ 6. Мнимые экспоненты
Фиг. 22.1. Вещественная и мнимая части функции 10is.
Чтобы лучше понять, что такое число в мнимой степени, вычислим последовательные степени десяти. Мы не будем каждый раз удваивать степень, чтобы не повторять табл. 22.3, и посмотрим, что случится с действительной частью после того, как она станет отрицательной. Результат можно увидеть в табл. 22.4.
В этой таблице собраны последовательные произведения числа 10i/8. Видно, что x уменьшается, проходит через нуль, достигает почти -1 (в промежутке между р=10 и р=11 величина точно равна -1) и возвращается назад. Точно так же величина у ходит взад-вперед.
Точки на фиг. 22.1 соответствуют числам, приведенным в табл. 22.4, а соединяющие их линии помогают следить за изменением х и у. Видно, что числа х и у осциллируют; 10is повторяет себя. Легко объяснить, почему так происходит.
Таблица 22.4. ПОСЛЕДОВАТЕЛЬНЫЕ ПРОИЗВЕДЕНИЯ ЧИСЛА 10i/8
Ведь i в четвертой степени — это i2 в квадрате. Это число равно единице; следовательно, если 100,68i равно i, то, возведя это число в четвертую степень, т. е. вычислив 102,72i, мы получим +1. Если нужно получить, например, 103,00i, то нужно умножить 102,72i на 100,28i. Иначе говоря, функция 10is повторяется, имеет период. Мы уже знаем, как выглядят такие кривые! Они похожи на график синуса или косинуса, и мы назовем их на время алгебраическим синусом и алгебраическим косинусом. Теперь перейдем от основания 10 к натуральному основанию. Это только изменит масштаб горизонтальной оси; мы обозначим 2,3025s через t и напишем 10is=eit, где t — действительное число. Известно, что eit=x+iy, и мы запишем это число в виде
(22.8)
Каковы свойства алгебраического косинуса cost и алгебраического синуса sint? Прежде всего x2+y2=1; это мы уже доказали, и это верно для любого основания, будь то 10 или е. Следовательно, cos2t+sin2t=1. Мы знаем, что eit=1+it для малых t; значит, если t — близкое к нулю число, то _cost близок к единице, a _sint близок к t. Продолжая дальше, мы придем к выводу, что все свойства этих замечательных функций, получающихся в результате возведения в мнимую степень, в точности совпадают со свойствами тригонометрического синуса и тригонометрического косинуса.
А как обстоит дело с периодом? Давайте найдем его. В какую степень надо возвести е, чтобы получить i? Иными словами, чему равен логарифм i по основанию е? Мы вычислили уже логарифм i по основанию 10; он равен 0,68226i; чтобы перейти к основанию е, мы умножим это число на 2,3025 и получим 1,5709i. Новое число (без i) можно назвать «алгебраическим π/2». Но поглядите-ка, оно отличается от настоящего π/2 всего лишь последним десятичным знаком, и это просто-напросто следствие наших приближений при вычислениях! Таким образом, чисто алгебраически возникли две новые функции — синус и косинус; они принадлежат алгебре и только алгебре. Мы пошли по их следам и обнаружили, что это те же самые функции, которые так естественно возникают в геометрии. Мы отыскали мост между алгеброй и геометрией.
Подводя итог нашим поискам, мы напишем одну из самых замечательных формул математики
(22.9)
Вот она, наша жемчужина.
Связь между алгеброй и геометрией можно использовать для изображения комплексных чисел на плоскости; точка на плоскости определяется координатами х и у (фиг. 22.2).
Фиг. 22.2. Комплексное число как точка на плоскости.
Представим каждое комплексное число в виде x+iy. Если расстояние точки от начала координат обозначить через r, а угол радиуса-вектора точки с осью x — через θ, то выражение x+iy можно представить в виде reiθ. Это следует из геометрических соотношений между x, y, r и θ. Таким образом, мы объединили алгебру и геометрию. Начиная эту главу, мы знали только целые числа и умели их считать. Зато у нас была небольшая идея о могуществе шага в сторону и обобщения. Используя алгебраические «законы», или свойства чисел, сведенные в уравнения (22.1), и определения обратных операций (22.2), мы смогли создать не только новые числа, но и такие полезные вещи, как таблицы логарифмов, степеней и тригонометрические функции (они возникли при возведении действительных чисел в мнимые степени), и все это удалось сделать, извлекая много раз квадратный корень из десяти!
Глава 23 РЕЗОНАНС
§ 1. Комплексные числа и гармоническое движение
Мы снова будем говорить в этой главе о гармоническом осцилляторе, особенно об осцилляторе, на который действует внешняя сила. Для анализа этих задач нужно развить новую технику. В предыдущей главе мы ввели понятие комплексного числа, которое состоит из действительной и мнимой частей и которое можно изобразить на графике. Действительная часть числа будет изображаться абсциссой, а мнимая — ординатой. Комплексное число а можно записать в виде a=ar+iai; при такой записи индекс r отмечает действительную часть а, а индекс i — мнимую. Взглянув на фиг. 23.1, легко сообразить, что комплексное число a=x+iy можно записать и так: x+iy=rexp(iθ), где r2=x2+y2=(x+iy)(x-iy)=aa* (а* — это комплексно сопряженное к а число; оно получается из а изменением знака i).
Фиг. 23.1. Комплексное число, изображенное точкой на «комплексной плоскости».
Итак, комплексное число можно представить двумя способами: явно выделить его действительную и мнимую части или задать его модулем r и фазовым углом θ. Если заданы r и θ, то х и у равны rcosθ и rsinθ, и, наоборот, исходя из числа x+iy, можно найти r=√(x2+y2)и угол θ; tgθ равен у/х (т. е. отношению мнимой и действительной частей).
Чтобы применить комплексные числа к решению физических задач, проделаем такой трюк. Когда мы изучали осциллятор, то имели дело с внешней силой, пропорциональной cosωt. Такую силу F=F0cosωt можно рассматривать как действительную часть комплексного числа F=F0exp(iωt), потому что exp(iωt)=cosωt+isinωt. Такой переход удобен: ведь иметь дело с экспонентой легче, чем с косинусом. Итак, трюк состоит в том, что все относящиеся к осциллятору функции рассматриваются как действительные части каких-то комплексных функций. Найденное нами комплексное число F, разумеется, не настоящая сила, ибо физика не знает комплексных сил: все силы имеют только действительную часть, а мнимой части взяться просто неоткуда. Тем не менее мы будем говорить «сила» F0exp(iωt), хотя надо помнить, что речь идет лишь о действительной ее части.
Рассмотрим еще один пример. Как представить косинусоидальную волну, фаза которой сдвинулась на Δ? Конечно, как действительную часть F0exp[i((ωt-Δ2)]; экспоненту в этом случае можно записать в виде exp[i(ωt-Δ)]=exp(iωt)exp(-iΔ). Алгебра экспонент гораздо легче алгебры синусов и косинусов; вот почему удобно использовать комплексные числа. Часто мы будем писать так:
(23.1)
Шляпка над буквой будет указывать, что мы имеем дело с комплексным числом, т. е.
Однако пора начать решать уравнения, используя комплексные числа, тогда мы увидим, как надо применять комплексные числа в реальных обстоятельствах. Для начала попытаемся решить уравнение
(23.2)
где F — действующая на осциллятор сила, а х — его смещение. Хотя это и абсурдно, предположим, что х и F — комплексные числа. Тогда х состоит из действительной части и умноженной на i мнимой части; то же самое касается и F. Уравнение (23.2) в этом случае означает
или
Комплексные числа равны, когда равны их действительные и мнимые части; следовательно, действительная, часть х удовлетворяет уравнению, в правой части которого стоит действительная часть силы. Оговорим с самого начала, что такое разделение действительных и мнимых частей возможно не всегда, а только в случае линейных уравнений, т. е. уравнений, содержащих х лишь в нулевой и первой степенях. Например, если бы уравнение содержало член λх2, то, сделав подстановку xr+ixi, мы получили бы λ(xr+ixi)2, и выделение действительной и мнимой частей привело бы нас к λ(хr2-xi2) и 2iλxrxi. Итак, мы видим, что действительная часть уравнения содержит в этом случае член -λxi2. Мы получили совсем не то уравнение, какое собирались решать.
Попытаемся применить наш метод к уже решенной задаче о вынужденных колебаниях осциллятора, т. е. об осцилляторе, на который действует внешняя сила. Как и раньше, мы хотим решить уравнение (23.2), но давайте начнем с уравнения
(23.3)
где ^Feiωt — комплексное число. Конечно, х — тоже комплексное число, но запомним правило: чтобы найти интересующие нас величины, надо взять действительную часть х. Найдем решение (23.3), описывающее вынужденные колебания. О других решениях поговорим потом. Это решение имеет ту же частоту, что и внешняя (приложенная) сила. Колебание, кроме того, характеризуется амплитудой и фазой, поэтому если представить смещение числом ^x, то модуль его скажет нам о размахе колебаний, а фаза комплексного числа — о временной задержке колебания. Воспользуемся теперь замечательным свойством экспоненты: (d/dt)[^xexp(iωt)]=iω^xexp(iωt). Дифференцируя экспоненциальную функцию, мы опускаем вниз экспоненту, делая ее простым множителем. Дифференцируя еще раз, мы снова приписываем такой же множитель, поэтому очень просто написать уравнение для ^x: каждое дифференцирование по времени надо заменить умножением на iω. (Дифференцирование становится теперь столь же простым, как и умножение! Идея использовать экспоненциальные функции в линейных дифференциальных уравнениях почти столь же грандиозна, как изобретение логарифмов, которые заменили умножение сложением. Здесь дифференцирование заменяется умножением.) Таким образом, мы получаем уравнение
(23.4)
[Мы опустили общий множитель eiωt.] Смотрите, как все просто! Дифференциальное уравнение немедленно сводится к чисто алгебраическому; сразу же можно написать его решение
поскольку (iω)2=-ω2. Решение можно несколько упростить, подставив k/m=ω20, тогда
(23.5)
Это, конечно, то же самое решение, которое уже было нами получено ранее. Поскольку m(ω20-ω2) — действительное число, то фазовые углы ^F и ^х совпадают (или отличаются на 180°, если (ω2>ω20). Об этом тоже уже говорилось. Модуль ^х, который определяет размах колебаний, связан с модулем ^F множителем 1/m(ω20-ω2); этот множитель становится очень большим, если ω приближается к ω0. Таким образом, можно достичь очень сильного отклика, если приложить к осциллографу нужную частоту ω (если с нужной частотой толкать подвешенный на веревочке маятник, то он поднимается очень высоко).
§ 2. Вынужденные колебания с торможением
Итак, мы можем решить задачу о колебательном движении, пользуясь изящной математикой. Однако изящество немногого стоит, когда задача и так решается просто; математику надо использовать тогда, когда решаются более сложные задачи. Перейдем поэтому к одной из таких задач, которая, кроме того, ближе к действительности, чем предыдущая. Из уравнения (23.5) следует, что, если ω в точности равна ω0, амплитуда колебания становится бесконечной. Этого, конечно, не может быть, потому что многие вещи, например трение, ограничивают амплитуду, а мы их не учитывали. Изменим теперь (23.2) так, чтобы учесть трение.
Сделать это обычно довольно трудно, потому что силы трения очень сложны. Однако во многих случаях можно считать, что сила трения пропорциональна скорости движения объекта. Именно такое трение препятствует медленному движению тела в масле или другой вязкой жидкости. Когда предмет стоит на месте, на него не действуют никакие силы, но чем скорее он движется и чем быстрее масло должно обтекать этот предмет, тем больше сопротивление. Таким образом, мы предположим, что в (23.2), кроме уже написанных членов, существует еще один — сила сопротивления, пропорциональная скорости: Ff=-c(dx/dt). Удобно записать с как произведение m на другую постоянную γ; это немного упростит уравнение.
Мы уже проделывали такой фокус, когда заменяли k на mω20, чтобы упростить вычисления. Итак, наше уравнение имеет вид
(23.6)
или, если положить с=mγ и k=mω20 и поделить обе части на m,
(23.6а)
Это самая удобная форма уравнения. Если γ очень мало, то мало и трение, и, наоборот, большие значения γ соответствуют громадному трению. Как решать это новое линейное уравнение? Предположим, что внешняя сила равна F0cos(ωt+Δ); можно было бы подставить это выражение в (23.6а) и попытаться решить полученное уравнение, но мы применим наш новый метод. Представим F как действительную часть ^Fexp(iωt), а x — как действительную часть ^xexp(iωt) и подставим эти комплексные числа в (23.6а). Собственно говоря, и подставлять-то нечего; внимательно посмотрев на (23.6а), вы тут же скажете, что оно превратится в
(23.7)
[Если бы мы попытались решить (23.6а) старым прямолинейным способом, то оценили бы по достоинству магический «комплексный» метод.] Поделив обе части уравнения на exp(iωt), найдем отклик осциллятора ^x на силу ^F
(23.8)
Итак, отклик ^x равен силе ^F, умноженной на некоторый множитель. Этот множитель не имеет ни названия, ни какой-то своей собственной буквы, и мы будем обозначать его буквой R:
тогда
(23.9)
Этот множитель можно записать либо как p+iq, либо как рexp(iθ). Запишем его в виде рexp(iθ) и посмотрим, к чему это приведет. Внешняя сила — это действительная часть числа F0exp(iΔ)еexp(iωt), она равна F0cos(ωt+Δ). Уравнение (23.9) говорит нам, что отклик ^x равен ^FR; мы условились писать R в виде R=ρexp(iθ); следовательно,
Вспомним (об этом уже говорилось), что физическое значение х, равное действительной части комплексного числа ^хexp(iωt), равно действительной части ρF0exp[i(θ+Δ)]exp(iωt). Но ρ и F0 — действительны, а действительная часть exp[i(θ+Δ+ωt)] — это просто cos(ωt+Δ+θ). Таким образом,
(23.10)
Это значит, что амплитуда отклика равна амплитуде силы F, умноженной на коэффициент усиления ρ; мы нашли «размах» колебаний. Но это еще не все: видно, что х колеблется не в такт с силой; фаза силы равна Δ, а у x; она сдвинута на дополнительную величину θ. Следовательно, ρ и θ — это величина и фазовый сдвиг отклика.
Найдем теперь значение ρ. Квадрат модуля любого комплексного числа равен произведению этого числа на комплексно сопряженное, т. е.
(23.11)
Можно найти и фазовый угол θ
значит,
(23.12)
Знак минус возник оттого, что tg(-θ)=-tgθ. Угол θ отрицателен при всех значениях ω, т. е. смещение х отстает по фазе от силы F.
На фиг. 23.2 показано, как изменяется ρ2 при изменении частоты (ρ2 для физика интереснее, чем ρ, потому что ρ2 пропорционально квадрату амплитуды, а значит, и той энергии, которую передает осциллятору внешняя сила).
Фиг. 23.2. График зависимости ρ2 от ω.
Очевидно, что если γ мало, то основной член в (23.11) — это 1/(ω20-ω2)2, и отклик стремится к бесконечности, если ω приближается к ω0. Но эта «бесконечность» — не настоящая бесконечность, потому что даже если ω=ω0, то все еще остается слагаемое 1/γ2ω2. Зависимость сдвига фазы от частоты изображена на фиг. 23.3.
Фиг. 23.3. График зависимости θ от ω.
Иногда приходится иметь дело с формулой, немного отличающейся от (23.8); она тоже называется «резонансной» и, несмотря на некоторое отличие от (23.8), описывает те же самые явления. Дело в том, что если значение γ очень мало, то наиболее интересная область резонансной кривой лежит около частоты ω=ω0, а здесь при малых γ формулу (23.8) с большой степенью точности можно заменить приближенной формулой. Поскольку ω20-ω2=(ω0-ω)(ω0+ω), то для ω, очень близких к ω0, разность квадратов почти равна 2ω0(ω0-ω), а γω можно заменить на γω0. Значит, ω20-ω2+γω≈2ω0(ω0-ω+iγ/2) и
Легко найти и ρ2:
А теперь решите сами такую задачу: с увеличением частоты значение ρ2 сначала растет, достигает при ω0 максимума, а потом снова убывает. На каком расстоянии от ω0 расположены частоты, которым соответствуют значения ρ2, вдвое меньшие максимального? Покажите, что при очень малом γ эти точки отстоят друг от друга на расстояние Δω=γ. Это значит, что резонанс делается более острым по мере того, как влияние трения становится все слабее и слабее.
Другой мерой ширины резонанса может служить «добротность» q=ω0/γ (чем уже резонанс, тем больше Q); если Q=1000, то по шкале частот ширина резонансной кривой равна всего 0,001. Резонансной кривой на фиг. 23.2 соответствует Q=5.
Явление резонанса важно потому, что оно проявляется довольно часто; описанию некоторых видов этих проявлений мы посвятим остаток главы.
§ 3. Электрический резонанс
Простейшие и самые широкие технические применения резонанс нашел в электричестве. Имеется довольно много устройств, из которых собираются электрические цепи. Их часто называют пассивными элементами цепи, и бывают они трех типов, хотя в каждый элемент одного типа всегда примешано чуточку элементов других типов. Прежде чем подробно описать эти элементы, заметим, что наше представление о механическом осцилляторе как о массе, подвешенной к концу пружины, всего лишь приближение. В «массе» сосредоточена вовсе не вся масса системы: пружина тоже обладает какой-то массой, пружина тоже инерционна. Точно так же «пружина» не состоит из одной пружины, масса тоже немного упруга, а не абсолютно тверда, как это может показаться. Подпрыгивая вверх и вниз, она слегка изгибается под толчками пружины. Так же обстоит дело и в электричестве. Расположить все предметы по «элементам цепи» с чистыми, идеальными характеристиками можно только приближенно. Так как у нас нет времени обсуждать пределы таких приближений, мы просто предположим, что они допустимы.
Итак, о трех элементах цепи. Первый называется емкостью (фиг. 23.4); в качестве примера емкости могут служить две металлические пластинки, разделенные тонким слоем диэлектрика.
Фиг. 23.4. Три пассивных элемента цепи.
Если пластинки зарядить, то между ними возникает разность потенциалов. Та же самая разность потенциалов будет между точками А и В, потому что при любой дополнительной разности потенциалов вдоль соединительных проводов заряды стекут по проводам. Таким образом, заданной разности потенциалов V между пластинками соответствуют определенные заряды +q и -q на каждой пластинке. Между пластинками существует некое электрическое поле; мы даже вывели соответствующую формулу для него (см. гл. 13 и 14)
(23.14)
где d — расстояние между пластинками, A — площадь пластинок. Заметим, что разность потенциалов линейно зависит от заряда. Если построить емкость не из параллельных пластин, а придать отдельным электродам какую-нибудь другую форму, разность потенциалов будет по-прежнему пропорциональна заряду, но постоянную пропорциональности не так-то легко будет рассчитать. Однако надо знать только одно: разность потенциалов между концами емкости пропорциональна заряду V=q/C; множитель пропорциональности равен 1/С (С и есть емкость объекта).
Второй элемент цепи называется сопротивлением; этот элемент оказывает сопротивление текущему через него электрическому току. Оказывается, что все металлические провода, а также многие другие материалы сопротивляются току одинаково; если к концам куска такого материала приложить разность потенциалов, то электрический ток в куске I=dq/dt будет пропорционален приложенной разности потенциалов
(23.15)
Коэффициент пропорциональности называют сопротивлением R. Соотношение между током и разностью потенциалов вам, наверное, уже известно. Это закон Ома.
Если представлять себе заряд, сосредоточенный в емкости, как нечто аналогичное смещению механической системы х, то электрический ток dq/dt аналогичен скорости, сопротивление R аналогично коэффициенту сопротивления c, а 1/С аналогично постоянной упругости пружины k. Самое интересное во всем этом, что существует элемент цепи, аналогичный массе! Это спираль, порождающая внутри себя магнитное поле, когда через нее проходит ток. Изменение магнитного поля порождает на концах спирали разность потенциалов, пропорциональную dI/dt. (Это свойство спирали используется в трансформаторах.) Магнитное поле пропорционально току, а наведенная разность потенциалов (так ее называют) пропорциональна скорости изменения тока
(23.16)
Коэффициент L — это коэффициент самоиндукции; он является электрическим аналогом массы.
Предположим, мы собираем цепь из трех последовательно соединенных элементов (фиг. 23.5); приложенная между точками 1 и 2 разность потенциалов заставит заряды двигаться по цепи, тогда на концах каждого элемента цепи тоже возникает разность потенциалов: на концах индуктивности VL=L(d2q/dt2), на сопротивлении VR=R(dq/dt), а на емкости Vc=q/C.
Фиг. 23.5. Электрический колебательный контур, состоящий из сопротивления, индуктивности и емкости.
Сумма этих напряжений дает нам полное напряжение
(23.17)
Мы видим, что это уравнение в точности совпадает с механическим уравнением (23.6); будем решать его точно таким же способом. Предположим, что V(t) осциллирует; для этого надо соединить цепь с генератором синусоидальных колебаний. Тогда можно представить V(t) как комплексное число V, помня, что для определения настоящего напряжения V(t) это число надо еще умножить на exp(iωt) и взять действительную часть. Аналогично можно подойти и к заряду q, а поэтому напишем уравнение, в точности повторяющее (23.8): вторая производная ^q— это (iω)2^q, а первая — это (iω)^q. Уравнение (23.17) перейдет в
последнее равенство запишем в виде
(23.18)
где ω20=1/LC, а γ=R/L. Мы получили тот же знаменатель, что и в механической задаче, со всеми его резонансными свойствами! В табл. 23.1 приведен перечень аналогий между электрическими и механическими величинами.
Таблица 23.1 МЕХАНИЧЕСКИЕ И ЭЛЕКТРИЧЕСКИЕ ВЕЛИЧИНЫ
Еще одно чисто техническое замечание. В книгах по электричеству используют другие обозначения. (Очень часто в книгах на одну и ту же тему, написанных людьми разных специальностей, используются различные обозначения.) Во-первых, для обозначения √-1 используют букву j, а не i (через i должен обозначаться ток!). Во-вторых, инженеры предпочитают соотношение между ^V и ^I, а не между ^V и ^q. Они так больше привыкли. Поскольку ^I=d^q/dt=iω^q, то вместо ^q можно подставить ^I/iω, и тогда
(23.19)
Можно слегка изменить исходное дифференциальное уравнение (23.17), чтобы оно выглядело более привычно. В книгах часто попадается такое соотношение:
(23.20)
Во всяком случае, мы находим, что соотношение (23.19) между напряжением ^V и током ^I то же самое, что и (23.18), и отличается только тем, что последнее делится на iω. Комплексное число R +iωL+1/iωC инженеры-электрики часто называют особым именем: комплексный импеданс ^Z. Введение новой буквы позволяет просто записать соотношение между током и сопротивлением в виде ^V=^Z^I. Объясняется это пристрастие инженеров тем, что в юности они изучали только цепи постоянного тока и знали только сопротивления и закон Ома: V=RI. Теперь они более образованы и имеют уже цепи переменного тока, но хотят, чтобы уравнения были те же самые. Вот они и пишут ^V=^Z^I, и единственная разница в том, что теперь сопротивление заменено более сложной вещью: комплексным числом. Они настаивают на том, что они не могут использовать принятого во всем мире обозначения для мнимой единицы и пишут j; поистине удивительно, что они не требуют, чтобы вместо буквы Z писали букву R! (Много волнений доставляют им разговоры о плотности тока; ее они тоже обозначают буквой j. Сложности науки во многом связаны с трудностями в обозначениях, единицах и прочих выдумках человека, о чем сама природа и не подозревает.)
§ 4. Резонанс в природе
Хотя мы детально разобрали вопрос о резонансе в электрических цепях, можно приводить пример за примером из любых наук и отыскивать в них резонансные кривые. В природе очень часто что-нибудь «колеблется» и так же часто наступает резонанс. Об этом уже говорилось в одной из предыдущих глав; приведем теперь некоторые примеры. Зайдите в библиотеку, возьмите с полки несколько книг, полистайте их; вы обнаружите кривые, похожие на кривые фиг. 23.2, и уравнения, похожие на уравнения, приведенные в этой главе. Много ли найдется таких книг? Для убедительности возьмем всего пять-шесть книг, и они обеспечат вас полным набором примеров резонансов.
Первые два относятся к механике. Самый первый грандиозен — речь идет о колебаниях атмосферы. Если бы атмосфера, которая, по нашим представлениям, шарообразна и обволакивает нашу Землю равномерно со всех сторон, под влиянием Луны вытянулась бы в одну сторону, то атмосфера приняла бы форму вытянутой дыни. Если предоставить атмосферу, имеющую форму дыни, самой себе, то возникнут колебания. Так получается осциллятор. Этими колебаниями управляет Луна, которая вращается вокруг Земли. Чтобы понять, как это происходит, представим себе, что Луна стоит неподвижно на каком-то расстоянии от Земли, а Земля вращается вокруг своей оси. Поэтому проекция силы, скажем, на ось х имеет периодическую составляющую. Отклик атмосферы на приливно-отливные толчки Луны будет обычным откликом осциллятора на периодическую силу. Кривая b на фиг. 23.6 изображает ожидаемый отклик атмосферы (кривая а приведена на заимствованном нами рисунке из книги Мунка и Мак-Дональда по другому поводу и нас не касается). Может показаться странным, что удалось начертить эту кривую: ведь Земля вращается с постоянной скоростью, и поэтому можно получить только одну точку на кривой — точку, приблизительно соответствующую периоду 12 — 12,7 час (приливы бывают дважды в сутки) плюс еще немного, потому что надо учесть движение Луны. Но, измеряя величину атмосферных приливов и время их задержки — фазу, можно найти обе характеристики отклика ρ и θ. По ним можно вычислить ω0 и γ а затем начертить уже всю кривую! Вот пример чистой науки. Из двух чисел получают два числа, по этим двум числам чертят очень красивую кривую, которая, конечно, проходит через ту же точку, по которой построена кривая! Кривая эта, конечно, бесполезна, пока нельзя измерить еще чего-нибудь, а в геофизике сделать это зачастую очень трудно. В нашем случае тем, что нужно было бы еще измерить, могут служить колебания атмосферы с собственной частотой ω0; необходимо какое-то возмущение, которое бы заставило атмосферу колебаться с частотой ω0. Такой случай однажды представился. В 1883 г. произошло извержение вулкана Кракатау, в результате которого в атмосферу взлетело пол-острова. Взрыв был такой, что удалось измерить период колебаний атмосферы. Он оказался равным 101/2 час. Собственная частота ω0, полученная из кривой фиг. 23.6, была равна 10 час 20 мин; таким образом было получено по крайней мере хоть одно подтверждение правильности наших представлений об атмосферных приливах.
Фиг. 23.6. Влияние внешнего возбуждения на атмосферу.
Во втором примере речь пойдет о совсем малых колебаниях. Мы рассмотрим кристалл хлористого натрия, который состоит из расположенных друг возле друга ионов натрия и хлора (мы об этом говорили ранее). Ионы эти несут электрический заряд: первый — положительный, второй — отрицательный. Посмотрим, какие интересные колебания могут возникнуть в кристалле. Если отодвинуть все положительные заряды вправо, а отрицательные — влево и предоставить их самим себе, то они начнут колебаться взад и вперед: решетка ионов натрия против решетки ионов хлора. Но как растащить эти заряды? Очень просто: если внести кристалл в электрическое поле, оно отодвинет положительные заряды в одну сторону, а отрицательные — в другую! Значит, имея внешнее электрическое поле, можно, пожалуй, вызвать колебания кристалла. Но для этого частота электрического поля должна быть столь большой, что она соответствует инфракрасному излучению! Таким образом попытаемся построить резонансную кривую, измеряя поглощение инфракрасного света хлористым натрием. Такая кривая изображена на фиг. 23.7.
Фиг. 23.7. Прохождение инфракрасного излучения через тонкую (0,17 мк) пленку поваренной соли.
По абсциссе отложена не частота, а длина волны, но это техническая деталь; между частотой и длиной волны существует строго определенное соотношение, так что мы все-таки имеем дело со шкалой частот, и одна из этих частот— резонансная частота.
Ну, а что можно сказать о ширине резонансной кривой? Чем эта ширина определяется? Очень часто кривая выглядит гораздо шире, чем ей предписывается теоретическим значением γ (эта ширина называется естественной шириной). Есть две причины уширения резонансной кривой. Мы наблюдаем колебания многих осцилляторов сразу, а их частоты могут немного отличаться. К этому приводят, например, натяжения в отдельных частях кристалла. Поэтому мы видим сразу много резонансных кривых, проходящих рядом. Они сливаются в одну кривую с большей шириной. Вторая причина очень проста — не всегда можно точно измерить частоту. Сколько со спектрометром ни возись, он всегда зарегистрирует не одну частоту, а целый спектр частот Δω. Поэтому может оказаться, что разрешающая сила спектрометра недостаточна для определения точной формы кривой. Так или иначе, но, глядя на фиг. 23.7, трудно сказать, что там за ширина — естественная или та, что соответствует неоднородностям кристалла или разрешающей силе спектрометра.
Еще один пример —более хитрый. Посмотрим, как качается магнит. Если поместить магнит в постоянное магнитное поле, то северный полюс захочет повернуться в одну сторону, а южный — в другую, и если магнит может поворачиваться вокруг оси, он будет колебаться около положения равновесия, как это делает стрелка компаса. Однако магниты, о которых пойдет речь,— это атомы. Они обладают моментом количества движения, и вращение порождает не простое движение в направлении поля, а прецессию. Посмотрим со стороны на какую-нибудь составляющую «шатаний», а потом возмутим колебания или попробуем управлять ими, чтобы затем измерить поглощение.
На фиг. 23.8 изображена кривая поглощения — типично резонансная кривая.
Фиг. 23.8. Зависимость потери, магнитной энергии в парамагнитном органическом соединении от напряженности приложенного поля.
Только получена она немного не так, как предыдущая. Частота горизонтального поля, управляющего колебаниями, все время остается постоянной, хотя, казалось бы, экспериментатор, чтобы получить кривую, должен менять частоту. Можно поступить и так, но технически легче оставить ω неизменной, а менять напряженность постоянного поля, что соответствует изменению ω0 в нашей формуле. Таким образом мы имеем дело с резонансной кривой для ω0. Тем не менее мы получаем резонанс с определенными ω0 и γ.
Пойдем дальше. Следующий наш пример связан с атомным ядром. Движение протонов и нейтронов в ядре — в некотором смысле колебательное движение. Убедиться в этом можно при помощи такого эксперимента: давайте обстреливать ядра лития протонами. Мы обнаружим, что в ядрах при этом будут происходить какие-то реакции, в результате которых возникает γ-излучение. Кривая, изображающая количество испущенного излучения, имеет очень острый, типично резонансный максимум. Это изображено на фиг. 23.9.
Фиг. 23.9. Зависимость интенсивности γ-излучения лития от энергии налетающих протонов. Пунктирная кривая —теоретическая, вычисленная для протонов с моментом количества движения l=0.
Однако приглядитесь к рисунку повнимательнее: на горизонтальной шкале отложена не частота, как обычно, а энергия! Дело в том, что та величина, которую в классической физике мы привыкли считать энергией, в квантовой механике оказывается определенным образом связанной с частотой некоторой волны. Если в привычной нам крупномасштабной физике при анализе какого-нибудь явления приходится иметь дело с частотой, то в квантовомеханических явлениях, связанных с атомным веществом, аналогичные кривые будут зависеть от энергии. Кривая на фиг. 23.9 иллюстрирует эту связь. Размышляя над этой кривой, можно прийти к мысли, что частота и энергия имеют глубокую взаимосвязь; так оно и есть на самом деле.
Вот еще одна резонансная кривая, полученная в результате опытов с атомными ядрами; она очень узкая, уже всех предыдущих. На фиг. 23.10 величина ω0 соответствует энергии 10 000 эв, а ширина γ равна приблизительно 10-5 эв; иначе говоря, Q=1010!
Фиг. 23.10. Кривая поглощения γ-излучения, полученная Р. Мёссбауэром.
Построив такую кривую, экспериментатор измерил Q самого добротного из ныне известных осцилляторов. Это проделал Р. Мёссбауэр, получивший за свои работы Нобелевскую премию. На горизонтальной шкале отложена скорость, потому что для сдвига частоты использовался эффект Допплера, получающийся в результате относительного движения источника и поглотителя. Цифры дают некоторое представление о тонкости эксперимента — пришлось измерять скорости в несколько сантиметров в секунду! Если продолжить горизонтальную шкалу влево, то нулевую частоту мы найдем на расстоянии 1010 см! Страницы для этого, пожалуй, не хватит!
Наконец, возьмем какой-нибудь выпуск журнала Physical Review, скажем, за 1 января 1962 г. Найдется ли в нем резонансная кривая? Резонансные кривые имеются непременно в каждом выпуске этого журнала, и на фиг. 23.11 изображена одна из таких кривых.
Фиг. 23.11. Зависимость эффективных сечений реакций от величины момента количества движения. а — K—+p→Λ+π++π—; б — K—+p→K0+n. Нижняя кривая описывает нерезонансный фон; верхняя кривая показывает, что на зтот фон наложено резонансное сечение.
Это очень интересная кривая. Она соответствует резонансу в реакциях со странными частицами (K--мезоны и протоны). Резонанс был обнаружен при измерении количества частиц разных сортов, получающихся в результате реакции. Разным продуктам реакции соответствуют разные кривые, но в каждой из них при одной и той же энергии есть пики примерно одинаковых очертаний. Значит, при определенной энергии K--мезона существует резонанс. При столкновении К--мезонов и протонов, наверное, создаются благоприятные для резонанса условия, а может быть, даже новая частица. Сегодня мы еще не можем сказать, что такое эти выбросы в кривых — «частица» или просто резонанс. Очень узкий резонанс соответствует очень точно отмеренному количеству энергии; это бывает тогда, когда мы имеем дело с частицей. Когда резонансная кривая уширяется, то становится трудно сказать, с чем мы имеем дело — с частицей, которая живет очень мало, или просто с резонансом в реакции. В гл. 2 мы отнесли эти резонансы к частицам, но когда писалась та глава, об этом резонансе еще не было известно, поэтому нашу таблицу элементарных частиц можно дополнить!
Глава 24 ПЕРЕХОДНЫЕ РЕШЕНИЯ
§ 1. Энергия осциллятора
Хотя глава названа «Переходные решения», речь здесь все еще в основном идет об осцилляторе, на который действует внешняя сила. Мы еще ничего не говорили об энергии колебаний. Давайте займемся ею.
Чему равна кинетическая энергия осциллятора? Она пропорциональна квадрату скорости. Здесь мы затронули важный вопрос. Предположим, что мы изучаем свойства некоторой величины А; это может быть скорость или еще что-нибудь. Мы обратились к помощи комплексных чисел: A=^Aexp(iωt), но в физике праведна и чтима только действительная часть комплексного числа. Поэтому если вам для чего-нибудь понадобится получить квадрат А, то не возводите в квадрат комплексное число, чтобы потом выделить его действительную часть.
Действительная часть квадрата комплексного числа не равна квадрату действительной части, она содержит еще и мнимую часть первоначального числа. Таким образом, если мы захотим найти энергию и посмотреть на ее превращения, нам придется на время забыть о комплексных числах.
Итак, истинно физическая величина А — это действительная часть A0exp[i(ωt+Δ)], т. е. A=A0соs(ωt+Δ), а комплексное число ^А — это A0exp(iΔ). Квадрат этой физической величины равен A02cos2(ωt+Δ). Он изменяется от нуля до максимума, как это предписывается квадратом косинуса. Максимальное значение квадрата косинуса равно 1, минимальное равно 0, а его среднее значение — это 1/2.
Зачастую нас совсем не интересует энергия в каждый данный момент колебания; во многих случаях достаточно знать лишь среднюю величину A2 (среднее значение квадрата А в течение времени, много большего, чем период колебаний). При этих условиях можно усреднить квадрат косинуса и доказать теорему: если А представляется комплексным числом, то среднее значение А2 равно 1/2A02. Здесь А02 — это квадрат модуля комплексного числа А. (Квадрат модуля ^A записывают по-разному: |^A|2 или ^A^A*— в виде произведения числа ^A на комплексно сопряженное.) Эта теорема пригодится нам еще много раз.
Итак, речь идет об энергии осциллятора, на который действует внешняя сила. Движение такого осциллятора описывается уравнением
(24.1)
Мы, конечно, предполагаем, что F(t) пропорциональна cosωt. Выясним теперь, много ли приходится этой силе работать. Работа, произведенная силой в 1 сек, т. е. мощность, равна произведению силы на скорость. [Мы знаем, что работа, совершаемая за время dt, равна Fdx, а мощность равна F(dx/dt).] Значит,
(24.2)
Как легко проверить простым дифференцированием, первые два члена можно переписать в виде (d/dt)[1/2m(dx/dt)2+1/2mω02x2]. Выражение в квадратных скобках — производная по времени суммы двух членов. Это понятно; ведь первый член суммы — кинетическая энергия движения, а второй — потенциальная энергия пружины. Назовем эту величину запасенной энергией, т. е. энергией, накопленной при колебаниях. Давайте усредним мощность по многим циклам, когда сила включена уже давно и осциллятор изрядно наколебался. Если пробег длится долго, запасенная энергия не изменяется; производная по времени дает эффект, в среднем равный нулю. Иными словами, если усреднить затраченную за долгое время мощность, то вся энергия поглотится из-за сопротивления, описываемого членом γm(dx/dt)2. Определенную часть энергии осциллятор, конечно, запасет, но если усреднять по многим циклам, то количество ее не будет меняться со временем. Таким образом, средняя мощность <P> равна
(24.3)
Применяя метод комплексных чисел и нашу теорему о том, что <А2>=1/2A02, легко найти эту среднюю мощность. Так как x=^xexp(iωt), то dx/dt=iω^xexp(iωt). Следовательно, средняя мощность равна
(24.4)
Если перейти к электрическим цепям, то dx/dt надо заменить на ток I (I — это dq/dt, где q соответствует х), а mγ — на сопротивление R. Значит, скорость потери энергии (мощности силы) в электрической цепи равна произведению сопротивления на средний квадрат силы тока
(24.5)
Энергия, естественно, переходит в тепло, выделяемое сопротивлением; это так называемые тепловые потери, или джоулево тепло.
Интересно разобраться также в том, много ли энергии может накопить осциллятор. Не путайте этого вопроса с вопросом о средней мощности, ибо хотя выделяемая силой мощность сначала действительно накапливается осциллятором, потом на его долю остается лишь то, что не поглотило трение. В каждый момент осциллятор обладает вполне определенной энергией, поэтому можно вычислить среднюю запасенную энергию <E>. Мы уже вычислили среднее значение (dx/dt)2, так что
(24.6)
Если осциллятор достаточно добротен и частота ω близка к ω0, то |^х| — большая величина, запасенная энергия очень велика и можно накопить очень много энергии за счет небольшой силы. Сила производит большую работу, заставляя осциллятор раскачиваться, но после того, как установилось равновесие, вся сила уходит на борьбу с трением. Осциллятор располагает большой энергией, если трение очень мало, и потери энергии невелики даже при очень большом размахе колебаний. Добротность осциллятора можно измерять величиной запасенной энергии по сравнению с работой, совершенной силой за период колебания.
Что это за величина — накопленная энергия по сравнению с работой силы за цикл? Ее обозначили буквой Q. Величина Q — это умноженное на 2π отношение средней запасенной энергии к работе силы за один цикл (можно рассматривать работу не за цикл, а за радиан, тогда в определении Q исчезнет 2π)
(24.7)
Пока Q не слишком велика — это плохая характеристика системы, если же Q довольно большая величина, то можно сказать, что это мера добротности осциллятора. Многие пытались дать самое простое и полезное определение Q; разные определения немногим отличаются друг от друга, но если Q очень велика, то все они согласуются друг с другом. При самом общем определении по формуле (24.7) Q зависит от ω. Если мы имеем дело с хорошим осциллятором вблизи резонансной частоты, то (24.7) можно упростить, положив ω=ω0, тогда Q=ω0/γ, такое определение Q было дано в предыдущей главе. Что такое Q для электрической цепи? Чтобы найти эту величину, надо заменить m на L, mγ на R и mω02 на 1/С (см. табл. 23.1). Тогда Q в точке резонанса равна Lω/R, где ω — резонансная частота. В цепи с большой Q запасенная цепью энергия велика по сравнению с работой за один цикл, производимой поддерживающей колебания в цепи машиной.
§ 2. Затухающие колебания
Вернемся к основной теме — переходным решениям. Переходными решениями называются решения дифференциального уравнения, соответствующие ситуации, когда внешняя сила не действует, но система тем не менее не находится в покое. (Конечно, лучше всего решать задачу, когда сила не действует, а система покоится, покоится — ну и пусть покоится!) Соответствующие переходным решениям колебания можно вызвать так: заставить силу поработать, а потом выключить ее. Что тогда случится с осциллятором? Сначала подумаем, как будет вести себя система с очень большой Q. Если сила действовала долго, то запасенная энергия была постоянной и работа тратилась лишь для того, чтобы поддержать ее. Предположим теперь, что мы выключили силу, тогда трению, которое раньше поглощало энергию поставщика, питаться больше нечем — кормильца-то нет. И трение начинает пожирать запасенную осциллятором энергию. Пусть добротность системы Q/2π=1000. Это значит, что работа, произведенная за цикл, равна 1/1000 запасенной энергии. Пожалуй, разумно предположить, что при не поддерживаемых внешней силой колебаниях за каждый цикл будет теряться одна тысячная часть имеющейся к началу цикла энергии. Будем считать, что при больших Q изменение энергии описывается угаданным нами приближенным уравнением (мы еще вернемся к этому уравнению и сделаем его совсем верным!)
(24.8)
Уравнение это приближенное, потому что оно справедливо только для больших Q. За каждый радиан система теряет 1/Q часть запасенной энергии Е. Значит, за промежуток времени dt энергия уменьшится в ωdt/Q раз (частота появляется при переводе радианов в настоящие секунды). А какая это частота? Предположим, что система устроена очень жестко, поэтому даже при действии силы она сколько-нибудь заметно колеблется только со своей собственной частотой. Поэтому будем считать, что ω — это резонансная частота ω0. Таким образом, из уравнения (24.8) следует, что запасенная энергия меняется следующим образом:
(24.9)
Теперь нам известно значение энергии в любой момент. Какой будет приближенная формула, определяющая амплитуду колебаний как функцию времени? Той же самой? Нет! Потенциальная энергия пружины изменяется как квадрат смещения, кинетическая энергия — как квадрат скорости; это приводит к тому, что полная энергия пропорциональна квадрату смещения. Таким образом, смещение (амплитуда колебаний) будет уменьшаться с половинной скоростью. Иначе говоря, мы ожидаем, что решение в случае затухающего переходного движения будет выглядеть как колебание с частотой, близкой к резонансной частоте ω0; амплитуда этого колебания будет уменьшаться как exp(-γt/2)
(24.10)
Эта формула и фиг. 24.1 дают представление о том, чего следует ожидать, а теперь приступим к точному анализу движения, т. е. к решению дифференциального уравнения движения.
Фиг. 24.1. Затухающие колебания.
Как же решить уравнение (24.1), если выкинуть из него внешнюю силу? Будучи физиками, мы интересуемся не столько методом, сколько самим решением. Поскольку мы люди уже опытные, попытаемся представить решение в виде экспоненциальной кривой, х=Аexp(iαt). (Почему мы так поступили? Оттого, что экспоненту легче всего дифференцировать!) Подставим это выражение в (24.1), помня о том, что каждое дифференцирование х по времени сводится к умножению на iα [напомним, что F(t)=0]. Сделать это очень легко, и наше уравнение примет вид
(24.11)
Левая часть равенства должна быть равна нулю все время, но это возможно только в двух случаях: а) А=0, однако это даже и не решение: ведь тогда все покоится, или б)
(24.12)
Если мы сможем решить это уравнение и найти α, то мы найдем и решение, амплитуда которого А не обязательно равна нулю!
(24.13)
Чтобы не думать о том, как извлечь квадратный корень, предположим, что γ/2 меньше ω0, и поэтому ω02-γ2/4 — положительная величина. Беспокоит другое: почему мы получили два решения! Им соответствуют
(24.14)
и
(24.15)
Займемся пока первым решением, предположив, что мы ничего не знаем о том, что квадратный корень принимает два значения. В этом случае смещение х равно x1=Aexp(iα1t), где А — произвольная постоянная. Чтобы сократить запись, введем специальное обозначение для входящего в α1 квадратного корня: √(ω02-γ2/4)=ωγ
Так, iα1=—γ/2+iωγ и x=Aexp[—(γ/2-iωγ)t], или, если воспользоваться замечательным свойством экспоненты,
(24.16)
Итак, система осциллирует с частотой ωγ, которая в точности не равна частоте ω0, но практически близка к ней, если система достаточно добротна. Кроме того, амплитуда колебаний экспоненциально затухает! Если взять действительную часть (24.16), то мы получим
(24.17)
Это решение очень напоминает угаданное нами решение (24.10), вот только частота немного другая, ωγ. Но это лишь небольшая поправка, значит, первоначальная идея была правильной. И все-таки не все благополучно! А не благополучно то, что существует второе решение.
Этому решению соответствует α2, и оно отличается от первого лишь знаком ωγ
(24.18)
Что все это значит? Скоро мы докажем, что если x1 и х2— возможные решения (24.1) при F(t)=0, то х1+х2—тоже решение этого уравнения! Таким образом, общее решение имеет вид
(24.19)
Теперь можно спросить: «А, собственно, зачем нам беспокоить себя еще одним решением, если нас вполне устраивало первое? К чему эти дополнительные решения, если мы все равно должны взять только действительную часть?» Мы знаем, что нужно взять действительную часть, но откуда математика знает, что мы хотим взять действительную часть? Когда у нас была внешняя сила F(t), то мы ее дополнили искусственной силой, и она каким-то образом управляла мнимой частью уравнения. Но когда мы положили F(t)≡0, то соглашение о том, что, каково бы ни было х, нужно взять только его действительную часть, стало нашим личным делом, и математическое уравнение об этом ничего не знало. В мире физики есть только действительные решения, но решение, которому мы так радовались, комплексно. Уравнению не известно, что мы делаем совершенно неожиданный шаг и отбираем только действительную часть, и оно предлагает нам еще, так сказать, комплексно сопряженное решение, чтобы, сложив оба решения, мы получили настоящее действительное решение; вот для чего мы взяли еще и α2. Чтобы х было действительным, Bexp(-iωγt) должно быть комплексно сопряженным к Aexp(iωγt) числом, тогда мнимая часть исчезнет. Таким образом, B должно быть комплексно сопряжено с А, поэтому наше решение имеет вид
(24.20)
Значит, наши колебания — это колебания с фазовым сдвигом и, как полагается, с затуханием.
§ 3. Переходные колебания в электрических цепях
Посмотрим, как выглядят переходные колебания. Для этого соберем цепь, изображенную на фиг. 24.2.
Фиг. 24,2. Электрическая цепь для демонстраций переходных колебаний.
В этой цепи разность потенциалов между концами индуктивности L поступает в осциллоскоп. Неожиданное включение рубильника S включает дополнительное напряжение и вызывает в осцилляторной цепи переходные колебания. Эти колебания аналогичны колебаниям механического осциллятора, вызванными неожиданным ударом. Сама цепь представляет собой электрический аналог механического осциллятора с затуханием, и мы можем наблюдать колебания при помощи осциллоскопа. Он покажет нам кривые, анализом которых мы и займемся. На фиг. 24.3—24.6 представлены кривые затухающих колебаний, полученные на экране осциллоскопа. На фиг. 24.3 показаны затухающие колебания в цепи с большой Q, т. е. с малым значением γ.
Фиг. 24.3. Затухающие колебания.
В такой цепи колебания затухают не очень быстро; мы видим довольно длинную синусоиду с медленно убывающим размахом.
Теперь давайте посмотрим, что произойдет, если мы будем уменьшать Q, так что колебания должны затухать быстрее. Чтобы уменьшить Q, увеличим сопротивление цепи R. При повороте ручки сопротивления колебания действительно затухают скорее (фиг. 24.4).
Фиг. 24.4. Колебания затухают быстрее.
Если еще увеличить сопротивление, то колебания затухнут еще быстрее (фиг. 24.5).
Фиг, 24.5. Колебания почти исчезли.
Но если сопротивление увеличить сверх некоторого предела, колебаний мы вообще не увидим. А может быть, нам просто отказывают глаза? Увеличим еще сопротивление и получим тогда кривую, представленную на фиг. 24.6; по ней можно лишь с натяжкой сказать, что в цепи произошли колебания, ну разве что одно.
Фиг. 24.6. Колебаний нет.
Можем ли мы математически объяснить это явление?
Сопротивление механического осциллятора, конечно, пропорционально γ. В нашем случае γ — это R/L. Теперь, если увеличивать γ, то в столь приятных нам решениях (24.14) и (24.15) наступает беспорядок; когда γ/2 становится больше ω0, решения приходится записывать по-другому:
Это снова два решения, которые приводят нас к решениям exp(iα1t) и exp(iα2t). Подставив теперь α1, получим
Никаких колебаний. Чисто экспоненциальное убывание. То же самое дает и второе решение
Заметим, что квадратный корень не может превысить γ/2; даже если ω0=0, оба члена равны. Если же ω20 отличается от γ2/4, то квадратный корень меньше γ/2 и выражение в круглых скобках всегда положительно. Это очень хорошо! Почему? Да потому что если бы это выражение было отрицательным, то е пришлось бы возводить в положительную степень и мы получили бы возрастающее со временем решение. Но при увеличении в цепи сопротивления колебания не могут возрастать, значит, мы избегли противоречия. Итак, мы получили два решения; оба решения экспоненциально затухают, но одно из них стремится «умереть» гораздо скорее. Общее решение, конечно, представляет собой комбинацию обоих решений, а значения коэффициентов А и В зависят от того, как начинаются колебания, каковы начальные условия. В нашей цепи случилось так, что А — отрицательное число, а В — положительное, поэтому на экране осциллоскопа мы увидели разность двух экспонент.
Давайте обсудим, как найти коэффициенты А и В (или А и A*), если известны начальные условия. Предположим, что в момент t=0 нам известны смещение х=х0 и скорость dx/dt=v0. Если в соотношения
подставить значения t=0, х=х0, dx/dt=v0 и воспользоваться тем, что е0=еi0=1, то мы получим
где A=AR+iAI, A*=AR — iAI. Значит,
(24.21)
Таким образом, зная начальные условия, мы полностью определили А и А*, а значит, и кривую переходного решения. Можно записать решение и по-другому. Вспомним, что
тогда
(24.22)
где ωγ=+√(ω20-(γ2/4). Мы получили формулу затухающих колебаний. Такая формула нам не понадобится, однако отметим ее особенности, справедливые и в более общих случаях.
Прежде всего поведение системы, на которую не действует внешняя сила, описывается суммой (суперпозицией) временных экспонент [мы записали их в виде exp(iαt)]. Такое решение хорошо передает истинное положение вещей. В общем случае α — это комплексное число, и его мнимая часть соответствует затуханию колебаний. Наконец, тесная математическая связь синусоидальных и экспоненциальных функций, о которой говорилось в гл. 22, физически часто проявляется в переходе от колебаний к чисто экспоненциальному затуханию при критических значениях некоторых параметров системы (в нашем случае это было сопротивление γ).
Глава 25 ЛИНЕЙНЫЕ СИСТЕМЫ И ОБЗОР
§ 1. Линейные дифференциальные уравнения
В этой главе мы снова вернемся к некоторым аспектам наших колебательных систем, только постараемся теперь увидеть нечто более общее, стоящее за спиной каждой частной системы. Изучение каждой колебательной системы сводилось к решению дифференциального уравнения
(25.1)
Эта комбинация «операций» над переменной х обладает интересным свойством: если вместо х подставить (х+у), получится сумма одинаковых операций над х и y, а умножение х на число а сводится к умножению на это число первоначальной комбинации. Это легко доказать. Чтобы не переутомиться, записывая все буквы, вошедшие в (25.1), давайте введем «скорописные» обозначения. Обозначим всю левую часть уравнения (25.1) символом _L(х). Увидев такой символ, вы должны мысленно представить себе левую часть уравнения (25.1). Поэтому, согласно этой системе, символ _L(x+y) будет означать следующее:
(25.2)
(Подчеркнем букву _L, чтобы не спутать этот символ с обычной функцией.) Иногда мы будем употреблять термин операторная запись, но совершенно безразлично, какими словами это называть, просто-напросто это «скоропись». Наше первое утверждение, что
(25.3)
следует из соотношений а(х+у)=ах+ау, d(x+y)/dt=dx/dt+-dy/dt и т. д.
Легко доказать, что для постоянного а
(25.4)
[Соотношения (25.3) и (25.4) тесно связаны одно с другим, потому что, подставив в (25.3) х+х, мы получим (25.4) для частного значения а=2 и т. д.]
Решая более сложные задачи, можно получить _L, в котором содержится больше членов и более высокие производные. Обычно первым делом интересуются, справедливы ли соотношения (25.3) и (25.4). Если они выполняются, то задачу называют линейной. В этой главе мы изучим некоторые свойства систем, следующие только из того факта, что система линейная. Это поможет нам понять общность некоторых свойств изученных ранее частных систем.
Давайте изучим некоторые свойства линейных дифференциальных уравнений, причем полезно помнить о хорошо знакомом нам частном уравнении (25.1). Первое интересное свойство: предположим, что мы решаем дифференциальное уравнение для переходных движений: свободных колебаний без действия внешних сил. Нам предстоит решить уравнение
(25.5)
Предположим, что мы как-то исхитрились одолеть это уравнение и нашли его частное решение х1. Это значит, что нам известна функция x1, для которой _L(x1)=0. После этого можно заметить, что ax1— тоже решение нашего уравнения; можно умножить частное решение уравнения на любую постоянную и получить новое решение. Иначе говоря, если какое-либо решение позволяет частице продвинуться на определенное расстояние, то она может совершить и более длинный рейс. Доказательство: _L(ax1)=a_L(x1)=a·0=0.
Предположим теперь, что нам удалось все-таки найти не одно частное решение x1, но и второе х2 (напомним, что когда мы в поисках переходного решения подставляли x=exp(iαt), то мы нашли два значения α, т. е. два решения: x1 и х2). Покажем теперь, что комбинация x1+x2 — тоже решение. Иными словами, если положить x=x1+x2, то х — это опять решение уравнения. Почему? Потому что если _L(x1)=0 и _L(x2)=0, то _L(x1+x2)=_L(x1)+_L(x2)=0+0=0. Таким образом, мы вправе складывать отдельные решения, описывающие движения линейной системы.
Продолжая в том же духе, мы можем сложить шесть первых и два вторых решения; ведь если x1 есть решение, то αx1 — тоже решение. Другими словами, любая сумма двух решений, например αx1+βx2, удовлетворяет уравнению. Если нам посчастливится найти три решения, то мы увидим, что любая комбинация трех решений снова удовлетворяет уравнению, и т. д. Поток таких решений можно ограничить независимыми решениями[17]; в случае осциллятора мы получили только два таких решения. Число независимых решений в общем случае зависит от того, что называется числом степеней свободы. Мы не будем сейчас подробно обсуждать этот вопрос, но в случае дифференциального уравнения второго порядка имеются лишь два независимых решения. Если мы найдем оба эти решения, то можно построить общее решение уравнения.
Посмотрим, что будет, когда на систему действует внешняя сила. Предположим, что нам встретилось уравнение
(25.6)
и мы нашли его частное решение. Назовем его решением Джо xД, т. е. _L(xД)=F(t). Хотелось бы найти еще одно решение этого уравнения. Добавим к решению Джо какое-нибудь решение свободного уравнения (25.5), например x1. Тогда, вспомнив о (25.3), получим
(25.7)
Следовательно, добавив к решению уравнения (25.6) любое «свободное» решение, мы получим новое решение. Свободное решение называют еще переходным решением.
Если неожиданно включить внешнюю силу, то движение осциллятора не сразу будет описываться равновесным (синусоидальным) решением: сначала к нему будут примешиваться переходные решения, которые, если подождать подольше, в конце концов «вымрут». Равновесное решение «выживет», потому что только оно соответствует внешней силе. В конце концов это будет единственным решением, но начальные движения системы зависят от того, какие обстоятельства сопутствуют включению силы.
§ 2. Суперпозиция решений
Перейдем теперь к другой интересной проблеме. Предположим, что нам задана какая-нибудь внешняя сила Fa (например, периодическая сила с частотой ω=ωа, но наши выводы будут верны для любой зависимости силы от времени) и мы нашли движение, соответствующее этой силе (переходные движения можно учитывать или не учитывать, это неважно). Предположим, что мы решили еще одну задачу — нашли движение в случае действия силы Fb. После этого предположим, что кто-то вбежал в комнату и сказал: «На контрольной задают задачу с силой Fa+Fb. Что нам делать?» Конечно, мы решим эту задачу — ведь мы сразу обнаружим одно замечательное свойство: сумма решений ха и хb, получаемых в том случае, если брать силы по отдельности, будет решением новой задачи. Для этого надо только вспомнить о (25.3):
(25.8)
Это пример того, что называют принципом суперпозиции для линейных систем, и это очень важная вещь. Дело обстоит так: если мы сможем представить сложную силу в виде суммы нескольких более простых сил и сможем решить уравнение для каждой силы в отдельности, то мы сможем решить и первоначальное уравнение, потому что для этого надо просто объединить куски решения так же, как мы объединяли отдельные силы, чтобы получить полную силу (фиг. 25.1).
Фиг. 25.1. Пример принципа суперпозиции для линейных систем.
Еще один пример принципа суперпозиции. В гл. 12 (вып. 1) говорилось об одном из важнейших фактов, вытекающих из законов электричества. Если нам задано распределение зарядов qa, можно найти электрическое поле Еa, порождаемое этими зарядами в точке Р. Другое распределение зарядов qb порождает в этой же точке поле Eb. Оба эти распределения, действуя вместе, породят в точке Р поле Е, которое представляет собой сумму полей Еа и Еb. Иначе говоря, поле, соответствующее совокупности многих зарядов,— это векторная сумма полей, соответствующих отдельным зарядам. Аналогия с предыдущим примером бросается в глаза: ведь если мы знаем результат действия отдельных сил, то отклик на силу, являющуюся суммой этих сил, будет суммой отдельных откликов.
Фиг. 25.2. Принцип суперпозиции в электростатике.
Причина справедливости принципа суперпозиции в электричестве состоит в том, что основные законы электричества, определяющие электрическое поле (уравнения Максвелла), — это линейные дифференциальные уравнения, обладающие свойством (25.3). Силам в этих уравнениях соответствуют заряды, порождающие электрическое поле, а уравнения, определяющие электрическое поле по заданным зарядам,— линейные уравнения.
Чтобы придумать еще один пример принципа суперпозиции, спросите себя, как вам удается настроить свой радиоприемник на определенную радиостанцию, хотя одновременно работает очень много станций. Сигналы радиостанций — это колеблющиеся электрические поля очень высокой частоты, действующие на антенну радиоприемника. Амплитуда этих колебаний, правда, меняется, их модулирует голос диктора, но скорость этих изменений очень мала и об этом можно пока забыть. Когда вы слышите: «Станция работает на частоте 780 килогерц», это значит, что частота излучаемого антенной радиостанции электромагнитного поля равна 780 000 колебаний в секунду и это поле с точно такой же частотой раскачивает электроны в антенне вашего приемника. Но ведь в то же самое время поблизости может работать и другая радиостанция на другой частоте, скажем на частоте 550 кгц. Эта станция тоже раскачивает электроны вашей антенны. Как же отделяются сигналы, поступающие в приемник с частотой 780 кгц, от сигналов, имеющих частоту 550 кгц? Ведь вы же не слышали голоса обоих дикторов одновременно.
Первая часть электрической цепи радиоприемника — это линейная цепь. По принципу суперпозиции ее отклик на электрическое поле Fа+Fb равен ха+хb. По всему выходит, что нам придется слушать обоих дикторов сразу. Но вспомним, что в резонансной цепи кривая отклика х на единичную силу F зависит от частоты примерно так, как это изображено на фиг. 25.3.
Фиг. 25.3. Резонансная кривая с острым максимумом.
В цепи с очень большим значением Q отклик имеет очень острый максимум. Предположим, что обе станции имеют примерно одинаковую мощность, поэтому обе силы имеют примерно одинаковую амплитуду. Отклик равен сумме откликов ха и хb, но на фиг. 25.3 ха громаден, а хb очень мал. Таким образом, хотя оба сигнала одинаковы по силе, в приемнике они проходят через остро резонансную цепь, настроенную на частоту ωа (частоту передач одной из станций), и отклик на эту частоту (станцию) значительно больше отклика на все остальные. Поэтому, несмотря на то что на антенну действуют оба сигнала, полный отклик почти целиком составлен из частоты ωа, и мы можем выбрать ту станцию, какую пожелаем.
Несколько слов о механизме настройки. Как мы настраиваем радиоприемник? Мы изменяли частоту ω0, меняя L или С цепи, потому что частота цепи зависит от комбинации L и С. Большинство радиоприемников устроено так, что в них меняется значение С. Поворачивая ручку настройки приемника, мы изменяем собственную частоту цепи. Пусть какому-то положению ручки соответствует частота ωс; если нет радиостанций, работающих на этой частоте, приемник молчит. Вы продолжаете изменять емкость С цепи, пока не построите кривую отклика с резонансом при частоте ωb, тогда вы услышите другую станцию. Вот так и настраивается радиоприемник; все дело в принципе суперпозиции, в сочетании с резонансным откликом[18].
Чтоб закончить обсуждение, давайте подумаем, как поступить при анализе линейных задач с заданной силой, когда сила очень сложно зависит от времени. Можно поступать по-разному, но есть два особенно удобных общих метода решения таких задач. Первый метод: предположим, что мы можем решить задачу в некоторых частных случаях, например в случае синусоидальных сил разных частот. Решать линейные уравнения в таких случаях — детская забава. Пусть нам и встретился этот «детский» случай. Теперь встает вопрос, нельзя ли представить любую силу в виде суммы двух или более «детских» сил? Мы уже показали на фиг. 25.1 довольно хитрую зависимость силы от времени; если туда добавить еще несколько синусоид, то результирующая кривая будет выглядеть еще сложнее. Таким образом, простенькие «детские» силы могут породить очень сложную силу. Верно и обратное: практически каждая кривая может быть представлена в виде бесконечной суммы синусоидальных волн разной длины волн (или частоты). Таким образом, мы знаем, как представить заданную силу F в виде синусоидальных волн, поэтому решение х можно представить в виде суммы F синусоидальных волн, каждая из которых умножается на эффективное отношение х к F. Такой метод решения называют методом преобразования Фурье, или анализом (разложением) Фурье. Мы не будем сейчас делать такого разложения; пока достаточно только идеи.
Очень интересен другой способ решения сложных задач. Предположим, что кто-то после больших умственных усилий решил заданную нам задачу в случае одной частной силы — импульсной. Сила внезапно и быстро действует на систему, затем выключается и все опять спокойно. Нам теперь достаточно решить такую задачу лишь в случае единичной силы, потом умножением на подходящее число мы сможем получить любые силы. Мы знаем, что осциллятор откликается на импульсную силу затухающими колебаниями. А как быть в случае другой силы, например силы, изображенной на фиг. 25.4?
Фиг. 25.4. Сложную силу можно представить как последовательность коротких импульсов.
Такую силу можно представить в виде последовательных ударов молотком. Сначала всюду стоит тишина, потом кто-то берет в руки молоток и внезапно раздаются равномерные удары — удар, удар, удар, удар, ... и опять все тихо. Иначе говоря, непрерывно действующую силу можно представить в виде ряда последовательных импульсов, быстро следующих один за другим. Мы знаем последствия одного импульса, а последствием серии импульсов будет ряд затухающих колебаний; нарисуйте кривую колебаний для первого импульса, затем, немного отступя, такие же кривые для второго импульса, третьего и т. д. Потом сложите все кривые. Таким образом математически можно представить полное решение в случае произвольной силы, если можно решить задачу для импульса. Ответ для любой силы можно получить путем интегрирования. Это метод функции Грина. Функция Грина — это отклик системы на отдельный импульс, а метод функции Грина — это метод анализа действия силы суммированием откликов на импульсы.
Физические принципы, лежащие в основе обоих методов, очень просты; они просто напрашиваются, если понять смысл линейного уравнения, но математические методы содержат довольно сложные интегрирования и т. д.; мы мало подготовлены, чтобы прямо атаковать эти методы. К этому вы еще вернетесь, когда поднабьете руку в математике. Но сама идея методов, право, очень проста.
Наконец, скажем еще, почему линейные системы так важны. Ответ прост: потому что мы умеем решать линейные уравнения! Поэтому большую часть времени мы будем решать линейные задачи. Вторая (и главная) причина заключается в том, что основные законы физики часто линейны. Например, уравнения Максвелла для законов электромагнетизма — линейные уравнения. Великие законы квантовой механики, насколько нам они известны, тоже сводятся к линейным уравнениям. Вот почему мы так много времени уделяем линейным уравнениям: если мы поняли линейные уравнения, мы готовы в принципе понимать очень многие вещи.
Упомянем еще другие ситуации, когда возникают линейные уравнения. Когда отклонения малы, многие функции можно приближенно заменить линейными. Например, точное уравнение движения маятника гласит
(25.9)
Это уравнение решается при помощи эллиптических функций, но легче его решить численно, как мы это делали в гл. 9 (вып. 1) при изучении ньютоновых законов движения. Большинство нелинейных уравнений вообще можно решить лишь численно. Для малых углов sinθ практически равен θ, и в этом случае можно перейти к линейному уравнению. На этом примере можно сообразить, что есть много обстоятельств, при которых малые эффекты линейны (здесь это отклонения маятника на малые углы). Другой пример: если на пружине качается небольшой грузик, сила пропорциональна растяжению пружины. Если сильно потянуть за пружину, она может и порваться, значит, в этом случае сила совсем иначе зависит от расстояния! Линейные уравнения очень важны. Они настолько важны, что физики и инженеры, пожалуй, половину своего времени тратят на решение линейных уравнений.
§ 3. Колебания в линейных системах
Давайте вспомним, о чем мы говорили в нескольких последних главах. Физику колебательных движений очень легко затемнить математикой. На самом-то деле здесь физика очень проста, и если на минуту забыть математику, то мы увидим, что понимаем почти все, что происходит в колебательной системе. Во-первых, если мы имеем дело только с пружинкой и грузиком, то легко понять, почему система колеблется — это следствие инерции. Мы оттянули массу вниз, а сила тянет ее назад; наступает момент, когда сила равна нулю, но грузик не может остановиться мгновенно: у него есть импульс, который заставляет его двигаться. Теперь пружинка тянет грузик в другую сторону, грузик начинает двигаться взад и вперед. Итак, если бы не было трения, то, несомненно, получилось бы колебательное движение, и так оно и есть на самом деле. Но достаточно незначительного трения, чтобы размах следующих колебаний стал меньше, чем раньше.
Что случится потом, после многих циклов? Это зависит от характера и величины трения. Предположим, что мы придумали такое устройство, что при изменении амплитуды сила трения оказывается пропорциональной другим силам — инерции и натяжению. Иначе говоря, при малых колебаниях трение слабее, чем при колебаниях с большой амплитудой. Обычно сила трения таким свойством не обладает, так что можно предположить, что в нашем случае действуют силы трения особого рода — силы, пропорциональные скорости; тогда для больших колебаний эти силы будут больше, а для малых — меньше. Если у нас именно такой вид трения, то в конце каждого цикла система будет находиться в тех же условиях, что и в начале цикла, только всего будет меньше. Все силы будут меньше в тех же пропорциях: сила пружинки немного ослабнет, инерциальные эффекты будут меньше. Ведь теперь и ускорения грузика будут меньше, и сила трения ослабеет (об этом мы позаботились, создавая наше устройство). Если бы мы имели дело с такими силами трения, то увидели бы, что каждое колебание в точности повторяет первое, только амплитуда его стала меньше. Если после первого цикла амплитуда составляла, например, 90% первоначальной, то после второго цикла она будет равна 90% от 90% и т. д., т. е. размах колебаний после каждого цикла уменьшается в одинаковое число раз. Кривая, ведущая себя таким образом,— это экспоненциальная функция. Она изменяется в одинаковое число раз на любых интервалах одинаковой длины. Иначе говоря, если отношение амплитуды одного цикла к амплитуде предыдущего равно а, то такое же отношение для второго цикла равно а2, затем а3 и т. д. Таким образом, амплитуда колебаний после n циклов равна
(25.10)
Но, конечно, n~t, поэтому общее решение будет произведением какой-нибудь периодической функции sinωt или соsωt на амплитуду, которая ведет себя примерно как bt. Если b положительно и меньше единицы, то его можно записать в виде е-c.
Вот почему решение задачи о колебаниях при учете трения будет выглядеть примерно как exp(-ct)cosωt. Это очень просто.
Что случится, если трение не будет таким искусственным; например обычное трение о стол, когда сила трения постоянна по величине, не зависит от размаха колебаний и меняет свое направление каждые полпериода? Тогда уравнения движения станут нелинейными; решить их трудно, поэтому придется прибегнуть к описанному в гл. 2 численному решению или рассматривать по отдельности каждую половину периода. Самым мощным, конечно, является численный метод; с его помощью можно решить любое уравнение. Математический анализ используется лишь для решения простых задач.
Надо сказать, что математический анализ вообще не такое уж могучее средство исследования; с его помощью можно решить лишь простейшие возможные уравнения. Как только уравнение чуть усложняется, его уже нельзя решить аналитически. Численный же метод, с которым мы познакомились в начале курса, позволяет решить любое уравнение, представляющее физический интерес.
Пойдем дальше. Что можно сказать о резонансной кривой? Как объяснить резонанс? Представим сначала, что трения нет и мы имеем дело с чем-то, что может колебаться само по себе. Если подталкивать маятник каждый раз, когда он пройдет мимо нас, то очень скоро маятник начнет раскачиваться, как сумасшедший. А что случится, если мы закроем глаза и, не следя за маятником, начнем толкать его с произвольной частотой, с какой захотим? Иногда наши толчки, попадая не в ритм, будут замедлять маятник. Но когда нам посчастливится найти верный темп, каждый толчок будет достигать маятника в нужный момент и он будет подниматься все выше, выше и выше. Таким образом, если не будет трения, то для зависимости амплитуды от частоты внешней силы мы получим кривую, которая выглядит, как сплошная линия на фиг. 25.5.
Фиг. 25.5. Резонансная кривая, отражающая разнообразные виды трения.
Качественно мы поняли резонансную кривую; чтобы найти ее точные очертания, пожалуй, придется прибегнуть к помощи математики. Кривая стремится к бесконечности, если ω→ω0, где ω0— собственная частота осциллятора.
Предположите, что существует слабое трение. Тогда при незначительных отклонениях осциллятора влияние трения сказывается слабо и резонансная кривая вдали от максимума не изменяется. Однако около резонанса кривая уже не уходит в бесконечность, а просто поднимается выше, чем в остальных местах. Когда амплитуда колебаний достигает максимума, работа, совершенная нами в момент толчка, полностью компенсирует потери энергии на трение за период. Таким образом, вершина кривой закруглена, и она уже не уходит в бесконечность. Чем больше трение, тем больше сглажена вершина кривой. Кто-нибудь может сказать: «Я думал, что ширины резонансных кривых зависят от трения». Так можно подумать, потому что резонансные кривые рисуют, принимая за единицу масштаба вершину кривой. Однако если нарисовать все кривые в одном масштабе (это прояснит дело больше, чем изучение математических выражений), то окажется, что трение срезает вершину кривой! Если трение мало, мы можем подняться высоко по резонансной кривой; когда трение сгладит кривую, мы на том же интервале частот поднимаемся на меньшую высоту, и это создает ощущение ширины. Таким образом, чем выше пик кривой, тем ближе к максимуму точки, где высота кривой равна половине максимума.
Наконец, подумаем, что произойдет при очень большом трении. Ясно, что, если трение очень велико, система вообще не осциллирует. Энергии пружинки едва-едва хватит на борьбу с силами трения, и грузик будет медленно ползти к положению равновесия.
§ 4. Аналогии в физике
Продолжая обзор, заметим, что массы и пружинки — это не единственные линейные системы; есть и другие. В частности, существуют электрические системы (их называют линейными цепями), полностью аналогичные механическим системам. Мы не старались до конца выяснить, почему каждая часть электрической цепи работает так, а не иначе; это нам еще трудно понять. Можно просто поверить, что то или иное поведение каждого элемента цепи можно подтвердить экспериментально.
Возьмем для примера простейшее устройство. Приложим к куску проволоки (сопротивлению) разность потенциалов V. Это значит, что если от одного конца проволоки до другого проходит заряд q, то при этом совершается работа qV. Чем выше разность потенциалов, тем большая работа совершается при «падении» заряда с высокопотенциального конца проволоки на низкопотенциальный. Заряды, проходя с одного конца проволоки на другой, выделяют энергию. Но зарядам не так-то просто плыть вдоль проволоки: атомы проволоки оказывают сопротивление потоку, и это сопротивление подчиняется закону, справедливому почти для всех обычных материалов: ток I пропорционален приложенной к проволоке разности потенциалов. Иначе говоря, число зарядов, проходящих через проволоку за 1 сек, пропорционально силе, с которой их толкают:
(25.11)
Коэффициент R называют сопротивлением, а само уравнение— законом Ома. Единица сопротивления — ом; он равен отношению одного вольта (1 в) к одному амперу (1 а). В механических устройствах очень трудно отыскать силу трения, пропорциональную скорости, а в электрических цепях — это дело обычное и закон Ома справедлив для большинства металлов с очень высокой точностью.
Нас интересует, много ли совершается работы за 1 сек при прохождении зарядов по проволоке (эту же величину можно назвать потерей мощности или выделяемой зарядами энергией)? Чтобы прогнать заряд q через разность потенциалов V, надо совершить работу qV; таким образом, работа за 1 сек равна V(dq/dt), или VI. Это выражение можно записать иначе: IR·I=I2R. Эту величину называют тепловыми потерями; вследствие закона сохранения энергии, такое количество теплоты производит в 1 сек сопротивление проволоки. Эта теплота накаляет проволоку электрической лампы.
У механических устройств есть, конечно, и другие интересные свойства, например, такие, как масса (инерция). В электрических цепях, оказывается, тоже существуют аналоги инерции. Можно построить прибор, называемый индуктором, а свойство, которым он обладает, носит название индуктивность. Ток, попадающий в такой прибор, не хочет останавливаться. Чтобы изменить ток, к этому прибору нужно приложить разность потенциалов. Если по прибору течет постоянный ток, то падения потенциалов нет. Цепи с постоянным током ничего «не знают» об индуктивности; эффекты индуктивности обнаруживаются только при изменениях тока. Описывающее эти эффекты уравнение гласит;
(25.12)
а индуктивность измеряется в единицах, которые называются генри (гн). Приложенная к прибору с индуктивностью в 1 гн разность потенциалов в 1 в изменяет ток на 1 а/сек. Уравнение (25.12), если хотите,— электрический аналог закона Ньютона: V соответствует F, L соответствует m, а I — скорости!
Все последующие уравнения, описывающие обе системы, выводятся одинаково, потому что мы просто можем заменить буквы в уравнении для одной системы и получить уравнение для другой системы; любой вывод, сделанный при изучении одной системы, будет верен и для другой системы.
Какое электрическое устройство соответствует пружинке, в которой сила пропорциональна растяжению? Если начать с F=kx и заменить F на V, а х на q, то получим V=αq.Мы уже знаем, что такое устройство существует; более того, это единственный из трех элементов цепи, работу которого мы понимаем. Мы уже знакомились с парой параллельных пластинок и обнаружили, что если зарядить пластинки равными, но противоположными по знаку зарядами, то поле между пластинками будет пропорционально величине заряда. Работа, совершаемая при переносе единичного заряда через щель от одной пластинки к другой, прямо пропорциональна заряду пластинок. Эта работа служит определением разности потенциалов и равна линейному интегралу электрического поля от одной пластинки к другой. По исторически сложившимся причинам постоянную пропорциональности называют не С, а 1/С, т. е.
(25.13)
Единица емкости называется фарадой (ф); заряд в 1 кулон, помещенный на каждой пластинке конденсатора емкостью в 1 ф, создает разность потенциалов в 1 в. Вот все нужные аналогии. Теперь можно, заменив m на L, q на х и т. д., написать уравнение для резонансной цепи
(25.14)
(25.15)
Все, что мы знаем об уравнении (25.14), можно применить и к уравнению (25.15). Переносится каждое следствие; аналогов так много, что с их помощью можно сделать замечательные вещи.
Предположим, что мы натолкнулись на очень сложную механическую систему: имеется не одна масса на пружинке, а много масс на многих пружинках, и все это перепутано. Что нам делать? Решать уравнения? Можно и так. Но попробуем собрать электрическую цепь, которая будет описываться теми же уравнениями, что и механическое устройство! Если мы собрались анализировать движение массы на пружинке, почему бы нам не собрать цепь, в которой индуктивность пропорциональна массе, сопротивление пропорционально γm, 1/С пропорционально k? Тогда электрическая цепь, конечно, будет точным аналогом механического устройства в том смысле, что любой отклик q на V (V соответствует действующей силе) в точности соответствует отклику х на силу! Перепутав в цепи великое множество сопротивлений, индуктивностей и емкостей, можно получить цепь, имитирующую сложнейшую механическую систему. Что в этом хорошего? Каждая задача, механическая или электрическая, столь же трудна (или легка), как и другая: ведь они в точности эквивалентны. Открытие электричества не помогло решить математические уравнения, но дело в том, что всегда легче собрать электрическую цепь и изменять ее параметры.
Предположим, что мы построили автомобиль и хотим узнать, сильно ли его будет трясти на ухабах. Соберем электрическую цепь, в которой индуктивности скажут нам об инерции колес, об упругости колес представление дадут емкости, сопротивления заменят амортизаторы и т. д. В конце концов мы заменим элементами цепи все части автомобиля. Теперь дело за ухабами. Хорошо, подадим на схему напряжение от генератора — он сможет изобразить любой ухаб; измеряя заряд на соответствующем конденсаторе, мы получаем представление о раскачке колеса. Измерив заряд (это сделать легко), мы решим, что автомобиль трясет слишком сильно. Надо что-то сделать. То ли ослабить амортизаторы, то ли усилить их. Неужели придется переделывать автомобиль, снова проверять, как его трясет, а потом снова переделывать? Нет! Просто нужно повернуть ручку сопротивления: сопротивление номер 10 — это амортизатор номер 3; так можно усилить амортизацию. Трясет еще сильнее — не страшно, мы ослабим амортизаторы. Все равно трясет. Изменим упругость пружины (ручка номер 17). Так мы всю наладку произведем с помощью электричества, многократным поворотом ручек.
Вот вам аналоговая вычислительная машина. Так называют устройства, которые имитируют интересующие нас задачи, описываемые теми же уравнениями, но совсем другой природы. Эти устройства легко построить, на них легко провести измерения, отладить их, и... разобрать!
§ 5. Последовательные и параллельные сопротивления
Обсудим, наконец, еще один важный вопрос, хотя он не совсем подходит по теме. Что делать с электрической цепью, если в ней много элементов? Например, когда индуктивность, сопротивление и емкость соединены, как показано на фиг. 24.2, то все заряды проходят через каждый из трех элементов так, что связывающий элементы ток во всех точках цепи одинаков. Поскольку ток всюду одинаков, падение напряжения на сопротивлении равно IR, на индуктивности равно L(dI/dt) и т. д. Полное падение напряжения получается суммированием частичных падений, и мы приходим к уравнению (25.15). Используя комплексные числа, мы решили это уравнение в случае равновесного отклика на синусоидальную силу. Мы нашли, что ^V=^Z^I (^Z называется импедансом цепи). Зная импеданс, легко найти ток в цепи ^I, если к цепи приложено синусоидальное напряжение ^V.
Предположим, что нужно собрать более сложную цепь из двух кусков, импедансы которых равны ^Z1 и ^Z2; соединим их последовательно (фиг. 25.6, а) и приложим напряжение.
Фиг. 25.6. Импедансы, соединенные последовательно (а) и параллельно (б).
Что случится? Задача немного сложнее предыдущей, но разобраться в ней нетрудно: если через Z1 течет ток ^I1, то падение напряжения на ^Z1 равно ^V1=^I^Z1, а падение напряжения на ^Z2 будет ^V2=^I^Z2. Через оба элемента цепи течет одинаковый ток. Полное падение напряжения вдоль такой цепи равно ^V=^V1+^V2=(^Z1+^Z2)I. Таким образом, падение напряжения в такой цепи мощно записать в виде ^V=^I^Zs, а ^Zs— импеданс системы, составленной из двух последовательно соединенных элементов, равен сумме импедансов отдельных элементов
(25.16)
Но это не единственный способ решения вопроса. Можно соединить отдельные элементы параллельно (фиг. 25.6,б). При таком соединении, если соединительные провода считать идеальными проводниками, к обоим элементам приложено одинаковое внешнее напряжение, а сила тока в каждом элементе не зависит от другого элемента. Ток через ^Z1 равен ^I1=^V/^Z1, ток в ^Z2 равен ^I2=^V/^Z2. Напряжение в обоих случаях одинаково. Полный ток через концы цепи равен сумме токов в отдельных частях цепи: ^I=^V/^Z1+^V/^Z2. Это можно записать и так:
Таким образом,
(25.17)
Многие сложные цепи иногда становятся более понятными, если расчленить их на куски, выяснить, чему равны импедансы отдельных частей, а затем шаг за шагом следить за соединением частей, помня о только что выведенных правилах. Если мы собрали цепь из большого числа произвольно соединенных элементов и создаем в этой цепи разности потенциалов при помощи небольших генераторов, импедансом которых можно пренебречь (когда заряд проходит через генератор, то потенциал возрастает на V), то при анализе цепи можно использовать такие правила:
1) сумма токов, протекающих через любое соединение, равна нулю; ведь притекший к любому соединению ток должен обязательно вытечь из него;
2) если заряд, двигаясь по замкнутой петле, вернулся в то место, откуда начал путешествие, полная работа должна быть равна нулю.
Эти правила называются законами Кирхгофа. Систематическое применение этих правил часто облегчает анализ работы сложных цепей. Мы к ним вернемся, когда будем говорить о законах электричества.
Выпуск 3. Излучение. Волны. Кванты
Глава 26 ОПТИКА. ПРИНЦИП НАИМЕНЬШЕГО ВРЕМЕНИ
§ 1. Свет
Эта глава — первая из посвященных электромагнитному излучению. Свет, с помощью которого мы видим, составляет только небольшую часть широкого спектра явлений одной природы, причем разные части спектра характеризуются разными значениями определенной физической величины. Эту величину называют «длиной волны». По мере того, как она пробегает значения в пределах спектра видимого света, цвет световых лучей меняется от красного до фиолетового. Систематическое изучение спектра от длинных волн к коротким лучше всего начать с так называемых радиоволн. В технике радиоволны получают в широком диапазоне длин волн и даже более длинные, чем те, которые используются в обычном радиовещании. В радиовещании применяются волны длиной около 500 м, за ними идут так называемые короткие волны, далее радиолокационный диапазон, миллиметровый диапазон и т. д. На самом деле между разными диапазонами нет никаких границ, природа их не создала. Числа, которые соответствуют разным диапазонам, и, конечно, сами названия диапазонов весьма условны.
Далее, пройдя долгий путь через миллиметровый диапазон, мы придем к инфракрасным волнам, а оттуда к спектру видимого света. Спустившись за его границы, мы попадем в ультрафиолетовую область. За ультрафиолетовой областью начинаются рентгеновские лучи, но границу между ними точно определить мы не можем, она где-то около 10-8 м, или 10-2 мк. Это область мягких рентгеновских лучей, за нею идет обычное рентгеновское излучение, затем жесткое излучение, потом γ-излучение и так ко все меньшим значениям величины, которую мы назвали длиной волны.
В пределах обширного диапазона длин волн имеется не менее трех областей, где возможны весьма интересные приближения. Существует, например, область, где длина волны мала по сравнению с размерами приборов, с помощью которых изучают такие волны; более того, энергия фотонов, если говорить на языке квантовой механики, меньше порога чувствительности приборов. В этой области первое грубое приближение дает метод, называемый геометрической оптикой. С другой стороны, когда длина волны становится порядка размеров прибора (такие условия проще создать для радиоволн, чем для видимого света), а энергия фотонов по-прежнему ничтожна, применяется другое очень полезное приближение, в котором учтены волновые свойства света, но снова пренебрегается эффектами квантовой механики. Это приближение основано на классической теории электромагнитного излучения; оно будет обсуждаться в одной из последующих глав. Наконец, для еще более коротких длин волн, когда энергия фотонов велика по сравнению с чувствительностью приборов и от волнового характера излучения можно отвлечься, снова возникает простая картина. Такую фотонную картину мы рассмотрим только в общих чертах. Полную теорию, описывающую все на основе единой модели, вы узнаете гораздо позже.
В этой главе мы ограничимся той областью, для которой эффективна геометрическая оптика и, как будет видно в дальнейшем, длина волны и фотонный характер света роли не играют. Мы даже не зададим вопроса, а что такое свет, и только опишем его поведение в масштабе длин и времен, много больших, чем некоторые характерные величины. Из сказанного ясно, что речь пойдет об очень грубом приближении, потом нам придется «отучаться» от изложенных здесь методов. Но отучимся мы легко, потому что почти сразу перейдем к более точному анализу.
Геометрическая оптика, хотя и является приближением, представляет огромный интерес с технической и исторической точек зрения. На истории этого вопроса мы намеренно остановимся подробнее, чтобы дать представление о развитии физической теории или физической идеи вообще.
Начнем с того, что свет знаком каждому и известен с незапамятных времен. Возникает первая проблема: каков механизм видения света? Теорий было много, но в конце концов они свелись к одной: существует нечто, попадающее в глаз при отражении от предметов. Эта идея существует уже давно и столь привычна, что теперь даже трудно себе представить другие идеи, предложенные, однако, весьма умными людьми, например, что нечто выходит из глаза и чувствует окружающие предметы. Были и другие важные наблюдения: свет распространяется из одной точки в другую по прямой линии, если ничто ему не препятствует и лучи света не взаимодействуют друг с другом. Иными словами, свет распространяется в комнате во всевозможных направлениях, но тот луч, который перпендикулярен направлению нашего взгляда, не воздействует на лучи, идущие к нам от какого-либо предмета. В свое время это был сильнейший аргумент против корпускулярной теории света и его использовал Гюйгенс. Но если представить себе свет в виде пучка летящих стрел, то как могли бы тогда другие стрелы легко пронизывать его? На самом деле ценность таких схоластических доказательств весьма сомнительна. Всегда можно сказать, что свет состоит именно из таких стрел, которые свободно проходят друг через друга!
§ 2. Отражение и преломление
Все сказанное дает представление об основной идее геометрической оптики. Теперь перейдем к ее количественному описанию. До сих пор мы разбирали случай, когда свет распространяется между двумя точками по прямой линии. Посмотрим теперь, что происходит, когда свет на своем пути наталкивается на какой-то объект (фиг. 26.1).
Фиг. 26.1. Угол падения равен углу отражения.
Простейший объект — это зеркало, и в этом случае мы знаем такой закон: свет, попадая на зеркало, не проходит через него, а отражается и снова уходит по прямой линии, причем направление прямой меняется при изменении наклона зеркала. Еще в древности люди были заняты вопросом: каково соотношение между этими двумя углами? Это очень простое соотношение, и найдено оно было давным-давно. Падающий на зеркало луч после отражения движется по такому пути, что углы между каждым лучом и зеркалом равны. По ряду соображений углы удобно отсчитывать от нормали к поверхности зеркала. Тогда так называемый закон отражения гласит:
(26.1)
В отличие от простого закона отражения более сложный закон возникает при переходе света из одной среды в другую, например из воздуха в воду; здесь тоже свет движется не по прямой. Траектория луча в воде образует некоторый угол с траекторией в воздухе. Когда луч падает почти вертикально, угол отклонения θi невелик; если же луч направить под большим углом, отклонение становится значительным (фиг. 26.2).
Фиг. 26.2. При переходе из одной среды в другую луч света преломляется.
Возникает вопрос: каково соотношение между двумя углами? В древности эта проблема долго ставила людей в тупик, но ответ тогда так и не был найден! Тем не менее именно по этому вопросу можно найти очень редкую в древнегреческой физике сводку экспериментальных данных!
Клавдий Птолемей составил таблицу углов отклонения света в воде для целого ряда углов падения из воздуха. В табл. 26.1 приведены углы в воздухе в градусах и соответствующие углы для воды. (Принято считать, что древние греки никогда не ставили опытов. Но, не зная закона, такую таблицу можно составить только на основании эксперимента. Надо отметить, однако, что данные таблицы слишком хорошо ложатся на параболу, поэтому они не могли быть результатом независимых измерений; это лишь ряд чисел, интерполированных по немногим измеренным точкам.)
Таблица 26.1 ПРЕЛОМЛЕНИЕ СВЕТА ПО ПТОЛЕМЕЮ
Это был очень важный шаг в становлении физического закона: сначала мы наблюдаем эффект, затем проводим измерения и сводим результаты в таблицу, после чего пытаемся найти закон, по которому одни величины сопоставляются с другими. Приведенная таблица была составлена еще в 140 г. до нашей эры, и вплоть до 1621 г. никто не смог найти такого закона, который связал бы эти два угла! Закон был установлен голландским математиком Виллебрордом Снеллом и читается так: пусть θi есть угол в воздухе и θr есть угол в воде, тогда синус θi равен синусу θr, умноженному на некоторую константу
(26.2)
Для воды число n равно примерно 1,33. Равенство (26.2) называется законом Снелла; он позволяет предсказать отклонение света при переходе из воздуха в воду. В табл. 26.2 указаны углы в воде и воздухе, полученные с помощью закона Снелла. Обратите внимание на удивительное согласие с таблицей Птолемея.
Таблица 26.2 ПРЕЛОМЛЕНИЕ СВЕТА ПО ЗАКОНУ СНЕЛЛА
§ 3. Принцип наименьшего времени Ферма
По мере развития науки нам хочется получить нечто большее, чем просто формулу. Сначала мы наблюдаем явления, затем с помощью измерений получаем числа и, наконец, находим закон, связывающий эти числа. Но истинное величие науки состоит в том, что мы можем найти такой способ рассуждения, при котором закон становится очевидным.
Впервые общий принцип, наглядно объясняющий закон поведения света, был предложен Ферма примерно в 1650 г. и получил название принципа наименьшего времени, или принципа Ферма. Вот его идея: свет выбирает из всех возможных путей, соединяющих две точки, тот путь, который требует наименьшего времени для его прохождения.
Покажем сначала, что это верно для случая с зеркалом, что этот простой принцип объясняет и прямолинейность распространения света, и закон отражения света от зеркала. Мы явно делаем успехи!
Попытаемся решить следующую задачу. На фиг. 26.3 изображены две точки А и В и плоское зеркало ММ'. Каким путем можно за кратчайшее время попасть из точки А в точку В? Ответ: по прямой, проведенной из А в В!
Фиг. 26.3. Иллюстрация принципа наименьшего времени.
Но если мы добавим дополнительное условие, что свет должен попасть на зеркало, отразиться от него и вернуться снова в точку В опять-таки за кратчайшее время, то ответить не так уж просто. Один путь — как можно скорее добраться до зеркала, а оттуда в точку B, т. е. по пути ADB. Путь DB, конечно, длинен. Если сдвинуться чуть-чуть вправо в точку Е, то первый отрезок пути немного увеличится, но зато сильно уменьшится второй, и время прохождения поэтому станет меньше. Как найти точку C, для которой время прохождения наименьшее? Воспользуемся для этого хитрым геометрическим приемом.
По другую сторону зеркала ММ', на таком же расстоянии от него, что и точка B, построим искусственную точку B'. Затем проведем линию ЕВ'. Поскольку угол BFM прямой и BF=FB', то ЕВ равно ЕВ'. Следовательно, сумма длин двух отрезков АЕ+ЕВ, пропорциональная времени их прохождения (если свет проходит с постоянной скоростью), равна сумме длин АЕ+ЕВ'. Теперь нужно выяснить, когда сумма длин будет наименьшей. Ответ: когда точка С будет лежать на прямой, соединяющей А и В'! Другими словами, нужно идти к мнимой точке В' (мнимому изображению точки В) и тогда мы найдем точку С. Далее, если АСВ'— прямая линия, угол BCF равен углу B'CF и, следовательно, углу АСМ. Таким образом, утверждение о равенстве углов падения и отражения равносильно утверждению, что свет при отражении от зеркала в точку В выбирает путь, требующий наименьшего времени. Еще Герон Александрийский высказал утверждение, что свет при отражении идет из одной точки в другую по кратчайшему пути, так что идея принципа, как видите, не нова. Именно это вдохновило Ферма, и он попробовал применить этот принцип к явлению преломления. Но свет, преломляясь, очевидным образом идет не по кратчайшему пути, и тогда Ферма предложил другой принцип — свет выбирает путь, время прохождения по которому наименьшее.
Прежде чем перейти к вопросу о преломлении света, сделаем еще одно замечание об отражении от зеркала. Если поместить источник света в точку В и направить луч на зеркало, свет, отражаясь от зеркала, пройдет из В в А так, как будто бы источник находится в В', а зеркала нет вообще. Наш глаз видит только тот свет, который действительно входит в него; и хотя источник расположен в точке В, зеркало направляет свет в глаз точно так, как будто источник находится в В', и система глаза — мозг интерпретирует именно так это явление. Поэтому иллюзия, что источник или предмет находится за зеркалом, вызывается только тем фактом, что свет попадает в глаз физически именно так, как если бы предмет действительно был позади зеркала (если не принимать во внимание пыль на зеркале и то, что нам известно, что зеркало реально существует, и другие сведения, которые учитывает наш мозг).
Покажем теперь, что из принципа наименьшего времени вытекает закон Снелла для преломления. Мы должны, конечно, что-то предположить относительно скорости света в воде. Будем считать, что скорость света в воде меньше скорости света в воздухе, и отношение второй скорости к первой обозначим через n.
Наша задача по-прежнему состоит в том, чтобы на фиг. 26.4 попасть из точки А в В за наименьшее время.
Фиг. 26.4. Иллюстрация принципа Ферма для случая преломления.
Чтобы убедиться, что путь по прямой здесь не самый быстрый, представим себе следующую ситуацию: хорошенькая девушка падает из лодки в воду в точке В и кричит, просит спасти. Линия X — это берег. Вы находитесь на суше в точке А и видите, что произошло, вы умеете плавать и умеете бегать. Но бегаете вы быстрее, чем плаваете. Что вам делать? Бежать по прямой к берегу? (Конечно!) Но, немного поразмыслив, вы поймете, что выгоднее пробежать несколько дольше по берегу, чтобы уменьшить ваш путь в воде, потому что в воде вы будете двигаться гораздо медленнее. (Рассуждая таким образом, лучше всего было бы заранее тщательно вычислить путь!) Во всяком случае, давайте попытаемся показать, что окончательное решение задачи — это путь АСВ, который занимает из всех возможных наименьшее время. Если этот путь кратчайший по времени, то любой другой окажется длиннее. Поэтому если отложить на графике зависимость времени от положения точки X, получится кривая, похожая на изображенную на фиг. 26.5, где точка С соответствует наименьшему времени.
Фиг. 26.5 Наименьшее время получается при выборе точки С. Соседние точки приводят примерно к такому же времени прохождения.
Это означает, что для точек X вблизи С в первом приближении время прохождения практически одинаковое, так как в точке С наклон кривой равен нулю. Итак, наш способ найти искомый путь сводится к требованию, чтобы при небольшом изменении положения точки время прохождения не менялось. (Конечно, возникнут бесконечно малые изменения времени второго порядка, и они должны быть положительными при смещении в обе стороны от точки С.) Возьмем близкую точку X, вычислим время прохождения на пути АХВ и сравним его со старым путем АСB. Сделать это очень просто. Конечно, нужно еще, чтобы разность времен стремилась к нулю для малых расстояний ХС. Обратимся сначала к пути по суше. Если мы опустим перпендикуляр ЕХ, то легко увидим, что наш путь стал короче на длину ЕС. Можно сказать, что это расстояние мы выиграли. С другой стороны, опустив перпендикуляр CF, мы увидим, что в воде приходится проплыть дополнительное расстояние XF. В этом мы проиграли. С точки зрения экономии времени выигрывается время на отрезке ЕС, но теряется на отрезке XF. Эти два интервала времени должны быть равны, так как в первом приближении полное время прохождения не меняется. Предположив, что скорость в воде равна скорости в воздухе, умноженной на 1/n, получим
(26.3)
Поэтому мы видим, что если нам удалось правильно выбрать точку С (XCsinEXC=nXCsinXCF) или мы сократили на длину общей гипотенузы ХС и заметили, что
то мы получим
(26.4)
Отсюда видно, что при отношении скоростей, равном n, свет должен двигаться из одной точки в другую по такому пути, чтобы отношение синусов θi и θr было равно отношению скоростей в двух средах.
§ 4. Применения принципа Ферма
Рассмотрим теперь некоторые интересные следствия принципа наименьшего времени. Первое из них — принцип обратимости. Мы уже нашли путь из A в В, требующий наименьшего времени; пойдем теперь в обратном направлении (считая, что скорость света не зависит от направления). Наименьшему времени отвечает та же траектория, и, следовательно, если свет распространяется по некоторому пути в одном направлении, он будет двигаться по этому пути и в обратном направлении.
Другой интересный пример! На пути света под некоторым углом поставлена четырехгранная стеклянная призма с параллельными гранями. Свет проходит из точки А в В и, встретив на своем пути призму (фиг. 26.6), отклоняется, причем длительность пути в призме уменьшается за счет изменения наклона траектории, а путь в воздухе немного удлиняется.
Фиг. 26.6. Луч света, выходящий из прозрачной пластины, параллелен падающему лучу.
Участки траектории вне призмы оказываются параллельными друг другу, потому что углы входа и выхода из призмы одинаковы.
Третье интересное явление состоит в том, что когда мы смотрим на заходящее солнце, то оно на самом деле находится уже ниже линии горизонта! Нам кажется, что солнце еще над горизонтом, а оно фактически уже зашло (фиг. 26.7).
Фиг. 26.7. У горизонта Солнце кажется на 1/2 градуса выше, чем на самом деле.
Дело здесь в следующем. Земная атмосфера вверху разрежена, а в нижних слоях более плотная. Свет распространяется в воздухе медленнее, чем в вакууме, и поэтому солнечные лучи достигнут какой-то точки за горизонтом быстрее, если будут двигаться не по прямой линии, а по траектории с более крутым наклоном в плотных слоях атмосферы, сокращая таким образом свой путь в этих слоях.
Еще пример того же рода — мираж, который часто наблюдают путешественники на раскаленных солнцем дорогах. Они видят на дороге «воду», а когда подъезжают туда, то кругом оказывается все сухо, как в пустыне! Сущность явления в следующем. То, что мы видим в этом случае, это «отраженный» дорогой свет. На фиг. 26.8 показано, как падающий на дорогу луч света попадает к нам в глаз. Почему?
Фиг. 26.8. Мираж.
Воздух сильно раскален над самой дорогой, а в верхних слоях холоднее. Горячий воздух, расширяясь, становится более разреженным, а потому и скорость света в нем больше, чем в холодном. Другими словами, свет быстрее проходит в теплых слоях, чем в холодных. Поэтому свет проходит не по прямой, а идет по траектории с наименьшим временем, заворачивая для этого в теплые слои воздуха, чтобы сократить время. Таким образом, свет идет по кривой.
И еще один пример. Представим себе такую ситуацию, когда весь свет, испускаемый в точке Р, собирается обратно в другую точку Р' (фиг. 26.9).
Фиг, 26.9. Оптический «черный ящик».
Это означает, конечно, что свет может попасть из точки Р в Р' по прямой линии. Это правильно. Но как устроить так, чтобы свет, идущий от Р к Q, тоже попал в Р'? Мы хотим собрать весь свет снова в одной точке, которую называют фокусом. Как это сделать? Поскольку свет всегда выбирает путь с наименьшим временем, то наверняка он не пойдет по другим предложенным нами путям. Единственный способ сделать целый ряд близлежащих траекторий приемлемыми для света — это устроить так, чтобы для всех время прохождения было точно одинаковым! В противном случае свет пойдет по траектории, требующей минимального времени. Поэтому задача построения фокусирующей системы сводится просто к созданию устройства, в котором свет тратит на всех путях одинаковое время!
Такое устройство создать просто. Возьмем кусок стекла, в котором свет движется медленнее, чем в воздухе (фиг. 26.10).
Фиг. 26 10. Фокусирующая оптическая система.
Проследим путь луча света, проходящего в воздухе по линии PQP'. Этот путь длиннее, чем прямо из Р в Р', и наверняка занимает больше времени. Но если взять кусок стекла нужной толщины (позже мы вычислим, какой именно), то путь в нем скомпенсирует добавочное время, затрачиваемое при отклонении луча на траектории PQP'. При этих условиях можно устроить так, чтобы время, затрачиваемое светом на пути по прямой, совпадало со временем, затрачиваемым на пути PQP'. Точно так же, если взять частично отклоненный луч PRR'P' (более короткий, чем PQP'), то придется скомпенсировать уже не так много времени, как для прямолинейной траектории, но некоторую долю времени все же скомпенсировать придется.
В результате мы приходим к форме куска стекла, изображенной на фиг. 26.10. При такой форме весь свет из точки Р попадет в Р'. Всё это нам известно уже давно, и называется такое устройство собирательной линзой. В следующей главе мы вычислим, какой должна быть форма линзы, чтобы получить идеальную фокусировку.
Наконец, последний пример. Предположим, что нам нужно так поставить зеркало, чтобы свет из точки Р всегда приходил в Р' (фиг. 26.11).
Фиг. 26.11. Эллиптическое зеркало.
На любом пути свет должен отразиться от зеркала, и время для всех путей должно быть одинаковым. В данном случае свет проходит только в воздухе, так что время прохождения пропорционально длине пути. Поэтому требование равенства времен сводится к требованию равенства полных длин путей. Следовательно, сумма расстояний r1 и r2 должна оставаться постоянной. Эллипс обладает как раз тем свойством, что сумма расстояний любой точки на его кривой от двух заданных точек постоянна; поэтому свет, отразившись от зеркала, имеющего такую форму, наверняка попадет из одного фокуса в другой.
Этот принцип фокусировки служит для наблюдения света звезд. При постройке большого 200-дюймового телескопа в обсерватории Паломар использовалась следующая идея. Вообразите себе звезду, удаленную от нас на миллиарды километров; мы хотим собрать весь испускаемый ею свет в фокус. Конечно, мы не можем начертить всю траекторию лучей до звезды, тем не менее мы должны проверить, насколько времена на различных траекториях равны. Мы, конечно, знаем, что если множество различных лучей достигло плоскости КК', перпендикулярной направлению лучей, то времена для всех этих лучей будут равны (фиг. 26.12).
Фиг. 26.12. Параболическое зеркало.
Далее лучи должны отразиться от зеркала и за равные промежутки времени попасть в фокус Р'. Это означает, что мы должны найти такую кривую, для которой сумма расстояний ХХ'-\-Х'Р' будет постоянна, независимо от выбора точки X. Легче всего это сделать, продолжив отрезок XX' до плоскости LL'. Потребуем теперь, чтобы выполнялись соотношения А'А"=А'Р',В'В"=В'Р', С'С"=С'Р' и т. д.; в этом случае мы получаем нужную нам кривую, потому что сумма длин А 'А+А 'Р'=АА'+А 'А'' будет постоянной для всех точек кривой. Значит, наша кривая есть геометрическое место всех точек, равноудаленных от линии и некоторой заданной точки. Такая кривая называется параболой; вот зеркало телескопа и было изготовлено именно в форме параболы.
Приведенные примеры в общих чертах иллюстрируют принцип устройства оптических систем. Точные кривые можно рассчитать, используя правило равенства времен на всех путях, ведущих в точку фокуса, и требуя, чтобы время прохождения на всех соседних путях было большим.
В следующей главе мы еще вернемся к фокусирующим оптическим системам, а теперь обсудим дальнейшее развитие теории. Когда предлагается новый физический принцип, такой, как принцип наименьшего времени, то нашей первой естественной реакцией могли бы быть слова: «Все это очень хорошо, восхитительно, но вопрос заключается в том, улучшает ли это вообще наше понимание физики?». На это можно ответить: «Да. Посмотрите сколько новых фактов мы теперь поняли!» А кто-то возразит: «Ну, в зеркалах я и так разбираюсь. Мне нужна такая кривая, чтобы каждая касательная к ней плоскость образовывала равные углы с двумя лучами света. Я могу рассчитать и линзу, потому что каждый падающий на нее луч отклоняется на угол, даваемый законом Снелла». Здесь очевидным образом содержание принципа наименьшего действия совпадает с законом равенства углов при отражении и пропорциональности синусов углов при преломлении. Тогда, может быть, это философский вопрос, а может быть, вопрос просто в том, какой путь красивее? Можно привести аргументы в пользу обеих точек зрения.
Однако критерий важности всякого принципа состоит в том, что он предсказывает нечто новое.
Легко показать, что принцип Ферма предсказывает ряд новых фактов. Прежде всего предположим, что имеются три среды — стекло, вода и воздух и мы наблюдаем явление преломления и измеряем показатель n для перехода из одной среды в другую. Обозначим через n12 показатель преломления для перехода из воздуха (1) в воду (2), а через n13— для перехода из воздуха (1) в стекло (3). Измерив преломление в системе вода-стекло, найдем еще один показатель преломления и назовем его n23.Здесь заранее нет оснований считать, что n12, n13 и n23 связаны между собой. Если же исходить из принципа наименьшего времени, то такую связь можно установить. Показатель n12 есть отношение двух величин — скорости света в воздухе к скорости света в воде; показатель n13 есть отношение скорости в воздухе к скорости в стекле, а n23 есть отношение скорости в воде к скорости в стекле. Поэтому, сокращая скорость света в воздухе, получаем
(26.5)
Другими словами, мы предсказываем, что показатель преломления для перехода из одного материала в другой можно получить из показателей преломления каждого материала по отношению к некоторой среде, скажем воздуху или вакууму. Таким образом, измерив скорость света во всех средах, мы образуем одно число для каждой среды — показатель преломления для перехода из вакуума в среду — и называем его ni (например, ni для воздуха есть отношение скорости в воздухе к скорости в вакууме и т. д.), после чего легко написать нужную формулу. Показатель преломления для любых двух материалов i и j равен
(26.6)
Используя только закон Снелла, подобное соотношение предсказать невозможно[19]. Но связь эта существует. Соотношение (26.5) известно давно и послужило сильным аргументом в пользу принципа наименьшего времени.
Еще одно предсказание принципа наименьшего времени состоит в том, что скорость света в воде при измерении должна оказаться меньше скорости света в воздухе. Это уже предсказание совсем другого рода. Оно гораздо глубже, потому что носит теоретический характер и никак не связано с наблюдениями, из которых Ферма вывел принцип наименьшего времени (до сих пор мы имели дело только с углами). Как оказалось, скорость света в воде действительно меньше скорости в воздухе, и ровно настолько, чтобы получился правильный показатель преломления.
§ 5, Более точная формулировка принципа Ферма
До сих пор мы фактически пользовались неправильной формулировкой принципа наименьшего времени. Здесь мы сформулируем его более точно. Мы неправильно называли его принципом наименьшего времени и для удобства по ходу дела применяли неправильную его трактовку. Но теперь мы выясним точное содержание принципа. Пусть имеется зеркало. Мы его показали на фиг. 26.3. Откуда свет знает, что он должен двигаться к зеркалу? Очевидно, путь, требующий наименьшего времени,— это линия АВ. Кое-кто поэтому может сказать: «Иногда этот путь требует как раз наибольшего времени». Так это неправильно! Путь по кривой наверняка займет еще больше времени! Точная формулировка принципа следующая: луч, проходящий по траектории, обладает тем свойством, что любое малое изменение пути (скажем, на 1%), расположения точки падения луча на зеркало, или формы кривой, или какие-либо иные изменения, не приводит в первом порядке к изменению времени прохождения; изменение времени происходит только во втором порядке. Другими словами, согласно этому принципу, свет выбирает один путь из множества близлежащих, требующих почти одинакового времени для прохождения.
С принципом наименьшего времени связана еще одна трудность, которую многие, не любящие такого рода теории, никак не могут переварить. Теория Снелла помогает легко «понять» поведение света. Свет проходит, видит перед собой поверхность и отклоняется, потому что на поверхности с ним что-то происходит. Легко понять идею причинности, проявляющуюся в том, что свет идет из одной точки в другую, а затем в следующую. Но принцип наименьшего времени есть философский принцип, который совсем иначе объясняет причину явлений в природе. Вместо причинной обусловленности, когда из одного нашего действия вытекает другое и т. д., этот принцип говорит следующее: в данной ситуации свет выбирает путь с наименьшим, или экстремальным временем. Но как удается свету выбирать свой путь? Вынюхивает он что ли соседние пути и сравнивает их потом друг с другом? В некотором смысле так и происходит. Эту способность света нельзя понять в рамках геометрической оптики, поскольку она связана с понятием длины волны; длина волны, грубо говоря, есть тот отрезок впереди лежащего пути, который свет может «почувствовать» и сравнить с соседними путями. Этот факт трудно продемонстрировать на опыте со светом, так как длина волны света чрезвычайно мала. Но радиоволны с длиной волны, скажем, 3 см, «видят» намного дальше. Предположим, имеется источник радиоволн, детектор и экран со щелью, как показано на фиг. 26.13; при этих условиях лучи будут проходить из S в D, поскольку это прямолинейная траектория, и даже если сузить щель, лучи все равно пройдут.
Фиг. 26.13, Прохождение радиоволн сквозь узкую щель.
Но если теперь отодвинуть детектор в точку D', то при широкой щели волны не пойдут из S в D', потому что они сравнят близлежащие пути и скажут: «Нет, друг мой, все эти пути требуют другого времени». С другой стороны, если оставить только узенькую щелку и таким образом помешать волнам выбирать путь, то окажутся годными уже несколько путей и волны пойдут по ним! Если щель узкая, в точку D' попадет больше излучения, чем через широкую щель! Такой же опыт возможен со светом, но в большом масштабе его проделать трудно. Этот эффект, однако, можно наблюдать в следующих простых условиях. Найдите маленький и яркий источник света, например уличный фонарь, где-нибудь в конце улицы или отражение солнца от колеса автомобиля. Поставьте перед глазами два пальца, оставив для света узенькую щель, и постепенно сближайте пальцы, пока щель полностью не исчезнет. Вы увидите, что свет, который вначале казался крохотной точкой, начнет расплываться и даже вытянется в длинную линию. Происходит это потому, что между пальцами оставлена лишь очень маленькая щель и свет не идет, как обычно, по прямой, а расходится под некоторым углом и в глаз попадает с разных направлений. Если вы будете достаточно внимательны, то заметите еще боковые максимумы и своеобразную кайму по краям.
Кроме того, само изображение будет окрашено. Все это будет в свое время объяснено, а сейчас этот опыт (а его очень легко проделать) просто демонстрирует, что свет не всегда распространяется по прямой.
§ 6. Квантовый механизм
В заключение дадим очень грубую картину того, что происходит на самом деле, как протекает весь процесс распространения света с квантовомеханической точки зрения, которую сейчас считают самой правильной (разумеется, наше описание будет носить лишь качественный характер). Исследуя свет на пути из А в В (см. фиг. 26.3), можно обнаружить, что он вовсе не представляет собой волны. Лучи света, оказывается, состоят из фотонов, которые можно реально зарегистрировать с помощью фотонного счетчика; они заставляют его щелкать. Яркость света пропорциональна среднему числу фотонов, пролетающему в 1 сек, а нас интересует вероятность попадания фотона из А в В при отражении от зеркала. Правило вычисления этой вероятности весьма необычно. Выберем какой-нибудь путь и найдем время на этом пути; затем образуем комплексное число или нарисуем маленький комплексный вектор ρеiθ, где угол θ пропорционален времени. Число оборотов вектора в секунду — это частота света. Возьмем теперь другой путь, и пусть он занимает другое время; тогда соответствующий ему вектор повернется на угол, отличный от первого (вспомним, что угол всегда пропорционален времени). Переберем все возможные пути и сложим векторы для каждого из них, тогда квадрат длины суммарного вектора определит вероятность прохождения фотона из начальной точки в конечную!
Покажем теперь, что отсюда следует принцип наименьшего времени для зеркала. Возьмем все возможные пути ADB, АЕВ, АСВ и т. д., изображенные на фиг. 26.3. Путь ADB вносит небольшой вклад, а соседний путь АЕВ занимает уже другое время, и его угол θ поэтому другой. Пусть точка С соответствует пути с наименьшим временем, тогда при небольшом изменении пути время не меняется. Точнее, сначала время заметно менялось, но с приближением к точке С оно меняется все меньше и меньше (фиг. 26.14).
Фиг. 26.14. Суммирование амплитуд вероятности на всех возможных соседних траекториях.
Таким образом, векторы, которые мы складываем, проходят вблизи С почти под одним и тем же углом, а затем времена начинают постепенно расти, векторы поворачиваются и т. д. В результате получается тугой клубок векторов. Полная вероятность есть расстояние от одного конца до другого, возведенное в квадрат. Почти весь вклад в эту суммарную вероятность вносит область, где векторы идут в одном направлении (с одной и той же фазой). Вклады от путей с разными временами взаимно сокращаются, потому что векторы направлены в разные стороны. Вот почему, если закрыть края зеркала, оно будет отражать почти точно так же, как и раньше, поскольку в приведенной выше процедуре это соответствует отбрасыванию части векторов внутри спиральных концов диаграммы, а для света это мало что изменит. Таково соответствие между современной теорией фотонов с ее понятием вероятности прохождения, зависящей от суммирования векторов, и принципом наименьшего времени.
Глава 27 ГЕОМЕТРИЧЕСКАЯ ОПТИКА
§ 1. Введение
В этой главе мы рассмотрим некоторые применения изложенных ранее принципов к устройству простейших оптических систем, используя приближение геометрической оптики. При конструировании многих оптических приборов это приближение оказывается особенно полезным. Геометрическая оптика и очень проста, и очень сложна. Я хочу этим сказать, что уже поверхностное изучение геометрической оптики в школе позволяет с помощью очень простых правил составлять грубые схемы приборов; если же мы хотим при этом учитывать искажения в линзах и прочие тонкости, то задача становится слишком сложной даже для студентов вашего курса! Если кому-нибудь действительно понадобится точно спроектировать линзу, учитывая аберрацию, то лучше всего обратиться к специальным руководствам или просто проследить путь лучей через разные поверхности (как это сделать — сказано в книгах) и, пользуясь законом преломления, определить направление вышедших из линзы пучков и выяснить, насколько хорошее изображение они создают. Считалось, что это слишком длинная процедура, но сейчас, когда мы вооружены вычислительными машинами, этот способ вполне хорош. Сформулировав задачу математически, легко подсчитать пути всех лучей. Словом, дело это простое и не требует новых принципов. Кроме того, законы и элементарной и специальной оптики фактически неприменимы в других областях, поэтому нам не было бы необходимости чересчур подробно изучать предмет, если бы не одно важное исключение.
Оказалось, что наиболее современная и абстрактная теория геометрической оптики, разработанная Гамильтоном, имеет весьма важные приложения в механике, причем в механике она имеет даже большее значение, чем в оптике, поэтому пусть ею занимается курс аналитической механики. А пока, понимая, что геометрическая оптика интересна только сама по себе, мы перейдем к изучению элементарных свойств оптических систем на основе принципов, изложенных в предыдущей главе.
Для дальнейшего нам понадобится одна геометрическая формула: пусть дан треугольник, высота которого h мала, а основание d велико; тогда гипотенуза s (фиг. 27.1) больше основания (нам нужно это знать, чтобы вычислить разность времен на двух различных путях света).
Фиг. 27.1. Треугольник, высота, которого h меньше основания d, а гипотенуза s больше основания.
Насколько гипотенуза больше основания? Мы можем найти разность Δ=s-d несколькими способами. Например, s2-d2=h2или (s-d)(s+d)=h2. Но s-d=Δ, а s+d~2s. Таким образом,
(27.1)
Вот и все, что нам нужно знать из геометрии для изучения изображений, получаемых с помощью кривых поверхностей!
§ 2. Фокусное расстояние для сферической поверхности
Рассмотрим сначала простейший пример преломляющей поверхности, разделяющей две среды с разными показателями преломления (фиг. 27.2).
Фиг. 27.2. Фокусировка на преломляющей поверхности.
Случай произвольных показателей пусть разберет читатель самостоятельно; нам важно рассказать об идее, задача же достаточно проста и ее можно решить в любом частном случае. Итак, пусть слева скорость света равна 1, а справа 1/n, где n — показатель преломления. Свет в стекле идет медленнее в n раз.
Теперь представим себе точку О на расстоянии s от лицевой поверхности стекла и другую точку О' на расстоянии s' внутри стекла и попытаемся выбрать кривую поверхность так, чтобы каждый луч, вышедший из О и попавший на поверхность в Р, приходил в точку О'. Для этого нужно придать поверхности такую форму, чтобы сумма времени прохождения света на пути от О к Р (т. е. расстояние ОР, деленное на скорость света, равную единице) плюс n-О'Р, т.е. время на пути от Р к О', было постоянной величиной, не зависящей от положения точки Р. Это условие дает уравнение для определения поверхности. В результате получается весьма сложная поверхность четвертого порядка (читатель может вычислить ее для собственного удовольствия с помощью аналитической геометрии). Проще рассмотреть специальный случай s→∞, когда кривая получается второго порядка и ее легче определить. Интересно сравнить эту кривую с кривой для фокусирующего зеркала (когда свет приходил из бесконечности), которая, как вы помните, оказалась параболой.
Итак, нужную поверхность сделать нелегко; чтобы сфокусировать свет от одной точки в другую, нужна довольно сложная поверхность. Практически такие сложные поверхности даже не пытаются создать, а пользуются компромиссным решением. Мы не будем собирать все лучи в фокус, а соберем только лучи, достаточно близкие к оси 00'. Раз идеальная форма поверхности столь сложна, возьмем вместо нее сферическую поверхность, которая имеет нужную кривизну у самой оси, и пусть далекие лучи отклоняются от оси, если они того хотят. Сферу изготовить намного проще, чем другие поверхности, поэтому выберем сферу и рассмотрим поведение лучей, падающих на сферическую поверхность. Будем требовать точной фокусировки только для тех лучей, которые проходят вблизи от оси. Иногда эти лучи называют параксиальными, а наша задача — найти условия фокусировки параксиальных лучей. Позже мы обсудим ошибки, связанные с отклонением лучей от оси.
Итак, считая, что Р близко к оси, опустим перпендикуляр PQ длиной h. Если бы наша поверхность была плоскостью, проходящей через Р, то время, затрачиваемое на пути от О к Р, превышало бы время на пути от О к Q, а время на пути от Р к О' превышало бы время от Q к О'. Поверхность стекла должна быть кривой, потому что только в этом случае весь излишек времени компенсируется задержкой при прохождении пути от V к Q! Далее, излишек времени на пути ОР есть h2/2s, а излишек времени на отрезке О'Р есть nh2/2s'. Это лишнее время, которое должно компенсироваться временем на пути VQ, накапливается на пути в среде, а не в вакууме. Другими словами, время на пути VQ в n раз больше соответствующего времени в вакууме, а поэтому лишнее время на этом отрезке есть (n-l)VQ. Ну, а какова длина VQ? Если С есть центр сферы с радиусом R, то с помощью уже знакомой нам формулы выводим, что длина VQ есть h2/2R. В результате мы получаем закон,
(27.2)
который связывает длины s и s' и определяет радиус кривизны R искомой поверхности:
(27.3)
Если мы хотим сфокусировать свет из точки О в точку О', то эта формула позволяет вычислить требуемый радиус кривизны поверхности.
Интересно, что та же линза с таким же радиусом кривизны R будет фокусировать и на других расстояниях, т. е. она является фокусирующей для любой пары расстояний, для которых сумма обратной величины одного расстояния и обратной величины другого, умноженного на n, есть постоянное число. Таким образом, данная линза (если учитывать только параксиальные лучи) является фокусирующей не только для точек О и О', но и для бесконечного числа пар точек, если эти пары удовлетворяют соотношению 1/s+n/s'=постоянная, характеризующая данную линзу.
Представляет интерес частный случай s→∞. Из формулы видно, что при увеличении s другое расстояние s' уменьшается. Другими словами, когда точка О удаляется, точка О' приближается, и наоборот. Когда точка О уходит на бесконечность, точка О' также двигается внутри стекла вплоть до расстояния, называемого фокусным расстоянием f'. Если на линзу падает параллельный пучок лучей, он соберется в линзе на расстоянии f'. Можно задать вопрос и по-другому. (Вспомним правило обратимости: если свет переходит из О в О', он, разумеется, может двигаться и в обратном направлении, из О' в О.) Таким образом, если источник света находится внутри стекла, то может возникнуть вопрос, где лучи соберутся в фокус? В частности, если источник внутри стекла находится на бесконечности (та же задача, что и раньше), то где будет фокус вне линзы? Это расстояние обозначают через f. Можно, конечно, сказать и иначе. Если источник расположен на расстоянии f, то лучи, проходя через поверхность линзы, выйдут параллельным пучком. Легко определить f и f':
(27.4)
(27.5)
Отметим интересный факт: если мы разделим каждое фокусное расстояние на соответствующий показатель преломления, то получим один и тот же результат! На самом деле, это общая теорема. Она справедлива для любой сложной системы линз, поэтому ее стоит запомнить. Мы не доказали эту теорему в общем виде, а лишь отметили ее применимость для одной поверхности, однако оказывается, что вообще два фокусных расстояния некоторой системы связаны подобным образом. Иногда выражение (27.3) записывают в следующем виде:
(27.6)
Такая форма более удобна, чем (27.3), потому что проще измерить f, чем кривизну и показатель преломления линзы. Если нам не нужно самим конструировать линзу или изучать в подробностях весь процесс, а достаточно достать линзу с полки, то нас будет интересовать только величина f, а не n или R!
Любопытная ситуация возникает, когда s становится меньше f. Что же тогда происходит? При s<f обратная величина (1/s) больше (1/f) и поэтому s' отрицательна. Наша формула утверждает, что свет фокусируется только при отрицательном значении s',— понимайте как хотите! Но означает это нечто весьма определенное и интересное. Формула эта остается полезной и для отрицательных значений. Что она означает, ясно из фиг. 27.3.
Фиг. 27.3. Мнимое изображение.
Исходящие из точки О лучи преломляются на поверхности, но в фокус не собираются, так как точка О расположена слишком близко к поверхности, и лучи становятся «более чем параллельны». Однако они начинают расходиться так, как будто бы вышли из точки О' вне линзы. Эта точка есть кажущееся изображение, или, как иногда говорят, мнимое изображение.
Изображение О' на фиг. 27.2 называется действительным изображением. Действительное изображение возникает, когда свет действительно проходит через точку. Но если кажется, что свет исходит из некоторой фиктивной точки, не совпадающей с действительным источником, то эта точка и есть мнимое изображение. Следовательно, для отрицательных s' точка О' находится по другую сторону поверхности, и все встает на свои места.
Рассмотрим теперь интересный случай, когда R=∞; при этих условиях (1/s)+(n/s')=0. Иными словами, s'=-ns, что означает, что если из плотной среды смотреть на некую точку в разреженной среде, то она будет казаться дальше в n раз. Мы можем прочитать наше уравнение и наоборот: при взгляде на объект, находящийся в плотной среде за плоской поверхностью раздела, нам будет казаться, что он расположен к нам ближе, чем на самом деле (фиг. 27.4).
Фиг. 27.4. Плоская поверхность раздела отображает точку О' в точку О.
Когда мы смотрим сверху на дно плавательного бассейна, он кажется нам мельче в 3/4 раза, чем он есть на самом деле; эта цифра есть обратная величина показателя преломления воды.
Теперь мы могли бы перейти к сферическому зеркалу. Но если вникнуть в смысл сказанного нами ранее, то вполне можно разобрать этот вопрос самостоятельно. Поэтому пусть читатель сам выведет формулы для сферического зеркала, но для этого полезно принять следующие условия:
1) расстояние до объекта s положительно, если точка О расположена слева от поверхности;
2) расстояние до изображения s' положительно, если точка О' расположена справа от поверхности;
3) радиус кривизны поверхности положителен, если центр находится справа от поверхности.
Например, на фиг. 27.2 s, s' и R положительны; на фиг. 27.3 s и R положительны, а s' отрицательна. Для вогнутой поверхности наша формула (27.3) остается справедливой, если считать R отрицательной величиной.
Пользуясь приведенными условиями, можно вывести соответствующую формулу и для зеркала, положив в (27.3) n=-1 (как если бы среда за зеркалом имела показатель преломления -1), и тогда получится правильный результат!
Мы вывели формулу (27.3) простым и элегантным способом, исходя из принципа наименьшего времени; ту же формулу можно, конечно, получить с помощью закона Снелла, если учесть, что углы малы и заменить синусы самими углами.
§ 3. Фокусное расстояние линзы
Рассмотрим теперь другой случай, имеющий большое практическое значение. Большинство линз, которыми мы пользуемся, имеет не одну, а две поверхности раздела. К чему это приводит? Пусть имеется стеклянная линза, ограниченная поверхностями с разной кривизной (фиг. 27.5).
Фиг. 27.5. Построение изображения, даваемого двусторонней линзой.
Рассмотрим задачу о фокусировании пучка света из точки О в точку О'. Как это сделать? Сначала используем формулу (27.3) для первой поверхности, забыв о второй поверхности. Это позволит нам установить, что испускаемый в точке О свет будет казаться сходящимся или расходящимся (в зависимости от знака фокусного расстояния) из некоторой другой точки, скажем О'. Решим теперь вторую часть задачи. Имеется другая поверхность между стеклом и воздухом, и лучи подходят к ней, сходясь к точке О'. Где они сойдутся на самом деле? Снова воспользуемся той же формулой! Находим, что они сойдутся к точке О". Таким образом можно пройти, если необходимо, через 75 поверхностей, последовательно применяя одну и ту же формулу и переходя от одной поверхности к другой!
Имеются еще более сложные формулы, которые могут нам помочь в тех редких случаях нашей жизни, когда нам почему-то нужно проследить путь света через пять поверхностей. Однако если уж это необходимо, то лучше последовательно перебрать пять поверхностей, чем запоминать кучу формул, ведь может случиться, что нам вообще не придется возиться с поверхностями!
Во всяком случае, принцип расчета таков: при переходе через одну поверхность мы находим новое положение, новую точку фокуса и рассматриваем ее как источник для следующей поверхности и т. д. Часто в системах бывает несколько сортов стекла с разными показателями n1, n2,...; поэтому для конкретного решения задачи нам нужно обобщить формулу (27.3) на случай двух разных показателей n1 и n2. Нетрудно показать, что обобщенное уравнение (27.3) имеет вид
(27.7)
Особенно прост случай, когда поверхности близки друг к другу и ошибками из-за конечной толщины можно пренебречь. Рассмотрим линзу, изображенную на фиг. 27.6, и поставим такой вопрос: каким условиям должна удовлетворять линза, чтобы пучок из О фокусировался в О'?
Фиг. 27.6. Тонкая линза с двумя положительными радиусами кривизны.
Пусть свет проходит точно через край линзы в точке Р. Тогда (пренебрегая временно толщиной линзы Т с показателем преломления n2) излишек времени на пути ОРО' будет равен (n1h2/2s)+(n1h2/2s'). Чтобы уравнять время на пути ОРО' и время на прямолинейном пути, линза должна обладать в центре такой толщиной Т, чтобы она задерживала свет на нужное время. Поэтому толщина линзы Т должна удовлетворять соотношению
(27.8)
Можно еще выразить Т через радиусы обеих поверхностей R1 и R2. Учитывая условие 3, мы находим для случая R1<R2 (выпуклая линза)
(27.9)
Отсюда получаем окончательно
(27.10)
Отметим, что, как и раньше, когда одна точка находится на бесконечности, другая будет расположена на расстоянии, которое мы называем фокусным расстоянием f. Величина f определяется равенством
(27.11)
где n=n2/n1
В противоположном случае, когда s стремится к бесконечности, s' оказывается на фокусном расстоянии f'. Для нашей линзы фокусные расстояния совпадают. (Здесь мы встречаемся еще с одним частным случаем общего правила, по которому отношение фокусных расстояний равно отношению показателей преломления тех двух сред, где лучи фокусируются. Для нашей оптической системы оба показателя одинаковы, а поэтому фокусные расстояния равны.)
Забудем на время формулу для фокусного расстояния. Если вы купили линзу с неизвестными радиусами кривизны и каким-то показателем преломления, то фокусное расстояние можно просто измерить, собирая в фокус лучи, идущие от удаленного источника. Зная f, удобнее переписать нашу формулу сразу в терминах фокусного расстояния:
(27.12)
Давайте посмотрим теперь, как работает эта формула и что из нее получается в разных случаях. Во-первых, если одно из расстояний s и s' бесконечно, другое равно f. Это условие означает, что параллельный пучок света фокусируется на расстоянии f и может использоваться на практике для определения f. Интересно также, что обе точки движутся в одну сторону. Если одна идет направо, то и вторая движется в ту же сторону. И наконец, если s и s' одинаковы, то каждое из них равно 2f.
§ 4. Увеличение
До сих пор мы рассматривали процесс фокусировки только для точек, лежащих на оси. Построим теперь изображение объектов, несколько смещенных в сторону от оси; это поможет нам понять явление увеличения. Если с помощью линзы сфокусировать свет от небольшой нити на экран, то мы увидим изображение той же нити, только несколько большего или меньшего размера по сравнению с настоящей. Отсюда мы заключаем, что свет попадает в фокус от каждой точки нити. Чтобы получше в этом разобраться, рассмотрим линзу, схематически изображенную на фиг. 27.7.
Фиг. 27.7. Геометрическое построение изображения от тонкой линзы.
Нам известно, следующее:
1) каждый луч, параллельный оси, фокусируется по другую сторону линзы в точке, называемой фокусом и расположенной на расстоянии f от линзы;
2) каждый луч, приходящий из фокуса по одну сторону линзы, выходит с другой стороны параллельно оси.
С помощью только этих фактов мы докажем формулу (27.12) геометрическим путем. Пусть объект находится на расстоянии x от фокуса и его высота есть у. Мы знаем, что луч PQ отклоняется и пройдет через фокус R по другую сторону линзы. Если свет от точки Р фокусируется линзой, достаточно определить путь еще одного луча, и тогда фокус будет расположен в точке пересечения двух лучей. Нужно только умело выбрать направление второго луча. Вспомним, что параллельный луч проходит через фокус, и наоборот: луч, проходящий через фокус, выходит параллельно оси! Поэтому проведем луч РТ через U. (Правда, фокусируемые лучи могут быть гораздо тоньше, чем начерченные нами, но их труднее изобразить, поэтому оставим нашу прежнюю схему.) Поскольку луч параллелен оси, проведем TS параллельно XW. Пересечение S и есть искомая точка. Отсюда мы получаем нужную высоту и правильное расстояние. Обозначим высоту через y', а расстояние до фокуса через x'. Теперь можно вывести формулу для линзы. Из подобных треугольников PVU и TXU находим
(27.13)
Из треугольников SWR и QXR получаем
(27.14)
Разрешая оба равенства относительно y'/y, находим
(27.15)
Равенство (27.15) есть знаменитая формула для линзы; в ней содержится все, что нам нужно знать о линзах; увеличение y'/y выражено через расстояние и фокусную длину. Возникающее отсюда соотношение, связывающее x и x' с f, имеет вид
Оно гораздо изящнее формулы (27.12). Мы рекомендуем читателю доказать, что при s=x+f и s'=x'+f равенства (27.12) и (27.16) совпадают.
§ 5. Сложные линзы
Опишем кратко без вывода основные свойства системы линз. Как исследуют систему нескольких линз? Очень просто. Начнем с некоторого объекта и определим его изображение, даваемое первой линзой, пользуясь формулами (27.16), (27.12) или любой эквивалентной формулой или, наконец, изобразив все это графически. Итак, мы получим первое изображение. Затем мы будем рассматривать это изображение как источник для следующей линзы и, чтобы найти новое изображение, воспользуемся второй линзой с любой заданной фокусной длиной. Проделаем такую процедуру последовательно для всей системы линз. Вот и все. В принципе здесь нет ничего нового, поэтому мы не будем входить в подробности. Однако очень интересный результат получается, когда свет входит и выходит из системы линз в одну и ту же среду, например в воздух. Любое оптическое устройство — будь то телескоп или микроскоп с произвольным количеством линз и зеркал — обладает следующим интересным свойством. Имеются две плоскости, называемые главными плоскостями системы (часто они расположены поблизости от внешних поверхностей первой и последней линзы), которые обладают следующими свойствами: 1) свет, входящий параллельным пучком с одной стороны, собирается с другой стороны в фокус, отстоящий от второй главной плоскости на фокусное расстояние (как будто вместо системы имеется тонкая линза, совпадающая со второй главной плоскостью); 2) свет, входящий параллельным пучком с другой стороны, собирается в фокус на расстоянии f от первой главной плоскости, как будто там опять-таки находится тонкая линза (фиг. 27.8).
Фиг. 27.8. Главные плоскости оптической системы.
Само собой разумеется, если определить, как и раньше, расстояние х, х' и у, у', то формула (27.16) для тонкой линзы будет применима и в этом общем случае, только фокусные расстояния нужно отсчитывать от главных плоскостей, а не от центра линзы. Для тонкой линзы главные плоскости совпадают. Получается так, как если бы мы взяли тонкую линзу, разрезали её на дольки и разнесли их на некоторое расстояние, а в результате ничего не изменилось. Каждый входящий луч немедленно выскакивает по другую сторону от второй плоскости! Главные плоскости и фокусные расстояния находят либо вычислением, либо опытным путем; этим исчерпывается описание свойств оптической системы. Весьма интересно, что результат для большой и сложной оптической системы оказался таким простым.
§ 6. Аберрация
Пока вы еще не успели прийти в восхищение от такой великолепной штуки, как линза, я должен успеть сказать об ее серьезных недостатках, которые мы не могли заметить раньше, поскольку ограничились рассмотрением параксиальных лучей. Реальная линза обладает конечной толщиной и, вообще говоря, обнаруживает свойства аберрации. Например, луч, направленный вдоль оси, обязательно пройдет через фокус. Луч, близкий к оси, будет еще проходить через фокус, но более далекие лучи начнут от него отклоняться: близкие ненамного, а крайний луч уже на большое расстояние. В результате вместо точечного изображения получается расплывчатое пятно. Этот эффект называется сферической аберрацией, потому что он возникает в результате использования сферических поверхностей вместо поверхностей правильной формы. Для каждого данного расстояния от объекта до линзы эффект аберрации можно устранить, изменив форму линзы или взяв несколько линз с таким расчетом, чтобы аберрации отдельных линз взаимно уничтожались.
Линзы страдают еще одним недостатком: свет разного цвета имеет разную скорость, т. е. разные показатели преломления в стекле, а поэтому фокусное расстояние для разных цветов разное. Изображение белого пятна получается цветным, так как, когда в фокусе красный цвет, синий оказывается вне фокуса, и наоборот. Это явление называется хроматической аберрацией.
Бывают и другие искажения. Если объект находится не на оси, то добиться четкого фокуса невозможно. Легче всего это проверить, наклонив наведенную на фокус линзу так, чтобы в нее попадали лучи под большим углом к оси. Тогда изображение сильно расплывется и может случиться, что ни одного четко сфокусированного места не останется. Таким образом, линзы страдают рядом искажений, и обычно оптик-конструктор старается их выправить, соединяя по нескольку линз, с тем чтобы скомпенсировать искажения отдельных линз.
До какого предела можно устранить аберрации? Можно ли создать совершенную оптическую систему? Допустим, что мы сумели построить оптическую систему, фокусирующую свет точно в одну точку. Можем ли мы теперь найти требования (с точки зрения принципа Ферма), которым должна удовлетворять наша система? Система всегда имеет отверстие конечных размеров, в которое входит свет. Для совершенной системы время прохождения любого, как угодно удаленного от оптической оси луча одинаково. Но абсолютного совершенства не бывает, поэтому поставим вопрос: каков разумный предел точности совпадения всех времен? Это зависит от того, насколько совершенное изображение мы хотим иметь. Предположим, что мы хотим, чтобы оно было настолько совершенным, насколько это вообще возможно. Тогда с первого взгляда кажется, что и времена прохождения всех лучей нужно уравнять с максимальной точностью. На самом деле это не так; существует некий предел, за которым всякое уточнение бессмысленно, потому что приближение геометрической оптики перестает работать!
Вспомним, что принцип наименьшего времени, в отличие от закона сохранения энергии и импульса, не есть точный принцип, а лишь некоторое приближение. И поэтому интересно установить, какие ошибки допустимы в пределах точности этого приближения. Ответ: не имеет смысла требовать равенства времен прохождения лучей (скажем, в худшем случае луча вдоль оси и наиболее удаленного от оси) с точностью, превышающей период колебания света. Свет есть колебательный процесс с определенной частотой, которая связана с длиной волны, и если мы добились, что времена прохождения лучей отличаются на величину, меньшую или порядка периода колебаний, то дальше уравнивать времена бесполезно.
§ 7. Разрешающая способность
Еще один интересный вопрос, очень важный с технической точки зрения! какова разрешающая способность оптических приборов? Когда мы создаем микроскоп, мы хотим целиком видеть тот объект, который находится в поле нашего зрения. Это означает, например, что, глядя на бактерию, на боках которой имеются два пятнышка, мы хотим различить оба пятнышка на увеличенном изображении. Могут подумать, что для этого нужно только получить достаточное увеличение, ведь всегда можно добавить еще линзы и достичь большего увеличения, а если конструктор ловкий, то он устранит сферические и хроматические аберрации; вот вроде бы и нет причин, почему бы не увеличить желаемое изображение до любых размеров. Но предел возможностей микроскопа связан не с тем, что невозможно добиться увеличения более чем в 2000 раз. Можно построить систему линз, увеличивающую в 10 000 раз, и все же не увидеть те два пятнышка, расположенные так близко одно к другому, и не увидим мы их из-за ограниченности возможностей геометрической оптики и неточности принципа наименьшего времени.
Сравнивая время прохождения равных лучей, можно красивым способом вывести правило, определяющее расстояние между двумя точками, при котором эти точки еще различаются на изображении. Отвлечемся пока от аберраций и пусть все лучи от некоторой точки Р (фиг. 27.9) проходят до изображения Т за одно и то же время (такого быть не может, поскольку система несовершенна, но это уже к данному вопросу не относится).
Фиг. 27.9. Разрешающая способность оптической системы.
Возьмем еще одну близлежащую точку Р' и посмотрим, различаются ли их изображения. Другими словами, сможем ли мы различить оба изображения? Конечно, согласно геометрической оптике, должно быть два изображения, но то, что мы увидим, может оказаться весьма расплывчатым, и нам не удастся разобрать, что точек две. Требование, чтобы вторая точка давала изображение, отличное от первого, сводится к следующему условию: времена прохождения двух крайних лучей P'ST и Р'RТ от точки Р' до изображения первой точки Т должны быть разными. Почему? Потому что при равных временах свет от Р' сфокусировался бы в Т, т. е. изображения совпали бы. Итак времена должны быть разными. Но насколько они должны отличаться, чтобы мы сказали, что они имеют разные фокусы, и обе точки на изображении различимы? Разрешающая способность любого оптического устройства определяется следующим правилом: изображения двух точечных источников могут быть различимы, если только времена прохождения крайних лучей от одного источника к изображению второго отличаются от времени прохождения к собственному изображению более чем на один период. Для этого необходимо, чтобы разность времен прохождения верхнего и нижнего крайних лучей к чужому изображению была больше некоторой величины, примерно равной периоду колебания световой волны:
(27.17)
где v — частота света (число колебаний в секунду, или скорость света, деленная на длину волны). Обозначим расстояние между точками через D, а половину угла, под которым видна линза из точки Р, через θ; тогда (27.17) равносильно утверждению, что D больше (λ/n)sinθ, где n — показатель преломления в точке Р, а λ — длина волны. Отсюда размеры самого малого объекта, который мы можем увидеть, оказываются порядка длины волны света. Для телескопов тоже имеется такая формула; она определяет наименьшую разность углов (угловое расстояние) между двумя звездами, при которой их еще можно отличить друг от друга[20].
Глава 28 ЭЛЕКТРОМАГНИТНОЕ ИЗЛУЧЕНИЕ
§ 1 Электромагнетизм
Решающие и наиболее поразительные периоды развития физики — это периоды великих обобщений, когда явления, казавшиеся разобщенными, неожиданно становятся всего лишь разными аспектами одного и того же процесса. История физики — это история таких обобщений, и в основе успеха физической науки лежит главным образом наша способность к синтезу.
По-видимому, самым знаменательным моментом в развитии физики XIX столетия следует считать тот день в 1860 г., когда Дж. К. Максвелл сопоставил законы электричества и магнетизма с законами поведения света. В результате были частично объяснены свойства света — этой старой и тонкой субстанции, настолько загадочной и важной, что в свое время при написании главы о сотворении Мира сочли нужным отнести для него отдельный акт творения. Закончив свое исследование, Максвелл мог бы сказать: «Да будет электричество и магнетизм, и станет свет!»
Этот кульминационный момент долго подготавливался постепенным раскрытием законов электричества и магнетизма, о которых мы подробно расскажем в дальнейшем. Вкратце история сводится к следующему. По мере того как постепенно открывались все новые свойства электричества и магнетизма, электрических сил притяжения и отталкивания, а также магнитных сил, было обнаружено, что, хотя эти силы носят довольно сложный характер, все они спадают обратно пропорционально квадрату расстояния. Известно, например, что именно таким образом меняются кулоновские силы между неподвижными зарядами. Отсюда вытекает, что на достаточно больших расстояниях системы зарядов мало влияют друг на друга. Связав между собой открытые до тех пор законы, Максвелл обнаружил, что они несовместны, и, чтобы сделать всю систему совместной, он добавил к уравнениям еще один член. Появление этого члена привело к замечательному предсказанию: часть электрического и магнитного поля спадает медленнее, чем обратный квадрат расстояния, а именно обратно пропорционально самому расстоянию! Отсюда Максвелл вывел, что электрические токи воздействуют на как угодно далекие системы зарядов, и предсказал все основные, хорошо нам теперь знакомые явления — передачу радиоволн, радиолокацию и т. д.
Кажется поистине чудом, что с помощью каких-то электрических воздействий человек, говорящий где-нибудь в Европе, может быть услышан за тысячи миль в Лос-Анджелесе. Почему это стало возможным? Потому, что поля спадают обратно пропорционально не квадрату, а первой степени расстояния. Наконец, было показано, что свет тоже представляет собой электрические и магнитные поля, распространяющиеся на большие расстояния, а генерируется он неправдоподобно быстрым колебанием электронов в атомах. Все эти явления мы будем называть излучением, или, более точно, электромагнитным излучением, потому что бывают и другие типы излучений. Но почти всегда излучение означает электромагнитное излучение.
И тут выступает единство явлений во Вселенной. Движение атомов далекой звезды даже на огромных расстояниях возбуждает электроны нашего глаза, и мы узнаем о звездах. Если бы закона воздействия полей не существовало, мы бы буквально ничего не знали о внешнем мире! А электрические бури в галактике, удаленной от нас на пять миллиардов световых лет (самой далекой из обнаруженных до сих пор), еще способны возбуждать токи в гигантской «чаше» радиотелескопа. Вот почему мы видим и звезды, и галактики.
Об этих замечательных явлениях и пойдет речь в настоящей главе. В самом начале нашего курса лекций мы обрисовали общую картину мира, но теперь мы более подготовлены к тому, чтобы понять ее глубже. Поэтому вернемся снова к общей картине явлений и поговорим о ней более подробно. Начнем мы с описания положения, которое физика занимала в конце XIX столетия. Все, что тогда было известно об основных закономерностях, можно сформулировать так.
Во-первых, была известна сила тяготения (мы ее записывали неоднократно). Сила, действующая на тело с массой m со стороны тела массы М, дается выражением
(28.1)
где er — единичный вектор, направленный от m к М, а r — расстояние между телами.
Во-вторых, к концу XIX века был известен такой закон электричества и магнетизма: сила, действующая на заряд q, характеризуется двумя полями Е и В и скоростью заряда v:
(28.2)
К этому нужно добавить формулы для Е и В. Для совокупности заряженных частиц поля Е и В представляются как суммы вкладов от каждой частицы в отдельности. Таким образом, определив Е и В для одного заряда и сложив вклады от всех зарядов во Вселенной, мы получим полную величину Е и В! В этом и состоит принцип суперпозиции.
Как теперь получить формулу для электрического и магнитного поля одного заряда? Оказывается, это очень сложно; понадобится затратить много труда и использовать тонкие доказательства. Но не в этом дело. Мы написали законы, собственно, чтобы подчеркнуть красоту природы, показать, что все основные законы можно уместить на одной странице (с обозначениями читатель уже знаком). Точная и вполне строгая формула для поля, создаваемого отдельным зарядом, насколько мы знаем, имеет очень сложный вид (мы отвлекаемся от эффектов квантовой механики). Поэтому мы не будем выводить ее подробно, а запишем сразу, как она выглядит. На самом деле правильнее было бы записать законы электричества и магнетизма с помощью уравнений поля, о которых будет сказано позднее. Но там используются совсем иные понятия и обозначения, поэтому давайте сейчас напишем выражения для поля в уже знакомой нам форме, хотя она и не очень удобна для вычислений.
Электрическое поле Е дается выражением
(28.3)
Что означают отдельные члены в этом выражении? Возьмем первый из них, Е=-qer'/4πε0r'2. Это уже знакомый нам закон Кулона; здесь q — заряд, создающий поле, er' — единичный вектор, направленный от точки Р, где измеряется поле Е, r — расстояние от Р до q. Но закон Кулона неточен. Открытия, сделанные в XIX веке, показали, что любое воздействие не может распространяться быстрее некоторой фундаментальной скорости с, называемой теперь скоростью света. Поэтому определить положение заряда в настоящий момент времени невозможно. Кроме того, на поле в данный момент времени может влиять только поведение заряда в прошлом. А как давно в прошлом? Задержка во времени, или так называемое время запаздывания, есть время, необходимое для прохождения расстояния от заряда до точки измерения поля Р со скоростью света с. Время запаздывания равно r'/с. Таким образом, первый член в (28.3) представляет собой не обычный, а запаздывающий закон Кулона.
Чтобы учесть запаздывание, мы поставили штрих у r, понимая под r' то расстояние, на которое в начальный момент своего воздействия был удален заряд q от точки Р. Представим на минуту, что заряд несет с собой световые сигналы, которые движутся к точке Р со скоростью c. Тогда, глядя на заряд q, мы увидели бы его не в том месте, где он находится сейчас, а там, где он был некоторое время назад. В нашу формулу входит кажущееся направление er', так называемое запаздывающее направление, и запаздывающее расстояние r'. Это легко понять, но это еще не все. Дело, оказывается, еще гораздо сложнее.
В выражении (28.3) имеется и ряд других членов. Вторым членом природа как бы учитывает запаздывание в первом грубом приближении. Это поправка к запаздывающему кулоновскому члену; она представляет собой произведение скорости изменения кулоновского поля и времени запаздывания. Но и это не все. Есть еще третий член — вторая производная по t единичного вектора, направленного к заряду. Этим исчерпывается формула; мы учли все вклады в электрическое поле от произвольно движущегося заряда.
Магнитное поле выражается следующим образом:
(28.4)
Все предыдущее мы написали, чтобы показать красоту природы и, в некотором смысле, могущество математики. Говоря откровенно, мы даже не пытаемся понять, почему столь значительные по содержанию формулы занимают так мало места, ведь в них содержится и принцип действия генераторов тока, и особенности поведения света — словом, все явления электричества и магнетизма. Конечно, для полноты картины нужно добавить еще кое-что о свойствах использованных материалов (свойствах вещества), которые пока не учтены в (28.3).
Заканчивая краткое описание представлений о мире в XIX веке, следует упомянуть еще об одном фундаментальном обобщении, к которому в большой степени причастен и Максвелл, а именно о единстве явлений механики и теплоты. Мы будем говорить об этом в ближайшем будущем.
В XX столетии обнаружили, что все законы динамики Ньютона неправильны, и чтобы уточнить их, воспользовались квантовой механикой. (Законы Ньютона справедливы для тел достаточно больших размеров.) Совсем недавно законы квантовой механики в совокупности с законами электромагнетизма послужили основой для открытия законов квантовой электродинамики. Кроме того, был открыт ряд новых явлений, и раньше других — явление радиоактивности, открытое Беккерелем в 1898 г. (он похитил его из-под самого носа у XX столетия). Явление радиоактивности послужило началом развития науки о ядрах, новых частицах и о взаимодействиях совсем другого рода — не гравитационных и не электрических. Все эти вопросы еще ждут своего разрешения.
Для уж очень строгих и образованных читателей (скажем, профессоров, которым случится читать эти строки) специально добавим: наше утверждение, что выражение (28.3) содержит все известное из электродинамики, не совсем точно. Существует вопрос, который так и не был разрешен к концу XIX столетия. Если попробовать вычислить поле, создаваемое всеми зарядами, включая и тот заряд, на который в свою очередь действует поле, то возникнут трудности при попытке определить, например, расстояние от заряда до него самого и последующей подстановке этой величины, равной нулю, в знаменатель. Как быть с той частью поля, которая создается зарядом и на него же действует, до сих пор не понятно. Оставим этот вопрос, загадка не разгадана до конца, и мы по возможности будем избегать говорить о ней.
§ 2. Излучение
Перейдем от общей картины мира к явлениям излучения. Прежде всего мы должны выбрать тот член в выражении (28.3), который спадает обратно пропорционально первой (а не второй!) степени расстояния. Оказывается, что этот член имеет столь простой вид, что если принять его в качестве закона поведения электрического поля, создаваемого движущимся зарядом на больших расстояниях, то можно излагать электродинамику и оптику на элементарном уровне. Мы временно примем этот закон без доказательства, а позже изучим его подробнее.
Первый член в правой части (28.3) явно обратно пропорционален второй степени расстояния; легко показать, что и второй член, дающий поправку на запаздывание для первого, меняется таким же образом. Весь интересующий нас эффект заключен в третьем члене, и в общем он не так уж сложен. Этот член говорит нам следующее: посмотрите на заряд и заметьте направление единичного вектора (конец вектора скользит по поверхности единичной сферы). По мере движения заряда единичный вектор крутится, и его ускорение есть именно то, что нам нужно. Вот и все. Итак,
(28.5)
Формула (28.5) выражает закон излучения, потому что единственный член, который она содержит, спадает обратно пропорционально расстоянию и, следовательно, доминирует на больших расстояниях от заряда. (Часть, меняющаяся обратно пропорционально квадрату расстояния, становится настолько малой, что не представляет интереса.)
Продвинемся несколько вперед и выясним смысл формулы (28.5). Пусть заряд движется произвольным образом и мы наблюдаем его на некотором расстоянии. Представим на минуту, что заряд «светится» (хотя именно явление света мы и должны объяснить); итак, пусть заряд есть светящаяся белая точка. Мы видим движение этой точки. Но мы не можем точно определить, как она движется в данный момент, из-за упоминавшегося уже ранее запаздывания. Имеет смысл говорить только о том, как она двигалась в более ранний момент времени. Единичный вектор er' направлен к кажущемуся положению заряда. Конец вектора er', естественно, описывает некую кривую, так что ускорение имеет две составляющие. Одна из них — поперечная составляющая, возникающая из-за движения конца вектора вверх и вниз, а другая — радиальная, или продольная, возникающая из-за вращения конца вектора по сфере. Легко показать, что вторая составляющая много меньше первой и изменяется обратно пропорционально квадрату r для очень больших r. В самом деле, если отодвигать источник все дальше и дальше от точки наблюдения, колебания вектора er' будут становиться все слабее (обратно пропорционально расстоянию), а продольная составляющая ускорения будет убывать еще быстрее. Поэтому для практических целей достаточно спроектировать движение заряда на плоскость, находящуюся на единичном расстоянии. В результате мы приходим к следующему правилу: пусть мы наблюдаем движущийся заряд и все, что мы видим, запаздывает во времени, т. е. мы находимся в положении художника, который рисует пейзаж на полотне, стоящем от него на расстоянии единицы длины. Конечно, художник не учитывает тот факт, что скорость света конечна, а изображает мир таким, каким он его видит. Посмотрим, что он нарисует на этой картине. Мы увидим точку (изображение заряда), движущуюся по картине. Ускорение этой точки пропорционально электрическому полю. Вот и все, что нам нужно.
Таким образом, формула (28.5) дает полное и точное описание процесса излучения; в ней содержатся даже все релятивистские эффекты. Однако часто встречается более простая ситуация, когда заряды передвигаются с малой скоростью и на небольшие расстояния. Поскольку заряды движутся медленно, расстояния, которые они проходят с момента излучения, невелики, так что время запаздывания оказывается практически постоянным. В этом случае формула (28.5) упрощается. В самом деле, пусть заряд совершает малые смещения и находится примерно на одном и том же расстоянии от точки наблюдения. Время запаздывания на расстоянии r есть r/с. Тогда наше правило (определяющее поле излучения) будет выражаться так: если заряженное тело сдвигается на малые расстояния и боковое смещение есть x(t), то единичный вектор er' поворачивается на угол x/r, и поскольку r практически постоянно, то составляющая d2er'/dt2 в направлении x равна просто ускорению самой величины x в более ранний момент времени. В результате мы приходим к формуле
(28.6)
Сюда входят только составляющая аx, перпендикулярная лучу зрения. Попробуем понять, почему это так. В самом деле, когда заряд движется прямо к нам или от нас, единичный вектор в направлении заряда не смещается и ускорение равно нулю. Поэтому для нас существенно только боковое движение, т. е. только та часть ускорения, которая проектируется на экран.
§ 3. Дипольный излучатель
Примем формулу (28.6) в качестве основного закона электромагнитного излучения, т. е. будем считать, что электрическое поле, создаваемое нерелятивистски движущимся зарядом на достаточно больших расстояниях r, имеет вид (28.6). Электрическое поле обратно пропорционально r и прямо пропорционально ускорению заряда, спроектированному на «плоскость зрения», причем ускорение берется не в данный момент времени, а в более ранний (время запаздывания равно r/с). Вся оставшаяся часть главы будет посвящена приложению закона (28.6) к всевозможным явлениям распространения света и радиоволн, таким, как отражение, преломление, интерференция, дифракция и рассеяние. Закон (28.6) имеет фундаментальное значение и содержит всю необходимую для нас информацию. Остальная часть формулы (28.3) только декорация и нужна лишь для того, чтобы понять, как и почему возник закон (28.6).
В дальнейшем мы еще вернемся к формуле (28.3), а пока примем ее как нечто данное и отметим, что справедливость ее основывается не только на теоретических выводах. Можно придумать целый ряд опытов, в которых проявлялось бы действие закона (28.3). Для этого необходим ускоряющийся заряд. Строго говоря, заряд должен быть одиночным, но, если взять большое количество зарядов, движущихся одинаково, поле представится суммой вкладов отдельных зарядов. Для примера рассмотрим два отрезка проволоки, присоединенных к генератору, как показано на фиг. 28.1.
Фиг. 28.1. Высокочастотный генератор раскачивает электроны в проволоках вверх и вниз.
Суть дела в том, что генератор создает разность потенциалов или поле, которое в один момент времени выталкивает электроны из участка А и втягивает их в участок В, а через ничтожно малый промежуток времени действие поля становится обратным и электроны из В перекачиваются обратно в А! Так что в этих двух проволочках заряды на участках А и В как бы ускоряются одновременно то вверх, то вниз. Две проволоки и генератор нужны только в этом устройстве. Окончательный же результат таков, что заряды ускоряются вверх и вниз так, как если бы А и В составляли один кусок проволоки. Отрезок проволоки, длина которого очень мала по сравнению с расстоянием, проходимым светом за один период колебаний, называется электрическим дипольным осциллятором.
Таким образом, у нас есть прибор для создания электрического поля; теперь нам нужен прибор для детектирования электрического поля, но для этого можно взять то же самое устройство — пару проволок А и B! Если к такому устройству приложить электрическое поле, возникнет сила, движущая электроны по обеим проволокам либо вверх, либо вниз. Это движение фиксируется с помощью выпрямителя, смонтированного между проволоками А и В, а информация передается по тонкой проволоке в усилитель, где сигнал усиливается и воспроизводится со звуковой частотой путем модуляции радиочастот. Когда детектор воспринимает электрическое поле, из громкоговорителя доносится громкий звук; если поля нет, звука не возникает.
В помещении, где мы детектируем волны, обычно находятся и другие объекты, и электрическое поле тоже раскачивает в них электроны; они колеблются вверх и вниз и в свою очередь воздействуют на детектор. Поэтому для успешного эксперимента расстояние между источником волн и детектором не должно быть большим, чтобы снизить влияние волн, отраженных от стен и от нас самих. Таким образом, опыт может дать результаты, не вполне точно совпадающие с (28.6), но достаточные для грубой проверки нашего закона.
Включим теперь генератор и прислушаемся к звуковому сигналу. Когда детектор D находится в положении, параллельном генератору G в точке 1 (фиг. 28.2), мы услышим громкий сигнал (это характеризует большую величину поля).
Фиг. 28.2. Измерение электрического поля в точках окружности, центр которой совпадает с положением линейного осциллятора.
Ту же величину поля мы найдем и для любого азимутального угла θ, получаемого вращением вокруг оси G, потому что в нашем опыте ни одно азимутальное направление не выделено. С другой стороны, когда детектор находится в точке 3, поле оказывается равным нулю. Так и должно быть. Согласно нашей формуле, поле пропорционально ускорению заряда, спроектированному на плоскость, перпендикулярную лучу зрения. Когда детектор находится над генератором в точке 3, заряды движутся к детектору и обратно и, следовательно, поле не должно возникнуть. Итак, опыт подтверждает первое высказанное нами правило, что заряды, движущиеся в направлении D и обратно, никакого действия не оказывают. Во-вторых, из формулы следует, что поле перпендикулярно r и лежит в плоскости, построенной на векторах G и r; поэтому, поместив D в положение 1 и повернув на 90°, мы сигнала не услышим. Это как раз и означает, что электрическое поле направлено по вертикали. Если D смещено на некоторый промежуточный угол, наиболее громкий сигнал получается при ориентации детектора, указанной на рисунке. Дело в том, что, хотя генератор G и расположен вертикально, создаваемое им поле не будет параллельно направлению самого генератора; эффект определяется составляющей ускорения, перпендикулярной лучу зрения. В положении 2 сигнал оказывается слабее, чем в положении 1 именно из-за эффекта проектирования.
§ 4. Интерференция
Возьмем теперь два источника, расположенных рядом, на расстоянии в несколько сантиметров один от другого (фиг. 28.3).
Фиг. 28.3. Интерференция полей от двух источников.
Если оба источника присоединены к одному генератору и заряды в них движутся вверх и вниз одинаковым образом, то по принципу суперпозиции действия обоих источников складываются; электрическое поле равно сумме двух слагаемых и оказывается в два раза больше, чем в предыдущем случае.
Здесь появляется интересная возможность. Пусть заряды в S1 и S2 ускоряются вверх и вниз, но в S2 движение зарядов запаздывает и сдвинуто по фазе на 180°. Тогда в один и тот же момент времени поле, создаваемое S1, будет иметь одно направление, а поле, создаваемое S2,— противоположное, и, следовательно, в точке 1 никакого эффекта не возникнет. Относительную фазу колебаний легко создать с помощью трубки, передающей сигнал в S2. При изменении длины трубки меняется и время прохождения сигнала до S2, а следовательно, меняется разность фаз колебаний. Подобрав нужную длину трубки, мы можем добиться такого положения, что сигнал исчезнет, несмотря на движение зарядов в источниках S1 и S2! Излучение каждого источника в отдельности легко установить, выключая один из них; тогда действие второго обнаруживается сразу. Таким образом, если все сделать аккуратно, оба источника в совокупности могут дать нулевой эффект.
Теперь интересно убедиться, что сложение двух полей фактически есть векторное сложение. Мы только что рассмотрели случай движения зарядов вверх и вниз; обратимся теперь к примеру двух непараллельных движений. Прежде всего установим для S1 и S2 одинаковые фазы, т. е. пусть заряды движутся одинаково. Далее повернем S1 на угол 90°, как показано на фиг. 28.4.
Фиг. 28.4. Иллюстрация векторного характера сложения полей.
В точке 1 произойдет сложение двух полей, одного от горизонтального источника, а другого — от вертикального.
Полное электрическое поле представится векторной суммой двух сигналов, находящихся в одной и той же фазе; оба сигнала одновременно проходят и через максимум и через нуль. Суммарное поле должно быть равно сигналу R, повернутому на 45°. Максимальный звук будет получен, если повернуть детектор D на 45°, а не в вертикальном направлении. При повороте на прямой угол по отношению к указанному направлению звуковой сигнал, как легко проверить, должен быть равен нулю. И действительно, именно это и наблюдается!
А как быть с запаздыванием? Как показать, что сигнал действительно запаздывает? Конечно, прибегнув к большому числу сложных устройств, можно измерить время прибытия сигнала, но есть другой, очень простой способ. Обратимся снова к фиг. 28.3 и предположим, что S1 и S2 находятся в одной фазе. Оба источника колеблются одинаково и создают в точке 1 равные поля. Но вот мы перешли в точку 2, которая находится ближе к S2, чем к S1. Тогда, поскольку запаздывание определяется величиной r/c, при разных запаздываниях сигналы будут приходить с разными фазами. Следовательно, должна существовать такая точка, для которой расстояния от D до S1 и S2 различаются на такую величину Δ, когда сигналы будут погашаться.
В этом случае Δ должна быть равна расстоянию, проходимому светом за половину периода колебаний генератора. Сдвинемся еще дальше и найдем точку, где разность расстояний соответствует полному периоду колебаний, т.е. сигнал от первой антенны достигает точки 3 с запаздыванием по сравнению с сигналом от второй антенны, и это запаздывание в точности равно одному периоду колебаний. Тогда оба электрических поля снова находятся в одной фазе и сигнал в точке 3 опять становится сильным.
На этом закончим описание экспериментальной проверки важнейших следствий формулы (28.6). Мы, конечно, не касались вопроса об электрических полях, спадающих по закону 1/r, и не учитывали, что магнитное поле сопутствует электрическому при распространении сигнала. Для этого требуется довольно сложная техника вычислений, и вряд ли это что-либо добавит к нашему пониманию вопроса. Во всяком случае, мы установили свойства, наиболее важные для последующих приложений, а к другим свойствам электромагнитных волн мы еще вернемся.
Глава 29 ИНТЕРФЕРЕНЦИЯ
§ 1. Электромагнитные волны
В этой главе мы будем обсуждать те же вопросы, что и в предыдущей, но с большими математическими подробностями. Качественно мы уже показали, что поле излучения двух источников имеет максимумы и минимумы, и теперь наша задача — дать математическое, а не просто качественное описание поля.
Мы вполне удовлетворительно разобрали физический смысл формулы (28.6), рассмотрим теперь некоторые ее математические черты. Прежде всего поле заряда, движущегося вверх и вниз с малой амплитудой в направлении 0 от оси движения, перпендикулярно лучу зрения и лежит в плоскости ускорения и луча зрения (фиг. 29.1).
Фиг. 29.1. Напряженность поля Е, создаваемая положительным зарядом с запаздывающим ускорением a'.
Обозначим расстояние через r, тогда в момент времени t величина электрического поля равна
(29.1)
где a(t-r/с) — ускорение в момент времени (t-r/с), или запаздывающее ускорение.
Интересно нарисовать картину распределения поля в разных случаях. Наиболее характерный множитель в формуле (29.1) — это a (t-r/с); чтобы его понять, возьмем простейший случай θ=90° и изобразим поле на графике. Раньше мы были заняты вопросом, как ведет себя поле в данной фиксированной точке пространства с течением времени. Теперь посмотрим, как выглядит поле в разных точках пространства в один и тот же момент времени. Иначе говоря, нам нужен «моментальный снимок» поля, из которого будет ясно, каково оно в разных местах. Разумеется, картина распределения поля зависит от ускорения заряда. Зададим характер движения заряда: пусть сначала он покоится, затем внезапно начнет определенным образом ускоряться (как показано на фиг. 29.2) и, наконец, остановится.
Фиг. 29.2. Ускорение некоторого заряда как функция времени.
Затем, чуть позже, измерим поле в разных точках пространства. Мы можем утверждать, что поле будет иметь вид, приведенный на фиг. 29.3.
Фиг. 29.3. Электрическое поле как функция положения точки наблюдения спустя некоторый промежуток времени. Множителем 1/r пренебрегаем.
В самом деле, поле в каждой точке определяется ускорением заряда в предыдущий момент времени, причем под словом «предыдущий» понимается r/с секунд назад. Чем дальше точка, тем более ранним моментом времени определяется для нее ускорение. Поэтому кривая на фиг. 29.3 в некотором смысле есть «обращенный» во времени график ускорения; время и расстояние отличаются постоянным множителем c, который часто выбирается равным единице. Этот факт легко заметить и в математической записи a(t-r/с). Ясно, что добавка интервала времени Δt и вычитание отрезка пути Δr=-cΔt дают одну и ту же величину a(t-r/с).
Другими словами, увеличив время на Δt, можно восстановить значение a(t-r/с) добавлением отрезка Δr=сΔt, т. е. поле распространяется со временем как волна, уходящая от источника. Вот почему иногда говорят, что свет движется как волна. Можно также сказать, что поле запаздывает во времени, или иначе, что поле распространяется вширь с течением времени.
Особый интерес представляет случай периодических колебаний заряда q. В опыте, рассмотренном в гл. 28, смещение зарядов x в момент t равнялось некоторой константе х0, амплитуде колебаний, умноженной на cosωt. Ускорение в этом случае равно
(29.2)
где a0, равное — ω2x0, и есть амплитуда ускорения. Подставляя эту формулу в (29.1), находим
(29.3)
Отвлечемся пока от угла θ и постоянных и посмотрим, как ведет себя Е (29.3) в зависимости от времени или координат.
§ 2. Энергия излучения
Как мы уже говорили, в любой момент времени и в любой точке пространства напряженность поля меняется обратно пропорционально расстоянию r. Следует заметить, что энергия, несомая волной, и любые энергетические характеристики электрического поля пропорциональны квадрату поля. Пусть, например, заряд или осциллятор находится в электрическом поле и под влиянием поля начинает двигаться. Для линейного осциллятора смещение, ускорение и скорость, возникающие под действием поля, прямо пропорциональны величине поля. Поэтому кинетическая энергия заряда пропорциональна квадрату поля. Мы примем, что энергия, которую поле может передать какой-либо системе, пропорциональна квадрату поля.
Отсюда следует, что энергия, получаемая в данном месте от источника поля, уменьшается по мере удаления от источника, точнее, она падает обратно пропорционально квадрату расстояния. Существует очень простая интерпретация этого факта: соберем энергию волны, попадающую в конус с вершиной в источнике, сначала на расстоянии r1 (фиг. 29.4), а затем на расстоянии r2; тогда количество энергии, падающее на единичную площадку, обратно пропорционально квадрату расстояния r, а площадь поверхности внутри конуса растет прямо пропорционально квадрату расстояния r от поверхности до вершины конуса.
Фиг. 29.4. Количество энергии, протекающей внутри конуса OABCD, не зависит от расстояния r, на котором оно измеряется.
Таким образом, на каком бы расстоянии от вершины конуса мы ни находились, энергия, проходящая внутри конуса, одна и та же! В частности, если окружить источник со всех сторон поглощающими осцилляторами, то полное количество энергии, поступающее в них от волны, будет постоянным, независимо от расстояния до источника. Закон спадания поля Е как 1/r эквивалентен утверждению, что имеется поток энергии, который нигде не теряется; при этом энергия распространяется на все большие и большие области пространства. Таким образом, заряд, колеблясь, безвозвратно теряет энергию, уходящую все дальше и дальше. Заряд не может вернуть излученную энергию с тех расстояний, где применимо наше рассмотрение; для достаточно больших расстояний от источника вся излученная энергия уходит прочь. Конечно, энергия не исчезает бесследно и ее можно поглотить с помощью других систем. Потери энергии на излучение мы будем изучать в гл. 32.
Рассмотрим теперь более подробно волны вида (29.3) как функции времени в данном месте и как функции расстояния в данный момент времени. Как и раньше, будем отвлекаться от постоянных множителей и множителя 1/r.
§ 3. Синусоидальные волны.
Зафиксируем вначале r и рассмотрим поле как функцию времени. Получается функция, которая осциллирует с угловой частотой ω. Угловую частоту со можно определить как скорость изменения фазы со временем (радианы в секунду). Эта величина нам уже знакома. Период есть время одного колебания, одного полного цикла; он равен 2π/ω, так как произведение ω и периода есть полный период косинуса.
Введем новую величину, которая очень часто используется в физике. Она возникает в другой ситуации, когда t фиксировано и волна рассматривается как функция расстояния r. Легко увидеть, что как функция r волна (29.3) тоже осциллирует. Если отвлечься от множителя 1/r, то мы видим, что Е тоже осциллирует, когда мы меняем положение. Тогда по аналогии с ω введем так называемое волновое число и обозначим его через k. Оно определяется как скорость изменения фазы с расстоянием (радианы на метр). Время при таком изменении остается фиксированным.
Роль периода здесь играет другая величина, ее можно было бы назвать периодом в пространстве, однако ее обычное название — длина волны, а обозначается она буквой λ. Длина волны есть расстояние, на котором колебание поля совершает один полный цикл. Легко видеть, что длина волны равна 2π/k, потому что k, умноженное на длину волны, равно полному периоду косинуса. Итак, соотношение kλ=2π полностью аналогично ωt0=2π.
В нашем конкретном случае между частотой и длиной волны имеется определенная связь, однако приведенные выше определения k и ω носят совершенно общий характер и применимы также в тех физических условиях, когда никакого соотношения между этими величинами нет. Для рассматриваемой нами волны скорость изменения фазы с расстоянием найти легко. В самом деле, запишем выражение для фазы φ=ω(t-r/с) и возьмем частную производную по r
(29.4)
Это соотношение можно записать разными способами:
(29.5)
(29.6)
(29.7)
(29.8)
Почему длина волны оказывается равной периоду, умноженному на c? Очень просто. Дело в том, что за время, равное одному периоду, волны, двигаясь со скоростью с, пройдут расстояние ct0, а, с другой стороны, это расстояние должно быть равно длине волны.
В других физических явлениях, когда приходится иметь дело не со светом, такого простого соотношения между k и ω может и не быть. Пусть волна движется вдоль оси x, тогда распространение синусоидальной волны с частотой ω и волновым числом k описывается общей формулой вида sin(ωt-kx).
Введенное понятие длины волны позволяет уточнить пределы применимости формулы (29.1). Напомним, что поле складывается из нескольких частей: одна из них спадает как 1/r, другая — как 1/r2, а остальные падают с расстоянием еще быстрее. Имеет смысл выяснить: когда часть, спадающая по закону 1/r, наиболее существенна, а остальными можно пренебречь? Естественно ответить: «Когда мы отойдем достаточно далеко от источника, потому что член 1/r2 будет мал по сравнению с членом 1/r». Но что значит «достаточно далеко»? В общих чертах ответ таков: все остальные члены имеют порядок величины λ/r по сравнению с первым членом 1/r. Так что когда мы находимся на расстоянии нескольких длин волн от источника, формула (29.1) описывает поле в хорошем приближении. Область, удаленную от источника на расстояние, превышающее несколько длин волн, иногда называют «волновой зоной».
§ 4. Два дипольных излучателя
Рассмотрим теперь результирующее поле, которое возникает при одновременном действии двух осцилляторов. В предыдущей главе уже разбиралось несколько наиболее простых случаев. Мы дадим сначала качественную картину явления, а затем опишем те же эффекты с количественной точки зрения. Возьмем простейший случай, когда осцилляторы и детектор расположены в одной горизонтальной плоскости, а колебания осцилляторов происходят в вертикальном направлении.
На фиг. 29.5,а показан вид обоих осцилляторов сверху; в данном случае расстояние между ними в направлении север — юг равно половине длины волны и колеблются они в одной фазе, т.е. разность фаз осцилляторов равна нулю.
Фиг. 29.5. Зависимость интенсивности излучения двух диполей, находящихся на расстоянии в половину длины, волны, от направления излучения. A — диполи в фазе (α=0); б — диполи в противофазе (α=π).
Нас интересует интенсивность излучения в разных направлениях. Под интенсивностью мы подразумеваем количество энергии, проходящей мимо нас в 1 сек; оно пропорционально квадрату напряженности поля, усредненному по времени. Так, для определения яркости света нужно взять квадрат напряженности электрического поля, а не саму напряженность. (Напряженность электрического поля характеризуется силой, с которой поле действует на неподвижный заряд, а количество энергии, проходящей через некоторую площадку, пропорционально квадрату напряженности поля и измеряется в ваттах на квадратный метр. Коэффициент пропорциональности будет выведен в следующей главе.) Если мы находимся к западу от системы осцилляторов, к нам от обоих осцилляторов приходят поля, одинаковые по величине и с одной фазой, так что суммарное электрическое поле в два раза больше поля отдельного осциллятора. Следовательно, интенсивность будет в четыре раза больше интенсивности, возникающей от действия только одного осциллятора. (Числа на фиг. 29.5 указывают интенсивность, причем за единицу измерения выбрана интенсивность излучения одного осциллятора, помещенного в начале координат.) Пусть теперь поле измеряется в северном или южном направлении, вдоль линии осцилляторов. Поскольку расстояние между осцилляторами равно половине длины волны, их поля излучения различаются по фазе ровно на полцикла, а следовательно, суммарное поле равно нулю. Для промежуточного угла (равного 30°) интенсивность равна 2, т. е., уменьшаясь, интенсивность последовательно принимает значения 4, 2, 0 и т. д. Нам нужно научиться находить интенсивность для разных углов. По существу, это сводится к задаче о сложении двух колебаний с разными фазами.
Давайте коротко рассмотрим еще несколько интересных случаев. Пусть расстояние между осцилляторами, как и раньше, равно половине длины волны, но колебания одного осциллятора отстают по фазе от колебаний другого на половину периода (см. фиг. 29.5, б). Интенсивность в горизонтальном направлении (западном или восточном) обращается в нуль, потому что один осциллятор «толкает» в одном направлении, а другой — в обратном. В северном направлении сигнал от ближайшего осциллятора приходит на полпериода раньше сигнала от дальнего осциллятора. Но последний запаздывает в своих колебаниях как раз на полпериода, так что оба сигнала приходят одновременно, и интенсивность в северном направлении равна 4. Интенсивность под углом 30°, как будет показано позже, снова равна 2.
Теперь мы подошли к одному интересному свойству, весьма полезному на практике. Заметим, что фазовые соотношения между осцилляторами используются при передаче радиоволн. Допустим, мы хотим направить радиосигнал на Гавайские острова. Используем для этого систему антенн, расположенную так, как показано на фиг. 29.5, а, и установим между ними нулевую разность фаз. Тогда максимальная интенсивность будет идти как раз в нужном направлении, поскольку Гавайские острова лежат на западе от США. На следующий день мы решим передавать сигналы уже в Канаду. А поскольку Канада находится на севере, нам надо только изменить знак одной из антенн, чтобы антенны находились в противофазе, как на фиг. 29.5, б, и передача пойдет на север. Можно придумать разные устройства системы антенн. Наш способ—один из самых простых; мы можем значительно усложнить систему и, выбрав нужные фазовые соотношения, послать пучок с максимальной интенсивностью в требуемом направлении, даже не сдвинув с места ни одну из антенн! Однако в обеих радиопередачах мы затрачивали много энергии зря, она уходила в прямо противоположном направлении; интересно знать, есть ли способ посылать сигналы только в одном направлении? На первый взгляд кажется, что пара антенн такого типа будет всегда излучать симметрично. На самом деле картина гораздо разнообразнее; рассмотрим для примера случай несимметричного излучения двух антенн.
Пусть расстояние между антеннами равно четверти длины волны и северная антенна отстает от южной по фазе на четверть периода. Что у нас тогда получится (фиг. 29.6)?
Фиг. 29.6. Две дипольные антенны, дающие максимум излучения в одном направлении.
Как мы дальше покажем, в западном направлении интенсивность равна 2. В южном направлении получится нуль, потому что сигнал от северного источника N приходит на 90° позже сигнала от южного источника S и, кроме того, он отстает по фазе еще на 90°; в результате полная разность фаз есть 180° и суммарный эффект равен нулю. В северном направлении сигнал от источника N приходит на 90° раньше сигнала от S, поскольку источник N на четверть волны ближе. Но разность фаз равна 90° и компенсирует задержку во времени, поэтому оба сигнала приходят с одной фазой, что дает интенсивность, равную 4.
Таким образом, проявив некоторую изобретательность в расположении антенн и выбрав нужные сдвиги фаз, можно направить энергию излучения в одном направлении. Правда, энергия будет все-таки испускаться в довольно большой интервал углов. А можно ли сфокусировать излучение в более узкий интервал углов? Обратимся снова к передаче волн на Гавайские острова; там радиоволны шли на запад и на восток в широком диапазоне углов и даже на угол 30° интенсивность была всего вдвое меньше максимальной, энергия расходовалась впустую.
Можно ли улучшить это положение? Рассмотрим случай, когда расстояние между источниками равно десяти длинам волн (фиг. 29.7), а разность фаз колебаний равна нулю.
Фиг. 29.7. Распределение интенсивности двух диполей, находящихся на расстоянии 10λ друг от друга.
Это ближе к ситуации, описанной ранее, когда мы экспериментировали с интервалами, равными нескольким длинам волн, а не малым долям длины волны. Здесь иная картина.
Если расстояние между источниками равно десяти длинам волн (мы выбираем более легкий случай, когда они находятся в фазе), то в западном и восточном направлениях интенсивность максимальна и равна 4. Если же сдвинуться на небольшой угол, разность фаз станет равной 180° и интенсивность обратится в нуль. Более строго: если мы проведем прямые от каждого осциллятора до точки наблюдения и вычислим разность расстояний до осцилляторов Δ, причем Δ окажется равным λ/2, то оба сигнала будут в противофазе и суммарный эффект равен нулю. Этому направлению отвечает первый нуль на фиг. 29.7 (масштаб на рисунке не выдержан, это, по существу, грубая схема). Это означает, что мы получаем узкий луч в нужном направлении; если же мы чуть сдвигаемся в сторону, интенсивность исчезает. Для практических целей, к сожалению, такие передающие системы имеют существенный недостаток: при некотором угле расстояние Δ может стать равным λ и тогда оба сигнала снова окажутся в фазе! В результате получается картина с чередующимися максимумами и минимумами, точь-в-точь как в гл. 28 для расстояния между осцилляторами, равного 2,5λ.
Как избавиться от всех лишних максимумов? Существует довольно интересный способ устранения нежелательных максимумов. Поместим между нашими двумя антеннами целый ряд других (фиг. 29.8).
Фиг. 29.8. Устройство из шести дипольных антенн и часть распределения интенсивности его излучения.
Пусть расстояние между крайними по-прежнему равно 10λ, а через каждые 2λ поставим по антенне и настроим все антенны на одну фазу. Всего у нас будет, таким образом, шесть антенн, и интенсивность в направлении запад — восток, конечно, сильно возрастет по сравнению с интенсивностью от одной антенны. Поле увеличится в шесть раз, а интенсивность, определяемая квадратом поля,— в тридцать шесть раз. Поблизости от направления запад — восток, как и раньше, возникнет направление с нулевой интенсивностью, а дальше, там, где мы ожидали увидеть высокий максимум, появится всего лишь небольшой «горб». Попробуем разобраться, почему так происходит.
Причина появления максимума, казалось бы, по-прежнему существует, поскольку Δ может равняться длине волны, и осцилляторы 1 и 6, находясь в фазе, взаимно усиливают свои сигналы. Но осцилляторы 3 и 4 оказываются не в фазе с осцилляторами 1 и 6, отличаясь от них по фазе приблизительно на половину длины волны, и вызывают обратный эффект по сравнению с этими осцилляторами. Поэтому интенсивность в данном направлении оказывается малой, хотя и не равной точно нулю. В результате возникает мощный луч в нужном направлении и ряд небольших побочных максимумов. Но в нашем частном примере есть одна добавочная неприятность: поскольку расстояние между соседними диполями равно 2 λ, можно найти угол, для которого разность хода σ лучей от соседних диполей в точности равна длине волны. Сигналы от соседних осцилляторов будут отличаться на 360°, т. е. снова окажутся в фазе, и в этом направлении мы получим еще один мощный пучок радиоволн! На практике этого эффекта легко избежать, если выбрать расстояние между осцилляторами меньше одной длины волны. Само же возникновение добавочных максимумов при расстоянии между осцилляторами более одной длины волны очень интересно и важно, но не для передачи радиоволн, а для дифракционных решеток.
§ 5. Математическое описание интерференции
Мы рассматривали излучение диполей с качественной точки зрения, теперь рассмотрим количественную картину. Найдем прежде всего суммарное поле от двух источников в самом общем случае, когда разность фаз α и силы осцилляторов A1 и A2 произвольны; для этого необходимо сложить два косинуса с одинаковой частотой, но разными фазами. Разность фаз находится весьма просто: она складывается из разности, возникающей за счет неодинакового удаления точки наблюдения от обоих источников, и внутренней, заданной разности фаз колебаний. Выражаясь математически, нам необходимо сложить две волны: R=A1cos(ωt+φ1)+А2cos(ωt+φ2). Как это сделать?
Каждый, вероятно, сумеет провести это сложение, но тем не менее проследим за ходом вычислений. Прежде всего, если мы разбираемся в математике и достаточно ловко управляемся с синусами и косинусами, эту задачу легко решить. Самый простой случай, когда амплитуда A1 равна А2, и пусть обе они обозначаются через А. В этих условиях (назовем это тригонометрическим методом решения задачи) мы имеем
(29.9)
На уроках тригонометрии вы, вероятно, доказывали равенство
(29.10)
Если это нам известно, то мы немедленно получаем R:
(29.11)
Итак, мы снова получили синусоидальную волну, но с новой фазой и новой амплитудой. Вообще результат сложения двух синусоидальных волн есть синусоидальная волна с новой амплитудой AR, называемой результирующей амплитудой, и новой фазой φR, называемой результирующей фазой. В нашем частном случае результирующая амплитуда равна
(29.12)
а результирующая фаза есть арифметическое среднее обеих фаз. Таким образом, поставленная задача полностью решена. Предположим теперь, что мы забыли формулу сложения косинусов. Тогда можно применить другой метод решения — геометрический. Косинус, зависящий от ωt, можно представить в виде горизонтальной проекции некоторого вращающегося вектора. Пусть имеется вектор А1, вращающийся с течением времени; длина его равна A1, а угол с осью абсцисс равен ωt+φ1. (Мы пока опустим слагаемое ωt; как мы увидим, при выводе это не играет роли.) Сделаем моментальный снимок векторов в момент времени t=0, помня, что на самом деле вся схема вращается с угловой скоростью ω (фиг. 29.9).
Фиг. 29.9. Геометрический способ сложения двух косинусоидальных волн. Чертеж вращается со скоростью ω против часовой стрелки.
Проекция A1 на ось абсцисс в точности равна A1cos(ωt+φ1). В момент времени t=0 вторая волна представляется вектором A2, длина которого равна A2, а его угол с осью абсцисс равен φ2, причем он тоже вращается с течением времени. Оба вектора вращаются с одинаковой угловой скоростью ω, и их относительное расположение неизменно. Вся система вращается жестко, подобно твердому телу.
Горизонтальная проекция А2 равна A2cos(ωt+φ2). Из векторного анализа известно, что при сложении двух векторов по правилу параллелограмма образуется новый, результирующий вектор АR, причем x-компонента его есть сумма х-компонент слагающих векторов. Отсюда получаем решение нашей задачи. Легко проверить, что получается правильный ответ в нашем частном случае A1=А2=А. Действительно, из фиг. 29.9 очевидно, что AR лежит посредине между A1 и А2 и составляет угол 1/2(φ2-φ1) с каждым из них. Следовательно, AR=2Аcos1/2(φ2-φ1), что совпадает с прежним результатом. Кроме того, в случае А1-А2 фаза AR есть среднее от фаз A1 и А2. Для неравных A1 и А2 задача решается столь же просто. Мы можем назвать это геометрическим решением задачи.
Существует еще один метод решения задачи, его можно было бы назвать аналитическим. Вместо того чтобы рисовать схему, подобную приведенной на фиг. 29.9, напишем выражения, имеющие тот же смысл, что и чертеж, и сопоставим каждому вектору комплексное число. Действительные части этих комплексных чисел отвечают реальным физическим величинам. В нашем конкретном случае волны записываются следующим образом: A1ехр[i(ωt+φ1)] [действительная часть этого равна A1cos(ωt+φ1)] и A2ехр[i(ωt-+φ2)]. Сложим обе волны:
(29.13)
или
(29.14)
Задача, таким образом, решена, так как мы имеем окончательный результат в виде комплексного числа с модулем AR и фазой φR.
Для иллюстрации аналитического метода найдем амплитуду АR, т. е. «длину» R. «Длина» комплексного числа в квадрате есть само комплексное число, умноженное на сопряженное ему.
Комплексное сопряжение состоит в изменении знака i. Отсюда получаем
(29.15)
Перемножая, получаем A12+A22 и перекрестные члены
Далее
т. e. eiθ+e-iθ=2cosθ. Следовательно, окончательный результат есть
(29.16)
(С помощью формул тригонометрии легко установить совпадение получаемого результата с длиной AR на фиг. 29.9.)
Итак, суммарная интенсивность складывается из члена А12, возникающего от действия только первого источника, интенсивности А22, равной интенсивности второго источника, и еще дополнительного члена. Этот дополнительный член мы назовем эффектом интерференции. Он представляет собой разность между истинным результатом сложения и суммой интенсивностей. Интерференционный член может быть как положительным, так и отрицательным. [Интерференция (interference) в английской разговорной речи означает возражение, помеху, но в физике слова часто теряют первоначальный смысл и употребляются совсем в другом значении!] Если интерференционный член положителен, мы будем говорить о конструктивной интерференции (буквальный смысл этого выражения покажется ужасным всем, кроме физиков!). В противном случае мы говорим о деструктивной интерференции.
Посмотрим теперь, как применить нашу общую формулу (29.16) для сложения полей излучения двух осцилляторов к тем частным случаям, которые мы уже качественно обсуждали. Для этого необходимо лишь вычислить разность фаз φ1-φ2 двух сигналов, приходящих в данную точку пространства. (Эффект, разумеется, связан с разностью фаз, а не с их абсолютными значениями.) Рассмотрим случай, когда два осциллятора с равными амплитудами и с относительной фазой колебаний α (когда колебания одного имеют фазу нуль, фаза другого равна α) расположены на расстоянии d друг от друга. Будем искать интенсивность под углом θ к линии запад — восток. [Заметьте, что этот угол не имеет ничего общего с углом θ в формуле (29.1).] Разность расстояний от точки Р до осцилляторов равна dsinθ (фиг. 29.10), поэтому разность фаз, возникающая по этой причине, равна числу длин волн, заключенных на отрезке dsinθ, умноженному на 2π.
Фиг. 29.10. Два осциллятора, обладающие одинаковой амплитудой и разностью фаз α.
(Более подготовленный читатель, вероятно, умножил бы волновое число k, т. е. скорость изменения фазы с расстоянием, на d sinθ, результат получится тот же самый.) Разность фаз, возникающая из-за разности хода лучей, есть, таким образом, (2πdsinθ)/λ, но из-за относительного запаздывания осцилляторов возникает дополнительная разность фаз α. Отсюда полная разность фаз двух волн в точке наблюдения равна
(29.17)
Это выражение охватывает все случаи. Теперь остается только подставить его в (29.16) и положить A1=А2; получится формула, с помощью которой можно вывести все результаты для двух антенн одинаковой интенсивности.
Рассмотрим частные случаи. Например, на фиг. 29.5 мы полагали, что интенсивность на угол 30° равна 2. Откуда это получается? Осцилляторы находятся на расстоянии X/2, следовательно, для угла 30° dsinθ=λ/4, отсюда φ2-φ1=2πλ/4λ=π/2 и интерференционный член равен нулю. (Происходит сложение двух векторов, направленных под углом 90° друг к другу.) Сумма векторов есть гипотенуза прямоугольного равнобедренного треугольника, она в √2 раз больше каждой амплитуды. Следовательно, интенсивность в 2 раза больше интенсивности каждого источника в отдельности. Все остальные примеры исследуются точно таким же способом.
Глава 30 ДИФРАКЦИЯ
§ 1. Результирующее поле n одинаковых осцилляторов
Настоящая глава — непосредственное продолжение предыдущей, хотя название «Интерференция» здесь заменено словом «Дифракция». До сих пор никому не удалось удовлетворительным образом определить разницу между дифракцией и интерференцией. Дело здесь только в привычке, а существенного физического различия между этими явлениями нет. Единственное, что можно сказать по этому поводу,— это следующее: когда источников мало, например два, то результат их совместного действия обычно называют интерференцией, а если источников много, то чаще говорят о дифракции. Поэтому мы не будем утруждать себя вопросом — интерференция это или дифракция, а просто продолжим наше обсуждение с того места, где мы остановились в предыдущей главе.
Обсудим теперь случай, когда имеется n осцилляторов, расположенных на равных расстояниях один от другого и обладающих равными амплитудами, но разными фазами создаваемых ими полей. Разность фаз создается либо из-за выбора определенных фазовых сдвигов колебаний осцилляторов, либо потому, что мы находимся под углом к осцилляторам и возникает разность хода лучей. Независимо от причины возникновения разности фаз необходимо вычислить сумму такого вида:
где φ — разность фаз соседних осцилляторов для некоторого направления лучей. В данном частном случае φ=α+2πd1/λsinθ. Вычислим сумму R. Для этого воспользуемся геометрическим способом сложения. Длина первого слагаемого А, а его фаза равна нулю; длина второго также А, а фаза его равна φ. Следующее слагаемое имеет снова длину А и фазу, равную 2φ, и т. д. В конце концов получается часть правильного многоугольника с n сторонами (фиг. 30.1).
Фиг. 30.1. Результирующая амплитуда шести аквидистантных источников при разности фаз φ между каждыми двумя соседними источниками.
Вершины многоугольника лежат, конечно, на окружности, и чтобы легче было определить результирующую амплитуду, найдем радиус этой окружности. Пусть Q есть ее центр. Тогда угол OQS равен как раз фазе φ (поскольку радиус QS образует с А2 такой же угол, как QO с A1). Следовательно, радиус r должен удовлетворять равенству А=2rsinφ/2, откуда мы и находим величину r. Далее, большой угол OQT равен nφ; следовательно, AR=2rsinnφ/2. Исключая из обоих равенств r, получаем
(30.2)
Таким образом, суммарная интенсивность оказывается равной
(30.3)
Проанализируем это выражение и обсудим вытекающие из него следствия. Прежде всего, положив n=1, получим, как и следовало ожидать, I=I0. Проверим формулу для n=2: с помощью соотношения sinφ=2sin φ/2cosφ/2 сразу находим АR=2Acosφ/2, что совпадает с (29.12).
Мы вынуждены рассматривать сложение полей от многих источников потому, что в этом случае интенсивность в одном направлении получается много больше, чем в соседних, т. е. все побочные максимумы интенсивности оказываются гораздо меньше основного. Чтобы понять этот факт, начертим кривую соответствующую выражению (30.3) для больших n и φ, близких к нулю. Прежде всего, когда φ точно равно нулю, мы получаем отношение 0/0, но фактически для бесконечно малых φ отношение синусов равно n2, так как синус можно заменить его аргументом. Таким образом, максимум кривой в n2 раз больше интенсивности одного осциллятора. Этот результат легко понять, поскольку при нулевой разности фаз все n маленьких векторов складываются в один вектор, в n раз больший исходного, а интенсивность увеличивается в n2 раз.
С ростом фазы φ отношение двух синусов падает и обращается в нуль в первый раз при nφ/2=π, поскольку sinπ=0. Другими словами, значение φ=2π/n отвечает первому минимуму кривой (фиг. 30.2). С точки зрения векторов на фиг. 30.1 первый минимум возникает в том случае, когда стрелки векторов возвращаются в исходную точку, при этом полная разность фаз от первого до последнего осциллятора равна 2π.
Перейдем к следующему максимуму и покажем, что он действительно, как мы и ждали, много меньше первого. Для точного определения положения максимума необходимо учитывать, что и числитель, и знаменатель в (30.3) оба меняются с изменением φ. Мы не станем этого делать, поскольку при большом n sinφ/2 меняется медленнее sinφ/2 и условие sinφ/2=1 дает положение максимума с большой точностью. Максимум sin2nφ/2 достигается при nφ/2=Зπ/2 или φ=Зπ/n. Это означает, что стрелки векторов описывают полторы окружности.
Подставляя φ=3π/n, получаем sin23π/2=1 в числителе (30.3) (с этой целью и был выбран угол φ) и sin23n/2n в знаменателе. Для достаточно большого n можно заменить синус его аргументом: sin 3π/2n=3π/2n. Отсюда интенсивность во втором максимуме оказывается равной I=I0(4n2/9π2). Но n2I0 — не что иное, как интенсивность в первом максимуме, т. е. интенсивность второго максимума получается равной 4/9π2 от максимальной, что составляет 0,047, или меньше 5%! Остальные максимумы, очевидно, будут еще меньше. Таким образом, возникает очень узкий основной максимум и очень слабые дополнительные максимумы по обе стороны от основного.
Можно показать, что площадь под кривой интенсивности, включая все максимумы, равна 2πnI0 и в два раза превышает площадь пунктирного прямоугольника на фиг. 30.2.
Фиг. 30.2. Зависимость интенсивности от фазового угла для большого числа осцилляторов с одинаковыми амплитудами.
Посмотрим теперь, что дает формула (30.3) в приложении к разным случаям. Пусть источники расположены на одной линии, как показано на фиг. 30.3.
Фиг. 30.3. Устройство из n одинаковых осцилляторов, расположенных на линии. Фаза колебания s-го осциллятора равна as=sa.
Всего имеется n источников на расстоянии d друг от друга, и сдвиг фазы между соседними источниками выбран равным α. Тогда для лучей, распространяющихся в заданном направлении θ, отсчитываемом от нормали, вследствие разности хода лучей от двух соседних источников возникает дополнительный сдвиг фазы 2πd(1/λ)sinθ. Таким образом,
(30.4)
Рассмотрим сначала случай α=0. Все осцилляторы колеблются с одной фазой; требуется найти интенсивность их излучения как функцию угла θ. Подставим с этой целью φ=kdsinθ в формулу (30.3) и посмотрим, что получится в результате. Прежде всего при φ=0 возникает максимум. Значит, осцилляторы, колеблющиеся с одной фазой, дают мощное излучение в направлении θ=0. Интересно узнать, где находится первый минимум.
Он возникает при φ=2π/n; другими словами, первый минимум кривой интенсивности определяется из соотношения (2πd/λ)sinθ=2π/n. Сокращая на 2π, получаем
(30.5)
Теперь разберем с физической точки зрения, почему минимум возникает именно в этом месте. В этом выражении nd есть полная длина L нашей системы осцилляторов. Обращаясь к фиг. 30.3, мы видим, что ndsinθ=Lsinθ=Δ. Формула (30.5) подсказывает нам, что минимум возникает при Δ, равном одной длине волны. Но почему минимум получается при Δ=λ? Дело в том, что поля от отдельных осцилляторов равномерно распределены по фазе от 0 до 360°. Стрелки (см. фиг. 30.1) описывают полную окружность; мы складываем равные векторы, имеющие произвольные направления, а в этом случае сумма равна нулю. Вот при таких значениях угла, когда Δ=λ, возникает минимум. Это и есть первый минимум.
Формула (30.3) имеет еще одну важную особенность: при увеличении угла φ на число, кратное 2π, значение интенсивности не меняется. Поэтому для φ=2π, 4π, 6π и т. д. также возникают резкие и высокие максимумы. Вблизи этих максимумов интенсивность повторяет свой ход (см. фиг. 30.2). Зададимся вопросом, в силу каких геометрических соотношений возникают другие максимумы? Условие появления максимума записывается в виде φ=2πm, где m — любое целое число. Отсюда получаем (2πd/λ)sinθ=2πm. Сокращая на 2π, получаем
(30.6)
Это соотношение очень похоже на формулу (30.5). Однако там было ndsinθ=λ. Разница в том, что здесь нужно взять каждый отдельный источник и выяснить, что для него означает условие dsinθ=mλ; угол θ здесь таков, что разность хода δ=mλ. Другими словами, волны, идущие от источников, различаются по фазе на величину, кратную 360°, и, следовательно, все находятся в фазе. Поэтому при сложении волн возникает столь же высокий максимум, как и в рассмотренном ранее случае m=0. Побочные максимумы и весь ход интенсивности здесь такие же, как в случае φ=0. Таким образом, наша система посылает пучки лучей в разных направлениях, причем каждый пучок имеет высокий центральный максимум и ряд слабых боковых. Главные (центральные) максимумы в зависимости от величины m называются максимумами нулевого, первого и т. д. порядков; m называют порядком максимума.
Обратите внимание на такой факт: если d меньше λ, то формула (30.6) имеет единственное решение при m=0. Поэтому для малого расстояния между источниками возникает один-единственный пучок, сконцентрированный около θ=0. (Разумеется, есть еще пучок в обратном направлении.) Чтобы получить максимумы других порядков, расстояние d должно быть больше одной длины волны.
§ 2. Дифракционная решетка
На практике равенство фаз осцилляторов или антенн достигается с помощью проводов и всяких специальных устройств. Возникает вопрос, можно ли и как создать подобную систему для света. Сейчас мы еще не умеем делать маленькие радиостанции оптической частоты в буквальном смысле слова, соединять их крохотными проволочками и устанавливать для всех них одинаковые фазы. Однако есть другой очень простой способ, позволяющий добиться этой цели.
Предположим, у нас имеется большое количество параллельных проводов, отстоящих друг от друга на расстоянии d, и источник радиоволн, расположенный очень далеко, практически на бесконечности. Этот источник создает электрическое поле у каждой из проволочек с одной и той же фазой. (Можно взять и объемную систему проводов, но мы ограничимся плоской системой.) Тогда внешнее электрическое поле будет двигать электроны взад и вперед в каждой проволочке, в результате они становятся новыми излучателями. Такое явление называется рассеянием: свет от некоторого источника вызывает движение электронов в среде, а оно в свою очередь генерирует собственные волны. Поэтому достаточно взять ряд проволок на равном расстоянии друг от друга, подействовать на них радиоволнами от удаленного источника, и получается нужная нам система без всяких специальных контуров и т. п. Если лучи падают по нормали к плоскости проводов, фазы колебаний будут одинаковыми и возникнет та картина, о которой говорилось выше. Так, при расстоянии между проволочками, превышающем длину волны, максимальная интенсивность рассеяния получается в направлении нормали и в других направлениях, определяемых формулой (30.6.).
Точно такое же устройство годится и для света! Только вместо проволок берут стеклянную пластинку и наносят на нее ряд штрихов так, чтобы каждый из них рассеивал свет иначе, чем остальная поверхность пластинки. Если затем направить на пластинку пучок света, то каждый штрих станет источником, а если расстояние между штрихами будет достаточно мало, но не меньше одной длины волны (практически таких малых расстояний все равно невозможно добиться), возникает удивительное явление: лучи идут через пластинку не только по прямой, но и под конечным углом к нормали, зависящим от расстояния между штрихами! Устройства такого типа действительно существуют и широко используются, их называют дифракционными решетками.
Одна из разновидностей дифракционных решеток представляет собой обычную стеклянную пластинку, прозрачную и бесцветную, с нацарапанными на ней штрихами. Число штрихов на 1 мм зачастую достигает нескольких сотен, а расстояние между ними выдерживается с большой точностью. Действие такой решетки можно наблюдать, посылая сквозь нее с помощью проектора узкую вертикальную полоску света (изображение щели) на экран. Помещая решетку на пути света так, чтобы штрихи были расположены вертикально, мы увидим на экране ту же самую полоску света, но по сторонам от нее, кроме того, будут и другие полосы, окрашенные в разные цвета. Разумеется, мы получили не что иное, как уширенное изображение щели; угол θ в (30.6) зависит от λ, и разная окраска света, как мы знаем, соответствует разным частотам и разным длинам волн. Самой большой видимой длиной волны обладает красный свет; в силу условия dsinθ=λ ему соответствует наибольшее θ. И мы действительно обнаруживаем, что на экране красная полоса лежит дальше всех от центра изображения! С другой стороны должна быть такая же полоса; и в самом деле, мы видим на экране вторую полосу. Выражение (30.6) имеет еще одно решение с m=2. На соответствующем ему месте на экране видно какое-то расплывчатое слабое пятно, а дальше в сторону чуть заметен еще целый ряд слабых полосок.
Только что мы сказали, что максимумы всех порядков должны иметь одинаковую интенсивность, а у нас интенсивность получается разная, и, более того, правый и левый максимумы первого порядка отличаются по своей яркости! Причина здесь кроется в том, что решетки изготовляются особым способом, чтобы как раз и получался подобный эффект. Как это делается? Если бы дифракционные решетки имели бесконечно тонкие штрихи, расположенные на строго равном расстоянии друг от друга, то интенсивности максимумов всех порядков были бы одинаковы. Но фактически, хотя мы пока разобрали только простейший случай, мы могли бы также взять систему, состоящую из пар антенн, причем в каждой паре установили бы определенную разность фаз и интенсивности. Тогда можно было бы получить разную интенсивность у максимумов разных порядков. На дифракционную решетку часто наносят не ровные, а пилообразные штрихи. Специально подбирая форму «зубцов», можно увеличить интенсивность спектра данного порядка по отношению к остальным. В практической работе с решетками желательно иметь максимальную яркость в одном из порядков. Мы отложим пока весьма сложное объяснение этих фактов, скажем только, что такие решетки оказываются гораздо более полезными в применениях.
До сих пор мы рассматривали случай, когда фазы всех источников равны. Однако полученная нами формула (30.3) годится также и тогда, когда сдвиг фаз φ каждого источника по сравнению с предыдущим постоянен и равен α. Это означает, что антенны должны быть соединены по схеме, обеспечивающей небольшой сдвиг фазы между ними. Можно ли создать подобное устройство для света? Да, и очень просто. Пусть источник света находится на бесконечности и свет падает на решетку под некоторым углом, равным θвх (фиг. 30.4); рассмотрим рассеянный пучок света, выходящий под углом θвых (θвых — это наш старый угол θ, а θвх нужен для создания разности фаз у источников).
Фиг. 30.4. Разность хода двух лучей, отраженных соседними линиями решетки, равна dsinθвых — dsinθвх.
Пучок света от бесконечно удаленного источника падает сначала на первый штрих, затем на второй и т. д., сдвиг фазы света, попадающего на два соседних штриха, есть α=- dsinθвх/λ. Отсюда получаем формулу для дифракции света, падающего на решетку под некоторым углом:
(30.7)
Попытаемся найти направление максимальной интенсивности в этом случае. Условие возникновения максимума по-прежнему состоит в том, что φ должно быть числом, кратным 2π. Здесь следует отметить несколько интересных моментов.
Прежде всего, рассмотрим весьма интересный случай, соответствующий m=0; когда d меньше λ, тогда m=0 и других решений не возникает. Тогда получаем sinθвх=sinθвых, т. е. рассеянный луч выходит в том же направлении, что и первоначальный луч, падающий на дифракционную решетку. Но не следует думать, что свет просто «проходит насквозь». Мы ведь говорим о других лучах. Свет, проходящий насквозь, идет от первоначального источника, а мы имеем в виду свет, возникающий при рассеянии. Получается так, что рассеянный пучок света идет в том же направлении, что и первоначальный; более того, оба пучка могут интерферировать друг с другом, о чем мы расскажем в последующих главах.
В нашем случае имеется еще одно возможное решение. При заданном θвх угол θвых может быть равен дополнительному к θвх углу (π-θвх). Таким образом, кроме луча в направлении падающего пучка света, возникает еще один луч. Легко заметить, что его направление подчиняется правилу: угол падения равен углу рассеяния. Этот луч мы назовем отраженным.
Так мы подходим к пониманию основного механизма процесса отражения: падающий свет возбуждает движение атомов отражающего тела, а оно в свою очередь генерирует новую волну, и одно из направлений рассеянной волны (единственное для расстояния между рассеивателями, малого по сравнению с длиной волны) таково, что угол падения луча света равен углу, под которым выходит отраженный луч!
Перейдем теперь к особому случаю, когда d→0. Имеется, скажем, плотное тело конечных размеров. Потребуем еще, чтобы разность фаз между соседними рассеивателями стремилась к нулю. Иначе говоря, будем ставить все новые и новые антенны в промежутках между прежними, так что разности фаз будут становиться все меньше по мере уменьшения расстояния до соседних антенн, но общее число антенн пусть растет так, что полная разность фаз между первой и последней антенной остается постоянной. Посмотрим, как видоизменится формула (30.3), если полная разность фаз nφ остается постоянной (пусть nφ=Ф), а число n и фаза φ стремятся соответственно к бесконечности и нулю. Теперь значение φ так мало, что sinφ=φ, и если учесть также, что n2I0 есть интенсивность в центре максимума Im, то мы получим
(30.8)
На фиг. 30.2 показан ход этой предельной зависимости.
В данном случае дифракционная картина в общих чертах получается такой же, как и для конечного промежутка d>λ, те же боковые максимумы, нет только максимумов высших порядков. Когда все рассеиватели находятся в фазе, возникает максимум в направлении θвых=0 и минимум при Δ=λ, в точности как для конечных d и n. Таким образом, оказывается возможным рассмотреть непрерывное распределение рассеивателей или осцилляторов, используя интегралы вместо сумм.
Для примера возьмем длинную линию, составленную из осцилляторов, которые колеблются вдоль нее (фиг. 30.5).
Фиг. 30.5. Распределение интенсивности излучения непрерывной линии осцилляторов имеет высокий центральный максимум и многочисленные слабые боковые максимумы.
Такое устройство дает максимальную интенсивность в направлении, перпендикулярном нити. Кверху и книзу от экваториальной плоскости имеется небольшая интенсивность, но она очень мала. Пользуясь этим результатом, перейдем к более сложному устройству. Предположим, у нас имеется целый набор нитей, каждая из которых излучает в экваториальной плоскости. Если мы находимся в центральной плоскости, перпендикулярной всем проволокам, интенсивность излучения набора длинных линий в разных направлениях определяется так же, как и в случае бесконечно коротких линий,— нужно сложить вклады от всех длинных проволок. Вот почему вместо крошечных решеток — антенн, которые мы рассматривали, можно было бы использовать решетки с длинными и узкими щелями. Каждая из длинных щелей излучает в своем собственном направлении не вверх и не вниз, а только перпендикулярно щели, и, поставив их рядом друг с другом в горизонтальной плоскости, мы получим интерференцию.
Таким образом, можно создать еще более сложные устройства, размещая рассеиватели по линии, в плоскости или в пространстве. Сначала мы располагали рассеиватели на линии, а затем проанализировали случай, когда они заполняют полосу; для получения ответа каждый раз нужно было просуммировать вклады отдельных рассеивателей. Последний принцип справедлив во всех случаях.
§ 3. Разрешающая способность дифракционной решетки
Теперь мы способны понять еще ряд интересных явлений. Например, попробуем использовать решетку для определения длины волны света. На экране изображение щели развертывается в целый спектр линий, поэтому с помощью дифракционной решетки можно разделить свет по составляющим его длинам волн.
Возникает интересный вопрос: предположим, что имеются два источника с несколько разными частотами излучения или несколько разными длинами волн; насколько близкими должны быть эти частоты, чтобы по дифракционной картине нельзя было отделить одну частоту от другой? Красные и синие линии четко различаются. А вот если один луч красный, а другой чуть-чуть покраснее, самую малость. Насколько близки они должны быть? Ответ дается величиной, которая называется разрешающей способностью решетки. Ниже мы используем один из способов ее определения.
Предположим, что удалось найти дифракционный максимум для лучей определенного цвета, расположенный под некоторым углом. Если мы изменим длину волны, то и значение фазы (2πdsinθ)/λ будет иным и максимум, разумеется, возникнет при каком-то другом угле. Именно поэтому красные и синие полосы на экране разделяются. Насколько должны отличаться углы, чтобы мы смогли различить два разных максимума? Если верхушки максимумов совпадают, мы, конечно, не сможем различить их один от другого. Если же максимумы достаточно далеки друг от друга, то на картине распределения света возникают два горба.
Чтобы заметить, когда начинает вырисовываться двойной горб, лучше всего воспользоваться простым правилом, называемым обычно правилом (или критерием) Рэлея (фиг. 30.6).
Фиг. 30.6. Иллюстрация критерия Рэлея. Максимум одного распределения совпадает с минимумом другого.
По этому правилу первый минимум на дифракционной картине для одной длины волны должен совпадать с максимумом для другой длины волны. Теперь уже нетрудно вычислить разность длин волн, когда один минимум в точности «садится» на максимум другого пучка. Лучше всего для этого воспользоваться геометрическим способом.
Чтобы возник максимум при длине волны λ', расстояние Δ (см. фиг. 30.3) должно быть равно nλ', а чтобы возник максимум порядка m, расстояние Δ должно быть равно mnλ'. Другими словами, (2πd/λ'), sinθ=2πm и ndsinθ, равное Δ, естьλ', умноженная на mn, или соответственно mnλ'. Если мы хотим, чтобы под тем же углом для другого луча с длиной волны λ, появился минимум, расстояние Δ должно превышать mnλ ровно на одну длину волны λ, т. е. Δ=mnλ+λ=mnλ'. Отсюда, полагая λ'=λ+δλ, получаем
(30.9)
Отношение λ/δλ называется разрешающей способностью дифракционной решетки; она равна, как видно из формулы, полному числу линий в решетке, умноженному на порядок максимума луча. Легко убедиться, что эта формула эквивалентна следующему утверждению: разность частот должна быть равна обратной величине разности времен прохождения для самых крайних интерферирующих лучей[21]
Полезно запомнить именно эту общую формулу, потому что она применима не только для решеток, но и для любых устройств, тогда как вывод формулы (30.9) связан со свойствами дифракционных решеток.
§ 4. Параболическая антенна
Рассмотрим теперь еще один вопрос, связанный с разрешающей способностью. Речь идет об антеннах радиотелескопов, использующихся для определения положения источников радиоволн на небе и их угловых размеров. Если бы мы взяли нашу старую антенну и с ее помощью приняли сигналы, то, конечно, не могли бы сказать, откуда они пришли. А знать, где находится источник, очень важно. Можно, конечно, покрыть всю Австралию проводами-диполями, расположенными на равном расстоянии друг от друга. Затем подсоединить все диполи к одному приемнику так, чтобы уравнять запаздывание сигналов в соединительных проводах. Тогда сигналы от всех диполей придут к приемнику с одной фазой. Что в результате получится? Если источник расположен достаточно далеко и прямо над нашей системой, то сигналы от всех антенн придут к приемнику в фазе.
Но предположим, что источник расположен под небольшим углом θ к вертикали. Тогда сигналы, принятые различными антеннами, будут немного сдвинуты по фазе. В приемнике все эти сигналы с разными фазами складываются, и мы ничего не получим, если только угол θ достаточно велик. Но как велик должен быть этот угол? Ответ: мы получим нуль, если угол Δ/L=θ (см. фиг. 30.3) соответствует сдвигу фаз в 360°, т. е. если Δ равно длине волны λ.
Этот результат легко понять, если учесть, что векторы, соответствующие сигналам от разных антенн, образуют замкнутый многоугольник и их сумма тогда обращается в нуль. Наименьший угол, который антенное устройство длиной L еще может разрешить, есть θ=λ/L. Заметим, что кривая чувствительности антенны при приеме имеет точно такой же вид, как и распределение интенсивности, даваемое антеннами-передатчиками. Здесь проявляется так называемый принцип обратимости. Согласно этому принципу, для любых антенных устройств, при любых углах и т. п. справедливо правило: относительная чувствительность в разных направлениях совпадает с относительной интенсивностью для тех же направлений, если заменить приемник передатчиком.
Бывают антенные устройства и другого типа. Вместо того чтобы выстраивать целую систему диполей с кучей соединительных проводов между ними, можно расположить их по кривой, а приемник поставить в такую точку, где он мог бы фиксировать отраженные сигналы. Кривая выбирается с таким хитрым расчетом, чтобы все лучи от далекого источника после рассеяния доходили к приемнику за одно и то же время (см. фиг. 26.12). Значит, кривая должна быть параболой; тогда если источник находится на ее оси, то в фокусе возникает большая интенсивность рассеянного излучения. Легко найти разрешающую способность такого устройства. Расположение антенн по параболе здесь несущественно. Параболическая форма выбрана просто для удобства, она позволяет собирать все сигналы за одинаковое время и притом без проводов. Минимальный угол разрешения такого устройства по-прежнему равен θ=λ/L, где L — расстояние между крайними антеннами. Этот угол не зависит от промежутка между соседними антеннами, они могут быть размещены очень близко одна от другой, фактически вместо системы антенн можно даже взять сплошной кусок металла. В принципе это то же самое, что и зеркало телескопа. Итак, мы нашли разрешающую способность телескопа! (Иногда разрешающую способность пишут в виде θ=1,22 λ/L, где L — диаметр телескопа. Множитель 1,22 появляется по следующей причине: при выводе формулы θ=λ/L интенсивность всех диполей считалась одинаковой независимо от их положения, но, поскольку телескопы обычно делают круглыми, а не квадратными, интенсивность сигналов от краев меньше, чем от середины; в отличие от случая квадратного сечения края дают относительно малый вклад. Следовательно, эффективный диаметр короче истинного, что и учитывается множителем 1,22. На самом же деле такая точность в формуле для разрешающей способности кажется слишком педантичной[22].)
§ 5, Окрашенные пленки; кристаллы
Выше были рассмотрены некоторые эффекты, возникающие при интерференции нескольких волн. Но можно привести ряд других примеров, основной механизм которых слишком сложен, чтобы говорить о нем в данный момент (мы обсудим его впоследствии), а пока разберем возникающие в этих примерах интерференционные явления.
Например, когда свет падает на поверхность среды с показателем преломления n по нормали к поверхности, то часть света отражается. Причину отражения сейчас нам было бы трудно понять; мы поговорим о ней позже. Сейчас же предположим, что факт отражения света при входе и выходе света из преломляющей среды нам уже известен. Тогда при отражении света от тонкой пленки возникнет совокупность двух волн, отраженных от передней и задней поверхностей пленки; при достаточно малой толщине пленки эти волны будут интерферировать, усиливая или ослабляя друг друга в зависимости от знака разности фаз. Например, может случиться, что красный свет будет отражаться с усилением, а синий свет, который имеет другую длину волны,—с ослаблением, так что отраженный луч будет иметь яркую красную окраску. Если мы изменим толщину пленки и будем наблюдать отражение, скажем, в тех местах, где пленка потолще, то сможем увидеть обратную картину, т. е. красные волны будут ослабляться, а синие нет, и пленка будет казаться синей, или зеленой, или желтой, в общем любого цвета. Таким образом, мы видим тонкую пленку окрашенной, а если будем смотреть на нее под другим углом, то расцветка будет иной, так как время прохождения света через пленку меняется с изменением угла зрения. Так становится понятной причина возникновения сложной цветовой гаммы на пленках нефти, мыльных пузырях и во многих других подобных случаях. Сущность явления всюду одна — сложение волн с разными фазами.
Отметим еще одно важное применение дифракции. Возьмем дифракционную решетку и спроектируем ее изображение на экран. Для монохроматического света в определенных местах экрана возникнут максимумы — основные и более высоких порядков. По расположению максимумов и длине волны можно найти расстояние между линиями решетки. А по отношению интенсивностей различных максимумов можно найти форму штрихов решетки и различить пиловидную, прямолинейную и разные другие формы, даже не глядя на решетку. Этот принцип служит для определения положения атомов в кристалле. Единственная сложность состоит в том, что кристалл трехмерен; он представляет собой периодическую трехмерную решетку, составленную из атомов. Мы не можем использовать здесь видимый свет, потому что длина волны источника должна быть меньше расстояния между атомами, иначе никакого эффекта не будет; следовательно, нужно взять излучение с очень малыми длинами волн, т. е. рентгеновские лучи. Итак, освещая кристалл рентгеновскими лучами и найдя интенсивности максимумов разного порядка, можно определить расположение атомов в кристалле, даже не имея возможности увидеть все это собственными глазами! Именно таким путем было найдено расположение атомов в разных веществах. В гл. 1 мы привели несколько схем, показывающих размещение атомов в кристалле соли и ряде других веществ. Мы еще вернемся к этому вопросу в дальнейшем и обсудим его подробно, а пока не будем заниматься этой интереснейшей проблемой.
§ 6. Дифракция на непрозрачном экране
Рассмотрим сейчас весьма интересное явление. Пусть имеется непрозрачный лист с отверстиями, и по одну сторону от него расположен источник света. Нас интересует, какое изображение возникнет на экране по другую сторону листа. Каждый скажет, что свет пройдет через отверстия и создаст на экране какое-то изображение. Оказывается, что это изображение можно получить с хорошей степенью точности, если предположить, что источники света равномерно распределены по ширине отверстий, а фазы источников точно такие, как если бы непрозрачного листа вовсе не было. Источников в отверстиях на самом деле, конечно, нет; во всяком случае, это как раз то место, где их наверняка не может быть. Тем не менее правильная дифракционная картина получается, если считать, что источники расположены именно в отверстиях; факт довольно странный. Позже мы объясним, почему такое предположение правильно, а пока примем его на веру.
В теории дифракции есть один род дифракционных явлений, который стоит кратко обсудить. Речь идет о дифракции на непрозрачных экранах. Обычно в элементарных курсах о них говорят гораздо позже, так как для их объяснения нужно использовать довольно сложные формулы суммирования малых векторов. В остальном эти явления не отличаются от уже рассмотренных нами. Все интерференционные явления по существу одинаковы; в них не входят сколько-нибудь сложные понятия, только условия возникновения могут быть более сложными, и тогда векторы поля труднее складывать, вот и все.
Предположим, что свет приходит из бесконечности, попадает на предмет и отбрасывает от него тень. На фиг. 30.7 изображен экран, на который свет отбрасывает тень от предмета АВ, причем источник света удален на расстояние, много большее длины волны.
Фиг. 30.7. Далекий источник отбрасывает тень от непрозрачного предмета на экран.
Казалось бы, вне тени интенсивность света максимальна, а внутри должна быть полная темнота. На самом же деле, если откладывать интенсивность как функцию расстояния до края тени, интенсивность будет сначала расти, а затем начнет спадать, колеблясь самым прихотливым образом вблизи края тени (фиг. 30.9). Посмотрим, отчего это происходит. Для объяснения воспользуемся недоказанной нами теоремой, что вместо истинной картины опыта можно ввести эффективные источники, равномерно распределенные вне объекта.
Представим себе эти эффективные источники в виде большого количества близко расположенных антенн и найдем интенсивность в некоторой точке Р. Это очень похоже на то, чем мы занимались до сих пор. Но не вполне, поскольку наш экран теперь находится не на бесконечности. В данном случае нас интересует интенсивность интерферирующих лучей на конечном расстоянии, а не на бесконечности. Интенсивность в некоторой точке дается суммой вкладов от каждой антенны. Сначала возьмем антенну в точке D, прямо напротив Р. Если слегка изменить угол, скажем, подняться на высоту h, лучу потребуется больше времени, чтобы попасть в точку Р (амплитуда тоже изменится, так как расстояние до источника увеличилось, но разница эта очень мала, поскольку расстояние все равно велико, и гораздо менее важна, чем изменение фазы излучения). Далее, разность EP-DP равна h2/2s, т. е. разность фаз пропорциональна квадрату удаления от точки D, тогда как раньше у нас s было бесконечно и разность фаз была линейно связана с h. Когда фазы зависят от h линейно, каждый вектор повернут относительно предыдущего на постоянный угол. Теперь же мы должны построить кривую, складывая бесконечно малые векторы при условии, что образуемый ими угол с осью абсцисс растет с увеличением длины кривой не линейным, а квадратичным образом. Явный вид кривой находится с помощью довольно сложных математических методов, но мы всегда можем построить эту кривую, просто откладывая векторы под требуемым углом. В конечном счете мы получаем замечательную кривую (называемую спиралью Корню), изображенную на фиг. 30.8. Как ею пользоваться? Пусть требуется определить интенсивность, скажем, в точке Р.
Сложим волны с разными фазами от точки D вверх до бесконечности и вниз от D до точки Вр. Таким образом, нужно отложить ряд стрелок под постоянно растущим углом, начиная с точки Вр на фиг. 30.8.
Фиг. 30.8. Сложение амплитуд большого числа осцилляторов, излучающих с одной фазой. Разность фаз за счет запаздывания пропорциональна квадрату расстояния от точки D на фиг. 30.7.
Фиг. 30.9, Ход интенсивности вблизи края тени. Геометрический край menu находится в точке х0.
Весь вклад от области над Вр дается спиральной кривой. Если бы суммирование заканчивалось в некоторой точке, то полная амплитуда представилась бы вектором от Вр до этой точки; в нашем случае суммирование ведется до бесконечности, так что искомая амплитуда есть вектор Вр∞. Точка на кривой, соответствующая точке Вр на предмете, зависит от положения точки Р, потому что точка D кривой (точка перегиба) всегда относится к выбранной точке Р. Следовательно, в зависимости от положения Р над В начальная точка, откуда проводится вектор, попадает в разные места нижней спирали, и результирующий вектор Вр∞ имеет многочисленные максимумы и минимумы (фиг. 30.9).
Но если мы находимся в точке Q, по другую сторону от Р, то нам понадобится только верхний конец спиральной кривой. Другими словами, начальной точкой результирующего вектора будет не D, а BQ, и, следовательно, книзу от Р интенсивность должна непрерывно падать при удалении Q в область тени.
Есть одна величина, которую можно легко вычислить сразу и таким образом убедиться, что мы здесь что-то понимаем,— это интенсивность в точке, лежащей прямо против края. Эта интенсивность равна 1/4 от интенсивности падающего света. Причина: для точки, лежащей против края предмета (когда Вр совпадает с D на фиг. 30.8), получается половина кривой в отличие от целой кривой, которая была бы получена, если бы точки лежали достаточно далеко в освещенной области. Если точка R расположена достаточно высоко, результирующий вектор проводится от центра одной спирали до центра другой, а для точки на краю тени амплитуда равна половине этого вектора; следовательно, отношение интенсивностей получается равным 1/4.
В этой главе мы вычисляли интенсивность в разных направлениях при различном расположении источников. В заключение выведем формулу, которая нам понадобится в следующей главе, посвященной показателю преломления. До сих пор мы обходились только относительными интенсивностями, а на этот раз мы получим формулу для полной величины поля при условиях, о которых будет рассказано ниже.
§ 7. Поле системы осцилляторов, расположенных на плоскости
Предположим, что имеется некоторая плоскость, которую заполняют осцилляторы, причем все они колеблются в плоскости одновременно, с одной амплитудой и фазой. Чему равно поле на конечном, но достаточно большом расстоянии от плоскости? (Мы не можем выбрать точку наблюдения очень близко от плоскости, потому что у нас нет точных формул для поля вблизи источников.) Пусть плоскость зарядов совпадает с плоскостью XY и нас интересует поле в точке Р, лежащей на оси z, достаточно далеко от плоскости (фиг. 30.10).
Фиг. 30.10. Поле излучения осциллирующих зарядов, заполняющих плоскость.
Предположим, что число зарядов на единичной площадке равно n, а величина каждого заряда q. Все заряды совершают одинаковые гармонические колебания в одном и том же направлении, с той же амплитудой и фазой. Смещение заряда из его среднего положения описывается функцией x0cosωt. Вводя комплексную амплитуду, действительная часть которой дает реальное движение, будем описывать колебание заряда функцией x0eiωt.
Чтобы найти поле, создаваемое всеми зарядами в точке Р, нужно вычислить сначала поле отдельного заряда q, а затем сложить поля всех зарядов. Как известно, поле излучения пропорционально ускорению заряда, т. е.. — ω2x0еiωt (и одинаково для всех зарядов). Электрическое поле в точке Р, создаваемое зарядом в точке Q, пропорционально ускорению заряда q, нужно только помнить, что поле в точке Р в момент времени t определяется ускорением заряда в более ранний момент времени t'=t-r/c, где r/c — время, за которое волна проходит расстояние от Q до Р. Поэтому поле в точке Р пропорционально
(30.10)
Подставляя это значение ускорения в формулу для поля, создаваемого зарядом на большом расстоянии, получаем
(30.11)
Однако эта формула не совсем правильна, поскольку нужно брать не все ускорение целиком, а его компоненту, перпендикулярную линии QP. Мы предположим, однако, что точка Р находится от плоскости намного дальше, чем точка Q от оси z (расстояние ρ на фиг. 30.10), так что для эффектов, которые мы хотим учесть, косинус можно заменить единицей (косинус и так довольно близок к единице).
Полное поле в точке Р получается суммированием вкладов от всех зарядов в плоскости. Разумеется, мы должны взять векторную сумму полей. Но поскольку направление поля примерно одинаково для всех зарядов, в рамках сделанного приближения достаточно сложить величины всех полей. Кроме того, в нашем приближении поле в точке Р зависит только от r, следовательно, все заряды с одинаковым r создают равные поля. Поэтому, прежде всего, сложим поля всех зарядов в кольце шириной dρ и радиусом ρ. Интегрируя затем по всем ρ, получаем полное поле всех зарядов.
Число зарядов в кольце равно произведению площади кольца, 2πρdρ, на η — плотность зарядов на единицу площади. Отсюда
Интеграл берется в пределах ρ=0 и ρ=∞. Время t, конечно, зафиксировано, так что единственными меняющимися величинами являются ρ и r. Отвлечемся пока от постоянных множителей, включая и eiωt, и вычислим интеграл
(30.13)
Для этого учтем соотношение между ρ и r:
(30.14)
При дифференцировании формулы (30.14) z нужно считать независимым от ρ, тогда
что очень кстати, поскольку при замене в интеграле ρdρ на rdr знаменатель r сокращается. Интеграл приобретает более простой вид
(30.15)
Экспонента интегрируется очень просто. Нужно поставить в знаменатель коэффициент при r в показателе экспоненты и взять саму экспоненту в точках, соответствующих пределам. Но пределы по r отличаются от пределов по ρ. Когда ρ=0, нижний предел r=z, т. е. пределы по r равны z и бесконечности. Интеграл (30.15) равен
(30.16)
Вместо (r/с)∞ мы здесь написали ∞, поскольку и то и другое означает просто сколь угодно большую величину!
А вот е-i∞— величина загадочная. Ее действительная часть, равная cos(-∞), с математической точки зрения величина совершенно неопределенная. [Хотя можно допустить, что она находится где-то [а может быть и всюду (?)—между +1 и -1!]Но в физической ситуации эта величина может означать нечто вполне разумное и обычно оказывается равной нулю. Чтобы убедиться, что это так в нашем случае, вернемся к первоначальному интегралу (30.15)
Выражение (30.15) можно понимать как сумму большого числа маленьких комплексных чисел, модуль которых Δr, а угол в комплексной плоскости θ=-ωr/с. Попробуем оценить эту сумму графически. На фиг. 30.11 отложены первые пять членов суммы. Каждый отрезок кривой имеет длину Δr и расположен под углом Δθ=-ω(Δr/с) к предыдущему отрезку. Сумма первых пяти слагаемых обозначена стрелкой из начальной точки к концу пятого отрезка. Продолжая прибавлять отрезки, мы опишем многоугольник, вернемся примерно к начальной точке и начнем описывать новый многоугольник. Чем большее число отрезков мы будем прибавлять, тем большее число раз мы обернемся, двигаясь почти по окружности с радиусом с/. Теперь понятно, почему интеграл дает при вычислении неопределенный ответ!
Здесь мы должны обратиться к физическому смыслу нашего примера. В любой реальной ситуации плоскость зарядов не может быть бесконечной, а должна где-то оборваться. Если плоскость резко обрывается и ее граница имеет точно форму окружности, то наш интеграл будет равен некоторому значению на этой окружности (см. фиг. 30.11).
Фиг. 30.11. Вычисление интеграла z∫∞e-iωr/cdr графическим способом; θ=—ωr/c; Δθ=—ωΔr/c;
Если же плотность зарядов постепенно уменьшается по мере удаления от центра (или обращается в нуль вне некоторой границы неправильной формы, так что для достаточно больших ρ вклад всего кольца шириной dρ равен нулю), то коэффициент η в точном интеграле убывает, стремясь к нулю. Поскольку длина добавляемых отрезков в этом случае уменьшается, а угол Δθ остается тем же самым, график кривой, соответствующей интегралу, будет иметь вид спирали. Спираль оканчивается в центре первоначальной окружности, как изображено на фиг. 30.12.
Фиг. 30.12. Вычисление интеграла z∫∞ηe-iωr/cdr графическим способом,
Физически правильное значение интеграла дается величиной А, которой на схеме соответствует расстояние от начальной точки до центра окружности, равное как нетрудно убедиться
(30.17)
Точно такой же результат мы получили бы из (30.16), положив e-iω=0.
(Есть еще одна причина, почему вклад в интеграл от больших значений r стремится к нулю,— это опущенный нами множитель, учитывающий проекцию ускорения на плоскость, перпендикулярную линии PQ.)
Нас, конечно, интересует именно случай, имеющий физический смысл, поэтому мы положим е-iω равным нулю. Возвращаясь к формуле (30.12) для поля и вводя все опущенные ранее множители, мы получаем
(30.18)
(помня, что 1/i=-i).
Интересно отметить, что iωx0eiωt в точности равно скорости зарядов, так что выражения для поля можно переписать в виде
(30.19)
Этот результат немного странен, потому что запаздывание отвечает расстоянию z, которое есть кратчайшее расстояние от Р до плоскости. Но таков ответ, и, к счастью, формула довольно проста. [Добавим кстати, что, хотя формулы (30.18) и (30.19) были получены только для достаточно большого расстояния от плоскости, обе они оказываются правильными для любых z, даже для z<λ.]
Глава 31 КАК ВОЗНИКАЕТ ПОКАЗАТЕЛЬ ПРЕЛОМЛЕНИЯ
§ 1. Показатель преломления
Мы уже говорили, что свет в воде движется медленнее, чем в воздухе, а в воздухе чуть медленнее, чем в вакууме. Этот факт учитывается введением показателя преломления n. Попробуем теперь понять, как возникает уменьшение скорости света. В частности, особенно важно проследить связь этого факта с некоторыми физическими предположениями или законами, которые были ранее высказаны и сводятся к следующему:
а) полное электрическое поле при любых физических условиях может быть представлено в виде суммы полей от всех зарядов во Вселенной;
б) поле излучения каждого отдельного заряда определяется его ускорением; ускорение берется с учетом запаздывания, возникающего из-за конечной скорости распространения, всегда равной c.
Но вы, наверное, приведете сразу в качестве примера кусок стекла и воскликнете: «Ерунда, это положение здесь не годится. Нужно говорить, что запаздывание отвечает скорости c/n». Однако это неправильно; попробуем разобраться, почему это неправильно.
Наблюдателю кажется, что свет или любая другая электрическая волна распространяется сквозь вещество с показателем преломления n со скоростью с/n. И это с некоторой точностью так и есть. Но на самом деле поле создается движением всех зарядов, включая и заряды, движущиеся в среде, а все составные части поля, все его слагаемые распространяются с максимальной скоростью c. Задача наша состоит в том, чтобы понять, как возникает кажущаяся меньшая скорость.
Попробуем понять это явление на очень простом примере. Пусть источник (назовем его «внешним источником») помещен на большом расстоянии от тонкой прозрачной пластинки, скажем стеклянной. Нас интересует поле по другую сторону пластинки и достаточно далеко от нее. Все это схематично представлено на фиг. 31.1; точки S и Р здесь предполагаются удаленными на большое расстояние от плоскости.
Фиг. 31.1. Прохождение электрических волн сквозь слой прозрачного вещества.
Согласно сформулированным нами принципам, электрическое поле вдали от пластинки представляется (векторной) суммой полей внешнего источника (в точке S) и полей всех зарядов в стеклянной пластинке, причем каждое поле берется с запаздыванием при скорости с. Напомним, что поле каждого заряда не меняется от присутствия других зарядов. Это наши основные принципы. Таким образом, поле в точке Р может быть записано в виде
(31.1)
(31.2)
где Es — поле внешнего источника; оно совпадало бы с искомым полем в точке Р, если бы не было пластинки. Мы ожидаем, что в присутствии любых движущихся зарядов поле в точке Р будет отлично от Es.
Откуда берутся движущиеся заряды в стекле? Известно, что любой предмет состоит из атомов, содержащих электроны. Электрическое поле внешнего источника действует на эти атомы и раскачивает электроны взад и вперед. Электроны в свою очередь создают поле; их можно рассматривать как новые излучатели. Новые излучатели связаны с источником S, поскольку именно поле источника заставляет их колебаться. Полное поле содержит вклад не только от источника S, но и дополнительные вклады от излучения всех движущихся зарядов. Это значит, что поле в присутствии стекла изменяется, причем таким образом, что внутри стекла его скорость распространения кажется иной. Именно эту идею мы используем при количественном рассмотрении.
Однако точный расчет очень сложен, потому что наше утверждение, что заряды испытывают только действие источника, не совсем правильно. Каждый данный заряд «чувствует» не только источник, но, подобно любому объекту во Вселенной, он чувствует и все остальные движущиеся заряды, в частности и заряды, колеблющиеся в стекле. Поэтому полное поле, действующее на данный заряд, представляет собой совокупность полей от всех остальных зарядов, движение которых в свою очередь зависит от движения данного заряда! Вы видите, что вывод точной формулы требует решения сложной системы уравнений. Эта система очень сложна, и вы будете изучать ее значительно позднее.
А сейчас обратимся к совсем простому примеру, чтобы отчетливо понять проявление всех физических принципов. Предположим, что действие всех остальных атомов на данный атом мало по сравнению с действием источника. Иными словами, мы изучаем такую среду, в которой полное поле мало меняется из-за движения находящихся в ней зарядов. Такая ситуация характерна для материалов с показателем преломления, очень близким к единице, например для разреженных сред. Наши формулы будут справедливы для всех материалов с показателем преломления, близким к единице. Таким путем мы сможем избежать трудностей, связанных с решением полной системы уравнений.
Вы могли по ходу дела заметить, что движение зарядов в пластинке вызывает еще один эффект. Это движение создает волну, распространяющуюся назад в направлении источника S. Такая обратно движущаяся волна есть не что иное, как луч света, отраженный прозрачным материалом. Приходит он не только с поверхности. Отраженное излучение генерируется во всех точках внутри материала, но суммарный эффект эквивалентен отражению с поверхности. Учет отражения лежит за границами применимости настоящего приближения, в котором показатель преломления считается настолько близким к единице, что отраженным излучением можно пренебречь.
* * *
Прежде чем перейти к изучению показателя преломления, следует подчеркнуть, что в основе явления преломления лежит тот факт, что кажущаяся скорость распространения волны различна в разных материалах. Отклонение луча света есть следствие изменения эффективной скорости в разных материалах.
Чтобы пояснить этот факт, мы отметили на фиг. 31.2 ряд последовательных максимумов в амплитуде волны, падающей из вакуума на стекло.
Фиг. 31.2. Связь между преломлением и изменением скорости.
Стрелка, перпендикулярная указанным максимумам, отмечает направление распространения волны. Всюду в волне колебания происходят с одной и той же частотой. (Мы видели, что вынужденные колебания имеют ту же частоту, что и колебания источника.) Отсюда следует, что расстояния между максимумами волн по обе стороны поверхности совпадают вдоль самой поверхности, поскольку волны здесь должны быть согласованы и заряд на поверхности колеблется с одной частотой. Наименьшее расстояние между гребнями волн есть длина волны, равная скорости, деленной на частоту. В вакууме длина волны равна λ0=2πс/ω, а в стекле λ=2πv/ω или 2πс/ωn, где v=c/n— скорость волны. Как видно из фиг. 31.2, единственный способ «сшить» волны на границе состоит в изменении направления движения волны в материале. Простое геометрическое рассуждение показывает, что условие «сшивания» сводится к равенству λ0/sin θ0=λ/sinθ, или sinθ0/sinθ=n, а это и есть закон Снелла. Пусть сейчас вас больше не волнует само отклонение света; нужно только выяснить, почему же в самом деле эффективная скорость света в материале с показателем преломления n равна с/n?
* * *
Вернемся снова к фиг. 31.1. Из сказанного ясно, что нужно вычислить поле в точке Р от осциллирующих зарядов стеклянной пластинки. Обозначим эту часть поля, которая представляется вторым членом в равенстве (31.2), через Еа. Добавляя к ней поле источника Es, получаем полное поле в точке Р.
Стоящая перед нами здесь задача, пожалуй, самая сложная из тех, которыми мы будем заниматься в этом году, но сложность ее заключается только в большом количестве складываемых членов; каждый член сам по себе очень прост. В отличие от других случаев, когда мы обычно говорили: «Забудь вывод и смотри только на результат!», теперь для нас вывод гораздо важнее результата. Другими словами, нужно понять всю физическую «кухню», с помощью которой вычисляется показатель преломления.
Чтобы понять, с чем мы имеем дело, найдем, каким должно быть «поправочное поле» Еа, чтобы полное поле в точке Р выглядело как поле источника, замедлившееся при прохождении через стеклянную пластинку. Если бы пластинка никак не влияла на поле, волна распространялась бы направо (по оси z) по закону
(31.3)
или, используя экспоненциальную запись,
(31.4)
А что произошло бы, если бы волна проходила через пластинку с меньшей скоростью? Пусть толщина пластинки есть Δz. Если бы пластинки не было, то волна прошла бы расстояние Δz за время Δz/c. А поскольку кажущаяся скорость распространения есть c/n, то потребуется время nΔz/c, т. е. больше на некоторое добавочное время, равное Δt=(n-1) Δz/c. За пластинкой волна снова движется со скоростью с. Учтем добавочное время на прохождение через пластинку, заменив t в уравнении (31.4) на (t-Δt), т. е. [t-(n-1)Δz/c]. Таким образом, если поставить пластинку, то формула для волны должна приобрести вид
(31.5)
Эту формулу можно переписать еще и по-другому:
(31.6)
откуда заключаем, что поле за пластинкой получается умножением поля, которое было бы при отсутствии пластинки (т. е. Es), на ехр[-iω(n-1)Δz/c]. Как мы знаем, умножение осциллирующей функции типа eiωt на еiθ означает изменение фазы колебаний на угол θ, возникающее из-за задержки при прохождении пластинки. Фаза запаздывает на величину ω(n-1)Δz/c (именно запаздывает, поскольку в экспоненте стоит знак минус).
Мы говорили раньше, что пластинка добавляет поле Еа к первоначальному полю Es=E0ехр[iω(t-z/c)], а вместо этого нашли, что действие пластинки сводится к умножению поля на фактор, сдвигающий фазу колебаний. Однако здесь нет противоречия, поскольку тот же результат можно получить, прибавив подходящее комплексное число. Это число особенно просто найти для малых Δz, так как еx при малых x с большой точностью равно (1+x).
Тогда можно записать
(31.7)
Подставляя это равенство в (31 6), получаем
(31.8)
Первый член в этом выражении есть просто поле источника, а второй следует приравнять Еа — полю, создаваемому осциллирующими зарядами пластинки справа от нее. Поле Еа выражено здесь через показатель преломления n; оно, разумеется, зависит от напряженности поля источника.
* * *
Смысл сделанных преобразований легче всего понять с помощью диаграммы комплексных чисел (см. фиг. 31.3).
Фиг. 31.3. Построение вектора поля прошедшей через материал волны при некоторых значениях t и z.
Отложим сперва Es (z и t выбраны на рисунке такими, что Es лежит на действительной оси, но это не обязательно). Задержка при прохождении пластинки приводит к запаздыванию фазы Es, т. е. поворачивает Es на отрицательный угол. Это все равно, что добавить малый вектор Еа, направленный почти под прямым углом к Es. Именно такой смысл имеет множитель (-i) во втором члене (31.8). Он означает, что при действительном Es величина Еа отрицательная и мнимая, а в общем случае Es и Eа образуют прямой угол.
§ 2. Поле, излучаемое средой
Мы должны теперь выяснить, имеет ли поле осциллирующих зарядов в пластинке тот же вид, что и поле Еа во втором члене (31.8). Если это так, то тем самым мы найдем и показатель преломления n [поскольку n — единственный фактор в (31.8), не выражающийся через фундаментальные величины]. Вернемся теперь к вычислению поля Еа, создаваемого зарядами пластинки. (Для удобства мы выписали в табл. 31.1 обозначения, которыми мы уже пользовались, и те, которые нам понадобятся в дальнейшем.)
Таблица 31.1 обозначения которыми мы пользуемся ПРИ ВЫЧИСЛЕНИИ
Если источник S (на фиг. 31.1) находится слева на достаточно большом расстоянии, то поле Es имеет одинаковую фазу по всей длине пластинки, и вблизи пластинки его можно записать в виде
(31.9)
На самой пластинке в точке z=0 мы имеем
(31.10)
Это электрическое поле воздействует на каждый электрон в атоме, и они под действием электрической силы qE будут колебаться вверх и вниз (если E0 направлено вертикально). Чтобы найти характер движения электронов, представим атомы в виде маленьких осцилляторов, т. е. пусть электроны упруго соединены с атомом; это значит, что смещение электронов из нормального положения под действием силы пропорционально величине силы.
Если вы слышали о модели атома, в которой электроны вращаются по орбите вокруг ядра, то эта модель атома вам покажется просто смешной. Но это лишь упрощенная модель. Точная теория атома, основанная на квантовой механике, утверждает, что в процессах с участием света электроны ведут себя так, как будто они закреплены на пружинах. Итак, предположим, «что на электроны действует линейная возвращающая сила, и поэтому они ведут себя как осцилляторы с массой m и резонансной частотой ω0. Мы уже занимались изучением таких осцилляторов и знаем уравнение движения, которому они подчиняются:
(31.11)
(здесь F — внешняя сила).
В нашем случае внешняя сила создается электрическим полем волны источника, поэтому можно написать
(31.12)
где qe — заряд электрона, а в качестве Es мы взяли значение Еs=Е0еiωt из уравнения (31.10). Уравнение движения электрона приобретает вид
(31.13)
Решение этого уравнения, найденное нами раньше, выглядит следующим образом:
(31.15)
подставляя его в (31.13), получаем
откуда
(31.16)
Мы нашли то, что хотели,— движение электронов в пластинке. Оно одинаково для всех электронов, и только среднее положение («нуль» движения) у каждого электрона свое.
Теперь мы в состоянии определить поле Еа, создаваемое атомами в точке Р, поскольку поле заряженной плоскости было найдено еще раньше (в конце гл. 30). Обращаясь к уравнению (30.19), мы видим, что поле Еа в точке Р есть скорость заряда, запаздывающая по времени на величину z/c, умноженная на отрицательную константу. Дифференцируя х из (31.16), получаем скорость и, введя запаздывание [или же просто подставляя х0 из (31.15) в (30.18)], приходим к формуле
(31.17)
Как и следовало ожидать, вынужденное колебание электронов привело к новой волне, распространяющейся вправо (на это указывает множитель ехр[iω(t-z/c)]); амплитуда волны пропорциональна числу атомов на единице площади пластинки (множитель η), а также амплитуде поля источника (Е0). Кроме того, возникают и другие величины, зависящие от свойств атомов (qe, m, ω0).
Самый важный момент, однако, заключается в том, что формула (31.17) для Еa очень похожа на выражение Еа в (31.8), полученное нами с помощью введения запаздывания в среде с показателем преломления n. Оба выражения совпадают, если положить
(31.18)
Заметьте, что обе стороны этого равенства пропорциональны Δz, поскольку η — число атомов на единицу площади — равно NΔz, где N — число атомов на единицу объема пластинки. Подставляя NΔz вместо η и сокращая на Δz, получаем наш основной результат — формулу для показателя преломления, выраженную через константы, зависящие от свойств атомов, и частоту света:
(31.19)
Эта формула «объясняет» показатель преломления, к чему мы и стремились.
§ 3. Дисперсия
Полученный нами результат очень интересен. Он дает не только показатель преломления, выраженный через атомные постоянные, но указывает, как меняется показатель преломления с частотой света ω. С помощью простого утверждения «свет движется с меньшей скоростью в прозрачной среде» мы никогда бы не смогли прийти к этому важному свойству. Нужно, конечно, еще знать число атомов в единице объема и собственную частоту атомов ω0. Мы еще не умеем определять эти величины, поскольку они разные для разных материалов, а общую теорию по данному вопросу мы сейчас изложить не можем. Общая теория свойств различных веществ — их собственных частот и т. п.— формулируется на основе квантовой механики. Кроме того, свойства различных материалов и величина показателя преломления сильно меняются от материала к материалу, и поэтому вряд ли можно надеяться, что вообще удастся получить общую формулу, пригодную для всех веществ.
Тем не менее попробуем применить нашу формулу к разным средам. Прежде всего, для большинства газов (например, для воздуха, большей части бесцветных газов, водорода, гелия и т. д.) собственные частоты колебаний электронов соответствуют ультрафиолетовому свету. Эти частоты много больше частот видимого света, т. е. ω0 много больше ω, и в первом приближении можно пренебречь ω2 по сравнению с ω02. Тогда показатель преломления получается почти постоянным. Итак, для газов показатель преломления можно считать константой. Этот вывод справедлив также и для большинства других прозрачных сред, например для стекла. Взглянув более внимательно на наше выражение, можно заметить, что при увеличении ω знаменатель уменьшается, а, следовательно, показатель преломления растет. Таким образом, n медленно увеличивается с ростом частоты. Для синего света показатель преломления больше, чем для красного. Именно поэтому синие лучи сильнее отклоняются призмой, чем красные.
Сам факт зависимости показателя преломления от частоты называется дисперсией, так как именно из-за дисперсии свет «диспергирует», раскладывается призмой в спектр. Формула, выражающая показатель преломления как функцию частоты, называется формулой дисперсии. Итак, мы нашли дисперсионную формулу. (За последние несколько лет «дисперсионные формулы» стали использоваться в теории элементарных частиц.)
Наша дисперсионная формула предсказывает ряд новых интересных эффектов. Если частота ω0 лежит в области видимого света или если измерять показатель преломления вещества, например стекла, для ультрафиолетовых лучей (где ω близко к ω0), то знаменатель стремится к нулю, а показатель преломления становится очень большим. Пусть, далее, ω больше ω0. Такой случай возникает, например, если облучать вещества типа стекла рентгеновскими лучами. Кроме того, многие вещества, непрозрачные для обычного света (скажем, уголь), прозрачны для рентгеновских лучей, поэтому можно говорить о показателе преломления этих веществ для рентгеновских лучей. Собственные частоты атомов углерода гораздо меньше частоты рентгеновских лучей. Показатель преломления в этом случае дается нашей дисперсионной формулой, если положить ω0=0 (т. е. мы пренебрегаем ω02 по сравнению с ω2).
Аналогичный результат получается при облучении газа свободных электронов радиоволнами (или светом). В верхних слоях атмосферы ультрафиолетовое излучение Солнца выбивает электроны из атомов, в результате чего образуется газ свободных электронов. Для свободных электронов ω0=0 (упругой возвращающей силы нет). Полагая в нашей дисперсионной формуле ω0=0, получаем разумную формулу для показателя преломления радиоволн в стратосфере, где N теперь означает плотность свободных электронов (число на единицу объема) в стратосфере. Но, как видно из формулы, при облучении вещества рентгеновскими лучами или электронного газа радиоволнами член (ω02-ω2) становится отрицательным, откуда следует, что n меньше единицы. Это значит, что эффективная скорость электромагнитных волн в веществе больше c! Может ли так быть?
Может. Хотя мы и говорили, что сигналы не могут распространяться быстрее скорости света, тем не менее показатель преломления при некоторой частоте может быть как больше, так и меньше единицы. Это просто означает, что сдвиг фазы за счет рассеяния света либо положителен, либо отрицателен. Кроме того, можно показать, что скорость сигнала определяется показателем преломления не при одном значении частоты, а при многих частотах. Показатель преломления указывает на скорость движения гребня волны. Но гребень волны не составляет еще сигнала. Чистая волна без всяких модуляций, т. е. состоящая из бесконечно повторяющихся правильных осцилляций, не имеет «начала», и ее нельзя использовать для посылки сигналов времени. Чтобы послать сигнал, волну нужно видоизменить, сделать на ней отметку, т. е. сделать ее кое-где потолще или потоньше. Тогда волна будет содержать не одну частоту, а целый ряд частот, и можно показать, что скорость распространения сигнала зависит не от одного значения показателя преломления, а от характера изменения показателя с частотой. Мы пока отложим этот вопрос. В гл. 48 (вып. 4) мы вычислим скорость распространения сигналов в стекле и убедимся, что она не превышает скорости света, хотя гребни волны (понятия чисто математические) движутся быстрее скорости света.
Несколько слов по поводу механизма этого явления. Главная трудность здесь связана с тем фактом, что вынужденное движение зарядов противоположно по знаку направлению поля. Действительно, в выражении (31.16) для смещения заряда х множитель (ω0-ω2) отрицателен для малых ω0 и смещение имеет обратный знак по отношению к внешнему полю. Получается, что, когда поле действует с некоторой силой в одном направлении, заряд движется в противоположном направлении.
Как случилось, что заряд стал двигаться в сторону, противоположную силе? В самом деле, при включении поля заряд движется не противоположно силе. Сразу после включения поля возникает переходный режим, затем колебания устанавливаются и только после этого колебания заряды направлены противоположно внешнему полю. Одновременно результирующее поле начинает опережать по фазе поле источника. Когда мы говорим, что «фазовая скорость», или скорость гребней волны, больше с, то мы имеем в виду именно опережение по фазе.
На фиг. 31.4 показан примерный вид волн, возникающих при резком включении волны источника (т. е. при посылке сигнала).
Фиг. 31.4. Волновые «сигналы».
Из рисунка видно, что для волны, проходящей в среде с опережением по фазе, сигнал (т. е. начало волны) не опережает по времени сигнал источника.
Обратимся теперь снова к дисперсионной формуле. Следует помнить, что полученный нами результат несколько упрощает истинную картину явления. Чтобы быть точными, в формулу необходимо внести некоторые поправки. Прежде всего в нашу модель атомного осциллятора следует ввести затухание (иначе осциллятор, раз начав, будет колебаться до бесконечности, что неправдоподобно). Движение затухающего осциллятора мы уже изучали в одной из прошлых глав [см. уравнение (23.8)]. Учет затухания приводит к тому, что в формулах (31.16), а поэтому и в (31.19), вместо (ω02-ω2) появляется (ω02-ω2+iγω), где γ — коэффициент затухания.
Вторая поправка к нашей формуле возникает потому, что каждый атом обычно имеет несколько резонансных частот. Тогда вместо одного вида осцилляторов, нужно учесть действие нескольких осцилляторов с разными резонансными частотами, колебания которых происходят независимо друг от друга, и сложить вклады от всех осцилляторов.
Пусть в единице объема содержится Nk электронов с собственной частотой (ωk и коэффициентом затухания γk. Наша дисперсионная формула примет в результате вид
(31.20)
Это окончательное выражение для показателя преломления справедливо для большого числа веществ[23]. Примерный ход показателя преломления с частотой, даваемый формулой (31.20), приведен на фиг. 31.5.
Фиг. 31.5. Показатель преломления как функция частоты.
Вы видите, что всюду, за исключением области, где ω очень близко к одной из резонансных частот, наклон кривой положителен. Такая зависимость носит название «нормальной» дисперсии (потому что этот случай встречается наиболее часто). Вблизи резонансных частот кривая имеет отрицательный наклон, и в этом случае говорят об «аномальной» дисперсии (имея в виду «ненормальную» дисперсию), потому что она была наблюдена задолго до того, как узнали об электронах, и казалась в то время необычной. С нашей точки зрения, оба наклона вполне «нормальны»!
§ 4 Поглощение
Вы уже, наверное, заметили нечто странное в последней форме (31.20) нашей дисперсионной формулы. Из-за члена iγ, учитывающего затухание, показатель преломления стал комплексной величиной! Что это означает? Выразим n через действительную и мнимую части:
(31.21)
причем n' и n" вещественны. (Перед in" стоит знак минус, а само n", как легко убедиться, положительно.)
Смысл комплексного показателя преломления легче всего понять, вернувшись к уравнению (31.6) для волны, проходящей сквозь пластинку с показателем преломления n. Подставив сюда комплексное n и произведя перегруппировку членов, получаем
(31.22)
Множители, обозначенные буквой В, имеют прежний вид и, как и раньше, описывают волну, фаза которой после прохождения пластинки запаздывает на угол ω(n'-1)Δz/c. Множитель А (экспонента с действительным показателем) представляет нечто новое. Показатель экспоненты отрицателен, следовательно, А вещественно и меньше единицы. Множитель А уменьшает амплитуду поля; с ростом Δz величина А, а следовательно, и вся амплитуда падает. При прохождении через среду электромагнитная волна затухает. Среда «поглощает» часть волны. Волна выходит из среды, потеряв часть своей энергии. Этому не следует удивляться, потому что введенное нами затухание осцилляторов обусловлено силой трения и непременно приводит к потере энергии. Мы видим, что мнимая часть комплексного показателя преломления n" описывает поглощение (или «ослабление») электромагнитной волны. Иногда n" называют еще «коэффициентом поглощения».
Заметим также, что появление мнимой части n отклоняет стрелку, изображающую Еа на фиг. 31.3, к началу координат.
Отсюда ясно, почему поле ослабевает при прохождении через среду.
Обычно (как, например, у стекла) поглощение света очень мало. Именно так и получается по нашей формуле (31.20), потому что мнимая часть знаменателя iγkω много меньше действительной части (ωk2-ω2). Однако когда частота ω близка к ωk, резонансный член (ωk2-ω2) оказывается мал по сравнению с iγkω и показатель преломления становится почти чисто мнимым. Поглощение в этом случае определяет основной эффект. Именно поглощение дает в солнечном спектре темные линии. Свет, излучаемый поверхностью Солнца, проходит сквозь солнечную атмосферу (а также через атмосферу Земли), и частоты, равные резонансным частотам атомов в атмосфере Солнца, сильно поглощаются.
Наблюдение подобных спектральных линий солнечного света позволяет установить резонансные частоты атомов, а следовательно, и химический состав солнечной атмосферы. Точно так же по спектру звезд узнают состав звездного вещества. С помощью этих методов обнаружили, что химические элементы на Солнце и звездах не отличаются от земных.
§ 5. Энергия световой волны
Как мы видели, мнимая часть показателя преломления характеризует поглощение. Попробуем теперь вычислить энергию, переносимую световой волной. Мы высказали соображения в пользу того, что энергия световой волны пропорциональна —Е2, среднему по времени от квадрата электрического поля волны. Ослабление электрического поля за счет поглощения волны должно приводить к потере энергии, переходящей в какое-то трение электронов и в конечном счете, как нетрудно догадаться, в тепло.
Взяв часть световой волны, падающую на единичную площадку, например на квадратный сантиметр поверхности нашей пластинки на фиг. 31.1, можно записать энергетический баланс в следующей форме (мы предполагаем, что энергия сохраняется!):
(31.23)
Вместо первого члена можно написать α—Еs2, где α — коэффициент пропорциональности, связывающий среднее значение —Е2 с энергией, переносимой волной. Во втором члене необходимо включить поле излучения атомов среды, т. е. мы должны записать α—(Еs+Ea)2 или (раскладывая квадрат суммы) α(—Es2+—2EsEa+—Еа2).
Все наши вычисления проводились в предположении, что толщина слоя материала мала и показатель преломления его незначительно отличается от единицы, тогда Еа оказывается много меньше Es (это было сделано с единственной целью — упростить вычисления). В рамках нашего приближения член —Еа2 следует опустить, пренебрегая им по сравнению с —EsEa. Вы можете на это возразить: «Тогда нужно отбросить и —EsEa, потому что этот член много меньше —Еs2». Действительно, —EsEa много меньше —Еs2, но если мы выбросим этот член, то получим приближение, в котором эффекты среды не учитываются совсем! Правильность наших вычислений в рамках сделанного приближения проверяется тем, что мы всюду оставляли члены, пропорциональные NΔz (плотности атомов в среде), но выбрасывали члены порядка (NΔz)2 и более высоких степеней по NΔz. Наше приближение можно было бы назвать «приближением малой плотности».
Заметим, кстати, что наше уравнение баланса энергии не содержит энергии отраженной волны. Но так и должно быть, потому что амплитуда отраженной волны пропорциональна NΔz, а энергия пропорциональна (NΔz)2.
Чтобы найти последний член в (31.23), нужно вычислить работу, совершаемую падающей волной над электронами за 1 сек. Работа, как известно, равна силе, умноженной на расстояние; отсюда работа в единицу времени (называемая также мощностью) дается произведением силы на скорость. Точнее, она равна F·v, но в нашем случае сила и скорость имеют одинаковое направление, поэтому произведение векторов сводится к обычному (с точностью до знака). Итак, работа, совершаемая в 1 сек над каждым атомом, равна qe—Esv. Поскольку на единичную площадку приходится NΔz атомов, последний член в уравнении (31.23) оказывается равным NΔzqe—Esv. Уравнение баланса энергии принимает вид
(31.24)
Члены α—Es2 сокращаются, и мы получаем
(31.25)
Возвращаясь к уравнению (30.19), находим Еа для больших z:
(31.26)
(напомним, что η=NΔz). Подставляя (31.26) в левую часть равенства (31.25), получаем
Ho Es (в точке z) равно Es (в точке атома) с запаздыванием на z/c. Поскольку среднее значение не зависит от времени, оно не изменится, если временной аргумент запаздывает на z/c, т. е. оно равно —Es (в точке атома)·v, но точно такое же среднее значение стоит и в правой части (31.25). Обе части (31.25) будут равны, если выполняется соотношение
(31.27)
Таким образом, если справедлив закон сохранения энергии, то количество энергии электрической волны, приходящееся на единичную площадку в единицу времени (то, что мы называем интенсивностью), должно быть равно ε0с—Е2. Обозначив интенсивность через —S, получим
(31.28)
где черта означает среднее по времени. Из нашей теории показателя преломления получился замечательный результат!
§ 6. Дифракция света на непрозрачном экране
Теперь наступил удобный момент, чтобы применить методы настоящей главы к решению задачи другого рода. В гл. 30 мы говорили, что распределение интенсивности света — дифракционную картину, возникающую при прохождении света через отверстия в непрозрачном экране,— можно найти, равномерно распределив источники (осцилляторы) по площади отверстий. Другими словами, дифрагированная волна выглядит так, как будто источником служит дырка в экране. Мы должны выяснить причину этого явления, ведь на самом деле именно в дырке нет источников, нет никаких зарядов, движущихся с ускорением.
Ответим сначала на вопрос: что такое непрозрачный экран? Пусть между источником S и наблюдателем Р находится совершенно непрозрачный экран, как показано на фиг. 31.6, а.
Фиг. 31.6. Дифракция на непрозрачном экране.
Раз экран «непрозрачный», поле в точке Р отсутствует. Почему? Согласно общим принципам, поле в точке Р равно полю Es, взятому с некоторым запаздыванием, плюс поле всех остальных зарядов. Но, как было показано, поле Es приводит заряды экрана в движение, а они в свою очередь создают новое поле, и, если экран непрозрачный, это поле зарядов должно в точности погасить поле Es с задней стенки экрана. Тут вы можете возразить: «Каким чудом они в точности погасятся! А что, если погашение неполное?» Если бы поля гасились не полностью (напомним, что экран имеет некоторую толщину), поле в экране вблизи от задней стенки было бы отлично от нуля. Но тогда оно приводило бы в движение другие электроны экрана, создавая тем самым новое поле, стремящееся скомпенсировать первоначальное поле. Если экран толстый, в нем имеется достаточно много возможностей, чтобы свести остаточное поле к нулю. Пользуясь нашей терминологией, можно сказать, что непрозрачный экран обладает большим и чисто мнимым показателем преломления и поэтому волна в нем экспоненциально затухает. Вам, наверное, известно, что тонкие слои большинства непрозрачных материалов, даже золота, прозрачны.
Посмотрим теперь, какая возникнет картина, если взять такой непрозрачный экран с отверстием, какой изображен на фиг. 31.6, б. Каким будет поле в точке P? Поле в точке Р слагается из двух частей — поля источника S и поля экрана, т. е. поля от движения зарядов в экране. Движение зарядов в экране, по-видимому, очень сложное, но создаваемое ими поле находится довольно просто.
Возьмем тот же самый экран, но закроем отверстия крышками, как показано на фиг. 31.6, в. Пусть крышки сделаны из того же материала, что и экран. Заметьте, что крышки поставлены в тех местах, где на фиг. 31.6, б показаны отверстия. Давайте вычислим теперь поле в точке Р. Поле в точке Р в случае, показанном на фиг. 31.6, в, разумеется, равно нулю, но, с другой стороны, оно также равно полю источника плюс поле электронов экрана и крышек. Мы можем написать следующее равенство:
Штрихи относятся к случаю, когда отверстия закрыты крышками; значение Es в обоих случаях, конечно, одно и то же. Вычитая одно равенство из другого, получаем
Если отверстия не слишком малы (например, шириной во много длин волн), то присутствие крышек не должно повлиять на поле у экрана, исключая, быть может, узкую область вблизи краев отверстий. Пренебрегая этим малым эффектом, можно написать Eстенки=E'стенки и, следовательно,
Мы приходим к выводу, что поле в точке Р при открытых отверстиях (случай б) равно (с точностью до знака) полю, создаваемому той частью сплошного экрана, которая находится на месте отверстий! (Знак нас не интересует, поскольку обычно имеют дело с интенсивностью, пропорциональной квадрату поля.) Этот результат не только справедлив (в приближении не очень малых отверстий), но и важен; кроме всего прочего, он подтверждает справедливость обычной теории дифракции.
Поле E'крышки вычисляется при условии, что движение зарядов всюду в экране создает именно такое поле, которое гасит поле Es на задней поверхности экрана. Определив движение зарядов, мы складываем поля излучения зарядов в крышках и находим поле в точке Р.
Напомним еще раз, что наша теория дифракции приближенная и справедлива в случае не слишком малых отверстий. Если размер отверстий мал, член E'крышки также мал и разность E'стенки-Eстенки (которую мы считали равной нулю) может быть сравнима и даже много больше E'крышки. Поэтому наше приближение оказывается негодным.
Глава 32 РАДИАЦИОННОЕ ЗАТУХАНИЕ. РАССЕЯНИЕ СВЕТА
§ 1. Радиационное сопротивление
В предыдущей главе мы показали, что система осциллирующих зарядов излучает энергию, и нашли формулу для энергии излучения. Количество энергии, проходящее в 1 сек через квадратный метр поверхности площадки, перпендикулярной направлению излучения, определяется средней величиной квадрата электрического поля системы, умноженной на ε0c:
(32.1)
Каждый заряд, колеблясь, излучает энергию; излучает, например, и антенна, в которой внешний источник вызывает движение зарядов. При излучении энергия уходит в пространство, и в силу закона сохранения энергии по проводам, присоединенным к антенне, должна подаваться некоторая мощность. Это означает, что антенна, присоединенная к цепи источника тока, играет роль сопротивления, т. е. такого элемента цепи, где происходит «потеря» энергии (на самом деле энергия не теряется, а излучается, но по отношению к данному контуру энергия уходит безвозвратно). В обычном сопротивлении «теряемая» энергия переходит в тепло; в данном случае энергия уходит в пространство. С точки зрения теории электрических цепей неважно, куда уходит энергия, результат один и тот же — происходит «утечка» энергии из цепи. Поэтому, если антенна сделана даже из чистейшей меди, все равно для генератора она представляет собой сопротивление. Желательно, чтобы антенны излучали максимально возможное количество энергии, поэтому стараются уменьшить их емкость и индуктивность; самые лучшие антенны имеют очень малую емкость и индуктивность. Сопротивление, которое имеют антенны в цепи, называют радиационным сопротивлением.
Пусть через антенну проходит ток I, тогда средняя мощность, теряемая в антенне, равна квадрату тока, умноженному на сопротивление. Излучаемая антенной мощность также пропорциональна квадрату тока, потому что напряженность поля пропорциональна току, а излучаемая энергия пропорциональна квадрату поля. Коэффициент пропорциональности, связывающий излучаемую мощность и <I2>, и есть радиационное сопротивление.
Интересно узнать, из-за чего возникает радиационное сопротивление. Возьмем простой пример: пусть ток по антенне течет попеременно вверх и вниз. Если сообщить заряженному телу ускоренное движение вверх и вниз, то оно начнет излучать (незаряженное тело при этом энергию не излучает). Раз антенна излучает энергию, мы должны совершать над ней работу. Но одно дело показать с помощью закона сохранения энергии, что энергия теряется, и совсем другое — ответить на вопрос: против какой силы мы совершаем работу? Это очень интересный и трудный вопрос, на который применительно к электронам так и не удалось дать полного и удовлетворительного ответа. Однако в случае антенн ответ был найден. Вот что происходит в антеннах: поля, создаваемые движущимися электронами в одной части антенны, воздействуют на электроны в другой части. Можно вычислить действующие силы и найти производимую ими работу, а отсюда получить формулу для радиационного сопротивления. Было бы неправильно утверждать: «Мы можем вычислить», потому что мы еще не изучили законы электричества на малых расстояниях и знаем, каково электрическое поле только на больших расстояниях. Хотя мы привели формулу (28.3), мы еще не можем ею воспользоваться для вычисления поля внутри волновой зоны, потому что эта формула для нас слишком сложна. Правда, с помощью закона сохранения энергии мы можем получить результат и не зная вида поля на малых расстояниях. (Обращая ход рассуждений, можно найти взаимодействие на малых расстояниях, если известен вид поля на больших расстояниях и если затем воспользоваться законом сохранения энергии; мы, однако, не будем сейчас заниматься этим вопросом.)
Пусть теперь имеется один-единственный электрон; к чему приложена возникающая в нем сила сопротивления? Старая классическая теория представляла электрон в виде маленького шарика, различные части которого взаимодействуют друг с другом. В результате запаздывания при распространении взаимодействия внутри этого шарика сила оказывается несколько смещенной по фазе относительно скорости движения. Мы знаем, что, когда электрон покоится, «действие равно противодействию». Поэтому внутренние силы уравновешиваются и результирующая сила равна нулю. Но в ускоренном электроне сила, действующая на переднюю половинку со стороны задней, из-за запаздывания не равна силе, действующей в обратном направлении. Запаздывание взаимодействия во времени нарушает баланс сил, и в результате вся система как бы «наступает сама себе на шнурки». Такое объяснение возникновения радиационного сопротивления у движущегося электрона встретилось со многими трудностями и прежде всего потому, что по современным представлениям электрон вовсе не «маленький шарик»; проблема так и осталась нерешенной по сей день. Тем не менее, даже не зная механизма действия сил, мы можем точно вычислить силу сопротивления излучения, т. е. затраты энергии на ускорение заряда.
§ 2. Интенсивность излучения
Вычислим теперь полную энергию, излучаемую зарядом при ускорении. Для общности возьмем случай произвольного ускорения, считая, однако, движение нерелятивистским. Когда ускорение направлено, скажем, по вертикали, электрическое поле излучения равно произведению заряда на проекцию запаздывающего ускорения, деленному на расстояние. Таким образом, нам известно электрическое поле в любой точке, а отсюда мы знаем энергию ε0cE2, проходящую через единичную площадку за 1 сек.
Величина ε0c часто встречается в формулах распространения радиоволн. Обратную ей величину можно назвать импедансом вакуума (или сопротивлением вакуума); она равна 1/ε0с=377 ом. Отсюда мощность (в ваттах на квадратный метр) есть средний квадрат поля, деленный на 377.
С помощью формулы (29.1) для электрического поля мы получаем
(32.2)
где S — мощность на 1 м2, излучаемая под углом θ. Как уже отмечалось, S обратно пропорционально расстоянию. Интегрируя, получаем отсюда полную мощность, излучаемую во всех направлениях. Для этого сначала умножим S на площадь полоски сферы, тогда мы получим поток энергии в интервале угла dθ (фиг. 32.1).
Фиг. 32.1. Площадь кольца на сфере, равная 2πr2sinθrdθ.
Площадь полоски вычисляется следующим образом: если радиус равен r, то толщина полоски равна rdθ, а длина 2πrsinθ, поскольку радиус кольцевой полоски есть rsinθ. Таким образом, площадь полоски равна
(32.3)
Умножая поток [мощность на 1 м2, согласно формуле (32.2)] на площадь полоски, найдем энергию, излучаемую в интервале углов θ и θ+dθ; далее нужно проинтегрировать по всем углам θ от 0 до 180°:
(32.4)
При вычислении 0∫πsin3θdθ воспользуемся равенством sin3θ=(1—cos2θ) sinθ и в результате получим 4/3. Отсюда окончательно
(32.5)
Необходимо сделать несколько замечаний по поводу этого выражения. Прежде всего, поскольку а' есть вектор, то а'2 в формуле (32.5) означает а'·а', т. е. квадрат длины вектора. Во-вторых, в формулу (32.2) для потока входит ускорение, взятое с учетом запаздывания, т. е. ускорение в тот момент времени, когда была излучена энергия, проходящая сейчас через поверхность сферы. Может возникнуть мысль, что энергия действительно была излучена точно в указанный момент времени. Но это не совсем правильно. Момент излучения нельзя определить точно. Можно вычислить результат только такого движения, например колебания и т. п., где ускорение в конце концов исчезает. Следовательно, мы можем найти только полный поток энергии за весь период колебаний, пропорциональный среднему за период квадрату ускорения. Поэтому а'2 в (32.5) должно означать среднее по времени от квадрата ускорения. Для такого движения, когда ускорение в начале и в конце обращается в нуль, полная излученная энергия равна интегралу по времени от выражения (32.5).
Посмотрим, что дает формула (32.5) для осциллирующей системы, для которой ускорение а' имеет вид -ω2x0еiωt. Среднее за период от квадрата ускорения равно (при возведении в квадрат надо помнить, что на самом деле вместо экспоненты должна входить ее действительная часть — косинус, а среднее от cos2ωt дает 1/2):
Следовательно,
(32.6)
Эти формулы были получены сравнительно недавно — в начале XX века. Это замечательные формулы, они имели огромное историческое значение, и о них стоило бы почитать в старых книгах по физике. Правда, там использовалась другая система единиц, а не система СИ. Однако в конечных результатах, относящихся к электронам, эти осложнения можно исключить с помощью следующего правила соответствия: величина qe2/4πε0, где qе — заряд электрона (в кулонах), раньше записывалась как е2. Легко убедиться, что в системе СИ значение е численно равно 1,5188·10-14, поскольку мы знаем, что qe=1,60206·10-19 и 1/4πε0=8,98748·109. В дальнейшем мы будем часто пользоваться удобным обозначением
(32.7)
Если это численное значение e подставить в старые формулы, то все остальные величины в них можно считать определенными в системе СИ. Например, формула (32.5) прежде имела вид Р=2/3е2а2/с3. А потенциальная энергия протона и электрона на расстоянии r есть qe2/4πε0r или е2/r, где е=1,5188·10-14 ед. СИ.
§ 3. Радиационное затухание
Заряд, закрепленный на пружине с собственной частотой ω0 (или электрон в атоме), даже в абсолютно пустом пространстве не сможет колебаться бесконечно долго, поскольку, колеблясь, он теряет энергию на излучение. Никаких сил сопротивления в обычном смысле этого слова, никакой вязкости здесь нет. Но колебания не будут происходить «вечно», вследствие излучения они будут медленно замирать. А насколько медленно? Определим для осциллятора величину Q, вызванную так называемым радиационным сопротивлением или радиационным затуханием. Для любой колеблющейся системы величина Q равна энергии системы в данный момент времени, деленной на потери энергии, отнесенные к 1 рад:
Запишем Q по-другому, пользуясь для этого равенством dW/dφ=(dW/dt)/(dφ /dt)=-(dW/dt)/ω:
Если Q задано, то легко получить закон спадания энергии колебаний: dW/dt=(-ω/Q)W, откуда следует W=W0e-ωt/Q; здесь W0 — начальная энергия (при t=0).
Чтобы найти Q для излучающего осциллятора, вернемся к формуле (32.8) и подставим вместо dW/dt выражение (32.6).
А что нужно взять в качестве энергии W осциллятора? Кинетическая энергия осциллятора равна 1/2mv2, а средняя кинетическая энергия равна mω2x02/4. Но мы помним, что полная энергия осциллятора равна средней кинетической плюс средняя потенциальная, причем обе они для осциллятора равны; поэтому полная энергия равна
(32.9)
Какую частоту следует подставить в наши формулы? Мы возьмем собственную частоту ω0, потому что практически это и есть частота излучения атома, а вместо m подставим me. После ряда сокращений эта формула приводится к виду
(32.10)
(Для большей ясности и из соображений близости к исторически принятой форме мы ввели величину е2=qe2/4πε0 и записали 2π/λ вместо ω0/с.) Поскольку величина Q безразмерна, множитель е2/mес2, зависящий только от массы и заряда электрона и выражающий его внутренние свойства, обязан иметь размерность длины. Он был назван классическим радиусом электрона, потому что в старых моделях электрона радиационное сопротивление пытались объяснить действием одной части электрона на другие его части, для чего размеры электрона приходилось выбирать порядка e2/mec2. Но эта величина потеряла свой прежний смысл, и никто теперь не считает, что электрон имеет такой радиус. Численное значение классического радиуса электрона следующее:
(32.11)
Вычислим теперь значение Q для атома, излучающего видимый свет, например для атома натрия. Длина волны излучения натрия равна примерно 6000 Å и находится в желтой части спектра; эта величина довольно типична. Отсюда
(32.12)
т. е. для атомов Q порядка 108. Это значит, что атомный осциллятор колеблется 108 рад, или примерно 107 периодов, прежде чем его энергия уменьшится в 1/е раз. Частота колебаний света v=с/λ при длине волны 6000 Å составляет 1015 гц, а, следовательно, время жизни, т. е. время, за которое энергия уменьшится в 1/е раз, есть величина порядка 10-8сек.
Примерно за такое же время высвечиваются свободные атомы в обычных условиях. Проведенная оценка справедлива только для атомов в пустом пространстве, не подверженных никаким внешним воздействиям. Если электрон находится в твердом теле, он сталкивается с другими атомами и электронами, и тогда возникает добавочное сопротивление и затухание будет другим.
Величина эффективного сопротивления γ, определяющая сопротивление осциллятора, может быть найдена из соотношения 1/Q=γ/ω0; вспомним, что именно γ определяет ширину резонансной кривой (см. фиг. 23.2[24]). Итак, мы вычислили ширины спектральных линий для свободно излучающих атомов! Из равенства λ=2πc/ω получаем
(32.13)
§ 4. Независимые источники
Прежде чем перейти ко второй теме этой главы — рассеянию света, обсудим частный случай явления интерференции, который мы до сих пор не рассматривали. Речь пойдет о таком случае, когда интерференция не возникает. Пусть имеются два источника S1 и S2 с амплитудами поля A1 и A2. Излучение регистрируется в некоторой точке, в которую оба луча приходят с фазами φ1 и φ2 (фазы зависят от истинного момента излучения и времени запаздывания, являющегося функцией точки наблюдения).
Наблюдаемая интенсивность излучения получается сложением двух комплексных векторов с модулями A1 и A2 и фазами φ1 и φ2 (как в гл. 30) и возведением в квадрат; таким образом, энергия пропорциональна
(32.14)
Если бы не было перекрестного члена 2A1A2cos(φ1-φ2), полная энергия в данном направлении была бы равна сумме энергий A12+A22 излучаемых по отдельности каждым источником, что соответствует нашим обычным представлениям. Иначе говоря, интенсивность света, падающего на предмет от двух источников, совпала бы с суммой интенсивностей обоих источников. С другой стороны, если оставить перекрестный член, суммы интенсивностей не получится, потому что возникнет интерференция. В тех случаях, когда перекрестный член роли не играет, интерференция, казалось бы, отсутствует. Фактически же она возникает всегда, но подчас ее не удается наблюдать.
Приведем несколько примеров. Пусть два источника находятся друг от друга на расстоянии 7 000 000 000 длин волн, что в общем вполне осуществимо. Тогда в некотором фиксированном направлении разность фаз принимает вполне определенное значение. Но если сдвинуться от этого направления хоть на волосок, скажем на несколько длин волн (совсем пустячное расстояние: зрачок нашего глаза настолько велик, что действие лучей можно усреднять на расстояниях, много больших длины волны), то разность фаз станет другой и значение косинуса резко изменится. При вычислении средней интенсивности в маленькой области пространства косинус в точках этой области будет все время колебаться — плюс, минус, плюс, минус — и при усреднении даст нуль.
Итак, усреднение по области, в которой фаза быстро меняется от точки к точке, обращает интерференционный член в нуль.
Другой пример. Предположим, что два источника колеблются и излучают радиоволны независимо друг от друга, т. е. они представляют собой не один осциллятор, питающийся от двух проводов (благодаря чему разность фаз остается постоянной), а именно два независимых источника. И пусть источники не настроены точно на одну и ту же частоту (равенства частот очень трудно достигнуть, если не соединять источники в одной цепи). Именно при этих условиях мы и будем называть источники независимыми. Естественно, что из-за сдвига по частоте фазы источников будут различаться, даже если вначале они и совпадали: одна из фаз начнет опережать другую и очень скоро источники окажутся в противофазе, а при дальнейшем опережении фазы снова сравняются и т. д. Разность фаз источников будет, таким образом, дрейфовать со временем, но при измерениях в течение больших промежутков времени приборы не смогут уследить за ними, так как подъемы и спады интенсивности, похожие на «биения» звука, происходят слишком быстро. Мы должны усреднить по промежутку времени наблюдения, но при этом интерференционный член снова выпадает.
Другими словами, при усреднении по разности фаз интерференционный член обращается в нуль!
Имеется много книг по физике, в которых утверждается, что два различных источника света никогда не интерферируют. Это утверждение не отражает физического закона, а просто характеризует ту чувствительность экспериментальной техники, которая существовала к моменту написания книги. В источнике же света происходит следующее: сначала излучает один атом, затем другой и т. д. Как мы показали выше, атомы излучают последовательность волн за время около 10-8 сек; через 10-8 сек какой-то атом высвечивается, его место занимает другой, затем третий и т. д. Поэтому фаза может оставаться постоянной примерно только в течение 10-8 сек. При усреднении за промежутки времени, много большие 10-8 сек, интерференционный член от двух источников выпадает, так как фазы источников за это время много раз изменятся. Световые ячейки Керра позволяют регистрировать свет с очень большой скоростью, и с их помощью удалось показать, что интерференционный член меняется за время порядка 10-8 сек. Но большинство приборов не может регистрировать свет в столь малые интервалы времени и, естественно, не обнаруживает интерференции. Для глаза время усреднения — порядка 1/10 сек, поэтому увидеть интерференцию обычных источников совершенно невозможно.
Недавно удалось создать источники света, в которых атомы излучают одновременно, и поэтому можно обойти эффект усреднения. Принцип устройства подобных источников весьма сложен, его можно понять, только зная законы квантовой механики. Называются эти источники лазерами. Частота интерференции испущенного лазером света, т. е. время, в течение которого фаза остается постоянной, много больше 10-8 сек. Оно может быть равно сотой, десятой доле секунды и даже целой секунде; с помощью обычных световых ячеек можно определить частоту интерференции между двумя лазерами. Легко также заметить биения при сложении света от двух лазеров. Вне всякого сомнения, скоро станет возможно получать столь медленные биения, что, направив на стенку свет от двух лазеров, можно будет увидеть их невооруженным глазом в виде периодических ослаблений и увеличений яркости пятна!
Еще один пример погашения интерференции представляет собой сложение света не двух, а многих источников. В этом случае AR2 равно квадрату суммы большого числа амплитуд (комплексных чисел), т. е. сумме квадратов плюс перекрестные члены от каждой пары. При определенных условиях перекрестные члены могут погаситься и интерференция исчезнет. Например, когда источники распределены в пространстве случайным образом, тогда разность фаз A2 и А3 хотя и постоянна, но значительно отличается от разности фаз A1 и А2 и т. д. В результате получается много косинусов — одни из них положительны, другие отрицательны, а в сумме они почти целиком сокращаются.
Вот почему во многих случаях мы не замечаем эффекта интерференции, а полная интенсивность оказывается равной сумме интенсивностей всех источников.
§ 5. Рассеяние света
Приведенные выше примеры помогут нам понять одно явление, которое возникает в воздухе в результате неупорядоченного расположения атомов. В главе о показателе преломления мы говорили, что падающий свет вызывает излучение атомов. Электрическое поле падающего пучка раскачивает электроны вверх и вниз, и они, двигаясь с ускорением, начинают излучать. Это рассеянное излучение образует пучок света, движущийся в том же направлении, что и падающий луч, но отличающийся от него по фазе, благодаря чему и возникает показатель преломления.
Но что можно сказать об интенсивности рассеянного света в других направлениях? Если атомы очень правильно чередуются, образуя красивый геометрический узор, интенсивность во всех остальных направлениях равна нулю, потому что результат сложения множества векторов с меняющимися фазами сводится к нулю. Но если расположение атомов беспорядочное, интенсивность в любом направлении, как мы уже говорили, равна сумме интенсивностей от каждого атома в отдельности. Более того, атомы газа постоянно движутся, и разность фаз двух атомов, принимающая определенное значение в некоторый момент времени, в следующий момент уже изменится, поэтому при усреднении по времени исчезает каждый перекрестный член в отдельности. Следовательно, для определения интенсивности света, рассеянного газом, можно взять рассеяние на одном атоме и умножить интенсивность на число атомов.
Как уже отмечалось, голубой цвет неба объясняется именно рассеянием света в воздухе. Солнечный свет проходит сквозь воздух, и, когда мы смотрим в сторону от Солнца, например перпендикулярно падающему лучу, мы видим свет голубой окраски; попробуем теперь подсчитать интенсивность рассеянного света и понять, почему он голубой.
Падающий луч света с напряженностью электрического поля Е=Е0еiωt в точке расположения атома, как известно, заставляет электрон колебаться вверх и вниз (фиг. 32.2).
Фиг. 32.2. Луч, падающий на атом, заставляет заряды (электроны) атома колебаться. Движущиеся электроны в свою очередь излучают во все стороны.
С помощью уравнения (23.8) находим амплитуду колебаний
(32.15)
В принципе можно учесть затухание и ввести сумму по частотам, считая, что атом действует как совокупность осцилляторов с разными частотами. Однако для простоты ограничимся случаем одного осциллятора и пренебрежем затуханием. Тогда выражение для амплитуды принимает вид, которым мы уже пользовались при вычислении показателя преломления:
(32.16)
Из этой формулы для ^x и равенства (32.2) легко получить интенсивность рассеяния в заданном направлении.
Однако, чтобы сэкономить время, вычислим сначала полную интенсивность рассеяния во всех направлениях. Полную энергию, рассеиваемую атомом за 1 сек во всех направлениях, можно получить из формулы (32.7). После перегруппировки членов выражение для энергии принимает вид
(32.17)
Мы приводим результат в такой форме потому, что она удобна для запоминания: прежде всего, рассеиваемая энергия пропорциональна квадрату падающего поля. Что это означает? Очевидно, квадрат поля пропорционален энергии падающего пучка, проходящей за 1 сек. (В самом деле, энергия, падающая на 1 м2 за 1 сек, равна произведению ε0с и среднего квадрата электрического поля <E2>; если максимальное значение Е есть Е0 то <E2>=1/2E02.) Другими словами, рассеиваемая энергия пропорциональна плотности падающей энергии; чем сильнее солнечный свет, тем ярче кажется небо.
А какая доля падающего света рассеивается электроном? Вообразим мишень с площадью σ, помещенную на пути луча (не настоящую мишень, сделанную из какого-то вещества, потому что она приведет к дифракции света и т. п., а воображаемую мишень, нарисованную в пространстве). Количество энергии, проходящее через поверхность σ, пропорционально падающей интенсивности и площади мишени:
(32.18)
А теперь давайте условимся: полное количество энергии, рассеиваемое атомом, мы приравняем энергии падающего пучка, проходящей через некоторую площадь; указав величину площади, мы тем самым определяем рассеиваемую энергию. В такой форме ответ не зависит от интенсивности падающего пучка; он выражает отношение рассеиваемой энергии к энергии, падающей на 1 м2. Другими словами,
Смысл этой площади заключается в том, что, если бы вся попадающая на нее энергия отбрасывалась в сторону, она рассеивала бы столько энергии, сколько рассеивает атом.
Эта площадь называется эффективным сечением рассеяния. Понятие эффективного сечения используется всегда, когда эффект пропорционален интенсивности падающего пучка. В таких случаях количественный выход эффекта задается площадью эффективной области, выхватывающей из пучка такую часть, чтобы она равнялась выходу. Это ни в коем случае не означает, что наш осциллятор на самом деле занимает подобную площадь. Если бы свободный электрон просто качался взад и вперед, ему бы не соответствовала никакая площадь. Это лишь способ выражения результата через определенную величину; мы указываем площадь, на которую должен упасть пучок, чтобы получилась известная энергия рассеяния. Итак, в нашем случае
(32.19)
(s — рассеяние).
Рассмотрим несколько примеров. Прежде всего, когда собственная частота очень мала или электрон вообще свободен, что соответствует ω0=0, частота ω выпадает и сечение σ становится константой. В этом пределе сечение носит название томпсоновского сечения рассеяния. Оно равно площади квадратика со стороной около 10-15 м, т. е. площади 10-30 м2, а это очень мало!
С другой стороны, при рассеянии света в воздухе собственные частоты осцилляторов, как мы уже говорили, больше частот обычного света. Отсюда следует, что величиной ω2 в знаменателе можно пренебречь и сечение оказывается пропорциональным четвертой степени частоты. Значит, свет с частотой, в два раза большей, рассеивается в шестнадцать раз интенсивнее, а это уже вполне ощутимая разница. Таким образом, голубой свет, частота которого примерно вдвое выше частоты света у красного конца спектра, рассеивается значительно интенсивнее, чем красный свет. И, взглянув на небо, мы видим только изумительную синеву!
Стоит сказать еще несколько слов по поводу полученных результатов. Ответьте, во-первых, почему мы видим облака? Откуда они берутся? Всем известно, что возникают они за счет конденсации водяных паров. Но водяные пары, конечно, находились в атмосфере еще до конденсации. Почему же мы их не видели? А вот после конденсации их прекрасно видно. Не были видны — и вдруг появились. Как видите, тайна происхождения облаков — это совсем не детский вопрос, вроде «Папа, откуда взялась вода?», и ее нужно объяснить.
Мы только что говорили, что каждый атом рассеивает свет, и, естественно, водяной пар тоже должен рассеивать свет. Загадка состоит в том, почему вода, конденсированная в облаках, рассеивает свет сильнее в такое огромное число раз?
Давайте посмотрим, что получится, если вместо одного атома взять скопление атомов, скажем два атома, расположенных очень близко друг к другу по сравнению с длиной волны. Вспомним, что размеры атомов порядка 1 Å, а длина волны света порядка 5000 Å, так что несколько атомов вполне могут образовать сгусток, где расстояние между ними будет много меньше длины волны. Под действием электрического поля оба атома будут колебаться совместно, как целое. Рассеиваемое электрическое поле окажется равным сумме двух полей с одинаковой фазой, т. е. удвоенной амплитуде одного атома, а энергия увеличится в четыре, а не в два раза по сравнению с энергией излучения от отдельного атома! Таким образом, сгустки атомов излучают или рассеивают больше энергии, чем столько же атомов по отдельности. Наше старое утверждение, что фазы двух атомов никак не связаны, основывалось на предположении о большой разности фаз двух атомов, что справедливо только когда расстояние между ними порядка нескольких длин волн или когда они движутся. Если же атомы находятся совсем рядом, они излучают обязательно с одной фазой, и возникает усиливающая интерференция, что приводит к увеличению рассеяния.
Пусть в сгустке, крошечной капельке воды, содержится N атомов; тогда под действием электрического поля они будут двигаться, как и раньше, все вместе (влияние атомов друг на друга для нас несущественно, мы хотим только выяснить суть дела). Амплитуда рассеяния каждого атома одна и та же; следовательно, поле рассеянной волны оказывается в N раз больше. Интенсивность рассеиваемого света увеличивается в N2 раз. Если бы атомы находились далеко друг от друга, мы получили бы увеличение в N раз по сравнению со случаем отдельного атома, а здесь возникает N2 раз! Иначе говоря, рассеяние капельками воды (по N молекул в каждой) в N раз больше рассеяния тех же атомов по отдельности. Таким образом, чем больше вода конденсируется, тем больше рассеяние. Может ли рассеяние расти до бесконечности? Нет, конечно! На каком же этапе наши рассуждения станут неверными? Ответ: когда водяная капля увеличится настолько, что размеры ее окажутся порядка длины волны, колебания атомов будут происходить с разными фазами, потому что расстояние между ними станет слишком большим. Таким образом, с увеличением размера капель рассеяние растет до тех пор, пока капли не станут порядка длины волны, а затем с ростом капель рассеяние увеличивается гораздо медленнее. Кроме того, голубой свет в рассеянной волне начинает исчезать, потому что для коротких волн предел роста рассеяния наступает раньше (у менее крупных капель), чем для длинных волн. Хотя каждый атом рассеивает короткие волны сильнее, чем длинные, капли с размерами больше длины волны интенсивнее рассеивают свет вблизи красного конца спектра, и с ростом капель цвет рассеянного излучения меняется с голубого на красный (становится более красным).
Это явление можно наглядно продемонстрировать. Нужно взять очень маленькие частички вещества, которые затем постепенно будут расти. Для этого воспользуемся раствором гипосульфата натрия в серной кислоте, в котором осаждаются крохотные зернышки серы. Когда сера начинает осаждаться, зернышки еще очень малы и рассеянный свет имеет синеватый оттенок. С ростом числа и величины частиц в осадке свет сначала становится более интенсивным, а затем приобретает беловатый оттенок. Кроме того, проходящие лучи теряют синюю составляющую. Именно поэтому закат бывает красным; солнечные лучи, прошедшие к нам через толщу атмосферы, успели рассеять голубой свет и приобрели оранжевую окраску.
Наконец, при рассеянии возникает еще одно важное явление, которое, по существу, относится к поляризации — теме следующей главы. Однако оно так интересно, что имеет смысл сказать о нем сейчас. Оказывается, что электрическое поле рассеянного света колеблется преимущественно в одном определенном направлении. Пусть электрическое поле в падающей волне колеблется в каком-то направлении, тогда осциллятор будет совершать свои вынужденные колебания в том же направлении. Если теперь мы будем смотреть под прямым углом к падающему лучу, то увидим поляризованный свет, т. е. свет, в котором электрическое поле колеблется только в одном направлении. Вообще говоря, атомы могут осциллировать в любом направлении, лежащем в плоскости, перпендикулярной падающему лучу, но, когда они движутся прямо к нам или от нас, мы их не видим. Таким образом, хотя электрическое поле в падающем луче осциллирует во всевозможных направлениях (в этом случае говорят о неполяризованном свете), свет, рассеивающийся под углом 90°, содержит колебания только в одном направлении (фиг. 32.3)!
Фиг. 32.3. Возникновение поляризации у рассеянного луча, направленного под прямым углом к падающему лучу.
Есть такое вещество, называемое поляроидом, через которое проходит только волна с электрическим полем, параллельным некоторой оси. С помощью поляроида можно заметить поляризацию и, в частности, показать, что свет, рассеянный нашим раствором гипосульфата, действительно сильно поляризован.
Глава 33 ПОЛЯРИЗАЦИЯ
§ 1. Вектор электрического поля световой волны
В этой главе мы рассмотрим круг явлений, связанных с векторным характером электрического поля световой волны. В предыдущих главах направление колебаний электрического поля нас не интересовало, правда, мы отметили, что вектор электрического поля лежит в плоскости, перпендикулярной направлению распространения света. Но нам не нужно было знать направление вектора более точно. Теперь мы перейдем к изучению явлений, в которых главную роль играет определенное направление колебаний электрического вектора.
В идеально монохроматической световой волне электрическое поле колеблется с определенной частотой, а так как x- и y-компоненты поля могут колебаться независимо с одной и той же частотой, то сначала мы рассмотрим сложение двух взаимно перпендикулярных колебаний. Какое электрическое поле возникает при сложении колебаний x- и y-компонент поля с одинаковой частотой? Складывая колебание в направлении x и колебание с той же фазой в направлении у, получаем в плоскости xy колебание в новом направлении.
На фиг. 33.1 показано, как происходит сложение колебаний с разными амплитудами в направлении x и y.
Фиг. 33.1. Сложение колебаний в направлениях х и у, когда разность фаз между ними равна нулю.
Но примеры, представленные на этом рисунке, не исчерпывают всех возможностей: до сих пор предполагалось, что колебания вдоль осей x и y находятся в одной фазе, но это совсем не обязательно. Может случиться, что х- и y-колебания происходят с разными фазами.
В этом последнем случае вектор электрического поля описывает эллипс, что можно проиллюстрировать на следующем простом примере. Подвесим на длинной веревке мяч, чтобы он мог свободно колебаться в горизонтальной плоскости; колебания будут носить синусоидальный характер. Представим себе мысленно оси х и у в горизонтальной плоскости колебаний мяча с началом координат в точке покоя мяча. Выбирая соответствующее начальное смещение и начальную скорость мяча, можно заставить мяч колебаться по оси х, по оси у или по любому другому направлению в плоскости ху с одной и той же частотой, равной частоте маятника. Эти колебания мяча аналогичны колебаниям электрического вектора, приведенным на фиг. 33.1. В каждом случае колебания в направлениях х и у достигают максимума одновременно и, следовательно, оба колебания находятся в фазе. Но известно, что самый общий тип движения мяча — движение по эллипсу — возникает, когда колебания в направлениях х и у происходят с разными фазами.
На фиг. 33.2 показано сложение колебаний по осям х и у для разных значений сдвига фаз между ними.
Фиг. 33.2. Сложение колебаний в направлениях х и у с разными фазами. Компоненты Еx и Еу записаны и в действительных и в комплексных обозначениях.
Во всех примерах электрический вектор описывает эллипс. Колебание по прямой есть тоже частный случай эллиптического, когда сдвиг фаз равен нулю (или целому кратному я); при равных амплитудах и сдвиге фаз 90° (или нечетном числе л/2) происходит движение по окружности.
На фиг. 33.2 компоненты электрического поля в направлениях х и у записаны в виде комплексных чисел, что оказывается очень удобным для явного выделения разности фаз. В этих обозначениях не следует только путать действительную и мнимую части с х- и y-компонентами поля. Изображенные на фиг. 33.2 компоненты поля по осям х и у есть реальные физические поля, которые можно измерить. Действительная и мнимая части вектора электрического поля введены только для математического удобства, и физического смысла такое разделение не имеет.
Сделаем несколько замечаний о терминологии. Свет называется линейно поляризованным (иногда плоско поляризованным), если электрическое поле колеблется по прямой линии; на фиг. 33.1 показан случай линейной поляризации. Когда вектор электрического поля описывает эллипс, говорят об эллиптической поляризации. Если же электрический вектор описывает окружность, мы имеем круговую поляризацию. Если электрический вектор при своем движении в световой волне крутится как правосторонний винт, говорят о правой круговой поляризации. На фиг. 33.2, ж приведен пример правой круговой поляризации, а на фиг. 33.2, в — пример левой круговой поляризации. В обоих случаях свет движется от плоскости страницы к читателю. Наше определение левой и правой круговых поляризаций согласуется с подобными определениями для всех других частиц в современной физике, для которых можно ввести понятие поляризации (например, для электронов). Однако в курсах оптики иногда используются прямо противоположные определения, поэтому читателю следует с осторожностью относиться к терминам левая и правая поляризация.
Мы описали линейную, круговую и эллиптическую поляризации света и охватили, таким образом, все возможные случаи состояния света, кроме одного,—случая неполяризованного света. Ну, а как же может получиться неполяризованный свет, если известно, что колебания непременно происходят по тому или иному эллипсу?
Возьмем не вполне монохроматический свет, когда сдвиг фаз х- и y-колебаний непостоянен и электрический вектор колеблется произвольным образом; тогда поляризация света будет все время меняться. Вспомним, что один атом излучает свет за 10-8 сек, и, если все атомы будут излучать свет с разной поляризацией, поляризация полного пучка света будет меняться через каждые 10-8 сек. Когда поляризация света изменяется столь быстро, что ее невозможно измерить, говорят о неполяризованном свете, потому что все эффекты поляризации усредняются и сводятся к нулю. Ни один из интерференционных эффектов при сложении поляризаций не проявляется для неполяризованного света. В то же время само определение неполяризованного света подразумевает, что экспериментально невозможно установить, поляризован свет или нет.
§ 2. Поляризация рассеянного света
Первый пример поляризационных явлений, который мы уже ранее обсуждали, есть рассеяние света. Рассмотрим проходящий в воздухе пучок света, например солнечного света. Электрическое поле возбуждает колебания зарядов в воздухе, и в результате этих колебаний излучается свет, интенсивность которого максимальна в плоскости, перпендикулярной движению зарядов. Пучок солнечного света неполяризован, т. е. направление поляризации постоянно меняется, а следовательно, изменяется и направление колебаний зарядов в воздухе. Возьмем пучок света, рассеянный под углом 90°; он возникает от излучения только тех частиц воздуха, которые колеблются перпендикулярно линии зрения наблюдателя, и, следовательно, пучок рассеянного света будет поляризован в направлении этих колебаний. Таким образом, рассеяние дает нам пример получения поляризованного света.
§ 3. Двойное лучепреломление
Есть еще один интересный факт из области поляризационных явлений. Встречаются среды, показатель преломления которых различен для света, линейно поляризованного в том или другом направлении. Допустим, например, что имеется некий материал, состоящий из вытянутых несферических молекул, длина которых больше их ширины; предположим, что молекулы в веществе выстроены так, чтобы их большие оси оказались параллельными. Что произойдет, когда на тело подействует осциллирующее электрическое поле? Предположим, что такая структура молекул способствует тому, что электроны в материале легче поддаются колебаниям вдоль оси молекулы, чем поперек нее. При таких условиях следует ожидать, что поляризация в одном направлении будет вызывать один эффект, а поляризация, направленная под прямым углом к первой, — совсем другой. Назовем направление осей молекул оптической осью. Показатель преломления принимает разные значения в зависимости от того, направлена ли поляризация вдоль оптической оси или перпендикулярно ей. Среда с такими свойствами называется двоякопреломляющей. Она обладает двумя разными способами преломления, т. е. двумя показателями преломления в зависимости от поляризации света в среде. Какие материалы обладают этим свойством? Из разных соображений вытекает, что двоякопреломляющая среда должна иметь некоторое количество ориентированных несферических молекул. Ясно, что кубический кристалл, имеющий симметрию куба, не может быть двоякопреломляющим. А вот длинные игловидные кристаллы, безусловно, содержат несимметричные молекулы, и в них легко наблюдать эффект двойного лучепреломления.
Попробуем сообразить, что получится, если направить поляризованный луч на пластинку двоякопреломляющего материала. Если поляризация параллельна оптической оси, свет пройдет через пластинку с одной скоростью, а если поляризация перпендикулярна — с другой скоростью. Интересная ситуация возникает, если луч света поляризован, например, под углом в 45° к направлению оптической оси. Тогда поляризация, как известно, представляется в виде суммы поляризаций в направлении х и у с равными амплитудами и фазами, что показано на фиг. 33.2, а. Поскольку лучи с поляризациями вдоль осей х и у движутся в среде с разной скоростью, фазы обеих компонент поля будут расти по-разному.
Таким образом, несмотря на совпадение фаз х- и у-компонент вначале, внутри среды между ними появится разность фаз, пропорциональная глубине проникновения света в среду. Изменение поляризации света в процессе прохождения через среду показано в серии рисунков на фиг. 33.2. Если пластинка имеет такую толщину, что разность фаз на выходе между поляризациями по осям х и у равна 90° (фиг. 33.2, в), то свет выйдет из пластинки поляризованным по кругу. Пластинки такой толщины называются пластинками в четверть волны, поскольку они приводят к разности фаз в одну четвертую цикла. Пропуская линейно поляризованный свет через две пластинки в четверть волны, снова получаем линейно поляризованный свет, но направление поляризации повернется на прямой угол (это легко понять из фиг. 33.2, в).
Явление двойного лучепреломления легко продемонстрировать с помощью листка целлофана. Целлофан состоит из длинных молекул — волокон, и его структура неизотропна, поскольку волокна по большей части вытянуты в одном направлении. Для наблюдения явления двойного лучепреломления необходим пучок линейно поляризованного света, который нетрудно получить, пропуская неполяризованный свет через пластинку поляроида. О поляроиде мы еще будем говорить более подробно, а пока отметим одно его важное свойство: свет, поляризованный вдоль оси поляроида, проходит через него почти свободно, а свет, поляризованный перпендикулярно оси, сильно поглощается поляроидом. Когда неполяризованный свет пропускается через пластинку поляроида, то проходит только та часть света, колебания которой параллельны оси поляроида, поэтому прошедший через пластинку луч окажется линейно поляризованным. Это свойство поляроида используют также для определения направления поляризации линейно поляризованного света; кроме того, с помощью поляроида можно определить, есть ли у света вообще линейная поляризация или нет. Для этого достаточно пропустить свет через пластинку поляроида и поворачивать ее в плоскости, перпендикулярной лучу. Линейно поляризованный свет не может пройти через поляроид, когда ось поляроида перпендикулярна направлению поляризации луча. Повернув пластинку на 90°, мы увидим прошедший через нее луч лишь чуть-чуть менее ярким, чем падающий пучок света. Если яркость луча, пропущенного поляроидом, не зависит от ориентации поляроида, падающий пучок света не имеет линейной поляризации.
Для демонстрации двойного лучепреломления в целлофане возьмем два поляроида и расположим их, как показано на фиг. 33.3.
Фиг. 33.3. Схема эксперимента по двойному лучепреломлению в целлофане. Векторы электрического поля световой волны изображены пунктирными стрелками. Направления поляризации, пропускаемые поляроидами, и оптические оси целлофана изображены сплошными стрелками. Падающий луч света неполяризован.
Из первого поляроида выходит линейно поляризованный пучок света; мы пропускаем его через целлофан, а затем через другой поляроид, чтобы учесть действие целлофана на линейно поляризованный свет. Сначала расположим оси поляроидов перпендикулярно друг другу и уберем листок целлофана. Через второй поляроид свет не проходит совсем. Теперь поставим листок целлофана между поляроидами и будем поворачивать его вокруг оси пучка света. При этом, вообще говоря, некоторая часть света будет все время проходить через второй поляроид. Имеются, однако, две ориентации листка целлофана, перпендикулярные друг другу, при которых свет через второй поляроид не проходит. Ясно, что эти ориентации целлофана не влияют на линейную поляризацию проходящего через него света и должны поэтому совпадать с направлением оптической оси целлофана и перпендикулярным к нему направлением.
Здесь мы предполагаем, что скорость света, проходящего через целлофан, различна для указанных двух направлений поляризации, но само направление поляризации при прохождении света не меняется. Если выбрать промежуточную ориентацию целлофана где-то между двумя главными направлениями, как на фиг. 33.3, то через второй поляроид пройдет яркий пучок света.
Оказывается, толщина обычного целлофана, используемого в магазинах для упаковки, равна почти точно половине длины волны для большинства цветов в спектральном разложении белого света. Целлофан такой толщины поворачивает направление поляризации линейно поляризованного света на 90°, если это направление в падающем пучке образует угол 45° с оптической осью целлофана. Таким образом, выходящий из целлофана луч обладает как раз такой поляризацией, что может пройти второй поляроид.
Если в нашем опыте использовать пучок белого света, то только для одной компоненты его спектрального разложения толщина целлофана совпадет с половиной длины волны, и пучок, пропущенный вторым поляроидом, будет иметь цвет именно этой компоненты. Цвет пучка, прошедшего через наше устройство, будет зависеть от толщины листа целлофана, а эффективную толщину целлофана мы можем менять, наклоняя листок под некоторым углом и таким образом заставляя свет проходить больший путь внутри целлофана. При наклоне листка целлофана цвет пропущенного пучка меняется. Используя целлофан разной толщины, можно сконструировать фильтры, пропускающие лучи вполне определенного цвета. Эти фильтры обладают тем замечательным свойством, что они пропускают один цвет, когда оси двух поляроидов перпендикулярны, и дополнительный к нему цвет, когда оси поляроидов параллельны.
Системы ориентированных молекул имеют еще одно, на этот раз вполне практическое применение. Некоторые пластики состоят из очень длинных и сложных молекул, скрученных между собой. При очень тщательном проведении процесса затвердевания пластика молекулы, скручиваясь, образуют сплошную массу и ориентируются равномерно в самых разных направлениях, так что пластик обычно не проявляет свойства двойного лучепреломления. Но при затвердевании часто образуются дефекты и напряжения, которые приводят к некоторой неоднородности материала. Напряжения, возникающие в пластике, как бы вытягивают целую связку молекул, и молекулярные нити ориентируются преимущественно вдоль направления натяжения. Благодаря внутренним напряжениям пластик становится двоякопреломляющим, и эффект двойного лучепреломления можно наблюдать, пропуская через него поляризованный свет. Анализируя пропущенный пластиком пучок с помощью поляроида, мы заметим темные и светлые полосы (окрашенные в разные цвета, если берется пучок белого света). Если образец подвергнуть растяжению, вся совокупность полос начинает сдвигаться, а подсчитав полосы и определив место их наибольшего скопления, можно найти внутренние напряжения, возникающие в образце. Инженеры обычно используют это явление как способ определения напряжений в деталях, форма которых трудно поддается расчету.
Еще один интересный пример — двойное лучепреломление в жидкостях. Рассмотрим жидкость, состоящую из длинных асимметричных молекул, которые несут вблизи своих концов распределенный положительный или отрицательный заряд, т. е. молекулы являются электрическими диполями. Сталкиваясь, молекулы в жидкости принимают любую ориентацию, причем какого-либо преимущественного направления ориентации не существует. Но если приложить электрическое поле, молекулы начнут выстраиваться вдоль поля и в этот самый момент жидкость становится двоякопреломляющей средой. Взяв два поляроида и прозрачную ячейку с жидкостью такого сорта, можно создать устройство, которое пропускает свет только при включении электрического поля. В результате мы получаем электрический переключатель для света, который называют ячейкой Керра. А сам эффект, когда в жидкости возникает двойное лучепреломление под действием электрического поля, называется эффектом Керра.
§ 4. Поляризаторы
До сих пор мы говорили о средах, показатель преломления которых различен для разных направлений поляризации падающего светового пучка. Большое значение для практических применений имеют и другие среды, у которых в зависимости от поляризации света меняется не только показатель преломления, но и коэффициент поглощения. Как и в случае двойного лучепреломления, легко понять, что поглощение может зависеть от направления вынужденных колебаний зарядов только в анизотропных средах. Первый, старый, ставший уже знаменитым пример — это турмалин, а другой — поляроид. Поляроид состоит из тонкого слоя маленьких кристаллов герапатита (соль йода и хинина), выстроенных своими осями параллельно друг другу. Эти кристаллы поглощают свет, когда колебания происходят в одном каком-то направлении, и почти не поглощают света, когда колебания совершаются в другом направлении.
Направим на поляроид пучок света, поляризованный под углом θ к его оси. Какая интенсивность будет у пучка, прошедшего через поляроид? Разложим наш пучок света на две компоненты: одну с поляризацией, перпендикулярной той, которая проходит без ослабления (она пропорциональна sinθ), и вторую — продольную компоненту, пропорциональную cosθ. Через поляроид пройдет только часть, пропорциональная cosθ; компонента, пропорциональная sinθ, поглотится. Амплитуда света, прошедшего через поляроид, меньше амплитуды падающего света и получается из нее умножением на cosθ. Интенсивность света пропорциональна квадрату cosθ. Таким образом, если падающий свет поляризован под углом θ к оси поляроида, пропускаемая поляризатором доля интенсивности составляет cos2θ от полной. Доля интенсивности, поглощаемая в поляроиде, есть, разумеется, sin2θ.
Интересный парадокс возникает в следующем опыте. Известно, что два поляроида с осями, расположенными перпендикулярно друг другу, не пропускают света. Но если между такими поляроидами поместить третий, ось которого направлена под углом 45° к осям двух других, часть света пройдет через нашу систему. Как мы знаем, поляроид только поглощает свет, создать свет он не может. Тем не менее, поставив третий поляроид под углом 45°, мы увеличиваем количество прошедшего света. Вы можете сами проанализировать это явление в качестве упражнения.
Одно из интереснейших поляризационных явлений, возникающее не в сложных кристаллах и всяких специальных материалах, а в простом и очень хорошо знакомом случае,— это отражение от поверхности. Кажется невероятным, но при отражении от стекла свет может поляризоваться, и объяснить физически такой факт весьма просто. На опыте Брюстер показал, что отраженный от поверхности свет полностью поляризован, если отраженный и преломленный в среде лучи образуют прямой угол. Этот случай показан на фиг. 33.4.
Фиг. 33.4. Отражение линейно поляризованного света под углом Врюстера. Направление поляризации дается пунктирными стрелками: круглые точки изображают поляризацию, перпендикулярную плоскости страницы.
Если падающий луч поляризован в плоскости падения, отраженного луча не будет совсем. Отраженный луч возникает только при условии, что падающий луч поляризован перпендикулярно плоскости падения. Причину этого явления легко понять. В отражающей среде свет поляризован перпендикулярно направлению движения луча, а мы знаем, что именно движение зарядов в отражающей среде генерирует исходящий из нее луч, который называют отраженным. Появление этого так называемого отраженного луча объясняется не просто тем, что падающий луч отражается; мы теперь уже знаем, что падающий луч возбуждает движение зарядов в среде, а оно в свою очередь генерирует отраженный луч.
Из фиг. 33.4 ясно, что только колебания, перпендикулярные плоскости страницы, дают излучение в направлении отраженного луча, а следовательно, отраженный луч поляризован перпендикулярно плоскости падения. Если же падающий луч поляризован в плоскости падения, отраженного луча не будет совсем.
Это явление легко продемонстрировать при отражении линейно поляризованного луча от плоской стеклянной пластинки. Поворачивая пластинку под разными углами к направлению падающего поляризованного луча, можно заметить резкий спад интенсивности при значении угла, равном углу Брюстера. Это падение интенсивности наблюдается только в том случае, когда плоскость поляризации совпадает с плоскостью падения. Если же плоскость поляризации перпендикулярна плоскости падения, заметного спада интенсивности отраженного света не наблюдается.
§ 5. Оптическая активность
Интереснейший поляризационный эффект был обнаружен в материалах, молекулы которых не обладают зеркальной симметрией; это молекулы в виде штопора, перчатки с одной руки или вообще какой-то формы, которая при отражении в зеркале переходит в другую форму, подобно тому как перчатка с левой руки в этом случае принимает вид перчатки с правой. Предположим, что все вещество состоит из молекул одной формы, т. е. в веществе нет молекул, которые являлись бы зеркальными отражениями других. Тогда в этом веществе возникает замечательное явление, называемое оптической активностью,— направление поляризации линейно поляризованного света при прохождении через вещество поворачивается вокруг оси пучка.
Чтобы разобраться в явлении оптической активности, надо вывести ряд формул, но суть дела можно понять и качественно, без всяких вычислений. Возьмем асимметричную молекулу в форме спирали, показанную на фиг. 33.5. Оптическая активность появляется не обязательно для молекул именно такой формы, но пример спирали наиболее прост и типичен для случая, когда нет зеркальной симметрии.
Фиг. 33.5. Молекула, форма которой не обладает зеркальной симметрией. На молекулу падает пучок света, линейно поляризованный в направлении оси у.
Пусть на молекулу падает луч света, линейно поляризованный вдоль оси у, тогда электрическое поле вызывает движение зарядов вверх и вниз по спирали, так что в направлении у возникает ток и происходит излучение электрического поля Еу, поляризованного опять-таки вдоль оси у. Если, однако, электроны могут двигаться только вдоль спирали, появится составляющая тока вдоль оси х. Когда ток течет вверх по спирали, в точке z1 он движется к плоскости рисунка, а в точке z1+A — от плоскости (здесь А — диаметр молекулярной спирали). Казалось бы, x-составляющая тока не дает никакого излучения, потому что на противоположных сторонах витка спирали ток течет в прямо противоположном направлении. Однако если взять x-составляющую электрического поля, приходящего в точку z=z2, мы увидим, что ток в точке z=z1+А и ток в точке z=z1 создают поля в точке z2 с интервалом времени А/с и, следовательно, с разностью фаз π+ωА/с. Поскольку разность фаз в точности не равна π, поля не могут взаимно погаситься и остается небольшая x-компонента электрического поля, вызванная движением электронов в молекуле, хотя первоначальное падающее поле имело только y-компоненту. Складывая малую компоненту по оси х и большую компоненту по оси y, получаем результирующее поле под небольшим углом к оси у (первоначальному направлению поляризации). При движении луча света через среду направление поляризации поворачивается вокруг оси луча. Нарисовав молекулы в разных положениях и определив токи, индуцированные падающим электрическим полем, можно убедиться, что появление оптической активности и направление вращения не зависят от ориентации молекул.
Примером среды, обладающей оптической активностью, является обычная патока. Для демонстрации явления берут поляроид, дающий на выходе линейно поляризованный луч, прозрачный сосуд с патокой и второй поляроид, служащий для определения вращения плоскости поляризации.
§ 6. Интенсивность отраженного света
Рассмотрим здесь количественную зависимость коэффициента отражения от угла падения. На фиг. 33.6, а показан пучок света, падающий на поверхность стеклянной пластинки, от которой он частично отражается, а остальная его часть преломляется и уходит в глубь стекла. Пусть падающий луч имеет единичную амплитуду и линейно поляризован перпендикулярно плоскости рисунка. Обозначим амплитуду отраженной волны буквой b, а амплитуду преломленной —буквой а. Отраженная и преломленная волны будут, разумеется, линейно поляризованы, а направления электрического поля в падающей, отраженной и преломленной волнах параллельны друг другу.
Фиг. 33.6. Падающая волна единичной амплитуды отражается и преломляется на поверхности стекла. а — падающая волна поляризована по нормали к плоскости страницы; б — падающая волна поляризована в направлении, указанном пунктирной стрелкой.
На фиг. 33.6,б показана подобная же ситуация, но в предположении, что падающий луч поляризован в плоскости рисунка. Здесь через В и А обозначены соответственно амплитуды отраженной и преломленной волн.
Мы хотим вычислить интенсивности отраженного луча в обоих случаях, приведенных на фиг. 33.6. Как мы уже знаем, в случае, показанном на фиг. 33.6, б, отраженной волны не возникает, если угол между отраженным и преломленным лучами прямой, но нам хотелось бы получить количественный результат — точную формулу для амплитуд В и b как функций угла падения i. Полезно усвоить следующий принцип. Индуцированные в стекле токи генерируют две волны. Прежде всего они создают волну отражения. Далее, если бы в стекле токов не было, падающая волна прошла бы его насквозь, не меняя направления. Вспомним, что все заряды во Вселенной создают некое результирующее поле. Источник, создавший падающий пучок, дает поле единичной амплитуды, которое само по себе должно было бы проходить внутрь стекла по пунктирной линии (см. фиг. 33.6). Но это поле внутри стекла не наблюдается, а, следовательно, токи, возбуждаемые в стекле, должны излучать поле с амплитудой -1 вдоль той же пунктирной линии. Это позволяет вычислить амплитуды преломленных волн а и А.
Из фиг. 33.6, а видно, что поле с амплитудой b создается движением зарядов стекла, а внутри стекла это же движение дает поле с амплитудой а; следовательно, амплитуда b пропорциональна амплитуде а. Далее, если отвлечься от направления поляризации, можно было бы предположить, что отношение В/А равно отношению b/a, так как обе схемы на фиг. 33.6 можно считать одинаковыми. На самом деле это не совсем правильно, потому что на фиг. 33.6, б в отличие от ситуации, изображенной на фиг. 33.6, а, направления поляризаций не параллельны друг другу. В создании амплитуды В эффективно участвует только компонента А, параллельная В, т. е. Acos(i+r). Правильное соотношение пропорциональности выглядит поэтому так:
(33.1)
Теперь немного схитрим. Как мы знаем, на обоих рисунках фиг. 33.6 электрическое поле в стекле вызывает движение зарядов, которое генерирует поле с амплитудой, равной -1, поляризованное точно так же, как и в падающем луче, и распространяющееся вдоль пунктирной линии. Но из фиг. 33.6, б видно, что только перпендикулярная пунктирной линии компонента А дает полю необходимую поляризацию, тогда как на фиг. 33.6,а в создании поля на пунктирной линии эффективно участвует вся амплитуда а, поскольку ее поляризация параллельна поляризации поля с амплитудой -1. Следовательно, справедливо соотношение
(33.2)
так как обе амплитуды в левой части (33.2) создают волны с амплитудой -1.
Разделив (33.1) на (33.2), получаем
(33.3)
Проверим правильность этого результата на уже известном нам факте. Положив (i+r)=90°, из (33.3) получим B=0, что и было найдено в свое время Брюстером; таким образом, наш результат по крайней мере не содержит очевидной ошибки.
По предположению падающая волна имеет единичную амплитуду; тогда |B|2/12 есть коэффициент отражения лучей, поляризованных в плоскости падения, а |b|2/12 — коэффициент отражения лучей, поляризованных перпендикулярно плоскости падения. Отношение этих двух коэффициентов определяется с помощью формулы (33.3).
А теперь сотворим чудо и вычислим не только отношение, но и каждый коэффициент |В|2 и |b|2 в отдельности! Из закона сохранения энергии вытекает, что энергия преломленной волны должна быть равна энергии падающей волны минус энергия отраженной волны, т. е. 1-|В|2 в одном случае и 1-|b|2 —в другом. Более того, энергия света, прошедшего внутрь стекла в случае, показанном на фиг. 33.6, а, и такая же энергия в случае фиг. 33.6, б относятся как квадраты амплитуд преломленных волн: |A|2/|а|2. Возникает вопрос, возможно ли вычислить энергию волны в стекле, если кроме энергии электрического поля, вообще говоря, имеется и энергия движения атомов. Однако ясно, что любой вклад в полную энергию должен быть пропорционален квадрату амплитуды электрического поля. Следовательно,
(33.4)
Подставим сюда соотношение (33.2) и исключим A/a в написанном выражении, а величину В выразим через b с помощью формулы (33.3):
(33.5)
Здесь неизвестной величиной остается только b. Разрешая уравнение относительно |b|2, получаем
(33.6)
и, воспользовавшись (33.3), находим
(33.7)
Таким образом, мы нашли коэффициент отражения |b|2 для падающей волны, поляризованной перпендикулярно плоскости падения, и коэффициент отражения |B|2 для волны, поляризованной в плоскости падения!
Используя подобные приемы доказательства, можно пойти дальше и вывести, что b действительно. Для доказательства рассмотрим случай, когда свет приходит одновременно с обеих сторон поверхности стекла (ситуация, трудно осуществимая на опыте, но забавная в теоретическом отношении). Анализируя этот общий случай, можно убедиться в действительности величины b, откуда следует, что b=±sin(i-r)/sin(i+r). Если взять очень тонкий слой, в котором отражение происходит от обеих поверхностей, и вычислить интенсивность отраженного света, то можно установить даже знак b. Доля света, отраженного тонким слоем, нам известна, поскольку мы знаем ток, генерируемый в таком слое, и даже получили формулу для поля, создаваемого током. Эти аргументы приводят к соотношениям
(33.8)
Формулы (33.8) для коэффициентов отражения как функций углов падения и преломления называются формулами Френеля.
В пределе, когда углы i и r стремятся к нулю, т. е. в случае падения по нормали, мы получаем В2≈b2≈(i-r)2/(i+r)2 для обеих поляризаций, поскольку и синусы, и тангенсы в этих условиях практически равны углам. Но, как мы уже знаем, sini/sinr=n, а для малых углов i/r≈n. Отсюда совсем просто вывести, что коэффициент отражения в случае падения по нормали равен
Интересно вычислить, например, коэффициент отражения для воды. В этом случае n=4/3 и коэффициент отражения равен (1/7)2≈2%. При падении лучей по нормали к поверхности от воды отражается только 2% всей энергии.
§ 7. Аномальное преломление
Последним рассмотрим поляризационное явление, которое исторически было обнаружено самым первым,— аномальное преломление света. Моряки, побывавшие в Исландии, привозили в Европу кристаллы исландского шпата (СаСО3), которые обладали тем забавным свойством, что рассматриваемые сквозь них предметы как бы двоились, т. е. получалось два изображения предмета. Это явление привлекло внимание Гюйгенса и сыграло важную роль в открытии поляризации света. Как часто бывает, найденные раньше других явления оказываются в конечном счете наиболее трудными для объяснения. Обычно лишь после того, как физическая идея становится понятной в мельчайших подробностях, можно подобрать явления, иллюстрирующие эту идею наиболее просто и наглядно.
Аномальное преломление представляет собой частный случай уже изученного нами явления двойного лучепреломления. Аномальное преломление возникает тогда, когда оптическая ось, т.е. большая ось асимметричных молекул, не параллельна поверхности кристалла.
На фиг. 33.7 изображены два двоякопреломляющих кристалла и показано направление оптической оси. На верхнем рисунке падающий луч линейно поляризован в направлении, перпендикулярном оптической оси кристалла. Когда луч попадает на поверхность кристалла, каждая точка поверхности служит источником новой волны, распространяющейся внутрь кристалла со скоростью v┴ (скоростью света в кристалле, поляризация которого перпендикулярна направлению оптической оси). Волновой фронт представляется просто огибающей всех этих маленьких сферических волн, он движется прямо сквозь кристалл. Такое поведение света считается обычным, а соответствующий луч называется обыкновенным лучом.
Фиг. 33.7. Путь обыкновенного луча (вверху) и путь необыкновенною луча (внизу) в ввоякопреломляющем кристалле. Оптическая ось лежит в плоскости страницы.
На нижнем рисунке фиг. 33.7 поляризация падающего луча повернута на 90°, так что оптическая ось лежит в плоскости поляризации. Рассмотрим теперь маленькие волны, идущие от поверхности кристалла; они уже не сферические, как в предыдущем случае. Свет вдоль оптической оси движется со скоростью v┴, потому что поляризация перпендикулярна оптической оси, а свет, движущийся перпендикулярно оси, распространяется со скоростью v║ поскольку поляризация и оптическая ось параллельны. В двоякопреломляющем материале v║≠v┴, и на нашем рисунке выбран случай v║<v┴. Более подробный анализ показывает, что волны у поверхности кристалла имеют форму эллипсоидов, большая ось которых совпадает с оптической осью кристалла. Огибающая этих эллиптических волн — волновой фронт — движется через кристалл, как показано на нижнем рисунке фиг. 33.7. У задней поверхности кристалла луч отклоняется на тот же угол, что и у передней, и выходит параллельно падающему лучу, сместившись на некоторое расстояние. Совершенно очевидно, что этот луч не подчиняется закону Снелла и движется довольно необычно. Поэтому его называют необыкновенным лучом.
Если на аномально преломляющий кристалл направить неполяризованный пучок света, он разделится на два луча: обыкновенный, движущийся прямо через кристалл по обычным законам, и необыкновенный, который, пройдя через кристалл, смещается относительно падающего луча. Оба прошедших через кристалл луча линейно поляризованы перпендикулярно друг другу. Этот факт легко установить опытным путем, используя поляроид для определения поляризации вышедших из кристалла лучей света. Можно также подтвердить правильность нашей интерпретации, посылая на кристалл линейно поляризованный луч. Выбирая нужную ориентацию поляризации падающего пучка, мы в одном случае увидим луч, прошедший прямо сквозь кристалл, а в другом — единственный сместившийся луч.
На фиг. 33.1 и 33.2 были представлены самые разные поляризации в виде суперпозиции двух основных, а именно поляризаций по осям х и у с разными амплитудами и фазами. Вместо них можно выбрать и другие пары основных поляризаций. Один из возможных примеров представляют собой поляризации по двум перпендикулярным осям х' и y', повернутым относительно х и у (можно также любую поляризацию представить как суперпозицию случаев а и д на фиг. 33.2). Оказывается, эту мысль можно еще продолжить. Например, любую линейную поляризацию можно представить в виде суперпозиции правой и левой круговой поляризации с соответствующими амплитудами и фазами (случаи в и ж на фиг. 33.2), поскольку два равных вектора, вращающихся в разные стороны, при сложении дают вектор, осциллирующий вдоль прямой линии (фиг. 33.8).
Фиг. 33.8. Два вектора одной длины, вращающиеся в противоположные стороны, дают при сложении вектор, направление которого не меняется, а амплитуда осциллирует.
Если фазы вращающихся векторов разные, прямая будет наклонена. Таким образом, все графики фиг. 33.1 можно назвать «суперпозициями равного количества право- и левополяризованного света при разных сдвигах фаз». Когда левополяризованный свет отстает по фазе от правополяризованного, направление линейной поляризации меняется. Поэтому оптически активные среды можно в некотором смысле назвать двоякопреломляющими. Свойство оптической активности можно характеризовать и по-другому, говоря, что такие среды имеют разные показатели преломления для света правой и левой круговой поляризации. Суперпозиция право- и левополяризованного света с разными амплитудами дает эллиптически поляризованный свет.
Свет с круговой поляризацией обладает интересным свойством — он переносит момент количества движения (взятый относительно направления луча). Чтобы пояснить это утверждение, предположим, что поляризованный по кругу свет падает на атом, который представляет собой гармонический осциллятор, способный колебаться в любом направлении в плоскости ху. Тогда смещение электрона по оси х отвечает компоненте поля Еx, а смещение по оси у отвечает компоненте Еу, равной по величине, но отстающей по фазе на 90°. Это означает, что электрон под действием вращающего электрического поля световой волны (фиг. 33.9) будет двигаться по окружности с угловой скоростью ω.
Фиг. 33.9. Действие света с круговой поляризацией на вращающийся заряд.
Направление вектора смещения электрона а в зависимости от восприимчивости осциллятора к действующей на него силе не обязательно совпадает с направлением силы qеЕ, но тем не менее оба вектора вращаются одновременно друг с другом. Напряженность поля Е, вообще говоря, имеет компоненту, перпендикулярную смещению электрона а, так что над системой совершается работа, а кроме того на нее действует крутящий момент τ. Работа, которую он совершает в 1 сек, равна τω. За период Т системе передается энергия τωТ, причем τТ есть момент количества движения, поглощаемый вместе с энергией излучения. Мы видим, таким образом, что луч света правой круговой поляризации, энергия которого равна ℰ, переносит момент количества движения (вектор которого лежит вдоль направления распространения луча), равный по величине ℰ/ω. Действительно, если луч правополяризованного света поглощается веществом, поглотителю передается порция момента количества движения, равная ℰ/ω. Левополяризованный свет несет момент противоположного знака, т. е. -ℰ/ω.
Глава 34 РЕЛЯТИВИСТСКИЕ ЯВЛЕНИЯ В ИЗЛУЧЕНИИ
§ 1. Движущиеся источники
В этой главе мы расскажем еще о ряде эффектов, связанных с излучением, и на этом закончим изложение классической теории света. Проведенный нами в предыдущих главах анализ световых явлений был достаточно полным и подробным. Однако мы не коснулись одного важного в приложениях процесса электромагнитного излучения — мы не исследовали поведения радиоволн в ящике с отражающими стенками размером порядка длины волны или радиоволн, пропускаемых через длинную трубу. Явления, возникающие в так называемых полых резонаторах и волноводах, мы обсудим позднее, причем прежде мы их проиллюстрируем на другом физическом примере — на примере звука. А в остальном изучение классической теории света заканчивается этой главой.
Для всех эффектов, о которых здесь пойдет речь, характерно то, что они связаны с движением источника. Мы не будем больше предполагать, что смещение источника незначительно и его движение происходит с относительно малой скоростью возле фиксированной точки.
Вспомним, что, согласно основным законам электродинамики, электрическое поле на больших расстояниях от движущегося заряда дается формулой
(34.1)
Определяющей величиной здесь является вторая производная единичного вектора еR, направленного к кажущемуся положению заряда. Единичный вектор характеризует положение заряда, конечно, не в тот же момент времени, а то место, где находился бы заряд, если учесть конечную скорость передачи информации от заряда к наблюдателю.
Вместе с электрическим полем возникает магнитное поле, направленное всегда перпендикулярно электрическому и кажущемуся положению заряда. Оно дается формулой
(34.2)
Мы рассматривали до сих пор случай нерелятивистских скоростей, когда движением в направлении источника можно было пренебречь. Обратимся теперь к общему случаю произвольных скоростей и посмотрим, какие эффекты возникают в этих условиях. Итак, пусть движение происходит с любой скоростью, но расстояние от детектора до источника по-прежнему велико.
В гл. 28 мы уже говорили, что в производную d2eR'/dt2 входит только изменение направления еR'. Пусть заряд находится в точке с координатами (x, y, z) и ось z лежит вдоль линии наблюдения (фиг. 34.1).
Фиг. 34.1. Траектория движущегося заряда. Истинное положение в момент времени τ есть Т, положение при учете запаздывания есть А.
В данный момент времени τ координаты заряда есть x(τ), y(τ) и z(τ)- Расстояние R с большой точностью равно R(τ)=R0+z(τ). Направление вектора еR' зависит главным образом от х и у и почти совсем не зависит от z. Поперечные компоненты единичного вектора равны x/R и y/R; дифференцируя их, мы получаем члены, содержащие R2 в знаменателе:
Таким образом, на достаточно больших расстояниях существенны только члены с производными х и у. Отсюда
(34.3)
где R0 примерно равно расстоянию до заряда q; определим его как расстояние OP до начала координат (x, y, z). Итак, электрическое поле равно константе, умноженной на очень простую величину — производную координат х и у по t. (Математически можно назвать их поперечными компонентами вектора положения заряда r, но ясности от этого не прибавится.)
Конечно, нужно всегда помнить, что координаты берутся не в момент наблюдения, а с учетом запаздывания. В данном случае запаздывание зависит и от z(τ). Чему равно время запаздывания? Обозначим время наблюдения через t (это время в точке наблюдения Р), тогда время τ, которое в точке А соответствует времени t, не будет совпадать с t, а отстает от него на промежуток времени, необходимый свету, чтобы пройти все расстояние от заряда до точки наблюдения. В первом приближении время запаздывания равно R0/c, т. е. постоянной (что неинтересно), а в следующем приближении должно зависеть от z-координаты положения заряда в момент τ, потому что для заряда q, сдвинутого немного назад, запаздывание увеличивается. Этим эффектом мы раньше пренебрегали, если теперь учесть его, то мы получим формулу, пригодную для любых скоростей.
Нам остается выбрать определенное значение t, вычислить с его помощью τ и найти х и у в момент времени τ. Запаздывающие значения х и у обозначим через х' и y', вторые производные от них определяют поле. Итак, τ определяется из уравнений
и
(34.4)
Эти уравнения довольно сложны, но их решение легко получить геометрическим путем. Чертеж даст вам возможность качественно почувствовать, как возникают соотношения, хотя для вывода точных результатов понадобится преодолеть еще немало математических сложностей.
§ 2. Определение «кажущегося» движения
Написанное выше уравнение можно упростить довольно интересным способом. Опустим неинтересный для нас постоянный член R0/c (это означает только, что мы изменяем начало отсчета времени t на постоянный отрезок) и запишем
(34.5)
Нам нужно найти х' и у' как функции t, а не τ, и это достигается следующим образом: как подсказывает уравнение (34.5), нужно взять истинное движение заряда и добавить время τ, умноженное на константу (скорость света). На фиг. 34.2 показано, что это означает.
Фиг. 34.2. Геометрический способ определения x'(t) из уравнения (34.5.).
Возьмем истинную траекторию заряда (показанную слева) и представим себе, что по мере движения заряд удаляется от точки Р со скоростью с (здесь нет каких-либо релятивистских сокращений и подобных вещей; это просто математическое добавление cτ). Таким путем получится новая траектория, где по оси абсцисс отложено ct, как показано на рисунке справа. (На рисунке изображена траектория довольно сложного движения в плоскости, но движение может происходить не только в плоскости.) Смысл приведенной процедуры состоит в том, что горизонтальное расстояние в правой части фиг. 34.2 в отличие от левой оказывается равным не z, а z+cτ, т. е. ct. Мы нашли, таким образом, график изменения х' (и у') в зависимости от t! Осталось только определить ускорение на кривой, т. е. продифференцировать ее дважды. Отсюда окончательно заключаем: чтобы найти электрическое поле движущегося заряда, нужно взять траекторию движения и заставить двигаться каждую ее точку от точки наблюдения со скоростью с; полученная кривая дает положения х' и у' как функцию t. Ускорение на этой кривой определит электрическое поле в зависимости от t. Можно, если угодно, представить себе, что вся эта «твердая» кривая движется вперед со скоростью с сквозь плоскость зрения, так что точка пересечения с плоскостью зрения имеет координаты х' и у'. Ускорение этой точки и определит электрическое поле! Полученное решение будет не менее точно, чем формула, из которой мы исходили,— это просто ее геометрическое представление.
Если источник совершает относительно медленное движение, как, например, медленно колеблющийся вверх и вниз осциллятор, то при растягивании этого движения со скоростью света получится простая синусоидальная кривая. Отсюда можно получить формулу для поля, создаваемого осциллирующим зарядом, которую мы видели неоднократно.
Более интересный пример — это электрон, движущийся по окружности со скоростью, близкой к скорости света. Если наблюдатель находится в плоскости движения электрона, запаздывающее движение x'(t) имеет для него вид, изображенный на фиг. 34.3. Что это за кривая?
Фиг. 34.3. Кривая зависимости х'(t) для частицы, вращающейся по окружности с постоянной скоростью v=0,94c.
Если мы представим себе радиус-вектор, проведенный из центра окружности к заряду, и если мы продолжим эти радиальные линии чуть-чуть за заряд (совсем капельку, если заряд движется быстро), то мы придем к точке, которая движется со скоростью света с. Поэтому результирующее движение есть движение заряда, прикрепленного к колесу, которое катится назад (без скольжения) со скоростью с; это дает нам кривую, очень похожую на циклоиду, называется она гипоциклоидой.
Когда заряд движется по окружности со скоростью, близкой к скорости света, пики на кривой становятся очень острыми, а при скорости, равной скорости света, они были бы бесконечно острыми. «Бесконечно острые» пики! Очень интересно; это значит, что вблизи такого пика вторая производная очень велика. Один раз в течение каждого периода возникает мощный и резкий импульс электрического поля. Ничего похожего в случае нерелятивистского движения не бывает, там электрическое поле в течение всего периода принимает значения примерно одного и того же порядка. Вместо этого в случае больших скоростей там возникают резкие импульсы электрического поля с интервалом времени 1/Т0, где Т0 — период обращения. Это сильное электрическое поле излучается в узком конусе около направления движения заряда. Когда же заряд удаляется от точки наблюдения Р, производная кривой мала и излучение в направлении Р очень слабое.
§ 3. Синхротронное излучение
В синхротроне электроны движутся по окружности с большими скоростями, близкими к скорости света, и описанное излучение можно увидеть как настоящий свет! Обсудим это явление более подробно.
Электроны в синхротроне движутся по окружности в однородном магнитном поле. Давайте установим прежде всего, почему они движутся по окружности. Согласно уравнению (12.10), сила, действующая на частицу в магнитном поле, равна
(34.6)
и направлена перпендикулярно полю и скорости. Как обычно, сила равна скорости изменения импульса со временем. Если поле направлено вверх от плоскости страницы, импульс и сила располагаются так, как показано на фиг. 34.4.
Фиг. 34.4. Движение заряженной частицы в однородном магнитном поле по окружности (или по спирали).
Поскольку сила перпендикулярна скорости, кинетическая энергия, а значит, и абсолютная величина скорости остаются постоянными. Действие магнитного поля сводится только к изменению направления движения. За малый промежуток времени Δt вектор импульса изменится на величину Δр=F·Δt, направленную перпендикулярно импульсу, т. е. вектор импульса р повернется на угол Δθ=Δр/р=qvBΔt/p, так как |F|=qv·|В|. Но за то же время электрон пройдет расстояние Δs=vΔt. Две прямые, АВ и CD, очевидно, пересекутся в точке О, для которой ОА=ОС=R, причем Δs=RΔθ. Комбинируя написанные формулы, мы получаем RΔθ/Δt=Rω=v=qvBR/p, откуда
(34.7)
(34.8)
Мы можем повторить это рассуждение в любой последующий промежуток времени и придем, таким образом, к заключению, что частица в магнитном поле должна двигаться по окружности, имеющей радиус R, с угловой скоростью ω.
Равенство (34.7), выражающее импульс через произведение заряда, радиуса и магнитного поля, представляет собой очень важный закон, находящий весьма широкое применение. Он имеет большое практическое значение, потому что при наблюдении движения частиц с одинаковыми зарядами в магнитном поле позволяет измерить радиусы кривизны траекторий; зная, кроме того, величину магнитного поля, можно определить, таким образом, импульсы частиц. Умножив обе части (34.7) на с и выразив заряд q через заряд электрона, мы получаем формулу для импульса в единицах электронвольт (эв):
(34.9)
Здесь В, R и скорость света определены в системе единиц СИ, скорость света в этой системе равна численно 3·108.
Единица измерения магнитного поля в системе СИ называется вебер на метр квадратный. Часто употребляют более старую единицу — гаусс (гс). Один вебер/м2 равен 104 гс. Чтобы дать представление о величине магнитных полей, приведем некоторые цифры. Самое сильное магнитное поле, которое можно создать в железе, порядка 1,5·104 гс; при больших полях использовать железо становится невыгодным. В настоящее время электромагниты с обмоткой из сверхпроводящей проволоки позволяют получать постоянное поле напряженностью свыше 105 гс, т. е. 10 ед. СИ. Напряженность магнитного поля Земли у экватора составляет несколько десятых гаусса.
Обратимся снова к формуле (34.9) и возьмем для примера синхротрон, который разгоняет частицы до миллиарда электрон-вольт, т. е. дает частицы с рс, равным 109 эв (ниже мы определим и энергию частиц). Пусть В=104 гс, или 1 ед. СИ, т. е. поле достаточно сильное, тогда R оказывается равным 3,3 м. Синхротрон КАЛТЕХа имеет радиус 3,7 м, поле чуть больше взятого нами, а энергию 1,5 млрд. эв (или Гэв), т. е. порядок всех величин тот же самый. Теперь становится понятным, почему синхротроны имеют такие размеры.
Выше мы брали импульс частиц; полная же энергия, включающая энергию покоя, дается формулой W=√(р2с2+m2с4). Энергия покоя электрона mс2 равна 0,511·106 эв, поэтому при импульсе рс — 109 эв можно пренебречь величиной m2с4 и для всех практических целей пользоваться формулой W=рс, справедливой в случае релятивистских скоростей. Фактически нет никакой разницы, когда мы говорим, что энергия электрона равна 1 Гэв или что импульс электрона, умноженный на с, равен 1 Гэв. Когда W=109 эв, то, как легко показать, скорость частицы равна скорости света с точностью до одной восьмимиллионной!
Теперь вернемся к излучению, испускаемому такой частицей. Двигаясь по окружности с радиусом 3,3 м и длиной 20 м,частица делает один оборот примерно за то же время, за которое свет проходит 20 м. Поэтому длина волны испускаемого излучения, казалось бы, равна 20 м, т. е. лежит в области коротких радиоволн. Но, как мы уже говорили, возникают пики излучения (см. фиг. 34.3) и из-за того, что скорость электрона отличается от скорости света с на одну восьмимиллионную, ширина пиков пренебрежимо мала по сравнению с расстоянием между ними. Ускорение, определяемое второй производной по времени, приводит к появлению «фактора сокращения» 8·106 в квадрате, потому что масштаб времени уменьшается в 8·106 раз в области пика и входит он дважды. Поэтому эффективная длина волны должна быть в 64·1012 раз меньше 20 м, что соответствует уже области рентгеновских лучей. (На самом деле эффект определяется значением не в самом пике, а некоторой областью около пика. Это дает вместо квадрата степень 3/2, но все равно приводит к длинам волн, несколько меньшим, чем в видимом свете.) Итак, если даже медленно движущийся электрон излучает радиоволны длиной порядка 20 м, то релятивистские эффекты сокращают длину волны настолько, что мы можем увидеть излучение! Очевидно, свет должен быть поляризован перпендикулярно однородному магнитному полю.
Предположим далее, что мы направили подобный пучок света (импульсы излучения возникают через большие промежутки времени, так что для простоты возьмем один такой импульс) на дифракционную решетку, состоящую из множества рассеивающих линий. Какая картина возникнет после прохождения излучения через решетку? (Казалось бы, мы должны увидеть красные, синие полосы света и т. д., если вообще мы будем видеть свет.) А что мы увидим на самом деле?
Импульс излучения попадает прямо на решетку, и все осцилляторы на линиях решетки начинают одновременно бешено колебаться туда и обратно. При этом они излучают в разных направлениях, как показано на фиг. 34.5.
Фиг. 34.5, Падающий на решетку импульс света в форме острого пика после отражения дает в разных направлениях лучи различной окраски.
Но точка Р расположена ближе к одному концу решетки, и поэтому излучение попадает в нее сначала от А, потом от В и т. д., наконец, последним приходит импульс от самой крайней линии. В итоге совокупность всех отраженных волн принимает такой вид, как показано на фиг. 34.6,а.
Фиг. 34.6. Суммарное электрическое поле от совокупности острых импульсов (а) и импульсов гладкой формы (б).
Это электрическое поле, состоящее из целого ряда импульсов, очень походит на синусоидальную волну, причем длина волны есть расстояние между соседними импульсами, точь-в-точь как у монохроматической волны, падающей на дифракционную решетку! Таким образом, мы действительно увидим свет окрашенным. Но те же аргументы, казалось бы, позволяют думать, что «импульсы» любой формы создадут видимый свет. Нет, это не так. Предположим, что пики гораздо более гладкие; давайте снова сложим все рассеянные волны, разделенные небольшими временными интервалами (фиг. 34.6,б). Тогда мы увидим, что поле почти не испытывает колебаний и представляет собой весьма гладкую кривую, потому что каждый импульс мало меняется за промежуток времени между приходом двух соседних рассеянных волн.
Электромагнитное излучение, испускаемое релятивистской заряженной частицей, которая вращается в магнитном поле, называется синхротронным излучением. Происхождение этого названия очевидно, хотя такое излучение возникает не только в синхротронах и даже не только в условиях Земли. Весьма интересно и увлекательно то, что оно возникает и во Вселенной!
§ 4. Космическое синхротронное излучение
К 1054 г. нашей эры китайская и японская цивилизации были одними из самых передовых в мире: китайцы и японцы уже тогда следили за явлениями во Вселенной, и в этот самый год они зафиксировали замечательное событие — внезапное появление яркой звезды. (Любопытно, что ни один из европейских монахов, которые написали в средние века столько книг, и не подумал отметить это событие.) Как выглядит родившаяся звезда в настоящее время, показано на фиг. 34.7.
Фиг. 34.7. Крабовидная туманность. Снято без фильтра.
Снаружи видно большое количество красных нитей, которые создаются атомами тонкой газовой оболочки, излучающими при своих собственных частотах; спектр излучения состоит из ярких отдельных линий. Красный цвет обязан своим появлением азоту. А вот в центре светится странное размазанное пятно, излучающее в непрерывном спектре частот, т. е. частоты, свойственные разным атомам, никак не выделены. Пятно это — вовсе не облако пыли, отражающее свет от соседних звезд, что могло бы тоже привести к непрерывному спектру излучения. Сквозь это образование можно увидеть звезды, значит, оно прозрачное и само излучает свет.
На фиг. 34.8 показан тот же объект, но теперь снятый в лучах участка спектра, где нет ярких линий, т. е. фактически видна только центральная часть.
Фиг. 34.8. Крабовидная туманность. Снято через синий фильтр и поляроид, а — электрический вектор направлен вертикально; б — электрический вектор направлен по горизонтали.
Кроме того, снимки делались через поляризатор, и два представленных снимка соответствуют двум взаимно перпендикулярным ориентациям поляризатора. Легко заметить, что снимки разные! Таким образом, приходящий к нам свет поляризован. Причина этого эффекта предположительно состоит в том, что в туманности имеется местное магнитное поле, где крутится множество очень быстрых электронов.
Мы только что объяснили, каким образом электроны движутся в поле по окружности. Если к этому движению добавить любое равномерное движение в направлении поля, излучение поля не изменится, поскольку сила qv×В не имеет компоненты вдоль поля, а синхротронное излучение (как мы уже отмечали) всегда поляризовано под прямым углом к направлению проекции магнитного поля на плоскость зрения.
Сопоставляя оба эти факта, мы видим, что на участке, где один снимок светлый, а другой темный, электрическое поле света должно быть полностью поляризовано в одном направлении. Это значит, что перпендикулярно указанному направлению имеется магнитное поле, а в тех участках, где второй снимок имеет светлое пятно, магнитное поле направлено по-другому. При внимательном изучении фиг. 34.8 можно заметить, что здесь имеется, грубо говоря, ряд «линий», идущих в одном направлении на первом снимке и в перпендикулярном к нему направлении на втором снимке. Изображения имеют как бы волокнистую структуру. Можно думать, что магнитные силовые линии продолжаются довольно далеко в одном и том же направлении и поэтому, вероятно, возникают вытянутые участки магнитного поля, где электроны закручиваются в одном направлении, а в областях с другим направлением поля электроны закручиваются по-иному.
Почему энергия электронов остается большой столь долгое время? Ведь с момента взрыва прошло уже 900 лет; как же получилось, что электроны крутятся все так же быстро? Причина такой продолжительности всего процесса в целом и сохранения электронами их большой энергии, в частности, до сих пор еще не совсем понятна.
§ 5. Тормозное излучение
Мы кратко расскажем еще об одном интересном эффекте, связанном с излучением быстродвижущейся частицы. По существу, этот процесс очень похож на только что описанное излучение. Предположим, что имеется материал, содержащий заряженные частицы и мимо пролетает очень быстрый электрон (фиг. 34.9).
Фиг. 34.9. Быстрый электрон, пролетающий вблизи от ядра, излучает в направлении своего движения.
Тогда под действием электрического поля ядра электрон будет притягиваться и ускоряться, и на траектории появится изгиб. Чему будет равно излучение электрического поля в направлении С, если скорость электрона близка к скорости света? Вспомним наше правило: мы должны взять истинное движение, перенести его назад со скоростью с, и тогда мы получим кривую, производная которой определяет электрическое поле. Электрон примчался к нам со скоростью v, следовательно, при переносе получается обратное движение и вся траектория сожмется во столько раз, во сколько с—v меньше с. Таким образом, при 1-v/c≪1 кривизна кажущейся траектории в точке В' очень велика, и, взяв вторую производную, мы получаем мощное излучение в направлении движения. Следовательно, при прохождении через среду электроны большой энергии излучают вперед. Это явление называется тормозным излучением. На практике синхротроны используются не столько для получения электронов большой энергии (возможно, если бы их лучше умели выводить из синхротрона, мы бы этого не стали говорить), сколько для рождения энергичных фотонов, или γ~квантов в процессе прохождения электронов через плотные мишени, где они испускают тормозное излучение.
§ 6. Эффект Допплера
Рассмотрим теперь ряд других эффектов, связанных с движением источника. Пусть источник представляет собой покоящийся атом, колеблющийся со своей обычной частотой ω0. Частота наблюдаемого света тогда будет равна ω0. Но возьмем другой пример: пусть такой же атом колеблется с частотой ω1 и в то же время весь атом, весь осциллятор как целое движется со скоростью v по направлению к наблюдателю. Тогда истинное движение в пространстве будет таким, как изображено на фиг. 34.10,а.
Фиг, 34.10. Движение осциллятора в плоскости х—z и в плоскости x'—t.
Используем наш обычный прием и добавим сτ, т. е. сместим всю кривую назад и получим колебания, представленные на фиг. 34.10,6. За промежуток времени τ осциллятор проходит расстояние vτ, а на графике с осями х' и у' соответствующее расстояние равно (с-v)τ. Таким образом, число колебаний с частотой ω1, которое укладывалось в интервал Аτ, на новом чертеже укладывается теперь уже в интервал Δτ=(1-v/c) Δτ; осцилляции сжимаются, и, когда новая кривая будет двигаться мимо нас со скоростью с, мы увидим свет более высокой частоты, увеличенной за счет фактора сокращения (1-v/c). Итак, наблюдаемая частота равна
(34.10)
Можно, конечно, объяснить этот эффект и другими способами. Пусть, например, тот же атом испускает не синусоидальную волну, а короткие импульсы (пип, пип, пип, пип) с некоторой частотой ω1. С какой частотой мы будем их воспринимать? Первый импульс к нам придет спустя определенное время, а второй импульс придет уже через более короткое время, потому что атом за это время успел к нам приблизиться. Следовательно, промежуток времени между сигналами «пип» сократился за счет движения атома. Анализируя эту картину с геометрической точки зрения, мы придем к выводу, что частота импульсов увеличивается в 1/(1-v/c) раз.
Будет ли наблюдаться частота ω=ω0/(1-v/c), если атом с собственной частотой ω0 движется со скоростью v к наблюдателю? Нет. Нам хорошо известно, что собственная частота движущегося атома ω1 и частота покоящегося атома ω0 — не одно и то же из-за релятивистского замедления хода времени. Так что если ω0 — собственная частота покоящегося атома, то частота движущегося атома будет равна
(34.11)
Поэтому наблюдаемая частота ω окончательно равна
(34.12)
Изменение частоты, возникающее в таком случае, называется эффектом Допплера: если излучающий объект движется на нас, излучаемый им свет кажется более синим, а если он движется от нас, свет становится более красным.
Приведем еще два других вывода этого интересного и важного результата. Пусть теперь покоящийся источник излучает с частотой ω0, а наблюдатель движется со скоростью v к источнику. За время t наблюдатель сдвинется на новое расстояние vt от того места, где он был при t=0. Сколько радиан фазы пройдет перед наблюдателем? Прежде всего, как и мимо любой фиксированной точки, пройдет ω0t, а также некоторая добавка за счет движения источника, а именно vtk0 (это есть число радиан на метр, умноженное на расстояние).
Отсюда число радиан за единицу времени, или наблюдаемая частота, равно ω1=ω0+k0v. Весь этот вывод был произведен с точки зрения покоящегося наблюдателя; посмотрим, что увидит движущийся наблюдатель. Здесь мы снова должны учесть разницу в течении времени для наблюдателя в покое и движении, а это значит, что мы должны разделить результат на √( 1-v2/с2). Итак, пусть k0 есть волновое число (количество радиан на метр в направлении движения), а ω0 — частота; тогда частота, регистрируемая движущимся наблюдателем, равна
(34.13)
Для света мы знаем, что k0=ω0/c. Следовательно, в рассматриваемом примере искомое соотношение имеет вид
(34.14)
и, казалось бы, не похоже на (34.12)!
Отличается ли частота, наблюдаемая при нашем движении к источнику, от частоты, наблюдаемой при движении источника к нам? Конечно, нет! Теория относительности утверждает, что обе частоты должны быть в точности равны. Если бы мы были достаточно математически подготовлены, то могли бы убедиться, что оба математических выражения в точности равны! В действительности требование равенства обоих выражений часто используется для вывода релятивистского замедления времени, потому что без квадратных корней равенство сразу нарушается.
Раз уж мы начали говорить о теории относительности, приведем еще и третий способ доказательства, который покажется, пожалуй, более общим. (Суть дела остается прежней, ибо не играет роли, каким способом получен результат!) В теории относительности имеется связь между положением в пространстве и временем, определяемым одним наблюдателем, и положением и временем, определяемым другим наблюдателем, движущимся относительно первого. Мы уже выписывали эти соотношения (гл. 16). Они представляют собой преобразования Лоренца, прямые и обратные:
(34.15)
Для неподвижного наблюдателя волна имеет вид cos(ωt-kx); все гребни, впадины и нули описываются этой формой. А как будет выглядеть та же самая физическая волна для движущегося наблюдателя? Там, где поле равно нулю, любой наблюдатель при измерении получит нуль; это есть релятивистский инвариант. Следовательно, форма волны не меняется, нужно только написать ее в системе отсчета движущегося наблюдателя:
Произведя перегруппировку членов, получим
(34.16)
Мы снова получим волну в виде косинуса с частотой ω' в качестве коэффициента при t' и некоторой другой константой k' — коэффициентом при х'. Назовем k' (или число колебаний на 1 м) волновым числом для второго наблюдателя. Таким образом, движущийся наблюдатель отметит другую частоту и другое волновое число, определяемые формулами
(34.17)
(34.18)
Легко видеть, что (34.17) совпадает с формулой (34.13), полученной нами на основании чисто физических рассуждений.
§ 7. Четырехвектор (ω, k)
Соотношения (34.17) и (34.18) обладают весьма интересным свойством: новая частота ω' линейно связана со старой частотой ω и старым волновым числом k, а новое волновое число представляется в виде комбинации старого волнового числа и частоты. Далее, волновое число есть скорость изменения фазы с расстоянием, а частота — скорость изменения фазы со временем, и сами соотношения обнаруживают глубокую аналогию с преобразованиями Лоренца для координаты и времени: если ω сопоставить с t, а k с х/с2, то новое ω' сопоставляется с t', a k' — с координатой х'/с2. Иначе говоря, при преобразовании Лоренца ω и k изменяются так же, как t и х. Эти величины ω и k составляют так называемый четырехвектор. Четырехкомпонентная величина, преобразующаяся как время и координаты, и есть четырехвектор. Здесь все правильно, за исключением одного — четырехвектор имеет четыре компоненты, а у нас фигурируют только две! Как уже говорилось, ω и k подобны времени и одной координате пространства; для введения двух остальных координат надо изучить распространение света в трехмерном пространстве.
Пусть задана система координат x, y, z и волна движется в пространстве с волновым фронтом (фиг. 34.11). Длина волны есть λ, а направление распространения волны не совпадает ни с одной осью координат.
Фиг. 34.11. Плоская волна, движущаяся под углом.
Какой вид имеет формула движения для такой волны? Ответ очевиден: это cos(ωt-ks), где k=2π/ λ a s (расстояние вдоль направления движения волны) — проекция вектора положения на направление движения. Запишем это следующим образом: пусть r есть вектор точки в пространстве, тогда s есть r·еk, где ek — единичный вектор в направлении движения волны. Иначе говоря, s равно rcos(r·ek), проекции расстояния на направление движения. Следовательно, наша волна описывается формулой cos(ωt-kek·r).
Оказывается очень удобным ввести вектор k, называемый волновым вектором; величина его равна волновому числу 2π/λ, а направление совпадает с направлением распространения волны
(34.19)
Благодаря введению этого вектора волна приобретает вид cos(ωt-k·r), или cos(ωt-kxx-kyy-kzz). Выясним смысл проекций k, например kx. Очевидно, kx есть скорость изменения фазы в зависимости от координаты х. Фиг 34.11 подсказывает нам, что фаза меняется с ростом х так, как если бы вдоль х бежала волна, но соответствующая ей длина волны оказывается больше по величине. «Длина волны в направлении х» больше истинной на множитель, равный секансу угла α между осью х и направлением движения истинной волны:
(34.20)
Следовательно, скорость изменения фазы, обратно пропорциональная λx, в направлении х оказывается меньше на множитель cosα; но этот же множитель содержит и kx, равный модулю k, умноженному на косинус угла между k и осью х!
Итак, мы выяснили смысл волнового вектора, описывающего распространение волны в трехмерном пространстве. Четыре величины ω, kx, ky, kz преобразуются в теории относительности как четырехвектор, причем ω соответствует времени, а kx, ky, kz соответствуют x, y и z и компонентам четырехвектора.
Еще раньше, когда мы занимались теорией относительности (гл. 17), мы выяснили, что из четырехвекторов можно составить релятивистское штрихованное произведение. Взяв вектор положения xμ (где μ нумерует четыре компоненты — время и три пространственные) и волновой вектор kμ (где μ снова пробегает четыре значения), образуем штрихованное произведение хμ и kμ, записываемое в виде ∑'kμ хμ. Это произведение есть инвариант, не зависящий от выбора системы координат. Согласно определению штрихованного произведения, можно записать ∑'kμхμ. следующем виде:
(34.21)
Поскольку kμ есть четырехвектор, то, как мы уже знаем, ∑'kμxμ есть инвариант по отношению к преобразованиям Лоренца. Под знак косинуса в нашей формуле для плоской волны входит именно это произведение, и оно обязано быть инвариантом относительно преобразований Лоренца. У нас не может появиться формула, у которой под знаком косинуса стоит неинвариантная величина, потому что мы знаем, что значение фазы не зависит от выбора системы координат.
§ 8. Аберрация
При выводе формул (34.17) и (34.18) мы взяли простой пример, когда k лежит в направлении движения системы координат; но мы можем обобщить теперь эти формулы на другие возможные случаи. Пусть источник посылает луч света в определенном направлении; это направление фиксируется неподвижным наблюдателем, а мы движемся, скажем, по поверхности Земли в горизонтальном направлении (фиг. 34.12,а).
Фиг, 34.12. Удаленный источник света S. а — наблюдаемый через неподвижный телескоп; б — наблюдаемый через телескоп, движущийся в боковом направлении.
В каком направлении падает луч света с нашей точки зрения? Можно получить ответ, записав четыре компоненты kμ и совершив преобразования Лоренца. Но можно воспользоваться и следующим рассуждением: чтобы увидеть луч, следует наш телескоп повернуть на некоторый угол (фиг. 34.12, б). Почему? Потому что свет падает сверху со скоростью с, а мы движемся горизонтально со скоростью v, и свет пройдет «прямо» через телескоп, если последний наклонить на некоторый угол. Легко понять, что расстояние по горизонтали равно vt, а по вертикали ct, и, обозначив угол наклона через θ', мы получим tgθ'=v/c. Замечательно! В самом деле, замечательно, если бы не одна маленькая деталь: θ' не есть тот угол, под которым надо установить телескоп по отношению к поверхности Земли, потому что наш анализ проводился с точки зрения неподвижного наблюдателя.
Горизонтальное расстояние, которое мы считали равным vt, неподвижный по отношению к Земле наблюдатель найдет равным совсем другой величине, так как он пользуется, с нашей точки зрения, «сжатой» линейкой. Из-за эффекта сокращения возникает совсем другое соотношение:
(34.22)
что эквивалентно
(34.23)
Полезно вам самим получить это соотношение с помощью преобразования Лоренца.
Описанный выше эффект кажущегося изменения направления луча называется аберрацией и обнаружен на опыте. Казалось бы, как он может проявиться? Ведь никто не знает, где на самом деле расположена звезда. Пусть мы действительно смотрим на звезду в неправильном, кажущемся направлении, откуда нам известно, что оно неправильное? Известно; потому, что Земля обращается вокруг Солнца. Сегодня мы устанавливаем телескоп под одним углом, а через шесть месяцев мы должны его уже повернуть. Вот откуда мы знаем о существовании этого эффекта.
§ 9. Импульс световой волны
Займемся теперь другим вопросом. В прошлых главах мы ни разу не говорили о магнитном поле световой волны. Обычно эффекты, связанные с магнитным полем, очень малы, однако есть один интересный и важный эффект, возникающий под влиянием магнитного поля. Пусть имеется луч света, посылаемый каким-то источником, который действует на заряд и заставляет его колебаться вверх и вниз. Предположим, что электрическое поле направлено вдоль оси х; тогда колебания заряда будут происходить тоже вдоль оси х: положение заряда дается значением х, а скорость заряда есть v (фиг. 34.13).
Фиг. 34.13. Движущийся под действием электрического поля заряд, на который со стороны магнитного поля действует сила, направленная по световому лучу.
Магнитное поле направлено перпендикулярно электрическому. Электрическое поле, воздействуя на заряд, заставляет его раскачиваться вверх и вниз, а как действует магнитное поле? Магнитное поле действует только на движущийся заряд (пусть это будет, например, электрон); но электрон действительно движется, ведь он разгоняется электрическим полем, следовательно, оба поля действуют совместно. Двигаясь вверх и вниз с некоторой скоростью, электрон испытывает действие силы, равной по величине произведению Bvq, а каково направление этой силы? Направление силы совпадает с направлением распространения света. Следовательно, падающий на заряд луч света заставляет его колебаться и, кроме того, тянет его с некоторой силой в направлении движения световой волны. Это явление носит название давления электромагнитных волн, или светового давления.
Определим величину светового давления. Она, очевидно, равна F=qvB или, поскольку заряд и поле осциллируют, равна среднему по времени от F, т. е. <F>. Согласно (34.2), напряженность магнитного поля равна напряженности электрического поля, деленной на с, так что мы должны найти среднее от произведения электрического поля, скорости и заряда, деленного на с: <F>=q<vE>/c. С другой стороны, произведение заряда q на поле Е есть сила, действующая на заряд со стороны электрического поля, а произведение силы на скорость есть работа в единицу времени dW/dt, совершаемая над зарядом!
Следовательно, сила («толкающий импульс»), сообщаемая заряду за 1 сек, равна поглощаемой энергии света за 1 сек, деленной на с! Этот закон носит общий характер, поскольку нам не надо было знать силу осциллятора, а также взаимное уничтожение действия разных зарядов. В каждом случае, когда происходит поглощение света, возникает давление. Импульс, сообщаемый светом, всегда равен поглощаемой энергии, деленной на с:
(34.24),
Мы уже знаем, что свет переносит с собой энергию. Теперь мы приходим к выводу, что свет несет также и импульс и, кроме того, импульс световой волны всегда равен энергии, деленной на с.
И наоборот, при испускании света источник испытывает отдачу. Если атом излучает энергию W в некотором направлении, возникает импульс отдачи р=W/c. Пучок света, падающий по нормали к зеркалу, при отражении сообщает зеркалу в два раза большую силу.
Все сказанное находится в рамках классической теории света. Мы, конечно, знаем, что существует квантовая теория и что свет во многих отношениях ведет себя как частица. Энергия света — частицы — равна частоте, умноженной на постоянную
(34.25)
Раз свет переносит импульс, равный энергии, деленной на с, то эффективные частицы, фотоны, несут импульс
(34.26)
Направление импульса совпадает, разумеется, с направлением распространения света. Следовательно, можно записать это в векторной форме
(34.27)
Мы знаем также, что энергия и импульс частицы образуют четырехвектор. Мы уже выяснили, что ω и k тоже составляют четырехвектор. И очень хорошо, что в оба равенства (34.27) входит одна и та же константа; это означает, что квантовая теория и теория относительности согласуются друг с другом.
Уравнению (34.27) можно придать более элегантный вид: рμ=ħkμ (релятивистское уравнение для частицы, которая сопоставляется волне). Хотя это соотношение написано нами для фотонов, у которых k (модуль k) равно ω/с, а р=W/c, на самом деле оно имеет гораздо более общий характер. В квантовой механике все частицы, а не только фотоны проявляют волновые свойства, причем частота и волновое число соответствующих волн связаны с энергией и импульсом частицы соотношениями (34.27) (они называются соотношениями де-Бройля), даже в случае р, не равного W/с.
В предыдущей главе мы видели, что свет с- правой и левой круговой поляризацией также переносит момент количества движения, по величине пропорциональный энергии ℰ волны. С квантовой точки зрения пучок света с круговой поляризацией представляется в виде потока фотонов, каждый из которых несет момент количества движения ±ħ, направленный по или против движения. Вы видите, во что превращается поляризация с корпускулярной точки зрения — фотоны обладают моментом количества движения, как вращающиеся пули винтовки. Но картина с «пулями» столь же не полна, как и «волновая» картина, и нам предстоит обсудить эти представления более подробно в последующих главах, посвященных квантовым явлениям.
Глава 35 ЦВЕТОВОЕ ЗРЕНИЕ
§ 1. Человеческий глаз
Явление цвета отчасти обусловлено физическими процессами. Мы уже говорили о цветовой гамме мыльных пленок, вызванной интерференцией. Но цвет, кроме того, связан еще с функцией глаза и с тем, что происходит позади него, т. е. с деятельностью мозга. Физика изучает поведение света, пока он находится вне человеческого глаза, а наши ощущения, после того как свет попал в глаз, возникают в результате фотохимических и нервных процессов, а также психологических рефлексов.
С восприятием света связано множество интересных явлений, в которых тесно переплетаются и физические, и физиологические процессы, так что познавание явлений природы, воспринимаемых через зрение, выходит за рамки физики как таковой. Мы не станем извиняться за то, что собираемся несколько вторгнуться в другие области науки, потому что, как мы уже подчеркивали, науки разделены не естественным путем, а лишь из соображений удобства. Природа вовсе не заинтересована в подобном разделении, и многие интересные явления лежат именно на стыке разных областей науки.
В гл. 3 мы в общих чертах говорили о связях физики с другими науками; теперь мы хотим более подробно исследовать ту область явлений, где физика и другие науки исключительно тесно связаны между собой. Эта область — восприятие света, зрение. Особое внимание мы уделим цветовому зрению. В этой главе мы в основном будем говорить о явлениях, связанных со зрением человека; следующая глава будет посвящена физиологическим аспектам зрения как у человека, так и у животных.
Зрение начинается с глаза; чтобы понять, как мы видим, нужно разобраться в устройстве самого глаза. В следующей главе мы довольно подробно будем говорить о функции отдельных частей глаза и их связи с нервной системой. А пока кратко опишем, как функционирует глаз.
Фиг. 35.1. Строение глаза
Свет попадает в глаз через роговицу (фиг. 35.1); мы уже рассказывали раньше, как свет преломляется и отображается на задней поверхности глаза, на слое, который называется сетчаткой; разные части сетчатки воспринимают лучи от различных областей поля зрения вне глаза. Сетчатка не вполне однородна: в ее центре есть участок — пятно, который мы используем, когда нам необходимо видеть предметы особенно четко; в этом участке острота зрения особенно велика, называется он — желтое пятно, или центральная ямка. Легко убедиться непосредственно на опыте, что боковые участки глаза различают детали рассматриваемого предмета не столь эффективно, как центральный участок. В сетчатке имеется еще один участок, где зрительные нервы, несущие всю информацию, собираются вместе и выходят из глаза; этот участок называется слепым пятном. Сетчатка там не имеет чувствительности, и если, например, закрыть левый глаз и посмотреть перед собой, а затем медленно отодвигать палец (или другой небольшой предмет) из поля зрения, то в каком-то месте поля зрения этот предмет неожиданно исчезнет. Известен пока лишь один случай, когда из этого эффекта была извлечена реальная польза. Один физиолог, показавший действие слепого пятна, стал любимцем при дворе французского короля; на утомительных заседаниях со своими придворными король развлекался, «отрубая им головы»: он смотрел на одного из них и следил, как в это время «исчезала» голова другого.
Фиг. 35.2, Структура сетчатки (свет входит снизу}
На фиг. 35.2 в увеличенном масштабе показана структура сетчатки. Различные части сетчатки имеют разную структуру. На периферических частях сетчатки наиболее часто встречаются удлиненные объекты, называемые палочками. Ближе к желтому пятну, кроме палочек, попадаются еще колбочки. Позже мы опишем структуру этих элементов. Чем ближе к желтому пятну, тем больше становится колбочек, а в самом желтом пятне фактически имеются одни только колбочки, лежащие столь тесно, что здесь они много мельче, или уже, чем в других местах сетчатки. Следовательно, в центре поля зрения мы видим с помощью колбочек, а на периферии в восприятии света участвуют палочки. Интересно, что любая чувствительная к свету клетка в сетчатке не связана со зрительным нервом непосредственно, а соединена с другими клетками, которые в свою очередь соединены между собой. Существует несколько типов клеток: одни несут информацию к зрительному нерву, а другие связаны между собой в основном в «горизонтальном» направлении. Всего имеется четыре типа клеток, но мы сейчас не будем об этом говорить подробно, а только подчеркнем основную идею: что световой сигнал уже на этом этапе «продумывается». Иначе говоря, информация, полученная от различных клеток, не сразу поступает в мозг от каждой точки в отдельности, а частично осмысливается в сетчатке путем комбинирования информации от нескольких зрительных рецепторов. Важно понять, что сам глаз выполняет часть функций осмысливания, свойственных головному мозгу.
§ 2. Цвет зависит от интенсивности
Одним из самых примечательных свойств зрения является способность глаза привыкать (адаптироваться) к темноте. Когда из ярко освещенной комнаты мы входим в темную, то некоторое время мы ничего не видим, и лишь постепенно окружающие предметы начинают вырисовываться все явственнее, и в конце концов мы начинаем замечать то, чего раньше совсем не видели. При очень слабом свете предметы кажутся лишенными окраски. Было установлено, что зрение в условиях темновой адаптации осуществляется почти исключительно с помощью палочек, а в условиях яркого света — с помощью колбочек. В результате мы распознаем целый ряд явлений, связанных с передачей функции зрения от палочек и колбочек, действующих совместно, к одним только палочкам.
Во многих случаях объекты, которые считаются одноцветными, при увеличении интенсивности света могут приобрести окраску и стать изумительно красивыми. Например, изображение какой-нибудь слабой туманности в телескопе обычно кажется «черно-белым», однако астроному Миллеру из обсерваторий Маунт Вильсон и Паломар удалось благодаря своему терпению получить цветные снимки нескольких туманностей. Никто никогда не видел окраски туманностей своими глазами, но это не значит, что цвета созданы искусственным путем, просто интенсивность света была слишком мала, чтобы колбочки наших глаз могли определить цвет. Особенно красивы Кольцевидная и Крабовидная туманности. На снимке Кольцевидной туманности центральная часть окрашена в прекрасный синий цвет и окружена она ярким красным ореолом, а на снимке Крабовидной туманности на фоне голубоватой дымки перемежаются яркие красно-оранжевые нити.
При ярком свете чувствительность палочек, по-видимому, очень мала, но в темноте с течением времени они приобретают способность видеть. Относительные изменения интенсивности, к которым глаз может приспосабливаться, превышают один миллион раз. Природа придумала для этой цели два рода клеток: одни видят при ярком свете и различают цвета — это колбочки, другие приспособлены видеть в темноте — это палочки.
Отсюда возникают интересные следствия: первое — это обесцвечивание предметов (в слабом свете), а второе — различие в относительной яркости двух предметов, окрашенных в разные цвета. Оказывается, палочки видят синий конец спектра лучше, чем колбочки, но зато колбочки видят, например, темно-красный цвет, тогда как палочки его совершенно не могут увидеть. Поэтому для палочек красный цвет — все равно что черный. Если взять два листка бумаги, скажем красный и синий, то в полутьме синий будет казаться ярче красного, хотя при хорошем освещении красный листок гораздо ярче синего. Это совершенно поразительное явление. Если мы в темноте рассматриваем ярко раскрашенную обложку журнала и представляем себе ее расцветку, то на свету все становится совершенно неузнаваемым. Описанное выше явление называется эффектом Пуркинье.
Фиг. 35.3. Спектральная чувствительность глаза. Сплошная кривая — на свету; пунктирная — в темноте.
На фиг. 35.3 пунктирная кривая характеризует чувствительность глаза в темноте, т. е. чувствительность за счет палочек, а сплошная кривая относится к зрению на свету. Видно, что максимальная чувствительность палочек лежит в области зеленого цвета, а колбочек — в области желтого цвета. Поэтому красный листок (красный цвет имеет длину волны около 650 ммк), хорошо видный при ярком свете, почти совсем не виден в темноте.
Тот факт, что зрение в темноте осуществляется с помощью палочек, а в окрестности желтого пятна палочек нет, проявляется еще и в том, что мы видим в темноте предметы, находящиеся прямо перед нами, не столь отчетливо, как предметы, расположенные сбоку. Слабые звезды и туманности иногда бывает легче заметить, если смотреть на них несколько вбок, потому что в центре сетчатки палочек почти совсем нет.
Уменьшение числа колбочек к периферии глаза в свою очередь приводит еще к одному интересному эффекту — на краю поля зрения даже яркие предметы теряют свою окраску. Этот эффект легко проверить. Зафиксируйте свой взгляд в каком-то определенном направлении и попросите приятеля, чтобы он подошел к вам сбоку, держа в руке ярко раскрашенные листки. Попробуйте определить цвет листков, прежде чем они окажутся прямо перед вами. Вы обнаружите, что сами листки увидели задолго до того, как смогли определить, какого они цвета. Лучше, если ваш приятель будет входить в поле зрения со стороны, противоположной слепому пятну, иначе возникнет путаница: вы начнете уже различать цвета, и вдруг все исчезнет, а затем листки снова появятся и вы ясно различите их цвет.
Интересно также, что периферия сетчатки исключительно чувствительна к движению объектов зрения. Хотя мы плохо видим, когда смотрим искоса, одним уголком глаза, тем не менее сразу замечаем летящего сбоку жука или мошку, даже если вовсе не ожидали увидеть что-либо на этом месте. Нас так и «тянет» посмотреть, что это там мелькает на краю поля зрения.
§ 3. Измерение восприятия цвета
Теперь мы займемся зрением, осуществляемым с помощью колбочек, т. е. зрением при ярком освещении. Самое главное и самое характерное свойство такого зрения — это цвет. Мы уже знаем, что белый свет с помощью призмы можно разложить на целый спектр лучей с разными длинами волн, которые кажутся нам окрашенными в разные цвета; цвета именно кажутся — это определенные ощущения. Свет от любого источника можно проанализировать с помощью дифракционной решетки или призмы и найти его спектральное распределение, т. е. «количество» света той или иной длины волны. Один луч света может содержать большое количество синего, немного красного и совсем мало желтого, другой содержит цвета в иной пропорции и т. д. Для физики такой характеристики будет вполне достаточно, но здесь нам надо ответить на вопрос: какого цвета будет луч, каким он нам покажется? Очевидно, что окраска как-то связана со спектральным распределением света, но наша задача состоит в том, чтобы найти, от какой именно характеристики спектрального распределения зависит восприятие того или иного цвета. Например, как получить зеленый цвет? Нам хорошо известно, что можно просто выбрать соответствующий участок спектра. А нет ли другого способа получить зеленый, оранжевый и вообще любой цвет?
Может ли быть несколько спектральных распределений, вызывающих один и тот же зрительный эффект? Ответ совершенно определенный —да, может. Число различных зрительных восприятий довольно ограниченно; как мы вскоре увидим, это число охватывает всего лишь трехмерное множество восприятий, а число кривых — спектральных распределений для разных источников — бесконечно. Возникает вопрос, который мы и обсудим в первую очередь: при каких условиях различные распределения выглядят как один и тот же цвет?
Самый действенный психофизический способ оценки цветовой чувствительности состоит в использовании глаза как нулевого прибора. При этом не нужно исследовать, как складывается ощущение зеленого цвета, или измерять факторы, которые вызывают ощущение зеленого цвета, это было бы слишком сложно. Вместо этого мы изучим условия, при которых два раздражения (два воздействия) становятся неразличимыми. При этом нам нет необходимости знать, могут ли два человека получить в разных условиях одинаковое зрительное ощущение, а нужно лишь установить, что два раздражения, вызывающие одинаковые ощущения у одного человека, приводят к одинаковым ощущениям и у другого. Совершенно излишне сравнивать зрительные ощущения двух разных людей, смотрящих на один и тот же, скажем, зеленый предмет. Об этом мы ничего не знаем.
Для иллюстрации возможностей этого метода возьмем набор из четырех проекционных фонарей, снабженных фильтрами. Их яркость может непрерывно меняться в широких пределах: первый фонарь имеет красный фильтр и отбрасывает на экран красное пятно, второй — зеленый фильтр и дает зеленое пятно, третий — синий фильтр, и, наконец, четвертый образует на экране белый круг с черным пятном посредине. Включим красный и зеленый фонари так, чтобы пятна света на экране частично перекрывались, тогда область перекрывшихся пятен вызовет у нас ощущение нового цвета, не красновато-зеленого, а желтого. Изменяя пропорцию красного и зеленого, можно пройти через всевозможные оттенки оранжевого и т. д. Установив на экране определенный желтый цвет, можно получить точно такой же цвет, смешивая другие компоненты, например используя желтый фильтр и смешав затем желтый свет с лучом белого цвета. Другими словами, одни и те же цвета можно создавать несколькими способами, смешивая свет от разных фильтров.
Открытое нами явление аналитически можно записать следующим образом. Обозначим данный желтый цвет символом Y; он представляет собой сумму некоторых количеств света от красного фильтра (R) и от зеленого (G). С помощью двух чисел, скажем r и g, определяющих яркости (R) и (G), формула для желтого цвета записывается в виде
(35.1)
Вопрос теперь заключается в том, можно ли каждый цвет получить сложением двух или трех различных фиксированных цветов. Попробуем ответить на этот вопрос. Конечно, нельзя получить любой цвет, смешивая только зеленый и красный, потому что синий цвет в такой комбинации никогда не получится. Однако если добавить к ним синий, то в месте пересечения всех трех цветовых пятен можно добиться появления чистого белого цвета. Смешивая три разных цвета в разных пропорциях, в области пересечения можно получить цвета в очень широком диапазоне, поэтому не исключено, что смешение трех таких цветов может в принципе дать любой цвет. Мы потом рассмотрим, в какой мере это утверждение правильно; по существу оно верно, а вскоре мы сформулируем его более точно.
Совместим цветовые пятна от всех трех фонарей в одном месте и попытаемся подобрать такой же цвет, какой появляется во внешнем кольце от четвертого фонаря, опоясывающем пятно смешанного цвета. Свет от четвертого фонаря, который мы сначала считали «белым», теперь кажется бледно-желтым. Попытаемся подобрать этот цвет, смешивая красный, зеленый и синий; оказывается, методом проб и ошибок можно создать «кремовый» цвет, оттенок которого очень близок к нужному нам цвету. Поэтому легко поверить, что и любой цвет можно подобрать сочетанием красного, зеленого и синего цвета. Мы попробуем позже получить желтый цвет, но сначала хотелось бы создать один цвет, который получить очень трудно. Когда читают лекции о цвете, обычно демонстрируют «яркие» цвета и никогда не показывают коричневого; пожалуй, даже невозможно вспомнить, чтобы кто-либо видел коричневый свет. И действительно, этот свет никогда не используют, скажем, в сценических эффектах, и прожекторов с коричневым светом никто не видел; все как будто указывает на то, что получить коричневый свет невозможно. По этому поводу стоит, однако, заметить, что мы просто не привыкли видеть коричневый свет сам по себе, без всякого фона. Практически его можно создать, смешивая в некоторой пропорции красный и желтый. Чтобы убедиться, что на экране действительно получился коричневый цвет, достаточно увеличить яркость окружающего фона, на котором расположено цветовое пятно, и вы увидите пятно того самого цвета, который мы называем коричневым! Коричневый цвет всегда выглядит темным на фоне более светлого окружения. Легко получить коричневый цвет самых разных оттенков. Например, если уменьшить долю желтого света, возникнет красновато-коричневый цвет с шоколадным оттенком, а если добавить зеленый, получится ужасный цвет военного обмундирования, принятый в армии. Но сам по себе свет, создающий этот цвет, не так уж страшен — он просто желтовато-зеленый цвет, который рассматривается на светлом фоне.
Поставим теперь желтый фильтр на четвертый фонарь и попробуем путем смешивания подобрать такой же желтый цвет. (Яркость четвертого фонаря должна находиться в пределах яркости первых трех, иначе мы не сумеем создать смешанный цвет точно такой же яркости.) Оказывается, мы можем получить желтый цвет; достаточно только смешать зеленый и красный, а для оттенка добавить немного синего. После этого уже нетрудно поверить, что при соответствующих условиях можно в точности подобрать любой заданный цвет.
Давайте обсудим теперь законы смешивания цветов. Прежде всего, как мы уже говорили, один и тот же цвет может быть создан различными спектральными распределениями; далее, мы заметили, что «каждый» цвет может быть получен смешиванием трех основных цветов: красного, синего и зеленого. Наиболее интересное свойство смеси цветов состоит в следующем: пусть задан свет определенного состава, назовем его X, который на глаз неотличим от другого света Y (они могут иметь разные спектральные распределения, но зрительно кажутся одинаковыми); назовем эти цвета «одинаковыми» в том смысле, что глаз видит их как одинаковые, и запишем
(35.2)
Прибавим к каждому цвету новый, скажем Z (запись X+Z означает, что два световых пучка падают на одно и то же место экрана), и точно такой же пучок света добавим к Y. Тогда один из основных законов цвета выражается так: если два спектральных распределения неразличимы на глаз по цвету, то после добавления к ним одинакового количества нового цвета смеси будут по-прежнему неразличимы:
(35.3)
Мы только что смогли подобрать два одинаковых желтых цвета; если оба цвета осветить розовым светом, то они останутся одинаковыми. Итак, добавив любой цвет к одинаковым цветам, получим одинаковый цвет. Обобщая все цветовые явления этого рода, можно сказать и по-другому: если цвета двух расположенных рядом друг с другом лучей света в одних условиях выглядят одинаковыми, то при любых смешениях они останутся одинаковыми и один луч может быть заменен другим при любом смешении цветов. Важным и интересным оказывается также то обстоятельство, что совпадение цветов не зависит от свойств зрения в момент наблюдения; известно, что если долго смотреть на яркую красную поверхность или яркий красный свет, а затем взглянуть на белый лист бумаги, то он покажется зеленоватым и другие цвета также будут восприниматься с искажениями (из-за того, что мы долго перед этим смотрели на ярко-красный цвет). Пусть мы добились совпадения двух желтых цветов, а затем долго смотрели на яркий красный цвет; повернувшись снова к желтым пятнам, мы обнаружим, что они уже не кажутся нам больше желтыми (какими именно они будут казаться — я не знаю, но только не желтыми). Однако в любом случае оба цвета по-прежнему будут казаться одинаковыми, т. е. способность глаза приравнивать два цвета сохраняется, несмотря на адаптацию глаза в условиях разной интенсивности. Очевидным исключением является только случай очень малой интенсивности, когда функция зрения переходит от колбочек к палочкам; здесь уже нельзя говорить о сравнении цветов, так как система зрения совсем другая.
Второй закон смешения цветов состоит в следующем: любой цвет может быть получен смешением трех разных цветов (в нашем случае зеленого, красного и синего). Мы уже продемонстрировали на двух примерах, что смешение трех цветов может дать самые разные цвета. Описанные выше законы, кроме того, очень интересны с математической точки зрения. Для тех, кого интересует математическая сторона проблемы, мы расскажем о ней более подробно. Возьмем три наших цвета — зеленый, красный и синий, обозначим их буквами А, В и С и назовем их основными. Тогда любой цвет может быть получен смешением определенных количеств каждого из данных трех цветов: например, цвет X создается смесью количества а цвета А, количества b цвета В и количества с цвета С:
(35.4)
Составим теперь из тех же трех цветов новый цвет Y:
(35.5)
Тогда смесь цветов X и Y определяется суммами их компонент в основных цветах (как следствие двух главных законов цвета, приведенных выше):
(35.6)
Это правило очень напоминает суммирование векторов, причем (a, b, c) играют роль компонент одного вектора, а (a', b', c') — компонент второго, и новый свет Z определяется «суммой» векторов. Такое соответствие постоянно привлекало к себе внимание физиков и математиков. В частности, Шредингер написал замечательную работу о цветовом зрении, в которой он развил теорию «векторного анализа» в применении к смеси цветов.
Возникает вопрос: как нужно выбрать основные цвета? В самом деле, никакого единственно правильного выбора нет. С практической точки зрения иногда оказывается более полезным выбирать определенные три цвета, потому что они дают в смеси большее число оттенков, но мы не будем сейчас на этом останавливаться.
Любые три по-разному окрашенных пучка света[25] могут образовать какой угодно другой цвет, если их смешать в нужной пропорции.
Возможно ли показать на опыте действие этого удивительного, фантастического правила? Возьмем вместо красного, зеленого и синего света фонари с красным, синим, желтым фильтром и посмотрим, образует ли смесь этих цветов, скажем, зеленый цвет.
Смешивая эти три новых цвета в разных пропорциях, мы получаем целый спектр разных цветов. Но после целого ряда проб и ошибок мы убеждаемся, что ничего похожего на зеленый цвет получить не удается. А можем ли мы вообще образовать зеленый цвет? Да, можем. Но каким образом? Проектируя красный свет на зеленое пятно, мы можем затем подобрать точно такой же цвет путем смешения желтого и синего! Таким путем мы составляем две комбинации одного цвета, правда немного сжульничав, так как поместили красный в другую комбинацию. Но поскольку мы уже умеем разбираться в математических ухищрениях, то прекрасно понимаем, что вместо доказательства возможности составления цвета X из трех других цветов, например желтого, красного и голубого, мы установили, что красный плюс цвет X могут быть сделаны из желтого и голубого. Перенесем теперь красный цвет в другую часть равенства и будем интерпретировать его как отрицательную величину. Следовательно, в уравнениях типа (35.4) возможны как положительные, так и отрицательные значения коэффициентов, причем отрицательным величинам придается такой смысл, что их следует перенести в другую часть равенства со знаком плюс, тогда каждый цвет может быть действительно составлен из любых трех, и говорить о каком-то «правильном» выборе основных цветов бессмысленно.
Возникает вопрос, всегда ли при составлении смеси любого цвета входят три основных цвета с положительными коэффициентами? Нет, не всегда. Для каждой тройки основных цветов имеются цвета, для которых в смеси появляется отрицательный коэффициент, и поэтому однозначного способа выбора основной тройки не существует. В популярных книжках красный, зеленый и синий обычно называют основными цветами, но это объясняется только тем, что с их помощью можно создать более широкий набор цветов при положительных значениях коэффициентов в комбинации основных.
§ 4. Диаграмма цветности
Рассмотрим теперь смешивание цветов с математической точки зрения как некое геометрическое построение. Цвет, описываемый уравнением (35.4), можно представить вектором в трехмерном пространстве, где по трем осям отложены величины a, b и с, т. е. данному цвету соответствует точка в пространстве. Точка, соответствующая другому цвету, у которого компоненты равны а', b' и с', расположена в другом месте.
Фиг. 35.4. Стандартная диаграмма цветности.
Как мы уже знаем, сумма двух цветов есть новый цвет, который получается векторным суммированием первых двух. Диаграмму можно упростить и изобразить все на плоскости, если воспользоваться следующим наблюдением: возьмем свет определенной окраски и просто удвоим коэффициенты а, b и с, т. е. все компоненты увеличим, а соотношение между ними оставим неизменным; тогда получится свет той же самой окраски, но более яркий. Поэтому можно привести любой свет к одной и той же интенсивности и затем спроектировать все построение в трехмерном пространстве на плоскость, как это сделано на фиг. 35.4.
Отсюда следует, что любой цвет, полученный смешением двух заданных цветов, изображается точкой, лежащей на линии, которая соединяет оба выбранных цвета. Например, смесь, составленная из равных частей обоих цветов, лежит на середине соединяющего их отрезка; смесь из 1/4 одного цвета и 3/4 другого лежит на расстоянии 1/4 длины отрезка и т. д.
Если в качестве основных цветов выбрать красный, зеленый и синий, то все цвета, получаемые из них с положительными коэффициентами, лежат внутри треугольника, изображенного на рисунке пунктиром. По существу, треугольник содержит почти все цвета, которые мы видим, поскольку вообще все цвета, доступные нашему зрению, заключены внутри кривой довольно странной формы, немного выступающей за треугольник. Откуда взялась эта кривая? Кто-то когда-то весьма тщательно составил смеси всех видимых цветов из трех выбранных. Но мы не будем проверять все цвета; достаточно исследовать лишь чистые спектральные тона, линии спектра. Любой цвет можно рассматривать как сумму чистых спектральных тонов с различными, но положительными коэффициентами (чистых с физической точки зрения). Любой цвет состоит из некоторых количеств красного, желтого, синего и т. д. по всем цветам спектра. Зная, как составлены спектральные тона из трех основных цветов, можно вычислить необходимую пропорцию основных цветов и для какого угодно цвета. Поэтому, определив цветовые коэффициенты всех спектральных тонов по отношению к трем основным цветам, легко составить полную таблицу смешения цветов.
Фиг. 35.5. Цветовые коэффициенты чистых спектральных тонов для некоторого выбора основных цветов. 1 — красный; 2 — зеленый; 3 — синий.
В качестве примера на фиг. 35.5 приведены опытные данные по смешению трех цветов. Кривые показывают количество каждого из трех основных цветов (красного, зеленого, синего), образующих при смешении любой из цветов спектра. Красный цвет расположен на левом конце спектра, следом идет желтый цвет и т. д. до синего цвета, расположенного на правом краю. Заметьте, что в некоторых случаях необходимо брать отрицательные коэффициенты. Именно из таких данных и были определены положения точек для всех цветов на диаграмме, причем координаты х и у связаны с относительными количествами основных цветов, использованных для получения различных цветов. Отсюда же была найдена и граничная кривая диаграммы. Она представляет собой геометрическое место всех чистых спектральных тонов. Но каждый цвет может быть получен смешением спектральных тонов, поэтому любой цвет на линии, соединяющей две произвольные точки кривой, существует в природе. На диаграмме прямая соединяет крайний фиолетовый и далекий красный концы спектра. На ней расположены пурпурные цвета. Внутри кривой находятся те цвета, которые могут быть получены с помощью света, а цвета вне кривой вообще не могут быть созданы светом, и никто их никогда не видел (разве только во сне!).
§ 5. Механизм цветового зрения
Первый вопрос, который возникает по поводу изложенных закономерностей: почему цвета ведут себя таким образом?
Простейшая теория, предложенная Юнгом и Гельмгольцем, предполагала, что глаз обладает тремя сортами пигментов, восприимчивых к свету, и что спектры поглощения этих пигментов разные, скажем, один сильно поглощает красный свет, другой — синий, а третий — зеленый. Поэтому когда свет попадает в глаз, поглощение в каждой из трех областей происходит по-разному, а, исследуя разную поступающую информацию, наш мозг, или глаз, или еще что-то решает, какой цвет попал в глаз. Легко показать, что из предположения о трех сортах пигментов вытекают все правила смешения цветов.
Дальше, казалось бы, оставалось определить кривые поглощения всех трех пигментов, но по этому поводу возникли серьезные разногласия. К несчастью, оказалось, что можно найти только всевозможные линейные комбинации кривых поглощения, а не сами кривые для каждого пигмента в отдельности, потому что координаты на диаграмме могут быть повернуты любым образом. Пробовали использовать самые разные пути для получения кривых, характеризующих отдельные физические свойства глаза. Одна из таких кривых, называемая кривой яркости, представлена на фиг. 35.3.
На рисунке показаны две кривые: одна для глаза, адаптированного к темноте, а другая для зрения на свету (последняя характеризует зрение с помощью колбочек). Кривая указывает наименьшую яркость света данной окраски, которую еще способен воспринять глаз, т. е. характеризует чувствительность глаза в разных областях спектра.
Существует другой, очень интересный способ измерения этой же величины. Возьмем два цвета и будем попеременно показывать их на экране. Тогда, если частота их появления достаточно мала, мы увидим на экране мелькание. С увеличением частоты мелькание в конце концов исчезнет. Это произойдет при некоторой частоте, зависящей от яркости света и равной, скажем, 16 повторениям в секунду. Теперь можно так подобрать яркости, или интенсивности, двух цветов относительно друг друга, чтобы мелькание цвета при 16 циклах исчезало. При установленной яркости мелькание цветов возникает, только если перейти к меньшей частоте. Следовательно, при большой частоте мы получаем так называемое мелькание яркости, а при меньших частотах — мелькание цвета. Таким способом удается подобрать два цвета с «одинаковой яркостью». Получающиеся отсюда результаты почти, но не совсем аналогичны данным по пороговой чувствительности глаза к слабым потокам света, наблюдаемым с помощью колбочек. Большинство специалистов при определении кривой яркости пользуются данными опыта с мельканием цвета.
Итак, если глаз содержит три рода цветочувствительного пигмента, то задача заключается в определении формы спектра поглощения для каждого из них. Как это сделать? Известно, что встречаются люди, не различающие цветов; среди мужчин их насчитывается 8%, а среди женщин — 0,5%. Большинство людей, имеющих какие-либо отклонения в цветовом зрении или вообще им не обладающих, чувствительны к изменению цвета в разной степени, но для всех них характерно восприятие трех основных цветов. Есть, однако, и такие люди (их называют дихроматами), для которых любой цвет составлен из двух основных цветов. Естественно предположить, что у них отсутствует один из трех пигментов. Если бы существовало три типа дихроматов, для которых правила смешения были бы различны, то у одних должна была бы отсутствовать красная пигментация, у других — зеленая, а у третьих — синяя. По измерению восприятия цвета у этих трех типов людей можно определить три искомые кривые поглощения! И действительно, обнаружено три типа дихроматов: два из них встречаются довольно часто, а третий — крайне редко; измерения дали возможность установить спектры поглощения пигмента.
Фиг. 35.6. Смешение цветов у дейтеранопов.
На фиг. 35.6 показан механизм смешения цветов у одного типа людей, страдающих неправильным цветовым восприятием,— так называемых дейтеранопов. У них определенному цвету отвечает на диаграмме линия, а не точка, т. е. все цвета на линии кажутся им одинаковыми. Если правильно предположение об отсутствии у такого типа людей одной из трех составных частей цветовой информации, то все линии постоянного цвета должны пересечься в одной точке. Тщательное измерение на графике показывает, что линии действительно пересекаются в одной точке. Но эти линии были, очевидно, вычислены математиками и вовсе не являются истинными опытными данными! В самом деле, если взять последние опытные данные, то окажется, что точка пересечения на фиг. 35.6 находится не там, где она должна быть. Указанное на рисунке положение линий приводит к физически неправильному спектру поглощения: в ряде областей возникает и положительное, и отрицательное поглощение. Но из последних данных Юстовой получается, что кривые поглощения всюду положительны.
Фиг. 35.7. Дефект цветового зрения, свойственный протанопам.
Фиг. 35.7 иллюстрирует другой дефект цветового зрения, свойственный протанопам; линии на рисунке сходятся к точке вблизи красного конца граничной кривой. Примерно такое же положение точки пересечения получается и из данных Юстовой. Измерения восприятия цвета у людей, страдающих тремя разными дефектами цветового зрения, окончательно установили кривые поглощения для трех пигментов, они приведены на фиг. 35.8. Окончательно ли? Может быть.
Фиг. 35.8. Кривые спектральной чувствительности для рецепторов, воспринимающих три основных цвета.
Остается выяснить еще следующие вопросы: справедлива ли на самом деле теория трех пигментов, проистекают ли дефекты восприятия цвета из-за недостатка пигмента, и, кроме того, непонятно, насколько правильны данные по смешению цвета в случае дефектов зрения. Ряд исследователей получили разные результаты. И вопросы эти пока находятся в стадии изучения.
§ 6. Физико-химические свойства цветового зрения
Что можно сказать о сравнении полученных кривых со свойствами настоящего глазного пигмента? Пигменты, извлекаемые из сетчатки, главным образом состоят из одного вида, называемого зрительным пурпуром. Его самые примечательные свойства заключаются в том, что он присутствует в глазах почти всех позвоночных животных и его кривая поглощения почти точно совпадает с кривой чувствительности глаза.
Фиг. 35.9. Кривая чувствительности глаза при сумеречном зрении и кривая поглощения зрительного пурпура.
На фиг. 35.9 в одном масштабе изображены кривая поглощения зрительного пурпура и кривая чувствительности глаза, адаптированного к темноте. Очевидно, именно с помощью пурпура мы получаем возможность видеть в темноте. Зрительный пурпур представляет собой пигмент палочек и никакого отношения к цветовому зрению не имеет. Этот факт был установлен в 1877 г. Но и сейчас мы должны сказать, что цветовые пигменты колбочек ни разу не были выделены в пробирках. В 1958 г. еще можно было утверждать, что их никто никогда не видел. Но с тех пор два из них были обнаружены Раштоном, который применил очень простой и красивый метод.
Трудность, по-видимому, заключается в том, что глаз гораздо менее чувствителен к яркому свету, чем к свету малой интенсивности и, следовательно, для зрения требуется много пурпура, но относительно мало пигмента, восприимчивого к цвету. Замысел Раштона состоял в том, чтобы пигмент оставить в глазе и там как-то определить его свойства. Конкретно он сделал следующее. Есть такой прибор — офтальмоскоп, который позволяет послать луч света в глаз через хрусталик и сфокусировать отраженный глазом свет. С помощью этого прибора можно измерить количество отраженного света. В результате получают коэффициент отражения для света, дважды прошедшего через пигмент (свет отражается задними слоями глазного яблока и снова проходит через пигмент колбочек). В природе не часто бывает так здорово устроено. Колбочки устроены так хитро, что попадающий в них свет многократно отражается и постепенно доходит до маленьких чувствительных точек в вершинах колбочек. Попав прямо в чувствительную точку, свет отражается и выходит обратно, проделав значительный участок пути в светочувствительном пигменте. Кроме того, если направить луч в желтое пятно, где нет палочек, можно избежать побочного действия зрительного пурпура. Цвет сетчатки наблюдали уже давно, он имеет оранжево-розоватый оттенок; но сюда примешивается также цвет кровеносных сосудов и цвет задней стенки глаза и т. д. Как узнать, когда в офтальмоскопе виден сам пигмент? Ответ: сначала нужно найти человека с дефектом цветового зрения, у которого пигментов меньше и, следовательно, на котором легче провести анализ. Во-вторых, многие пигменты, в частности зрительный пурпур, обесцвечиваются на свету и теряют свою интенсивность; при освещении их концентрация меняется. Поэтому при измерении спектра поглощения глаза Раштон освещал весь глаз другим пучком, меняющим концентрацию пигмента, и измерял изменение спектра, на котором уже не сказывается отражение от сосудов, задней стенки глаза и т. д. Таким путем Раштону удалось получить кривую поглощения для чистого пигмента в глазе протанопа, показанную на фиг. 35.10.
Фиг. 35.10. Спектр поглощения цветового пигмента протанопа (квадратики) и нормального глаза (точки). В опыте луч проходил сквозь слой пигмента дважды.
Вторая кривая на фиг. 35.10 получена при исследовании нормального глаза следующим методом: после предварительного изучения нормального глаза и определения, к каким лучам чувствителен данный пигмент, другой пигмент обесцвечивался красным светом, к которому первый пигмент нечувствителен. Красный свет не воздействует на глаз протанопа, а нормальный глаз к этому свету чувствителен: таким способом можно получить кривую для отсутствующего пигмента. Форма одной кривой прекрасно согласуется с кривой Юстовой для зеленого пигмента, но другая кривая, красная, несколько смещена. Можно думать поэтому, что мы находимся на правильном пути. А может быть, и нет. Последние данные, полученные при исследовании дейтеранопов, не указывают на отсутствие какого-то определенного пигмента.
Явление цвета не относится к физике света как таковой. Цвет есть ощущение, а ощущение разных цветов в различных условиях различно. Если, например, взять розовый свет, полученный при сложении пучков белого и красного света (из красного и белого может, очевидно, получиться только розовый цвет), то в сравнении с ним белый свет может показаться голубым. Предмет, поставленный на пути лучей, отбрасывает две тени — одна из них освещается только белым, а другая — только красным светом. Для большинства людей «белая» тень кажется голубой, но, если увеличивать область тени, пока она не закроет весь экран, мы неожиданно увидим белый, а не голубой цвет! Подобные эффекты можно получить и при смешивании красного, белого и желтого света. Эта смесь может дать только оранжево-желтый цвет с разными оттенками. Смешав эти цвета в равных количествах, мы получим только оранжевый цвет. Тем не менее, рассматривая тени, на которые накладываются лучи в разных комбинациях, можно увидеть набор очень красивых цветов, отсутствующих в самом свете (поскольку в нем есть только оранжевые лучи), но возникающих в наших ощущениях. Мы ясно видим разнообразные цвета, совсем непохожие на «физические» цвета, присутствующие в самих лучах света. Важно помнить, что сетчатка сама «осмысливает» свет; она, хотя и бессознательно, сравнивает то, что видит в одной области, с тем, что видит в другой. А что нам известно о том, как это происходит, будет рассказано в следующей главе.
Глава 36 МЕХАНИЗМ ЗРЕНИЯ
§ 1. Ощущение цвета
Обсуждая механизм зрения, прежде всего необходимо понять, что мы обычно видим не беспорядочный набор цветных или световых пятен (разумеется, если не находимся на выставке некоторых современных художников!). Когда мы смотрим на что-то, то видим человека или вещь; другими словами, мозг интерпретирует то, что мы видим, как человека или вещь. Как он это делает — никому неведомо, но делает он это, надо сказать, великолепно. Хотя мы на опыте учимся узнавать, как выглядит человек, однако есть некоторые более элементарные свойства зрения, которые тем не менее тоже включают сопоставление информации от различных частей того, что мы видим. Чтобы понять, как происходит интерпретация изображения в целом, следует изучить первые стадии сопоставления информации от различных клеток сетчатки. В настоящей главе мы сконцентрируем наше внимание главным образом именно на этих сторонах зрения, хотя попутно упомянем и о некоторых других смежных вопросах.
Примером такого сопоставления информации (хотя и на элементарном уровне), поступающей одновременно от нескольких частей глаза и происходящей помимо нашей воли, контроля и сознания, может служить голубая тень от белого света, когда одновременно экран освещается еще и красным светом. При этом по меньшей мере предполагается, что нам известно, что основа экрана красная, и хотя в глаз попадают только «белые» лучи, однако где-то эти кусочки информации складываются вместе и мы видим голубую тень. Чем полнее и привычнее картина, тем большую поправку делает глаз. Действительно, Ланд показал следующее: если мы возьмем два диапозитива, поместим перед ними два фильтра, поглощающие красный и белый свет в различных отношениях, мы будем смешивать разные интенсивности кажущегося голубого и красного света и сможем получить довольно правдивое изображение реальной сцены с натуральными предметами. Кроме красного и белого, мы в этом случае получим множество промежуточных цветов. Аналогичные результаты можно получить, смешивая красный и зелено-голубой цвета; оказывается, что мы получаем почти полный набор цветов. Впрочем, если внимательно приглядеться к ним, то мы увидим, что они не столь уж хороши. Но даже и при этих условиях просто удивительно, как много можно получить только из красного и белого цвета. Чем больше изображение напоминает реальную картину, тем больше мы способны компенсировать то обстоятельство что цвет-то фактически только розовый!
Другим примером может служить появление «цвета» на черно-белом вращающемся диске, изображенном на фиг. 36.1.
Фиг. 36.1. При вращении этого диска одно из колец кажется цветным; при изменении направления вращения окрашенным кажется второе кольцо.
При вращении диска смена черного и белого цвета для каждого радиуса в точности одинакова; это составляет фон, на котором видны два «кольца». Первое кольцо кажется окрашенным в один цвет, а второе — в другой[26]. До сих пор никто не понимает причины появления здесь окраски, однако ясно, что наиболее правдоподобное объяснение состоит в том, что на каком-то элементарном уровне, по-видимому, в самом глазе происходит сложение информации.
Почти все современные теории цветового зрения сходятся на том, что опыты по смешиванию цветов указывают на существование в глазе только трех сортов пигментов и что ощущение цвета создают именно спектры поглощения этих трех пигментов. Однако полная чувствительность, связанная с характеристиками поглощения этих пигментов, функционирующих одновременно, не обязательно равна сумме их чувствительностей. Каждый знает, что желтый цвет не кажется нам красновато-зеленым, и многих, вероятно, несказанно удивит тот факт, что каждый видимый ими цвет есть по сути дела смесь разных цветов, ибо им кажется, что чувство цвета вызывается каким-то другим механизмом, а не просто смешиванием, наподобие сочетания звуков в аккорды в музыке, когда одновременно звучат, скажем, три ноты. Ведь в аккорде, если внимательно прислушаться, можно различить отдельные ноты, а в желтом цвете, сколько бы мы ни приглядывались, увидеть красный и зеленый цвет отдельно невозможно.
Уже первые теории зрения утверждали, что имеются три сорта пигментов и соответственно три сорта колбочек, каждая из которых содержит один пигмент; что от каждой колбочки в мозг идут нервы, так что в мозг переносятся три сорта информации и там что-то происходит. Конечно, это очень несовершенная теория, ибо она не позволяет обнаружить, что за информация переносится по зрительным нервам в мозг; она даже не приступала к решению этой проблемы. Мы должны задать более фундаментальный вопрос: не все ли равно, где происходит сложение информации? Насколько необходимо, чтобы эта информация передавалась по зрительным нервам прямо в мозг, и не может ли какой-то первоначальный анализ выполняться самой сетчаткой? Мы знаем, что сетчатка невероятно сложна и обладает множеством внутренних связей (см. фиг. 35.2); какой-то анализ она способна выполнить.
Дело в том, что ученые, занимающиеся анатомией и развитием глаза, показали, что сетчатка, в сущности, не что иное, как часть самого мозга; при развитии зародыша часть мозга выносится вперед, из нее назад вырастают длинные волокна, которые связывают ее с остальным мозгом. По своей организации сетчатка весьма похожа на мозг. По этому поводу кто-то прекрасно сказал, что это «мозг выдумал, как ему взглянуть на мир». Глаза — это кусочек мозга, которым он, так сказать, «касается света», внешнего мира. Таким образом, нет ничего необычного в том, что какой-то анализ цвета происходит уже в самой сетчатке.
Это предоставляет нам весьма интересную возможность. Ведь никакой другой орган чувств не делает столько, если так можно выразиться, предварительных вычислений, как глаз, прежде чем сигнал попадет в нерв, где его можно измерить. Вычисления для всех остальных органов чувств обычно производит сам мозг, а из-за огромного количества внутренних связей в мозге добраться до этого специфического места и произвести какие-то измерения очень трудно. В глазе вычисления производятся в трех слоях клеток, затем результат вычисления передается по зрительному нерву в мозг. Так что здесь мы, по-видимому, впервые получаем возможность физиологически наблюдать, как работает первый слой мозга, быть может, на начальной стадии. Это вдвойне интересно не только для понимания зрения, но и для всех проблем физиологии.
Тот факт, что существуют три сорта пигментов, вовсе не означает, что должно быть также три сорта ощущений. Существует теория цветового зрения, основанная на совершенно противоположной цветовой схеме (фиг. 36.2).
Фиг. 36.2. Нервные связи, согласно теории цветового зрения. b — голубой; y—желтый; g — зеленый; r —красный; w — белый; bk — черный.
Согласно этой схеме, какое-то из нервных волокон несет много импульсов, если мы видим желтый цвет, и меньше, чем обычно, если мы видим голубой. Другое нервное волокно точно таким же образом переносит информацию о зеленом и красном цвете, а третье — о белом и черном. Другими словами, в этой теории уже начинают делаться догадки о системе связи и методе анализа.
Вопросы, которые мы пытаемся решить с помощью догадок об этом первоначальном анализе, следующие: проблема кажущихся цветов на розовом фоне; что происходит, когда глаз привыкает к различным цветам; и вопрос о так называемых психологических явлениях. Под этим термином мы понимаем, например, что белый цвет не «ощущается» нами как смесь красного, желтого и синего, и такая теория возникла потому, что, как утверждают психологи, существуют четыре кажущихся чистых цвета: «Существуют четыре мощных возбудителя, вызывающие соответственно простые голубой, желтый, зеленый и красный оттенки. В отличие от таких красок, как сиена, пурпур, фуксин или другие различимые цвета, эти простые оттенки являются несмешанными в том смысле, что ни один из них не принимает участия в образовании других, в частности голубой цвет нельзя назвать желтоватым, красноватым, зеленоватым и т. д.; психологически они представляют первичные оттенки».
В этом состоит так называемый психологический факт. Чтобы выяснить, откуда взялся этот факт, нужно очень старательно просмотреть всю литературу. Все, что мы находим в современной литературе по этому вопросу, повторяет те же утверждения или утверждения одного из немецких психологов, авторитетом которого является Леонардо да Винчи, хорошо всем известный великий художник. Этот психолог говорит: «Леонардо считал, что существует пять цветов». Дальнейшие поиски приводят к еще более древним книгам. В этих книгах говорится примерно следующее: «Фиолетовый цвет — это красновато-голубой, оранжевый — это красновато-желтый, но можно ли красный рассматривать как фиолетово-оранжевый? Не будут ли красный и желтый более основными цветами, чем фиолетовый и оранжевый? На вопрос, какие цвета они считают основными, большинство людей назовут красный, желтый и синий, а некоторые добавят к этим трем еще и четвертый — зеленый. Психологи привыкли принимать эти четыре цвета за основные».
Итак, с точки зрения психологов, раз все говорят, что есть три цвета, а кое-кто утверждает, что четыре, и хотят, чтобы было четыре, ну пусть будет четыре. Это иллюстрирует трудности, сопровождающие психологические исследования. Ясно, что мы таким чувством обладаем, но узнать о нем немного больше очень трудно.
Можно идти по другому пути — физиологическому — и экспериментально выяснить, что на самом деле происходит в мозге, в глазе, в сетчатке или другом каком-то месте, и, может быть, удастся обнаружить, что некоторые комбинации импульсов от различных клеток передаются по определенным нервным волокнам. К сожалению, первичные пигменты не сосредоточены каждый в отдельной клетке: могут быть клетки, в которых содержится смесь различных пигментов, клетки с красным и зеленым пигментами или со всеми тремя сразу (информация об этих трех пигментах будет «белой» информацией) и т. д. Есть много способов связать всю эту систему, и мы должны выяснить, какой из них предпочла природа. В то же время хочется надеяться, что, поняв физиологические связи, мы хоть немного продвинемся вперед в понимании некоторых психологических аспектов. Итак, вперед по этому пути!
§ 2. Физиология зрения
Мы начали говорить не только о цветовом зрении, но о зрении вообще только для того, чтобы напомнить о внутренних связях в сетчатке, показанных на фиг. 35.2. Сетчатка поистине напоминает поверхность мозга. Хотя настоящая картина под микроскопом выглядит несколько более сложно, чем этот схематический рисунок, но тем не менее при тщательном анализе можно увидеть все эти внутренние связи. Дело не в том, что одна часть сетчатки связана с другими частями и что информация, переданная по длинным аксонам, образующим зрительный нерв, представляет собой комбинированную информацию от многих клеток. Дело в том, что существуют три слоя клеток, функции которых следующие: во-первых, это фоторецепторы, на которые непосредственно действует свет, затем промежуточные клетки, которые принимают информацию от одного или нескольких фоторецепторов и снова отдают ее нескольким клеткам третьего слоя, а затем в мозг. Между клетками различных слоев существуют разнообразные перекрещивающиеся связи.
Вернемся к некоторым аспектам строения и функции глаза (см. фиг. 35.1). Свет фокусируется главным образом роговицей, благодаря тому, что поверхность ее искривлена и она «загибает» лучи света. Вот почему под водой мы видим не так хорошо, ибо показатели преломления роговицы (1,37) и воды (1,33) разнятся недостаточно сильно. Позади роговицы находится практически водная среда с показателем преломления 1,33, а дальше — хрусталик, строение которого очень интересно: он состоит из целого ряда слоев, как луковица, с той только разницей, что эти слои прозрачные и показатель преломления их меняется от 1,40 в середине до 1,38 по краям. (Неплохо было бы изготовить линзу с необходимым показателем преломления в любом месте; тогда нам незачем было бы так искривлять ее, как это делается с линзой с постоянным показателем преломления.) Более того, форма роговицы вовсе не сферическая. Сферическая линза обладает известной сферической аберрацией. Наружная часть роговицы более «плоская», чем у сферы, причем как раз настолько, чтобы сферическая аберрация ее оказалась меньше аберрации той сферической линзы, которую мы поставили бы вместо нее! Посредством этой оптической системы роговица — хрусталик свет фокусируется на сетчатку. Если мы смотрим на близко расположенные или удаленные предметы, то хрусталик искривляется или выпрямляется, изменяя тем самым фокусное расстояние и настраиваясь на различную удаленность. Для регулирования общего количества света в глазе имеется радужная оболочка, или радужка, которая определяет «цвет» глаз — у кого карие, у кого голубые. При увеличении количества света оболочка сжимается и зрачок уменьшается, при уменьшении — оболочка расходится и зрачок увеличивается.
Фиг. 36.3. Нервные связи, управляющие механическими движениями глаза.
Рассмотрим теперь изображенный на фиг. 36.3 нервный механизм, регулирующий аккомодацию хрусталика, движение глаза (способность глаза поворачивать глазное яблоко в глазнице) и диаметр зрачка. Основная часть всей информации попадает в зрительный нерв А, который разделяется на два пучка (о них мы еще будем говорить), и по ним идет в мозг. Однако имеется несколько волокон (именно они сейчас нам и интересны), которые не идут прямо в зрительную кору, где мы «видим» изображение, а вместо этого отправляются в средний мозг Н. Это как раз те волокна, по которым передается информация о средней освещенности и приказы о необходимом диаметре зрачка или, если изображение кажется расплывчатым, о кривизне хрусталика. Если же изображение раздвоено, то по этим волокнам посылается приказ подрегулировать глаза для бинокулярного зрения. Во всяком случае, они проходят через центр мозга и возвращаются назад в глаз. Буквой K обозначены мышцы, которые управляют хрусталиком при аккомодации, а буквой L — ресничные мышцы. Радужка имеет две мышечные системы: 1) мышца, суживающая зрачок (циркулярная мышца) L; она работает очень быстро и связана непосредственно с мозгом коротким аксоном; 2) мышца, расширяющая зрачок (радиальная мышца), которая действует тогда, когда освещение предмета уменьшается и циркулярная мышца расслабляется. Как и во многих других частях тела, здесь тоже пара мышц работает в противоположных направлениях; почти в каждом таком случае управляющая ими нервная система «настроена» настолько точно, что, когда одной из них посылается приказ сжаться, другой автоматически посылается приказ расслабиться. Однако радужка представляет любопытное исключение: нервы, которые заставляют оболочку сжиматься, мы только что описали, но до сих пор никому точно не известно, откуда выходят нервы, заставляющие ее разжиматься. Они идут куда-то вниз, в спинной мозг в области грудной клетки, из спинного мозга вверх через шейный нервный узел, потом опять назад в голову и к другому концу радужки. Сигнал фактически проходит через совершенно другую нервную систему, не через центральную, а через симпатическую. Очень странно, для чего все это нужно.
В глазе, как мы подчеркивали, имеется еще одна странность: светочувствительные клетки расположены в сетчатке в глубине, так что, прежде чем попасть в рецепторы, свет должен пройти через несколько слоев других клеток: сетчатка как бы вывернута наизнанку! В общем некоторые вещи в устройстве глаза кажутся нам великолепными, а некоторые — просто глупыми.
На фиг. 36.4 показана связь глаза с частью мозга, наиболее непосредственно принимающей участие в процессе зрения.
Фиг. 36.4. Нервная связь глаза со зрительной корой.
Зрительные нервные волокна идут в некоторую область, лежащую сразу же за участком D, называемым латеральным коленчатым телом, а затем в участок мозга, называемый зрительной корой. Следует помнить, что от каждого глаза некоторые волокна направляются в другую половину мозга, так что представленная картина не полна. Зрительные нервы от левой части правого глаза проходят через зрительный перекрест B, тогда как нервы от левой части левого глаза обходят его сбоку. Таким образом, левая часть мозга получает всю информацию, идущую от левых сторон обоих глаз, т. е. правой стороны поля зрения, тогда как правая сторона мозга «видит» левую часть поля зрения. Вот каким способом происходит сложение информации от обоих глаз и определяется удаленность предмета. Такова система бинокулярного зрения.
Очень интересны связи между сетчаткой и зрительной корой. Если мы в сетчатке каким-то образом возбудим или разрушим некоторую область, то умирает все волокно, поэтому мы можем узнать, куда оно идет, с чем оно связано. Самое интересное то, что между сетчаткой и зрительной корой, оказывается, существует однозначное соответствие: каждому пятну на сетчатке соответствует пятно в зрительной коре, и два рядом расположенных пятна на сетчатке окажутся рядом и в зрительной коре. Так что зрительная кора, кроме всего прочего, отражает и пространственное расположение палочек и колбочек, хотя и очень искаженно. Предметы, находящиеся в центре поля зрения и занимающие очень мало места на сетчатке, в зрительной коре распространяются на очень много клеток. Ясно, что очень важно, чтобы первоначально расположенные близко предметы оказались так же близко расположенными и в зрительной коре. Однако самое интересное здесь вот что. Участок, который, казалось бы, наиболее важен для близко расположенных предметов, находится как раз в середине поля зрения. Поистине невероятно, но прямая вертикальная линия в середине поля зрения обладает тем свойством, что информация, полученная от всех точек, расположенных справа от нее, поступает в левое полушарие мозга, а информация от точек, расположенных слева,— в правое полушарие. Но прямо посредине проходит граница, так что предметы, которые очень близки и расположены в середине по разные стороны от границы, в мозге оказываются очень далекими! Информация через какие-то другие каналы все же как-то проходит из одной стороны мозга в другую, и это очень странно.
Очень интересно, как все это связывается вместе. Вопрос о том, что уже связано и что еще нужно научиться связывать, довольно стар. Прежде думали, что, по-видимому, никаких врожденных связей вообще нет; имеются только какие-то грубые наметки, и лишь потом на опыте еще в детстве постигают, что когда предмет находится «вон там», то это дает такое-то ощущение. (Врачи постоянно уверенно заявляют о том, что чувствуют маленькие дети, но откуда сами они знают, что чувствует годовалый ребенок?) Может быть, годовалый ребенок, видя предметы «вон там», испытывает какое-то чувство и учится протягивать руку именно «туда», потому что когда он протягивает ее «сюда», то схватить предмет не удается. Но, по-видимому, этот подход все же неверен, ибо, как мы уже видели, во многих случаях такие специфические промежуточные связи существуют уже с рождения.
Более показательны в этом отношении замечательные опыты над саламандрами. (К счастью, у саламандры имеется прямая перекрестная связь без зрительного перекреста, поскольку у нее глаза расположены по бокам головы и поля зрения обоих глаз не перекрываются. Саламандрам поэтому бинокулярное зрение ни к чему.) Опыты эти состоят в следующем. Мы можем перерезать зрительный нерв у саламандры, но он, однако, снова начнет расти из глаз. Так будут восстанавливаться сами собой тысячи и тысячи клеток. И хотя волокна зрительных нервов не будут лежать рядом (они теперь напоминают большой небрежно изготовленный телефонный кабель, все волокна которого перекручены и перепутаны), однако, достигнув мозга, они снова расположатся в надлежащем порядке. Когда перерезают зрительный нерв саламандры, то возникает вопрос: восстанавливается ли он снова? Да, восстанавливается. Таков замечательный ответ. Если саламандре перерезать зрительный нерв, то он снова вырастает и она будет видеть ничуть не хуже, чем раньше. Однако если мы перережем зрительный нерв и перевернем глаз, а потом оставим его в покое, то нервы снова вырастут и саламандра прозреет, но теперь она будет совершать ужасные ошибки: увидев муху вверху, саламандра прыгнет вниз, и она уже никогда не сможет «выучиться» действовать правильно. Так что каким-то непостижимым образом тысячи и тысячи клеток нервных волокон находят в мозге свое истинное место.
Проблема связей в мозге, т. е. в какой степени все там связано и в какой нет,— важнейшая проблема в теории развития живых существ. Ответ еще неизвестен, но его интенсивно ищут.
Аналогичный опыт с золотой рыбкой приводит к тому же результату: в том месте, где мы перережем нерв, образуется страшный узел, подобно большому шраму или опухоли, и, несмотря на все это, волокна снова «прорастут» в мозг к своему истинному месту. Для того чтобы это произошло, волокна, поскольку они растут по старому каналу зрительного нерва, «должны решать», в каком направлении расти. Но как им удается это делать? Возможно, что здесь работает какой-то химический механизм, который по-разному действует на разные волокна. Подумать только, сколь огромно число растущих волокон и каждое из них как-то, по-своему отличается от соседних; реагируя на какой-то химический механизм, оно делает это достаточно однозначно, чтобы отыскать свое истинное место среди окончательных связей в мозге! Это поразительно, фантастично! Это одно из величайших явлений, открытых биологами за последнее время, и оно, несомненно, связано со многими старыми нерешенными проблемами роста, организации и развития организма, особенно зародыша.
Другое интересное явление связано с движением глаза. Чтобы добиться совпадения двух изображений, глаз должен обладать способностью двигаться. Эти движения могут быть разного рода: когда мы следим за чем-то, оба глаза должны поворачиваться одновременно в одном направлении — вправо или влево; когда мы следим за удаляющимся или приближающимся предметом, глаза должны двигаться в противоположных направлениях. Нервы, подходящие к мышцам глаза, как раз приспособлены для этих целей. Одни нервы заставляют наружные мышцы, например левого глаза и внутренние мышцы правого, сокращаться, а противоположные мышцы — расслабляться, так что оба глаза движутся в одну сторону. Но есть и другие центры, возбуждение которых заставляет глаза двигаться навстречу друг другу. Любой глаз может быть скошен в уголок, если второй при этом движется к носу, но совершенно невозможно сознательно или несознательно одновременно повернуть оба глаза в разные стороны, и вовсе не потому, что нет мышц, способных сделать это, а потому, что нет способа послать такие сигналы, чтобы оба глаза отвернулись в разные стороны. (Разумеется, если не произошло никакого нарушения, например не перерезан нерв.) И хотя мышцы одного глаза вполне могут поворачивать его как угодно, даже йоги никаким усилием воли не могут повернуть оба глаза в разные стороны. Просто потому, что нет никакой возможности сделать это. В какой-то мере мы уже скованы от рождения. Это очень важный пункт, ибо большинство прежних книг по анатомии и психологии не признавало или не замечало того факта, что мы в такой степени скованы с самого рождения; они утверждали, что можно всему научиться.
§ 3. Палочки
Посмотрим теперь подробнее, что происходит в палочках сетчатки. На фиг. 36.5 показана микрофотография середины палочки (конец ее выходит вверх за пределы снимка).
Фиг. 36.5. Электронная микрофотография палочки.
Справа в увеличенном виде слой за слоем видны плоские структуры, содержащие родопсин (зрительный пурпур) — красящее вещество, или пигмент, который, собственно, и обусловливает функцию палочек. Родопсин представляет собой большие молекулы белка, содержащего специальную группу, называемую ретиненом, которая может быть отщеплена от белка, что, несомненно, и является главной причиной поглощения света. Нам пока не понятно, почему эти структуры плоские, но весьма возможно, что это сделано для того, чтобы молекулы родопсина лежали параллельно друг другу. Химия этого явления известна сейчас довольно хорошо, но, кроме того, возможно, что здесь принимает участие и физика. Может оказаться, что все молекулы располагаются в своего рода ряд, и когда одна из них возбуждается, то вылетевший при этом электрон (или просто волна возбуждения) доходит до некоторого места в конце структуры и порождает сигнал или что-нибудь аналогичное. Это очень важная область, и она еще совсем не разработана. Это поле деятельности для биохимии и физики твердого тела или чего-то в этом духе.
Те же самые слоистые структуры найдены и в других местах, где тоже важен свет, например в хлоропласте растений, где под действием света происходит фотосинтез. При большом увеличении мы обнаруживаем те же самые слои, но, конечно, вместо ретинена мы находим хлорофилл. Химическая форма ретинена показана на фиг. 36.6.
Фиг. 36.6. Строение ретинена.
Его боковая ветвь содержит серию альтернирующих двойных связей, характерную почти для всех сильно поглощающих органических веществ, подобных хлорофиллу, гемоглобину и т. д. Эти вещества человек не может изготовить в своих собственных клетках и должен получать их с пищей в виде специального вещества, в точности похожего на ретинен, за исключением водородной связи на правом конце. Называется это вещество витамином А. Если в пище его недостаточно, то запас ретинена в организме не пополняется и развивается то, что мы называем куриной слепотой, т. е. количества пигмента будет недостаточно для того, чтобы можно было видеть в сумерках.
Известно также, почему такая серия двойных связей очень сильно поглощает свет. Я немного расскажу вам об этом. Альтернирующая серия двойных связей называется сопряженной двойной связью. Двойная связь означает, что там есть дополнительный электрон, который легко сдвинуть вправо или влево. Когда свет ударяет по этой молекуле, то электрон каждой двойной связи на один шаг сдвигается. В результате сдвинутся электроны во всей цепи, подобно тому, как упадут при толчке поставленные друг за другом костяшки домино, и хотя каждый из них проходит очень небольшое расстояние (мы считаем, что в отдельном атоме электрон может проходить только очень маленькое расстояние), в целом получается такой же эффект, как будто электрон с одного конца перескочил на другой! Это то же самое, как если бы один электрон прошел все расстояние взад и вперед, а в таком случае происходит значительно более сильное поглощение под действием электрического поля, чем если бы мы передвинули электрон только на расстояние, связанное с одним атомом. А поскольку двигать электрон взад и вперед не так уже трудно, то ретинен очень сильно поглощает свет; таков механизм, в основе которого лежит физика и химия.
§ 4. Сложные глаза насекомых
Вернемся теперь к биологии. Человеческий глаз — отнюдь не единственный тип глаза. Хотя глаза почти всех позвоночных похожи на человеческие, однако у низших животных мы встречаем множество других типов глаз. Обсуждать их у нас нет времени. Но среди беспозвоночных (например, у насекомых) встречаются и высокоразвитые типы глаз; это сложные, или фасеточные, глаза. (У большинства насекомых, кроме больших фасеточных глаз, есть еще простые глаза, или глазки.) Наиболее тщательно изучалось зрение пчелы. Изучать особенности зрения пчел легко, ибо их, как известно, привлекает мед и мы можем ставить опыты, смазывая медом, например, голубую или красную бумагу и наблюдая, какая из них привлечет пчелу. Этим методом были обнаружены очень интересные особенности зрения пчелы.
Прежде всего, пытаясь определить, насколько отчетливо пчела видит разницу между двумя кусочками «белой» бумаги, некоторые исследователи нашли, что она видит ее не очень хорошо, а другие, наоборот, что она делает это чертовски здорово. Даже если брались два почти в точности одинаковых кусочка бумаги, пчела все же различала их. Один кусок бумаги, например, отбеливался цинковыми белилами, а другой — свинцовыми, и, хотя оба они выглядели в точности одинаково, пчела различала их, ибо они по-разному отражают ультрафиолетовый свет. Таким образом, было обнаружено, что глаз пчелы чувствителен к более коротким длинам волн, чем глаз человека. Наши глаза видят в диапазоне от 7000 до 4000 Å, от красного до фиолетового, а пчелы могут видеть вплоть до 3000 Å, т. е. в ультрафиолетовой области! А это порождает целый ряд очень интересных эффектов. Прежде всего пчелы различают многие цветы, которые нам кажутся абсолютно одинаковыми. В этом нет ничего удивительного; ведь цветы цветут вовсе не для того, чтобы радовать наш взор. Они служат приманкой для пчел, своеобразным сигналом о том, что здесь есть мед. Всем известно, что есть очень много «белых» цветов. Цвет, который нам кажется белым, по-видимому, пчелы не видят, ибо выяснилось, что разные белые цветы не отражают ультрафиолетовые лучи столь полно, как это делают истинно белые цветы. От белого предмета отражается не весь падающий на него свет, ультрафиолетовые лучи теряются, а это в точности то же, что для нас потеря голубого цвета, т. е. получение желтого цвета. Итак, все белые цветы кажутся пчелам цветными. Однако нам известно также, что пчелы не видят красного цвета. Выходит, можно считать, что красные цветы кажутся пчелам черными? Ничего подобного! Тщательное изучение красных цветов показывает, что, во-первых, даже наши глаза способны различать у огромного большинства красных цветов легкий синеватый оттенок, вызванный дополнительным отражением большинством из них синего цвета, который находится в видимой пчелами области. Кроме того, опыты также показывают, что цветы отличаются по своей способности отражать ультрафиолет от различных частей лепестка и т. д. Итак, если бы мы могли видеть цветы такими, как их видят пчелы, то нашли бы их еще прекраснее и разнообразнее!
Впрочем, было обнаружено, что имеются такие красные цветы, которые не отражают голубых или ультрафиолетовых лучей, поэтому они должны казаться пчелам черными! Это в какой-то степени объясняет недоумение тех людей, которых очень волнует этот вопрос: ведь черный цвет не кажется привлекательным, да и трудно его отличить от грязной густой тени. Так оно и получается на самом деле: пчелы не прилетают на эти цветы. Но зато как раз они нравятся крохотным колибри; оказывается, эти птички отлично видят красный цвет!
Еще одна интересная сторона зрения пчелы. Взглянув на кусочек голубого неба и не видя самого солнца, пчела, по-видимому, может все-таки определить, где находится солнце. Для нас это не так-то просто. Посмотрите из окна на небо. Вы видите, что оно голубое. А в каком направлении находится сейчас солнце? Пчела может это определить, ибо она очень чувствительна к направлению поляризованного света, а отраженный от неба свет поляризован[27]. До сих пор спорят о том, как это ей удается: то ли потому, что рассеяние света различно при разных обстоятельствах, то ли глаза пчелы непосредственно чувствительны к направлению поляризованного света. В самое недавнее время получены данные о непосредственной чувствительности глаза пчелы.
Говорят также, что пчела способна различать отдельные вспышки света с частотой 200 раз в 1 сек, тогда как мы различаем только 20 вспышек. В улье пчелы движутся очень быстро; они шевелят лапками, машут крылышками, но наши глаза с трудом успевают уследить за всеми этими движениями. Вот если бы мы могли различать более быстрые мелькания, тогда другое дело. Видимо, для пчелы очень важно, чтобы ее глаза имели столь быструю реакцию.
Теперь поговорим о том, какова, собственно, острота зрения у пчелы? Глаз пчелы сложный; состоит он из огромного числа особых глазков, называемых омматидиями, которые расположены на почти сферической поверхности по бокам головы насекомого.
Фиг. 36.7. Строение омматидия.
На фиг. 36.7 показан омматидий. В его вершине находится прозрачная область, своего рода «хрусталик», но в действительности это больше напоминает фильтр, заставляющий свет идти вдоль узкого волокна, где, по-видимому, и происходит его поглощение. От другого его конца отходит нервное волокно. Центральное нервное волокно имеет по бокам шесть клеток, от которых по сути дела оно и отходит. Для наших целей этого описания вполне достаточно; главное то, что клетка имеет коническую форму, и множество таких клеток, примыкая друг к другу, образует поверхность глаза пчелы.
Фиг. 36.8. Схема распределения омматидиев на поверхности глаза пчелы.
Посмотрим теперь, каково разрешение такого глаза. Проведем линию (фиг. 36.8), схематически представляющую омматидий, на поверхности глаза, который мы будем считать сферой радиусом r. Мы сейчас попытаемся вычислить ширину каждого омматидия, для чего напряжем немного нашу сообразительность и предположим, что природа столь же сообразительна, как и мы! Если омматидий очень велик, то разрешение не может быть большим. Иначе говоря, один омматидий получает информацию об одном направлении, соседний — о другом и т. д., а предметы, попавшие в промежуток, пчела не сможет видеть достаточно хорошо. Таким образом, неопределенность остроты зрения глаза, несомненно, связана с угловым размером конца омматидия относительно центра кривизны глаза. (На самом деле глаза расположены только на поверхности головы.) Но угол от одного омматидия до следующего равен, конечно, диаметру омматидия, деленному на радиус кривизны поверхности глаза:
(36.1)
Итак, можно сказать: «Чем меньше будет значение δ, тем больше окажется острота зрения. Но почему же тогда природа не дала пчеле очень-очень мелкие омматидии?» В ответ можно сказать следующее: мы уже достаточно хорошо знаем физику, чтобы понять, что при попытке пропустить свет через узкую щелку из-за дифракции невозможно достаточно хорошо видеть в данном направлении, ибо туда будет попадать свет от различных направлений, т. е. от всех направлений, находящихся внутри угла Δθd, такого, что
(36.2)
Теперь ясно, что, если взять δ слишком маленьким, каждый омматидий вследствие дифракции будет видеть не только в одном направлении! Но если сделать значение δ слишком большим, то, хотя каждый будет смотреть в одном направлении, их окажется слишком мало, чтобы получить достаточно подробную картину. Таким образом, мы должны подобрать такое расстояние d, чтобы полный эффект этих двух механизмов был минимальным. Если мы сложим два выражения и найдем место, где сумма имеет минимум, то получим
(36.3)
что дает расстояние
(36.4)
Если мы для оценки будем считать, что r приблизительно равно 3 мм, а длину волны света, который пчела видит, примем равной 4000 А, то после умножения и извлечения корня найдем
В книгах указывается диаметр, равный 30 мк. Как видите, согласие оказывается довольно хорошим! Ясно, что именно этот механизм определяет размер глаза пчелы и он вполне доступен нашему пониманию. Подставив теперь полученное число в (36.1), легко определить, каково угловое разрешение глаза пчелы. Оно оказывается очень плохим по сравнению с глазом человека. Мы способны видеть вещи, кажущийся размер которых в тридцать раз меньше, чем видит пчела. Так что по сравнению с человеком изображение у пчелы получается довольно расплывчатое, несфокусированное.
Фиг. 36.9. Оптимальный размер омматидия, равный δm.
Тем не менее так оно есть, и на большее она просто не может рассчитывать. Естественно возникает вопрос: а почему бы пчеле не завести себе такой же глаз, как у нас, с хрусталиком и со всем прочим? Этому мешает несколько довольно интересных причин. Прежде всего пчела слишком мала; если бы у нее был глаз, похожий на наш, но соответственно уменьшенный, то размер зрачка оказался бы порядка 30 мк, а поэтому дифракция была бы так велика, что пчела все равно не видела бы лучше. Слишком маленький глаз — это не очень хорошо. Потом, если сделать глаз большим, как голова пчелы, то он занял бы всю голову. Ведь ценность сложного глаза в том и состоит, что он практически не занимает места — просто тоненький слой на поверхности головы пчелы. Так что, прежде чем давать советы пчеле, не забывайте, что у нее есть свои собственные проблемы!
§ 5. Другие типы глаз
Кроме пчел, многие другие животные могут различать цвета. Рыбы, бабочки, птицы и пресмыкающиеся тоже могут различать цвета. А вот большинство млекопитающих, как полагают, не могут. Приматы, однако, различают. Птицы, несомненно, различают цвета, об этом говорит их окраска.
Какой был бы смысл самцам так блистательно ярко наряжаться, если бы самки не могли это видеть! Иначе говоря, привлекающее оперение, которым обладают птицы, и есть результат того, что самки способны различать цвета. Так что в следующий раз, когда вы увидите павлина и будете удивляться этой сверкающей выставке ярких красок, восхищаться утонченно подобранными цветами и замирать перед удивительным чувством эстетики птицы, не забудьте, что ваш восторг относится собственно к самке павлина, к ее наблюдательности и тонкому вкусу: только это ведь и породило столь удивительное зрелище!
Большинство беспозвоночных имеют либо недоразвитые, либо сложные глаза, а глаза всех позвоночных животных похожи на глаз человека. Однако есть одно исключение. Рассматривая высшие формы животных, мы обычно восклицаем: «Ну конечно, так и есть!», но если встать на менее предвзятую точку зрения и ограничиться только беспозвоночными, чтобы исключить нас самих, и спросить зоологов, какое из беспозвоночных животных они считают наиболее развитым, то большинство из них в один голос ответят — осьминог! Весьма интересно, что, помимо развитого мозга, его реакций и прочего, которые слишком хороши для беспозвоночного, осьминог имеет высокоразвитый глаз, совершенно непохожий на глаза кого-либо другого. Это не сложный глаз и не светочувствительное пятно, в нем есть и роговица, и веко, есть и радужка, и две полости, заполненные жидкостью, и хрусталик, и сетчатка (фиг. 36.10).
Фиг. 36.10. Глаз осьминога.
В точности то же, что и у позвоночных! Это замечательный пример совпадения в эволюции, когда природа дважды пришла к одному и тому же решению проблемы, но с одним небольшим улучшением. Сетчатка у осьминога, как оказалось, представляет собой тоже часть мозга, и образовалась она при эмбриональном развитии, как у позвоночных животных, но имеется одно очень интересное и поразительное отличие: чувствительные к свету клетки расположены не позади слоев других клеток, как у нас, а непосредственно на внутренней поверхности глазного яблока, а клетки, занимающиеся вычислением,— позади них. Теперь мы по крайней мере видим, что в расположении клеток в нашем глазе глубокого смысла нет. В другой раз природе пришлось исправить свою ошибку! Самыми большими глазами наделен громадный спрут: диаметр их 38 см!
§ 6. Нервные механизмы зрения
Одной из основных тем этой главы является взаимосвязь и взаимоинформация отдельных частей глаза. Давайте рассмотрим сложный глаз краба-мечехвоста, над которым было проделано довольно много опытов. Прежде всего нужно понять, какого сорта информация может передаваться по нервам. По нерву передается нечто вроде возмущения электрической природы, которое может быть легко зарегистрировано. Это некое волнообразное возмущение, которое бежит по нерву и вызывает на другом его конце какой-то эффект. Информацию переносит длинный отросток нервной клетки, называемый аксоном, и если один конец аксона возбужден, то по нему бежит «импульс». Далее, если по нерву уже проходит один импульс, то за ним не может немедленно последовать второй. Все импульсы имеют одну и ту же величину, так что, когда нерв сильно возбужден, это вовсе не означает, что по нему бежит больший импульс, а просто увеличивается число импульсов в 1 сек. Величина же импульса определяется нервным волокном. Это важно усвоить, чтобы понять, что произойдет дальше.
Фиг. 36.11. Сложный глаз краба-мечехвоста, а — общий вид; б — в разрезе.
На фиг. 36.11,а показан сложный глаз краба-мечехвоста; в нем всего лишь около тысячи омматидиев. Фиг. 36.11, б представляет собой поперечный разрез этой системы. Видны отдельные омматидии и нервные волокна, соединяющие их с мозгом. Но обратите внимание, что даже у этого краба имеются внутренние связи. Они, конечно, гораздо менее сложные, чем в глазе человека, но именно это-то и дает нам возможность изучить подобные связи на простом примере.
Давайте рассмотрим такой опыт: наложим на зрительный нерв нашего краба небольшие электроды и осветим только один омматидий; это легко можно сделать с помощью линз. Если мы в какой-то момент времени t0 включим свет и будем измерять возникающие электрические импульсы, то увидим, что после небольшой задержки последует быстрая серия разрядов, частота которых постепенно будет уменьшаться, пока не достигнет какой-то равномерности (фиг. 36.12,а). После выключения света разряды прекращаются. Интересно, что если усилитель остается связанным с тем же нервом, а мы направим свет на другой омматидий, то ничего не произойдет, сигналов не будет.
Фиг. 36.12. Ответная реакция на свет нервных волокон глаза краба-мечехвоста.
Проделаем теперь другой опыт: осветим первый омматидий и получим те же импульсы, но если теперь мы направим свет еще на другой соседний омматидий, то на короткое время импульсы прекращаются, после чего импульсы «побегут» снова, но с гораздо меньшей частотой (фиг. 36.12,б). Оказывается, что импульсы, возникающие во втором омматидий, затормаживают импульсы первого! Другими словами, хотя каждый нерв и несет информацию о своем омматидий, количество этой информации подавляется сигналами от другого омматидия. Например, когда более или менее равномерно освещен весь глаз, то сигнал, пришедший от любого отдельного омматидия, будет относительно слабым, ибо он подавлен множеством других сигналов. Торможение аддитивно, т. е. если мы осветим несколько соседних омматидиев, торможение будет очень сильным.
Торможение оказывается большим, если омматидии расположены ближе, но если они достаточно удалены друг от друга, то торможение практически сводится к нулю. Таким образом, торможение аддитивно и зависит от расстояния. Это первый пример, когда информация от различных частей глаза перерабатывается в нем самом. Если подумать немного, то можно понять, что этот механизм предназначен для усиления контраста на краях объекта, ибо если часть предмета освещена, а часть нет, то омматидии, направленные на освещенную область, дают импульсы, которые затормаживаются всеми соседними омматидиями, видящими освещенную область, так что они относительно слабы. С другой стороны, омматидии, видящие границу световой области и дающие «белый» сигнал, хотя и подавлены своими соседями, но тех не столь уж много, ибо некоторые из них совсем темные (не видят света), в результате чего сигнал оказывается более сильным. В итоге получается кривая, подобная изображенной на фиг. 36.13. Краб как бы видит «усиленный» контур.
Фиг. 36.13. Ответная реакция омматидия краба-мечехвоста на резкий освещенный край.
Однако тот факт, что существует такое «усиление» контура, известен уже давно. Это действительно замечательная вещь, которая неоднократно обсуждалась психологами. Чтобы изобразить предмет, нам достаточно нарисовать лишь его контур. Ведь мы привыкли видеть картины, на которых изображены одни только контуры! Но что же такое контур? Ведь это просто граница между темным и светлым или между одним цветом и другим. В самом деле, это вовсе не что-то определенное. Можно думать, что угодно, но никакой линии вокруг предмета нет! Нет, все это только наша выдумка. Теперь мы начинаем понимать, почему нам достаточно контура, чтобы представить себе весь предмет. По-видимому, наши глаза тоже работают, подобно глазам мечехвоста, разумеется, гораздо более сложно, но все же аналогично.
Наконец, я вкратце опишу более сложные опыты, очень красивые, и трудные, которые были проделаны над лягушкой. При выполнении их в зрительный нерв лягушки вводились миниатюрные искусно сделанные нитеобразные зонды и измерялись сигналы, идущие вдоль одного определенного аксона; точно так же как в случае с крабом-мечехвостом, было обнаружено, что информация зависит не просто от одной точки глаза, а является суммой информации, полученных от нескольких частей.
Наиболее современная картина операций на глазе лягушки выглядит следующим образом. Можно найти четыре типа различных зрительных нервных волокон, в том смысле, что существуют четыре различных сорта ответных реакций. В этих экспериментах не было вспышек света: лягушка не замечает таких вещей. Она просто сидит, и глаза ее неподвижны до тех пор, пока листок лилии не начнет двигаться. Тогда глаза лягушки движутся как раз так, чтобы изображение оставалось в поле зрения. Однако сама по себе лягушка глазами не ворочает и не ищет, куда девался объект. Если в поле ее зрения движется что-то, напоминающее небольшое насекомое (нужно, чтобы она могла видеть нечто маленькое, движущееся на неподвижном фоне), то обнаруживаются четыре различных сорта нервных волокон, отвечающих на это раздражение. Их свойства приведены в табл. 36.1. Длительное (нестираемое) обнаружение края означает, что если мы внесем предмет с резким краем в поле зрения лягушки, то в тех фоторецепторах, мимо которых он движется, возникает множество импульсов, которые переходят затем в редкие импульсы, продолжающиеся до тех пор, пока край находится в поле зрения, даже если он стоит на месте.
Таблица 36.1 ТИПЫ ОТВЕТНЫХ РЕАКЦИЙ ЗРИТЕЛЬНЫХ НЕРВНЫХ ВОЛОКОН У ЛЯГУШКИ
После выключения света импульсы прекращаются. Если снова включить свет и край предмета по-прежнему находится в поле зрения, то импульсы возникают снова. Они не исчезают. Другой сорт волокон очень похож на первый, но с тем исключением, что они не работают, если край прямой. Нужно, чтобы край был изогнутым! Насколько сложной должна быть система взаимных связей сетчатки глаза лягушки, чтобы видеть движение изогнутой поверхности! Более того, если эти волокна чем-то возбуждены, то возбуждение не может держаться так же долго, как в первом случае, и если мы выключим свет и включим его снова, то импульсы не возобновятся. Впрочем, это зависит от движения выпуклой поверхности. Глаз видит ее движение и помнит, где она находится, но если мы на момент выключим свет, то глаз просто забывает о ней и больше ее не видит.
Следующим типом является регистрация изменения контраста. Если край надвигается или отодвигается, то сигналы есть. Но если предмет стоит, то никаких сигналов вообще нет.
Затем есть «регистратор тусклости». Если интенсивность света уменьшается, то возникают импульсы, если она неизменна— импульсы прекращаются: регистратор работает, только когда свет тускнеет.
И, наконец, есть несколько волокон, которые служат регистраторами темноты. Самое удивительное, что они беспрестанно «стреляют»! Если свет усиливается, «выстрелы» становятся более редкими, а если ослабевает, то, наоборот, «огонь» становится более частым, но он не прекращается ни на секунду. В темноте же они «строчат», как сумасшедшие, напоминая постоянно: «Тьма! Тьма! Тьма!»
Все эти реакции кажутся слишком сложными, чтобы их можно было как-то классифицировать. Подозрительно даже, правильно ли истолкованы эксперименты. Но самое интересное, что эти же классы очень отчетливо выделяются самой анатомией лягушки! После того как волокна были расклассифицированы (очень важно, что это было сделано после), другие измерения обнаружили, что скорости импульсов, бегущих по различным волокнам, не одинаковы. Так что был найден другой независимый способ определения сорта волокна!
Еще один интересный вопрос: насколько велика анализирующая область, связанная с каким-то одним волокном? Ответ оказался различным для разных классов волокон.
Фиг. 36,14. Покрышка мозга лягушки.
На фиг. 36.14 показана поверхность так называемой покрышки мозга лягушки. Сюда приходят волокна из зрительного нерва. Все эти нервные волокна связаны с различными слоями покрышки. Слоистое строение ее напоминает строение сетчатки (это один из фактов, говорящих нам о том, что сетчатка и мозг весьма похожи друг на друга). Если теперь взять электрод и постепенно перемещать его вниз по слоям, то можно определить, где оканчиваются разные типы зрительных волокон. Опыт дает очень красивый и удивительный результат: оказывается, что различные сорта волокон оканчиваются в различных слоях! В первом слое оканчивается первый тип волокон, во втором — второй; третий и пятый оканчиваются в одном и том же слое, а глубже всех проникает четвертый тип. (Вас не должно удивлять, что номера их почти совпали с номерами слоев! Именно поэтому они и пронумерованы таким образом, в ранних работах они нумеровались иначе!)
Все, что мы узнали, можно кратко сформулировать так: по-видимому, имеются три сорта пигментов. Может быть множество различных сортов рецепторов, в которые эти пигменты входят в различных пропорциях, однако множество внутренних связей позволяет складывать и вычитать эффекты отдельных нервных клеток. Таким образом, прежде чем мы действительно поймем цветовое зрение, необходимо понять конечный этап ощущение зрения вообще. Это все еще открытый вопрос, но исследования с микроэлектродами, возможно, дадут нам в конце концов дополнительные сведения о том, как же мы видим цвета.
Глава 37 КВАНТОВОЕ ПОВЕДЕНИЕ
§ 1. Атомная механика
В последних нескольких главах мы с вами рассмотрели многие существенные понятия, без которых невозможно разобраться ни в явлении света, ни вообще в электромагнитном излучении. (Некоторые специальные вопросы — теорию показателя преломления плотного вещества и полное внутреннее отражение — мы отложим до будущих времен.) Мы имели дело с так называемой «классической теорией» электромагнитных волн, и для множества явлений она давала достаточно точное описание природы. И нас не очень заботило при этом, что световая энергия всегда доставляется порциями — «фотонами».
Очередной темой, которой мы собираемся заняться (в главах, начиная с 39), является проблема поведения сравнительно крупных массивов вещества — их механических или, скажем, их тепловых свойств. Знакомясь с этими свойствами, мы увидим, что старая классическая теория здесь немедленно терпит неудачу, терпит по той причине, что вещество на самом деле состоит из частиц атомных размеров. И если все же мы намерены пользоваться старой теорией, то только потому, что это единственное, в чем мы можем разобраться с помощью изученной нами классической механики. Но наши успехи не будут велики. Мы обнаружим, что в отличие от теории света теория вещества на этом пути довольно быстро наталкивается на затруднения. Можно было бы, конечно, обойти все атомные эффекты стороной. Но вместо этого мы решили здесь вклинить небольшой экскурс в основные идеи квантовых свойств вещества, в квантовые представления атомной физики. Надо же, чтоб вы хоть примерно представляли, как выглядит то, что мы обходим. Все равно ведь атомные эффекты до того важны, что нам не миновать познакомиться с ними вплотную.
Стало быть, сейчас мы перейдем к введению в предмет квантовой механики. Но по-настоящему проникнуть в суть предмета вы сможете лишь намного позже.
Квантовая механика — это описание поведения мельчайших долек вещества, в частности всего происходящего в атомных масштабах. Поведение тела очень малого размера не похоже ни на что, с чем вы повседневно сталкиваетесь. Эти тела не ведут себя ни как волны, ни как частицы, ни как облака, или биллиардные шары, или грузы, подвешенные на пружинах,— словом, они не похожи ни на что из того, что вам хоть когда-нибудь приходилось видеть.
Ньютон считал, что свет состоит из частиц. А потом оказалось, как мы уже убедились, что свет ведет себя подобно волнам. Позже, однако (в начале XX века), обнаружили, что, действительно, поведение света временами напоминает частицу. Об электроне же, наоборот, сначала думали, что он похож на частицу, а потом было выяснено, что во многих отношениях он ведет себя как волна. Значит, на самом деле его поведение ни на что не похоже. И мы сдались. Мы так и говорим: «Он ни на что не похож».
Однако, к счастью, есть еще одна лазейка: дело в том, что электроны ведут себя в точности подобно свету. Квантовое поведение всех атомных объектов (электронов, протонов, нейтронов, фотонов и т. д.) одинаково: всех их можно назвать «частицами-волнами» (годится, впрочем, и любое другое название). Значит, все, что вы узнаете про свойства электронов (а именно они будут служить нам примером), все это будет применимо к любым «частицам», включая фотоны света.
В течение первой четверти нашего века постепенно накапливалась информация о поведении атомов и других мельчайших частиц, и знакомство с этим поведением вело ко все большему замешательству среди физиков. В 1926—1927 гг. оно было устранено работами Шредингера, Гейзенберга и Борна. Им удалось в конце концов получить непротиворечивое описание поведения вещества атомных размеров. Основные характерные черты этого описания мы и разберем в данной главе.
Раз поведение атомов так не похоже на наш обыденный опыт, то к нему очень трудно привыкнуть. И новичку в науке, и опытному физику — всем оно кажется своеобразным и туманным. Даже большие ученые не понимают его настолько, как им хотелось бы, и это совершенно естественно, потому что весь непосредственный опыт человека, вся его интуиция — все прилагается к крупным телам. Мы знаем, что будет с большим предметом; но именно так мельчайшие тельца и не поступают. Поэтому, изучая их, приходится прибегать к различного рода абстракциям, напрягать воображение и не пытаться связывать их с нашим непосредственным опытом.
В этой главе мы сразу же попробуем ухватить самый основной элемент таинственного поведения в самой странной его форме. Мы выбрали для анализа такое явление, которое невозможно, совершенно, абсолютно невозможно объяснить классическим образом. В этом явлении таится самая суть квантовой механики. Но на самом деле в нем прячется только одна-единственная тайна. Мы не можем раскрыть ее в том смысле, что не можем «объяснить», как она работает. Мы просто расскажем вам, как она работает. Рассказывая об этом, мы познакомим вас с основными особенностями всей квантовой механики.
§ 2. Опыт с пулеметной стрельбой
Пытаясь понять квантовое поведение электронов, мы сопоставим его с привычными нам движениями обычных частиц, похожих на пулю, и обычных волн, похожих на волны на воде. Сперва мы займемся стрельбой из устройства, схематически показанного на фиг. 37.1.
Фиг. 37.1. Опыт со стрельбой из пулемета.
Это пулемет, выпускающий целый сноп пуль. Он не очень хорош, этот пулемет. При стрельбе его пули рассеиваются на довольно широкий угол, как это изображено на рисунке. Перед пулеметом стоит плита (броневая), а в ней есть две дыры, через которые пуля свободно проходит. За плитой расположен земляной вал, который «поглощает» попавшие в него пули. Перед валом стоит предмет, который мы назовем «детектором». Им может служить, скажем, ящик с песком. Любая пуля, попав в детектор, застревает в нем. Если нужно, ящик открывают и все попавшие внутрь пули пересчитывают. Детектор можно передвигать взад и вперед (в направлении х). Этот прибор позволяет экспериментально ответить на вопрос: «Какова вероятность того, что пуля, проникшая сквозь плиту, попадет в вал на расстоянии х от середины?» Заметьте, что мы говорим только о вероятности, потому что невозможно сказать определенно, куда попадет очередная пуля. Пуля, даже попавшая в дыру, может срикошетить от ее края и уйти вообще неизвестно куда. Под «вероятностью» мы понимаем шанс попасть пулей в детектор, который установлен в х метрах от середины. Этот шанс можно измерить, подсчитав, сколько пуль попало в детектор за определенное время, а затем разделив это число на полное число пуль, попавших в вал за то же время. Или, полагая, что скорость стрельбы была одинакова, можно считать вероятность пропорциональной числу пуль, попавших в детектор за условленное время.
Для наших целей надо вообразить немного идеализированный опыт, когда пули не дают осколков и остаются целыми. Тогда мы обнаружим, что пули всегда попадают в детектор порциями: если уж мы что-то нащупали в детекторе, то это всегда целая пуля, а не половина и не четвертушка. Даже когда скорость стрельбы становится очень малой, все равно в детекторе за определенное время либо ничего не накапливается, либо обнаруживается целое — непременно целое — число пуль. Стало быть, размер порции не зависит от скорости стрельбы. Мы говорим поэтому: «Пули всегда приходят равными порциями». С помощью нашего детектора мы измеряем как раз вероятность прихода очередных порций как функцию х. Результат таких измерений (мы, правда, пока еще не провели такого эксперимента и сейчас просто воображаем, каким будет результат) изображен на графике фиг. 37.1,в. Вероятность в нем отложена вправо, а х — по вертикали, согласуясь с движением детектора. Вероятность обозначена P12, чтобы подчеркнуть, что пули могли проходить и сквозь отверстие 1, и сквозь отверстие 2. Вы, конечно, не удивитесь, что вероятность P12 близ середины графика велика, а по краям мала. Вас может, однако, смутить, почему наибольшее значение Р12 оказалось при х=0. Это легко понять, если один раз проделать опыт, заткнув дырку 2, а другой раз — дырку 1. В первом случае пули смогут проникать лишь сквозь дырку 1 и получится кривая P1(см. фиг. 37.1,б). Здесь, как и следовало ожидать, максимум P1 приходится на то х, которое лежит по прямой от пулемета через дырку 1. А если заткнуть дырку 1, то получится симметричная кривая Р2 — распределение вероятностей для пуль, проскочивших сквозь отверстие 2. Сравнив части б и в на фиг. 37.1, мы получаем важный результат
(37.1)
т. е. вероятности просто складываются. Действие двух дырок складывается из действий каждой дырки в отдельности. Этот результат наблюдений мы назовем отсутствием интерференции по причине, о которой вы узнаете после. На этом мы покончим с пулями.
Они приходят порциями, и вероятность их попадания складывается без интерференции.
§ 3. Опыт с волнами
Теперь проведем опыт с волнами на воде. Прибор показан схематически на фиг. 37.2.
Фиг. 37.2. Опыт с волнами на воде.
Это мелкое корытце, полное воды. Предмет, обозначенный как «источник волн», колеблясь при помощи моторчика вверх и вниз, вызывает круговые волны. Справа от источника опять стоит перегородка с двумя отверстиями, а дальше — вторая стенка, которая для простоты сделана поглощающей (чтобы волны не отражались): насыпана песчаная отмель. Перед отмелью помещается детектор; его опять, как и раньше, можно передвигать по оси х. Теперь детектор — это устройство, измеряющее «интенсивность» волнового движения. Представьте себе приспособление, измеряющее высоту волн. Если его шкалу откалибровать пропорционально квадрату высоты, то отсчеты шкалы смогут давать интенсивность волны. Детектор, таким образом, будет определять энергию, переносимую волной, или, точнее, долю энергии, доставляемую детектору.
Первое, в чем можно убедиться при помощи такого волнового аппарата,— это что интенсивность может быть любой величины. Когда источник движется еле-еле, то и детектор показывает тоже чуть заметное движение. Если же движение возрастет, то и в детекторе интенсивность подскочит. Интенсивность волны может быть какой угодно. Мы уже не скажем, что в интенсивности есть какая-то «порционность».
Заставим теперь волновой источник работать стабильно, а сами начнем измерять интенсивность волн при различных значениях х. Мы получим интересную кривую (кривая I12 на фиг. 37.2,в).
Но мы уже видели, откуда могут возникать такие картинки,— это было тогда, когда мы изучали интерференцию электрических волн. И здесь можно видеть, как первоначальная волна дифрагирует на отверстиях, как от каждой щели расходятся круги волн. Если на время одну щель прикрыть и измерить распределение интенсивности у поглотителя, то кривые выйдут довольно простыми (см. фиг. 37.2,б).
Кривая I1 — это интенсивность волн от щели 1 (когда ее измеряли, щель 2 была закрыта), а кривая I2 — интенсивность волн от щели 2 (при закрытой щели 1).
Мы видим со всей определенностью, что интенсивность I12, наблюдаемая, когда оба отверстия открыты, не равна сумме интенсивностей I1 и I2. Мы говорим, что здесь происходит «интерференция», наложение двух волн. В некоторых местах (где на кривой I12 наблюдается максимум) волны оказываются «в фазе», пики волн складываются вместе, давая большую амплитуду и тем самым большую интенсивность. В этих местах говорят о «конструктивной интерференции». Она наблюдается в тех местах, расстояние которых от одной из щелей на целое число длин волн больше (или меньше) расстояния от другой.
А в тех местах, куда две волны приходят со сдвигом фаз π (т. е. находятся «в противофазе»), движение волны представляет собой разность двух амплитуд. Волны «интерферируют деструктивно», интенсивность получается маленькой. Это бывает там, где расстояние от щели 1 до детектора отличается от расстояния между детектором и щелью 2 на нечетное число полуволн. Малые значения I12 на фиг. 37.2 отвечают местам, где две волны интерферируют деструктивно.
Вспомните теперь, что количественную связь между I1, I2 и I12 можно выразить следующим образом: мгновенная высота волны в детекторе от щели 1 может быть представлена в виде (действительной части) h'1eiωt, где «амплитуда» h'1, вообще говоря, комплексное число. Интенсивность пропорциональна среднему квадрату высоты, или, пользуясь комплексными числами, |h'1|2. Высота волн от щели 2 тоже равна h2eiωt, а интенсивность пропорциональна |h'2|2. Когда обе щели открыты, высоты волн складываются, давая высоту (h'1+h'2)eiωt и интенсивность |h1+h2|2. Множитель пропорциональности нас сейчас не интересует, так что формулу для интерферирующих волн можно записать в виде
(37.2)
Вы видите, что ничего похожего на то, что было с пулями, не получается. Раскрыв |h1+h2|2, мы напишем
(37.3)
где δ — разность фаз между h1 и h2. Вводя интенсивности из (37.2), можем написать
(37.4)
Последний член и есть «интерференционный член».
На этом мы покончим с волнами. Интенсивность их может быть любой, между ними возникает интерференция.
§ 4. Опыт с электронами
Представим себе теперь такой же опыт с электронами. Схема его изображена на фиг. 37.3.
Фиг. 37.3. Опыт с электронами.
Мы поставим электронную пушку, которая состоит из вольфрамовой проволочки, нагреваемой током и помещенной в металлическую коробку с отверстием. Если на проволочку подано отрицательное напряжение, а на коробку — положительное, то электроны, испущенные проволокой, будут разгоняться стенками и некоторые из них проскочат сквозь отверстие. Все электроны, которые выскочат из пушки, будут обладать (примерно) одинаковой энергией. А перед пушкой мы поставим снова стенку (на этот раз тонкую металлическую пластинку) с двумя дырочками. За стенкой стоит другая пластинка, она служит «земляным валом», поглотителем. Перед нею — подвижный детектор, скажем счетчик Гейгера, а еще лучше — электронный умножитель, к которому подсоединен динамик.
Заранее предупреждаем вас: не пытайтесь проделать этот опыт (в отличие от первых двух, которые вы, быть может, уже проделали). Этот опыт никогда никто так не ставил. Все дело в том, что для получения интересующих нас эффектов прибор должен быть чересчур миниатюрным. Мы с вами ставим сейчас «мысленный эксперимент», отличающийся от других тем, что его легко обдумать. Что должно в нем получиться, известно заранее, потому что уже проделано множество опытов на приборах, размеры и пропорции которых были подобраны так, чтобы стал заметен тот эффект, который мы сейчас опишем.
Первое, что мы замечаем в нашем опыте с электронами, это резкие «щелк», «щелк», доносящиеся из детектора (вернее, из динамика). Все «щелк» одинаковы. Никаких «полущелков».
Мы замечаем также, что они следуют совершенно не регулярно. Скажем, так: щелк..... щелк-щелк... щелк...... щелк.... щелк-щелк... ... щелк... и т. д. Кому случалось видеть счетчик Гейгера, знает, как он щелкает. Если подсчитать, сколько раз динамик щелкнул за достаточно длительное время (скажем, за несколько минут), а потом снова подсчитать, сколько он отщелкал за другой такой же промежуток времени, то оба числа будут почти одинаковыми. Можно поэтому говорить о средней частоте, с которой слышатся щелчки (столько-то «щелк» в минуту в среднем).
Когда мы переставляем детектор, частота щелчков то растет, то падает, но величина (громкость) каждого «щелк» всегда остается одной и той же. Если мы охладим проволоку в пушке, частота щелчков спадет, но каждый «щелк» будет звучать, как прежде. Поставим у поглотителя два отдельных детектора; тогда мы сразу заметим, что щелкает то один из них, то другой, но никогда оба вместе. (Разве что иногда наше ухо не разделит двух щелчков, последовавших очень быстро один за другим.) Мы заключаем поэтому, что все, что попадает в детектор, приходит туда «порциями». Все «порции» одной величины; в детектор (или поглотитель) попадает только целая «порция»; в каждый момент в поглотитель попадает только одна порция. Мы говорим: «Электроны всегда приходят одинаковыми порциями».
Как и в опыте со стрельбой из пулемета, мы попытаемся теперь поискать в новом опыте ответ на вопрос: «Какова относительная вероятность того, что электронная «порция» попадет в поглотитель на разных расстояниях х от середины?» Как и в том опыте, мы получим относительную вероятность, подсчитывая частоту щелчков при стабильно работающей пушке. Вероятность, что порции окажутся на определенном расстоянии х, пропорциональна средней частоте щелчков при этом х. В результате нашего опыта получена интереснейшая кривая P12, изображенная на фиг. 37.3,в. Да! Именно так и ведут себя электроны!
§ 5. Интерференция электронных волн
Попытаемся проанализировать кривую на фиг. 37.3 и посмотрим, сможем ли мы понять поведение электронов. Первое, что хочется отметить, это что раз они приходят порциями, то каждая из порций (ее тоже естественно именовать электроном) проходит либо сквозь отверстие 1, либо сквозь отверстие 2. Мы зафиксируем это в виде «Утверждения».
Утверждение А: Каждый электрон проходит либо сквозь отверстие 1, либо сквозь отверстие 2.
Если это предположить, то все электроны, достигшие поглотителя, можно разбить на два класса: 1) проникшие сквозь отверстие 1; 2) проникшие сквозь отверстие 2. Значит, полученная кривая — это сумма эффектов от электронов, прошедших сквозь отверстие 1, и электронов, прошедших сквозь отверстие 2. Давайте проверим это соображение экспериментально. Сначала проведем измерения с электронами, которые пройдут сквозь отверстие 1. Закроем отверстие 2 и подсчитаем щелчки в детекторе. Из частоты щелчков мы получим значение P1. Результат измерений показан на кривой P1 фиг. 37.3,б. Выглядит это вполне разумно. Точно таким же образом измерим P2 — распределение вероятностей для электронов, прошедших сквозь отверстие 2. Оно тоже показано на рисунке.
Кривая P12, полученная, когда оба отверстия открыты, явным образом не совпадает с суммой P1+P2 (суммой вероятностей при только одном работающем отверстии). По аналогии с нашим опытом с волнами на воде мы скажем: «Здесь есть интерференция»:
(37.5)
Откуда же могла появиться интерференция? Может, надо сказать так: «То, что порции проходят либо сквозь отверстие 1, либо сквозь отверстие 2,— это, по-видимому, неверно, ведь если бы это было так, то складывались бы вероятности. Должно быть, их движение сложней. Они разбиваются пополам и...» Да нет же! Это невозможно, они ведь всегда приходят целыми порциями... «Ну ладно, тогда может кое-кто из них, пройдя сквозь отверстие 1, заворачивает в 2, а после опять в 1, и так несколько раз, или еще как-то бродит по обоим отверстиям.
Тогда, закрыв отверстие 2, мы отрежем им путь и изменим вероятность того, что электрон, выйдя из отверстия 1, попадет в конце концов в поглотитель...» Но посмотрите-ка! Ведь есть такие точки на кривой, в которые при обоих открытых отверстиях попадает очень мало электронов, а при одном закрытом отверстии их попадает гораздо больше. Выходит, закрытие одного отверстия увеличивает число электронов, проходящих через другое. И наоборот, середина кривой P12 более чем вдвое превышает сумму P1+P2. Здесь, закрыв одно отверстие, вы тем самым уменьшаете число электронов, проходящих сквозь другое. Объяснить оба эффекта, предполагая, что электроны блуждают по сложным траекториям, пожалуй, довольно трудно.
Все это выглядит весьма таинственно. И тем таинственней, чем больше об этом думаешь. Идей, объясняющих кривую Р12 как результат сложного движения отдельных электронов через оба отверстия, было сфабриковано немало. Но ни одна из этих попыток не была успешной. Ни одна не смогла выразить Р12 через P1 и Р2.
При этом, как ни странно, математика, связывающая P1 и Р2 с P12, проста до чрезвычайности. Ведь кривая P12 ничем не отличается от кривой I12 на фиг. 37.2, а последнюю-то получить очень просто. То, что приближается к поглотителю, может быть описано двумя комплексными числами φ1 и φ2 (это функции от х). Квадрат абсолютной величины φ1 дает эффект от одного отверстия 1: P1=|φ1|2. Эффект, полученный при открытом отверстии 2, точно таким же образом получается из φ2, т. е. Р2=|φ212. А общее действие обоих отверстий выразится в виде P12=|φ1+φ2|2. Выкладки абсолютно те же, что и для волн на воде! (А попробуйте-ка, кстати, получить такой простой результат, считая, что электроны шныряют взад и вперед сквозь пластинку по необычным траекториям.)
В конце концов мы приходим к следующему заключению: электроны приходят порциями, подобно частицам, а вероятность прибытия этих порций распределена так же, как и интенсивность волн. Именно в этом смысле электрон и ведет себя «частично как частица, а частью как волна».
Заметим, кстати, что, имея дело с классическими волнами, мы определили интенсивность как среднее по времени от квадрата амплитуды волны и применили комплексные числа как математический прием, облегчающий расчеты. Но в квантовой механике амплитуды обязаны представляться комплексными числами. Одной только действительной части амплитуд недостаточно. Пока, впрочем, это выглядит лишь как техническая подробность, потому что формулы с виду одни и те же.
А поскольку вероятность прохода сквозь оба отверстия выражается столь просто (хотя и не равна сумме P1+Р2), то больше по этому поводу сказать нечего. Но имеется еще множество тонкостей, связанных с таким поведением природы. Хотелось бы рассказать о некоторых из них. Во-первых, раз число частиц, достигающих определенной точки, не равно числу прохождений сквозь отверстие 1 плюс число прохождений через отверстие 2 (как этого можно было ожидать, основываясь на «Утверждении А»), то, несомненно, «Утверждение А» неверно. Неверно, что электроны проходят либо сквозь отверстие 1, либо сквозь отверстие 2. Но этот вывод можно проверить и иначе.
§ 6. Как проследить за электроном?
Попытаемся проделать такой опыт. В наш электронный прибор как раз за стенкой между двумя отверстиями поместим сильный источник света (фиг. 37.4).
Фиг. 37.4. Другой опыт с электронами.
Известно, что электрические заряды рассеивают свет. Поэтому, каким бы путем электрон ни прошел к детектору, он обязательно рассеет немного света в наш глаз, и мы увидим, где он проскочил. Скажем, если он проскользнет сквозь отверстие 2, как это показано на рисунке, то мы увидим, как где-то около точки А что-то блеснуло. Если же он проскочит сквозь верхнее отверстие, то блеснет где-то поблизости от отверстия 1. А если бы случилось так, что свет блеснет сразу в двух местах, потому что электрон разделился пополам, то... Но лучше приступим к опыту!
Вот что мы увидим: всякий раз, когда мы слышим из детектора «щелк», мы также видим вспышку света или у отверстия 1, или у отверстия 2, но никогда у обоих отверстий сразу! Так происходит при любом положении детектора. Отсюда мы делаем вывод, что когда мы смотрим на электрон, то обнаруживаем, что он проходит или через одно отверстие, или через другое. «Утверждение А», как показывает эксперимент, выполняется с необходимостью.
Что же в таком случае неверно в наших доводах против правильности «Утверждения А»? Почему же все-таки P12 не равно P1+Р2? Продолжим наш опыт! Давайте проследим за электронами и посмотрим, что они поделывают. Для каждого положения детектора (для каждого фиксированного х) мы подсчитаем, сколько электронов в него попало, и одновременно проследим (наблюдая вспышки), через какие отверстия они прошли. Следить мы будем так: услышав «щелк», мы поставим палочку в первом столбце, если заметим вспышку у первого отверстия; если же вспышка блеснет у отверстия 2, то мы отметим это палочкой во второй колонке. Каждый попадающий в детектор электрон будет отнесен к одному из двух классов: либо к классу электронов, проникших сквозь отверстие 1, либо к классу электронов, проникших сквозь отверстие 2. Количество палочек, накопившихся в первой колонке, даст нам р1 — вероятность того, что электрон пройдет к детектору сквозь отверстие 1; точно так же вторая колонка даст Р'2 — вероятность того, что электрон воспользовался отверстием 2. Повторив эти измерения для многих значений х, мы получим кривые р'1 и Р'2, показанные на фиг. 37.4,б.
Ну что ж, ничего неожиданного в них нет! Кривая P'1 вышла похожей на кривую P1, которая получалась, когда отверстие 2 закрывали, а кривая P'2 похожа на то, что мы получали, когда закрывали отверстие 1. Итак, никаких блужданий от дырки к дырке не существует. Когда мы следим за электронами, то оказывается, что они проникают сквозь стенку со щелями в точности так, как мы ожидали. Закрыты ли отверстия или открыты, все равно те электроны, которые мы видели проникающими сквозь отверстие 1, распределены одинаково.
Но погодите! Какова же теперь полная вероятность — вероятность того, что электрон попал в детектор любым путем? У нас уже есть сведения об этом. Сделаем вид, что мы не замечали световых вспышек, т. е. сложим палочки, стоящие в обеих колонках. Нам нужно только сложить числа. Для вероятности того, что электрон попал в поглотитель, пройдя через любое из отверстий, мы действительно получим Р'12=P1+P2. Выходит, что, хоть нам и удалось проследить, через какое отверстие проходят электроны, никакой прежней интерференционной кривой P12 не вышло, получилась новая кривая Р'12 — кривая без интерференции! А выключите свет — и снова возникнет Р12.
Мы приходим к заключению, что, когда мы смотрим на электроны, распределение их на экране совсем не такое, как тогда, когда на них не смотрят. Уж не от включения ли света меняется ход событий? Должно быть, электроны — вещь очень деликатная; свет, рассеиваясь на электронах, толкает их и меняет их движение. Мы ведь знаем, что электрическое поле, действуя на заряд, прилагает к нему силу. От этого, по-видимому, и следует ожидать изменения движения. Во всяком случае, свет оказывает на электроны большое влияние. Пытаясь «проследить» за электронами, мы изменили их движение. Толчки, испытываемые электронами при рассеянии фотонов, очевидно, таковы, что движение электронов сильно изменяется: электрон, который прежде мог попасть в максимум P12, теперь приземляется в минимуме Р12; вот поэтому никакой интерференции и не заметно.
«Но к чему же такой яркий источник света? — можете вы подумать.— Сбавьте яркость! Световые волны ослабнут и не смогут так сильно возмущать электроны; ослабляя свет все больше и больше, можно в принципе добиться того, что воздействием света на электрон можно будет вообще пренебречь». Будь по-вашему. Давайте попробуем.
Первое, что мы замечаем, это что блеск света, рассеянного на электронах, не слабеет. Сила вспышек остается прежней. От того, что свет стал тускнеть, изменилось лишь одно: временами, услышав щелчок детектора, мы никакой вспышки не замечаем; электрон прошел незамеченным. Мы просто обнаруживаем, что свет ведет себя так же, как электроны: мы знаем, что он «волнист», а теперь убеждаемся, что он к тому же распространяется «порциями». Он доставляется—или рассеивается — порциями, которые мы называем «фотонами». Понижая интенсивность источника света, мы не меняем величины фотонов, а меняем только темп, с каким они испускаются. Этим и объясняется, почему при притушенном свете некоторые электроны проскальзывают к детектору незаметно. Просто как раз в тот момент, когда электрон двигался к детектору, фотона в нужном месте не оказалось.
Все это немного нас обескураживает. Если правильно, что всякий раз, когда мы «видим» электрон, получаются одинаковые вспышки, то все увиденные нами до сего времени электроны были возмущенными электронами. Давайте тогда опыт с тусклым светом проведем иначе. Теперь, услышав щелчок в детекторе, мы будем ставить палочку в одну из трех колонок: в первую, если электрон замечен у отверстия 1, во вторую, если его видели у отверстия 2, и в третью, если его вообще не видели. Обработав данные (рассчитав вероятности), мы получим следующие результаты: «виденные у отверстия 1» будут распределены по закону P'1, «виденные у отверстия 2» — по закону Р'2 (так что «виденные либо у отверстия 1, либо у отверстия 2» распределяются по закону P'12), а «незамеченные» распределены «волноподобно», как Р12 на фиг. 37.3! Если электроны не видимы, возникает интерференция!
Это уже можно понять. Когда мы не видим электрон, значит, фотон не возмутил его; а если уж мы его заметили, значит, он возмущен фотоном. Степень возмущения всегда одна и та же, потому что все фотоны света производят эффекты одинаковой величины, достаточной для того, чтобы смазать любые интерференционные эффекты.
Но нет ли хоть какого-нибудь способа увидеть электрон, не возмущая его? Мы уже говорили о том, что импульс, уносимый фотоном, обратно пропорционален его длине волны (р=h/λ). Чем больше импульс у фотона, тем сильнее он толкает электрон, когда рассеивается на нем. Ага! Раз мы хотим как можно слабее возмущать электроны, то не стоит снижать интенсивность света, лучше снизить его частоту (или, что то же самое, увеличить длину волны). Нужно осветить электроны красным светом. Можно воспользоваться даже инфракрасным светом или радиоволнами (как в радаре). При помощи оборудования, приспособленного для восприятия длинноволнового света, можно тоже разглядеть, куда направился электрон. Может быть, более «мягкий» свет поможет нам избежать сильного возмущения электронов.
Ну что ж, примемся экспериментировать с длинными волнами. Будем повторять наш опыт, увеличивая все больше и больше длину волны. На первых порах ничего не изменится, все результаты будут прежними. А потом произойдет ужасно неприятная вещь. Вы помните, что, изучая микроскоп, мы заметили, что вследствие волновой природы света появляются ограничения на расстояния, на которых два пятна еще не сливаются в одно. Это расстояния порядка длины волны света. И вот теперь это ограничение опять всплывает. Как только длина волны сравняется с промежутком между отверстиями, вспышки станут такими размытыми, что невозможно будет разобрать, возле какого отверстия произошла вспышка! Мы не сможем больше угадывать, какой дыркой воспользовался электрон! Известно, что где-то проскочил, а где — неясно! И это как раз при таком цвете, когда толчки становятся еле заметными, а кривая Р'12 начинает походить на P12, т. е. начинает чувствоваться интерференция. И только при длинах волн, намного превышающих расстояние между отверстиями (когда уже нет никакой возможности разобрать, куда прошел электрон), возмущение, причиняемое светом, становится таким слабым, что снова появляется кривая Р12 (см. фиг. 37.3).
В нашем опыте мы обнаружили, что невозможно приспособить свет для того, чтобы узнавать, через какое отверстие проник электрон, и в то же время не исказить картины. Гейзенберг предположил, что новые законы природы были бы совместимы друг с другом только в том случае, если бы существовали некоторые фундаментальные ограничения на наши экспериментальные возможности, ограничения, которых прежде не замечали. Он предложил в качестве общего принципа свой принцип неопределенности. В терминах нашего эксперимента он звучит следующим образом: «Невозможно соорудить аппарат для определения того, через какое отверстие проходит электрон, не возмущая электрон до такой степени, что интерференционная картина пропадает». Если аппарат способен определять, через какую щель проходит электрон, он не способен оказаться столь деликатным, чтобы не исказить картину самым существенным образом. Никому никогда не удалось изобрести или просто указать способ, как обойти принцип неопределенности. Значит, мы обязаны допустить, что он описывает одну из основных характеристик природы.
Полная теория квантовой механики, которой мы в настоящее время пользуемся для описания атомов, а значит, и всего вещества, зависит от правильности принципа неопределенности. Квантовая механика весьма успешно справляется со своими задачами; это укрепляет нашу веру в принцип. Но если когда-нибудь удастся «разгромить» принцип неопределенности, то квантовая механика начнет давать несогласованные результаты и ее придется исключить из рядов правильных теорий явлений природы.
«Ну, хорошо,— скажете вы,— а как же быть с «Утверждением А»? Значит, верно все-таки, что электрон проходит либо сквозь отверстие 1, либо сквозь 2? Или же это неверно?» Единственный ответ, который может быть дан, таков: мы нашли из опыта, что существует некоторый определенный способ, которым мы должны рассуждать, чтобы не прийти к противоречиям.
Вот как мы обязаны рассуждать, чтобы не делать ошибочных предсказаний. Если вы следите за отверстиями, а точнее, если у вас есть прибор, способный узнавать, сквозь какое отверстие из двух проник электрон, то вы можете говорить, что он прошел сквозь отверстие 1 (или 2). Но если вы не пытались узнать, где прошел электрон, если в опыте не было ничего возмущавшего электроны, то вы не смеете думать, что электрон прошел либо сквозь отверстие 1, либо сквозь отверстие 2. Если вы все же начнете так думать и затем делать из этой мысли различные выводы, то, несомненно, натворите ошибок в своем анализе. Вы вынуждены балансировать на этом логическом канате, если хотите успешно описывать природу.
* * *
Если движение всего вещества, подобно электронам, нужно описывать, пользуясь волновыми понятиями, то как быть с пулями в нашем первом опыте? Почему мы не увидели там интерференционной картины? Дело оказывается в том, что у пуль длина волны столь незначительна, что интерференционные полосы становятся очень тонкими. Столь тонкими, что никакой детектор разумных размеров не разделит их на отдельные максимумы и минимумы. Мы с вами видели только нечто усредненное — это и есть классическая кривая. На фиг. 37.5 мы попытались схематически изобразить, что происходит с крупными телами.
Фиг. 37.5. Интерференционная картина при рассеянии пуль. а — истинная (схематично); б — наблюдаемая.
На фиг. 37.5, а показано распределение вероятностей для пуль, предсказываемое квантовой механикой. Предполагается, что резкие колебания должны дать представление об интерференционной картине от очень коротких волн. Но любой физический детектор неизбежно вынужден будет накрыть сразу множество зигзагов этой кривой, так что измерения, проведенные с его помощью, дадут плавную кривую, показанную на фиг. 37.5,6.
§ 7. Исходные принципы квантовой мвханики
Теперь подытожим основные выводы из наших опытов. Сделаем мы это в такой форме, чтобы они оказались справедливыми для всего класса подобных опытов. Сводку итогов можно записать проще, если сперва определить «идеальный опыт», т. е. опыт, в котором отсутствуют неопределенные внешние влияния и нет никаких не поддающихся учету изменений, колебаний и т. д. Точная формулировка будет такова: «Идеальным опытом называется такой, в котором все начальные и конечные условия опыта полностью определены». Такую совокупность начальных и конечных условий мы будем называть «событием». (Например: «электрон вылетает из пушки, попадает в детектор, и больше ничего не происходит».) А сейчас дадим нашу сводку выводов.
СВОДКА ВЫВОДОВ
1) Вероятность события в идеальном опыте дается квадратом абсолютной величины комплексного числа φ, называемого амплитудой вероятности.
(37 6)
2) Если событие может произойти несколькими взаимно исключающими способами, то амплитуда вероятности события — это сумма амплитуд вероятностей каждого отдельного способа. Возникает интерференция.
(37.7)
3) Если ставится опыт, позволяющий узнать, какой из этих взаимно исключающих способов на самом деле осуществляется, то вероятность события—это сумма вероятностей каждого отдельного способа. Интерференция отсутствует.
(37.8)
* * *
Быть может, вам все еще хочется выяснить: «А почему это? Какой механизм прячется за этим законом?» Так вот: никому никакого механизма отыскать не удалось. Никто в мире не сможет вам «объяснить» ни на капельку больше того, что «объяснили» мы. Никто не даст вам никакого более глубокого представления о положении вещей. У нас их нет, нет представлений о более фундаментальной механике, из которой можно вывести эти результаты.
Мы хотели бы подчеркнуть очень важное различие между классической и квантовой механикой. Мы уже говорили о вероятности того, что электрон попадает туда-то и туда-то в данных обстоятельствах. Мы подразумевали, что с нашим (да и с самым лучшим) экспериментальным устройством невозможно будет предсказывать точно, что произойдет. Мы способны только определять шансы! Это означало бы, если это утверждение правильно, что физика отказалась от попыток предсказывать точно, что произойдет в определенных условиях. Да! Физика и впрямь сдалась. Мы не умеем предсказывать, что должно было бы случиться в данных обстоятельствах. Мало того, мы уверены, что это немыслимо: единственное, что поддается предвычислению,— это вероятность различных событий. Приходится признать, что мы изменили нашим прежним идеалам понимания природы. Может быть, это шаг назад, но никто не научил нас, как избежать его!
Сделаем теперь несколько замечаний об одном утверждении, которое иногда делали те, кто не хотел пользоваться приведенным описанием. Они говорили: «Может быть, в электроне происходят какие-то внутренние процессы, имеются какие-то внутренние переменные, о чем мы пока ничего не знаем. Может быть, именно поэтому мы не умеем предугадывать, что случится. А если бы мы могли попристальней вглядеться в электрон, то смогли бы сказать, куда он придет». Насколько нам известно, такой возможности нет. Трудности все равно остаются. Предположим, что внутри электрона есть механизм какого-то рода, определяющий, куда электрон собирается попасть. Тогда эта машина должна определить также, через какое отверстие он намерен проследовать. Но не забывайте, что вся эта внутриэлектронная механика не должна зависеть от того, что делаем мы, и, в частности, от того, открыли мы данное отверстие или нет. Значит, если электрон, отправляясь в путь, уже прикинул, сквозь какую дырку он протиснется и где он приземлится, то для электронов, облюбовавших отверстие 1, мы получим распределение P1, а для остальных — распределение P2. А тогда для тех электронов, которые прошли через оба отверстия, с необходимостью распределение окажется суммой P1+P2. Не видно способа обойти этот вывод. Но мы экспериментально доказали, что он неверен. Никто еще не нашел отгадки этой головоломки. Стало быть, в настоящее время приходится ограничиваться расчетом вероятностей. Мы говорим «в настоящее время», но мы очень серьезно подозреваем, что все это — уже навсегда и разгрызть этот орешек человеку не по зубам, ибо такова природа вещей.
§ 8. Принцип неопределенности
Вот как сам Гейзенберг сформулировал свой принцип неопределенности: если вы изучаете какое-то тело и вы в состоянии определить x-компоненту импульса тела с неопределенностью Δр, то вы не можете одновременно определить координату х тела с точностью, большей чем Δx=h/Δр.
Произведение неопределенностей в положении тела и в его импульсе в любой момент должно быть больше постоянной Планка. Это частный случай принципа неопределенности. Более общая формулировка была высказана в предыдущем параграфе: нельзя никаким образом устроить прибор, определяющий, какое из двух взаимно исключающих событий осуществилось, без того, чтобы в то же время не разрушилась интерференционная картина.
Сейчас на одном частном случае мы покажем, что, если не иметь в своем распоряжении какого-нибудь принципа, наподобие принципа Гейзенберга, трудностей избежать никак нельзя. Представим себе такое видоизменение опыта, показанного на фиг. 37.3, в котором стенкой с отверстиями служит пластинка на катках, способная откатываться вверх и вниз (в x-направлении), как показано на фиг. 37.6.
Фиг. 37.6. Опыт, в котором измеряется отдача стенки.
Внимательно следя за движением пластинки, можно попытаться узнать, сквозь какое отверстие прошел электрон. Представьте, что случится, когда детектор поставят в точку х=0. Когда электрон проходит через отверстие 1, он должен отклониться вниз от пластинки, чтобы попасть в детектор. Так как изменилась вертикальная компонента импульса, то к пластинке приложится сила отдачи — тот же импульс, но в противоположном направлении. Пластинка испытает толчок вверх. А когда электрон пройдет сквозь нижнее отверстие, пластинка почувствует толчок вниз. И при любом другом положении детектора импульс, получаемый пластинкой, будет тоже неодинаков: когда электрон проскакивает через верхнюю дырку — один, когда сквозь нижнюю — другой. И, значит, не трогая электрон, ни капельки не возмущая его, а лишь следя за пластинкой, можно узнать, каким путем воспользовался электрон.
Чтобы определить это, нам нужно только знать, каков был импульс экрана до прихода электрона. Тогда, измерив импульс экрана после пролета электрона, мы сразу увидим, насколько он переменился. Но вспомните, что, согласно принципу неопределенности, при этом уже невозможно будет знать положение пластинки с произвольной точностью. Однако если мы не знаем точно, где она находится, как же мы узнаем, где эти два отверстия? Для каждого нового электрона, проникающего сквозь пластинку, отверстия окажутся на новом месте. А это значит, что центр нашей интерференционной картины для каждого электрона тоже будет на новом месте. Интерференционные полосы (колебания вероятности) смажутся. В следующей главе мы докажем численно, что при измерении импульса пластинки (достаточно точном для того, чтобы из измерений отдачи узнать номер отверстия) неопределенности в координате х пластинки как раз хватит на то, чтобы сдвинуть возникающую в детекторе картину вверх или вниз на расстояние от максимума до ближайшего минимума. От этих случайных сдвигов картина интерференции размажется и от нее, в конце концов, не останется и следа.
Принцип неопределенности «спасает» квантовую механику. Гейзенберг понимал, что если б можно было с большей точностью измерять и положение, и импульс одновременно, то квантовая механика рухнула бы. Вот он и допустил, что это невозможно. Тогда люди принялись придумывать способы, как все-таки это сделать. Но никому не удалось представить себе способ, как измерять положение и импульс чего угодно — экрана, электрона, биллиардного шара, любого предмета — с большей точностью. И квантовая механика продолжает вести свой рискованный, впрочем, вполне четко очерченный образ жизни.
Глава 38 СООТНОШЕНИЕ МЕЖДУ ВОЛНОВОЙ И КОРПУСКУЛЯРНОЙ ТОЧКАМИ ЗРЕНИЯ
§ 1. Волны амплитуды вероятности
В этой главе мы с вами обсудим соотношение между волновой и корпускулярной точками зрения. Из предыдущей главы мы уже знаем, что ни та, ни другая неверны. Обычно мы всегда старались формулировать понятия аккуратно или по крайней мере, достаточно точно чтобы при дальнейшем изучении их не пришлось бы менять. Разрешалось их расширять, обобщать, но уже никак не менять! Но как только мы пытаемся говорить об электроне как волне или об электроне как частице, то любая из этих точек зрения рано или поздно меняется, ведь обе они приблизительны. Поэтому все, что мы изучим в этой главе, в каком-то смысле неправильно; будут высказаны некие полуинтуитивные соображения, которым со временем предстоит уточняться, и кое-что придется слегка изменить, когда мы их уточним с помощью квантовой механики. Причина в том, что, не собираясь сейчас штудировать квантовую механику по всем правилам, мы хотим получить по крайней мере представление о характере эффектов, которые мы там обнаружим. Да и к тому же весь наш опыт относится либо к волнам, либо к частицам, и поэтому весьма удобно использовать то те, то другие представления, чтобы добиться некоторого понимания того, что произойдет в определенных обстоятельствах, пока мы еще не знаем всей математики квантовомеханических амплитуд. По мере нашего продвижения вперед мы будем стараться прояснять самые слабые места. Впрочем, многие из этих мест почти верны, все дело просто в толковании.
Прежде всего мы уже знаем, что новый, выдвигаемый квантовой механикой способ изображать мир — новая система мира — состоит в том, чтобы задавать амплитуду любого события, которое может случиться. Если событие состоит в регистрации частицы, то можно задать амплитуду обнаружения этой частицы в тех или иных местах и в то или иное время. Вероятность обнаружить частицу тогда будет пропорциональна квадрату абсолютной величины амплитуды. Вообще говоря, вероятность обнаружить частицу в каком-то месте и в какое-то время меняется в зависимости от места и от времени.
В частном случае амплитуда может изменяться синусоидально в пространстве и времени по закону exp[i(ωt-k·r)] (не забывайте, что амплитуда — число комплексное, а не действительное); тогда в нее входит определенная частота ω и определенный волновой вектор k (величина k=|k| называется волновым числом). Это отвечает той предельной классической ситуации, когда можно считать, что имеется частица с известной энергией Е, которая связана с частотой соотношением
(38.1)
и с известным импульсом р, связанным с волновым вектором формулой
(38.2)
Это означает, что понятие частицы ограниченно. Само понятие частицы, понятие ее положения, ее импульса и т. д., которым мы так часто пользуемся, в некотором смысле не является удовлетворительным. Например, когда амплитуда, относящаяся к событию обнаружения частицы в том или ином месте, дается функцией exp[i(ωt-k·r)], равной по абсолютной величине единице, то это значит, что вероятность обнаружить частицу одинакова для любой точки. Получается, что тогда мы просто не знаем, где она находится. Она может оказаться где угодно, ее положение в высшей степени неопределенно.
Когда же положение частицы более или менее известно, когда оно может быть предсказано довольно точно, то вероятность того или иного ее местоположения должна быть отлична от нуля в определенной области, имеющей, скажем, длину Δx. Вне этой области вероятность равна нулю. Вероятность — это квадрат абсолютной величины амплитуды. Когда квадрат абсолютной величины равен нулю, то и амплитуда равна нулю.
Фиг. 38.1. Волновой пакет длиной Δx.
Выходит, что амплитуда описывает цуг волн протяженностью Δx (фиг. 38.1), а длине волны (расстоянию между горбами волн) в цуге волн соответствует некоторое значение импульса частицы.
Здесь мы сталкиваемся со странным и в то же время очень простым явлением, никак непосредственно с квантовой механикой не связанным. Оно известно всем, кто занимался волнами, даже не зная квантовой механики, а именно: нельзя однозначно определить длину волны для короткого цуга волн. У такого цуга нет определенной длины волн; в волновом числе имеется неопределенность, связанная с конечной длиной цуга, а значит, и неопределенность в импульсе.
§ 2. Измерение положения и импульса
Чтобы понять, почему в квантовой механике появляется неопределенность в положении и (или) в импульсе, рассмотрим два примера. Мы уже видели раньше, что если бы этого не было, если бы можно было параллельно измерять и местонахождение, и импульс какого-то тела, то возник бы парадокс. К счастью, парадокса не возникает, а то обстоятельство, что неопределенность естественным образом вытекает из волновой картины, свидетельствует, что все здесь взаимосвязано.
Вот первый пример, показывающий связь импульса и координаты в условиях, которые легко себе представить. Пусть сквозь единственную щель в экране проникают частицы, пришедшие издалека и обладающие определенной энергией. Движутся все они горизонтально (фиг. 38.2).
Фиг. 38.2. Дифракция частиц, проходящих сквозь щель.
Сосредоточим наше внимание на вертикальной составляющей импульса. У каждой из этих частиц имеется (в обычном классическом смысле) горизонтальная составляющая импульса определенной величины р0. Вертикальная составляющая импульса рy (до того, как частица пройдет сквозь прорезь) также в классическом смысле хорошо известна: частицы не движутся ни вверх, ни вниз, потому что их источник очень удален, значит, вертикальная составляющая импульса частицы в точности равна нулю. А теперь предположим, что ширина щели равна В. Когда частица пройдет через щель, то ее вертикальная координата у определится с хорошей точностью ± В. Это значит, что неопределенность в положении частицы Δy будет порядка В. Может, вы захотите сказать, что Δpy=0, потому что импульс частиц, мол, точно горизонтален? Но это не так. Это прежде мы знали, что импульс имеет только горизонтальную составляющую, а теперь мы этого уже не знаем. Перед тем как частица проникла сквозь щель, мы не знали ее вертикальной координаты. После того как частица проникла сквозь щель, мы узнали ее вертикальную координату, но потеряли информацию об ее вертикальной составляющей импульса! Почему? Да потому, что, согласно волновой теории, происходит отклонение, или дифракция, волн, проникших сквозь щель, подобно тому как это бывает со светом. Поэтому есть конечная вероятность того, что частицы, пройдя сквозь щель, не пойдут прямо вперед. Вся картина распространения расплывается за счет дифракции, и угол этого расширения (угол, под которым виден первый минимум) есть мера неопределенности направления частицы.
Каким образом происходит расплывание изображения в ширину? Расплывание означает, что существует некая вероятность того, что частица отправится вверх или вниз, т. е. приобретет компоненту импульса, направленную вверх или вниз. (Мы говорим и о вероятности и о частице, потому что дифракционную картину можно обнаружить с помощью счетчика частиц, а когда счетчик регистрирует частицу, скажем, в точке С на фиг. 38.2, то он регистрирует частицу целиком. А это значит в классическом смысле, что частица имеет вертикальный импульс, направляющий ее из щели прямо в точку С.)
Чтобы примерно представить себе степень расплывания импульса, напишем, что вертикальный импульс ру размазан на р0Δθ, где р0 — горизонтальный импульс. Чему же равно Δθ в размазанной картине? Известно, что первый минимум наблюдается при угле Δθ таком, что в этом направлении волна от дальнего края щели должна отстать на одну свою длину от волны от ближнего края (мы об этом уже говорили в гл. 30). Стало быть, Δθ равно λ/B, и тем самым Δрy в этом эксперименте равно р0λ/В. Чем меньше будет В, чем точнее будет определяться положение частицы, тем шире будет дифракционная картина. Вспомните, что когда мы закрывали щели в эксперименте с микроволнами, то интенсивность в стороне от щели возрастала. Значит, чем уже щель, тем шире становится картина дифракции, тем правдоподобнее, что мы обнаружим у частицы импульс, направленный в сторону. И неопределенность в вертикальном импульсе, действительно, обратно пропорциональна неопределенности в у, потому что их произведение равно p0λ.
Но λ — это длина волны, а р0 — импульс, и в соответствии с квантовой механикой их произведение — это постоянная Планка h. Получается, что произведение неопределенностей в вертикальном импульсе и в вертикальной координате есть величина порядка h:
(38.3)
Мы не можем приготовить систему, в которой положение частицы по вертикали было бы известно, и в то же время предсказывать с определенностью, превышающей h/Δy, насколько ее движение отклонится от вертикали. Неопределенность в вертикальном импульсе всегда больше h/Δy, если Δy — неопределенность, с какой мы знаем положение частицы.
Некоторые люди утверждают, что в квантовой механике все неправильно. Когда, говорят они, частица приближалась слева, ее вертикальный импульс был равен нулю. А когда она прошла через щель, стало известно ее положение. И то, и другое может быть определено с любой точностью.
Совершенно верно. Мы можем зарегистрировать частицу и определить, каково ее положение и каким должен был быть ее импульс, чтобы она попала туда, куда она попала. Это все верно. Но соотношение неопределенностей (38.3) ничего общего с этим не имеет. Уравнение (38.3) относится к возможности предсказания, а не к замечаниям о том, что произошло в прошлом. Какая польза в том, что мы скажем: «Я знал, каков был импульс до прохода частицы сквозь щель, а теперь узнал к тому же и координату»? Ведь теперь-то знание об импульсе частицы уже утеряно. Раз она прошла сквозь щель, то мы уже не можем больше предсказывать ее вертикальный импульс. Речь идет о теории, способной к предсказаниям, а не об измерениях после того, как все завершилось. Мы и обсуждаем вопрос о том, что можно предвидеть.
Попробуем теперь по-иному подойти к этим вещам. Приведем другой пример того же явления, на этот раз с более подробными количественными оценками. Прежде мы измеряли импульс классическим способом: мы рассматривали направление, скорость, углы, и тому подобное; в этом заключался способ получения импульса путем классического анализа. Но раз импульс связан с волновым числом, то в природе существует и другой, совершенно иной путь измерения импульса частиц (все равно, фотона или любой другой), не имеющий классического аналога. В нем используется уравнение (38.2) и просто измеряется длина волны. Давайте попробуем таким способом измерить импульс.
Фиг. 38.3. Определение импульса с помощью дифракционной решетки.
Пусть имеется решетка со множеством линий (фиг. 38.3), на которую направлен пучок частиц. Мы неоднократно рассматривали эту задачу: когда у частиц есть определенный импульс, то вследствие интерференции в некотором направлении возникает очень резкий максимум. Мы также говорили о том, насколько точно можно определить этот импульс, т. е. какова разрешающая сила решетки. Мы не будем заново это все выводить, а сошлемся на гл. 30; там мы выяснили, что относительная неопределенность в длине волны, связанная с данной решеткой, равна 1/Nm, где N — количество линий решетки, а m — порядок дифракционного максимума. Иначе говоря,
(38.4)
Перепишем эту формулу в виде
(38.5)
где расстояние L показано на фиг. 38.3. Это — разность двух расстояний: расстояния, которое должна пройти волна (или частица), отразившись от нижней части решетки, и расстояния, которое нужно пройти, отразившись от верха решетки.
Другими словами, волны, образующие дифракционный максимум,— это волны, приходящие от разных частей решетки. Первыми прибывают волны, вышедшие снизу — это начало цуга волн, а потом следуют дальнейшие части цуга, от средних частей решетки, пока не придут волны от верха: точка цуга, удаленная от его начала на расстояние L. Значит, чтобы получить в спектре резкую линию, отвечающую определенному импульсу [с неопределенностью, даваемой формулой (38.4)], для этого нужен цуг волн длиной L. Если цуг чересчур короток (короче L), то не вся решетка будет действовать. Волны, образующие спектр, будут отражаться при этом только от небольшого куска решетки, и решетка не будет хорошо работать — получится сильное размытие по углу. Чтобы его сузить, надо использовать всю ширину решетки так, чтобы хотя бы на одно мгновение весь цуг волн улегся одновременно на решетке и рассеялся ото всех ее частей. Потому-то длина цуга должна быть равна L; тогда только неопределенность в длине волны окажется меньше, чем указано формулой (38.5). Заметим, что
(38.6)
поэтому
(38.7)
где L — длина цуга волн.
Это означает, что когда цуг волн короче L, то неопределенность в волновом числе превосходит 2π/L. Иначе говоря, неопределенность в волновом числе, умноженная на длину волнового цуга (назовем ее на минутку Δx), больше 2π. Мы назвали ее Δx потому, что это как раз неопределенность в положении частицы. Если цуг волн тянется только на конечном промежутке, то лишь там мы и можем обнаружить частицу с неопределенностью Δx. Это свойство волн (тот факт, что произведение длины цуга волн на неопределенность в волновом числе, связанном с этим цугом, не меньше 2π) опять-таки хорошо знакомо всем, кто занимался волнами. И никакого отношения к волновой механике оно не имеет. Просто нельзя очень точно подсчитать число волн в конечной их веренице.
Объяснить это можно и по-другому. Пусть длина цуга волн L. Так как на концах цуга волны спадают (как на фиг. 38.1), то количество волн на длине L известно с точностью порядка ± 1. Но число волн на длине L равно kL/2π. Значит, неопределенность в k равна 2π/L. Опять получилась формула (38.7) как простое свойство всяких волн. Это остается верным всегда: и для волн в пространстве, когда k есть количество радиан на 1 см, а L — длина цуга, и для волн во времени, когда ω есть число колебаний в 1 сек, а Т — «длина» во времени того же цуга. Иначе говоря, если цуг волн длится только конечное время Т, то неопределенность в частоте дается формулой
(38.8)
Мы все время старались подчеркнуть, что это свойство самих волн, что все это хорошо известно, например в теории звука. А квантовомеханические применения этих свойств опираются на толкование волнового числа как меры импульса частицы по правилу р=ℏk, так что (38.7) уже утверждает, что Δр≈h/Δx. Это устанавливает предел классическому представлению об импульсе. (Естественно, оно и должно быть как-то подвергнуто ограничению, если мы собираемся изображать частицы как волны!) И очень хорошо, что мы нашли правило, которое каким-то образом берется указать, где нарушаются классические представления.
§ 3. Дифракция на кристалле
Теперь рассмотрим отражение волн вещества от кристалла. Кристалл — это твердое тело, состоящее из множества одинаковых атомов, расположенных стройными рядами. Как можно расположить этот строй атомов, чтобы, отражая в данном направлении данный пучок света (рентгеновских лучей), электронов, нейтронов, чего угодно, получить сильный максимум? Чтобы испытать сильное отражение, лучи, рассеянные от всех атомов, должны быть в фазе друг с другом. Не может быть так, чтобы точно половина волн была в фазе, а половина — в противофазе, тогда все волны исчезнут. Нужно, стало быть, найти поверхности постоянной фазы; это, как мы уже объясняли раньше, плоскости, образующие равный угол с начальным и конечным направлениями (фиг. 38.4).
Фиг. 38.4. Рассеяние волн плоскостями кристалла.
Если мы рассмотрим две параллельные плоскости, как показано на фиг. 38.4, то волны, рассеянные на них, окажутся в фазе только тогда, когда разность расстояний, пройденных фронтом волны, будет равна целому числу длин волн. Эта разность, как легко видеть, равна 2dsinθ, где d — расстояние между плоскостями. Итак, условие когерентного отражения имеет вид
(38.9)
Если, скажем, кристалл таков, что атомы в нем укладываются на плоскостях, удовлетворяющих условию (38.9) с n=1, то будет наблюдаться сильное отражение. Если, с другой стороны, существуют другие атомы той же природы (и расположенные с той же плотностью) как раз посередине между слоями, то на этих промежуточных плоскостях произойдет рассеяние равной силы; оно интерферирует с первым и погасит его. Поэтому d в выражении (38.9) должно означать расстояние между примыкающими плоскостями; нельзя взять две плоскости, разделенные пятью слоями, и применить к ним эту формулу!
Интересно, что настоящие кристаллы обычно не столь просты,— это не одинаковые атомы, повторяющиеся по определенному закону. Они скорее похожи, если прибегнуть к двумерной аналогии, на обои, на которых повторяется один и тот же сложный узор. Для атомов «узор» — это некоторая их расстановка, куда может входить довольно большое число атомов; скажем, для углекислого кальция — атомов кальция, углерода и трех атомов кислорода. Важно не то, каков рисунок, а то, что он повторяется.
Этот основной рисунок называется ячейкой, а способ повторения определяет тип решетки; тип решетки можно сразу определить, взглянув на отражения и рассмотрев их симметрию. Другими словами, от типа решетки зависит, где не будет отражения (лучей от кристалла), но чтобы узнать, что стоит в каждой ячейке, надо учесть и интенсивность рассеяния по тем или иным направлениям. Направления рассеяния зависят от типа решетки, а сила рассеяния определяется тем, что находится внутри каждой ячейки; этим способом и было изучено строение кристаллов.
Две фотографии дифракции рентгеновских лучей даны на фиг. 38.5 и 38.6.
Фиг. 38.5. Дифракция рентгеновских лучей на кристаллах каменной соли.
Фиг. 38.6. Дифракция рентгеновских лучей на миоглобине.
Занятная вещь получается с рассеянием, когда промежутки между ближайшими плоскостями меньше λ/2. В этом случае уравнение (38.9) вообще не имеет решений ни для одного n. Выходит, когда λ больше двойного промежутка между примыкающими плоскостями, то никаких боковых дифракционных пятнышек нет и свет (и не только свет, а все, что хотите) прямо проходит через вещество. Проходит, не отражаясь, не рассеиваясь, не теряясь. В частности, свет (у него λ много больше этих промежутков) проходит, не давая никакой картины отражений от кристаллических плоскостей.
Интересные следствия этого явления наблюдаются в урановых реакторах — источниках нейтронов (нейтроны — это, уж бесспорно, частицы, спросите у кого угодно!). Если пустить эти самые частицы-нейтроны через длинный блок графита, то они начнут рассеиваться и с трудом будут протискиваться в глубь блока (фиг. 38.7).
Фиг. 38.7. Диффузия нейтронов из котла сквозь графитовый блок
Рассеиваются они из-за того, что отскакивают от атомов. Но строго говоря, согласно волновой теории, все обстоит как раз наоборот — они отскакивают от атомов из-за дифракции от кристаллических плоскостей. Оказывается, что если взять длинный стержень графита, то у всех нейтронов, выходящих из его дальнего конца, окажется большая длина волны! Если нанести на график интенсивность нейтронов как функцию длины волны, то на нем изобразятся только длины волн выше некоторого минимума (фиг. 38.8).
Фиг. 38.8. Интенсивность нейтронов, выходящих us стержня графита, как функция длины волны.
Значит, таким путем можно получить очень медленные нейтроны. Проникают сквозь графит только самые медленные нейтроны, они не дифрагируют, не рассеиваются на кристаллических плоскостях графита, а спокойно проходят, как свет через стекло. И нет никакого рассеяния по сторонам. Существует и множество других доказательств реальности нейтронных волн и волн других частиц.
§ 4. Размер атома
Рассмотрим еще одно применение принципа неопределенности (38.3), но только, пожалуйста, не воспринимайте этот расчет чересчур буквально; общая мысль правильна, но анализ проделан не очень аккуратно. Мысль эта касается определения размера атомов; ведь по классическим воззрениям электроны должны были бы излучать свет и, крутясь по спирали, упасть на поверхность ядра. Но, согласно квантовой механике, это невозможно, потому что в противном случае мы бы знали, где очутился электрон и насколько быстро он вертится.
Допустим, имеется атом водорода и мы измеряем положение электрона; мы не должны быть в состоянии предвидеть точно, где он окажется, иначе расплывание импульса станет бесконечным. Всякий раз, как мы смотрим на электрон, он где-нибудь оказывается; у него есть амплитуда вероятности оказаться в различных местах, так что есть вероятность найти его где угодно. Однако не все эти места должны быть возле самого ядра; положим, что существует разброс в расстояниях порядка а, т. е. расстояние от ядра до электрона примерно в среднем равно а. Определим а, потребовав, чтобы полная энергия атома оказалась минимальной.
Разброс в импульсах, в согласии с соотношением неопределенностей, должен быть равен примерно h/а; поэтому, стремясь измерить как-нибудь импульс электрона (например, рассеивая на нем фотоны и наблюдая эффект Допплера от движущегося рассеивателя), мы не будем получать все время нуль (электрон не стоит на месте), а будем получать импульсы порядка р≈h/а. Кинетическая энергия электронов примерно будет равна 1/2mv2=Р2/2m=h2/2ma2. (To, что мы сейчас делаем, в каком-то смысле есть анализ размерностей: мы прикидываем, как кинетическая энергия может зависеть от постоянной Планка h, массы m и размера атома а. Ответ получается с точностью до численных множителей типа 2, π и т. д. Мы даже не определили как следует а.) Далее, потенциальная энергия равна частному от деления минус е2 на расстоянии от центра, скажем, — е2/а (как мы помним, е2 — это квадрат заряда электрона, деленный на 4πε0). Теперь смотрите: когда а уменьшается, то потенциальная энергия тоже уменьшается, но чем меньше а, тем больше требуемый принципом неопределенности импульс и тем больше кинетическая энергия. Полная энергия равна
(38.10)
Мы не знаем, чему равно a, но зато мы знаем, что атом, обеспечивая свое существование, вынужден идти на компромисс, с тем чтобы полная энергия его была как можно меньше. Чтобы найти минимум Е, продифференцируем его по а, потребуем равенства производной нулю и найдем а. Производная Е равна
(38.11)
Уравнение dE/da=0 дает для а величину
(38.12)
Это расстояние называется воровским радиусом, и мы видим, что размеры атома — порядка ангстрема. Получилась правильная цифра. Это очень хорошо, это даже удивительно хорошо, ведь до сих пор никаких теоретических соображений о размере атома у нас не было. С классической точки зрения атомы попросту невозможны: электроны должны упасть на ядра. Подставив формулу (38.12) для а0 в (38.10), мы найдем энергию. Она оказывается равной
(38.13)
Что означает отрицательная энергия? А то, что, когда электрон находится в атоме, у него энергии меньше, чем когда он свободен. Иначе говоря, в атоме он связан. И нужна энергия, чтобы вырвать его из атома; для ионизации атома водорода требуется энергия 13,6 эв. Не исключено, конечно, что потребуется вдвое или втрое больше энергии, или в π раз меньше, так как расчет наш был очень неряшлив. Однако мы схитрили и выбрали все константы так, чтобы итог получился абсолютно правильным! Эта величина -13,6 эв — называется ридбергом энергии; это энергия ионизации водорода.
Только теперь становится понятным, отчего мы не проваливаемся сквозь пол. При ходьбе вся масса атомов наших ботинок отталкивается от пола, от всей массы его атомов. Атомы сминаются, электроны вынуждены тесниться в меньшем объеме, и по принципу неопределенности их импульсы в среднем увеличиваются, а увеличение импульсов означает рост энергии. Сопротивление атомов сжатию — это не классический, а квантовомеханический эффект. По классическим понятиям следовало ожидать, что при сближении электронов с протонами энергия уменьшится; наивыгоднейшее расположение положительных и отрицательных зарядов в классической физике — это когда они сидят верхом друг на друге. Классической физике это было хорошо известно и представляло загадку: атомы-то все же существовали! Конечно, ученые и тогда придумывали разные способы выхода из тупика, но правильный (будем надеяться!) способ стал известен только нам!
Кстати, когда вокруг ядра бывает много электронов, то они тоже стараются держаться подальше друг от друга. Причина этого пока вам непонятна, но это факт, что если какой-то электрон занял какое-то место, то другой этого места уже не займет. Точнее, из-за существования двух направлений спина, эти электроны могут усесться друг на друга и вертеться: один — в одну сторону, другой — в другую. Но уже никакого третьего на это место вам не поместить. Вы должны их помещать на новые места, и в этом-то истинная причина того, что вещество обладает упругостью. Если бы можно было помещать все электроны в одно место, вещество было бы даже плотней, чем обычно. И именно благодаря тому, что электроны не могут сидеть друг на друге, существуют и столы, и другие твердые предметы.
Естественно поэтому, что, желая понять свойства вещества, нужно пользоваться квантовой механикой; классической для этого явно недостаточно.
§ 5. Уровни энергии
Мы говорили уже об атоме в наинизшем возможном энергетическом состоянии. Но оказывается, что электрон способен и на многое другое. Он может вращаться и колебаться гораздо энергичней, возможности его движений в атоме довольно многообразны. Согласно квантовой механике, при установившихся условиях движения атом может обладать только вполне определенными энергиями. На диаграмме фиг. 38.9 мы будем откладывать энергии по вертикали, а горизонтальными линиями отмечать разрешенные значения энергии. Когда электрон свободен, т. е. когда его энергия положительна, она может быть любой; скорость электрона тоже может быть какой угодно. Но энергии связанных состояний не произвольны. Атом может иметь только ту или иную энергию из дозволенной совокупности значений, скажем, таких, как на фиг. 38.9.
Фиг. 38.9. Схема энергий атома. Показано несколько возможных переходов.
Обозначим эти разрешенные значения через Е0, E1, E2, Е3. Если первоначально атом находится в одном из этих «возбужденных» состояний E1, E2 и т. д., он не останется в нем навсегда. Раньше или позже он упадет в низшее состояние и излучит при этом энергию в виде света. Частота испущенного света определяется требованием сохранения энергии плюс квантовомеханическим пониманием того, что частота света связана с энергией света условием (38.1).
Поэтому, например, частота света, освобожденного в переходе от энергии Е3 к энергии E1, равна
(38.14)
Эта частота характерна для данного сорта атомов и определяет линию в спектре испускания. Возможен и другой переход — от E3 к Е0. У него своя частота:
(38.15)
Еще одна возможность заключается в том, что если атом возбужден до состояния E1, то он может упасть в основное состояние E0, излучая фотон с частотой
(38.16)
Мы привели здесь эти три перехода для того, чтобы подчеркнуть интересную связь между ними. Из трех формул (38.14), (38.15), (38.16) легко получить
(38.17)
Вообще, обнаружив две линии в спектре, можно ожидать, что найдется и линия с частотой, равной сумме (или разности) частот. Все линии можно объяснить, отыскав серию уровней, таких, что каждая линия соответствует разности энергий между какими-то двумя уровнями. Это замечательное совпадение между частотами линий в спектре было замечено еще до открытия квантовой механики. Его называют комбинационным принципом Ритца. С точки зрения классической механики он опять выглядит таинственно. Впрочем, не будем больше напоминать о том, что классическая механика обанкротилась в мире атомов; мне кажется, мы это уже хорошо показали.
Мы говорили уже о том, что в квантовой механике все события представляются в виде амплитуд, которые ведут себя как волны, имеют определенную частоту и волновое число. Посмотрим теперь, как при помощи амплитуд объяснить, что у атома бывают только определенные энергетические состояния. Из всего, что было сказано до сих пор, это вывести и понять невозможно. Но зато мы все знаем, что волны в ограниченном объеме обладают определенными частотами. Скажем, если звуковая волна ограничена пределами органной трубы или как-либо иначе, то звуковые колебания могут быть разными, но их частоты не могут быть любыми. И так всегда: у тела, внутри которого держатся волны, всегда бывают определенные резонансные частоты. Волны, заключенные в ограниченный объем, всегда обладают лишь определенным набором частот. (В дальнейшем мы еще будем изучать это явление и выпишем все нужные формулы.) Ну, а поскольку существует общее соотношение между частотой колебаний амплитуды и энергией, то нет ничего удивительного в том, что электроны, связанные в атомах, обладают только вполне определенными энергиями.
§ 6. Немного философии
Поговорим еще немного о философии квантовой механики. Как и всегда, здесь есть две стороны: философское содержание физики и его экстраполяция на другие области знаний. Когда философские идеи, связанные с наукой, переносятся на другие области, они обычно при этом искажаются до неузнаваемости. Поэтому мы ограничим свои замечания, насколько это возможно, только физикой.
Прежде всего начнем с самого интересного предмета — с идеи принципа неопределенности: наблюдение воздействует на явление. Хоть и всегда было известно, что, наблюдая явление, мы воздействуем на него, но здесь суть-то в том, что этим воздействием нельзя пренебречь, нельзя его свести до нуля, нельзя переделкой прибора произвольно уменьшить это влияние. Наблюдая явление, нельзя хотя бы слегка не нарушить его ход, и без учета этого нарушения теория не может стать последовательной. И в доквантовой физике наблюдатель иногда был важен, но лишь в довольно тривиальном смысле. Рассматривался, скажем, такой вопрос: дерево падает в лесу, в котором нет никого, кто мог бы услышать это; вызовет ли падение шум? И следовал ответ: настоящее дерево, падая в настоящем лесу, бесспорно, шум вызовет, даже если никого поблизости нет. Пусть никто падения слышать не мог, все равно останутся другие следы — кое-где осыплются листья, а на некоторых листочках останутся едва заметные царапинки от колючек, которые можно будет объяснить лишь тем, что листва дрожала. Так что следует допустить, что в некотором смысле звук и впрямь существовал. «Но было ли ощущение звука?» — можем мы спросить. Нет, для ощущения, видимо, нужно и сознание. А есть ли сознание у муравьев, да и водятся ли они в этом лесу и сознают ли что-либо деревья — вопрос темный. Поэтому бросим эту задачу.
С тех пор как родилась квантовая механика, стали подчеркивать и другое положение: не надо говорить о вещах, которые невозможно измерить. (Кстати, и теория относительности говорила об этом же.) Пока не определено, как измерять величину, ей нет места в теории. А поскольку точное значение импульса локализованной (находящейся в каком-то месте) частицы не может быть определено при помощи измерения, значит, импульсу нечего делать в теории.
Так вот, если вы думаете, что классическая теория потому и погибла, вы ошибаетесь. Было бы легкомысленно сделать такой вывод. Невозможность точного измерения координаты и одновременно импульса не означает априори, что нельзя о них говорить, а означает только, что говорить о них нет необходимости. На самом деле в науках бывает иначе: идея или понятие, которые невозможно прямо связать с опытом или замерить, могут быть полезными, а могут быть бесполезными. О них можно только сказать что они не обязаны присутствовать в теории. Пусть, например, мы сравниваем классическую теорию мира с квантовой теорией, а из эксперимента следует, что координата и импульс могут измеряться лишь неточно. Мы спрашиваем себя, имеет ли смысл понятие точного положения частицы или точного ее импульса. Классическая теория отвечает «да», а квантовая — «нет». Но это само по себе не означает, что классическая физика ошибается.
Когда была открыта новая, квантовая, механика, приверженцы классической теории, т. е. все физики, кроме Гейзенберга, Шредингера и Борна, говорили: «Что же хорошего в ней, в вашей теории, раз она не может ответить на простейшие вопросы: каково точное положение частицы? Через какую щель она проскочит? и другие». Ответ Гейзенберга гласил: «Я не обязан отвечать на такие вопросы, ибо вы не можете их задать экспериментально». Иначе говоря, отвечать — означало бы делать то, что делать необязательно. Рассмотрим две теории, (А) и (Б). Теория (А) содержит в себе идею, которую нельзя проверить непосредственно, но которая используется в анализе; теория (Б) этой идеи не содержит. Если их предсказания расходятся, то нельзя утверждать, что теория (Б) ошибочна на том основании, что она не может объяснить идею из теории (А); ведь эта идея как раз из тех вещей, которые нельзя непосредственно проверить.
Ну что ж! Хорошо, конечно, знать, какие из идей экспериментальной проверке не поддаются, но нет необходимости отбрасывать их все. Неверно же, что науку можно создавать только из тех понятий, которые прямо связаны с опытом. Ведь в самой квантовой механике есть и амплитуда волновой функции, и потенциал, и многие другие умственные построения, не поддающиеся прямому измерению. Основа науки — в ее способности предвидеть. Предвидеть — это значит сообщать, что случится в опыте, который никогда прежде не ставился. Как этого можно добиться? Предполагая, что мы независимо от эксперимента знаем, что произойдет, мы экстраполируем опыт, выводим его в область, в которой он не ставился. Мы расширяем свои представления до пределов, в которых они никогда не проверялись. Если этого не сделано — никакого предсказания нет. Поэтому вполне разумно было когда-то физику-классику в счастливом неведении предполагать, что понятие положения, бесспорно имеющее смысл в футболе, имеет какой-то смысл и для электрона. Это была не глупость. Это была разумная процедура. А теперь мы, например, говорим, что закон относительности верен при любых энергиях, а ведь в один прекрасный день явится кто-нибудь и объяснит, насколько мы глупы. Мы не догадаемся, в каком месте мы совершаем «глупость», покуда не «вырастем над собой»; вся проблема сводится к тому, как и когда нам это удастся. Единственный же способ обнаружить, в чем мы ошибаемся, это понять, в чем состоят наши предсказания. Так что без умственных построений не обойтись.
Мы уже делали ряд замечаний о недетерминированности квантовой механики, т. е. о том, что она не способна предсказывать, что произойдет в данных физических условиях, как бы аккуратно они ни были на опыте осуществлены. Если атом находится в возбужденном состоянии, собираясь излучить фотон, мы не можем сказать, когда это случится; существует конечная амплитуда вероятности испустить фотон в любой момент, и только эту вероятность мы и можем предвидеть. Мы не можем точно предсказывать будущее. На этой основе и высказываются разного рода глупости о неопределенности всех явлений в мире, возникают вопросы о свободе воли частиц и т. д.
Следует, конечно, подчеркнуть, что и классическая физика была в каком-то смысле недетерминированной. Обычно думают, что недетерминированность, невозможность предсказать будущее — это особенность квантовой механики, и именно с ней связывают возникновение представлений о свободе воли и т. д. Но если бы даже наш мир был классическим, т. е. если бы законы механики были классическими, все равно из этого не следует, что те же или какие-то аналогичные представления не возникли бы. Да, конечно, с точки зрения классики, узнав местоположение и скорость всех частиц в мире (или в сосуде с газом), можно точно предсказать, что будет дальше. В этом смысле классический мир детерминирован. Но представьте теперь, что наша точность ограничена и что мы не знаем точно положение только одного из атомов; знаем, скажем, его с ошибкой в одну миллиардную. Тогда если он столкнется с другим атомом, неопределенность в знании его координат после столкновения возрастет. А следующее столкновение еще сильней увеличит ошибку. Так что если сначала ошибка и была еле заметной, то все равно вскоре она вырастет до огромнейшей неопределенности. Вот вам пример: вода, падая с плотины, брызжет во все стороны. Подойдите поближе, и на ваш нос тоже упадет несколько брызг. Это кажется совершеннейшей случайностью, хотя поведение воды может быть предсказано на основе чисто классических законов. Точное положение всех капель зависит от мельчайших колебаний потока воды перед плотиной. Но как оно зависит? Еле заметные нерегулярности в падении воды усиливаются и приводят к полной случайности движений. Ясно, что мы не можем по-настоящему предвидеть положение капель, если не знаем движения воды абсолютно точно.
Правильнее будет сказать, что для данной точности (сколь угодно большой, но конечной) можно всегда указать такой большой промежуток времени, что для него становится невозможным сделать предсказания. И этот промежуток (в этом вся соль) не так уж велик. Он не равен миллиону лет при точности в одну миллиардную! Время с уменьшением ошибки растет только логарифмически, и оказывается, что за очень и очень малое время вся наша информация теряется. Если точность равна даже одной миллиард-миллиард-миллиардной (ставьте сколько угодно миллиардов, но только когда-нибудь остановитесь!), все равно можно указать промежуток времени, меньший чем время, нужное для того, чтобы произвести измерения с такой огромной точностью, после которого уже невозможно будет предугадывать, что случится! Поэтому нечестно говорить, что уже в видимой свободе и недетерминированности человеческого мышления мы видим доказательства невозможности его изучения в рамках классической «детерминистской» физики и приветствовать квантовую механику как избавительницу нашего духа от «абсолютно механистической» Вселенной. С практической точки зрения «детерминизм» отсутствовал и в классической механике.
Выпуск 4. Кинетика. Теплота. Звук
Глава 39 КИНЕТИЧЕСКАЯ ТЕОРИЯ ГАЗОВ
§ 1. Свойства вещества
С этой главы мы начнем изучение новой темы, которая займет у нас довольно много времени. Мы начнем анализ свойств вещества с физической точки зрения. Зная, что вещество построено из большого числа атомов или каких-то других элементарных частей, взаимодействующих электрически и подчиняющихся законам механики, мы постараемся понять, почему скопления атомов ведут себя именно так, а не иначе.
Нечего и говорить, что это трудная задача. И будет лучше, если мы с самого начала подчеркнем, что это чрезвычайно трудная задача и что решать ее нам придется совсем иными способами, чем раньше. Когда мы изучали механику и оптику, то могли начинать с точных формулировок некоторых законов, например законов Ньютона или формулы для поля, порождаемого ускоренным зарядом. Узнав их, мы сразу же могли объяснить бездну всяких явлений, а потом эти законы становились для нас прочной основой, опираясь на которую, мы совершенствовались и в механике, и в оптике. Мы можем продолжать изучение и дальше, но мы не обнаружим при этом какую-то новую физику, мы просто будем решать старые задачи более точными математическими методами.
Такой способ непригоден для изучения свойств вещества. Мы можем сказать о свойствах вещества лишь самые простые вещи. Предмет этот слишком сложен, чтобы можно было начать с самых основных законов. Мы по-прежнему будем пользоваться законами механики и электричества. Но законы эти слишком далеки от тех свойств, которые мы собираемся изучать. От законов Ньютона до свойств вещества очень много шагов и каждый шаг очень труден. Сейчас мы сделаем несколько таких шагов, но мне хочется предупредить вас, что если в предыдущих главах мы анализировали явления более или менее строго, то теперь с каждым шагом мы все больше будем терять строгость. Свойства вещества мы сможем понять лишь весьма приближенно.
Происходит это по нескольким причинам. Во-первых, наш анализ не может быть полным потому, что для этого нужно глубокое знание теории вероятностей; мы ведь не собираемся следить за движением каждого атома, а хотим узнать о среднем числе атомов, движущихся в том или ином направлении, и прикинуть, к чему приведет разница в этих средних. Таким образом, теория вероятностей органически входит в нашу тему, а в математике мы еще не очень сильны и многого от нас не потребуешь.
Вторая и более серьезная причина — чисто физическая. Поведение атомов подчиняется законам не классической, а квантовой механики, и пока мы не изучим квантовую механику, нельзя серьезно говорить об изучении свойств вещества. Речь идет не просто о переходе от больших предметов к маленьким, например от автомобилей к биллиардным шарам, разница между законами классической и квантовой механики гораздо глубже и существенней, и многие объяснения, если исходить из классической механики, будут просто неверными. Так что многих вещей мы пока никак не в состоянии понять, однако мы будем подчеркивать каждый раз, когда объяснения приведут нас в тупик, чтобы по крайней мере хоть предупредить, где он находится. Для этого и говорилось о квантовой механике в предыдущих главах: надо было понять, в каких случаях отказывает механика классическая.
Почему же мы вообще изучаем свойства вещества? Не лучше ли было бы подождать с полгода или год, пока мы не подучим теорию вероятностей и квантовую механику, а потом уж и взяться за свойства вещества поосновательней? На это следует ответить, что трудные вещи лучше изучать не спеша! Сначала мы — плохо ли, хорошо ли — познакомимся с общими идеями, подумаем, что может произойти в тех или иных обстоятельствах, а потом, когда лучше узнаем основные законы, сформулируем все это поточнее.
Каждый, кто хочет всерьез анализировать свойства вещества, должен сначала написать основные уравнения и попытаться решить их. Но каждого, кто начинал с этого, ждала неудача. Успех приходил лишь к тем, кто подходил к делу как физик: у этих людей сначала не было ничего, кроме грубой идеи, а затем они находили верное приближение, соображая, что в этой трудной ситуации можно считать большим, а что малым. Задачи в этой области столь сложны, что даже не очень четкая и половинчатая идея оправдывает затраченное на нее время, и можно то и дело возвращаться к одной и той же задаче, приближаясь понемногу к ее точному решению. Так мы и поступаем в нашем курсе.
И еще одна причина, по которой мы приступаем сейчас к изучению свойств веществ: нам уже приходилось встречать похожие идеи, например в химии. Некоторые из них известны нам со школы. Было бы интересно понять их с точки зрения физика.
Вот один из самых увлекательных примеров: известно, что равные объемы газов содержат при одинаковом давлении и температуре равное число молекул. Авогадро первым понял закон кратных отношений: из того, что в химической реакции между двумя газами объемы реагирующих газов относятся как целые числа, следует, что равные объемы содержат равное число атомов. Но почему в равных объемах содержится равное число атомов? Можно ли объяснить это, исходя из законов Ньютона? Для этого вам придется изучить эту главу. Мы еще будем впоследствии много говорить о давлениях, объемах, температуре и теплоте.
Мы обнаружим при этом, что многие соотношения между свойствами вещества можно понять, ни слова не говоря об атомах. Например, если какое-нибудь тело сжать, оно нагреется; если тело нагревать, оно начнет расширяться. Связь между этими явлениями можно понять, не изучая строения тела. Занимающаяся такими вещами наука называется термодинамикой. Конечно, глубокое понимание термодинамики возможно лишь после подробного изучения механизма, лежащего в основе того или иного процесса. Вот этим мы и займемся: мы примем с самого начала тот факт, что все вещества состоят из атомов, и постараемся понять свойства вещества и законы термодинамики.
Итак, начнем изучение свойств газов, исходя из законов Ньютона.
§ 2. Давление газа
Каждый знает, что газ оказывает давление. Но отчего? В этом надо разобраться как следует. Если бы наши уши были намного чувствительнее, чем они есть на самом деле, мы бы все время слышали страшный шум. Но природа позаботилась, чтобы наши уши не были столь восприимчивы, ведь они оказались бы для нас совершенно бесполезными — в них постоянно стоял бы дикий гул, похожий на шум от стартующей ракеты. Дело в том, что барабанные перепонки наших ушей соприкасаются с воздухом, а воздух состоит из великого множества беспорядочно движущихся молекул, которые, ударяясь о барабанные перепонки, создают такой шум, как будто сразу очень много барабанщиков отбивают беспорядочную дробь — бум, бум, бум... Однако мы не слышим этих звуков, потому что атомы очень малы, а уши наши недостаточно чувствительны. Беспорядочные удары молекул должны были бы собственно продавить барабанную перепонку, но ее непрестанно бомбардируют и с внутренней стороны, и в результате полная сила, действующая на перепонку, оказывается равной нулю. Если бы откачать воздух с одной стороны или хотя бы сделать разным его относительное количество с обеих сторон, то перепонка продавилась бы в ту или иную сторону, потому что бомбардировка с одной стороны оказалась бы гораздо сильнее. Мы иногда испытываем это неприятное ощущение, когда очень быстро поднимаемся в лифте или на самолете, а хуже всего, если мы еще при этом простужены (в этом случае распухшая слизистая оболочка закрывает каналы, соединяющие через носоглотку внутреннюю полость уха с внешним пространством, и таким образом оба давления не могут быстро уравняться.)
Чтобы проанализировать это явление количественно, предположим, что газ находится в ящике, одна стенка которого представляет собой поршень, способный перемещаться (фиг. 39.1).
Фиг. 39.1. Атомы газа в ящике, в котором движется поршень без трения.
Найдем силу, с которой действуют на поршень находящиеся внутри ящика атомы. О поршень ударяются атомы, движущиеся внутри объема V со всевозможными скоростями. Предположим, что вне ящика ничего нет — сплошной вакуум. Что же произойдет? Если предоставить поршень самому себе и не придерживать его, то с каждым ударом молекулы он будет приобретать небольшой импульс и постепенно будет вытолкнут совсем из ящика. Чтобы удержать его в ящике, придется приложить силу F. Какова должна быть эта сила? Говоря о силе, мы будем относить ее к единице площади: если площадь поршня равна А, то действующая на него сила будет пропорциональна площади. Определим давление как величину, равную отношению приложенной к поршню силы к площади поршня:
(39.1)
Чтобы лучше понять, для чего это делается, подсчитаем бесконечно малую работу dW, которую надо затратить, чтобы протолкнуть поршень на бесконечно малое расстояние —dx (позднее это понадобится нам и для других целей); эта работа равна произведению силы на расстояние или, согласно (39.1), произведению давления, площади поршня и расстояния. Все это равно произведению давления на изменение объема, взятого с обратным знаком:
(39.2)
(Произведение площади А на изменение высоты dx равно изменению объема.) Знак минус в этом выражении возникает из-за того, что при сжатии объем уменьшается; если принять это во внимание, то мы получим правильный результат: чтобы сжать газ, надо затратить работу.
Итак, с какой силой надо давить на поршень, чтобы уравновесить удары молекул? При каждом ударе поршню сообщается некий импульс. В каждую секунду поршень получает определенный импульс и начинает двигаться. Чтобы предотвратить это, приложенная нами сила за секунду должна сообщить поршню точно такой же импульс. Таким образом, сила равна импульсу, сообщенному поршню за 1 сек. Можно об этом сказать и иначе: если предоставить поршень самому себе, то он за счет бомбардировки наберет скорость и с каждым ударом будет подталкиваться и двигаться с ускорением. Быстрота изменения скорости поршня, или ускорение, пропорциональна действующей силе. Таким образом, сила, которую мы определили как произведение давления на площадь, равна импульсу, сообщенному поршню за 1 сек всеми молекулами внутри ящика.
Подсчитать импульс, передаваемый поршню за 1 сек, легко; мы сделаем это в два этапа: сначала определим импульс, переданный одним атомом при столкновении с поршнем, а потом умножим эту величину на число соударений атомов с поршнем за 1 сек. Сила и будет произведением этих двух величин.
Займемся теперь этими величинами: предположим сначала, что поршень — это идеальный «отражатель» атомов. Если это не так, то вся наша теория рухнет — поршень начнет нагреваться и произойдет много всяких событий, предсказать которые мы не в состоянии. Однако, когда снова установится равновесие, в результате окажется, что каждое столкновение будет эффективно упругим. В среднем энергия приходящих и уходящих частиц не изменяется. Таким образом, предположим, что газ находится в равновесии и поршень, будучи неподвижным, энергии не поглощает. В этом случае частица, подлетевшая к поршню с определенной скоростью, улетит от него с той же скоростью, причем масса частицы не изменится.
Если v есть скорость атома, а vx— составляющая скорости вдоль оси х, то импульс «к поршню» равен mvx, но раз частица «отражается», то импульс «от поршня» равен той же величине; значит, за одно соударение поршню сообщается импульс 2mvx.
Нужно теперь подсчитать число соударений атома за 1 сек; для этого можно взять любой промежуток времени dt, а потом разделить число соударений на dt. Много ли атомов попадает за это время в цель? Предположим, что в объеме V заключено N атомов, т. е. в каждом единичном объеме имеется n=N/V атомов. Теперь заметим, что за время t достигнут поршня не все частицы, движущиеся к поршню с заданной скоростью, а только те, которые оказались достаточно близко от него. Если частицы были очень далеко, то, хотя они и стремятся к поршню, к сроку они не успеют. Таким образом, за время t о поршень ударятся лишь те частицы, которые в начальный момент были не дальше чем на расстоянии vxt от него. Следовательно, число соударений за время t равно числу атомов, находящихся на расстоянии, не превышающем vxt, а поскольку площадь поршня равна А, то атомы, которые со временем попадут в цель, занимают объем Avxt. А число атомов, попавших в цель, равно произведению объема на число атомов в единичном объеме nvxAt. Но нас, конечно, интересует не число соударений за время t, а мы хотим знать число соударений за 1 сек, поэтому мы делим на t и получаем nvxA. (Время t может быть взято очень малым, для красоты можно писать dt и затем дифференцировать, но это все одно и то же.)
Итак, мы нашли, что сила равна
(39.3)
Обратите внимание, что если фиксировать плотность частиц, то сила оказывается пропорциональной площади! После этого давление найти очень просто:
(39.4)
Теперь надо исправить кое-какие неточности: прежде всего не все молекулы имеют одну и ту же скорость и не все они движутся в одном направлении, так что нам приходится иметь дело с разными v2x! Каждая молекула, ударяясь о поршень, вносит свой вклад, поэтому надо взять среднее по всем молекулам. Сделав это, мы получим
(39.5)
А не забыли ли мы множитель 2? Нет, потому что лишь половина атомов движется к поршню. Другие летят в противоположную сторону, а усредняя по v2x, мы усредняем как по положительным, так и по отрицательным составляющим vx. Если просто усреднить по v2x, получится вдвое больший результат. Среднее v2x для положительных vx равно половине среднего v2x для всех vx.
Но атомы прыгают в ящике как хотят, и поэтому ясно, что «x-направление» для них ничем не отличается от любого другого; они движутся куда угодно: вправо — влево, вверх — вниз, взад — вперед. Поэтому <v2x> (средний квадрат скорости движения в одном направлении) равен среднему квадрату скорости в любом другом направлении
(39.6)
Используем это обстоятельство для небольшого математического трюка и обнаружим, что каждый из членов в (39.6) равен их сумме, деленной на три, а сумма — это квадрат величины скорости:
(39.7)
Это очень хорошо, потому что теперь уже не надо заботиться о координатных осях, и формулу для давления можно записать в виде
(39.8)
Мы выделили множитель <mv2/2>, потому что это кинетическая энергия движения молекулы как целого. Итак, мы нашли
(39.9)
Если мы будем знать скорость молекул, то очень быстро подсчитаем давление.
В качестве простого примера можно описать такие газы, как гелий, пары ртути или калия при достаточно высокой температуре или аргон; это одноатомные газы, для которых можно считать, что их атомы не имеют внутренних степеней свободы. Если нам попадется сложная молекула, то в ней могут быть всевозможные внутренние движения, всякого рода колебания и т. д. Мы предполагаем, что можно не принимать их в расчет; но можно ли это делать — вопрос сложный и мы к нему вернемся; в действительности для нашего случая это окажется допустимым. Итак, предположим, что внутреннее движение атомов можно не рассматривать, и поэтому кинетическая энергия движения молекулы как целого восполняет всю энергию. Для одноатомного газа кинетическая энергия — действительно полная энергия. Будем обозначать полную энергию буквой U (иногда ее называют полной внутренней энергией, как-будто у газа может быть какая-то внешняя энергия), т. е. всю энергию всех молекул газа или любого другого объекта.
В случае одноатомного газа мы предположим, что полная энергия U равна произведению числа атомов на среднюю кинетическую энергию каждого из них, потому что мы пренебрегли возможным возбуждением атомов или какими-то внутриатомными движениями. Тогда
(39.10)
Немного задержимся и ответим на такой вопрос: предположим, что мы медленно сжимаем газ; каким должно быть давление, чтобы сжать газ до заданного объема? Определить это легко, так как давление есть энергия, деленная на объем. Но когда газ сжимается, производится работа и поэтому энергия газа U возрастает. Процесс сжатия описывается неким дифференциальным уравнением. В начальный момент газ занимает определенный объем и обладает определенной энергией, поэтому нам известно и давление. Как только мы начинаем сжимать газ, энергия U возрастает, объем V уменьшается, а как изменяется давление, нам еще предстоит узнать.
Итак, нам предстоит решить дифференциальное уравнение. Сейчас мы это сделаем. Однако подчеркнем сначала, что, сжимая газ, мы предполагаем, что вся работа уходит на увеличение энергии атомов газа. Вы спросите: «А необходимо ли на этом останавливаться? Куда же еще она может уйти?» Но оказывается, что затраченная работа может уйти и в другое место. Энергия может «вытечь» из ящика сквозь стенки: горячие (т. е. очень быстрые) атомы при бомбардировке будут нагревать стенки ящика и энергия выйдет наружу. Но мы предполагаем, что в нашем случае этого не происходит.
Сделаем небольшое обобщение, хотя и в этом случае мы будем рассматривать лишь очень частный случай: запишем вместо PV=2/3U
(39.11)
Энергия U умножается на (γ-1) для удобства, потому что в дальнейшем нам придется иметь дело с газами, для которых множитель перед U равен не 2/3, а какому-то другому числу. Чтобы можно было описывать и такие случаи, запишем этот множитель так, как его обозначают почти сто лет. Тогда в нашем случае одноатомного газа, такого, как гелий, γ=5/3, потому что 5/3-1=2/3.
Мы уже говорили, что совершаемая при сжатии газа работа равна -PdV. Сжатие, при котором тепло не поглощается и не выделяется, называется адиабатическим сжатием; это слово образовано из трех греческих слов: а(не)+dia(сквозь)+bainein(проходить). (Слово адиабатический употребляется в физике в разных смыслах, так что не всегда можно понять, что между ними общего.) При адиабатическом сжатии вся затраченная работа уходит на изменение внутренней энергии. Вот в этом и смысл, что нет потерь энергии и, значит, PdV=-dU. Но поскольку U=PV/γ-1, то можно записать
(39.12)
Итак, PdV=-(PdV+VdP)/(γ-1) или, приводя подобные члены, получаем γPdV=-VdP, или
(39.1З)
Если мы примем, что γ постоянна, а это так в случае одноатомных газов, то уравнение интегрируется и мы получаем γlnV+lnP=lnC, где С — постоянная интегрирования. Переходя к степеням, мы получаем такой закон:
(39.14)
Иначе говоря, если выполнены условия адиабатичности, т. е. потерь энергии нет и газ при сжатии нагревается, то в случае одноатомного газа произведение объема на давление в степени 5/3 есть величина постоянная! Этот результат мы получили чисто теоретически, но опыт показывает, что и в действительности все происходит именно так.
§ 3. Сжимаемость излучения
Приведем еще один пример из кинетической теории газов; он не особенно интересует химиков, но очень важен для астрономов. Внутри нагретого до высокой температуры ящика имеется огромное число фотонов. (В качестве такого ящика надо взять очень горячую звезду. Солнце недостаточно горячо для этих целей. В звезде, правда, слишком много атомов, но если ее температура очень высока, то атомами можно пренебречь и считать, что внутренность звезды целиком заполнена фотонами.) Вспомним теперь, что фотон обладает импульсом р. (При изучении кинетической теории газов мы всегда будем испытывать страшные неудобства: P — это давление, но р — еще и импульс; V — это объем, но это и скорость одновременно, а Т — это и температура, и кинетическая энергия, и время, и момент силы; тут нужен глаз да глаз.) Сейчас буква р — это импульс, вектор. Поступим так же, как и в предыдущем параграфе, за удары фотонов о стенку ответственна x-составляющая импульса, а удвоенная x-составляющая импульса — это импульс, полученный стенкой после каждого удара. Итак, вместо 2mvx пишем 2рx, а при вычислении числа столкновений нужно по-прежнему подставлять vx; проделав все это, формулу (39.4) для давления мы уже записываем в виде
(39.15)
После усреднения мы получим произведение n на среднее значение pxvx (вспомните, что мы говорили о множителе 2), а после того как на помощь будут призваны два других измерения, мы найдем
(39.16)
Эта формула почти совпадает с (39.9), потому что импульс равен mv, просто это более общая формула, вот и все. Произведение давления на объем равно произведению полного числа атомов на среднее значение 1/3(p·v).
Чему равно p·v для фотонов? Импульс и скорость направлены одинаково, а скорость равна скорости света, поэтому интересующее нас произведение — это импульс фотона, умноженный на скорость света. Произведение импульса фотона на скорость света — это энергия фотона: Е=рс. Мы имеем дело с энергией каждого фотона и должны умножить среднюю энергию фотона на число фотонов. Получается одна треть полной энергии:
(39.17)
Для фотонов, следовательно, поскольку впереди стоит 1/3, множитель (γ-1) в (39.11) равен 1/3, т. е. γ=4/3, значит, излучение в ящике подчиняется закону
(39.18)
Таким образом, мы знаем сжимаемость излучения! Можно использовать эту формулу при анализе вклада излучения в давление внутри звезды, подсчитать давление и оценить, как оно изменяется при сжатии звезды. Просто удивительно, как много мы уже умеем!
§ 4. Температура и кинетическая энергия
До сих пор мы не имели дела с температурой; мы сознательно избегали разговоров на эту тему. Мы знаем, что если сжимать газ, энергия молекул возрастает, и мы обычно говорим, что газ при этом нагревается. Теперь надо понять, какое это имеет отношение к температуре. Нам известно, что такое адиабатическое сжатие, а как поставить опыт, чтобы можно было сказать, что он был проведен при постоянной температуре? Если взять два одинаковых ящика с газом, приставить их один к другому и подержать так довольно долго, то даже если вначале эти ящики обладали тем, что мы назвали различной температурой, то в конце концов температуры их станут одинаковыми. Что это означает? Только то, что ящики достигли того состояния, которого они в конце концов достигли бы, если бы их надолго предоставили самим себе! Состояние, в котором температуры двух тел равны — это как раз то окончательное состояние, которого достигают после длительного соприкосновения друг с другом.
Давайте посмотрим, что случится, если ящик разделен на две части движущимся поршнем и каждое отделение заполнено разным газом, как это показано на фиг. 39.2 (для простоты предположим, что имеются два одноатомных газа, скажем, гелий и неон).
Фиг. 39.2. Атомы двух разных одноатомных газов, разделенных подвижным поршнем.
В отделении 1 атомы массы m1 движутся со скоростью v1, а в единице объема их насчитывается n1 штук, в отделении 2 эти числа соответственно равны m2, v2 и n2. При каких же условиях достигается равновесие?
Разумеется, бомбардировка слева заставляет поршень двигаться вправо и сжимает газ во втором отделении, затем то же самое происходит справа и поршень ходит так взад и вперед, пока давление с обеих сторон не сравняется, и тогда поршень остановится. Мы можем устроить так, чтобы давление с обеих сторон было одинаковым, для этого нужно, чтобы внутренние энергии, приходящиеся на единичный объем, были одинаковыми или чтобы произведения числа частиц n в единице объема на среднюю кинетическую энергию было одинаковым в обоих отделениях. Сейчас мы попытаемся доказать, что при равновесии должны быть одинаковы и отдельные сомножители. Пока мы знаем только, что равны между собой произведения чисел частиц в единичных объемах на средние кинетические энергии
это следует из условия равенства давлений и из (39.8). Нам предстоит установить, что по мере постепенного приближения к равновесию, когда температуры газов сравниваются, выполняется не только это условие, а происходит и еще кое-что.
Чтобы было яснее, предположим, что нужное давление слева в ящике достигается за счет очень большой плотности, но малых скоростей. При больших n и малых v можно получить то же самое давление, что и при малых n и больших v. Атомы, если они плотно упакованы, могут двигаться медленно, или атомов может быть совсем немного, но ударяют они о поршень с большей силой. Установится ли равновесие навсегда? Сначала кажется, что поршень никуда не сдвинется и так будет всегда, но если продумать все еще раз, то станет ясно, что мы упустили одну очень важную вещь. Дело в том, что давление на поршень вовсе не равномерное, поршень-то раскачивается точно так же, как барабанная перепонка, о которой мы говорили в начале главы, ведь каждый новый удар не похож на предыдущий. Получается не постоянное равномерное давление, а скорее нечто вроде барабанной дроби — давление непрерывно меняется, и наш поршень как бы постоянно дрожит. Предположим, что атомы правого отделения ударяют о поршень более или менее равномерно, а слева атомов меньше, и удары их редки, но очень энергичны. Тогда поршень то и дело будет получать очень сильный импульс слева и отходить вправо, в сторону более медленных атомов, причем скорость этих атомов будет возрастать. (При столкновении с поршнем каждый атом приобретает или теряет энергию в зависимости от того, в какую сторону движется поршень в момент столкновения.) После нескольких столкновений поршень качнется, потом еще, еще и еще..., газ в правом отделении будет время от времени встряхиваться, а это приведет к увеличению энергии его атомов, и движение их ускорится. Так будет продолжаться до тех пор, пока не уравновесятся качания поршня. А равновесие установится тогда, когда скорость поршня станет такой, что он будет отбирать у атомов энергию так же быстро, как и отдавать. Итак, поршень движется с какой-то средней скоростью, и нам предстоит найти ее. Если нам это удастся, мы подойдем к решению задачи поближе, потому что атомы должны подогнать свои скорости так, чтобы каждый газ получал через поршень ровно столько энергии, сколько теряет.
Очень трудно рассчитать движение поршня во всех деталях; хотя все это очень легко понять, оказывается, что проанализировать это несколько труднее. Прежде чем приступить к такому анализу, решим другую задачу: пусть ящик заполнен молекулами двух сортов с массами m1 и m2, скоростями v1 и v2 и т. д.; теперь молекулы смогут познакомиться поближе. Если сначала все молекулы № 2 покоятся, то долго это продолжаться не может, потому что о них будут ударять молекулы № 1 и сообщать им какую-то скорость. Если молекулы № 2 могут двигаться значительно быстрее, чем молекулы № 1, то все равно рано или поздно им придется отдать часть своей энергии более медленным молекулам. Таким образом, если ящик заполнен смесью двух газов, то проблема состоит в определении относительной скорости молекул обоих сортов.
Это тоже очень трудная задача, но мы все-таки решим ее. Сначала нам придется решить «подзадачу» (опять это один из тех случаев, когда, независимо от того как решается задача, окончательный результат запоминается легко, а вывод требует большого искусства). Предположим, что перед нами две сталкивающиеся молекулы, обладающие разными массами; во избежание осложнений мы наблюдаем за столкновением из системы их центра масс (ц. м.), откуда легче уследить за ударом молекул. По законам столкновений, выведенным из законов сохранения импульса и энергии, после столкновения молекулы могут двигаться только так, что каждая сохраняет величину своей первоначальной скорости, и изменить они могут только направление движения. Типичное столкновение выглядит так, как его изобразили на фиг. 39.3.
Фиг. 39.3. Столкновение двух неодинаковых молекул, если смотреть из системы центра масс.
Предположим на минутку, что мы наблюдаем столкновения, системы центра масс которых покоятся. Кроме того, надо предположить, что все молекулы движутся горизонтально. Конечно, после первого же столкновения часть молекул будет двигаться уже под каким-то углом к исходному направлению. Иначе говоря, если вначале все молекулы двигались горизонтально, то спустя некоторое время мы обнаружим уже вертикально движущиеся молекулы. После ряда других столкновений они снова изменят направление и повернутся еще на какой-то угол. Таким образом, если кому-нибудь и удастся сначала навести порядок среди молекул, то все равно они очень скоро разбредутся по разным направлениям и с каждым разом будут все больше и больше распыляться. К чему же это в конце концов приведет? Ответ: Любая пара молекул будет двигаться в произвольно выбранном направлении столь же охотно, как и в любом другом. После этого дальнейшие столкновения уже не смогут изменить распределения молекул.
Что имеется в виду, когда говорят о равновероятном движении в любом направлении? Конечно, нельзя говорить о вероятности движения вдоль заданной прямой — прямая слишком тонка, чтобы к ней можно было относить вероятность, а следует взять единицу «чего-нибудь». Идея заключается в том, что через заданный участок сферы с центром в точке столкновения проходит столько же молекул, сколько через любой другой участок сферы. В результате столкновений молекулы распределяются по направлениям так, что любым двум равным по площади участкам сферы будут соответствовать равные вероятности (т. е. одинаковое число прошедших через эти участки молекул).
Между прочим, если мы будем сравнивать первоначальное направление и направление, образующее с ним какой-то угол θ, то интересно, что элементарная площадь на сфере единичного радиуса равна произведению 2π на sinθdθ, или, что то же самое, на дифференциал cosθ. Это означает, что косинус угла θ между двумя направлениями с равной вероятностью принимает любое значение между -1 и +1.
Теперь нам надо вспомнить о том, что имеется на самом деле; ведь у нас нет столкновений в системе центра масс, а сталкиваются два атома с произвольными векторными скоростями v1 и v2. Что происходит с ними? Мы поступим так: снова перейдем к системе центра масс, только теперь она движется с «усредненной по массам» скоростью vц.м.=(m1v1+m2v2)/(m1+m2). Если следить за столкновением из системы центра масс, то оно будет выглядеть так, как это изображено на фиг. 39.3, только надо подумать об относительной скорости столкновения w. Относительная скорость равна v1-v2. Дело, следовательно, обстоит так: движется система центра масс, а в системе центра масс молекулы сближаются с относительной скоростью w; столкнувшись, они движутся по новым направлениям. Пока все это происходит, центр масс все время движется с одной и той же скоростью без изменений.
Ну и что же получится в конце концов? Из предыдущих рассуждений делаем следующий вывод: при равновесии все направления w равновероятны относительно направления движения центра масс[28]. Это означает, что в конце концов не будет никакой корреляции между направлением относительной скорости и движением центра масс. Если бы даже такая корреляция существовала вначале, то столкновения ее бы разрушили и она в конце концов исчезла бы полностью. Поэтому среднее значение косинуса угла между w и vц.м. равно нулю. Это значит, что
(39.19)
Скалярное произведение w·vц.м. легко выразить через v1 и v2:
(39.20)
Займемся сначала v1·v2; чему равно среднее v1·v2? Иначе говоря, чему равно среднее проекции скорости одной молекулы на направление скорости другой молекулы? Ясно, что вероятности движения молекулы как в одну сторону, так и в противоположную одинаковы. Среднее значение скорости v2 в любом направлении равно нулю. Поэтому и в направлении v1 среднее значение v2 тоже равно нулю. Итак, среднее значение v1·v2 равно нулю! Следовательно, мы пришли к выводу, что среднее m1v21 должно быть равно m2v22. Это значит, что средние кинетические энергии обеих молекул должны быть равны:
(39.21)
Если газ состоит из атомов двух сортов, то можно показать (и мы даже считаем, что нам удалось это сделать), что средние кинетические энергии атомов каждого сорта равны, когда газ находится в состоянии равновесия. Это означает, что тяжелые атомы движутся медленнее, чем легкие; это легко проверить, поставив эксперимент с «атомами» различных масс в воздушном желобе.
Теперь сделаем следующий шаг и покажем, что если в ящике имеются два газа, разделенные перегородкой, то по мере достижения равновесия средние кинетические энергии атомов разных газов будут одинаковы, хотя атомы и заключены в разные ящики. Рассуждение можно построить по-разному. Например, можно представить, что в перегородке проделана маленькая дырочка (фиг. 39.4), так что молекулы одного газа проходят сквозь нее, а молекулы второго слишком велики и не пролезают.
Фиг. 39.4. Два газа в ящике, разделенном полупроницаемой перегородкой.
Когда установится равновесие, то в том отделении, где находится смесь газов, средние кинетические энергии молекул каждого сорта сравняются. Но ведь в числе проникших сквозь дырочку молекул есть и такие, которые не потеряли при этом энергии, поэтому средняя кинетическая энергия молекул чистого газа должна быть равна средней кинетической энергии молекул смеси. Это не очень удовлетворительное доказательство, потому что ведь могло и не быть такой дырочки, сквозь которую пройдут молекулы одного газа и не смогут пройти молекулы другого.
Давайте вернемся к задаче о поршне. Можно показать, что кинетическая энергия поршня тоже должна быть равна 1/2m2v22. Фактически кинетическая энергия поршня связана только с его горизонтальным движением. Пренебрегая возможным движением поршня вверх и вниз, мы найдем, что горизонтальному движению соответствует кинетическая энергия 1/2m2v2x2. Но точно так же, исходя из равновесия на другой стороне, можно показать, что кинетическая энергия поршня должна быть равна 1/2m1v1x2. Хотя мы повторяем предыдущее рассуждение, возникают некоторые дополнительные трудности в связи с тем, что в результате столкновений средние кинетические энергии поршня и молекулы газа сравниваются, потому что поршень находится не внутри газа, а смещен в одну сторону.
Если вас не удовлетворит и это доказательство, то можно придумать искусственный пример, когда равновесие обеспечивается устройством, по которому молекулы каждого газа бьют с обеих сторон. Предположим, что сквозь поршень проходит короткий стержень, на концах которого насажено по шару. Стержень может двигаться сквозь поршень без трения. По каждому из шаров со всех сторон бьют молекулы одного сорта. Пусть масса нашего устройства равна m, а массы молекул газа, как и раньше, равны m1 и m2. В результате столкновений с молекулами первого сорта кинетическая энергия тела массы m равна среднему значению 1/2 mtv12 (мы уже доказали это). Точно так же, столкновения с молекулами второго сорта заставляют тело иметь кинетическую энергию, равную среднему значению 1/2m2v22. Если газы находятся в тепловом равновесии, то кинетические энергии обоих шаров должны быть равны. Таким образом, результат, доказанный для случая смеси газов, можно немедленно обобщить на случай двух разных газов при одинаковой температуре.
Итак, если два газа имеют одинаковую температуру, то средние кинетические энергии молекул этих газов в системе центра масс равны.
Средняя кинетическая энергия молекул — это свойство только «температуры». А будучи свойством «температуры», а не газа, она может служить определением температуры. Средняя кинетическая энергия молекулы, таким образом, есть некоторая функция температуры. Но кто нам подскажет, по какой шкале отсчитывать температуру? Мы можем сами определить шкалу температуры так, что средняя энергия будет пропорциональна температуре. Лучше всего для этого назвать «температурой» саму среднюю энергию. Это была бы самая простая функция, но, к несчастью, эту шкалу уже выбрали иначе и вместо того, чтобы назвать энергию молекулы просто «температурой», используют постоянный множитель, связывающий среднюю энергию молекулы и градус абсолютной температуры, или градус Кельвина. Этот множитель: k=1,38·10-23 дж на каждый градус Кельвина[29]. Таким образом, если абсолютная температура газа равна Т, то средняя кинетическая энергия молекулы равна 3/2kT (множитель 3/2 введен только для удобства, благодаря чему исчезнут множители в других формулах).
Заметим, что кинетическая энергия, связанная с составляющей движения в любом направлении, равна только 1/2kТ. Три независимых направления движения доводят ее до 3/2kT.
§ 5. Закон идеального газа
Теперь можно подставить наше определение температуры в уравнение (39.9) и найти закон зависимости давления газа от температуры: произведение давления на объем равно произведению полного числа атомов на универсальную постоянную k и температуру:
(39.22)
Следовательно, при одинаковых температуре, давлении и объеме число атомов строго определено — это тоже универсальная постоянная! Таким образом, из законов Ньютона следует, что в равных объемах любых газов при одинаковых температуре и давлении содержится равное число молекул. Вот какой неожиданный вывод!
На практике, когда имеешь дело с молекулами, приходится оперировать большими числами, поэтому химики произвольно выбрали число, очень большое число, и придумали ему специальное название. Они назвали его моль. Моль — это очень искусственное число. Почему химики не приняли за единицу 1024, чтобы вышло круглое число,— это вопрос исторический.
Случилось так, что они для удобства выбрали стандартное число N0=6,02·1023 объектов и назвали это число молем объектов. После этого, вместо того чтобы измерять число молекул в штуках, они измеряют их в молях[30]. Можно написать число молей (выражая их через N0) и умножить его на число атомов в моле, потом умножить на kT, а затем, если захотим, выделить произведение числа атомов в моле на k, тогда получится молярное значение k; для этой величины выделим особую букву R. Молярное значение k равно 8,317 дж: R=N0k=8,317дж/моль·К-1. Таким образом мы нашли газовый закон, выраженный в виде произведения числа молей (его обозначают буквой N) на RT, или в виде произведения числа атомов на kT:
(39.23)
Смысл тот же самый, только единицы измерения разные. В качестве единицы мы используем 1, а химики используют 6·1023!
Сделаем еще одно замечание по поводу газового закона; оно касается вещей более сложных, чем одноатомные молекулы. Пока мы имели дело только с движением одноатомного газа в центре масс. А что если при этом учесть действие сил? Рассмотрим сначала случай, когда поршень удерживается горизонтально расположенной пружинкой, на которую действует сила. Взаимная встряска атомов и поршня в каждый данный момент, конечно, не зависит от положения поршня. Условия равновесия остаются прежними. Независимо от того, где находится поршень, от него требуется только, чтобы скорость его движения была такой, чтобы он получал от молекул столько же энергии, сколько отдавал им. Наличие пружинки не меняет дела. Скорость, с которой движется поршень, в среднем та же. Таким образом, наша теорема о том, что средняя кинетическая энергия в одном направлении равна 1/2kT, справедлива независимо от того, есть силы или их нет.
Рассмотрим, например, двухатомную молекулу, составленную из атомов с массами mА и mB. Нам удалось доказать, что движение в центре масс части А и части В таково, что <1/2mAvA2>=<1/2mBvB2>=3/2kT. Но как это может быть, если отдельные части связаны друг с другом? Хотя они и связаны между собой, но обмен энергией при взаимных вращениях, изменении расстояния и соударениях с другими молекулами зависит только от того, как быстро они движутся. Только этим определяется обмен энергией при соударениях. Сила в каждый отдельный момент не имеет никакого значения. Следовательно, даже если между отдельными частями молекулы действуют силы, верен тот же принцип.
Докажем, наконец, что газовый закон справедлив и в том случае, когда внутреннее движение не учитывается. До сих пор нам не надо было включать внутреннее движение. Мы просто рассматривали одноатомный газ. Но теперь мы покажем, что скорость центра масс любого объекта, который можно рассматривать как тело массы М, равна
(39.24)
Иначе говоря, можно рассматривать как отдельные части, так и всю молекулу в целом! Посмотрим, почему это можно делать: масса двухатомной молекулы равна М=mА+mB, а скорость центра масс равна vц.м.=(mAvA+mBvB)/M. Нам нужно теперь определить <vц.м.2>. Если возвести в квадрат vц.м., то получится
Умножив это на 1/2M и усреднив, получим
[Мы воспользовались тем, что (mA+mB)/М=1.] А чему равно <vA·vB>? (Хорошо бы, чтобы это было равно нулю!) Чтобы найти это среднее, используем наше предположение, что относительная скорость w=vA-vB не предпочитает какое-то одно определенное направление остальным, т. е. средняя составляющая вдоль любого направления равна нулю. Мы предполагаем, следовательно, что
Но что такое w·vц.м.? Это скалярное произведение, равное
Далее, поскольку <mAvA2>=<mBvB2>, то первый и последний члены взаимно уничтожаются, и мы получаем
Итак, если mА≠mB, то <vA·vB>=0, а это означает, что жесткому движению всей молекулы, рассматриваемой как одна частица массы М, соответствует средняя кинетическая энергия, равная 3/2kT.
Одновременно мы доказали, что средняя кинетическая энергия внутреннего движения двухатомной молекулы, если не учитывать движения центра масс, равна 3/2kT! Ведь полная кинетическая энергия отдельных частей молекулы равна 1/2mAvA2+1/2mBvB2, а среднее ее значение — это 3/2kT+3/2kT, или 3kT. Кинетическая энергия движения центра масс равна 3/2kT, так что средняя кинетическая энергия вращательного и колебательного движений двух атомов внутри молекулы — это разность этих величин, 3/2kT.
Теорема о средней энергии центра масс — это весьма общая теорема: для каждого объекта, рассматриваемого как единое целое, независимо от того, действуют на этот объект силы или нет, средняя кинетическая энергия каждого независимого движения равна 1/2kT. Эти «независимые направления движения» иногда называют степенями свободы системы. Число степеней свободы молекулы, составленной из r атомов, равно 3r, потому что для определения положения каждого атома нужны три координаты. Полную кинетическую энергию молекулы можно представить либо как сумму кинетических энергий отдельных атомов, либо как сумму кинетической энергии движения Центра масс и кинетической энергии внутренних движений. Последнюю иногда можно представить как сумму кинетической энергии вращений и кинетической энергии колебаний, но это можно сделать только приближенно. Наша теорема, если применить ее к r-атомной молекуле, гласит, что средняя кинетическая энергия молекулы равна 3/2rkT дж, из которых 3/2kT — кинетическая энергия движения молекулы как целого, а остаток 3/2(r-1)kT — это внутренняя кинетическая энергия вращений и колебаний.
Глава 40 ПРИНЦИПЫ СТАТИСТИЧЕСКОЙ МЕХАНИКИ
§ 1. Экспоненциальная атмосфера
Мы уже изучали некоторые свойства большого числа сталкивающихся атомов. Наука, которая занимается этим, называется кинетической теорией, и она описывает свойства вещества, рассматривая, как сталкиваются атомы. Мы утверждаем, что все свойства вещества в целом можно объяснить, рассматривая движение отдельных его частей.
Пока мы ограничимся случаем теплового равновесия, т. е. всего лишь подклассом всех явлений природы. Законы механики, применяемые в условиях теплового равновесия, получили название статистической механики, и в этой главе вы немного познакомитесь с некоторыми основными теоремами этой науки.
Одна теорема статистической механики вам уже известна. Согласно этой теореме, для любого движения при абсолютной температуре Т средняя кинетическая энергия каждого независимого движения (каждой степени свободы) равна 1/2kT. После этого нам становится кое-что известно о среднем квадрате скорости атомов. Теперь нам необходимо узнать чуть побольше о координатах атомов, чтобы выяснить, много ли их находится при тепловом равновесии в той или иной точке пространства, а также немного подробнее изучить распределение атомов по скоростям. Хотя мы знаем, чему равен средний квадрат скорости, мы все же не можем ответить на вопрос, сколько атомов обладают скоростью, в три раза большей, чем корень из среднего квадрата скорости, или скоростью, равной одной четверти корня из среднего квадрата скорости. А вдруг все атомы имеют одинаковую скорость?
Итак, вот два вопроса, на которые мы попытаемся дать ответ: 1) Как атомы располагаются в пространстве, когда на них действуют силы? 2) Каково распределение атомов по скоростям?
Заметим, что это два совершенно независимых вопроса и что распределение по скоростям всегда одинаково. Этого можно было ожидать после того, как мы выяснили, что средняя кинетическая энергия степени свободы всегда равна 1/2kT, независимо от того, какие силы действуют на молекулы. Распределение по скоростям молекул не зависит от сил, потому что силы не влияют на частоту столкновений.
Давайте начнем с примера распределения молекул в атмосфере, подобной той, в которой мы живем, но без ветра или других каких-либо возмущений.
Предположим, что мы имеем дело с довольно высоким столбом газа, находящегося в тепловом равновесии (не так, как в настоящей атмосфере; в ней, как известно, по мере подъема вверх становится холоднее). Укажем здесь, что нарушение равновесия в случае разницы температур на разных высотах можно продемонстрировать, поместив в столб газа металлический стержень так, что его концы соприкасаются с маленькими шариками (фиг. 40.1).
Фиг. 40.1. Равновесие в атмосфере с постоянной температурой. Давление на высоте h должно превосходить давление на высоте h+dh на вес заключенного между этими уровнями газа. Стержень и шарики выравнивают температуру.
Нижние шарики, получая от молекул газа энергию 1/2kT, передают ее через стержень верхним шарикам и встряхивают их; верхние шарики в свою очередь будут встряхивать соприкасающиеся с ними наверху молекулы. В конце концов, конечно, температура на разных высотах гравитационного поля станет одинаковой.
Нам предстоит найти закон, по которому происходит разрежение атмосферы по мере подъема вверх, когда температура на всех высотах одинакова. Если N — полное число молекул в объеме V газа с давлением Р, то PV=NkT, или Р=nkT, где n — число молекул в единичном объеме. Иначе говоря, если известно число молекул в единичном объеме, то известно и давление, и наоборот: давление и плотность пропорциональны друг другу, ведь температура в нашем случае постоянна. Но давление не может быть постоянным: с уменьшением высоты оно должно возрастать, потому что нижнему слою приходится, так сказать, выдерживать вес всех расположенных сверху атомов. Теперь можно определить, как давление меняется с высотой. Если на высоте h выделить площадку единичной площади, то на эту площадку снизу будет действовать сила, равная давлению Р. Если бы не было силы тяжести, то на площадку на высоте h+dh действовала бы сверху вниз точно такая же сила. Но в нашем случае это не так: действующая снизу сила должна превосходить силу, действующую сверху, на величину, равную весу газа, заключенного между слоями h и h+dh. На каждую молекулу действует сила тяжести mg, где g — ускорение силы тяжести. В интересующем нас слое находится ndh молекул. Это приводит к такому дифференциальному уравнению: Ph+dh-Ph=dP=-mgndh. Поскольку Р=nkT, а Т — постоянная, то можно избавиться или от Р, или от n. Исключим из уравнений Р; тогда получим
Это дифференциальное уравнение говорит нам, как убывает плотность по мере увеличения высоты.
Мы располагаем теперь дифференциальным уравнением для плотности частиц n, которая меняется с высотой, но меняется так, что производная плотности пропорциональна себе самой. Функция, производная которой пропорциональна себе самой,— это экспоненциальная функция и, значит, решение дифференциального уравнения имеет вид
(40.1)
Здесь постоянная интегрирования n0— плотность на высоте h=0 (которую можно задать произвольно); с высотой плотность экспоненциально убывает.
Заметим, что если имеется несколько сортов молекул с разными массами, то число их убывает по разным экспонентам. Число более тяжелых молекул убывает с высотой быстрее, чем число легких молекул. Поэтому можно ожидать, что раз кислород тяжелее азота, то по мере подъема вверх относительное содержание азота в атмосфере (смеси азота и кислорода) будет возрастать. В нашей атмосфере, во всяком случае на доступных высотах, этого фактически не происходит, ибо вследствие воздушных возмущений газы вновь перемешиваются. Ведь это же не изотермическая атмосфера. Тем не менее на больших высотах преобладают очень легкие газы, например водород, так как молекулы легких газов способны забраться на такую высоту, где все остальные экспоненты уже вымрут (фиг. 40.2).
Фиг. 40.2. Нормированная плотность как функция высоты в гравитационном поле Земли для кислорода и водорода при постоянной температуре.
§ 2. Закон Больцмана
Отметим здесь тот факт, что числитель показателя экспоненты в равенстве (40.1) — это потенциальная энергия атома. Поэтому можно в нашем случае сформулировать закон следующим образом: плотность в каждой точке пропорциональна
где п.э. — потенциальная энергия отдельного атома.
Возможно, что это случайность и этот закон справедлив только в частном случае однородного гравитационного поля. Однако можно показать, что это весьма общее утверждение. Предположим, что на молекулы газа действуют какие-то иные, не гравитационные, силы. Например, молекулы обладают электрическим зарядом, а тогда они реагируют на электрическое поле или на другой заряд, притягивающий их. А может быть, в результате взаимного притяжения атомов друг к другу или к стенкам, или к какому-нибудь твердому телу, или еще к чему-то существуют какие-то силы притяжения, которые зависят от взаимного расположения молекул и действуют на все молекулы. Предположим теперь для простоты, что все молекулы одинаковы и что сила действует на каждую отдельную молекулу, так что полная сила, действующая на произвольно выделяемую часть газа, равна просто произведению числа молекул на силу, действующую на одну молекулу. Дело совсем упростится, если выбрать систему координат так, что сила F будет действовать вдоль оси х.
Так же, как и раньше, рассечем газ двумя параллельными плоскостями, промежуток между которыми равен dx. Тогда сила, действующая на каждый атом, умноженная на число атомов в 1 см3 (обобщение прежнего nmg) и умноженная на dx, должна сбалансировать изменение давления: Fndx=dP=kTdn. Или, придав этому закону другую форму, которая пригодится позднее, запишем:
(40.2)
Теперь заметим, что —Fdx — это работа, которую надо совершить для переноса молекулы из х в х+dx, и если сила F произошла из потенциала, т. е. работу можно описывать с помощью потенциальной энергии, то нужную нам величину можно считать изменением потенциальной энергии (п. э.). Отрицательное изменение потенциальной энергии — это произведенная работа Fdx, так что d(lnn)=-d(п. э.)/kT, или после интегрирования
(40.3)
Таким образом, то, что нам удалось заметить в частном случае, справедливо вообще. (А что если F не происходит из потенциала? Тогда (40.2) просто-напросто не имеет решения. В этом случае, после того как какой-нибудь атом опишет замкнутый путь, вдоль которого полная работа не равна нулю, энергия либо прибавится, либо убавится и равновесие никогда не установится. Температурное равновесие невозможно, если внешние силы, действующие на газ, не консервативны.) Уравнение (40.3) известно под названием закона Больцмана. Это еще один из принципов статистической механики: вероятность найти молекулу в заданной точке заданной пространственной конфигурации изменяется экспоненциально, причем показатель экспоненты состоит из потенциальной энергии в заданной пространственной конфигурации, взятой с обратным знаком и деленной на kT.
Таким образом, мы знаем кое-что о распределении молекул. Предположим, что в нашем распоряжении имеется плавающий в жидкости положительный ион; он притягивает окружающие его отрицательные ионы. Много ли их окажется на разных расстояниях от положительного иона? Если нам известно, как зависит от расстояния потенциальная энергия, то отношение чисел ионов на разных расстояниях определяется полученным нами законом. Этому закону можно найти еще много других применений.
§ 3. Испарение жидкости
В менее элементарной статистической механике пытаются решить следующую важную задачу. Предположим, что имеется совокупность притягивающихся друг к другу молекул и сила между любыми двумя молекулами, скажем i-й и j-й, зависит только от расстояния между ними rij и может быть представлена в виде производной от потенциальной энергии V(rij). На фиг. 40.3 показан возможный вид такой функции.
Фиг. 40.3. Кривая потенциальной энергии для двух молекул. Потенциальная энергия зависит только от расстояний.
Если r>r0, то при сближении молекул энергия уменьшается, поэтому молекулы притягиваются; если же молекулы сближаются еще теснее, энергия очень резко возрастает, значит, на малых расстояниях молекулы сильно отталкиваются. Таково в общих чертах поведение молекул.
Предположим теперь, что мы заполнили этими молекулами какой-то ящик и хотим знать, как они там уместятся в среднем. На это даст ответ выражение ехр(-п. э./kT). В этом случае полная потенциальная энергия, если предположить, что молекулы взаимодействуют только попарно, равна сумме всех парных энергий (в более сложных случаях могут встретиться и тройные силы, но электрические силы, например, парные). Поэтому вероятность того, что молекулы образуют конфигурацию, характеризуемую заданными комбинациями расстояний rij, пропорциональна
Если температура очень высока, так что kT≫|V(r0)|, то экспонента почти всюду мала, и вероятность найти молекулу в том или ином месте почти не зависит от расстояния до других молекул. Рассмотрим случай двух молекул; в этом случае ехр (—п.э./kT) будет вероятностью найти молекулы на расстоянии r друг от друга. Ясно, что вероятность максимальна тогда, когда потенциал наиболее отрицателен, а когда потенциал стремится к бесконечности, вероятность почти равна нулю (это происходит на очень малых расстояниях). Это означает, что у атомов газа нет шансов столкнуться друг с другом, уж очень сильно они отталкиваются. Но очень велики шансы найти эти молекулы (если отнести вероятность к единичному объему) вблизи точки r0. Здесь вероятность больше, чем в других точках, но насколько больше — это зависит от температуры. Если температура очень велика по сравнению с разностью энергий в точках r=r0 и r=∞, то экспонента всегда почти равна единице. Это случай, когда средняя кинетическая энергия (она порядка kT) значительно превосходит потенциальную энергию. Силы тогда мало что значат. Но с падением температуры вероятность найти молекулы на расстоянии, близком к r0, резко возрастает по сравнению с вероятностью найти молекулы в любом другом месте; и в самом деле, если kT много меньше |V(r0)|, то около r0 экспонента имеет довольно большой положительный показатель. Другими словами, при заданном объеме молекулы предпочитают быть на расстоянии минимальной энергии, а не очень далеко друг от друга. По мере падения температуры атомы сближаются, сбиваются в кучу, объединяются в жидкости, в твердые тела и молекулы, а если их подогреть, то они испаряются.
Если бывает необходимо точно описать, как происходит испарение, или вообще уточнить, как молекулы ведут себя в данных обстоятельствах, то поступать следует так. Прежде всего нужно как можно точнее узнать закон взаимодействия молекул V(r). Как это сделать — безразлично: можно вычислить потенциал с помощью квантовой механики или установить закон взаимодействия экспериментально. Но если даже закон взаимодействия молекул известен, нужно все же учесть, что дело идет о миллионах молекул и нам еще придется хватить горя при изучении функции ехр(—∑Vij/kT). Все же удивительно, что функция так проста и все как будто ясно, поскольку известен точный потенциал взаимодействия, а дело это оказывается невероятно сложным: трудность заключается в ужасающе большом числе переменных.
Но вопрос захватывающе интересен. Это один из примеров того, что называют «задачей многих тел», и он содержит много поистине увлекательных вещей. Одна-единственная формула, которую мы получим, решив задачу, должна содержать все детали, например переход газа в твердое состояние или возможные кристаллические строения твердого тела. Многие пытались ее сосчитать, но математические трудности уж очень велики, и дело не в трудности вывода общего закона, а просто в том, чтобы справиться с огромным числом переменных.
Вот и все, что касается распределения частиц в пространстве. На этом, собственно, и кончается классическая статистическая механика, ибо если нам известны силы, то в принципе мы можем найти пространственное распределение, а распределение скоростей находится сразу на все случаи жизни, оно не будет меняться от случая к случаю. Основная задача состоит в получении более конкретной информации из нашего формального решения: это и является основным занятием классической статистической механики.
§ 4. Распределение молекул по скоростям
Обсудим теперь распределение молекул по скоростям, потому что интересно, а иногда и полезно знать, какая часть молекул движется с той или иной скоростью. Чтобы выяснить это, можно использовать те знания, которые мы приобрели, когда изучали распределение газа в атмосфере. Мы считаем газ идеальным; мы предполагали это, пренебрегая взаимным притяжением атомов при расчете потенциальной энергии. В наш первый пример мы включили лишь потенциальную энергию силы тяжести. Если бы между атомами существовали взаимные силы, то нам, конечно, пришлось бы написать что-нибудь более сложное. Но мы по-прежнему будем предполагать, что между атомами никаких сил нет, и на момент даже забудем о столкновениях; потом мы попытаемся найти этому оправдание. Мы видим, что на высоте h находится гораздо меньше молекул, чем на высоте 0 (фиг. 40.4); согласно формуле (40.1), число их экспоненциально убывает с высотой.
Фиг. 40.4. Высоты h достигают только те молекулы, скорость которых на высоте h=0 достаточно велика.
Но почему же на большей высоте меньше молекул? Разве не все молекулы, живущие на высоте 0, появляются на высоте h? Нет! Потому что на высоте 0 есть молекулы, движущиеся слишком медленно, и они не способны взобраться на потенциальную гору до высоты h. Вот и ключ к решению задачи о распределении молекул по скоростям; ведь, зная равенство (40.1), мы знаем число молекул, скорость которых слишком мала для достижения высоты h. Их ровно столько, чтобы создать нужное падение плотности при увеличении h.
Давайте сформулируем все поточнее: подсчитаем, сколько молекул проходит снизу вверх через плоскость h=0 (называя заданный уровень нулевой высотой, мы вовсе не считаем, что здесь пол, просто это удобнее нам для начала отсчета, и на отрицательной высоте может находиться газ). Эти молекулы газа движутся во всех направлениях, и некоторые из них проходят через нашу плоскость; таким образом, в любой момент сквозь плоскость снизу вверх проходит известное число молекул в секунду с заданной скоростью. Затем отметим следующее: если через u обозначить скорость, необходимую для того, чтобы подняться на высоту h (кинетическая энергия mu2/2=mgh), то число молекул в секунду, поднимающихся с нижней плоскости строго вверх и имеющих составляющую скорости, большую чем u, в точности равно числу молекул, пересекающих верхнюю плоскость с любой вертикальной составляющей скорости. Те молекулы, вертикальная скорость которых не превышает u, не достигают верхней плоскости. Таким образом,
Но число молекул, пересекающих h с любой скоростью, большей нуля, меньше числа молекул, пересекающих нижний уровень с любой скоростью, большей нуля, хотя бы потому, что внизу больше атомов. Вот и все, что нам нужно. Мы уже знаем, что распределение молекул по скоростям на всех высотах одинаково, ведь мы уже выяснили, что температура во всей атмосфере одинакова. Но поскольку распределение скоростей всюду одинаково и число атомов, пересекающих нижний уровень, больше, то ясно, что отношение n>0(h) (числа атомов, пересекающих высоту h с положительной скоростью) и n>0(0) (числа атомов, пересекающих с положительной скоростью высоту 0) равно отношению плотностей на этих высотах, т. е. ехр(—mgh/kT). Но n>0(h)=h>u(0), поэтому
поскольку 1/2mu2=mgh. Теперь скажем это своими словами: число молекул, пересекающих за 1 сек единичную площадь на высоте 0 с вертикальной составляющей скорости, превышающей u, равно произведению числа молекул, пересекающих эту площадку со скоростью, большей нуля, на ехр(-mu2/2kT).
Это верно не только для произвольной высоты 0, но и для любой другой высоты, поэтому распределение по скоростям одинаково повсюду! (Окончательный результат не включает высоты h, она появляется только в промежуточных рассуждениях.) Это общая теорема о распределении по скоростям. В ней утверждается, что если в столбе газа просверлить крохотную дырочку, ну совсем малюсенькую, так что столкновения там будут редки и длина пробега молекул между столкновениями будет много больше диаметра дырочки, то молекулы будут вылетать из нее с разными скоростями, но доля частиц, вылетающих со скоростью, превышающей и, равна ехр(-mu2/2kT).
Теперь вернемся к вопросу о том, можно ли пренебрегать столкновениями. Почему это не имеет значения? Мы могли бы повторить все наши доводы, используя не конечную высоту h, а бесконечно малую высоту h, столь малую, что для столкновений между высотами 0 и h было бы слишком мало места. Но это не обязательно: наши доводы, очевидно, основаны лишь на анализе значений энергий и на сохранении энергии; при столкновениях же происходит обмен энергиями среди молекул. Но нам довольно безразлично, следим ли мы за одной и той же молекулой, раз происходит лишь обмен энергиями с другой молекулой. И получается, что если мы даже сделаем это достаточно тщательно (а такую работу тщательно проделать, конечно, труднее), то результат будет тот же.
Интересно, что найденное нами распределение по скоростям имеет вид
(40.4)
Этот способ описания распределения по скоростям —когда подсчитывается число молекул, проходящих через выделенную площадку с заданной минимальной z-составляющей скорости,— отнюдь не самый удобный. Например, чаще хотят знать, сколько молекул в заданном объеме газа движется, имея z-составляющую скорости между двумя заданными значениями, а это, конечно, из (40.4) сразу не получишь. Поэтому придадим нашей формуле удобную форму, хотя то, что мы получили, — это весьма общий результат. Заметим, что невозможно утверждать, что любая молекула в точности обладает той или иной наперед заданной скоростью; ни одна из них не движется со скоростью, в точности равной 1,7962899173 м/сек. Итак, чтобы придать нашему утверждению какой-то смысл, мы должны спросить, сколько молекул можно найти в заданном интервале скоростей. Нам придется говорить о том, как часто встречаются скорости в интервале между 1,796 и 1,797 и т. п. Выражаясь математически, пусть f(u)du будет долей всех молекул, чьи скорости заключены в промежутке u и u+du, или, что то же самое (если du бесконечно мало), долей всех молекул, имеющих скорость и с точностью до du. На фиг. 40.5 представлена возможная форма функции f(u), а заштрихованная часть ширины du и средней высоты f(u) — это доля молекул f(u)du.
Таким образом, отношение площади заштрихованного участка ко всей площади под кривой равно относительному числу молекул со скоростью и внутри отрезка du.
Фиг. 40.5. Функция, распределения скоростей. Заштрихованная площадь равна f(u)du — это относительное число частиц, скорости которых заключены внутри отрезка du около точки u.
Если определить f(u) так, что относительное число молекул будет просто равно площади заштрихованного участка, то полная площадь под кривой — это все 100% молекул, т. е.
(40.5)
Теперь остается только найти это распределение, сравнив его с результатом доказанной ранее теоремы. Сначала надо выяснить, как выразить через f(u) число молекул, проходящих за 1 сек через заданную площадку со скоростью, превышающей u?
Это число не равно интегралу u∫∞f(u)du (хотя это первое, что приходит в голову), ведь нас интересует число молекул, проходящих через площадку за секунду. Более быстрые молекулы будут пересекать площадку, так сказать, чаще, чем более медленные, поэтому, чтобы найти число проходящих молекул, надо умножить плотность молекул на скорость. (Мы уже обсуждали это в предыдущей главе, когда подсчитывали число столкновений.)
Полное число молекул, проходящих через поверхность за время t, равно числу молекул, способных достигнуть поверхности, а это молекулы, проходящие к поверхности с расстояния ut. Таким образом, число молекул, достигающих площадки, определяется не просто числом молекул, движущихся с данной скоростью, а равно этому числу, отнесенному к единице объема, и умноженному на расстояние, которое они пройдут, прежде чем достигнут площадки, сквозь которую они, по-видимому, должны пройти, а это расстояние пропорционально u. Значит, нам предстоит вычислить интеграл от произведения и на f(u)du, взятый от u до бесконечности, причем мы уже знаем, что этот интеграл обязательно должен быть пропорционален ехр(-mu2/2kT), а постоянную пропорциональности еще надо определить:
(40.6)
Если теперь продифференцировать интеграл по u, то мы получим подынтегральное выражение (со знаком минус, потому что u — это нижний предел интегрирования), а дифференцируя правую часть равенства, мы получим произведение u на экспоненту (и на некоторую постоянную). Сократим в обеих частях и, и тогда
(40.7)
Мы оставили в обеих частях равенства du, чтобы помнить, что это распределение; оно говорит нам об относительном числе молекул, имеющих скорость между u и u+du.
Постоянная С должна определиться из условия равенства интеграла единице в согласии с уравнением (40.5). Можно доказать[31], что
Используя это обстоятельство, легко найти С=√(m/2πkT).
Поскольку скорость и импульс пропорциональны, можно утверждать, что распределение молекул по импульсам, отнесенное к единице импульсной шкалы, также пропорционально ехр(-к.э./kT). Оказывается, что эта теорема верна также в теории относительности, если только формулировать ее в терминах импульсов, тогда как в терминах скоростей это уже не так; поэтому сформулируем все в терминах импульсов:
(40.8)
Это значит, что мы установили, что вероятности, определяемые энергиями разного происхождения (и кинетической и потенциальной), в обоих случаях выражаются одинаково: ехр(-энергия/kT); таким образом, наша замечательная теорема приобрела форму, весьма удобную для запоминания.
Однако пока мы говорили только о «вертикальном» распределении скоростей. Но мы можем спросить, какова вероятность того, что молекула движется в другую сторону? Конечно, эти распределения связаны друг с другом и можно получить полное распределение, исходя из какого-то одного, ведь полное распределение зависит только от квадрата величины скорости, а не от ее z-составляющей. Распределение по скоростям не должно зависеть от направления и определяться только функцией u2 — вероятностью величины скорости. Нам известно распределение z-составляющей, и мы хотим получить отсюда распределение других составляющих. В результате полное распределение по-прежнему пропорционально ехр(-к.э./kT), только теперь кинетическая энергия состоит из трех частей: mvx2/2, mvy2/2 и mvz2/2, суммируемых в показателе экспоненты. А можно записать это и в виде произведения:
(40.9)
Вы можете убедиться в том, что эта формула верна, ибо, во-первых, распределение зависит только от v2 и, во-вторых, вероятности данных vz получаются после интегрирования по всем vx и vy и это должно привести к (40.7). Но обоим этим требованиям удовлетворяет только функция (40.9).
§ 5. Удельные теплоемкости газов
Посмотрим теперь, как можно проверить теорию и оценить, насколько хороша классическая теория газов. Мы уже говорили, что если U—внутренняя энергия N молекул, то формула pV=NkT=(γ-1)U иногда и для некоторых газов может оказаться правильной. Мы знаем, что для одноатомного газа правая часть равна 2/3 кинетической энергии движения центров масс атомов. В случае одноатомного газа кинетическая энергия равна внутренней энергии, поэтому γ-1==2/3.
Но предположим, что мы столкнулись с более сложной молекулой, которая может вращаться и колебаться, и предположим (в классической механике это так), что энергии внутренних движений также пропорциональны kT. Поэтому при заданной температуре молекула, кроме кинетической энергии kT, имеет внутреннюю энергию колебания и вращения. Тогда полная энергия U включает не только кинетическую энергию, но и вращательную энергию и мы получаем другие значения у. Наилучший способ измерения γ — это измерение удельной теплоемкости, характеризующей изменение энергии при изменении температуры. К этому способу мы еще вернемся, а пока предположим, что нам удалось экспериментально определить γ с помощью кривой PVγ, соответствующей адиабатическому сжатию.
Попробуем вычислить γ для ряда частных случаев. Прежде всего для одноатомных газов полная энергия U есть не что иное, как кинетическая энергия, и в этом случае, как мы уже знаем, γ равно 5/3. В качестве примера двухатомных газов рассмотрим кислород, водород, пары иода и т. д. и предположим, что двухатомный газ можно представить как собрание пар атомов, между которыми действуют силы, похожие на те, что изображены на фиг. 40.3. Можно также предположить, и оказывается, что это вполне законно, что при температурах, обычных для диатомных газов, пары атомов стремятся удалиться друг от друга на расстояние r0 (расстояние минимума потенциальной энергии). Если бы это было не так, и вероятность не очень сильно зависела от удаления от равновесной конфигурации, то мы обнаружили бы, что кислород есть смесь сравнимых количеств O2 и одиночных атомов кислорода. А мы знаем, что в кислороде присутствует очень мало одиночных атомов кислорода, а это означает, что глубина потенциальной ямы значительно больше kT, и это как раз мы и предполагали. Но раз атомы, составляющие молекулу, прочно закреплены на расстоянии r0, то нам понадобится лишь часть потенциальной кривой вблизи минимума, которую в этом случае можно приближенно заменить параболой. Параболический потенциал соответствует гармоническому осциллятору, и, в самом деле, отличной моделью молекулы кислорода могут служить два соединенных пружинкой атома.
Но чему же равна полная энергия молекулы при температуре Т? Мы знаем, что кинетическая энергия каждого из атомов равна 3/2 kT, так что кинетическая энергия обоих атомов равна 3/2kT+3/2kT. Можно распределить эту энергию иначе: тогда те же самые 3/2 плюс 3/2 будут выглядеть как кинетическая энергия центра масс (3/2), кинетическая энергия вращения (2/2) и кинетическая энергия колебаний (1/2). Известно, что на долю кинетической энергии колебаний приходится 1/2, потому что это одномерное движение, а каждой степени свободы соответствует 1/2kT. Обращаясь к вращениям, мы можем выделить две оси вращения, что соответствует двум независимым движениям. Мы представляем себе атомы в виде точек, которые не могут вращаться вокруг соединяющей их линии. Но на всякий случай запомним о таком предположении, потому что если мы упремся где-то в тупик, то, может быть, здесь обнаружится корень зла. Нас должен интересовать еще и другой вопрос: чему равна потенциальная энергия колебаний, велика ли она? Средняя потенциальная энергия гармонического осциллятора равна средней кинетической энергии, т.е. также 1/2kT. Полная энергия молекулы U=7/2kT, или kT=2/7U на атом. Это означает, что γ равно 9/7, а не 5/3, т. е. γ=1,286.
Можно сравнить эти числа с действительно измеренными значениями γ, приведенными в табл. 40.1. Взгляните сначала на гелий; это одноатомный газ, и значение γ очень близко к 5/3; отклонение от этого значения, вероятно, есть просто следствие экспериментальных неточностей, хотя при столь низких температурах между атомами могут появиться силы взаимодействия. Криптон и аргон — еще два одноатомных газа — также дают согласующиеся значения в пределах ошибки эксперимента.
Таблица 40.1 ИЗМЕРЕННЫЕ ЗНАЧЕНИЯ γ ДЛЯ РАЗЛИЧНЫХ ГАЗОВ
Перейдем к двухатомным газам. Тут же обнаружится, что значение γ для водорода, равное 1,404, не согласуется с теоретическим значением 1,286. Очень близкое значение дает и кислород, 1,399, но с теоретическим это снова не согласуется. Для йодистого водорода γ равно просто 1,40. Начинает казаться, что мы нашли общий закон: для двухатомных молекул γ равно 1,40. Но нет, поглядите дальше. Для брома мы получаем 1,32, а для иода 1,30. Поскольку 1,30 довольно близко к 1,286, то можно считать, что экспериментальное значение γ для иода согласуется с теоретическим, а кислород представляет собой исключение. Это уже неприятно. То, что верно для одной молекулы, неверно для другой, и нам, по-видимому, надо проявить хитроумие, чтобы объяснить это.
Давайте рассмотрим еще более сложные молекулы, состоящие из большого числа частей, например С2Н6 — этан. Молекула атома состоит из восьми разных атомов, и все они качаются и вращаются в самых разных комбинациях, так что полная величина внутренней энергии должна складываться из огромного числа kT, по крайней мере 12kT только для одной кинетической энергии, поэтому γ-1 должно быть очень близко к нулю, а γ почти в точности равно единице. И действительно, значение γ для этана меньше, чем в предыдущих случаях, но 1,22— не так уж мало, во всяком случае, больше 11/12, чему должно быть равно γ, если учесть только кинетическую энергию. Этого вообще нельзя понять!
Ну а дальше совсем плохо, ибо двухатомную молекулу нельзя рассматривать как абсолютно жесткую, даже в пределе. Даже если связь между атомами так сильна, что они не могут и пошевелиться, все равно нужно считать, что они колеблются. Колебательная энергия всегда равна kT, поскольку она не зависит от силы связи. Но если представить себе двухатомную молекулу абсолютно жесткой, остановить колебания и выбросить эту степень свободы, то мы получим U=5/2 kT и γ=1,40 для двухатомных газов. Казалось бы, это подходит и для Н2, и для O2. Но вопрос по-прежнему остается открытым, потому что γ и для кислорода, и для водорода зависит от температуры! На фиг. 40.6 показаны результаты нескольких измерений. Для Н2 значение γ изменяется от 1,6 при -185°С до 1,3 при 2000°С. В случае водорода изменения γ еще больше, но и в случае кислорода γ явно стремится возрасти при падении температуры.
Фиг. 40.6. Экспериментальные значения γ как функция температуры для водорода и кислорода. Классическая теория предсказывает не зависящее от температуры значение γ=1,286.
§ 6. Поражение классической физики
Итак, приходится сказать, что мы натолкнулись на трудности. Можно соединить атомы не пружинкой, а чем-нибудь другим, но оказывается, что это только увеличит значение γ. Если пустить в ход другие виды энергии, то вопреки фактам γ очень приблизится к единице. Все известное нам из классической теоретической физики только ухудшает положение. Нам известно, например, что каждый атом содержит электроны, и атомные спектры обязаны своим существованием внутренним движениям электронов; каждый электрон должен иметь по крайней мере 1/2kT кинетической энергии и еще кое-что из потенциальной, а когда все это складывается, то γ становится еще меньше. Просто смешно. И явно что-то не так.
Первая замечательная работа по динамической теории газов была сделана Максвеллом в 1859 г. Исходя из идей, с которыми мы только что познакомились, он сумел точно объяснить очень много известных явлений, таких, как закон Бойля, теорию диффузии, вязкость газов и другие вещи, о которых мы еще будем говорить в следующей главе. Подводя итог всем этим великим достижениям, он писал: «Наконец, установив необходимое соотношение между поступательным и вращательным движением несферических частиц (он имел в виду теорему о 1/2kT), мы доказали, что в системе из таких частиц не может выполняться известное соотношение между двумя теплоемкостями». Он говорит здесь о γ (позднее мы увидим, что эта величина связана с двумя разными способами измерения удельной теплоемкости) и замечает, что никто не в состоянии дать верного ответа.
В прочитанной десять лет спустя лекции он сказал: «Я должен изложить Вам то, что я считаю наибольшей трудностью, стоящей перед молекулярной теорией». Это было первое указание на ложность законов классической физики, первое предчувствие того, что существует нечто, необъясненное с самого начала, ибо опыту противоречила строго доказанная теорема.
Примерно в 1890 г. Джинс заговорил вновь об этой загадке. Часто приходится слышать, что физики конца девятнадцатого столетия были уверены в том, что им известны все существенные законы природы и дело стоит лишь за тем, чтобы получить нужные числа с максимальным числом десятичных знаков. Кто-то это сказал, а остальные повторяют. Но если покопаться в физических журналах тех лет, то станет ясно, что почти каждый из них в чем-нибудь да сомневался. Джинс говорил об этой проблеме как о загадочном явлении, из которого как будто бы следует, что по мере падения температуры некоторые виды движения «замерзают».
Если бы мы могли предположить, что колебаний при низких температурах нет и возникают они только при высоких температурах, то можно было бы представить существование такого газа, у которого при очень низкой температуре колебательного движения нет совсем, так что γ=1,40, а при высоких температурах возникают колебания и, следовательно, γ убывает. То же самое можно предположить и о вращениях. Если бы можно было избавиться от вращений, скажем, «заморозить» их, понизив достаточно температуру, то стало бы понятно, почему при низких температурах для водорода γ приближается к 1,66. Но как же понять все это? Конечно, оставаясь в рамках классической механики, «замерзающих» движений нельзя объяснить. Все стало на свои места лишь после открытия квантовой механики.
Мы сформулируем без доказательства основные результаты статистической механики, построенной на основе квантовой механики. Напомним, что, согласно квантовой механике, связанная потенциалом система, например осциллятор, имеет дискретный набор уровней энергии, т. е. состояний с различной энергией. Возникает вопрос: как модифицировать статистическую механику, чтобы привести ее в согласие с квантовой механикой? Обратите внимание на интересную деталь: хотя большинство задач квантовой механики сложнее соответствующих задач классической физики, проблемы статистической механики решаются с помощью квантовой теории много проще!
Простенький результат классической механики, что n=n0ехр(-энергия/kT), становится в квантовой теории весьма важной теоремой: если набор молекулярных состояний характеризуется энергиями E0, E1, E2, ..., Ei, ..., то в случае теплового равновесия вероятность найти молекулу в состоянии с энергией Еi пропорциональна ехр(-Ei/kT). Так определяется вероятность пребывания в различных состояниях. Иначе говоря, относительный шанс — вероятность нахождения в состоянии Е1 по сравнению с вероятностью нахождения в состоянии Е0 равен
(40.10)
это, конечно, то же самое, что и
(40.11)
потому что Р1=n1/N, а Р0=n0/N. Таким образом, состояния с большей энергией менее вероятны, чем состояние с меньшей энергией. Отношение числа атомов в верхнем состоянии к числу атомов в нижнем состоянии равно е в степени (разность энергий, деленная на kT, с обратным знаком) — очень простая теорема.
Обратим внимание на то, что уровни энергии гармонического осциллятора отстоят друг от друга на равных расстояниях. Припишем низшему уровню энергию Е0=0 (на самом деле эта энергия немного отличается от нуля, но сдвиг всех уровней на одну и ту же величину не имеет значения), тогда энергия следующего уровня E1=ℏω, затем следует 2ℏω, 3ℏω) и т. д.
А теперь посмотрим, что из этого получится. Предположим, что мы изучаем колебания двухатомной молекулы, которую можно сейчас считать гармоническим осциллятором. Каковы относительные шансы найти молекулу в состоянии Е1, а не в состоянии Е0? Ответ: Отношение шанса найти молекулу в состоянии Е1 к шансу найти эту молекулу в состоянии Е0 равно ехр(-ℏω/kT}. Предположим, что kT много меньше ℏω, т. е. мы находимся в области низких температур. Тогда вероятность обнаружить состояние E1 чрезвычайно мала. Практически все молекулы находятся в состоянии Е0. Если изменить температуру, но по-прежнему поддерживать ее очень малой, то шанс найти молекулу в состоянии Е1=ℏω по-прежнему бесконечно мал — энергия осциллятора все еще почти равна нулю; она не изменяется с температурой, пока температура остается много меньше ℏω. Все осцилляторы находятся в низшем состоянии, их движение эффективно «заморожено», и они не дают вклада в теплоемкость. С помощью данных табл. 40.1 можно установить, что при 100°С, а это равно 373°К (абсолютной температуры), kT много меньше колебательной энергии молекул кислорода и водорода, но сравнимо с колебательной энергией иода. Причина такой разницы в том, что атомы иода гораздо тяжелее атомов водорода и, хотя силы, действующие между атомами иода и водорода, сравнимы, молекула иода столь тяжела, что собственная частота ее колебаний чрезвычайно мала по сравнению с собственной частотой водорода. При комнатной температуре kT таково, что ℏω водорода больше kT, а ℏω иода — меньше. Поэтому классическую колебательную энергию можно обнаружить только у иода.
Если увеличивать температуру газа, начав с очень малых значений Т, когда почти все молекулы находятся в их низшем состоянии, то появляется ощутимая вероятность найти молекулу во втором состоянии, затем в следующем за ним и т. д. Когда много состояний получают заметную вероятность, газ ведет себя более или менее так, как того требует классическая физика, ведь в этом случае систему квантовых состояний трудно отличить от непрерывного распределения энергии, и система может обладать почти любой энергией. Таким образом, при повышении температуры мы снова попадаем в область классической физики, как это видно из фиг. 40.6. Аналогично можно показать, что точно так же квантуются и вращательные состояния атомов, но эти состояния размещены так тесно, что обычно kT больше расстояния между уровнями. В этом случае возбуждено сразу много уровней и вращательная кинетическая энергия системы ведет себя классически. Лишь водород при комнатных температурах ведет себя иначе.
Это первый случай, когда из сравнения с экспериментом обнаружилось, что с классической физикой что-то неблагополучно, мы искали способы уладить все трудности в квантовой механике тем самым путем, каким это происходило на самом деле. Прошло примерно лет 30 или 40, пока не была обнаружена еще одна трудность, и снова в статистической механике, но на этот раз в механике фотонного газа. Новая задача была решена Планком в первые годы нашего столетия.
Глава 41 БРОУНОВСКОЕ ДВИЖЕНИЕ
§ 1. Равнораспределение энергии
Броуновское движение открыл в 1827 г. ботаник Роберт Броун. Изучая жизнь под микроскопом, он заметил, что мельчайшие частицы цветочной пыльцы пляшут в его поле зрения; в то же время он был достаточно сведущ, чтобы понимать, что перед ним не живые существа, а просто плавающие в воде соринки. Чтобы окончательно доказать, что это не живые существа, Броун разыскал обломок кварца, внутри которого была заполненная водой полость. Вода попала туда много миллионов лет назад, но и в такой воде соринки все продолжали свою пляску. Казалось, что очень мелкие частицы пляшут непрерывно. Позднее было доказано, что это один из эффектов молекулярного движения и понять его качественно можно, представив себе, что мы откуда-то издалека следим за игрой в пушбол. Мы знаем, что под большим мячом движется толпа людей и каждый толкает мяч, куда хочет. Мы не видим отдельных игроков, потому что поле очень далеко от нас, но мяч мы видим и замечаем, что перемещается он очень беспорядочно. Мы уже знаем из разобранных в предыдущих главах теорем, что средняя кинетическая энергия взвешенной в газе или жидкости маленькой частицы равна 3/2kT, даже если эта частица гораздо тяжелее молекул газа. Если она очень тяжела, то и движется она сравнительно медленно, но на самом деле оказывается, что скорость частицы не так уж мала. Конечно, заметить движение частицы не очень легко, потому что средняя кинетическая энергия 3/2kT соответствует скорости около 1 мм/сек, если диаметр частицы равен 1 —2 мк. Такое движение трудно заметить даже под микроскопом, потому что частица постоянно меняет направление своего движения и пойти в какую-нибудь определенную сторону не желает. В конце главы мы посмотрим, далеко ли она может уйти. Этот вопрос впервые был разрешен Эйнштейном в начале нашего столетия.
Между прочим, когда говорят, что средняя кинетическая энергия частицы равна 3/2 kT, то требуют, чтобы этот результат был выведен из кинетической теории, т. е. из законов Ньютона. Мы уже можем получать разные удивительные вещи с помощью кинетической теории, самое интересное — что удается получить так много из столь малого. Конечно, мы не хотим сказать, что законы Ньютона — это «малое», они на самом деле дают все необходимое для решения задачи, просто нам пришлось потрудиться совсем немного. Как же нам удалось так много получить? Просто мы постоянно исходили из очень важного предположения, что если заданная система находится при некоторой температуре в тепловом равновесии, то при той же температуре она будет в равновесии с чем угодно. Скажем, нам хочется посмотреть, как движется частица, если она сталкивается с водой.
Для этого представим, что, кроме воды и частицы, есть еще и газ, состоящий из частиц еще одного сорта —маленьких дробинок, которые, как мы предполагаем, с водой не взаимодействуют и только сильно ударяют по нашей частице. Предположим, что частица ощетинилась острыми шипами и все дробинки наталкиваются на них. Об этом воображаемом газе из дробинок при температуре Т нам известно все — это идеальный газ. Вода — дело сложное, а идеальный газ — он попроще. И вот наша частица находится в равновесии с газом из дробинок. Следовательно, среднее движение частицы должно быть таким, каким ему следует быть вследствие столкновений с атомами, потому что если бы частица двигалась относительно воды с большей скоростью, чем положено, то дробинки, отняв у частицы часть ее энергии, нагрелись бы больше, чем вода. Но ведь мы начали с равных температур и предполагаем, что если равновесие однажды наступило, то оно таким и останется; не может вдруг одна часть системы нагреться, а другая остыть.
Это предположение справедливо и его можно доказать, используя законы механики, но доказательство очень сложно и понять его можно, только хорошо зная механику. С помощью квантовой механики доказать это гораздо легче, чем с помощью классической. Впервые эту теорему доказал Больцман, а мы, приняв, что она верна, можем утверждать, что если частица сталкивается с воображаемыми дробинками, то ее энергия равна 3/2kT. Но этой же самой энергией она должна обладать, если мы удалим дробинки и оставим частицу наедине с водой при такой же температуре. Это странная, но правильная цепь рассуждений.
Кроме движения коллоидных частиц, на которых и было впервые открыто броуновское движение, имеется еще целый ряд других явлений, и не только в лабораторных, но и в других условиях, позволяющих обнаружить броуновское движение. Если бы мы смогли соорудить чрезвычайно тонкое измерительное устройство, скажем, крохотное зеркальце, прикрепленное к тонкой кварцевой нити очень чувствительного баллистического гальванометра (фиг. 41.1), то зеркальце не стояло бы на месте, а непрерывно плясало бы, поэтому если бы мы осветили это зеркальце лучом света и проследили за отраженным пятном, то потеряли бы надежду создать совершенный измерительный инструмент, так как зеркальце все время пляшет. Почему? Потому что средняя кинетическая энергия вращения зеркальца равна 1/2kT.
Фиг. 41.1. Чувствительный зеркальный гальванометр и образец записи шкалы как функция времени. Пучок света из источника L отражается от маленького зеркальца на шкале.
Чему равен средний квадратичный угол качаний зеркальца? Предположим, что мы определили период собственных колебаний зеркальца, стукнув слегка по одной его стороне и наблюдая, как долго будет оно качаться взад и вперед, и пусть нам также известен момент инерции I. Формулу для кинетической энергии вращения мы знаем, это равенство (19.8): Т=1/2Iω2. А потенциальная энергия пропорциональна квадрату угла отклонения, т. е. V=1/2αθ2. Но если мы знаем период колебаний t0 и можем вычислить собственную частоту ω0=2π/t0, то можно и потенциальную энергию записать в виде V=1/2/Iω02θ2. Мы знаем, что средняя кинетическая энергия равна 1/2 kT, но поскольку перед нами гармонический осциллятор, то средняя потенциальная энергия также равна 1/2kT. Следовательно,
(41.1)
Таким образом мы можем рассчитать колебания зеркальца гальванометра и тем самым найти предел точности нашего инструмента. Если нам нужно уменьшить колебания, то следует охладить зеркальце. Но здесь возникает интересный вопрос — в каком месте его охладить? Все зависит от того, откуда оно получает больше «пинков». Если в колебаниях повинна кварцевая нить, то охлаждать нужно ее верхний конец, если же зеркальце находится в газовой среде и раскачивается в основном за счет соударений с молекулами газа, то лучше охладить газ. Итак, практически, если известно, почему происходит затухание колебаний, то оказывается, что имеется всегда какой-то источник флуктуации; к этому вопросу мы еще вернемся.
Те же флуктуации работают, и довольно удивительным образом, в электрических цепях. Предположим, что мы построили очень чувствительный, точный усилитель для какой-нибудь определенной частоты и к его входу подключили резонансную цепь (фиг. 41.2), настроенную на эту же частоту, наподобие радиоприемника, только получше.
Фиг. 41.2. Резонансная цепь с большим Q. а — реальная цепь при температуре T; б — искусственная цепь с идеальным (бесшумным) сопротивлением и «генератором шума».
Предположим, что мы захотели как можно точнее изучить флуктуации, для этого мы сняли напряжение, скажем, с индуктивности и подали его на усилитель. Конечно, во всякой цепи такого рода имеются некоторые потери. Это не идеальная резонансная цепь, но все же очень хорошая цепь, и обладает она малым сопротивлением (на схеме сопротивление показано, надо только помнить, что оно очень мало). А теперь мы хотим узнать, как велики флуктуации падения напряжения на индуктивности? Ответ: Нам известно, что «кинетическая энергия», запасенная катушкой резонансной цепи, равна 1/2LI2 (см. гл. 25). Поэтому среднее значение 1/2 LI2 равно 1/2kT, это дает нам среднее квадратичное значение тока, а отсюда можно определить и среднее квадратичное значение напряжения. Если мы хотим знать падение напряжения на индуктивности, нам пригодится формула VL=iωLI, тогда средний квадрат модуля падения напряжения на индуктивности равен <VL2>=L2ω02<I2>, а полагая 1/2L<I2>=1/2kT, получаем
(41.2)
Итак, теперь мы можем рассчитать контур и предсказать, каким в нем будет так называемый шум Джонсона, т. е. шум, связанный с тепловыми флуктуациями!
Но откуда же эти флуктуации берутся? А все из-за сопротивления, точнее говоря, в результате пляски электронов в сопротивлении. Ведь они находятся в тепловом равновесии с остальным материалом сопротивления, а это приводит к флуктуациям плотности электронов. Таким образом они порождают крошечные электрические поля, управляющие резонансной цепью.
Инженеры-электрики объясняют все это иначе. Физически источником шумов служит сопротивление. Однако можно заменить реальную цепь с честным сопротивлением, вызывающим шумы, фиктивной цепью, содержащей маленький генератор, который якобы порождает шумы, а сопротивление теперь будет идеальным — оно уже не шумит. Все шумы теперь исходят от фиктивного генератора. Итак, если нам известны характеристики шума, порождаемого сопротивлением, и у нас для этого имеется подходящая формула, то можно рассчитать, как цепь реагирует на этот шум. Следовательно, нам нужна формула для шумовых флуктуаций. Сопротивление одинаково хорошо порождает шумы всех частот, поскольку оно само отнюдь не резонатор. Резонансная цепь, конечно, «слышит» лишь часть этого шума вблизи определенной частоты, а в сопротивлении заключено много и других частот. Силу генератора можно описать таким образом: выделяемая на сопротивлении средняя мощность, если оно непосредственно соединено с генератором шума, равна <E2>/R, где Е — снимаемое с генератора напряжение. Но теперь мы хотим знать подробнее о распределении мощности по частотам. Каждой определенной частоте соответствует очень малая мощность. Пусть P(ω)dω — мощность, которую генератор посылает сопротивлению в интервале частот dω. Тогда можно доказать (мы докажем это для другого случая, но математика и там и тут одинакова), что выделяемая мощность равна
(41.3)
и, таким образом, не зависит от сопротивления.
§ 2. Тепловое равновесие излучения
Мы приступаем к обсуждению более сложной и интересной теоремы, суть которой состоит в следующем. Предположим, что у нас имеется заряженный осциллятор, вроде того, о котором мы говорили, когда речь шла о свете. Пусть это будет электрон, колеблющийся в атоме вверх и вниз. А раз он колеблется, то излучает свет. Предположим теперь, что этот осциллятор попал в сильно разреженный газ, состоящий из других атомов, и время от времени эти атомы с ним сталкиваются. Когда в конце концов наступит равновесие, осциллятор приобретает такую энергию, что кинетическая энергия колебаний будет равна 1/2kT, а поскольку это гармонический осциллятор, то полная энергия движения станет равной kT.
Это, конечно, неверно, потому что осциллятор несет электрический заряд, а поскольку он обладает энергией kТ, то, качаясь вверх и вниз, он излучает свет. Поэтому невозможно получить равновесие только самого вещества без того, чтобы заряды не излучали свет, а когда свет излучается, утекает энергия, осциллятор со временем растрачивает энергию kT, а окружающий газ, сталкивающийся с осциллятором, постепенно остывает. Именно таким образом остывает за ночь натопленная с вечера печка, выпуская все тепло на воздух. Прыгающие в ее кирпичах атомы заряжены и непрерывно излучают, а в результате этого излучения танец атомов постепенно замедляется.
Но если заключить все атомы и осцилляторы в ящик, так чтобы свет не смог уйти в бесконечность, тепловое равновесие может наступить. Мы можем поместить газ в ящик, в стенках которого есть и другие излучатели, испускающие свет внутрь ящика, а еще лучше соорудить ящик с зеркальными стенками. Этот пример поможет лучше понять, что произойдет. Итак, мы предполагаем, что все излучение от осциллятора остается внутри ящика. Осциллятор и в этом случае начинает излучать, но довольно скоро он все же соберет свое значение kT кинетической энергии. Происходит это потому, что сам осциллятор будет освещаться, так сказать, собственным светом, отраженным от стенок ящика. Вскоре в ящике будет много света и, хотя осциллятор продолжает излучать, часть света будет возвращаться и возмещать осциллятору потерянную им энергию.
А теперь подсчитаем, насколько должен быть освещен ящик при температуре Т, чтобы рассеяние света на осцилляторе обеспечивало его как раз такой энергией, какая нужна для поддержания излучения. Пусть атомов в ящике совсем немного и находятся они далеко друг от друга, так что наш осциллятор идеальный, не имеющий иного трения, кроме радиационного. Теперь заметим, что при тепловом равновесии осциллятор делает сразу два дела. Во-первых, он излучает, и мы можем подсчитать энергию излучения. Во-вторых, он в возмещение получает точно такое же количество энергии в результате рассеяния на нем света. Поскольку энергия ниоткуда больше притечь не может, то эффективное излучение — это как раз та часть «общего света», которая рассеялась на осцилляторе.
Таким образом, прежде всего мы вычисляем энергию, излучаемую в 1 сек осциллятором с заданной энергией. (Мы позаимствуем для этого в гл. 32, посвященной радиационному трению, несколько равенств и не будем здесь приводить их выводы.) Отношение энергии, излученной за радиан, к энергии осциллятора называется 1/Q [см. уравнение (32.8)] : 1/Q=(dW/dt)/ω0W. Используя величину γ (постоянную затухания), можно записать это в виде 1/Q=γ/ω0, где ω0— собственная частота осциллятора, если γ очень мала, а Q очень велико. Излученная за 1 сек энергия равна
(41.4)
Излученная за 1 сек энергия просто равна произведению γ на энергию осциллятора. Средняя энергия нашего осциллятора равна kT, поэтому произведение γ на kT — это среднее значение излученной за 1 сек энергии:
(41.5)
Теперь нам нужно только узнать, что такое γ. Эту величину легко найти из уравнения (32.12):
(41.6)
где r0=e2/mc2— классический радиус электрона, и мы положили λ=2πс/ω0.
Окончательный результат для средней скорости излучения света вблизи частоты ω0 таков:
(41.7)
Теперь надо выяснить, сильно ли должен быть освещен осциллятор. Освещение должно быть таким, чтобы поглощенная осциллятором энергия (и впоследствии рассеянная) была в точности равна предыдущей величине. Иначе говоря, излученный свет — это свет, рассеянный при освещении осциллятором в полости. Итак, нам остается рассчитать, сколько света рассеивается осциллятором, если на него падает какая-то — неизвестная — доза излучения. Пусть I(ω)dω— энергия света частоты ω в интервале частот dω (ведь у нас нет света точно заданной частоты; излучение распределено по спектру). Таким образом, I(ω) — это спектральное распределение, которое нам надо найти. Это тот цвет огня, который мы увидим внутри печи при температуре Т, если откроем дверцу и заглянем внутрь. Сколько же все-таки света поглотится? Мы уже определяли количество излучения, поглощаемого из заданного падающего пучка света, и выразили его через эффективное сечение. Это соответствует тому, как если бы мы предполагали, что весь свет, падающий на площадку определенной площади, поглощается. Таким образом, полная переизлученная (рассеянная) интенсивность равна произведению интенсивности падающего света I(ω)dω на эффективное сечение σ.
Мы вывели формулу для эффективного сечения [см. уравнение (31.19)], не включающую затухания. Нетрудно повторить этот вывод снова и учесть трение, которым мы тогда пренебрегли. Если это сделать, то, вычисляя эффективное сечение по прежнему образцу, мы получим
(41.8)
Пойдем дальше; σs как функция частоты имеет более или менее заметную величину только для ω около собственной частоты ω0. (Вспомним, что для излучающего осциллятора Q — порядка 108.) Когда ω равна ω0, осциллятор рассеивает очень сильно, а при других значениях ω он почти не рассеивает совсем. Поэтому можно заменить ω на ω0, а ω2-ω02 на 2ω0(ω-ω0); тогда
(41.9)
Теперь почти вся кривая загнана в область около ω=ω0. (Фактически мы не должны делать никаких приближений, но легче иметь дело с интегралом, в котором подынтегральное выражение несколько проще.) Если умножить интенсивность в данном интервале частот на эффективное сечение рассеяния, то получится энергия, рассеянная в интервале dω. Полная рассеянная энергия — это интеграл по всем ω. Таким образом,
(41.10)
Теперь мы положим dWs/dt=3γkT. Но почему здесь стоит 3? Потому что в гл. 32 мы предполагали, что свет поляризован так, что может раскачивать осциллятор. Если бы мы использовали осциллятор, способный раскачиваться только в одном направлении, а свет был бы, скажем, поляризован неверно, то он не рассеивался бы совсем. Поэтому мы должны либо усреднить эффективное сечение рассеяния на осцилляторе, способном раскачиваться только в одном направлении, по всем направлениям падающих пучков и поляризации света в пучке, либо, что легче сделать, представить себе, что наш осциллятор послушно следует за полем, каким бы оно ни было там, где он находится. Такой осциллятор, который одинаково легко раскачивается в любом из трех направлений, имеет среднюю энергию 3kT, потому что у него 3 степени свободы. А раз 3 степени свободы, то надо писать 3γkT.
Займемся теперь интегралом. Предположим, что неизвестное спектральное распределение света I(ω) — это плавная кривая, которая в той узкой области частот, где σs имеет острый максимум, меняется не слишком сильно (фиг. 41.3).
Фиг. 41.3. Сомножители подынтегрального выражения (41.10). Пик — это резонансная кривая 1/[(ω-ω0)2+(γ2/4)]. Множитель I(ω) можно с хорошим приближением заменить на I(ω0).
Тогда сколько-нибудь существенный вклад в интеграл дают только частоты, близкие к ω0 и отстоящие от нее на очень малую величину γ. Поэтому, хотя I(ω) неизвестная и, может быть, сложная функция, важно только ее поведение около ω=ω0 и можно заменить плавную кривую еще более ровной — «постоянной» — всюду одной высоты. Иначе говоря, мы просто вынесем I(ω) из-под знака интеграла и назовем это I(ω0). Вынесем за интеграл и остальные постоянные и тогда получим
(41.11)
Интеграл берется от 0 до ∞, но 0 отстоит так далеко от ω0, что кривая за это время идет почти вдоль оси абсцисс, поэтому заменим 0 на -∞, разница небольшая, а интеграл взять легче. Интеграл вида ∫dx/(x2+а2) приводит к арктангенсу. Если взглянуть в справочник, то мы увидим, что он равен π/α. Итак, для нашего случая это 2π/γ. После небольших манипуляций мы получаем
(41.12)
Затем мы подставим сюда формулу (41.6) для γ (мы уже не будем стараться писать ω0; раз это верно для любой ω0, то можно назвать ее просто ω), и формула для I(ω) примет вид
(41.13)
Она и определяет распределение света в горячей печке. Это так называемое излучение абсолютно черного тела. Черного потому, что, если заглянуть в топку печки при абсолютном нуле, она будет черной.
Формула (41.13) задает распределение энергии излучения внутри ящика при температуре Т согласно классической теории. Отметим сначала замечательную особенность этого выражения. Заряд осциллятора, масса осциллятора, все частные его свойства выпали из формулы; ведь если мы достигли равновесия с одним осциллятором, мы должны позаботиться о равновесии и с любым другим осциллятором другой массы, иначе будут неприятности. Таким образом, это важный способ проверки нашей теоремы о том, что равновесие зависит только от температуры, а не от того, что приводит к равновесию. Теперь можно начертить кривую I(ω) (фиг. 41.4).
Фиг. 41.4. Распределение интенсивности излучения черного тела при двух температурах. Сплошные кривые — согласно классической теории; пунктирные — настоящее распределение, 1— paдuo ; 2 — инфракрасное; 3 — видимое; 4 — ультрафиолетовое; 5 — рентгеновские лучи.
Она покажет нам, какова освещенность при разных частотах.
В выражение для интенсивности в ящике на единицу частоты входит, как видно, квадрат частоты; это значит, что если взять ящик при любой температуре, то в нем обнаружится бездна рентгеновских лучей!
Мы знаем, конечно, что это неверно. Когда мы открываем печку и заглядываем в нее, мы не портим глаз рентгеновскими лучами. Дальше — хуже, полная энергия ящика, полная интенсивность, просуммированная по всем частотам, должна быть площадью под этой уходящей в бесконечность кривой. Итак, здесь что-то совсем неверно в самой основе.
Это значит, что классическая теория совершенно непригодна для правильного описания распределения излучения черного тела, так же как и для описания теплоемкостей газов. Физики ходили вокруг этого вывода, рассматривали его с различных точек зрения и не нашли выхода. Это предсказание классической физики. Уравнение (41.13) называется законом Рэлея, предсказано оно классической физикой и до очевидности абсурдно.
§ 3. Равномерное распределение и квантовый осциллятор
Только что отмеченная трудность — это еще одна сторона проблемы непрерывности в классической физике, она началась с непорядка в теплоемкостях газов, а потом эта проблема сконцентрировалась на распределении света в черном теле. Конечно, пока теоретики обсуждали эти вещи, производились еще и измерения настоящих кривых. И было установлено, что правильная кривая выглядит так, как пунктирные кривые на фиг. 41.4. Никаких рентгеновских лучей там нет. Если понижать температуру, то кривые приближаются к оси абсцисс примерно так, как того требует классическая теория, но и при низкой температуре опытные кривые тоже в конце обрываются.
Таким образом, начало кривой распределения правильно описывает опыт, а ее высокочастотный конец сбивается с верного пути. Почему же так? Когда Джеймс Джинс размышлял о теплоемкостях газов, он заметил, что движение, совершаемое с большой частотой, «замерзает» при понижении температуры. Значит осциллятор не может обладать средней энергией kT, если температура слишком мала или если частота колебаний слишком велика. А теперь вспомним, как мы выводили (41.13). Все зависело от энергии осциллятора при тепловом равновесии. Когда мы подставляли kT в (41.5), это было то же kT, что и в (41.13), т. е. средняя энергия гармонического осциллятора частоты ω при температуре Т. Классическая физика говорит, что она равна kT, а эксперимент отвечает: Нет! При очень низких температурах или при очень высоких частотах это не так. Таким образом, кривая падает по той же причине, что и теплоемкости газов. Кривую черного тела изучать легче, чем теплоемкости газов, где много сложностей, и мы сконцентрируем внимание на определении правильной кривой излучения черного тела, потому что эта кривая будет той кривой, которая расскажет нам, как средняя энергия гармонического осциллятора при любой его частоте зависит от температуры.
За изучение этой кривой взялся Планк. Сначала он нашел чисто эмпирический ответ, сравнивая опытную кривую с известными функциями, которые лучше всего эту кривую подгоняли. Таким образом, он получил эмпирическую формулу для средней энергии гармонического осциллятора как функцию температуры. Иначе говоря, он заменил kT правильной формулой, а потом нашел простой вывод этой формулы, правда, при очень странном предположении. Это предположение состоит в том, что гармонический осциллятор может поглотить за один прием только энергию ℏω. После этого нельзя и подумать, что осциллятор может обладать любой энергией. Конечно, это было началом конца классической физики.
Сейчас мы выведем первую правильную формулу квантовой механики. Предположим, что дозволенные уровни энергии гармонического осциллятора лежат на равном расстоянии ℏω0 друг от друга, поэтому осциллятор может обладать только одной из этих энергий (фиг. 41.5).
Фиг. 41.5. Уровни энергии гармонического осциллятора. Отстоят друг от друга но равных расстояниям En=nℏω.
Аргументы Планка выглядят немного сложнее наших, ведь это было самым началом квантовой механики, и ему приходилось кое-что доказывать. Ну, а мы просто примем как факт (который Планк и установил), что вероятность того, что занят уровень энергии Е, равна Р(Е)=αехр(-E/kT). Исходя из этого, мы получим правильный результат.
Предположим, что у нас есть много осцилляторов и каждый колеблется с частотой ω0. Некоторые из них находятся в низшем квантовом состоянии, другие забрались на уровень выше и т. д. Нам нужно знать среднюю энергию этих осцилляторов. Чтобы найти ее, давайте вычислим полную энергию всех осцилляторов и поделим результат на их число. Тогда мы получим среднюю энергию на осциллятор при тепловом равновесии, а это то же самое, что и энергия при равновесии с излучением черного тела, и ее надо подставить в уравнение (41.13) вместо kT.
Пусть N0 — число осцилляторов в основном состоянии (состоянии с наименьшей энергией), N1— число осцилляторов в состоянии Е1, N2— число осцилляторов в состоянии E2 и т. д. Согласно гипотезе (которую мы не доказали), классические выражения для вероятности ехр(-п. э./kT) или ехр(-к. э./kT) заменяются в квантовой механике на ехр(-ΔE/kT), где ΔE — разность энергий. Можно утверждать, что число осцилляторов в первом состоянии N1 равно произведению числа молекул в основном состоянии N0 на ехр(-ℏω/kT). Аналогично, N2(число молекул во втором состоянии) равно N2=N0 exp(-2ℏω/kT). Чтобы упростить алгебру, введем х=ехр(-ℏω/kT). Тогда все выглядит очень просто:
Сначала найдем полную энергию всех осцилляторов. Если осциллятор находится в основном состоянии, его энергия нуль. Если он находится в первом состоянии, то его энергия равна ℏω0, а таких осцилляторов N1. Значит, в этом состоянии запасена энергия N1ℏω, или ℏωN0x. Энергия осциллятора во втором состоянии 2ℏω0, а осцилляторов N2, поэтому мы получаем такую энергию: N22ℏω=2ℏω0N0x2 и т. д. Сложив все это, найдем полную энергию Eполн=N0ℏω (0+х+2х2+Зx3+...).
А сколько всего осцилляторов? В основном состоянии, конечно, N0, в первом состоянии N1 и т. д.; снова все сложим и получим Nвcе=N0(1+x+x2+x3+...). Поэтому средняя энергия равна
(41.14)
Читателям представляется возможность позабавиться этими суммами и получить от этого удовольствие. Когда вы покончите с суммированием и подставите в окончательный результат значение х, то получите, если не ошиблись
(41.15)
Эта формула была не только самой первой формулой, но и самой первой мыслью квантовой механики, и она явилась великолепным ответом на все недоумения предшествующих десятилетий. Максвелл уже понимал, что что-то неверно, но вопрос был в том, что же правильно? Здесь содержится количественный ответ — что же надо взять вместо kT. Выражение для энергии, конечно, стремится к kT при ω→0 или при Т→∞. Попробуйте это доказать — здесь надо поступить так, как этому учит математика.
Выражение для средней энергии содержит знаменитый обрезающий множитель, который предвидел Джинс, и если использовать его вместо kT в (41.13), то мы получим распределение света в черном ящике:
(41.16)
Итак, мы видим, что при больших ω кривая резко идет вниз; хотя в числителе стоит ω3, знаменатель содержит е в чрезвычайно высокой степени; на кривой нет никакого намека на подъем, и там, где мы того не ждем, не появляется ни ультрафиолетовых, ни рентгеновских лучей!
Может возникнуть недовольство в связи с тем, что при выводе (41.16) мы пользовались квантовой теорией для уровней энергии гармонического осциллятора, а при определении эффективного сечения σs мы оставались верны классической теории. Но квантовая теория взаимодействия света с гармоническим осциллятором приводит точно к тем же результатам, что и классическая. Это обстоятельство оправдывает то время, которое мы затратили на изучение показателя преломления и рассеяние света, основанное на представлении об атоме как о маленьком осцилляторе, — квантовые формулы получаются точно такими же.
Теперь вернемся к шумам Джонсона в сопротивлении. Мы уже отмечали, что теория мощности шума, по существу, — та же самая, классическая теория излучения черного тела. На самом деле, как мы уже говорили, сопротивление в цепи — это не настоящее сопротивление, а похоже скорее на антенну (антенна ведь тоже похожа на сопротивление, она излучает энергию). Это радиационное сопротивление, и легко подсчитать излучаемую им мощность. Эта мощность равна той мощности, которую антенна получает от окружающего ее света, и мы должны прийти к тому же самому распределению с точностью до одного, двух множителей. Мы можем предположить, что сопротивление — это генератор с неизвестным спектром мощности Р(ω). Найти распределение поможет то обстоятельство, что этот генератор, включенный в резонансную цепь произвольной частоты (как на фиг. 41.2, б), порождает на индуктивности падение напряжения, определяемое равенством (41.2). Это приведет нас к тому же интегралу, что и (41.10), а продолжая работать тем же методом, мы получим уравнение (41.3). Для низких температур kT в (41.3), конечно, надо заменить выражением (41.15). Две теории (излучения черного тела и шумов Джонсона) физически тесно связаны, так как мы можем связать резонансную цепь с антенной, тогда сопротивление R будет радиационным сопротивлением в чистом виде. Поскольку (41.2) не зависит от физических свойств сопротивления, генератор G для настоящего сопротивления и для радиационного сопротивления будет одинаковым. А что же будет источником генерируемой мощности Р(ω), если сопротивление R — теперь просто-напросто идеальная антенна, находящаяся в равновесии с ее окружением при температуре Т? Это излучение в пространстве при температуре Т, которое обрушивается на антенну в качестве «принятого сигнала» и служит эффективным генератором. Следовательно, двигаясь от (41.13) к (41.3), можно найти прямое соответствие между P(ω) и I(ω).
Объяснение явлений, о которых мы сейчас говорим (так называемый шум Джонсона, распределение Планка и теория броуновского движения, о которой мы собираемся говорить),— это достижения первого десятилетия нашего века. Узнав об этом и заглянув в историю, вернемся к броуновскому движению.
§ 4. Случайные блуждания
Попробуем понять, насколько меняется положение танцующей частицы за время, во много раз большее, чем промежуток между двумя ударами. Посмотрим на маленькую частицу, которая вовлеклась в броуновское движение и пляшет под непрерывно и беспорядочно сыплющимися на нее ударами молекул воды. Вопрос: Далеко ли отойдет частица от первоначального положения, когда истечет заданное время? Эту задачу решили Эйнштейн и Смолуховский. Представим себе, что мы разделили выделенное нам время на малые промежутки, скажем, по одной сотой доле секунды, так что после первой сотой доли секунды частица оказалась в одном месте, в течение второй сотой секунды она продвинулась еще, в конце следующей сотой секунды — еще и т. д. При той скорости бомбардировки, которой подвергается частица, одна сотая секунды — огромное время.
Читатель легко может проверить, что число столкновений, которые испытывает одна плавающая в воде молекула, порядка 1014 в секунду, так что на одну сотую долю секунды приходится примерно 1012 столкновений, а это очень много! Естественно, что по прошествии одной сотой доли секунды частица не «помнит», что с ней было до этого. Иначе говоря, все столкновения случайны, так что каждый последующий «шаг» частицы совершенно не зависит от предыдущего. Это напоминает знаменитую задачу о пьяном моряке, который выходит из бара и делает несколько шагов, но плохо держится на ногах, и каждый шаг делает куда-то в сторону, случайно (фиг. 41.6).
Фиг. 41.6. Зигзагообразный путь из 36 случайных шагов длиной L. Как далеко расположена точка S36 от В? В среднем на 6L.
Так где же окажется наш матрос спустя некоторое время? Конечно, мы этого не знаем! И предсказать это невозможно. Все, что можно сказать, — это то, что он где-то наверняка находится, но это совершенно неопределенно. Ну хорошо, а далеко ли он все-таки уйдет? Каково будет то среднее расстояние от бара, на котором окажется матрос? На этот вопрос мы уже ответили, потому что мы однажды уже обсуждали суперпозицию света от огромного числа различных источников с различными фазами, а это значит, что мы складывали огромное число стрелок, направленных по произвольным направлениям (см. гл. 32) Тогда мы обнаружили, что средний квадрат расстояния от одного конца цепи беспорядочных шагов до другого (т. е. интенсивность света) равен сумме интенсивностей отдельных источников. Совершенно аналогично, используя ту же математику, можно немедленно показать, что если RN— векторное расстояние от начала через N шагов, то средний квадрат расстояния от начала пропорционален числу шагов N.
Это значит, что <RN2>=NL2, где L — длина каждого шага. Поскольку число шагов пропорционально выделенному нам условиями задачи времени, то средний квадрат расстояния пропорционален времени:
(41.17)
Это не означает, что среднее расстояние пропорционально времени. Если бы среднее расстояние было пропорционально времени, то частица двигалась бы с вполне определенной постоянной скоростью. Матрос, несомненно, идет вперед, но движение его таково, что квадрат среднего расстояния пропорционален времени. Это и есть характерная особенность случайных блужданий.
Мы легко докажем, что каждый шаг увеличивает квадрат расстояния в среднем на L2. Если записать RN=RN-1+L, то окажется, что RN2 равно
а усредняя по многим попыткам, получим <RN2>=<RN-12>+L2, потому что <RN-1·L>=0. Таким образом, по индукции
(41.18)
Теперь хорошо бы вычислить коэффициент a в уравнении (41.17); для этого нужно еще кое-что добавить. Предположим, что если к частице приложена сила (она не имеет никакого отношения к броуновскому движению, просто мы подыскиваем выражение для импульса), то частица будет противодействовать силе следующим образом. Прежде всего должна проявиться инерция. Пусть m — коэффициент инерции, эффективная масса частицы (не обязательно настоящая масса настоящей частицы, потому что если протаскивать частицу сквозь воду, то движется и вода). Поэтому если мы рассматриваем движение в одном направлении, то нужно обзавестись с одной стороны слагаемым m(d2x/dt2). Далее подчеркнем, что, если мы толкаем частицу равномерно, она должна тормозиться жидкостью с силой, пропорциональной скорости. Кроме инерции жидкости, существует еще сопротивление течению, вызванное вязкостью и сложным строением жидкости. Для возникновения флуктуации абсолютно необходимо существование необратимых потерь, нечто вроде сопротивления. Пока таких потерь нет, нет способа получить kT. Причина флуктуации тесно связана с такими потерями. Мы еще обсудим, каков механизм такого трения, мы поговорим о силах, пропорциональных скорости, и выясним, откуда они берутся. А пока давайте просто предположим, что такое сопротивление существует. Тогда формула для движения под действием внешней силы, если она толкает частицу самым обычным способом, выглядит так:
(41.19)
Величину μ можно определить экспериментально. Например, мы можем изучить падение капли под действием силы тяжести. Тогда известно, что сила равна mg, а μ — это mg, деленное на окончательно установившуюся скорость падения капли. Или можно поместить каплю в центрифугу и следить за скоростью осаждения. А если она заряжена, то можно приложить электрическое поле. Таким образом, μ — это измеряемая величина, а не какая-нибудь искусственная вещь, и ее значение известно для коллоидных частиц многих типов.
Применим эту формулу также в том случае, когда сила не внешняя, а равна беспорядочным силам броуновского движения. Попробуем определить средний квадрат пройденного телом пути. Будем рассматривать расстояния не в трех, а в одном измерении и определим среднее значение х2, чтобы подготовить себя к решению задачи. (Разумеется, среднее значение х2 равно среднему y2 и среднему z2, поэтому средний квадрат расстояния будет втрое больше того, что мы получим.)
Конечно, x-составляющая беспорядочной силы так же беспорядочна, как и остальные компоненты. Чему же равна скорость изменения x2? Она равна (d/dt)(x2)=2x(dx/dt), поэтому скорость изменения среднего x2 можно найти, усреднив произведение скорости на координату. Покажем, что это постоянная величина, т. е. средний квадрат радиуса возрастает пропорционально времени, и найдем скорость возрастания. Если умножить уравнение (41.19) на х, то получим mx(d2x/dt2)+μx(dx/dt)=xFx. Нас интересует среднее по времени x(dx/dt), поэтому усредним по времени все уравнение целиком и изучим все три слагаемых. Что можно сказать о произведении х на силу? Хоть частица и добралась до точки х, последующие толчки могут быть направлены в любом направлении по отношению к х, ведь случайная сила полностью случайна и ей нет дела, откуда частица начала двигаться. Если кордината х положительна, у средней силы нет никаких оснований направиться в этом же направлении. Для нее оно столь же вероятно, как и любое другое. Случайные силы не могут отправить частицу в определенном направлении. Поэтому среднее произведения х на Fx равно нулю. С другой стороны, слагаемому mx(d2x/dt2) можно, немного повозившись, придать вид
Мы разбили первоначальное слагаемое на два и должны усреднить их оба. Посмотрим, чему же равно произведение х на скорость. Это произведение не изменяется со временем, потому что, когда частица попадает в заданную точку, она уже не помнит, где она была раньше, и характеризующие такие ситуации величины не должны зависеть от времени. Поэтому среднее значение этой величины равно нулю. У нас осталось лишь mv2, а об этой величине нам кое-что известно: среднее значение mv2/2 равно 1/2 kT. Следовательно, мы установили, что
влечет за собой
или
(41.20)
Это значит, что средний квадрат радиус-вектора частицы <R2> к моменту t равен
(41.21)
Таким образом, мы и в самом деле можем выяснить, как далеко уйдут частицы! Сначала нужно изучить реакцию частицы на постоянную силу, выяснить скорость дрейфа частицы под действием известной силы (чтобы определить μ), а тогда мы сможем узнать, далеко ли расползутся беспорядочно движущиеся частицы. Полученное нами уравнение имеет большую историческую ценность, потому что на нем основан один из первых способов определения постоянной k. Ведь в конце концов можно измерить величину μ, и время, определить расстояние, на которое удалится частица, и получить средние значения. Почему так важно определить точное значение k? Потому что по закону PV=RT для моля можно измерить R, которое равно произведению числа атомов в моле на k. Моль когда-то определялся как столько-то граммов кислорода 16 (теперь для этой цели используют углерод), поэтому числа атомов в моле сначала не знали. Это, конечно, интересный и важный вопрос. Каковы размеры атомов? Много ли их? Таким образом, одно из самых ранних определений числа атомов свелось к определению того, далеко ли уйдут мельчайшие соринки, пока мы будем терпеливо разглядывать их в микроскоп в течение строго определенного времени. После этого можно было найти и постоянную Больцмана k, и число Авогадро N0, потому что R к этому времени было уже измерено.
Глава 42 ПРИМЕНЕНИЯ КИНЕТИЧЕСКОЙ ТЕОРИИ
§ 1. Испарение
Эта глава посвящена дальнейшим применениям кинетической теории. В предыдущей главе мы подчеркнули один из выводов этой теории, что средняя кинетическая энергия каждой степени свободы молекулы или любого другого объекта равна 1/2 kT. Сейчас центральным пунктом нашего изложения будет утверждение о том, что отнесенная к единице объема вероятность обнаружить частицу в том или ином месте пропорциональна ехр(-п.э./kT). (Это утверждение мы используем в ряде задач.)
Явления, которые мы собираемся изучить, довольно сложны: испарение жидкости, вылет электронов с поверхности металла или химическая реакция, в которой участвует много атомов. В таких случаях кинетическая теория не дает простых и точных предписаний, ситуация слишком сложна для этого. Поэтому выводы этой главы, за исключением особо оговоренных, весьма неточны. Мы только подчеркнем, что, исходя из кинетической теории, можно более или менее хорошо понять эти явления. Но гораздо более точное представление о них дают термодинамические аргументы или некоторые измерения отдельных критических величин.
Однако полезно знать, хотя бы очень приблизительно, почему то, что происходит, происходит именно так. Тогда, натолкнувшись на явление, которое содержит в себе нечто, чего мы еще не видели, или то, что проанализировать мы еще не собрались, мы, может быть, сможем более или менее точно сказать, что произошло. Такой анализ будет в высшей степени неточным, но в общих чертах верным — верным по сути, но чуть-чуть упрощенным, скажем, в некоторых тонких деталях.
Разберем первый пример — испарение жидкости. Предположим, что большой ящик при заданной температуре заполнен жидкостью и паром поровну. Будем считать, что средние расстояния между молекулами пара довольно велики, а вот в жидкости они упакованы плотно. Задача состоит в том, чтобы определить число молекул, находящихся в газовой фазе, по сравнению с числом молекул, находящихся в жидкости. Какова плотность пара при заданной температуре и как она зависит от температуры?
Пусть n — число молекул пара в единице объема. Это число, естественно, меняется с температурой. С притоком тепла испарение увеличивается. Добавим еще одну величину 1/Va, равную числу атомов в единице объема, содержащихся в жидкости; мы предполагаем, что в жидкости каждой молекуле отведен вполне определенный объем, поэтому чем больше в жидкости молекул, тем больший объем они занимают. Если Va — объем, отведенный одной молекуле, то число молекул в единичном объеме равно единичному объему, деленному на объем, занимаемый молекулой. Далее, предположим, что между молекулами действуют силы притяжения, удерживающие их внутри жидкости. Иначе нельзя понять, почему происходит конденсация. Итак, предположим, что имеется сила притяжения и существует энергия связи молекулы в жидкости, которая теряется при переходе молекул в пар. Это наводит на мысль, что для перевода какой-нибудь молекулы из жидкости в пар, нужно совершить работу W. Существует определенная разность W между энергией молекулы в жидкости и ее энергией в паре, потому что для переноса молекул в пар мы должны оторвать ее от всех молекул, к которым она притягивается.
Теперь обратимся к общему принципу, по которому отношение числа атомов в единице объема в разных областях равно n2/n1=ехр[-(Е2-E1/kT)]. Значит, n —число молекул в единичном объеме пара, деленное на 1/Va (число молекул в единичном объеме жидкости), равно
(42.1)
Таково общее правило. Это очень похоже на равновесную атмосферу в поле тяжести, когда низшие слои газа плотнее верхних, потому что для подъема молекулы на высоту h нужна энергия mgh. В жидкости молекулы размещены плотнее, чем в газе, так как их заставляет потесниться энергия «подъема» W, и отношение плотностей равно ехр(-W/kT).
Это как раз то, что мы хотели вывести — плотность пара изменяется как е в некоторой степени. Показателем служит взятая со знаком минус похожая на энергию величина, деленная на kT. Множители перед экспонентой не особенно интересны, потому что в большинстве случаев плотность пара гораздо меньше плотности жидкости. При этих обстоятельствах, когда мы далеки от критической точки, где плотности почти одинаковы, соотношение плотностей, при котором n много меньше 1/Va, обеспечивается тем, что W много больше kT. Поэтому формулы типа (42.1) интересны только тогда, когда W действительно гораздо больше kT; в этом случае е возводится в громадную отрицательную степень и если немного изменить Т, то изменится слегка и громадная степень, а это изменение повлечет за собой такие изменения экспоненты, которые будут гораздо важнее возможных изменений предэкспоненциальных множителей. Но отчего бы изменяться таким множителям, как 1/Va? Да оттого, что наше описание приблизительно. Ведь в действительности каждая молекула не имеет определенного объема; при изменении температуры объем Vа не остается постоянным — жидкости сжимаются и расширяются. Есть еще и другие мелочи вроде этой, так что действительная ситуация гораздо сложнее. Почти всюду стоят медленно изменяющиеся с температурой множители. В действительности само W медленно изменяется с температурой, потому что при разных температурах молекулам отведены разные объемы, и притяжение должно быть разным, и т. д. Итак, можно прийти к выводу, что поскольку у нас получилась формула, в которой все неизвестным образом изменяется с температурой, то на самом деле формулы никакой и нет. Но если мы знаем, что показатель у экспоненты W/kT заведомо велик, то можно убедиться, что наибольшие изменения кривой плотности пара как функции температуры обусловлены экспоненциальным множителем. Поэтому если мы будем считать W постоянной величиной, а коэффициент 1/Va — почти постоянной, то это будет хорошим приближением вдоль небольшого интервала нашей кривой. Иначе говоря, основные изменения определяются видом функции ехр(-W/kT),
Выходит, что в природе есть много, очень много процессов, для которых характерно взятие энергии взаймы; основным свойством таких процессов является экспоненциальная температурная зависимость: е возводится в отношение взятой с отрицательным знаком энергии к kT. Это полезный факт, но только в тех случаях, когда энергия велика по сравнению с kT, поскольку главная часть изменений с температурой определяется изменением kT, а не величиной постоянных и других сомножителей.
Давайте рассмотрим сейчас немного подробнее другой способ получения почти аналогичного результата для испарения. Чтобы получить (42.1), мы просто применили всегда справедливое при равновесии правило, но мало что поняли в существе явления. Поэтому невредно попытаться посмотреть детальнее, как происходит испарение. Можно описать его примерно так: молекулы пара непрерывно бомбардируют поверхность жидкости; при ударе они могут либо отскочить от поверхности, либо пробить ее. Что случается чаще, нам неизвестно, может быть, отношение этих исходов равно 50 к 50, а может быть и 10 к 90. Предположим, что поверхность пробивается всегда, потом мы посмотрим, к чему приводит предположение о более прочной поверхности. Тогда в каждый момент будет иметься определенное число атомов, сконденсировавшихся на поверхности жидкости. Число сконденсировавшихся молекул (число молекул, прошедших через площадку единичной площади) равно числу молекул в единице объема n, умноженному на скорость v. Эта скорость молекул связана с температурой; ведь известно, что в среднем 1/2mv2 равно 3/2 kT. Поэтому v —какая-то средняя скорость. Конечно, нужно еще проинтегрировать по углам и сделать всякого рода усреднения, но результат прямо пропорционален корню из среднего квадрата скорости. Таким образом,
(42.2)
т. е. числу молекул, достигших единичной площадки и сконденсировавшихся.
Но атомы жидкости непрерывно пляшут, и время от времени отдельные атомы выскакивают наружу. Теперь нам нужно выяснить, часто ли это происходит. При равновесии число молекул, выскочивших за 1 сек из жидкости, равно числу молекул, поступивших за это же время на ее поверхность.
Ну, а много ли молекул выскакивает? Чтобы выскочить наружу, молекула должна как-то умудриться приобрести некоторую добавочную энергию, которая окажется больше, чем энергия ее соседок. И этот избыток энергии должен быть довольно большим, ведь наша молекула очень сильно притягивается к остальным молекулам жидкости. Обычно ей так и не удается преодолеть этого сильного притяжения, но иногда при столкновениях на ее долю выпадает излишек энергии. Шансы получить необходимую в нашем случае избыточную энергию W невелики, если W≫kT. Действительно, вероятность того, что атом приобретает энергию, большую чем W, равна ехр(-W/kT). Это общий принцип кинетической теории: шансы призанять энергию W сверх средней энергии равны е, возведенному в степень, показатель которой равен отношению W к kT со знаком минус. Предположим, что некоторым молекулам удалось получить эту энергию. Теперь можно установить, сколько молекул покидает поверхность жидкости за 1 сек. Конечно, получение молекулой нужной энергии еще не означает, что испарение обеспечено. Ведь эта молекула может находиться слишком глубоко в жидкости, а если она даже и находится у поверхности, то может двигаться не туда. Число молекул, покидающих единичную площадку за 1 сек, — это примерно число молекул на единице площади вблизи поверхности, деленное на время, которое требуется молекуле для побега, и умноженное на вероятность ехр(-W/kT) готовности молекул к побегу, в том смысле, что они уже получили достаточное количество энергии.
Предположим, что каждая молекула на поверхности жидкости занимает определенную площадку площади А. Тогда число молекул на единице поверхности жидкости равно 1/А. А много ли молекуле нужно времени, чтобы совершить свой побег? Если молекулы движутся с определенной средней скоростью v и должны пройти расстояние, равное, скажем, диаметру молекулы D (толщине наружного слоя), то время, нужное для преодоления этого расстояния, и есть время побега, если только молекула обладает достаточной энергией. Это время равно D/v. Таким образом, число испаряющихся молекул приблизительно равно
(42.3)
Заметим, что произведение площади каждой молекулы на толщину слоя приблизительно равно объему Va, отведенному каждой молекуле. Итак, для получения равновесия мы должны иметь Nc=Ne, или
(42.4)
Можно выкинуть из этого равенства скорости, потому что они равны; если даже специально отметить, что одна из них — скорость молекулы пара, а другая — скорость испаряющейся молекулы, — все равно они одинаковы, ведь мы знаем, что средняя кинетическая энергия обеих молекул (в одном направлении) равна 1/2kT. Но можно сказать: «Нет! Нет! Ведь испаряются только особо быстрые молекулы. Только они приобрели достаточный избыток энергии». Не совсем так, потому что в тот момент, когда эти молекулы выскакивают из жидкости, они теряют этот избыток, преодолевая потенциальную энергию. Поэтому при подходе к поверхности они уже движутся с замедленной скоростью v! Точно так же обстояло дело с распределением молекулярных скоростей в атмосфере — в нижних слоях молекулы были определенным образом распределены по энергиям. Те из них, которые достигали более высоких слоев, распределялись по энергиям точно так же, потому что медленные молекулы вверх совсем не поднимались, а быстрые, поднявшись, двигались медленнее. Испаряющиеся молекулы распределены по скоростям так же, как молекулы, движущиеся в глубине жидкости — поистине поразительный факт. Во всяком случае, нет смысла пытаться столь строго обсуждать нашу формулу, потому что в ней есть и другие неточности; например, мы рассматривали вероятность отражения молекул от поверхности, а не их конденсации и т. д. Мы имеем дело лишь с грубым описанием скорости испарения и конденсации и видим, естественно, что плотность пара n изменяется так же, как и раньше, но теперь мы понимаем этот процесс много лучше, а раньше писали почти произвольную формулу.
Более глубокое понимание позволит нам выяснить еще кое-что. Например, предположим, что мы откачиваем пар, причем так быстро, что пар удаляется практически с той же быстротой, с какой образуется (если наш насос очень хороший, а испарение происходит медленно). С какой скоростью будет происходить испарение, если температура жидкости Т будет поддерживаться постоянной? Предположим, что мы экспериментально уже измерили равновесную плотность пара и нам известно, сколько молекул в единице объема может быть в равновесии с жидкостью при заданной температуре. Теперь мы хотим узнать скорость испарения жидкости. Хотя мы ограничились лишь грубым анализом испарения, он все же дал нам сведения о числе прибывающих молекул пара, правда, с точностью до неизвестного коэффициента отражения. Поэтому мы можем использовать то обстоятельство, что при равновесии число покидающих пар молекул равно числу прибывающих молекул. Правда, пар откачивается и молекулы могут только покидать жидкость, но если оставить пар в покое, то установится равновесная плотность, при которой число прибывающих в жидкость молекул равно числу испаряющихся. Следовательно, легко видеть, что в этом случае число молекул, покидающих поверхность жидкости за 1 сек, равно произведению неизвестного коэффициента отражения R на число молекул, которые ежесекундно возвращались бы в жидкость, если бы пар не откачивался, потому что именно это число входит в уравнение баланса для испарения при равновесии:
(42.5)
Конечно, легче подсчитать число молекул, переходящих из пара в жидкость, потому что в этом случае не надо ничего предполагать о силах, как это приходилось делать при подсчете числа покидающих жидкость молекул. Проще изменить путь рассуждений.
§ 2. Термоиониая эмиссия
Можно привести еще один пример часто встречающегося процесса, столь похожего на испарение жидкости, что его даже не придется анализировать отдельно. В сущности, это та же самая задача. В любой радиолампе есть источник электронов — вольфрамовая нить накаливания и положительно заряженная пластинка, притягивающая электроны. Оторвавшийся с поверхности вольфрама электрон немедленно улетает к пластинке. Это — «идеальный» насос, который непрерывно «откачивает» электроны. Возникает вопрос: сколько электронов ежесекундно покидает вольфрамовую проволоку и как их число зависит от температуры? Решение задачи дается той же формулой (42.5), потому что электроны, находящиеся в куске металла, притягиваются ионами или атомами металла. Они, грубо говоря, притягиваются металлом. Чтобы оторвать электрон от металла, надо сообщить ему определенное количество энергии, т. е. затратить для этого работу. Эта работа для разных металлов различна. Фактически она изменяется даже в зависимости от вида поверхности у одного и того же металла, но в целом она составляет несколько электронвольт,—величину, вообще типичную для энергии химических реакций. При этом полезно вспомнить, что разность потенциалов химических элементов, например батареи для магниевой вспышки, которая порождается химическими реакциями, порядка 1 в.
Как определить число электронов, покидающих металл за 1 сек? Очень трудно перечислить все, что может повлиять на выход электрона: легче решить задачу по-другому. Представим, что мы не удаляем вылетевшие электроны, а электроны образуют нечто вроде газа и могут вернуться в металл. В этом случае существует вполне определенная равновесная плотность электронов, которая определяется такой же формулой, как (42.1), где Va, грубо говоря, — объем, отведенный в металле одному электрону, а W=qeφ (φ —так называемая работа выхода, или разность потенциалов, необходимая для того, чтобы вырвать электрон с поверхности металла). Эта формула подскажет нам, сколько электронов должно находиться в окружающем пространстве и проникать в металл, чтобы скомпенсировать потерю тех электронов, которые покинули металл. Теперь легко подсчитать, сколько электронов уйдет из металла, если мы будем непрерывно откачивать их, потому что число ушедших электронов в точности равно числу электронов, которые должны были бы вернуться в металл, если существовал электронный «пар», плотность которого определяется формулой (42.1). Иначе говоря, электрический ток через единичную площадку равен произведению заряда электрона на число электронов, проходящих за 1 сек через площадку единичной площади; последнее равно произведению числа электронов в единичном объеме на скорость: поэтому, как мы уже много раз видели,
(42.6)
Мы знаем, что 1 эв соответствует kT при температуре, достигающей 11 600 град. Нить накаливания радиолампы работает примерно при температуре 1100 град, поэтому экспоненциальный множитель равен примерно е-10; когда мы слегка изменяем температуру, экспоненциальный множитель изменяется очень сильно. Это опять основное свойство формул, содержащих ехр(-qeφ/kT). Предэкспоненциальный множитель на самом деле совершенно неверен; оказывается, что поведение электронов в металле правильно описывает квантовая, а не классическая механика, но правильный множитель лишь немного отличается от нашего. Фактически до сих пор никто еще не смог точно вычислить этот множитель, хотя многие при расчетах пользовались квантовыми формулами высшего класса. Основная задача состоит в том, чтобы выяснить, не меняется ли W хотя бы медленно с температурой? Если да, то медленно изменяющуюся с температурой величину W нельзя отделить от предэкспоненциальных коэффициентов. Если, например, W зависит от температуры линейно, так что W=W0+αkT, то
Такая линейная зависимость W от температуры эквивалентна измененной «постоянной». Попытка точного вычисления предэкспоненциального множителя очень трудна и обычно бесплодна.
§ 3. Тепловая ионизация
Перейдем теперь к еще одному применению все той же идеи. Теперь речь пойдет об ионизации. Предположим, что газ состоит из великого множества атомов, которые обычно нейтральны, но если газ нагреть, то атомы могут оказаться ионизованными. Нам нужно знать, сколько существует ионов при тех или иных обстоятельствах, т. е. при заданной плотности атомов в единичном объеме и при определенной температуре. Снова придется представить себе ящик, в котором находится N атомов, содержащих в себе электроны. (Если электрон покидает атом, то атому присваивается наименование ион, а если атом нейтрален, то говорят просто—атом.) Таким образом, предположим, что в заданный момент в единичном объеме число нейтральных атомов равно nа, число ионов равно ni, а число электронов равно nе. Нужно определить, как связаны эти три числа между собой?
Прежде всего эти числа подчиняются двум условиям или связям. Например, можно как угодно менять различные условия, температуру и т. д., но сумма na+ni всегда останется одной и той же, потому что это просто-напросто N — число атомных ядер в ящике. Если в единице объема число ядер сохраняется постоянным, а изменяется, скажем, температура, то, хотя в результате ионизации некоторые атомы превращаются в ионы, общее число атомов и ионов не изменяется. Значит, na+ni=N. Другое условие вытекает из того, что если газ в целом электрически нейтрален (и если мы пренебрегаем двойной или тройной ионизацией), то число ионов всегда равно числу электронов, или ne=ni. Эти дополнительные условия просто выражают сохранение заряда и сохранение атомов.
Эти равенства верны, и мы в конце концов всегда используем их при решении реальных задач. Но нам нужно получить другое соотношение между этими величинами. Сделать это можно так. Обратимся снова к идее о том, что для отрыва электрона от атома требуется какое-то количество энергии, которую мы будем называть энергией ионизации и обозначать буквой W (чтобы новые формулы выглядели так же, как и раньше). Итак, W равна энергии, потребной для того, чтобы оторвать электрон от атома и получить ион. Мы снова убеждаемся, что число свободных электронов в единичном объеме «пара» равно произведению числа электронов в единичном объеме, связанных в атомах, на е в степени минус разность энергий связанного и свободного электронов, деленная на kT. Опять основное уравнение. Но как это записать? Число свободных электронов в единичном объеме, конечно, ne, потому что это определение nе. Ну, а что можно сказать о числе связанных в атоме электронов в единичном объеме? Общее число мест, отданных электронам, равно nа+ni;, и мы предположим, что когда все электроны связаны, то каждому отводится некоторый объем Va. Таким образом, полный атомный объем, занимаемый связанными электронами, равен (na+ni)Va, и нашу формулу теперь можно записать в виде
Но формула эта неверна. Мы упустили из вида одно существенное обстоятельство: когда один электрон попал в атом, другой электрон уже не может проникнуть в этот же объем! Иначе говоря, не все объемы из числа возможных доступны электрону, который раздумывает, куда бы ему отправиться — в пар или в конденсированное состояние. Здесь возникают непредвиденные осложнения, в силу которых электрон не может подойти близко к тому месту, где уже находится другой электрон — они отталкиваются. По этой причине мы должны считать только ту часть объема, в которой электрон может разместиться. Ведь те объемы, которые уже заняты, нельзя причислять к числу возможных, и только те объемы, которые предоставлены ионам, можно рассматривать как места, вакантные для электронов. Тогда, учтя это обстоятельство, мы найдем, что более точная формула записывается в виде
(42.7)
Эту формулу называют уравнением ионизации, или уравнением Саха. Теперь посмотрим, можем ли мы качественно понять, почему получается формула, подобная этой, если следить за кинетикой процесса.
Прежде всего время от времени, когда электрон сталкивается с ионом, они объединяются в атом. Точно так же время от времени атом испытывает столкновение и разваливается на ион и электрон. Скорости обоих процессов должны быть равны. А долго ли электрону и иону искать друг друга? Встречи, конечно, учащаются, если возрастает число электронов в единичном объеме. К этому же приводит и увеличение числа ионов в единичном объеме. Следовательно, полная скорость рекомбинации пропорциональна произведению числа электронов на число ионов. Далее, полная скорость ионизации в результате столкновений должна линейно зависеть от числа способных к ионизации атомов. Таким образом, скорости обоих процессов сбалансируются тогда, когда установится определенное соотношение между произведением neni и числом атомов na. Тот факт, что это соотношение выражается особой формулой, куда входит энергия ионизации W, дает, конечно, несколько большую информацию, но мы можем легко сообразить, что такая формула обязательно должна содержать концентрации электронов, ионов и атомов в комбинации neni/na, которая приводит к постоянной, не зависящей больше от чисел n, а только от температуры, атомных размеров и других постоянных.
Заметим также, что поскольку уравнение содержит числа в единичном объеме и если мы поставим два опыта с одним и тем же полным числом N атомов и ионов, т. е. со строго определенным числом ядер, но заключим их в ящики разных объемов, то числа n будут меньше для больших ящиков. Однако отношение neni/na должно оставаться постоянным, поэтому полное число электронов и ионов должно быть больше в большем ящике. Чтобы убедиться в этом, предположим, что в ящик объема V помещено N ядер и их f-я часть ионизована. Тогда ne=fN/V=ni и na=(1-f)N/V. В этом случае наше уравнение принимает вид
(42.8)
Иначе говоря, если мы берем все меньшую и меньшую плотность атомов или непрерывно увеличиваем объем ящика, относительное число электронов и ионов должно возрасти. То, что ионизация может быть вызвана просто «расширением», при котором плотность уменьшается, объясняет нам, почему при очень малых плотностях (какие встречаются в холодном межзвездном пространстве) много ионов, хотя это трудно понять, учитывая имеющуюся в нашем распоряжении энергию. Энергия во много-много раз больше kT, но ионы все равно есть.
Почему же ионы могут существовать лишь при условии, что вокруг них имеется много места, тогда как при увеличении плотности они стремятся исчезнуть? Ответ: Все дело в атомах. Время от времени свет или другой атом, или ион, или еще что-то, что поддерживает тепловое равновесие, разрушает атомы. Очень редко, потому что для этого требуются огромные количества избыточной энергии, электрон отрывается и происходит превращение атома в ион. Если пространства огромны, то электрон слоняется очень долго, быть может много лет и ничего не встречает. Но однажды он находит ион, и тогда они объединяются в атом. Скорость, с которой электроны покидают атомы, очень мала. Но если объем огромен, то сбежавший электрон так долго ищет ион, с которым он мог бы рекомбинировать, что вероятность рекомбинации совсем ничтожна; поэтому, несмотря на то, что для ионизации нужны большие излишки энергии, число электронов может быть вполне ощутимым.
§ 4. Химическая кинетика.
При химических реакциях происходит нечто похожее на «ионизацию». Например, два вещества А и В комбинируют в основном веществе АВ; тогда, подумав немного, мы можем АВ назвать атомом (В — то, что мы называем электроном, а А — то, что мы называем ионом). После такой замены, как и раньше, можно написать уравнение равновесия
(42.9)
Эта формула, конечно, неточна, потому что «постоянная» с зависит от того, в каком объеме позволено объединяться А и В и т. п., но, обратясь к термодинамическим аргументам, можно придать смысл величине W в экспоненциальном множителе, и тогда окажется, что она тесно связана с энергией, необходимой для реакции.
Попробуем понять эту формулу как результат столкновений, приблизительно так же, как мы постигали формулу испарения, подсчитывая электроны, вырывающиеся в пространство, и те, которые возвращаются назад за единицу времени. Предположим, что при столкновениях А и В иногда образуют соединение АВ. И предположим еще, что АВ — это сложная молекула, которая участвует в общей пляске и по которой ударяют другие молекулы, причем время от времени она получает энергию, достаточную для того, чтобы взорваться и снова развалиться на части А и В.
Заметим, что в химических реакциях дело обстоит так, что если сближающиеся атомы имеют слишком малую энергию, то, хотя этой энергии и достаточно для реакции А+В→АВ, факт соударения атомов А и В еще не обязательно означает начало реакции. Обычно требуется, чтобы соударение было более «жестким», «мягкого» соударения между А и В может оказаться недостаточно для начала реакции, даже если в процессе освобождается достаточное для реакции количество энергии. Предположим, что общей чертой химических реакций является требование, по которому для объединения А и В в АВ недостаточно простого соударения, а нужно, чтобы они столкнулись, имея определенное количество энергии. Эта энергия называется энергией активации, т. е. энергия, нужная для «активации» реакции. Пусть А*— тот избыток энергии, который необходим, чтобы столкновения могли вызвать реакцию. Тогда скорость Rf, с которой А и В порождают АВ, должна содержать произведение числа атомов А и B, умноженное на скорость, с которой отдельный атом ударяется о некоторую площадку величиной σAB, и на величину ехр(-A*/kT) (вероятность того, что атомы обладают достаточной энергией):
(42.10)
Теперь надо найти скорость обратного процесса Rr. Есть некоторая вероятность, что А и В снова разойдутся. Чтобы разойтись, им недостаточно энергии W, которая обеспечит их раздельное существование. Но раз молекулам нелегко соединиться, должен существовать некий барьер, через который А и В должны перевалить, чтобы разлететься. Они должны запастись не только нужной для их существования энергией, но и взять кое-что про запас. Получается что-то вроде подъема на холм перед спуском в долину; сначала приходится вскарабкаться на высоту, потом спуститься, и только после этого разойтись (фиг. 42.1).
Фиг. 42.1. Соотношение энергий в реакции А+В→АВ.
Таким образом, скорость перехода АВ в А и В пропорциональна произведению nАВ — начальному числу молекул АВ на ехр[-(W+A*)/kT]:
(42.11)
Постоянная с' складывается из объема атомов и частоты столкновений; ее можно получить, как и в случае испарения, перемножая площадь и толщину слоя, но сейчас мы этого делать не будем. Сейчас нас больше интересует тот факт, что, когда эти скорости равны, их отношение равно единице. Это говорит о том, что, как и раньше, (nAnB/nAB)=cехр(-W/kT), где с содержит сечения, скорости и другие множители, не зависящие от чисел n. Интересно, что скорость реакции по-прежнему изменяется как ехр(-const/kT), хотя эта постоянная уже не имеет никакого отношения к той, с которой мы встречались в задаче о концентрациях; энергия активации А* сильно отличается от энергии W. Энергия W регулирует пропорции А, В и АВ, при которых устанавливается равновесие, но если нам захочется узнать, быстро ли А+В переходит в АВ, то это уже к равновесию отношения не имеет, и появляется уже другая энергия, энергия активации, которая с помощью экспоненты управляет скоростью реакции.
Кроме того, A* не является фундаментальной постоянной, как W. Предположим, что реакция происходит на поверхности стены, или на какой-нибудь другой поверхности, тогда А и В могут растечься по ней так, что объединение в АВ будет для них более легким делом. Иначе говоря, сквозь гору можно прорыть «туннель» или срыть вершину горы. В силу сохранения энергии, по какому бы пути мы ни шли, результат будет один: из А и В получится АВ, так что разность энергий W не зависит от пути, по которому идет реакция, однако энергия активации А* очень сильно зависит от этого пути. Вот почему скорости химических реакций столь чувствительны к внешним условиям. Можно изменить скорость реакции, изменив поверхность, с которой соприкасаются реактивы, можно изготовить «набор бочонков» и подбирать с его помощью любые скорости, если они зависят от свойств поверхности. Можно внести в среду, в которой происходит реакция, третий предмет; это также может сильно изменить скорость реакции, такие вещества при незначительном изменении А* иногда чрезвычайно влияют на скорость реакции; их называют катализаторами. Реакции может практически не быть совсем, потому что А* слишком велика для заданной температуры, но если добавить это специальное вещество — катализатор, то реакция протекает очень быстро, потому что А* уменьшается.
Между прочим, эта реакция А плюс В, дающая АВ, доставляет немало волнений. Ведь невозможно сохранить сразу и энергию, и импульс, пытаясь подогнать два предмета друг к другу, чтобы сделать из них один более устойчивый. Следовательно, необходим по крайней мере третий предмет С и реальная реакция выглядит гораздо сложнее. Скорость прямого процесса должна содержать произведение nAnBnC, и можно подумать, что наша формула становится неверной, но это не так! Если мы начнем искать скорость развала АВ, то выясним, что этой молекуле еще надо столкнуться с С, поэтому скорость обратной реакции пропорциональна nABnC и из формулы для равновесных концентраций nC выпадает. Правильность закона равновесия (42.9), который мы написали прежде всего, абсолютно гарантирована независимо от любого возможного механизма реакции!
§ 5. Законы излучения Эйнштейна
Обратимся теперь к интересной задаче, похожей на только что описанную и связанную с законом излучения черного тела. В предыдущей главе мы разбирали вывод закона распределения излучения в полости по способу Планка, рассматривая излучение осциллятора. Осциллятор обладает определенной средней энергией, а раз он осциллирует, то должен и излучать и накачивать излучение в полость, пока она не заполнится как раз таким количеством излучения, которое нужно для поддержания равновесия между излучением и поглощением. Рассуждая таким образом, мы нашли, что интенсивность излучения частоты ω задается формулой
(42.12)
Этот вывод содержит предположение, что генерирующий излучение осциллятор обладает определенными уровнями энергии, отстоящими друг от друга на равном расстоянии. Мы не говорили о том, что свет состоит из фотонов или чего-то вроде этого. Мы даже не задавали вопроса, каким способом при переходе атома с одного уровня энергии на другой переносится единичная энергия ℏω в виде света. Первоначальная идея Планка состояла в том, что вещество квантовано, а свет — нет: осциллятор не может получать любую энергию, а должен принимать ее порциями. Вызывает еще беспокойство то, что способ вывода — полуклассический. Мы вычислили скорость излучения осциллятора, исходя из законов классической физики, а потом забыли об этом и сказали: «Нет, этот осциллятор имеет много уровней энергии». Но для последовательно строгого вывода этой чисто квантовой формулы пришлось пройти длинный путь, завершившийся в 1927 г. созданием квантовой механики. А тем временем Эйнштейн попытался заменить точку зрения Планка, что квантованы только материальные осцилляторы, идеей о том, что свет в действительности состоит из фотонов и его следует в определенном смысле понимать как газ из частиц с энергией ℏω. Далее, Бор обратил внимание на то, что любая система атомов имеет уровни энергии, но расстояния между ними не обязательно постоянны, как у осцилляторов Планка. Поэтому возникла необходимость пересмотреть вывод или хотя бы более точно исследовать закон излучения, исходя из более последовательной квантовомеханической точки зрения.
Эйнштейн предположил, что окончательная формула Планка правильна и использовал ее для получения новой, ранее неизвестной информации о взаимодействии излучения с веществом. Он рассуждал так: надо рассмотреть любые два из возможных уровней энергии атома, скажем, m-й и n-й уровни (фиг. 42.2).
Фиг. 42.2. Переход между двумя уровнями энергии атома.
Затем Эйнштейн предположил, что, когда атом освещается светом подходящей частоты, он может поглотить фотон, перейдя из состояния n в состояние m, и вероятность такого перехода за 1 сек пропорциональна интенсивности освещающего атом света и еще зависит от того, какие уровни мы возьмем.
Назовем постоянную пропорциональности Bnm, чтобы помнить, что это не универсальная постоянная природы и зависит она от того, какую пару уровней мы выберем: некоторые уровни возбудить легко, а другие возбуждаются с большим трудом. Теперь надо найти формулу, описывающую скорость перехода из m в n. Эйнштейн предположил, что она складывается из двух частей. Даже если внешнего излучения нет, существует вероятность того, что атом, излучив фотон, перейдет из возбужденного состояния в состояние с меньшей энергией. Это так называемое спонтанное излучение.
Это предположение аналогично идее о том, что даже классический осциллятор, обладая определенной энергией, не может ее сохранить; излучение неизбежно вызывает потерю энергии. Таким образом, по аналогии со спонтанным излучением классических систем существует определенная вероятность Amn (она опять зависит от уровней), с которой атом переходит из состояния m в состояние n, и эта вероятность не зависит от того, освещается атом светом или нет. Но Эйнштейн пошел еще дальше и, сравнив с классической физикой и используя другие аргументы, пришел к заключению, что излучение зависит от наличия света вокруг. Когда атом освещается светом подходящей частоты, то вероятность излучения фотона возрастает пропорционально интенсивности света с постоянной пропорциональности Bmn. Если бы нам удалось выяснить, что этот коэффициент равен нулю, то мы уличили бы Эйнштейна в ошибке. Но, конечно, мы увидим, что он был прав.
Итак, Эйнштейн предположил, что существует три сорта процессов: поглощение, пропорциональное интенсивности света, излучение, пропорциональное интенсивности света (его называют индуцированным излучением, или вынужденным излучением), и спонтанное излучение, не зависящее от интенсивности света.
Предположим теперь, что при температуре Т установилось равновесие, и в состоянии n находится некоторое количество атомов Nn, а в состоянии m — некоторое количество атомов Nm. Тогда полное число атомов, переходящих из n в m, равно произведению числа атомов в состоянии n на скорость перехода одного атома из состояния n в состояние m. Таким образом, мы получили формулу для числа атомов, переходящих за 1 сек из n в m:
(42.13)
Число атомов, переходящих из m в n, получается точно таким же способом: надо умножить число атомов в состоянии m на скорость перехода одного атома. На этот раз получаемое выражение выглядит так:
(42.14)
Теперь предположим, что при тепловом равновесии число атомов, поднимающихся на верхний уровень, должно быть равно числу атомов, спускающихся вниз. Это по крайней мере один из способов удержать число атомов на каждом уровне постоянным[32]. Следовательно, при равновесии мы считаем обе скорости равными. Но у нас в запасе есть еще кое-какая информация: мы знаем, насколько велико Nm по сравнению с Nn; отношение этих чисел равно ехр[—(Em-En)/kT]. После этого Эйнштейн предположил, что частота света, который вовлекается в игру при переходах из m в n, соответствует разности энергий, так что во всех наших формулах Еm-Еn=ℏω. Итак,
(42.15)
Таким образом, если приравнять две скорости: NnBmnI(ω)=Nm[Amn+BmnI(ω)] и поделить на Nm, то мы получим
(42.16)
Из этого выражения можно найти I(ω). Это просто:
(42.17)
Но Планк уже сказал нам, что формула должна иметь вид (42.12). Следовательно, мы можем сделать кое-какие выводы: прежде всего Bmn должно быть равно Bnm, потому что иначе ехр(ℏω/kT)-1 не получить. Таким образом, Эйнштейн открыл некоторые соотношения, прямого вывода которых он не знал, например, что вероятности вынужденного излучения и поглощения должны быть равны. Это интересно. Кроме того, чтобы (42.17) и (42.12) согласовались,
(42.18)
Значит, если известна, скажем, скорость поглощения для заданного уровня, то можно получить скорость спонтанного излучения и скорость вынужденного излучения или какую-нибудь комбинацию этих величин.
Больше этого на основании столь общих предположений ни Эйнштейн, ни вообще кто-либо получить не сможет. Чтобы действительно вычислить абсолютную скорость спонтанного излучения или вообще любую скорость специфически атомного перехода, нужно знать все скрытые механизмы атома. Этому учит так называемая квантовая электродинамика, открытая лишь одиннадцать лет спустя. А Эйнштейн предсказал все это в 1916 г.
Возможность вынужденного излучения в наши дни нашла интересное применение. Если есть свет, то он стремится вызвать переход сверху вниз. Тогда этот переход может увеличить энергию света на ℏω, если найдутся такие атомы, у которых занят верхний уровень. Можно разработать нетепловой метод приготовления газа, в котором число состояний m гораздо больше числа состояний n. Газ будет очень далек от равновесия, и формулу ехр(-ℏω/kT), верную для равновесия, к нему применить нельзя. Можно добиться даже, чтобы число занятых верхних состояний было очень большим, тогда как число атомов в нижнем состоянии практически будет равно нулю. Тогда свет с частотой, соответствующей разности энергий Em-Еn, будет поглощаться очень слабо, потому что атомов, находящихся в состоянии n и способных поглотить его, очень мало. С другой стороны, когда газ из таких атомов освещен, то свет вызывает излучение из верхнего состояния! Таким образом, если в верхнем состоянии находится много атомов, то начинается что-то вроде цепной реакции, когда атомы вдруг начинают излучать; более того, они вынуждены излучать и все разом проваливаются в нижнее состояние. Так работает лазер, а если излучаются инфракрасные волны, то их источник называют мазером.
Чтобы загнать атомы в состояние m, прибегают к разным ухищрениям. Может существовать более высокий уровень, на который атомы можно поднять сильным пучком света высокой частоты. С этого высокого уровня атомы падают вниз, испуская самые различные фотоны, пока не соберутся на уровне m. Если атомы стремятся задержаться на уровне m, не излучая фотонов, то этот уровень называют метастабильным. А потом атомы разом спрыгивают с уровня m, сопровождая прыжок вынужденным излучением. Еще одна техническая деталь — если поместить нашу систему в обычный ящик, то она может спонтанно излучать во многих направлениях, что наносит ущерб вынужденному излучению. Но можно усилить эффект вынуждения и увеличить его значение, поставив у каждой стенки ящика почти полностью отражающие зеркала; тогда излученный свет получает шанс вызвать дополнительное излучение, следующее отражение добавит еще один такой шанс, а потом еще, еще и еще. Хотя зеркала отражают почти весь свет, существует небольшая вероятность прохождения части света сквозь зеркало и выхода наружу. В конце концов весь свет, подчиняясь закону сохранения энергии, выйдет наружу в виде тонкого, сильного пучка. Так и получают мощные пучки света в лазерах
Фиг. 42.3. При возбуждении голубым светом атом поднимается на высший уровень h и, быстро испустив фотон, сваливается с него на уровень m. Когда число атомов в состоянии m становится достаточно большим, возникает действие лазера.
Глава 43 ДИФФУЗИЯ
§ 1. Столкновения молекул
До сих пор мы изучали движение молекул только при тепловом равновесии. А теперь нужно обсудить, как движутся молекулы газа, когда он близок к равновесию, но еще не достиг его полностью. Если газ слишком неравновесен, все становится чрезвычайно сложным и разобраться в том, что там происходит, очень трудно, а вот если отклонения от равновесия незначительны, то задачи решаются легко. Однако, чтобы рассмотреть, что происходит в таком газе, надо снова вернуться к кинетической теории. Статистическая механика и термодинамика пригодны, когда имеется равновесие, а чтобы проанализировать то, что происходит при отклонении от равновесия, приходится, так сказать, перебирать атом за атомом.
В качестве простого примера неравновесной задачи рассмотрим диффузию ионов в газе. Предположим, что в газе содержится немного ионов — электрически заряженных молекул. Если к газу приложить электрическое поле, то на каждый ион будет действовать сила, отличающаяся от сил, действующих на нейтральные молекулы. Если бы других молекул не было, то ион двигался бы с постоянным ускорением, пока не наткнулся бы на стенку ящика. Но наличие других молекул меняет дело: скорость иона возрастает лишь до тех пор, пока он не ударится о молекулу и не потеряет своего импульса. После этого он снова начинает ускоряться, но вновь теряет импульс. В результате ион вынужден двигаться по ломаному пути, хотя все же в конце концов он движется в направлении электрического поля. Мы замечаем, таким образом, что ион «дрейфует» со средней скоростью, пропорциональной электрическому полю; чем сильнее поле, тем быстрее движется ион. Конечно, пока существует поле и пока ион продолжает двигаться, не может быть и речи о тепловом равновесии. Система стремится прийти к равновесию, но для этого нужно, чтобы все ионы приклеились к стенке ящика. С помощью кинетической теории возможно вычислить скорость дрейфа ионов.
Наших математических познаний еще недостаточно, чтобы точно вычислить все, что произойдет, но мы можем получить приближенное решение, которое правильно передаст все существенные особенности явления. Мы можем определить зависимость эффекта от давления, температуры и т. п., но не в наших силах вычислить точно все коэффициенты, стоящие перед этими сомножителями. Поэтому не будем мучить себя заботой о точных значениях таких коэффициентов. Получить их можно только после очень тонкого математического анализа.
Прежде чем рассуждать о том, что происходит в отсутствие равновесия, посмотрим повнимательнее на равновесный газ. Необходимо, например, знать среднее время между двумя последовательными столкновениями молекулы.
Каждая молекула непрерывно сталкивается с другими молекулами. Происходят все эти столкновения, конечно, случайно. Если выбрать какую-нибудь молекулу, то за достаточно долгое время Т она получит определенное число N ударов. Если увеличить промежуток времени вдвое, то и число ударов возрастет вдвое. Таким образом, число столкновений пропорционально времени Т. Это можно выразить следующим образом:
(43.1)
Мы записали постоянную пропорциональности в виде 1/τ, где τ имеет размерность времени. Постоянная τ — это среднее время между столкновениями. Предположим для примера, что за час происходит 60 столкновений; тогда τ равно одной минуте. Мы будем говорить, что τ (одна минута) это среднее время между столкновениями.
Часто нам придется искать ответ на такой вопрос: Какова вероятность того, что молекула испытает столкновение в течение малого промежутка времени dt? Мы догадываемся, что эта вероятность равна dt/τ. Попытаемся, однако, привести более убедительные аргументы. Предположим, что в нашем распоряжении имеется очень большое число N молекул. Сколько молекул из этого числа столкнется в течение интервала времени dt? Если молекулы находятся в равновесном состоянии, то ничего не будет меняться в среднем со временем. Таким образом, N молекул, пробывших в ящике в течение интервала dt, испытают столько же соударений, сколько одна молекула за время Ndt. Число соударений одной молекулы за большое время Ndt известно — это Ndt/τ. А если число соударений между N молекулами за время dt равно Ndt/τ, то вероятность удара для одной молекулы равна 1/N части этой величины, или (1/N)(Ndt/τ)=dt/τ (как мы и говорили с самого начала). Таким образом, относительное число молекул, сталкивающихся за время dt, грубо говоря, равно dt/τ. Если, например, τ равно одной минуте, то за секунду столкнется 1/60 часть всех молекул.
Это означает, конечно, что если в данный момент 1/60 часть молекул подошла достаточно близко к тем, с кем они должны столкнуться, то их столкновение произойдет в течение следующей минуты.
Когда мы говорим, что τ (среднее время между столкновениями) равно одной минуте, то мы вовсе не считаем, что все столкновения разделены в точности минутными интервалами. Частица, столкнувшись, совсем не выжидает потом еще минуту, чтобы нанести следующий удар. Промежутки между последовательными столкновениями весьма различны. В дальнейшем, правда, нам это не понадобится, но можно задать такой вопрос: А чему все же равно время между столкновениями? Мы уже знаем, что в приведенном выше примере среднее время равно одной минуте, но нам, быть может, нужно знать, какова вероятность того, что молекула не столкнется ни с кем в течение двух минут?
Ответим на более общий вопрос: Какова вероятность того, что молекула не испытает ни одного столкновения за время t? Начнем в какой-то произвольный момент времени, который мы назовем t=0, следить за определенной молекулой. Какова вероятность того, что до момента встречи ее с другой молекулой пройдет время t? Чтобы вычислить вероятность, посмотрим, что случится со всеми N0 молекулами, находящимися в ящике. Пока мы ждем в течение времени t, некоторые молекулы испытают столкновения. Пусть N(t) — число молекул, не испытавших столкновений за время t. Мы можем определить N(t), ибо нам известно, как это число меняется со временем. Это число N(t), естественно, меньше общего числа молекул N0. Если мы знаем, что за время t избежать столкновений удалось N(t) молекулам, то N(t+dt) (число молекул, которым удалось сделать это за время t+dt) меньше N(t) на число молекул, все-таки столкнувшихся за время dt. Мы уже раньше научились определять число молекул, которым не удалось избежать столкновений за время dt, с помощью среднего времени τ: dN=N(t)dt/τ. Мы получаем уравнение
(43.2)
Величину, стоящую в левой части уравнения, N(t+dt), можно в согласии с общими правилами дифференциального исчисления записать в виде N(t)+(dN/dt)(dt). Сделав эту подстановку, мы приведем уравнение (43.2) к виду
(43.3)
Число молекул, выбывших из игры за промежуток dt, пропорционально числу наличных молекул и обратно пропорционально среднему времени жизни τ. Уравнение (43.3) легко проинтегрировать, если переписать его в виде
(43.4)
Поскольку в каждой части стоит полный дифференциал, то интеграл уравнения таков:
(43.5)
или, что то же самое,
(43.6)
Мы знаем, что постоянная должна быть равна N0 — полному числу молекул, потому что в начальный момент t=0 все молекулы ждут «следующего» удара. Мы можем записать наш результат в виде
(43.7)
Если мы хотим определить вероятность P(t) того, что молекула не испытает столкновений, нужно величину N(t) поделить на N0; тогда получим
(43.8)
Вот наш результат: вероятность того, что какая-то молекула сможет прожить время t, не столкнувшись, равна ехр(-t/τ), где τ — среднее время между столкновениями. Вероятность эта начинается с 1 (очевидности) при t=0 и уменьшается по мере того, как t становится все больше и больше. Вероятность того, что молекула избежит столкновений за время τ, равна е-1=0,37... Шансов выдержать дольше, чем среднее время между столкновениями, меньше половины. В этом нет ничего странного, потому что существует достаточно много молекул, которые избегают столкновений значительно дольше среднего времени между столкновениями, так что среднее время между столкновениями по-прежнему равно τ.
Первоначально мы определили τ как среднее время между столкновениями. Сформулированный в виде уравнения (43.7) результат говорит нам, что среднее время, отсчитываемое от произвольно взятого момента до следующего столкновения, также равно τ. Этот несколько удивительный факт можно продемонстрировать следующим образом. Число молекул, которые испытают их следующее столкновение в промежутке dt, отсчитанного от времени t после произвольно взятого начального времени, равно N(t)dt/τ. Их «промежуток времени до следующего столкновения» равен, конечно, t. «Среднее время до следующего столкновения» получается обычным образом:
Используя полученное из (43.7) число N(t) и вычисляя интеграл, найдем, что τ — это среднее время, отсчитанное от любого момента до следующего столкновения.
§ 2. Средняя длина свободного пробега
Есть еще возможность описать столкновения молекул, не вводя для этого времени между столкновениями. Можно определить, далеко ли успеет уйти частица между столкновениями. Если мы знаем, что среднее время между столкновениями равно τ, а средняя скорость молекул равна v, то очевидно, что среднее расстояние между столкновениями, которое мы обозначим буквой l, равно произведению τ и v. Это расстояние между столкновениями обычно называют длиной свободного пробега:
(43.9)
В этой главе мы не будем уточнять, какого рода среднее мы имеем в виду в каждом случае. Существующие разные средние — среднее, корень из среднего квадрата и т. д.— приблизительно равны и отличаются только множителями, близкими к единице. Поскольку для получения правильных множителей необходим подробный анализ, нам нет смысла очень уж стараться уточнять, какое именно среднее используется в том или ином случае. Мы хотим еще предупредить читателей, что используемые для обозначения физических величин алгебраические символы (например, l для длины свободного пробега) не являются общепринятыми просто потому, что об этом никто еще специально не договаривался.
Вероятность того, что молекула испытает столкновение, пройдя расстояние dx, равна dx/l, как вероятность столкновения за короткий промежуток времени dt равна dt/τ. Призвав на помощь те же аргументы, что и раньше, читатель сможет показать, что вероятность того, что молекула пройдет по крайней мере расстояние х, прежде чем испытает следующее столкновение, равна е-x/l.
Среднее расстояние, которое молекула проходит между столкновениями (длина свободного пробега l), зависит от количества молекул, ее окружающих, и от того, какого «размера» эти молекулы, т. е. от того, насколько уязвимую мишень представляют они собой. «Размеры» мишени при столкновениях обычно описывают при помощи «эффективного сечения столкновений»; эта же идея используется и в ядерной физике или в задачах о рассеянии света.
Рассмотрим движущуюся частицу, которая проходит расстояние dx внутри газа, содержащего n0 рассеивателей (молекул) в единичном объеме (фиг. 43.1).
Фиг. 43.1. Эффективное сечение столкновения.
На каждой площадке единичной площади, перпендикулярной к направлению движения выбранной нами частицы, имеется n0dx молекул. Если каждая может быть представлена эффективной площадью столкновения, или, как обычно говорят, «эффективным сечением столкновения» σс, то полная площадь, покрываемая рассеивателями, равна σcn0dx.
Под «эффективным сечением столкновения» понимается площадь, в которую должен попасть центр частицы, если она должна столкнуться с заданной молекулой. Если молекулы выглядят как маленькие шарики (классическая картина), то следует ожидать, что σс=π(r1+r2)2, где r1 и r2— радиусы двух сталкивающихся молекул. Вероятность того, что наша частица столкнется с какой-нибудь молекулой, равна отношению площади, покрываемой рассеивающими молекулами, к полной площади, принятой нами за единицу. Таким образом, вероятность столкновения на пути dx равна σсn0dx:
(43.10)
Мы уже отметили раньше, что вероятность столкновения на пути dx может быть записана в терминах длины свободного пробега l как dx/l. Сравнивая это с (43.10), можно связать длину свободного пробега с эффективным сечением столкновения:
(43.11)
Это равенство легче запомнить, если записать его так:
(43.12)
Эта формула говорит, что если частица проходит путь l внутрь рассеивателя, в котором молекулы могут как раз покрыть всю площадь, то в среднем происходит одно столкновение. В цилиндре высотой l, поставленном на основание единичной площади, содержится n0l рассеивателей; если каждый из них занимает площадь σс, то полная площадь, покрытая ими, равна n0lσc, а это как раз единичая площадь. Конечно, молекулы не покрывают всей площади целиком, потому что часть молекул прячется за соседние молекулы. Поэтому некоторые молекулы пройдут между столкновениями большее, чем l, расстояние. Ведь это только в среднем молекулам между столкновениями дается ровно столько времени, чтобы они смогли пройти расстояние l. Измеряя длину свободного пробега l, можно определить эффективное сечение рассеяния σc и сравнить этот результат с расчетами, основанными на детальной теории строения атомов. Но это уже совсем другая тема! А пока вернемся к проблеме неравновесных состояний.
§ 3. Скорость дрейфа
Мы хотим описать поведение одной или нескольких молекул, которые чем-то отличаются от огромного большинства остальных молекул газа. Будем называть «большинство» молекул молекулами «фона», а отличающиеся от них молекулы получат название «особых» молекул, или (для краткости) S-молекул. Молекула может быть особой по целому ряду причин: она может быть, скажем, тяжелее молекул фона. Может она отличаться от них также химическим составом. А, может быть, особые молекулы несут электрический заряд — тогда это будет ион на фоне нейтральных молекул. Из-за необычности масс или зарядов на S-молекулы действуют силы, отличающиеся от сил между молекулами фона. Изучая поведение S-молекул, можно понять основные эффекты, которые вступают в игру во многих разнообразных явлениях. Перечислим некоторые из них: диффузия газов, электрический ток в батарее, осаждение, разделение при помощи центрифуги и т. д.
Начнем с изучения основного процесса: на S-молекулу в газе из молекул фона действуют какая-то особая сила F (это может быть сила тяжести или электрическая сила) и, кроме того, более обычные силы, обусловленные столкновениями с молекулами фона. Нас интересует общий характер поведения S-молекулы. Детальное описание ее поведения — это непрерывные стремительные удары и следующие одно за другим столкновения с другими молекулами. Но если проследить внимательно, то станет ясно, что молекула неуклонно движется по направлению силы F. Мы говорим, что дрейф накладывается на беспорядочное движение. Но нам хотелось бы знать, как зависит скорость дрейфа от силы F.
Если в какой-то произвольный момент времени начать наблюдать за S-молекулой, то можно надеяться, что попали мы как раз где-то между двумя столкновениями. Это время молекула употребит на то, чтобы в дополнение к скорости, оставшейся у нее после всех столкновений, увеличить составляющую скорости вдоль силы F. Немного погодя (в среднем через время τ) она снова испытает столкновение и начнет двигаться по новому отрезку своей траектории. Стартовая скорость, конечно, будет другой, а ускорение от силы F останется неизменным.
Чтобы упростить сейчас дело, предположим, что после каждого столкновения наша S-молекула выходит на совершенно «свободный» старт. Это значит, что у нее не осталось никаких воспоминаний о прежних ускорениях под действием силы F. Такое предположение было бы разумным, если бы наша S-молекула была намного легче молекул фона, но это, конечно, не так. Позднее мы обсудим более разумное предположение.
А пока предположим, что все направления скорости S-молекулы после каждого столкновения равновероятны. Стартовая скорость имеет любое направление и не может дать никакого вклада в результирующее движение, поэтому мы не будем принимать во внимание начальную скорость после каждого столкновения. Но, кроме случайного движения, каждая S-молекула в любой момент имеет дополнительную скорость в направлении силы F, которая увеличивается со времени последнего столкновения. Чему равно среднее значение этой части скорости? Оно равно произведению ускорения F/m (где m — масса S-молекулы) на среднее время, прошедшее с момента последнего столкновения. Но среднее время, протекшее после последнего столкновения, должно быть равно среднему времени перед следующим столкновением, которое мы уже обозначили буквой τ. Средняя скорость, порождаемая силой F,— это как раз скорость дрейфа; таким образом, мы пришли к соотношению
(43.13)
Это наше основное соотношение, главное во всей главе. При нахождении τ могут появиться всякого рода усложнения, но основной процесс определяется уравнением (43.13).
Обратите внимание, что скорость дрейфа пропорциональна силе. К сожалению, о названии для постоянной пропорциональности еще не договорились. Коэффициент перед силой каждого сорта имеет свое название. В задачах, связанных с электричеством, силу можно представить как произведение заряда на электрическое поле: F=qE; в этом случае постоянную пропорциональности между скоростью и электрическим полем Е называют «подвижностью». Несмотря на возможные недоразумения, мы будем применять термин подвижность для отношения скорости дрейфа к силе любого сорта. Будем писать
(43.14)
и называть μ подвижностью. Из уравнения (43.13) следует
(43.15)
Подвижность пропорциональна среднему времени между столкновениями (редкие столкновения слабо тормозят S-молекулу) и обратно пропорциональна массе (чем больше инерция, тем медленнее набирается скорость между столкновениями).
Чтобы получить правильный численный коэффициент в уравнении (43.13) (а у нас он верен), нужна известная осторожность. Во избежание недоразумений нужно помнить, что мы используем коварные аргументы, и употреблять их можно только после осторожного и детального изучения. Чтобы показать, какие бывают трудности, хотя по виду вроде все благополучно, мы снова вернемся к тем аргументам, которые привели к выводу уравнения (43.13), но эти аргументы, которые выглядят вполне убедительно, приведут теперь к неверному результату (к сожалению, такого рода рассуждения можно найти во многих учебниках!).
Можно рассуждать так: среднее время между столкновениями равно τ. После столкновения частица, начав двигаться со случайной скоростью, набирает перед следующим столкновением дополнительную скорость, которая равна произведению времени на ускорение. Поскольку до следующего столкновения пройдет время τ, то частица наберет скорость (F/m)τ. В момент столкновения эта скорость равна нулю. Поэтому средняя скорость между двумя столкновениями равна половине окончательной скорости, а средняя скорость дрейфа равна 1/2Fτ/m. (Неверно!) Этот вывод неверен, а уравнение (43.13) правильно, хотя, казалось бы, в обоих случаях мы рассуждали одинаково убедительно. Во второй результат вкралась довольно коварная ошибка: при его выводе мы фактически предположили, что все столкновения отстоят друг от друга на время τ. На самом деле некоторые из них наступают раньше, а другие позже этого времени. Более короткие времена встречаются чаще, но их вклад в скорость дрейфа невелик, потому что слишком мала в этом случае вероятность «реального подталкивания вперед». Если принять во внимание существование распределения свободного времени между столкновениями, то мы увидим, что множителю 1/2, полученному во втором случае, неоткуда взяться. Ошибка произошла из-за того, что мы, обманувшись простотой аргументов, попытались слишком просто связать среднюю скорость со средней конечной скоростью. Связь между ними не столь уж проста, поэтому лучше подчеркнуть, что нам нужна средняя скорость сама по себе. В первом случае мы с самого начала искали среднюю скорость и нашли ее верное значение! Быть может, теперь вам понятно, почему мы не пытались найти точного значения всех численных коэффициентов в наших элементарных уравнениях?
Вернемся к нашему предположению о том, что каждое столкновение полностью стирает из памяти молекулы все о былом ее движении и что после каждого столкновения для молекулы начинается новый старт. Предположим, что наша S-молекула — это тяжелый объект на фоне более легких молекул. Тогда уже недостаточно одного столкновения, чтобы отобрать у S-молекулы ее направленный «вперед» импульс. Только несколько последовательных столкновений вносят в ее движение «беспорядок». Итак, вместо нашего первоначального рассуждения предположим теперь, что после каждого столкновения (в среднем через время τ) S-молекула теряет определенную часть своего импульса. Мы не будем исследовать детально, к чему приведет такое предположение. Ясно, что это эквивалентно замене времени τ (среднего времени между столкновениями) другим, более длинным τ, соответствующим среднему «времени забывания», т. е. среднему времени, за которое S-молекула забудет о том, что у нее когда-то был импульс, направленный вперед. Если понимать τ так, то можно использовать нашу формулу (43.15) для случаев, не столь простых, как первоначальный.
§ 4. Ионная проводимость
Применим наши результаты к частному случаю. Предположим, что в сосуде, заполненном газом, содержатся также ионы — атомы или молекулы с избыточным электрическим зарядом. Схематически это выглядит так, как на фиг. 43.2.
Фиг. 43.2. Электрический ток в ионизованном газе.
Если две противоположные стенки сосуда сделаны из металлических пластин, то их можно подсоединить к полюсам батареи и создать таким образом в газе электрическое поле.
Электрическое поле будет с некоторой силой воздействовать на ионы, и они начнут свой дрейф к одной из пластин. В результате возникнет электрический ток, и газ со своими ионами будет работать как сопротивление. Выразив через скорость дрейфа ионный поток, можно рассчитать величину сопротивления. Больше всего нас интересует зависимость ионного потока от приложенной к пластинам разности потенциалов V.
В нашем случае сосуд — это прямоугольный ящик, длина которого b, а площадь поперечного сечения А (см. фиг. 43.2). Если к пластинам приложена разность потенциалов V, то электрическое поле Е между пластинами равно V/b. (Электрический потенциал — это работа, совершаемая при переносе единичного заряда от одной пластины к другой. Сила, действующая на единичный заряд, равна Е. Если значение Е одинаково всюду между пластинами, что можно с достаточным основанием предположить в нашем случае, то затраченная на единичный заряд работа равна Eb, т. е. V=Eb.) В нашем случае на ионы действует сила qЕ, где q — заряд иона. Скорость дрейфа иона равна произведению силы на μ:
(43.16)
Электрический ток I равен потоку заряда за 1 сек. Электрический ток через одну из пластин равен, таким образом, полному заряду ионов, достигающих пластины за 1 сек. Если ионы движутся к пластине со скоростью vдр, то за время Т пластины достигнут те ионы, которые находились не дальше, чем на расстоянии vдрT от нее. Если в единичном объеме содержится ni ионов, то за время Т на пластине высадится niAvдрT ионов.
Каждый ион несет заряд q, поэтому
(43.17)
Ток I — это отношение собранного за время Т заряда к времени Т:
(43.18)
Подставляя сюда скорость дрейфа vдр из (43.16), получаем
(43.19)
Мы выяснили, что ток пропорционален разности потенциалов, это и есть закон Ома, а сопротивление R равно обратной постоянной пропорциональности:
(43.20)
Мы нашли связь сопротивления со свойствами молекул niq и μ, которое в свою очередь зависит от τ и m. Если мы при помощи атомных измерений определим ni и q, то, измеряя R, можно определить μ, а потом и τ.
§ 5. Молекулярная диффузия
Перейдем к другой задаче, для которой нам придется несколько изменить метод анализа, — к задаче о диффузии. Предположим, что мы взяли ящик, заполненный газом, находящимся в тепловом равновесии, а потом в любое место внутри ящика вспрыснули небольшое количество другого газа. Назовем первоначальный газ газом «фона», а новый газ — «особым» газом. Особый газ начинает распространяться по всему ящику, но распространение это замедляется наличием молекул фона. Явление такого замедленного распространения называется диффузией. Диффузия в основном определяется столкновениями молекул особого газа с молекулами фона. После многих столкновений особые молекулы более или менее равномерно распределятся по всему ящику. Важно не спутать диффузию газа с переносом больших количеств вещества в результате конвекционных токов. Обычно смешение двух газов происходит именно в результате комбинации конвекции и диффузии. Сейчас нас интересует только такое перемешивание, которое не сопровождается «порывами ветра». Газ распространяется только благодаря молекулярному движению, т. е. происходит диффузия. Давайте выясним, быстро ли происходит диффузия.
Итак, мы приступаем к вычислению общего потока молекул особого газа, порождаемого молекулярным движением. Общий поток не равен нулю только тогда, когда распределение молекул отличается от равновесного, иначе усреднение молекулярного движения сводит общий поток к нулю. Рассмотрим сначала поток в направлении оси х. Чтобы определить, чему этот поток равен, мы должны вообразить площадку, перпендикулярную к оси, и подсчитать число молекул, пересекающих эту площадку. Чтобы определить общий поток, мы должны считать положительными те молекулы, которые движутся в направлении положительных x, и вычесть из этого числа те молекулы, которые движутся в противоположном направлении. Как мы неоднократно убеждались, число молекул, пересекающих площадку в течение времени ΔT, равно числу молекул, находящихся к началу интервала ΔT внутри объема, заключенного между нашей площадкой и площадкой, расположенной от нее на расстоянии vΔT. (Заметим, что здесь v — настоящая скорость молекулы, а отнюдь не скорость дрейфа.)
Мы упростим наши выкладки, если возьмем площадку единичной площади. Тогда число особых молекул, пересекающих площадку слева направо (справа от площадки лежат положительные x-направления), равно n-vΔT, где n- — число особых молекул в единичном объеме слева от площадки (с точностью до множителя ~1/6, но мы такими множителями пренебрежем!). Аналогично, число особых молекул, движущихся справа налево, равно n+vΔT, где n+ — плотность особых молекул справа от площадки. Если мы обозначим молекулярный поток буквой J, под которой мы будем понимать общий поток молекул через единичную площадку за единицу времени, то получим
(43.21)
или
(43.22)
А что понимать под n- и n+? Когда мы говорим «плотность слева от площадки», то как далеко налево? Мы должны измерить плотность в том месте, откуда молекула отправляется в свой «свободный полет», потому что число стартующих молекул определяется числом молекул, находящихся в этом месте. Таким образом, n- — это плотность молекул на расстоянии длины свободного пробега l слева от нашей воображаемой площадки, а n+ — плотность молекул на расстоянии длины свободного пробега справа от нее.
Распределение особых молекул в ящике удобно описывать с помощью непрерывной функции x, y и z, которую мы обозначим na. Под na(x, y, z) нужно понимать плотность особых молекул в маленьком объеме вокруг точки (x, y, z). Тогда разность (n+-n-) можно представить в виде
(43.23)
Подставляя этот результат в (43.22) и пренебрегая множителем 2, получаем
(43.24)
Мы выяснили, что поток особых молекул пропорционален производной плотности, или, как иногда говорят, «градиенту плотности».
Ясно, что мы сделали несколько грубых приближений. Не говоря уже о том, что мы постоянно забывали о множителях, мы использовали v, когда нужно было ставить vx, а разместив объемы, содержащие молекулы n+ и n-, на концах перпендикуляров к площадке, взяли перпендикуляры длиной l. Между тем для тех молекул, которые движутся не перпендикулярно к поверхности, l соответствует длине наклонного пути. Можно исправить эти недоделки; более тщательный анализ показал бы, что правую часть уравнения (43.24) нужно умножить на 1/3. Итак, более правильный ответ выглядит следующим образом:
(43.25)
Аналогичные уравнения можно написать для токов вдоль y- и z-направлений.
С помощью макроскопических наблюдений можно измерить ток Jx и градиент плотности dna/dx. Их отношение, найденное экспериментально, называется «коэффициентом диффузии» D. Это значит, что
(43.26)
Мы смогли показать, что ожидаемое значение коэффициента D для газа равно
(43.27)
Пока мы изучили в этой главе два разных процесса: подвижность (дрейф молекул под действием «внешней» силы) и диффузию (разбегание молекул, определяемое только внутренними силами, случайными столкновениями). Однако эти процессы связаны друг с другом, потому что в основе обоих явлений лежит тепловое движение, и оба раза в расчетах появлялась длина свободного пробега l.
Если в уравнение (43.25) подставить l=vτ и τ=μm, то получится
(43.28)
Ho mv2 зависит только от температуры. Мы еще помним, что
(43.29)
так что
(43.30)
Таким образом, D, коэффициент диффузии, равен произведению kT на μ, коэффициент подвижности:
(43.31)
Оказывается, что (43.31) — это точное соотношение между коэффициентами. Хотя мы исходили из очень грубых предположений, не нужно к нему добавлять никаких дополнительных множителей. Можно показать, что (43.31) в самом деле всегда удовлетворяется точно. Это верно даже в очень сложных случаях (например, для случая взвешенных в жидкости мелких частиц), когда наши простые вычисления явно отказываются служить.
Чтобы показать, что (43.31) верно в самых общих случаях, мы выведем его иначе, используя только основные принципы статистической механики. Представьте себе, что почему-то существует градиент «особых» молекул и возник ток диффузии, пропорциональный, согласно (43.26), градиенту плотности. Тогда мы создадим в направлении оси х силовое поле так, что на каждую особую молекулу будет действовать сила F. По определению подвижности μ скорость дрейфа дается соотношением
(43.32)
Используя обычные аргументы, можно найти ток дрейфа (общее число молекул, пересекающих единичную площадку за единицу времени):
(43.33)
или
(43.34)
А теперь можно так распорядиться силой F, что ток дрейфа, вызываемый силой F, скомпенсирует диффузию, тогда полный ток особых молекул будет равен нулю. В этом случае мы имеем Jx+Jдр=0, или
(43.35)
В этом случае «компенсации» существует постоянный (во времени) градиент плотности, равный
(43.36)
Теперь уже легко соображать дальше! Ведь мы добились равновесия и можем теперь применять наши равновесные законы статистической механики. По этим законам вероятность найти молекулу около точки х пропорциональна ехр(-U/kT), где U — потенциальная энергия. Если говорить о плотности молекул nа, то это значит:
(43.37)
Дифференцируя (43.37) по х, получаем
(43.38)
или
(43.39)
В нашем случае сила F направлена вдоль оси х и потенциальная энергия U равна -Fx, а -dU/dx=F. Уравнение (43.39) принимает вид
(43.40)
[Это в точности уравнение (40.2), из которого мы и вывели ехр(-U/kT); круг замкнулся.] Сравнивая (43.40) и (43.36), мы получаем уравнение (43.31). Мы показали, что в уравнении (43.31), которое выражает ток диффузии через подвижность, все коэффициенты правильны, а само уравнение правильно всегда. Подвижность и диффузия тесно связаны. Эту связь открыл Эйнштейн.
§ 6. Теплопроводность
Методы кинетической теории, которую мы так успешно применяли, позволяют также рассчитать и теплопроводность газа. Если газ в верхней части ящика горячее, чем внизу, то тепло перетечет сверху вниз. (Мы предполагаем, что теплее верхняя часть ящика, потому что в противном случае возникнут поднимающиеся вверх конвекционные токи, а этот случай уже не имеет отношения к теплопроводности.) Перенос тепла от горячего газа к холодному вызывается диффузией «горячих» молекул (т. е. молекул с большой энергией) вниз и диффузией «холодных» молекул вверх. Чтобы вычислить поток тепловой энергии, мы должны узнать сначала об энергии, переносимой через выделенную площадку сверху вниз (ее переносят движущиеся вниз молекулы), потом об энергии, переносимой через эту же площадку снизу вверх (за это уже отвечают молекулы, поднимающиеся вверх). Разность этих потоков энергии даст нам полный поток энергии сверху вниз.
Теплопроводность ϰ определяется как отношение скорости переноса тепловой энергии через единичную площадку к градиенту температуры:
(43.41)
Поскольку ход вычислений теплопроводности очень похож на вычисление потока заряженных частиц в ионизованном газе, то мы предлагаем читателю в виде упражнения доказать, что
(43.42)
при этом (γ-1)kT —средняя энергия молекулы при температуре Т.
Если вспомнить о соотношении nlσc=1, то теплопроводность можно записать в виде
(43.43)
Мы получили поистине удивительный результат. Известно, что средняя скорость молекул газа зависит от температуры и не зависит от плотности. Можно думать, что σс зависит только от размеров молекул. Таким образом, наш очень простой вывод сводится к тому, что теплопроводность ϰ (а следовательно, и скорость потока тепла в каждом частном случае) не зависит от плотности газа! Изменение числа «носителей» энергии при изменениях плотности в точности компенсируется изменением расстояния, которое пробегает «носитель» между столкновениями.
А теперь можно спросить: Действительно ли поток тепла всегда не зависит от плотности газа? Ну а если плотность стремится к нулю и в ящике совсем не остается газа? Конечно, нет! Формула (43.43), как и другие формулы этой главы, выведена в предположении, что средняя длина свободного пробега между столкновениями гораздо меньше любых размеров ящика. Если плотность газа столь мала, что молекула имеет неплохие шансы пробежаться от одной стенки ящика к другой, ни разу не столкнувшись, то все вычисления этой главы рухнут. В этих случаях следует вернуться к кинетической теории и заново все детально рассчитать.
Глава 44 ЗАКОНЫ ТЕРМОДИНАМИКИ
§ 1. Тепловые машины; первый закон
До сих пор мы рассматривали свойства вещества с атомной точки зрения, причем мы пытались, хотя бы в общих чертах, понять, что произойдет, если принять, что вещество состоит из атомов, подчиняющихся тем или иным законам. Однако вещество обладает и такими свойствами, которые можно понять, не изучая подробно его строения. Поисками соотношений между различными свойствами вещества, не углубляясь в изучение внутреннего его строения, занимается термодинамика. Исторически термодинамика стала наукой еще до того, как более или менее точно узнали о внутреннем строении вещества.
Приведем пример: согласно кинетической теории, давление газа вызывается молекулярной бомбардировкой, и нам известно, что при нагревании газа бомбардировка усиливается и давление должно повыситься. И наоборот, если внутрь ящика с газом вдвигается поршень, преодолевающий сопротивление бомбардирующих его молекул, то энергия этих молекул возрастает, а соответственно повышается и температура. Итак, повышая температуру внутри заданного объема, мы увеличиваем давление. Если же мы сжимаем газ, то повышается его температура. Используя кинетическую теорию, можно найти количественные соотношения между этими двумя эффектами, однако каждому понятно, что между давлением и температурой обязательно должна существовать некоторая связь, не зависящая от деталей столкновений.
Рассмотрим еще один пример. Многим, наверное, известно интересное свойство резины — если растянуть ее, она нагреется. Если вы зажмете губами резиновую полоску и, потянув рукой, растянете ее, то отчетливо почувствуете, что она нагрелась. Это нагревание обратимо, т. е. если вы, продолжая держать полоску губами, быстро отпустите ее, то возникнет столь же отчетливое ощущение холода. Это означает, что при растяжении резина нагревается, а при ослаблении натяжения она охлаждается. Наш инстинкт может нам подсказать, что нагретая резина тянет лучше: если растяжение нагревает резину, то нагревание заставит ее сжаться. Действительно, если поднести к растягиваемой грузиком резиновой полоске газовую горелку, то мы заметим, что полоска резко сократится (фиг. 44.1).
Фиг. 44.1. Нагретая резина.
Таким образом, при нагревании натяжение в резине возрастет, и это вполне согласуется с тем, что при уменьшении натяжения она остывает.
Скрытые в резине механизмы, управляющие этими эффектами, очень сложны. Мы опишем их с молекулярной точки зрения, хотя главная задача этой главы — научиться понимать связь между такими эффектами независимо от молекулярной модели. Тем не менее, именно исходя из молекулярной модели, мы можем показать, что оба эти явления тесно связаны. Поведение резины можно объяснить так. Представьте себе, что резина, по существу, огромный клубок, состоящий из очень длинных молекул, что-то вроде «молекулярных макарон», но с небольшим дополнительным усложнением: между этими молекулярными цепочками имеются соединительные цепочки. Таким образом, моделью куска резины могут служить слипшиеся во время варки макароны, образующие огромный ком. Когда мы растягиваем такой клубок, некоторые молекулярные цепи стремятся вытянуться в линию вдоль направления растяжения. В то же время все цепи участвуют в тепловом движении и непрерывно сталкиваются друг с другом. Поэтому такая цепь, когда ее растягивают, не остается в натянутом виде, так как об нее ударяют со всех сторон другие цепи и другие молекулы, и она будет вынуждена запутаться снова. Поэтому истинная причина того, почему резина все время стремится сократиться, заключается в следующем: при растяжении цепи действительно вытягиваются вдоль одной линии, но тепловые движения цепей стремятся запутать их снова и сократить их длину. Поэтому если растянуть цепи и увеличить температуру, то усилится и бомбардировка цепей, что приведет к увеличению натяжения. Этим объясняется способность нагретой резины поднять более тяжелый груз. Если растянутую в течение некоторого времени резину отпустить, то каждая цепь становится мягче, ударяющиеся о расслабленные цепи молекулы теряют энергию, и температура падает.
Итак, мы видели, как кинетическая теория устанавливает связь между сокращением при нагревании и остыванием при расслаблении, но было бы чересчур сложно пытаться вывести методами кинетической теории точные соотношения между этими эффектами. Нам пришлось бы для этого выяснить, сколько столкновений происходит ежесекундно и как выглядят молекулярные цепи. И вообще всех трудностей просто не перечислить. Детали механизма столь сложны, что кинетическая теория не в состоянии описать в точности все происходящее. Однако можно вывести некоторые соотношения между этими эффектами, практически ничего не зная о внутреннем механизме!
Вся термодинамика сводится примерно к таким рассуждениям: раз резина при высокой температуре «сильнее», чем при низкой, то с помощью тепла можно совершать самые разнообразные работы, скажем подымать грузы и передвигать их на новое место. И действительно, мы уже убедились, что нагретая резина способна поднимать тяжести. С изучения возможности использования тепла для совершения работы и начинается термодинамика. Можно ли построить машину, в которой используются тепловые свойства резины? Да, только выглядеть она будет глуповато. Для этого можно немного усовершенствовать велосипедное колесо, вставив туда резиновые спицы (фиг. 44.2).
Фиг. 44.2. Тепловая машина с резиновыми спицами.
Если с помощью двух ламп накаливания нагреть резину на одной стороне колеса, то она станет «сильнее», чем ненагретая резина на другой стороне. Центр тяжести колеса сдвинется и отойдет от точки опоры. Колесо повернется. После поворота холодные резиновые спицы пододвинутся поближе к теплу, а нагретые уступят им свое теплое место и остынут. И колесо будет медленно вращаться, пока будут гореть лампы. Коэффициент полезного действия такой машины чрезвычайно мал. Для вращения колеса едва хватает содержащейся в двух лампах мощности около 400 вт, а способно оно поднять лишь блоху! Однако тут же возникает интересный вопрос: нельзя ли более эффективно перевести тепло в работу?
Собственно говоря, термодинамика ведет свое начало с работ знаменитого инженера Сади Карно, который желал построить наилучшую и наиболее экономичную машину. Это один из немногих замечательных случаев, когда инженер заложил основы физической теории. На память приходит еще один пример, но уже сравнительно недавний — это анализ теории информации, сделанный Клодом Шенноном. Кстати, эти вопросы тесно связаны.
В паровой машине тепло используется для кипячения воды. Образующийся пар, расширяясь, толкает поршень, а поршень крутит маховик. Итак, пар вытолкнул поршень до отказа — что дальше? Эта порция пара свою работу выполнила, однако самое неразумное было бы закончить цикл выпуском пара в атмосферу, тогда к паровому котлу придется вновь подводить воду. Дешевле, а значит, и эффективнее отводить пар в другой сосуд, где он будет конденсироваться холодной водой, и образующуюся при этом воду можно будет снова вернуть в паровой котел, обеспечив непрерывную циркуляцию. Таким образом, паровая машина поглощает тепло и превращает его в работу. А может быть, лучше залить котел спиртом? Какими свойствами должно обладать вещество, чтобы обеспечить наилучшую работу машины? Этот вопрос задавал себе Карно и, размышляя таким образом, как мы уже сказали, попутно открыл соотношение очень общего типа.
Все результаты термодинамики содержатся в нескольких предельно простых утверждениях, называемых законами термодинамики. Во времена Карно первый закон термодинамики — закон сохранения энергии —был еще не известен. Однако аргументы были сформулированы Карно так точно, что они оказались правильными, хотя первый закон тогда не был еще открыт! Немного позже Клаузиус привел более простой вывод, который понять оказалось легче, чем очень тонкие рассуждения Карно. Но Клаузиус исходил из предположения, что сохраняется не полная энергия, а теплота; так считала в то время калорическая теория, которая впоследствии была вообще отвергнута как неверная. Поэтому часто говорят, что аргументы Карно были ложными. На самом же деле логика Карно безукоризненна. Неверно только упрощенное толкование этих аргументов Клаузиусом, а именно с ним все обычно знакомятся.
Так случилось, что так называемый второй закон термодинамики был открыт Карно раньше первого закона! Было бы очень интересно привести здесь аргументы Карно, не опирающиеся на первый закон. Но придется отказаться от этого, потому что мы изучаем физику, а не историю. С самого начала будем пользоваться первым законом, хотя многое можно было бы сделать и без него.
Сначала сформулируем первый закон, закон сохранения энергии: если нам дана система и мы подводим к ней тепло и производим над ней какую-то работу, то приращение энергии системы равно подведенному теплу и затраченной работе. Мы запишем все это так: к системе подводится тепло Q и над ней производится работа W, тогда энергия системы U возрастает; эту энергию иногда называют внутренней энергией. Связаны эти величины следующим соотношением:
(44.1)
Изменение U можно получить, добавляя небольшое количество тепла ΔQ и небольшую работу ΔW:
(44.2)
Это — дифференциальная форма того же закона. Все это мы уже хорошо знаем из предыдущей главы.
§ 2. Второй закон
А что такое второй закон термодинамики? Мы знаем, что если при работе приходится преодолевать трение, то потерянная работа равна выделившемуся теплу. Если мы преодолеваем трение в комнате при температуре Т и делаем это достаточно медленно, то температура в комнате изменится ненамного. Мы превращаем работу в тепло при постоянной температуре. Ну, а можно ли поступить наоборот? Сумеем ли мы каким-то способом превратить тепло в работу при постоянной температуре? Второй закон термодинамики утверждает, что это невозможно. Было бы очень хорошо научиться превращать тепло в работу, изменив лишь направление процесса, похожего на трение. Если исходить только из закона сохранения энергии, можно считать, что тепловая энергия, например колебательная энергия молекул, способна служить удобным источником полезной энергии. Но Карно утверждал, что при постоянной температуре тепловую энергию нельзя извлечь из ее источника. Иначе говоря, если бы весь мир имел повсюду одинаковую температуру, то оказалось бы невозможным превратить тепловую энергию в работу. Хотя процессы, при которых работа переходит в тепло, могут идти при постоянной температуре, невозможно обратить их и вернуть работу обратно. Если говорить точно, Карно утверждал, что при постоянной температуре нельзя извлечь тепло из его источника и превратить в работу, не производя больше никаких изменений в заданной нам системе или в окружающем пространстве.
Последняя фаза очень важна. Предположим, что в запаянном контейнере находится сжатый воздух при постоянной температуре; мы позволили ему расшириться. Такое устройство может совершать работу; оно может привести в движение пневматический молоток. При расширении, например, воздух чуть-чуть охлаждается, но если в нашем распоряжении очень большое море, огромный тепловой резервуар, то мы снова сможем нагреть его. Итак, мы взяли из моря (резервуара) тепло и произвели работу при помощи сжатого воздуха. Однако Карно не ошибся. Ведь мы не сумели оставить все в системе без изменения. Чтобы сжать снова воздух, которому мы позволили расшириться, нам понадобится произвести дополнительную работу. Покончив с этим, мы обнаружим, что не только не смогли заставить систему работать при заданной температуре Т, но еще и сами вложили некую работу. Мы должны говорить только о таких случаях, когда полный результат всего процесса сводится к изъятию тепла и превращению его в работу, точно так же, как при преодолении трения конечный результат есть превращение работы в тепло. Если процесс сводится к движению по окружности, то систему можно вернуть точно в исходное положение, но конечным результатом этого процесса будет переход в тепло затраченной на преодоление трения работы. А можно ли обратить этот процесс? Повернуть, скажем, какую-нибудь ручку, чтобы все повернулось вспять, трение производило полезную работу, а моря остыли? Карно сказал, что этого не может быть. Давайте и мы предположим, что это невозможно.
Если бы это стало вдруг возможным, то это означало бы, что, помимо многих других полезных вещей, мы смогли бы, например, без всяких затрат отнять тепло у холодного тела и отдать его горячему. Между тем каждый знает, что тепло переходит от горячего тела к холодному.
Если мы просто приложим нагретое тело к холодному и больше ничего делать не будем, то, насколько известно, горячее тело никогда не станет горячее, а холодное — холоднее! Но если бы мы смогли произвести работу, отобрав тепло, скажем, у океана или от чего-нибудь еще, не изменив его температуры, то эту работу можно было бы, призвав на помощь трение, снова превратить в тепло, но уже при другой температуре. Например, второе плечо нашей воображаемой машины может тереться обо что-то, что и так уже нагрелось. Полный результат процесса в этом случае сводится к охлаждению «холодного» тела, в нашем случае океана, и нагреванию горячих трущихся частей машины. Гипотезу Карно, второй закон термодинамики, иногда формулируют так: тепло не может перетечь само собой от холодного тела к горячему. Но мы только что убедились в эквивалентности этих утверждений. Повторим их снова. Первое: нельзя осуществить процесс, единственным результатом которого является превращение тепла в работу при постоянной температуре. Второе: тепло не может перетечь само собой от холодного тела к горячему. Мы будем чаще пользоваться первой формулировкой.
Анализ работы тепловой машины, проделанный Карно, весьма похож на то, что мы делали в гл. 4 (вып. 1), когда изучали подъемные машины и рассуждали о законе сохранения энергии. Более того, приведенные там аргументы подсказаны аргументами Карно о работе тепловых машин. Поэтому некоторые рассуждения в этой главе покажутся вам уже знакомыми.
Предположим, что «котел» построенной нами тепловой машины поддерживается при температуре Т1. За счет отнятого у котла тепла Q1 пар совершил работу W и выделил в «конденсоре» тепло Q2 [температура конденсора равна Т2 (фиг. 44.3)].
Фиг. 44.3. Схема тепловой машины.
Карно не уточнил, чему равно это тепло, потому что не знал первого закона и не предполагал, что Q2 равно Q1 потому что не верил этому. Многие считали, что Q1 и Q2 одинаковы, так предписывала калорическая теория. Но Карно этого не предполагал, в этом одна из тонкостей его аргументов. Если же использовать первый закон, то мы найдем, что выделенное тепло Q2 равно теплу Q1 за вычетом совершенной работы:
(44.3)
(Если бы наш процесс был циклическим и сконденсированная вода поступала бы снова в котел, то после каждого цикла при заданном количестве участвующей в цикле воды поглощалось бы тепло Q1 и производилась бы работа W.)
А теперь построим другую машину и посмотрим, не сможем ли мы совершить большую работу при том же количестве тепла, выделяемого при температуре T1. В конденсоре будет поддерживаться та же температура Т2. Мы используем то же тепло Q1 из котла и попытаемся совершать большую работу, чем та, которая была произведена старой паровой машиной. Для этого, быть может, придется использовать другую жидкость, скажем спирт.
§ 3. Обратимые машины
Давайте разберемся в наших машинах получше. Одно из свойств всех машин нам уже известно. Если в машине есть трение, то неизбежны потери энергии. Наилучшей машиной была бы машина вообще без трения. Предположим, что мы имеем дело с теми же идеальными машинами, что и при изучении закона сохранения энергии, т. е. машинами, которым совсем не надо преодолевать трения.
А теперь обсудим аналог движения без трения — «лишенный трения» перенос тепла. Если мы приложим горячее тело к телу, обладающему более низкой температурой, то возникнет тепловой поток. Тепло течет от горячего тела к холодному, и, чтобы повернуть поток вспять, нужно слегка изменить температуру какого-нибудь одного тела. Но машина, лишенная трения, будет под действием сколь угодно малой силы послушно двигаться туда, куда ей приказывают, а когда сила будет действовать в другую сторону, охотно последует за ней. Аналогом машины без трения может служить устройство, в котором бесконечно малые изменения температуры могут повернуть тепловой поток вспять. Если разность температур конечна, то это невозможно. Но если тепло течет между двумя телами практически при одинаковой температуре и достаточно бесконечно малого изменения температуры, чтобы поток повернул в любом направлении, то поток считается обратимым (фиг. 44.4).
Фиг. 44.4. Обратимый перенос тепла.
Если нагреть слегка левую половину тела, тепло потечет вправо; если чуть-чуть охладить левую половину, тепло устремится влево. Итак, оказалось, что идеальной машиной является так называемая обратимая машина, в которой любой процесс обратим в том смысле, что малейшие изменения условий работы могут заставить машину работать в обратном направлении. Это означает, что машина не должна ни в каком месте иметь трения; в такой машине не должно быть также места, где тепло резервуара или пар котла прямо соприкасались бы с какими-то более холодными или более горячими частями.
Займемся идеальной машиной, в которой обратимы все процессы. Чтобы показать, что создание такой машины в принципе возможно, мы просто приведем пример рабочего цикла, причем нас не интересует возможность его практической реализации, достаточно того, что с точки зрения Карно он обратим.
Предположим, что в цилиндре, оборудованном поршнем без трения, имеется газ. Это не обязательно идеальный газ. Содержимое цилиндра вообще не обязано быть газом. Но для определенности будем считать, что в цилиндре идеальный газ. Предположим еще, что имеются две тепловые подушки Т1 и Т2— два очень больших тела, поддерживаемых при определенных температурах T1 и Т2 (фиг. 44.5).
Фиг. 44.5. Шаги цикла Карно. а — шаг 1. Изотермическое расширения при T1, поглощается тепло Q1; 6 — шаг 2. Адиабатическое расширение; температура падает от T1, до Т2; в —шаг 3. Изотермическое сжатие при Т2; выделяется тепло Q2; г —шаг 4. Адиабатическое сжатие; температура поднимается от Т2, до T1.
Будем считать, что Т1 больше Т2. Для начала нагреем газ и, положив цилиндр на подушку T1, позволим газу расшириться. Пусть по мере притока тепла в газ поршень очень медленно выдвигается из цилиндра. Тогда можно поручиться, что температура газа не будет сильно отклоняться от Т1. Если выдернуть поршень очень быстро, температура в цилиндре может упасть значительно ниже Т1 и процесс уже нельзя будет считать полностью обратимым. Если же мы будем медленно вытаскивать поршень, температура газа останется близкой к температуре Т1. С другой стороны, если поршень медленно вдвигать обратно в цилиндр, температура станет лишь чуть-чуть повыше температуры Т1 и тепло потечет вспять. Вы видите, что такое изотермическое (при постоянной температуре) расширение может быть обратимым процессом, если только производить его медленно и осторожно.
Чтобы лучше понять, что происходит, нарисуем кривую зависимости давления газа от его объема (фиг. 44.6).
Фиг. 44.6. Цикл Карно.
Когда газ расширяется, его давление падает. Кривая 1 показывает, как изменяются объем и давление, если в цилиндре поддерживается постоянная температура Т1. Для идеального газа эта кривая описывается уравнением PV=NkT1. Во время изотермического расширения по мере увеличения объема давление падает, пока мы не остановимся в точке b. За это время газ заберет из резервуара тепло Q1; ведь мы уже знаем, что если бы газ расширялся, не соприкасаясь с резервуаром, он бы остыл. Итак, мы закончили расширение в точке b. Давайте теперь снимем цилиндр с резервуара и продолжим расширение. Но теперь теплу уже неоткуда взяться. И снова мы медленно выдвигаем поршень, так что нет причины, почему бы процесс мог быть необратимым. Конечно, мы опять предполагаем, что трения нет. Газ продолжает расширяться, и температура падает, потому что связь с источниками тепла прервана.
Будем расширять газ так, чтобы расширение описывалось кривой 2 до тех пор, пока мы не достигнем точки с, где температура упадет до T2. Такое расширение без притока тепла называется адиабатическим. Мы уже знаем, что в случае идеального газа кривая 2 имеет вид PVγ=const, где γ — постоянная, большая единицы; поэтому адиабатическая кривая падает круче изотермической. Если температура газа в цилиндре достигла Т2, то, положив цилиндр на вторую тепловую подушку, мы не рискуем вызвать температурных изменений.
Теперь можно медленно сжать газ, продвигаясь по кривой 3, причем цилиндр соприкасается с резервуаром при температуре T2 (см. фиг. 44.5, шаг 2). Поскольку цилиндр соприкасается с резервуаром, его температура не может повыситься, но газу придется отдать резервуару тепло Q2 при температуре T2. Продвинувшись по кривой 3 до точки d, мы снова снимем цилиндр с тепловой подушки при температуре Т2 и продолжаем сжимать газ. На этот раз мы не станем отбирать у газа тепло. При этом поднимется температура, а давление пойдет по кривой 4. Если мы тщательно проделаем все этапы, то вернемся к исходной точке а при температуре Т1 и можем повторить цикл.
По этой диаграмме судя, газ совершил полный цикл, отняв за это время тепло Q1 при температуре T1 и отдав тепло Q2 при температуре T2. Этот цикл обратим, и поэтому мы можем шаг за шагом проделать весь путь в обратном направлении. Мы могли бы пойти назад, а не вперед, могли бы начать движение из точки а при температуре T1, двигаться по кривой 4, затем поглотить тепло Q2 при температуре T2 (для этого надо все время выдвигать поршень) и т. д., пока цикл не будет завершен. Если мы совершали цикл в одном направлении, то заставили газ работать, если же нам захотелось повернуть назад, то придется поработать самим.
Между прочим, легко сосчитать полную работу. Полная работа, совершаемая при расширении, равна произведению давления на изменение объема: ∫PdV. На нашей диаграмме мы откладывали Р вертикально, а V горизонтально. Если обозначать вертикальное расстояние буквой у, а горизонтальное буквой х, то мы получим интеграл ∫ydx, а это — площадь под кривой. Таким образом, площадь под каждой из пронумерованных кривых измеряет работу, совершенную либо газом, либо нами за соответствующий этап цикла. Легко понять, что чистый выход работы равен площади внутри кривых.
Раз уж мы привели пример одной обратимой машины, то можно предположить, что возможно существование и других таких же устройств. Пусть обратимая машина А забирает Q1 при T1 совершает работу W и возвращает какое-то количество тепла при температуре Т2. Предположим, что у нас есть еще одна машина В — творение рук человека, уже сконструированная, а может быть, еще и не изобретенная. Можно взять паровую машину, колесо с резиновыми спицами — словом, что угодно. Мы даже не интересуемся, обратима ли эта машина. Важно только, чтобы она забирала тепло Q1 при температуре Т1 и возвращала часть этого тепла при более низкой температуре Т2. Предположим, что машина В совершает некую работу W'. Теперь покажем, что W' не может быть больше W; нет такой машины, которая работала бы лучше, чем обратимая. Но почему? Предположим, что W' больше W. Тогда мы можем забрать тепло Q1 при температуре Т1 и отдать его машине В. Эта машина совершит работу W' и отдаст какое-то количество тепла (неважно какое) резервуару с температурой Т2. После этого мы можем распорядиться какой-то частью работы W', которую мы считаем больше W. Прибережем пока часть работы W, а остаток W'-W употребим с пользой для себя (фиг. 44.7).
Фиг. 44.7. Машина В заставляет работать обратимую машину А в обратном направлении.
Обладая работой W, можно запустить машину А в обратном направлении, ведь это — обратимая машина. При этом она поглотит какое-то количество тепла из резервуара с температурой Т2, но зато вернет тепло Q1 резервуару при температуре Т1. Каков чистый результат этого двойного цикла? Мы вернули все к исходному состоянию и совершили дополнительную работу W'-W. Дело свелось к тому, что мы извлекли энергию из резервуара с температурой Т2! Тепло Q1, взятое из резервуара с температурой T1, было аккуратно возвращено. Раз это тепло все равно возвращается, то в качестве резервуара с температурой Т1 можно взять что-нибудь поменьше океана и заключить это устройство внутрь составной машины А+В. Чистым результатом цикла такой машины будет изъятие из резервуара при температуре Т2 тепла W'-W и превращение его в работу. Но извлечение полезной работы из резервуара при неизменной температуре без других изменений запрещается постулатом Карно. Этого нельзя сделать. Таким образом, не существует таких машин, которые извлекли бы некоторое количество тепла из резервуара при температуре Т1, возвратили бы какую-то его часть при температуре Т2 и совершили большую работу, чем обратимая машина, работающая при тех же самых температурных условиях.
Предположим теперь, что машина В тоже обратима. Тогда, конечно, не только W' не больше W, но и W не больше W'. Чтобы доказать это, надо просто обратить предыдущие аргументы. Итак, если обе машины обратимы, то они должны производить одинаковую работу, и мы пришли к блестящему выводу Карно: если машина обратима, то безразлично, как она умудряется превращать тепло в работу. Произведенная машиной работа, если только машина поглощает определенное количество тепла при температуре Т1 и возвращает какую-то его часть при температуре Т2, не зависит от устройства машины. Так уж устроен мир, и от частных свойств машины это не зависит.
Если бы мы нашли закон, определяющий работу, совершаемую при изъятии тепла Q1 при температуре Т1 и возвращении части этого тепла при температуре T2, то эта величина была бы универсальной постоянной, не зависящей от свойств вещества. Конечно, если нам известны свойства какого-нибудь вещества, мы можем вычислить интересующую нас величину. После этого мы будем вправе заявить, что все остальные вещества, если с их помощью построить обратимую машину, произведут точно такую же работу. Такова основная идея, ключ, с помощью которого мы можем найти последующие соотношения. Например, мы хотим узнать, насколько резина сжимается при нагревании и насколько она остывает, когда мы позволяем ей сжаться. Предположим, что мы взяли резину в качестве рабочего вещества обратимой машины и совершили обратимый цикл. Чистый результат, полная произведенная работа,— это универсальная функция, великая функция, не зависящая от свойств вещества. Таким образом, мы убеждаемся, что есть нечто, ограничивающее в известном роде разнообразие свойств вещества. Мы не можем сделать эти свойства какими захотим, не можем изобрести вещество, которое, будучи использованным в тепловой машине, произвело бы за обратимый цикл работу больше допустимой. Этот принцип, это ограничение,— единственное реальное правило, которое можно вывести из термодинамики.
§ 4. Коэффициент полезного действия идеальной машины
А сейчас попробуем найти закон, определяющий работу W как функцию Q1, Т1 и Т2. Ясно, что W пропорционально Q1, ибо если две обратимые машины работают в параллель, то такая сдвоенная машина тоже будет обратимой машиной. Если каждая из этих машин поглощает тепло Q1, то обе сразу поглощают 2Q1, а работа, которую они совершают, равна 2W и т. д. Поэтому пропорциональность W затраченному теплу Q1 вполне естественна.
После этого сделаем еще один важный шаг к универсальному закону. В качестве рабочего вещества машины можно взять одно вещество с хорошо известными нам свойствами. Воспользуемся этим и выберем идеальный газ. Можно и не делать этого, а вывести интересующее нас правило чисто логически, совсем не используя для этого какого-то вещества. Это одно из самых блестящих теоретических доказательств в физике, но пока мы используем менее абстрактный и более простой метод прямого вычисления.
Нам нужно лишь получить формулы для Q1 и Q2 (ведь W=Q1-Q2) — тепла, которым машина обменивается с резервуарами во время изотермического расширения и сжатия. Для примера вычислим Q1— тепло, полученное от резервуара при температуре T1 во время изотермического расширения (кривая 1 на фиг. 44.6) от точки а, где давление равно pa, объем Va, температура Т1, до точки b, где давление равно рb, объем Vb, а температура та же самая T1. Энергия каждой молекулы идеального газа зависит только от температуры, а поскольку в точках а и b одинаковы и температура, и число молекул, то и внутренняя энергия тоже одинакова. Энергия U не изменяется; полная работа газа в период расширения
совершается за счет энергии Q1, полученной из резервуара. Во время расширения pV=NkT1 или
значит,
(44.4)
т. е.
Вот то тепло, которое взято из резервуара при температуре Т1. Точно так же можно вычислить и тепло, отданное при сжатии (кривая 3 на фиг. 44.6) резервуару при температуре T2:
(44.5)
Чтобы закончить анализ, нужно еще найти соотношение между Vc/Vd и Vb/Va. Для этого взглянем сначала на кривую 2, которая описывает адиабатическое расширение от b до c. В это время pVγ остается постоянным. Поскольку pV=NkT, то формулу для адиабатического расширения в конечных точках пути можно записать в виде (pV)Vγ-1=const, или TVγ-1=const, т. е.
(44.6)
Так как кривая 4 описывает адиабатическое сжатие от d до а, то
(44.6а)
Если поделить эти равенства одно на другое, то мы выясним, что отношения Vb/Va и Vc/Vd равны, поэтому равны и логарифмы в (44.4) и (44.5). Значит,
(44.7)
Это и есть то соотношение, которое мы искали. Хотя оно доказано для машины с идеальным газом, мы уже знаем, что оно справедливо для любой обратимой машины.
А теперь посмотрим, как можно вывести этот универсальный закон на основании только логических аргументов, не интересуясь частными свойствами веществ. Предположим, что у нас есть три машины и три температуры Т1, Т2 и Т3. Одна машина поглощает тепло Q1 при температуре T1, производит работу W13 и отдает тепло Q3 при температуре T3 (фиг. 44.8).
Фиг. 44.8. Спаренные машины 1 и 2 эквивалентны машине 3.
Другая машина работает при перепаде температур T2 и Т3. Предположим, что эта машина устроена так, что она поглощает то же тепло Q3 при температуре Т3 и отдает тепло Q2. Тогда нам придется затратить работу W32, ведь мы заставили машину работать в обратном направлении. Цикл первой машины заключается в поглощении тепла Q1 и выделении тепла Q3 при температуре Т3. Вторая машина в это время забирает из резервуара то же самое тепло Q3 при температуре T3 и отдает его в резервуар с температурой Т2. Таким образом, чистый результат цикла этих спаренных машин состоит в изъятии тепла Q1 при температуре Т1 и выделении тепла Q2 при температуре T2. Эти машины эквивалентны третьей, которая поглощает тепло Q1 при температуре Т1, совершает работу W12 и выделяет тепло Q2 при температуре Т2. Действительно, исходя из первого закона, можно сразу же показать, что W12=W13-W32:
(44.8)
Теперь можно получить закон, связывающий коэффициенты полезного действия машин. Ведь ясно, что между эффективностями машин, работающих при перепаде температур Т2-T3, T2-Т3 и Т1-Т2, должны существовать определенные соотношения.
Сформулируем пояснее наши аргументы. Мы убедились, что всегда можем связать тепло, поглощенное при температуре T1 и тепло, выделенное при температуре T2, определив тепло, выделенное при какой-то другой температуре T3. Это значит, что мы можем описать все свойства машины, если введем стандартную температуру и будем анализировать все процессы с помощью именно такой стандартной температуры. Иначе говоря, если мы знаем коэффициент полезного действия машины, работающей между температурой Т и какой-то стандартной температурой, то сможем вычислить коэффициент полезного действия машины, работающей при любом перепаде температур. Ведь мы рассматриваем только обратимые машины, поэтому ничто не мешает нам спуститься от начальной температуры к стандартной, а потом снова вернуться к конечной температуре. Примем температуру в один градус за стандартную. Для обозначения выделяемого при стандартной температуре тепла используем особый символ QS. Это значит, что если машина поглощает при температуре Т тепло Q, то при температуре в один градус она выделяет тепло QS. Если какая-то машина, поглощая тепло Q1 при T1, выделяет тепло QS при температуре в один градус, а другая машина, поглотив тепло Q2 при Т2, выделяет то же самое тепло QS при температуре в один градус, то машина, поглощающая Q1 при Т1, должна при температуре Т2 выделять тепло Q2. Мы уже доказали это, рассмотрев три машины, работающие при трех температурах. Таким образом, для полного описания работы машин нам остается узнать совсем немного. Мы должны выяснить, сколько тепла Q1 должна поглотить машина при температуре T1, чтобы выделить при единичной температуре тепло QS. Конечно, между теплом Q и температурой Т существует зависимость. Легко понять, что тепло должно возрастать при возрастании температуры, ведь мы знаем, что если заставить работать машину в обратном направлении, то при более высокой температуре она отдает тепло. Легко также понять, что тепло Q1 должно быть пропорционально QS. Таким образом, наш великий закон выглядит примерно так: Каждому количеству тепла QS, выделенного при температуре в один градус, соответствует количество тепла, поглощенного машиной при температуре Т, равное QS, умноженному на некоторую возрастающую функцию Q температуры:
(44.9)
§ 5. Термодинамическая температура
Пока мы не будем делать попыток выразить эту возрастающую функцию в терминах делений знакомого нам ртутного градусника, а взамен определим новую температурную шкалу. Когда-то «температура» определялась столь же произвольно. Мерой температуры служили метки, нанесенные на равных расстояниях на стенках трубочки, в которой при нагревании расширялась вода. Потом решили измерить температуру ртутным термометром и обнаружили, что градусные расстояния уже не одинаковы. Сейчас мы можем дать определение температуры, не зависящее от каких-либо частных свойств вещества. Для этого мы используем функцию f(T), которая не зависит ни от одного устройства, потому что эффективность обратимых машин не зависит от их рабочего вещества. Поскольку найденная нами функция возрастает с температурой, то мы можем считать, что она сама по себе измеряет температуру, начиная со стандартной температуры в один градус. Для этого надо только договориться, что
(44.10)
а
(44.11)
Это означает, что теперь мы можем найти температуру тела, определив количество тепла, которое поглощается обратимой машиной, работающей в интервале между температурой тела и температурой в один градус (фиг. 44.9)
Фиг. 44.9. Абсолютная термодинамическая температура.
Если машина забирает из котла в семь раз больше тепла, нежели поступает в одноградусный конденсор, то температура котла равна семи градусам и т. д. Таким образом, измеряя количество тепла, поглощаемого при разных температурах, мы определяем температуру. Полученная таким образом температура называется абсолютной термодинамической температурой и не зависит от свойств вещества. Теперь мы будем пользоваться исключительно этим определением температуры[33].
Теперь нам ясно, что если у нас имеются две машины, из коих одна работает при перепаде температур Т1 и один градус, а другая — T2 и один градус, и обе они выделяют при единичной температуре одинаковое количество тепла, то поглощаемое ими тепло должно удовлетворять соотношению
(44.12)
Но это означает, что если какая-нибудь обратимая машина поглощает тепло Q1 при температуре Т1, а выделяет тепло Q2 при температуре Т2, то отношение Q1 к T1 равно отношению Q2 к T2. Это справедливо для любой обратимой машины. Все, что будет дальше, содержится в этом соотношении: это центр термодинамической науки.
Но если это все, что есть в термодинамике, то почему же ее считают такой трудной наукой? А попробуйте описать поведение какого-нибудь вещества, если вам даже заранее известно, что масса вещества все время постоянна. В этом случае состояние вещества в любой момент времени определяется его температурой и объемом. Если известны температура и объем вещества, а также зависимость давления от объема и температуры, то можно узнать и внутреннюю энергию. Но кто-нибудь скажет: «А я хочу поступить иначе. Дайте мне температуру и давление и я скажу вам, каков объем. Я могу считать объем функцией температуры и давления и искать зависимость внутренней энергии именно от этих переменных». Трудности термодинамики связаны именно с тем, что каждый может подойти к задаче с того конца, с какого вздумает. Нужно только сесть и выбрать определенные переменные, а потом уж твердо стоять на своем, и все станет легко и просто.
Сейчас приступим к выводам. В механике мы подошли ко всем нужным нам результатам, исходя из центра механического мира F=ma. Такую же роль в термодинамике сыграет только что найденный нами принцип. Но какие выводы можно сделать, исходя из этого принципа?
Ну начнем. Сначала скомбинируем закон сохранения энергии и закон, связывающий Q1 и Q2, чтобы найти коэффициент полезного действия обратимой машины. Первый закон говорит, что W=Q1-Q2. Согласно нашему новому принципу,
Поэтому работа равна
(44.13)
Это соотношение характеризует эффективность машины, т. е. количество работы, произведенное при заданной затрате тепла. Коэффициент полезного действия пропорционален перепаду температур, при котором работает машина, деленному на более высокую температуру:
(44.14)
Коэффициент полезного действия не может быть больше единицы, а абсолютная температура не может быть меньше нуля, абсолютного нуля. Таким образом, раз T2 должна быть положительной, то коэффициент полезного действия всегда меньше единицы. Это наш первый вывод.
§ 6. Энтропия
Уравнение (44.7) или (44.12) может быть истолковано особо. При работе обратимых машин Q1/T1=Q2/T2, и тепло Q1 при температуре Т1 «эквивалентно» теплу Q2 при температуре T2; ведь если поглощается Q1, то всегда выделяется тепло Q2. Если теперь придумать для Q/T особое название, то можно сказать, что при обратимых процессах поглощается столько же Q/T, сколько и выделяется. Иначе говоря, Q/T не убывает и не прибывает. Эта величина Q/T называется энтропией, и мы говорим, что «за обратимый цикл изменение энтропии равно нулю». Если T=1°, то энтропия равна Q/1°; мы уже снабдили энтропию особым символом S=QS/1°. Энтропия повсюду обозначается буквой S, а численно она равна теплу (которое мы обозначили буквой QS), выделяемому в одноградусном резервуаре (энтропия не равна просто теплу, это тепло, деленное на температуру, и измеряется она в джоулях на градус).
Интересно, что, кроме давления, которое зависит от температуры и объема, и внутренней энергии (функции все тех же объема и температуры), мы нашли еще величину — энтропию вещества, которая тоже является функцией состояния. Постараемся объяснить, как вычислять энтропию и что мы понимаем под словами «функция состояния». Проследим за поведением системы в разных условиях. Мы уже умеем создавать разные условия экспериментально, например можно заставить систему расширяться адиабатически или изотермически. (Между прочим, машина не обязательно должна иметь только два резервуара, может быть и три, и четыре различные температуры, и машина будет обмениваться теплом с каждым из резервуаров.) Мы можем прогуляться по всей диаграмме pV, переходя от одного состояния к другому. Иначе говоря, можно перевести газ из состояния а в какое-нибудь другое состояние b и потребовать, чтобы переход из а в b был обратимым. Теперь предположим, что вдоль пути из а в b поставлены маленькие резервуары с разными температурами. Тогда каждый короткий шажок будет сопровождаться изъятием из вещества тепла dQ и передачей его в резервуар при температуре, соответствующей данной точке пути. Давайте свяжем все эти резервуары с помощью обратимых тепловых машин с одним резервуаром единичной температуры. После того как мы закончим перевод вещества из состояния а в состояние b, мы вернем все резервуары в их первоначальное состояние. Обратимая машина вернет каждую дольку тепла dQ, изъятого из вещества при температуре Т, и каждый раз при единичной температуре будет выделяться энтропия dS, равная
(44.15)
Подсчитаем полное количество выделенной энтропии. Разность энтропии, или энтропия, нужная для перехода из а в b в результате какого-нибудь обратимого изменения, это — полная энтропия, т. е. энтропия, взятая из маленьких резервуаров и выделенная при единичной температуре:
(44.16)
Вопрос заключается в том, зависит ли разность энтропии от пути в плоскости pV? Из а в b ведет много дорог. Вспомним, что в цикле Карно мы могли перейти из точки а в точку с (см. фиг. 44.6) двумя способами. Можно было расширить газ сначала изотермически, а потом адиабатически, а можно было начать с адиабатического расширения и окончить изотермическим. Итак, мы должны выяснить, меняется ли энтропия при изменении пути из а в b (фиг. 44.10).
Фиг. 44.10. Изменение энтропии при обратимом переходе.
Она не должна измениться, потому что если мы совершим полный цикл, выйдя из а в b по одному пути и возвратясь по другому, то это путешествие будет эквивалентно полному циклу обратимой машины. При таком цикле никакого тепла не передается одноградусному резервуару.
Поскольку мы не имеем права взять тепло из одноградусного резервуара, то при каждом путешествии из а в b приходится обходиться одним и тем же количеством энтропии. Это количество не зависит от пути, существенны только конечные точки. Таким образом, можно говорить о некоторой функции, которую мы назвали энтропией вещества. Эта функция зависит только от состояния вещества, т. е. только от объема и температуры.
Можно найти функцию S(V,Т). Мы подсчитаем изменение энтропии при обратимых изменениях вещества, следя за теплом, выделяемым в одноградусном резервуаре. Но это изменение можно выразить еще в терминах тепла dQ, изымаемого у вещества при температуре Т:
(44.17)
Полное изменение энтропии равно разности энтропии в конечной и начальной точках пути:
(44.18)
Это выражение не определяет энтропию полностью. Пока известна лишь разность энтропии в двух разных состояниях. Определить энтропию абсолютно можно только после того, как мы сумеем вычислить энтропию одного какого-нибудь состояния.
Очень долго считалось, что абсолютная энтропия — это вообще ничего не значащее понятие. Но в конце концов Нернст высказал утверждение, названное им тепловой теоремой (иногда его называют третьим законом термодинамики). Смысл ее очень прост. Сейчас мы сообщим эту теорему, не объясняя, почему она верна. Постулат Нернста утверждает просто, что энтропия всякого тела при абсолютном нуле равна нулю. Теперь мы знаем, при каких Т и V (при T=0) энтропия равна нулю, и сможем вычислить энтропию в любой другой точке.
Чтобы проиллюстрировать эту идею, давайте вычислим энтропию идеального газа. При изотермическом (а следовательно, обратимом) расширении ∫dQ/T равен просто Q/T, потому что Т постоянная. Таким образом, согласно (44.4), изменение энтропии равно
так что S(V,T)=NklnV плюс функция одной только температуры. А как S зависит от T? Мы уже знаем, что при адиабатическом расширении теплообмена нет. Таким образом, энтропия остается постоянной, хотя объем V изменяется, заставляя изменяться Т (чтобы сохранить равенство TVγ-1=const). Ясно ли вам после этого, что
где а — постоянная, не зависящая ни от V, ни от Т? [Постоянная а называется химической постоянной. Она зависит от свойств газа, и ее можно определить экспериментально в соответствии с теоремой Нернста. Для этого надо измерить тепло, выделяемое газом при его охлаждении и конденсации до превращения его при 0° в твердое тело (гелий и при этой температуре остается жидким). Потом надо найти интеграл ∫dQ/T. Можно найти а и теоретически; для этого понадобятся постоянная Планка и квантовая механика, но в нашем курсе этого мы не будем касаться.]
Отметим некоторые свойства энтропии. Сначала вспомним, что на участке обратимого цикла между точками а и b энтропия меняется на Sb-Sa (фиг. 44.11).
Фиг. 44.11. Изменение энтропии за полный обратимый цикл. Полное изменение энтропии равно нулю.
Вспомним еще, что по мере продвижения вдоль этого пути энтропия (тепло, выделяемое при единичной температуре) возрастает в согласии с правилом dS=dQ/T, где dQ — тепло, изъятое из вещества при температуре Т.
Мы уже знаем, что после обратимого цикла полная энтропия всего, что включается в процесс, не изменяется. Ведь тепло Q1, поглощенное при T1, и тепло Q2, выделенное при Т2, вносят в энтропию равные по величине, но противоположные по знаку вклады. Поэтому чистое изменение энтропии равно нулю. Таким образом, при обратимом цикле энтропия всех участников цикла, включая резервуары, не изменяется. Это правило как будто похоже на закон сохранения энергии, но это не так. Оно применимо только к обратимым циклам. Если перейти к необратимым циклам, то закона сохранения энтропии уже не существует.
Приведем два примера. Для начала предположим, что какая-то машина с трением производит необратимую работу, выделяя тепло Q при температуре Т. Энтропия возрастет на Q/Т. Тепло Q равно затраченной работе, и когда мы производим какую-то работу с помощью трения о какой-то предмет, температура которого равна Т, то энтропия возрастает на величину W/Т.
Другой пример необратимости: если приложить друг к другу два предмета с разными температурами, скажем Т1 и Т2, то от одного предмета к другому перетечет некоторое количество тепла. Предположим, например, что мы бросили в холодную воду горячий камень. Насколько изменяется энтропия камня, если он отдает воде тепло ΔQ при температуре T1? Она уменьшается на ΔQ/T1. А как изменяется энтропия воды? Она возрастет на ΔQ/T2. Тепло, конечно, может перетечь только от более высокой температуры Т1 к более низкой Т2. Поэтому если T1 больше Т2, то ΔQ положительно. Таким образом, изменение энтропии положительно и равно разности двух дробей:
(44.19)
Итак, справедлива следующая теорема: в любом необратимом процессе энтропия всего на свете возрастает. Только обратимые процессы могут удержать энтропию на одном уровне. А поскольку абсолютно необратимых процессов не существует, то энтропия всегда понемногу растет. Обратимые процессы — это идеализированные процессы с минимальным приростом энтропии.
К сожалению, нам не придется углубиться в область термодинамики. Наша цель лишь проиллюстрировать основные идеи этой науки и объяснить причины, по которым возможно основываться на этих аргументах. Но в нашем курсе мы не будем часто прибегать к термодинамике. Термодинамикой широко пользуются в технике и в химии. Поэтому с термодинамикой вы практически познакомитесь в курсе химии или технических наук. Ну а дублировать нет смысла, и мы ограничимся лишь некоторым обзором природы теории и не будем вдаваться в детали для специальных ее применений.
Два закона термодинамики часто формулируют так:
Первый закон: Энергия Вселенной всегда постоянна.
Второй закон: Энтропия Вселенной всегда возрастает.
Это не слишком хорошая формулировка второго закона. В ней ничего не говорится, например, о том, что энтропия не изменяется после обратимого цикла и не уточняется само понятие энтропии. Просто это легко запоминаемая форма обоих законов, но из нее нелегко понять, о чем собственно идет речь.
Все законы, о которых сейчас шла речь, мы собрали в табл. 44.1. А в следующей главе мы используем эту сводку законов, чтобы найти соотношение между теплом, выделяемым резиной при растяжении, и дополнительным натяжением резины при ее нагревании.
Таблица 44.1 ЗАКОНЫ ТЕРМОДИНАМИКИ
Глава 45 ПРИМЕРЫ ИЗ ТЕРМОДИНАМИКИ
§ 1. Внутренняя энергия
Когда приходится использовать термодинамику для дела, то оказывается, что она очень трудный и сложный предмет. В этой книге, однако, мы не будем залезать в самые дебри. Эта область особенно интересна для химиков и инженеров, и тем, кому захочется получше познакомиться с ней, следует обратиться к физической химии или инженерной термодинамике. Есть еще ряд хороших справочных книг, в которых эта тема обсуждается более подробно.
Термодинамика сложна потому, что каждое явление она позволяет описывать многими способами. Если нам нужно описать поведение газа, то мы можем исходить из того, что его давление зависит от температуры и объема, а можно предположить, что объем зависит от давления и температуры. То же самое и с внутренней энергией U: можно сказать, что она определяется температурой и объемом, стоит только выбрать именно эти переменные, но можно говорить о зависимости от температуры и давления или от давления и объема и т. д. В предыдущей главе мы познакомились с другой функцией температуры и объема, называемой энтропией S. И теперь ничто не помешает нам построить другие функции этих переменных. Например, функция U-TS тоже зависит от температуры и объема. Таким образом, нам приходится иметь дело с большим количеством разных величин, зависящих от разнообразных комбинаций переменных.
Чтобы упростить понимание этой главы, договоримся с самого начала выбрать в качестве независимых переменных температуру и объем. Химики используют для этого температуру и давление, потому что их легче измерять и контролировать в химических реакциях. Но мы используем повсюду в этой главе температуру и объем и изменим этому только в одном месте, чтобы посмотреть, как совершается переход к химическим переменным.
Итак, сначала рассмотрим только одну систему независимых переменных — температуру и объем. Затем нас будут интересовать только две функции этих переменных: внутренняя энергия и давление. Все другие термодинамические функции можно получить с помощью этих двух, но не обязательно это делать именно сейчас. Даже после таких ограничений термодинамика останется еще трудным предметом, но все же уже не столь невозможным для понимания!
Сначала немного займемся математикой. Если величина есть функция от двух переменных, то дифференцировать ее придется осторожнее, чем мы это делали раньше, имея дело с одной переменной. Что мы понимаем под производной давления по температуре? Изменение давления, сопровождающее изменение температуры, разумеется, зависит от того, что случилось с объемом, пока менялась температура. Прежде чем понятие производной по температуре обретет ясный смысл, надо сказать что-то определенное об изменении объема. Например, можно спросить, какова скорость изменения Р относительно Т при постоянном объеме. Тогда отношение изменений обеих этих величин, по существу, обычная производная, которой привыкли присваивать символ dP/dT. Мы обычно используем особый символ ∂P/∂T, он напоминает нам, что Р зависит, кроме Т, еще и от переменной V, и эта переменная не изменяется. Чтобы подчеркнуть тот факт, что V не изменяется, мы не только используем символ ∂, но еще пометим индексом остающуюся постоянной переменную (∂P/∂T)у. Конечно, поскольку имеются только две независимые переменные, то это обозначение излишне, но оно, быть может, поможет нам легче пройти сквозь термодинамические дебри частных производных.
Предположим, что функция f(x, у) зависит от двух независимых переменных х и у. Под символом (∂f/∂x)у мы понимаем самую обычную производную, получаемую общепринятым способом, если у постоянна:
Аналогично определяется и
Например, если f(x, у)=х2+ух, то (∂f/∂x)y=2x+y, а (∂f∂y)x=х. Мы можем распространить это на старшие производные: ∂2f/∂y2 или ∂2f/∂y∂x. Последний случай означает, что сначала f продифференцировано по х, считая у постоянным, а затем результат продифференцирован по у, но теперь постоянным стало х. Порядок дифференцирования не имеет значения: ∂2f/∂x∂y=∂2f/∂y∂x.
Нам придется подсчитывать изменение Δf, происходящее с f(x, у), если х переходит в х+Δх, а у переходит в y+Δy. Будем предполагать, что Δx и Δy бесконечно малы:
(45.1)
Последнее уравнение и есть основное соотношение, связывающее приращение Δf с Δx и Δy.
Посмотрим, как используется это соотношение; для этого вычислим изменение внутренней энергии U(Т,V), если температура Т переходит в Т+ΔT, а объем V переходит в V+ΔV. Используем формулу (45.1) и запишем
(45.2)
В предыдущей главе мы нашли другое выражение для изменения внутренней энергии ΔU; тогда к подводимому газу прибавлялось тепло ΔQ:
(45.3)
Сравнив (45.2) и (45.3), можно было бы подумать, что P=(∂U/∂V)T, но это не так. Чтобы получить верный результат, сначала предположим, что газ получает тепло ΔQ, причем объем его не изменяется, так что ΔV=0. Если ΔV=0, то уравнение (45.3) говорит нам, что ΔU=ΔQ, а уравнение (45.2) утверждает, что ΔU=(∂U/∂T)VΔT, поэтому (∂U/∂T)V=ΔQ/ΔT. Отношение ΔQ/ΔT—количество тепла, которое нужно подвести к телу, чтобы изменить его температуру на один градус, удерживая объем постоянным,— называется удельной теплоемкостью при постоянном объеме и обозначается символом CV. Таким образом, мы показали, что
(45.4)
Теперь снова подведем к газу тепло ΔQ, но на этот раз договоримся, что температура газа останется постоянной, а объему мы позволим измениться на ΔV. В этом случае анализ сложнее, но мы можем вычислить ΔU, используя аргументы Карно, для чего нам придется снова призвать на помощь цикл Карно из предыдущей главы.
Диаграмма давление — объем для цикла Карно изображена на фиг. 45.1. Мы уже показали, что полная работа, совершаемая газом при обратимом цикле, равна ΔQ(ΔT/T), где ΔQ — тепло, подводимое к газу при температуре Т во время изотермического расширения от V до V+ΔV, а Т—ΔТ — это конечная температура, которой достигает газ при адиабатическом расширении на втором этапе цикла. Сейчас мы покажем, что эта работа равна, кроме того, заштрихованной площади на фиг. 45.1. Работа газа во всех случаях жизни равна ∫PdV; она положительна, если газ расширяется, и отрицательна, когда он сжимается. Если вычертить зависимость Р от V, то изменения Р и V изобразятся кривой, в каждой точке которой определенному значению Р соответствует определенное значение V. Работа, произведенная газом, пока его объем изменяется от одного значения до другого (интеграл ∫PdV),— это площадь под кривой, соединяющей начальное и конечное значения V. Применим эту идею к циклу Карно и убедимся, что если обойти цикл, помня о знаке совершенной газом работы, то чистая работа газа будет равна заштрихованной на фиг. 45.1 площади.
Фиг. 45.1. Диаграмма Р — V для цикла Карно. Кривые, помеченные Т и Т—ΔТ,— изотермы; крутые кривые между ними — адиабаты. Когда газ изотермически расширяется при температуре Т, он получает тепло ΔQ и увеличивает свой объем на ΔV; ΔР—изменение давления при постоянном объеме, температура в это время падает с Т до Т—ΔT.
А теперь вычислим эту площадь чисто геометрически. Цикл, который был использован для получения фиг. 45.1, отличается от цикла, описанного в предыдущей главе тем, что теперь ΔQ и ΔT бесконечно малы. Наши адиабаты и изотермы очень близки друг к другу, поэтому фигура, описанная жирными линиями на фиг. 45.1, приближается к параллелограмму, когда приращения ΔQ и ΔТ стремятся к нулю. Площадь этого параллелограмма в точности равна ΔVΔP (где ΔV — изменение объема, когда к газу подводится энергия ΔQ при постоянной температуре, а ΔР — изменение давления при изменении температуры на ΔT и постоянном объеме). Легко показать, что заштрихованная площадь на фиг. 45.1 равна площади, ограниченной пунктиром на фиг. 45.2.
Фиг. 45.2. Заштрихованная площадь=Площадь, ограниченная пунктирными линиями=Площадь прямоугольника=ΔPΔV.
А эту фигуру легко превратить в прямоугольник со сторонами ΔР и ΔV, для чего нужно лишь вырезать из нее треугольники и сложить их немного иначе.
Соберем все наши выводы вместе.
Выражение (45.5) содержит в себе суть результатов, следующих из аргументов Карно. Всю термодинамику можно вывести из (45.5) и первого закона, содержащегося в уравнении (45.3). Выражение (45.5)— это, в сущности, второй закон, хотя впервые Карно сформулировал его несколько иначе, поскольку не пользовался нашим определением температуры.
А теперь можно приступить к вычислению (∂U/∂V)T. Насколько изменится внутренняя энергия U, если объем изменится на ΔV? Во-первых, внутренняя энергия U меняется за счет подводимого тепла и, во-вторых, за счет совершаемой работы. Подводимое тепло, согласно (45.5), равно
а совершаемая над веществом работа равна —PΔV. Поэтому изменение ΔU складывается из двух кусков
(45.6)
Поделив обе стороны на ΔV, мы найдем скорость изменения U относительно V при постоянной Т
(45.7)
В нашей термодинамике, где есть только две переменные, Т и V, и только две функции, Р и U, уравнения (45.3) и (45.7) — это основные уравнения, из которых можно вывести все последующие результаты.
§ 2. Применения
Теперь обсудим смысл уравнения (45.7) и посмотрим, почему оно дает ответ на поставленные в предыдущей главе вопросы. Мы занимались рассмотрением такой задачи: в кинетической теории ясно, что рост температуры приводит к увеличению давления, потому что усиливается бомбардировка поршня атомами. Те же физические причины приводят к тому, что при выталкивании поршня от газа отбирается тепло, и чтобы удержать температуру постоянной, надо позаботиться о подводе тепла. При расширении газ остывает, а при нагревании его давление возрастает. Между этими явлениями должна существовать какая-то связь, и она полностью определяется уравнением (45.7). Если мы удерживаем объем постоянным и поднимаем температуру, давление растет со скоростью (∂P/∂T)V. Вот мы и нашли эту связь: если увеличить объем и не подвести какого-то количества тепла для поддержания температуры, то газ остынет, а величина (∂U/∂V)T подскажет нам, сколько именно надо подбавить тепла. Уравнение (45.7) выражает фундаментальную связь между этими двумя эффектами. Именно это мы обещали найти, отправляясь на поиски законов термодинамики. Не зная внутреннего строения газа и лишь веря, что построить вечный двигатель второго рода выше наших сил, мы смогли вывести соотношение между количеством тепла, необходимого для поддержания постоянной температуры при расширении газа, и изменением давления газа при нагревании!
Получив от газа все, что нужно, рассмотрим другой случай — резину. Растянув резиновую полоску, мы обнаружили, что ее температура возросла, а нагревание заставило ее сжаться. Какое уравнение дает в случае резины тот же результат, что и уравнение (45.3) для газа? Сначала все идет, как и раньше: когда к резине подводится тепло ΔQ, внутренняя энергия изменяется на ΔU и производится какая-то работа. Только теперь эта работа равна —FΔL вместо PΔV, где F — это приложенная к резине сила, а L — длина резиновой полоски. Сила F зависит от температуры и длины резиновой полоски. Заменив в (45.3) PΔV на —FΔL, получим
(45.8)
Сравнивая (45.3) и (45.8), мы убедимся, что уравнение для резины получилось сразу после замены одних букв другими. Если заменить V на L, а Р на —F, то все аргументы цикла Карно окажутся применимыми и к резине. Можно тотчас же, скажем, вывести, что нужное для растяжения на ΔL тепло ΔQ определяется уравнением, аналогичным (45.5): ΔQ=—Т(∂F/∂T)LΔL. Это уравнение говорит нам, насколько увеличится сила, если длина резиновой полоски при нагревании останется постоянной. Надо только узнать, сколько тепла требуется для поддержания постоянной температуры при небольшом растяжении полоски. Итак, мы видим, что и к резине, и к газу применимы одни и те же уравнения. Можно даже писать ΔU=ΔQ+AΔB, где А и В — самые разные величины, сила и длина, давление и объем и т. д. Если интересует поведение газа, нужно заменить A и В на Р и V.
Для примера рассмотрим разность электрических потенциалов, или электродвижущую силу (э. д. с.) батареи Е, и заряд ΔZ, прошедший через батарею. Мы знаем, что работа, производимая обратимой электрической батареей, например аккумулятором, равна EΔZ. (Поскольку мы не включили в рассмотрение член PΔV, то придется потребовать, чтобы объем оставался постоянным.) Посмотрим, что скажет о работе батареи термодинамика. Если заменить Р на Е, а V на Z, то вместо уравнения (45.6) получится
(45.9)
Это уравнение говорит нам, что при путешествии заряда ΔZ по батарее меняется внутренняя энергия U. Но почему ΔU/ΔZ — это не просто э. д. с. батареи E? Дело в том, что в реальных обстоятельствах движение зарядов внутри батареи вызывает выделение тепла. Внутренняя энергия батареи изменяется, во-первых, за счет работы, производимой батареей во внешней цепи, и, во-вторых, за счет нагревания батареи. Интересно, что вторую часть изменения внутренней энергии опять-таки можно подсчитать, следя, как меняется э. д. с. батареи при изменении температуры. Между прочим, когда заряды текут по батарее, там происходят химические реакции, и уравнение (45.9) указывает на отличный способ измерения необходимой для реакции энергии. Для этого нам нужно лишь сделать батарею, работающую на этой реакции, и сначала просто измерить э. д. с., а потом проследить, как меняется э. д. с. с температурой, если ни один заряд не выпускается из батареи!
Мы предположили, что объем батареи можно поддерживать постоянным, только поэтому мы позволили себе пренебречь членом PΔV и считать, что работа батареи равна EΔZ. Но оказывается, что поддерживать объем постоянным технически очень трудно. Гораздо легче держать батарею под постоянным атмосферным давлением. Вот почему химики не любят только что написанных нами уравнений: они предпочитают уравнения, которые были бы связаны с постоянным давлением. Мы с самого начала этой главы за независимые переменные приняли V и Т. Химикам больше нравятся Р и Т, поэтому посмотрим теперь, как преобразуются наши выводы при переходе к химической системе переменных. Постарайтесь при этом не ошибиться, потому что мы как-никак сменили детали и перешли от Т и V к Т и Р.
Начнем с (45.3), где ΔU=ΔQ-PΔV; член PΔV можно заменить на EΔZ или даже на АΔВ. Если бы нам удалось как-нибудь заменить PΔV на VΔP, тогда V и Р поменялись бы ролями и химики остались бы довольны. Тот, кто сообразителен, заметит, что дифференциал произведения PV равен d(PV)=PdV+VdP. Добавив это равенство к (45.3), он получит
Чтобы все наши последующие выводы походили на выводы из уравнения (45.3), давайте будем считать U+PV какой-то новой функцией, назовем ее энтальпией Н, и напишем в таком виде: ΔH=ΔQ+VΔP.
Вот теперь мы готовы перевести все наши рассуждения на химический язык, надо только помнить, что U→H, Р→-V, V→P. Химики считают, что вся термодинамика содержится не в уравнении (45.7), а в уравнении
Выяснив, как происходит переход к химическим переменным Т и Р, вернемся к нашим старым переменным. Теперь и уже до конца главы нашими независимыми переменными будут Т и V.
Сейчас давайте применим полученные результаты к некоторым физическим процессам. Сначала рассмотрим идеальный газ. Из кинетической теории известно, что внутренняя энергия газа зависит только от характера движения молекул и от их числа. Внутренняя энергия зависит только от Т, а к V она безразлична. Если изменять V при постоянной Т, то U не изменится. Значит, (∂U/∂V)T=0, и уравнение (45.7) говорит нам, что для идеального газа
(45.10)
Уравнение (45.10) — это дифференциальное уравнение, и оно кое-что расскажет нам о Р. Мы расправимся с частной производной так: поскольку частная производная вычислена при постоянном V, можно заменить частную производную обычной, только надо помнить, что все это делается «при постоянном V». Уравнение (45.10) тогда принимает вид
(45.11)
интегрирование не составит для нас труда, и мы получим
(45.12)
Мы знаем, что давление идеального газа равно
(45.13)
Это соотношение совместимо с (45.12), потому что R и V — постоянные. Но зачем же мы мучились, решая эти уравнения? Ведь результат-то был уже известен. Потому что мы пользовались двумя независимыми определениями температуры! Однажды мы предположили, что кинетическая энергия молекул пропорциональна температуре. Это предположение привело нас к температурной шкале, которую мы назвали шкалой идеального газа. Температура Т в уравнении (45.13) отсчитывается по газовой шкале. Мы называли отсчитанную по газовой шкале температуру кинетической температурой. Потом мы определили температуру иначе, и это определение вообще не нуждалось ни в каком веществе. Исходя из второго закона, мы определили то, что можно назвать «абсолютной термодинамической температурой» Т; она появляется в уравнении (45.12). Здесь мы только доказали, что давление идеального газа (идеальный газ для нас нечто, чья внутренняя энергия не зависит от объема) пропорционально абсолютной термодинамической температуре. Мы, кроме того, знаем, что давление пропорционально температуре, измеренной по газовой шкале. Таким образом, можно заключить, что кинетическая температура пропорциональна «абсолютной термодинамической температуре». Это, конечно, означает, что если бы мы были благоразумны, то показания обеих шкал могли бы всегда жить в согласии. В конце концов эти шкалы можно выбрать так, что они совпадут; постоянную пропорциональности можно положить равной единице. Очень долго люди сами себе создавали трудности, но наконец превратили две шкалы в одну!
§ 3. Уравнение Клаузиуса— Клайперона
Испарение жидкости — это еще одна область, в которой можно применить наши результаты. Предположим, что мы вдвигаем поршень в цилиндр с каким-то веществом.
Естественно задать себе вопрос: как зависит давление от объема, если температура остается постоянной? Иначе говоря, мы хотим начертить изотермические линии на диаграмме Р—V. Вещество в цилиндре — это далеко не идеальный газ, с которым мы имели дело; теперь это жидкость или пар, а может быть, и то и другое вместе. Если сжать вещество достаточно сильно, то оно начнет превращаться в жидкость. Если мы будем увеличивать давление, объем изменится очень мало, а наши изотермы при уменьшении объема пойдут резко вверх, как это показано в левой части фиг. 45.3.
Фиг. 45.3. Изотермы конденсирующегося пара. Пар сжимается в цилиндре. Слева — все вещество превратилось в жидкость; справа — вся жидкость испарилась; в середине — в цилиндре сосуществуют жидкость и пар.
Если увеличивать объем, выдвигая поршень из цилиндра, давление будет падать, пока мы не достигнем точки кипения жидкости и в цилиндре появится пар. Дальнейшее вытягивание поршня приведет к более сильному испарению. Когда цилиндр заполнен частично паром, а частично жидкостью, то между ними устанавливается равновесие — жидкость испаряется, пар конденсируется, и скорости этих процессов равны. Если предоставить пару больший объем, то, чтобы удержать прежнее давление, понадобится больше пара. Поэтому, хоть жидкость все испаряется, давление остается прежним. Вдоль плоской части кривой на фиг. 45.3 давление не изменяется, это давление называется давлением пара при температуре Т. Если объем все увеличивается, наступит момент, когда запасы жидкости иссякнут. В такой ситуации давление падает при увеличении объема, ведь теперь мы имеем дело с обычным газом; это изображено в правой части диаграммы Р—V. Нижняя кривая на фиг. 45.3— это изотермическая кривая при более низкой температуре Т—ΔT. Давление жидкости в этом случае немного меньше, потому что с ростом температуры жидкости расширяются (не все жидкости, вода около точки замерзания поступает наоборот), а давление пара при уменьшении температуры, конечно, падает.
Из двух изотерм можно снова построить цикл, соединив концы их плоских участков (скажем, адиабатами), как это показано на фиг. 45.4. Небольшая зазубрина в нижнем правом углу фигуры несущественна, и мы просто забудем о ней. Используем аргументы Карно, которые показывают, как связано тепло, подведенное к жидкости для превращения ее в пар, с работой, совершаемой веществом при обходе цикла. Пусть L—это тепло, необходимое для испарения жидкости в цилиндре. Вспомним, как мы рассуждали при выводе уравнения (45.5), и немедленно скажем, что L(ΔT/T) равно работе, совершенной веществом. Как и раньше, работа вещества равна площади, заключенной внутри цикла. Эта площадь приблизительно равна ΔP(VG—VL), где ΔР — разность давлений пара при температурах Т и Т—ΔT, VG — объем газа, а VL — объем жидкости. Оба объема надо измерять при давлении, равном давлению пара.
Сравнивая два выражения для работы, мы получаем L(ΔT/T)=ΔP(VG-VL), или
(45.14)
Уравнение (45.14) связывает скорость изменения давления пара с температурой и количеством тепла, необходимым для испарения жидкости. Хотя вывел его Карно, называется оно уравнением Клаузиуса — Клайперона.
Сравним уравнение (45.14) с результатом, следующим из кинетической теории. Обычно VG гораздо больше VL. Поэтому VG-VL≈VG=RT/P на моль. Если еще предположить, что L — не зависящая от температуры постоянная (хотя это не очень хорошее приближение), то мы получим ∂P/∂T=L/(RT2P). Вот решение этого дифференциального уравнения:
(45.15)
Надо выяснить, в каких отношениях находится это выражение с полученной ранее с помощью кинетической теории зависимостью давления от температуры. Кинетическая теория говорит, хотя и очень неопределенно, что число молекул пара над жидкостью примерно равно
(45.16)
где UG—UL— разность отнесенных к молю внутренних энергий газа и жидкости. Термодинамическое уравнение (45.15) и кинетическое уравнение (45.16) очень похожи, потому что давление равно nkT, но все-таки это разные уравнения. Однако их можно сделать одинаковыми, если заменить старое предположение L=const предположением о том, что L—UG=const. Если предположить, что L—UG — не зависящая от температуры постоянная, то соображения, из которых ранее следовало (45.15), приведут теперь к уравнению (45.16).
Это сравнение показывает преимущества и недостатки термодинамики по сравнению с кинетической теорией. Прежде всего полученное термодинамически уравнение (45.14) — это точное соотношение, а (45.16) — всего-навсего приближение. Ведь нам пришлось предположить, что U приблизительно постоянна и что наша модель верна. Во-вторых, нам, быть может, никогда не удастся понять до конца, как газ переходит в жидкость, и все-таки уравнение (45.14) правильно, а (45.16)— это только приближение. В-третьих, хотя мы говорили о превращении газа в жидкость, наши аргументы верны для любого перехода из одного состояния в другое. Например, переход твердое тело — жидкость описывается кривыми, очень похожими на кривые фиг. 45.3 и 45.4.
Фиг. 45.4. Диаграмма Р — V для цикла Карно с конденсирующимся в цилиндре паром. Слева — все вещество переходит в жидкость. Чтобы полностью испарить ее при температуре Т, нужно добавить тепла L. При падении температуры от Т до Т—ΔT пар расширяется адиабатически.
Вводя скрытую теплоту плавления М/моль, мы получим формулу, аналогичную уравнению (45.14): (∂Pпл/∂T)V=M/[T(VL-VS)]. Мы можем не знать ничего о кинетической теории процесса плавления, а все же получить правильное уравнение. Однако если мы узнаем кинетическую теорию, то сразу же получим большое преимущество. Уравнение (45.14) — это всего лишь дифференциальное уравнение, и мы еще совершенно не умеем находить постоянные интегрирования. В кинетической теории можно вычислить и эти постоянные, надо только придумать хорошую модель, описывающую все явление полностью. Итак, в каждой теории есть и хорошее, и плохое. Если познания наши слабы, а картина сложна, то термодинамические соотношения оказываются самым мощным средством. Когда же картина упрощается настолько, что можно ее проанализировать теоретически, то лучше сначала попробовать выжать из этого анализа как можно больше.
Еще один пример: излучение черного тела. Мы уже говорили об ящике, содержащем излучение и ничего больше, и уже толковали о равновесии между излучением и осциллятором. Мы выяснили также, что когда фотоны ударяются о стенки ящика, они создают давление Р. Мы вывели формулу PV=U/3, где U — полная энергия фотонов, а V — объем ящика. Если подставить U=3РV в основное уравнение (45.7),то обнаружится, что
(45.17)
Поскольку объем ящика не изменяется, можно заменить (∂P/∂T)V на dP/dT и получить обыкновенное дифференциальное уравнение. Оно легко интегрируется и дает lnP=4lnT+const, или Р=const·T4. Давление излучения изменяется как четвертая степень температуры, поэтому заключенная в излучении энергия U/V=P/3 тоже меняется как T4. Обычно пишут так: U/V=(4σ/с)T4, где с — скорость света, а σ— другая постоянная. Термодинамика сама по себе ничего не скажет нам об этой постоянной. Это хороший пример и ее могущества, и ее бессилия. Знать, что U/V изменяется как T4, — это уже большое дело, но узнать, чему именно равно U/V при той или иной температуре, можно, только разобравшись в деталях полной теории. У нас есть теория излучения черного тела и сейчас мы вычислим σ.
Пусть I(ω)dω — распределение интенсивности, иначе говоря, поток энергии через 1 м2 за 1 сек в интервале частот между ω и ω+dω:
поэтому
Мы уже успели узнать, что
Подставляя выражение для I(ω) в наше уравнение для U/V, получаем
Если сделать замену переменных x=ℏω/kT, то это выражение примет вид
Этот интеграл — просто-напросто какое-то число, и мы можем найти его приближенно. Для этого надо лишь вычертить подынтегральную кривую и подсчитать площадь под ней. Она приблизительно равна 6,5. Математики могут вычислить наш интеграл точно, он равен π4/15[34]. Сравнивая это выражение с записанным ранее U/V=(4σ/с)T4, мы найдем σ:
Много ли энергии утечет за 1 сек из дырки единичной площади, проделанной в стенке ящика? Чтобы найти поток энергии, умножим плотность энергии U/V на с. Еще нужно умножить на 1/4; эта четверть набегает вот по каким причинам. Во-первых, 1/2 появляется из-за того, что мы вычисляем только вырвавшуюся наружу энергию, и, во-вторых, если поток подходит к дырке не под прямым углом, то вырваться ему труднее; это уменьшение эффективности учитывается умножением на косинус угла с нормалью. Среднее значение косинуса равно 1/2. Теперь понятно, почему мы писали U/V=(4σ/c)T4: так проще выразить поток энергии сквозь маленькую дырку; если отнести поток к единичной площади, то он равен просто σT4.
Глава 46 ХРАПОВИК И СОБАЧКА
§ 1. Как действует храповик
В этой главе мы поговорим о храповике и собачке — очень простом устройстве, позволяющем оси вращаться только в одном направлении. Возможность получать одностороннее вращение заслуживает глубокого и тщательного анализа, из него проистекут интересные заключения.
Вопросы, которые мы будем обсуждать, возникают при попытке найти с молекулярной или кинетической точки зрения простое объяснение тому, что существует предел работы, которая может быть получена от тепловой машины. Правда, мы уже знаем сущность доказательства Карно, но было бы приятно найти и элементарное его объяснение — такое, которое показало бы, что так физически на самом деле происходит. Существуют, конечно, сложные, покоящиеся на законах Ньютона математические доказательства ограниченности количества работы, которое можно получить, когда тепло перетекает с одного места в другое; но очень непросто сделать эти доказательства элементарными. Короче говоря, мы не понимаем их, хотя можем проследить выкладки.
В доказательстве Карно то обстоятельство, что при переходе от одной температуры к другой нельзя извлечь неограниченное количество тепла, следует из другой аксиомы: если все происходит при одной температуре, то тепло не может быть превращено в работу посредством циклического процесса. Поэтому первым делом попытаемся понять, хотя бы на одном элементарном примере, почему верно это более простое утверждение.
Попробуем придумать такое устройство, чтобы второй закон термодинамики нарушался, т. е. чтобы работу из теплового резервуара получали, а перепада температур не было. Пусть в сосуде находится газ при некоторой температуре, а внутри имеется вертушка (фиг. 46.1), причем будем считать, что T1=T2=T.
Фиг. 46.1. Машина, состоящая из храповика и собачки.
От ударов молекул газа вертушка будет покачиваться. Нам остается лишь пристроить к другому концу оси колесико, которое может вертеться только в одну сторону,— храповичок с собачкой. Собачка пресечет попытки вертушки поворачиваться в одну сторону, а повороты в другую—разрешит. Колесико будет медленно поворачиваться; может быть, удастся даже подвесить на ниточку блошку, привязать нить к барабану, насаженному на ось, и поднять эту блошку!
Возможно ли это? По гипотезе Карно — нет. Но по первому впечатлению — очень даже возможно (если только мы верно рассудили). Видно, надо посмотреть повнимательнее. И действительно, если вдумаешься в работу храповика с собачкой, все оказывается не так просто.
Во-первых, хотя наш идеализированный храповик и предельно прост, но есть еще собачка, а при ней положено быть пружинке. Проскочив очередной зубец, собачка должна возвратиться в прежнее положение, так что без пружинки не обойтись.
Весьма существенно и другое свойство храповика и собачки (на рисунке его нельзя показать). Предположим, что части нашего устройства идеально упруги. Когда собачка пройдет через конец зубца и сработает пружинка, собачка ударится о колесико и начнет подпрыгивать. Если в это время произойдет очередная флуктуация, вертушка может повернуться и в другую сторону, так как зубец может проскользнуть под собачкой, когда та приподнята! Значит, для необратимости вертушки важно, чтобы было устройство, способное гасить прыжки собачки. Но при этом гашении энергия собачки перейдет к храповику и примет вид тепловой энергии. Выходит, что по мере вращения храповик будет все сильнее нагреваться. Для простоты пусть газ вокруг храповика уносит часть тепла. Во всяком случае, вместе с храповиком начнет нагреваться и сам газ. И что же, так будет продолжаться вечно? Нет! Собачка и храповик, сами обладая некоторой температурой Т, подвержены также и броуновскому движению. Это значит, что время от времени собачка случайно поднимается и проходит мимо зубца как раз в тот момент, когда броуновское движение вертушки пытается повернуть ее назад. И чем горячее предмет, тем чаще это бывает.
Вот отчего наш механизм не будет находиться в вечном движении. Иногда от щелчков по крыльям вертушки собачка поднимается и вертушка поворачивается. Но иногда, когда вертушка стремится повернуть назад, собачка оказывается уже приподнятой (из-за флуктуации движений этого конца оси) и храповик действительно поворачивает обратно. В итоге—чистый нуль. И совсем нетрудно показать, что, когда температура в обоих сосудах одинакова, в среднем вращения не будет. Будет, конечно, множество поворотов в ту или иную сторону, но чего мы хотим — одностороннего вращения,— тому не бывать.
Рассмотрим причину этого. Чтобы поднять собачку до верха зубца, надо проделать работу против натяжения пружинки. Назовем эту работу ε; пусть θ — угол между зубцами. Шанс, что система накопит достаточно энергии ε, чтобы поднять собачку до края зубца, есть ехр(-ε/kT). Но вероятность того, что собачка поднимется случайно, тоже есть ехр(-ε/kT). Значит, сколько раз собачка случайно поднимется, давая храповику свободно повернуться назад, столько же раз окажется достаточно энергии, чтобы при прижатой собачке вертушка повернулась вперед. Выйдет равновесие, а не вращение.
§ 2. Храповик как машина
Пойдем дальше. Рассмотрим другой пример: температура вертушки T1, а температура храповика Т2; T2 меньше Т1. Так как храповик холодный и флуктуации собачки сравнительно редки, ей теперь очень трудно раздобыть энергию ε. Но из-за того, что вертушка горячая, она часто получает энергию ε, и наше устройство начнет, как и задумано, вертеться в одну сторону.
Посмотрим-ка, удастся ли нам теперь поднимать грузы. Привяжем к барабану нить и привесим к ней грузик вроде нашей блошки. Пусть L будет момент, создаваемый грузом. Если момент L не очень велик, наша машина груз поднимет, так как из-за броуновских флуктуации повороты в одну сторону вероятнее, чем в другую. Определим, какой вес мы сможем поднять, как быстро он будет подниматься и т. д.
Сперва рассмотрим движение вперед, для которого храповик и предназначен. Сколько энергии нужно занять у вертушки, чтобы продвинуться на шаг? Чтобы поднять собачку, нужна энергия ε. Чтобы повернуть храповик на угол θ против момента L, нужна энергия Lθ. Всего нужно занять энергию ε+Lθ. Вероятность заполучить ее равна ехр[-(ε+Lθ)/kT1]. В действительности дело не только в самой этой энергии, но и в том, сколько, раз в секунду она окажется в нашем распоряжении. Вероятность в секунду только пропорциональна ехр[-(ε+Lθ)/kT1]; обозначим коэффициент пропорциональности 1/τ (он в конце выкладок выпадет). После каждого шага вперед совершенная над грузом работа есть Lθ. Энергия, взятая у вертушки, равна ε+Lθ. Энергией ε наматывается нить, затем следует: щелк, щелк, клингенкланггеклунген..., и энергия переходит в тепло. Вся одолженная энергия идет на то, чтобы поднять блошку и собачку, которая потом падает и отдает тепло другой стороне (храповику).
Рассмотрим теперь случай обратного вращения. Что происходит здесь? Чтобы храповик повернулся назад, надо лишь снабдить собачку такой энергией, чтоб ей хватило сил подняться и пропустить храповик. Эта энергия по-прежнему равна ε. Вероятность (в пересчете на секунду) того, что собачка поднимется на нужную высоту, теперь равна (1/τ)ехр(-ε/kT2). (Множитель пропорциональности тот же, но в показателе стоит kT2 из-за того, что температура иная.) Когда это случается, т. е. зубчатка проскальзывает назад, работа уже высвобождается (высвободился один зубец, а вместе с ним и работа Lθ). Энергия, взятая у системы храповик — собачка, есть ε, а энергия, переданная газу на другом конце оси при температуре T1 есть Lθ+ε. Это тоже легко понять. Положим, что собачка поднялась сама собой за счет флуктуации. Когда она упадет и пружинка ударит ее по зубцу, возникнет сила, стремящаяся повернуть зубчатку, ведь плоскость-то, о которую ударилась собачка, наклонная. Эта сила производит работу; то же можно сказать о весе грузика. Обе силы суммируются, и вся медленно высвобождаемая энергия появляется в виде тепла на той стороне, где вертушка. (Конечно, так и должно быть по закону сохранения энергии, но мы обязаны осторожно продумать все насквозь!)
Мы замечаем, что все эти энергии в точности те же, что и раньше, только переставлены. Итак, смотря по тому, какое из отношений больше, грузик либо медленно поднимается, либо медленно опускается. Конечно, на самом деле он непрерывно ходит туда-сюда, покачивается, но мы говорим об усредненном поведении.
Положим, что при определенном весе вероятности окажутся равными. Тогда привесим к нити бесконечно легкий грузик. Весь груз медленно пойдет вниз, и машина будет совершать работу, энергия будет откачиваться от храповика и пересылаться вертушке. Если же убрать часть груза, неравновесность перекинется на другую сторону. Груз поднимается, тепло отбирается от вертушки и поставляется шестерне. Мы попадаем в условия обратимого цикла Карно благодаря тому, что груз выбран как раз так, чтобы обе вероятности были равны. Это условие таково: (ε+Lθ)/T1=ε/T2. Пусть машина медленно тянет груз вверх.
Таблица 46.1 ОПЕРАТИВНАЯ СВОДКА ДЕЙСТВИЙ ХРАПОВИКА И СОБАЧКИ
Энергия Q1 отбирается от лопастей, а энергия Q2 доставляется шестерне, и эти энергии находятся в отношении (ε+Lθ)/ε. Когда мы опускаем груз, то опять Q1/Q2=(ε+Lθ)/ε. Итак (табл. 46.1), мы имеем
Далее, полученная работа относится к энергии, взятой у вертушки, как Lθ к Lθ+ε, т. е. как (T1-Т2)/Т1. Мы видим, что наше устройство, работая обратимо, ни за что не сможет высосать работы больше, чем позволяет это отношение. Это тот вывод, которого мы и ожидали на основе доказательства Карно, а одновременно и главный результат этой лекции.
Однако мы можем использовать наше устройство, чтобы понять еще кое-какие явления, даже неравновесные, лежащие вне области применимости термодинамики.
Давайте подсчитаем теперь, как быстро наш односторонний механизм будет вращаться, если все его части одинаково нагреты, а к барабану подвешен грузик. Если мы потянем чересчур сильно, могут произойти любые неприятности. Собачка соскользнет вдоль храповика, пружинка лопнет или еще что-нибудь случится. Но предположим, мы тянем так осторожно, что все работает гладко. В этих условиях верен вышеприведенный анализ вероятностей поворота храповика вперед или назад, и нужно только учесть равенство температур. С каждым скачком валик поворачивается на угол θ, так что угловая скорость равна величине θ, помноженной на вероятность одного из этих скачков в секунду. Ось поворачивается вперед с вероятностью (1/τ)ехр[-ε+Lθ)/kT], а назад она поворачивается с вероятностью (1/τ)ехр(-ε/kT). Угловая скорость равна
(46.1)
График зависимости ω от L показан на фиг. 46.2.
Фиг. 46.2. Угловая скорость храповика как функция вращательного момента.
Мы видим, что, когда L положительно, результат один, когда отрицательно — совсем другой. Если L растет, будучи положительным, что бывает, когда мы хотим повернуть храповик назад, скорость вращения назад близка к постоянной величине. А когда L становится отрицательным, ω поистине «рвется вперед», так как у ε показатель степени огромен! Таким образом, угловая скорость, вызываемая действием разных сил, весьма несимметрична. Пойти в одну сторону легко: мы получаем большую угловую скорость от маленькой силы. Идя в обратную сторону, мы можем приложить много усилий, а вал все же будет двигаться еле-еле.
Такое же положение возникает в электрическом выпрямителе. Вместо силы там имеется электрическое поле, а взамен угловой скорости — сила тока. Для выпрямителя напряжение тоже не пропорционально сопротивлению, наблюдается та же несимметричность. Анализ, проделанный нами для механического выпрямителя, годится и для электрического. Вид полученной выше формулы типичен для зависимости пропускной способности выпрямителя от напряжения.
Уберем теперь все грузики и обратимся к первоначальному механизму. Если бы Т2 было меньше Т1, храповик вертелся бы вперед. Этому поверит любой. Но вот во что трудно поверить сразу, так это в обратное. Если T2 больше T1, храповик вращается назад! Динамический храповик с избытком теплоты внутри вертится назад, потому что собачка храповика отскакивает. Если собачка в какой-то момент находится на наклонной плоскости, она толкает эту плоскость в сторону подъема. Но это происходит все время, ведь если случится, что собачка поднимется достаточно высоко, чтобы проскочить край зубца, она окажется на новой наклонной плоскости. Словом, горячие храповик с собачкой идеально приспособлены для вращения в сторону, обратную той, в какую им первоначально предназначено было вертеться!
Как бы хитроумно мы ни сконструировали «однобокий» механизм, при равенстве температур он не захочет вертеться в одну сторону чаще, чем в другую. Когда мы смотрим на него, он может поворачиваться либо туда, либо сюда, но при продолжительной работе ему никуда не уйти. Тот факт, что он не уйдет никуда, на самом деле фундаментальный, глубокий принцип; все в термодинамике покоится на нем.
§ 3. Обратимость в механике
Что же это за глубокий механический принцип, который утверждает, что при постоянстве температуры и достаточно продолжительной работе наше устройство не уйдет ни назад, ни вперед? Очевидно, мы получили фундаментальное утверждение о том, что нельзя придумать машину, которая, будучи предоставлена самой себе в течение долгого времени, охотней повернулась бы в какую-то одну определенную сторону. Попробуем выяснить, как это вытекает из законов механики.
Законы механики действуют примерно так: сила есть масса на ускорение; сила, действующая на частицу, есть сложная функция положений всех прочих частиц. Бывает, что силы зависят и от скорости, например в магнетизме, но не о них сейчас речь. Возьмем простой случай, скажем тяготение, когда силы определяются только расположением частиц. Положим, что мы решили нашу систему уравнений и получили для каждой частицы определенную траекторию x(t). Для достаточно сложных систем и решения очень сложны; с течением времени возможно появление самых невероятных конфигураций. Если мы придумаем любое, какое только нам придет в голову, расположение частиц и терпеливо подождем, то это расположение непременно наступит! Следя за решением в течение долгого времени, мы увидим, что оно как бы перепробует все, что возможно. В простейших устройствах это не обязательно, но в более или менее сложных системах с большим числом атомов такая вещь происходит.
Но решения способны и на большее. Решая уравнения движения, мы можем получить некоторую функцию, скажем t+t2+t3. Мы утверждаем, что другим решением будет -t+t2-t3. Иными словами, если всюду в решение подставить -t вместо t, то мы получим еще одно решение того же уравнения. Это произойдет оттого, что при замене t на -t в первоначальном дифференциальном уравнении ничего не изменится: в нем присутствуют лишь вторые производные по времени. Значит, если наблюдается некоторое движение, то возможно и точно противоположное движение. К нашему замешательству, может оказаться, когда мы следим за движением достаточно долго, что оно временами совершается в одну сторону, а временами — в обратную. Одно направление ничем не привлекательней другого. Поэтому невозможно сконструировать машину, для которой после длительной работы одно направление окажется более вероятным, чем другое, если только машина достаточно сложна.
Можно, правда, изобрести машину, для которой это утверждение явным образом неверно. Взять, например, колесо, закрутить его в пустом пространстве, и оно навсегда пойдет вертеться в одну сторону. Имеются поэтому некоторые условия, вроде сохранения момента вращения, из-за которых наши рассуждения нарушаются. Но это только означает, что наши доказательства надо проделать поаккуратней. Надо, например, учесть, что вращательный момент забирают себе стенки или еще что-то, так что специальные законы сохранения перестают действовать. Тогда опять, если система достаточно сложна, наше доказательство годится. Оно основано на обратимости законов механики.
Отдавая должное истории, мы хотели бы отметить устройство, изобретенное Максвеллом, впервые разработавшим динамическую теорию газов. Он нарисовал такую картину: пусть имеются два сосуда с газом при одной и той же температуре. Между сосудами имеется маленькое отверстие. Возле него сидит небольшой чертик (конечно, это может быть и прибор!). В отверстии есть дверца, чертик может ее открывать и закрывать. Он следит за молекулами, подлетающими слева. Как только он замечает быструю молекулу, он отворяет дверцу. Увидит медленную — и дверцу на замок! Можно сделать его чертиком высшей квалификации, пристроив на затылок ему еще пару глаз, чтобы с молекулами в другом сосуде он поступал наоборот: пропускал налево медленные, а быстрые не выпускал. Вскоре левый сосуд остынет, а правый нагреется. Спрашивается, будут ли нарушены идеи термодинамики существованием этакого чертика?
Оказывается, что если чертик конечного размера, то сам он вскоре так нагреется, что ничего не увидит. Простейшим чертиком явится, скажем, откидная дверца с пружинкой. Быстрой молекуле хватает сил открыть дверцу и проскочить, а медленной не хватит, и она отлетит прочь. Но это опять-таки знакомая нам система храповик — собачка, только в другом виде; в конце концов механизм просто нагреется. Чертик не может не нагреться, если его теплоемкость не бесконечна. В нем, во всяком случае, имеется конечное число шестеренок и колесиков, так что он не сможет отделаться от излишка тепла, которое приобретет, наблюдая молекулы. Вскоре он так начнет дрожать от броуновского движения, что не сможет сказать, что это там за молекулы, приближаются ли они, удаляются ли, словом, не сможет работать.
§ 4. Необратимость
Все ли законы физики обратимы? Конечно, нет! Попробуйте-ка, например, из яичницы слепить обратно яйцо! Или пустите фильм в обратную сторону — публика в зале тотчас же начнет смеяться. Необратимость — самая яркая черта всех событий.
Откуда же она появляется? Ведь ее нет в законах Ньютона. Если мы считаем, что любое явление может быть в конечном счете объяснено законами физики, и если также оказывается, что все уравнения обладают фантастическим свойством давать при t→-t другое решение, то ведь тогда обратимо любое явление. Но как же тогда получается, что в природе, в явлениях большого масштаба, все необратимо? Видимо, значит, есть какие-то законы, какие-то неизвестные нам, но важные уравнения, быть может, в электричестве, а может, в нейтринной физике, для которых уже существенно, куда идет время.
Рассмотрим теперь этот вопрос. Один закон такого рода мы уже знаем — он утверждает, что энтропия только растет. Когда одно тело теплое, а другое холодное, тепло переходит от теплого к холодному. Это утверждение нам подошло бы. Но хорошо бы и этот закон понять с точки зрения механики. Нам уже удалось получить при помощи чисто механических соображений все следствия из постулата о том, что тепло не может течь в обратную сторону; это помогло нам понять второй закон. Значит, необратимость из обратимых уравнений получать мы способны. Но использовали ли мы при этом только законы механики? Разберемся в этом глубже.
Так как речь зашла об энтропии, то нам придется найти ее микроскопическое описание. Когда мы говорим, что в чем-то (например, в газе) содержится определенное количество энергии, то мы можем обратиться к микроскопической картине этого явления и сказать, что каждый атом имеет определенную энергию. Полная энергия есть сумма энергий атомов. Равным образом, у каждого атома есть своя определенная энтропия. Суммируя, получим полную энтропию. На самом деле здесь все обстоит не так уж гладко, но все же давайте посмотрим, что получится.
В виде примера подсчитаем разницу энтропии газа при одной температуре, но в разных объемах. В гл. 44 для изменения энтропии мы получили
В нашем случае энергия газа до и после расширения одна и та же, потому что температура не менялась. Значит, чтобы восполнить работу, проделанную газом, нужно придать ему какое-то количество тепла. Для малых изменений объема
Подставив это в dQ, получим, как в гл. 44,
Например, при удвоении объема энтропия меняется на Nkln2.
Рассмотрим теперь другой интересный пример. Пусть имеется цилиндр с перегородкой посредине. По одну ее сторону — неон («черные» молекулы), а по другую — аргон («белые» молекулы). Уберем перегородку и позволим газам перемешаться. Как изменится энтропия? Можно представить себе, что вместо перегородки между газами стоит поршень с отверстиями, в которые проходят белые молекулы и не проходят черные, и другой поршень с обратными свойствами. Сдвигая поршень к основанию цилиндра, легко понять, что для каждого газа задача сводится к только что решенной. Энтропия, таким образом, меняется на Nkln2; это значит, что энтропия на одну молекулу возрастает на kln2. Цифра 2 появилась оттого, что вдвое увеличился объем, приходящийся на одну молекулу. Странное обстоятельство! В нем проявилось свойство не самой молекулы, а свободного места вокруг нее. Выходит, что энтропия увеличивается, когда температура и энергия не меняются, а изменилось только распределение молекул!
Мы знаем, что стоит убрать перегородку, и газы через некоторое время перемешаются из-за столкновений, колебаний, ударов молекул и т. д. Стоит убрать перегородку, и какая-то белая молекула начнет приближаться к черной, а черная — к белой, они проскочат мимо друг друга и т. д. Постепенно какие-то из белых молекул проникнут случайно в объем, занятый черными, а черные — в область белых. Через какое-то время получится смесь. В общем это необратимый процесс реального мира, он должен привести к росту энтропии.
Перед нами простой пример необратимого процесса, полностью состоящего из обратимых событий. Каждый раз, когда происходит столкновение двух молекул, они разлетаются в определенных направлениях. Если запустить киноленту, на которой засняты столкновения, в обратную сторону, то ничего неправильного на экране не появится. Ведь один вид столкновений столь же вероятен, как и другой. Поэтому перемешивание полностью обратимо, и тем не менее оно необратимо. Каждому известно, что, взяв отдельно белое и отдельно черное и перемешав их, мы через несколько минут получим смесь. Подождем еще сколько-то там минут — они не отделятся, смесь останется смесью. Значит, бывает необратимость, основанная на обратимых ситуациях. Но теперь нам ясна и причина. Мы начали с расположения, которое в каком-то смысле упорядочено. В хаосе столкновений оно стало неупорядоченным. Переход от упорядоченного расположения к беспорядочному является источником необратимости.
Конечно, если бы мы сняли на киноленту это движение и пустили бы потом пленку назад, то увидели бы, как постепенно устанавливается порядок. Кто-нибудь мог бы возразить: «Но это — против всех законов физики!» Тогда мы бы прокрутили фильм еще раз и просмотрели бы каждое столкновение. Все они были бы безупречны, каждое подчинялось бы законам физики. Все дело, конечно, в том, что скорости каждой молекулы были бы выдержаны в точности, так что, если проследить их пути вспять, мы возвратимся к начальным условиям. Но такая ситуация крайне маловероятна. Если иметь дело не со специально приготовленным газом, а просто с белыми и черными молекулами, их никогда не удалось бы вернуть назад.
§ 5. Порядок и энтропия
Итак, мы должны теперь потолковать о том, что понимать под беспорядком и что — под порядком. Дело не в том, что порядок приятен, а беспорядок неприятен. Наши смешанные и несмешанные газы отличаются следующим. Пусть мы разделили пространство на маленькие элементы объема. Сколькими способами можно разместить белые и черные молекулы в элементах объема так, чтобы белые оказались на одной стороне, а черные — на противоположной? И сколькими способами можно их разместить без этого ограничения? Ясно, во втором случае способов гораздо больше. Мы измеряем «беспорядок» в чем-то по числу способов, каким может быть переставлено его содержимое, лишь бы внешне все выглядело без изменения. Логарифм числа способов — это энтропия. В цилиндре с разделенными газами число способов меньше и энтропия меньше, т. е. меньше «беспорядок».
Пользуясь этим техническим определением «беспорядка», можно понять наше утверждение. Во-первых, энтропия измеряет «беспорядок». Во-вторых, Вселенная всегда переходит от «порядка» к «беспорядку», поэтому энтропия всегда растет. Порядок не есть порядок в том смысле, что именно эта расстановка молекул нам нравится; смысл в том, что число разных способов расставить молекулы (лишь бы со стороны расстановки выглядели одинаково) относительно ограничено. Когда мы крутили назад наш фильм о перемешивании газов, было не так уж много беспорядка. Каждый отдельный атом имел в точности необходимые скорость и направление, чтобы выйти куда положено! Энтропия была в общем невысока, хотя это и не было заметно.
А что можно сказать о необратимости других физических законов? Когда мы рассматривали электрическое поле ускоряемого заряда, было сказано, что мы должны брать запаздывающее поле. В момент t на расстоянии r от заряда надо брать поле, созданное ускорением в момент t-r/c, а не в момент t+r/c. Поэтому законы электричества на первый взгляд необратимы. Вместе с тем очень странно, что эти законы следуют из уравнений Максвелла, которые в действительности обратимы. Однако можно привести довод, что если бы мы пользовались только опережающим полем, полем, отвечающим положению дел в момент t+r/c, и сделали это совершенно последовательно в полностью замкнутом пространстве, то все происходило бы в точности так же, как при употреблении запаздывающих полей! Эта кажущаяся необратимость в теории электричества, таким образом (по крайней мере в замкнутой полости), вовсе не является необратимостью. Вы это должны уже слегка сами чувствовать; вы знаете уже, что когда колеблющийся заряд создает поле, отражающееся от стен оболочки, то в конечном счете устанавливается равновесие, в котором односторонности нет места. Запаздывающие поля — только прием, удобный метод решения.
Насколько нам известно, все основные законы физики, подобно уравнениям Ньютона, обратимы. Тогда откуда необратимость? Она — из-за превращения порядка в беспорядок. Но это утверждение все равно не понятно, пока мы не знаем, откуда порядок. Почему ситуации, в которых мы оказываемся ежедневно, никогда не бывают равновесными? Одно мыслимое объяснение таково. Рассмотрим снова наш цилиндр со смесью белых и черных молекул. Если следить за ним достаточно долго, может оказаться, что по чисто случайному, крайне невероятному, но все же мыслимому стечению обстоятельств белые молекулы распределятся главным образом у дна, а черные — у крышки. После этого с течением времени они опять начнут перемешиваться.
Стало быть, одно возможное объяснение высокой степени упорядоченности нынешнего мира заключается в том, что нам просто повезло. Вероятно, как-то однажды во Вселенной случилась флуктуация, все как-то разделилось, а теперь вновь возвращается к прежнему. Такая теория не несимметрична; на вопрос, как мог бы выглядеть разделенный газ немного раньше или немного позже, она ответит: в любом случае мы увидели бы серое пятно, потому что молекулы опять смешались бы. Как бы ни потекло время, вперед или назад, газ все равно перемешался бы. Таким образом, по этой теории именно необратимость является одной из случайностей жизни.
Легко показать, что это не так. Предположим, что мы смотрим не на весь цилиндр сразу, а на какую-то часть его. Пусть в какой-то момент мы открыли в этой части определенную степень порядка: белое с черным в ней разделены. Что отсюда следует для частей, которые мы еще не рассматривали? Если мы и впрямь считаем, что порядок возникает из беспорядка путем флуктуации, то мы обязаны рассмотреть самую вероятную флуктуацию из тех, которые способны в нашей части установить порядок. Но при такой наивероятнейшей флуктуации остальная часть сосуда вовсе не должна рассортироваться — совсем наоборот! Значит, из гипотезы, что мир — это флуктуация, следует, что, когда мы взглянем на часть мира, прежде нами не виденную, мы должны обнаружить в ней смесь, беспорядок, в отличие от известного нам прежде мира. Если весь наш порядок есть флуктуация, выброс, мы не смеем надеяться на порядок где-либо сверх того, где он уже обнаружен.
Теперь предположим, что разделение произошло от того, что в прошлом Вселенная была действительно упорядочена (не из-за флуктуации, а просто белое и черное были первоначально обособлены). Тогда эта теория предскажет, что в других местах тоже должен быть порядок, порядок не как случайность, а из-за того, что в прежние времена порядок был лучше. Тогда можно ожидать, что мы обнаружим в местах, которые мы еще не видели, порядок.
Астрономы, например, пока наблюдали не все звезды. Каждую ночь они наводят свои телескопы на новые звезды, и эти звезды ведут себя так же, как и старые. Из этого мы заключаем, что Вселенная — не флуктуация и что наш порядок — это память о тех временах, когда все только начиналось. Мы не говорим, что нам понятна логика этого. По каким-то причинам Вселенная когда-то имела очень малую для своего энергосодержания энтропию, и с той поры энтропия выросла. Это — путь по направлению в будущее. В этом начало всех необратимостей. Именно это порождает процессы роста и распада. Именно из-за этого мы вспоминаем не будущее, а прошлое, вспоминаем события, которые ближе к тому моменту в истории мира, когда порядок был лучше нынешнего. Именно поэтому мы не способны вспомнить события того времени, беспорядок при котором сильней теперешнего,— мы называем это время будущим.
Мы уже говорили когда-то, что в стакане вина откроется нам вся Вселенная, стоит только заглянуть в него поглубже. Стакан вина — штука достаточно сложная, есть там и влага, и стекло, и свет, и еще многое другое.
Прелесть физики еще и в том, что даже такие простые и идеализированные вещи, как храповик с собачкой, действуют лишь оттого, что и они — часть Вселенной. Храповик с собачкой работают в одну сторону только потому, что они находятся в тесном контакте с остальной Вселенной. Если бы храповик с собачкой поместить в сосуд и изолировать на некоторое время, то колесико перестанет предпочитать одно направление вращения другому. Но по той же причине, по какой мы, открывая шторы, впускаем свет, из-за чего мы идем остывать в тень и греться на солнце, по той же причине храповик с собачкой вертятся лишь в одну сторону. Односторонность связана как-то с тем, что храповик — это часть нашей Вселенной. Часть Вселенной не только в том смысле, что подчиняется законам Вселенной, но и потому, что его одностороннее поведение связано с односторонним поведением всей Вселенной. Оно не может пока быть понято до конца: наука приоткрыла великую тайну ранней истории мира, которая сейчас служит лишь предметом разных гипотез.
Глава 47 ЗВУК. ВОЛНОВОЕ УРАВНЕНИЕ
§ 1. Волны
В этой главе мы будем обсуждать новое явление — волны. О волнах часто и много говорится в физике, и мы наше внимание должны сконцентрировать на этом вопросе не только потому, что собираемся рассмотреть частный пример волн — звук,— но и потому, что волновые процессы имеют и другие многочисленные применения во всех областях физики.
Изучая гармонический осциллятор, мы уже отмечали, что существуют примеры как механических колеблющихся систем, так и электрических. Волны тесно связаны с колебательными системами, однако волновое движение есть не только колебание в данном месте, зависящее от времени, но и движение в пространстве.
Мы уже на самом деле изучали волны. Когда мы говорили о волновых свойствах света, мы обращали особое внимание на пространственную интерференцию волн одной и той же частоты от различных источников, расположенных в разных местах. Существуют еще два важных явления, о которых мы не упоминали и которые свойственны как свету, т. е. электромагнитным волнам, так и любой другой форме волнового движения. Первое из них — это явление интерференции, но уже не в пространстве, а во времени. Когда мы слушаем звуки сразу от двух источников, причем частоты их слегка отличаются, к нам приходят то гребни обеих волн, то гребень одной волны и впадина другой (фиг. 47.1).
Фиг. 47.1. Интерференция звука во времени от двух источников с несколько отличающимися частотами приводит к биениям.
Звук то усиливается, то ослабевает, возникают биения, или, другими словами, происходит интерференция во времени. Второе явление — это волновое движение в замкнутом объеме, когда волны отражаются то от одной, то от другой стенки.
Все эти эффекты можно было, конечно, рассмотреть и на примере электромагнитных волн. Мы этого не сделали по той причине, что на одном примере мы не почувствовали бы общего характера явления, свойственного самым разным процессам. Чтобы подчеркнуть общность понятия волн вне рамок электродинамики, мы рассмотрим здесь другой пример — звуковые волны.
Есть еще пример — морские волны, набегающие на берег, или мелкая водяная рябь. Кроме того, существуют два рода упругих волн в твердых телах: волны сжатия (или продольные волны), в которых частицы тела колеблются вперед и назад в направлении распространения волны (звуковые колебания в газе именно такого типа), и поперечные волны, когда частицы тела колеблются перпендикулярно направлению движения волны. При землетрясениях в результате движения участка земной коры возникают упругие волны обоих типов.
И, наконец, есть еще один тип волн, который нам дает современная физика. Это волны, определяющие амплитуду вероятности нахождения частицы в данном месте,— «волны материи», о которых мы уже говорили. Их частота пропорциональна энергии, а волновое число пропорционально импульсу. Эти волны встречаются в квантовой механике.
В этой главе мы будем рассматривать только такие волны, скорость которых не зависит от длины волны. Пример таких волн — распространение света в вакууме. Скорость света в этом случае одна и та же для радиоволн, для синего и зеленого света и вообще для света любой длины волны. Именно поэтому, когда мы описывали волновые явления, мы сначала и не заметили самого факта распространения волн. Вместо этого мы говорили, что если перенести заряд в некоторую точку, то электрическое поле на расстоянии х будет пропорционально ускорению заряда, но не в момент времени t, а в более ранний момент времени t- x/c. Поэтому распределение электрического поля в пространстве в некоторый момент времени, изображенное на фиг. 47.2, спустя время t передвинется на расстояние ct. Выражаясь математически, можно сказать, что в рассматриваемом нами одномерном случае электрическое поле есть функция от x-ct. Отсюда видно, что при t=0 оно оказывается функцией только х. Если взять более поздний момент времени и несколько увеличить х, мы получим ту же самую величину поля. Например, если максимум поля возникает при x=3 и в момент времени t=0, то положение максимума в момент времени t находится из равенства
Мы видим, что такая функция отвечает распространению волны. Итак, функция f(x-ct) описывает волну. Мы можем все сказанное записать кратко так:
если Δx=cΔt. Конечно, существует еще и другая возможность, когда источник излучает волны не направо, как указано на фиг. 47.2, а налево, так что волны будут двигаться в сторону отрицательных х.
Фиг. 47.2. Примерное распределение электрического поля в некоторый момент времени (а) и электрическое поле через промежуток времени t (b).
Тогда распространение волны описывалось бы функцией g(x+ct).
Может еще случиться, что в пространстве одновременно движется несколько волн, и тогда электрическое поле есть сумма всех полей и все они распространяются независимо. Это свойство электрических полей можно выразить так: пусть f1(x-ct) отвечает одной волне, а f2(x-ct) — другой, тогда их сумма также описывает некоторую волну. Это утверждение называется принципом суперпозиции. Он справедлив и для звуковых волн.
Мы хорошо знаем, что звуки воспринимаются в той последовательности, в какой они создаются источником. А если бы высокие частоты распространялись быстрее, чем низкие, то вместо звуков музыки мы слышали бы резкий и отрывистый шум. Точно так же если бы красный свет двигался быстрее, чем синий, то вспышка белого света выглядела бы сначала красной, затем белой и наконец синей. Мы хорошо знаем, что такого на самом деле не происходит. И звук, и свет движутся в воздухе со скоростью, почти не зависящей от частоты. Примеры волнового движения, где этот принцип не выполняется, будут рассмотрены в гл. 48.
Для света (электромагнитных волн) мы получили формулу, определяющую электрическое поле в данной точке, которое возникает при ускорении заряда. Казалось бы, нам остается теперь подобным образом определить какую-нибудь характеристику воздуха, скажем давление на заданном расстоянии от источника через движение источника, и учесть запаздывание при распространении звука.
В случае света такой подход был приемлем, так как все наши знания сводились к тому, что заряд в одном месте действует с некоторой силой на заряд в другом месте. Подробности распространения взаимодействия из одной точки в другую были абсолютно несущественны. Но звук, как известно, распространяется по воздуху от источника к уху, и естественно спросить, чему равно давление воздуха в каждый данный момент. Кроме того, хотелось бы знать, как именно движется воздух.
В случае электричества мы могли поверить в правило, поскольку законы электричества мы еще не проходили, но для звука это не так. Нам недостаточно сформулировать закон, определяющий распространение звукового давления в воздухе; этот процесс должен быть объяснен на основе законов механики. Короче, звук есть часть механики, и он должен быть объяснен с помощью законов Ньютона. Распространение звука из одной точки в другую есть просто следствие механики и свойств газов, если звук распространяется в газе, или свойств жидкостей и твердых тел, если звук проходит через эти среды. Позднее мы выведем также свойства света и его волновое движение из законов электродинамики.
§ 2. Распространение звука
Давайте выведем теперь свойства распространения звука между источником и приемником, основываясь на законах Ньютона, но не учитывая при этом взаимодействия звука с источником и приемником. Обычно мы более подробно останавливались на результате, а не на его выводе. В этой главе мы используем противоположный подход. Главным здесь будет в некотором смысле само получение результата. Метод объяснения новых явлений с помощью старых, законы которых уже известны, представляет собой, пожалуй, величайшее искусство математической физики. Математическая физика решает две проблемы: найти решение заданного уравнения и найти уравнения, описывающие новое явление. То, чем мы будем заниматься, относится как раз ко второй проблеме.
Рассмотрим простейший пример — распространение звука в одномерном пространстве. Для вывода нам сначала необходимо понять, что же в действительности происходит. В основе явления лежит следующий факт: когда тело перемещается в воздухе, возникает возмущение, которое как-то распространяется по воздуху. На вопрос, что это за возмущение, мы можем ответить: это такое движение тела, которое вызывает изменение давления. Конечно, если тело движется медленно, воздух лишь обтекает его, но нас интересует быстрое движение, когда воздух не успевает обойти вокруг тела. При этих условиях воздух в процессе движения сжимается и возникает избыточное давление, толкающее окружающие слои воздуха. Эти слои в свою очередь сжимаются, снова возникает избыточное давление, и вот начинает распространяться волна.
Опишем этот процесс на языке формул. Прежде всего решим, какие нам нужны переменные. В нашей задаче нам нужно знать, насколько переместился воздух, поэтому смещение воздуха в звуковой волне, несомненно, будет первой нашей переменной. Вдобавок хотелось бы знать, как меняется плотность воздуха при смещении. Давление воздуха тоже меняется, и это еще одна интересная переменная. Кроме того, воздух движется с некоторой скоростью, и мы должны уметь определить скорость частиц воздуха. Частицы воздуха имеют еще и ускорение, но, записав все эти переменные, мы сразу же поймем, что и скорость, и ускорение будут нам известны, если известно смещение воздуха как функция времени.
Как уже говорилось, мы рассмотрим волну в одном измерении. Так можно поступить, если мы находимся достаточно далеко от источника и так называемый фронт волны мало отличается от плоскости. На этом примере наше доказательство будет проще, поскольку можно сказать, что смещение χ зависит только от х и t, а не от у и z. Поэтому поведение воздуха описывается функцией χ(х, t).
Насколько полно такое описание? Казалось бы, оно очень не полно, потому что нам не известны подробности движения молекул воздуха. Они движутся во всех направлениях, и этот факт не отражается функцией χ(х, t). С точки зрения кинетической теории, если в одном месте наблюдается большая плотность молекул, а в соседнем меньшая, молекулы будут переходить из области с большей плотностью в область с меньшей плотностью, так чтобы уравнять плотности. Очевидно, что при этом никаких колебаний не происходит и звук не возникает. Для получения звуковой волны нужно, чтобы молекулы, вылетая из области с большей плотностью и давлением, передавали импульс другим молекулам, находящимся в области разрежения. Звук возникает в том случае, если размеры области изменения плотности и давления намного больше расстояния, проходимого молекулами до соударения с другими молекулами. Это расстояние есть длина свободного пробега, и оно должно быть много меньше расстояния между гребнями и впадинами давления. В противном случае молекулы перейдут из гребня во впадину, и волна моментально выровнится.
Мы, естественно, хотим описать поведение газа в масштабе, большем, чем длина свободного пробега, так что свойства газа не будут определяться поведением отдельных молекул. Например, смещение есть смещение центра инерции небольшого объема газа, а давление или плотность относятся к этому же объему. Мы обозначим давление через Р, а плотность через ρ, причем обе величины будут функциями от х и t. Необходимо помнить, что наше описание приближенное и справедливо лишь, когда свойства газа не слишком быстро меняются с расстоянием.
§ 3. Волновое уравнение
Итак, физические явления, происходящие в звуковой волне, обладают следующими тремя свойствами:
I. Газ движется, и плотность его меняется.
II. При изменении плотности меняется и давление.
III. Неравномерное распределение давления вызывает движение газа.
Рассмотрим сначала свойство II. Для любого газа, жидкости или твердого тела давление является функцией плотности. До прихода звуковой волны мы имели равновесное состояние с давлением Р0 и плотностью ρ0. Давление Р зависит от плотности среды: Р=f(ρ), и в частности равновесное давление Р0=f(ρ0). Отклонения величины давления от равновесного в звуковой волне очень малы. Давление удобно измерять в барах (1 бар=105н/м2). Давление в одну стандартную атмосферу приблизительно равно 1 бар (1 атм=1,0133 бар). Для звука обычно используется логарифмическая шкала интенсивности, так как восприятие уха, грубо говоря, растет логарифмически. В этой децибельной шкале уровень звукового давления I связан с амплитудой звукового давления:
(47.1)
где давление отнесено к некоторому стандартному давлению Ротн=2·10-10 бар.
Звуковое давление Р=103 Ротн=2·10-7 бар[35] соответствует довольно сильному звуку в 60 дб. Мы видим, что давление меняется в звуковой волне на очень малую величину по сравнению с равновесным или средним, равным 1 атм. Смещение и перепады плотности также очень малы. При взрывах, однако, изменения уже не столь малы; избыточное звуковое давление может превышать 1 атм. Такие большие перепады давления приводят к новым явлениям, которые мы рассмотрим позже. В звуковых волнах уровень силы звука выше 100 дб встречается редко; уровень силы звука в 120 дб уже вызывает боль в ушах. Поэтому, написав для звуковой волны
(47.2)
можно считать, что изменение давления Pu очень мало по сравнению с P0, а изменение плотности ρu очень мало по сравнению с ρ0. Тогда
(47.3)
где P0=f(ρ0) и f'(ρ0) — производная от f(ρ), взятая при значении ρ=ρ0. Второе равенство здесь возможно только потому, что ρu очень мало. Таким образом, мы находим, что избыточное давление Pu пропорционально избыточной плотности ρu; коэффициент пропорциональности обозначается через ϰ:
Это весьма простое соотношение и составляет точное содержание свойства II.
Перейдем теперь к свойству I. Предположим, что положение элемента объема воздуха, не возмущенного звуковой волной, есть х, а звук смещает его в момент времени t на величину χ(х,t), так что его новое положение есть x+χ(x,t), как показано на фиг. 47.3.
Фиг. 47.3. Смещение воздуха в точке х есть χ(х,t), а в точке х+Δх равно χ(x+Δx,t). Первоначальный объем, приходящийся на единицу площади в плоской звуковой волне, есть Δx, а окончательный объем равен Δx+χ(x+Δx,t)-χ(x,t).
Далее, положение соседнего элемента объема есть х+Δх, и его смещенное положение есть х+Δх+χ(х+Δх,t). Теперь можно найти изменение плотности. Поскольку мы рассматриваем плоскую волну, удобно взять единичную площадку, перпендикулярную оси х, т. е. направлению распространения волны. Количество воздуха, приходящееся на единичную площадку в интервале Δx, есть ρ0Δx, где ρ0 — невозмущенная, или равновесная, плотность воздуха. Эта порция воздуха, смещенная звуковой волной, будет находиться теперь между x+χ(x,t) и x+Δх+χ(х+Δх,t), причем количество воздуха в этом интервале то же самое, что в интервале Δx до прихода волны. Если через ρ обозначить новую плотность, то
(47.5)
Поскольку Δx мало, можно написать χ(x+Δx,t)-χ(x,t)=(∂χ/∂x)Δx. Здесь уже появляется частная производная, потому что χ зависит и от x, и от времени. Наше уравнение принимает вид
(47.6)
или
(47.7)
Но в звуковой волне все изменения малы, так что ρu мало, χ мало и ∂χ/∂x тоже мало. Поэтому в уравнении, которое мы только что написали,
(47.8)
можно пренебречь ρu(∂χ/∂x) по сравнению с ρ0(∂χ/∂x). Так мы приходим к соотношению, которое требовалось согласно свойству I:
(47.9)
Именно такой вид уравнения можно было ожидать из чисто физических соображений. Если смещение различно для разных х, плотность будет изменяться. Знак тоже правильный: если смещение χ растет с ростом х, так что воздух расширяется, плотность должна уменьшаться.
Теперь нам нужно найти третье уравнение — уравнение движения, производимого избытком давления. Зная соотношение между силой и давлением, можно получить уравнение движения. Возьмем объем воздуха толщиной Δx и с единичной площадью грани, перпендикулярной х, тогда масса воздуха в этом объеме есть ρ0Δx, а ускорение воздуха есть ∂2χ/∂t2, так что масса, умноженная на ускорение для этого слоя, есть ρ0Δx(∂2χ/∂t2). (Если Δx мало, то безразлично, где брать ускорение — на краю слоя или где-нибудь посредине.) Сила, действующая на единичную площадку нашего слоя, перпендикулярную оси x, должна быть равна ρ0Δx(∂2χ/∂t2). В точке х мы имеем силу Р(х,t), действующую на единицу площади в направлении +х, а в точке x+Δx возникает сила в обратном направлении, по величине равная Р(x+Δx, t) (фиг. 47.4):
Фиг. 47.4. Результирующая сила в направлении оси х, возникающая за счет давления на единичную площадку, перпендикулярную к оси х, есть — (∂P/∂x)Δх.
(47.10)
Мы учли, что Δx мало и что только избыточное давление Рu меняется в зависимости от х. Итак, согласно свойству III мы получаем
(47.11)
Теперь уже уравнений достаточно, чтобы увязать все величины и привести к одной переменной, скажем х. Можно выразить Рu в (47.11) с помощью (47.4):
(47.12)
а затем исключить ρu с помощью (I). Тогда ρ0 сократится и у нас останется
(47.13)
Обозначим сs2=ϰ, тогда можно написать
(47.14)
Это и есть волновое уравнение, которое описывает распространение звука в среде.
§ 4. Решения волнового уравнения
Посмотрим теперь, действительно ли волновое уравнение описывает основные свойства звуковых волн в среде. Прежде всего мы хотим вывести, что звуковое колебание, или возмущение, движется с постоянной скоростью. Кроме того, нам нужно доказать, что два различных колебания могут свободно проходить друг через друга, т. е. принцип суперпозиции. Мы хотим еще доказать, что звук может распространяться и вправо и влево. Все эти свойства должны содержаться в нашем одном уравнении.
Раньше мы отмечали, что любое возмущение, имеющее вид плоской волны и движущееся с постоянной скоростью, записывается в виде f(x-vt). Посмотрим теперь, является ли f(x-vt) решением волнового уравнения. Вычисляя ∂χ/∂x, получаем производную функции dχ/dx=f'(x-vt). Дифференцируя еще раз, находим
(47.15)
Дифференцируя эту же функцию χ по t, получаем значение — V, умноженное на производную, или ∂χ/∂t=-vf(x-vt); вторая производная по времени дает
(47.16)
Очевидно, что f(х-vt) удовлетворяет волновому уравнению, если v равно cs.
Таким образом, из законов механики мы получаем, что любое звуковое возмущение распространяется со скоростью cs и, кроме того,
тем самым мы связали скорость звуковых волн со свойствами среды.
Легко увидеть, что звуковая волна может распространяться: и в направлении отрицательных х, т. е. звуковое возмущений вида χ(х, t)=g(x+vt) также удовлетворяет волновому уравнению. Единственное отличие этой волны от той, которая распространялась слева направо, заключается в знаке v, но знак д2χ/dt2 не зависит от выбора x+vt или х-vt, потому что в эту производную входит только v2. Отсюда следует, что решение уравнения описывает волны, бегущие в любом направлении со скоростью cs.
Особый интерес представляет вопрос о суперпозиции решений. Допустим, мы нашли одно решение, скажем χ1. Это значит, что вторая производная χ1 по х равна второй производной χ1 по t1, умноженной на 1/сs2. И пусть есть второе решение χ2, обладающее тем же свойством. Сложим эти два решения, тогда получается
(47.17)
Теперь мы хотим удостовериться, что χ(х, t) тоже представляет некую волну, т. е. χ тоже удовлетворяет волновому уравнению. Это очень просто доказать, так как
(47.18)
и вдобавок
(47.19)
Отсюда следует, что ∂2χ/∂x2=(1/cs2)∂2χ/∂t2, так что справедливость принципа суперпозиции проверена. Само существование принципа суперпозиции связано с тем, что волновое уравнение линейно по χ.
Теперь естественно было бы ожидать, что плоская световая волна, распространяющаяся вдоль оси х и поляризованная так, что электрическое поле направлено по оси y, тоже удовлетворяет волновому уравнению
(47.20)
где с — скорость света. Волновое уравнение для световой волны есть одно из следствий уравнений Максвелла. Уравнения электродинамики приводят к волновому уравнению для света точно так же, как уравнения механики приводят к волновому уравнению для звука.
§ 5. Скорость звука
При выводе волнового уравнения для звука мы получили формулу, которая связывает при нормальном давлении скорость движения волны и относительное изменение давления с плотностью:
(47.21)
Чтобы оценить скорость изменения давления, очень важно знать, как при этом меняется температура. Можно ожидать, что в местах сгущения звуковой волны температура повысится, а в местах разрежения — понизится. Ньютон первым вычислил скорость изменения давления с плотностью, предположив, что температура при этом не меняется. Он считал, что тепло передается из одной области звуковой волны в другую так быстро, что температура измениться не успеет. Способ Ньютона дает изотермическую скорость звука, что неправильно. Правильное вычисление было сделано позже Лапласом, считавшим вопреки Ньютону, что давление и температура в звуковой волне меняются адиабатически. Поток тепла из области сгущения в область разрежения пренебрежимо мал, если только длина волны велика по сравнению с длиной свободного пробега. При этих условиях ничтожная утечка тепла в звуковой волне не влияет на скорость звука, хотя и приводит к небольшому поглощению звуковой энергии. Мы можем, естественно, ожидать, что поглощение тепла усилится, когда длина волны приблизится к длине свободного пробега, но такие длины волн примерно в миллион раз меньше длины волны слышимого звука.
Итак, для звука истинная скорость изменения давления с плотностью должна вычисляться без учета отвода тепла. Это соответствует адиабатическому изменению давления, для которого мы нашли, что PVγ=const, где V — объем. Поскольку плотность ρ обратно пропорциональна объему, связь P и ρ для адиабатических процессов дается соотношением
(47.22)
откуда мы получаем dP/dρ=γP/ρ. Тогда для скорости звука возникает соотношение
(47.23)
Можно еще написать сs2=γPV/ρV и использовать соотношение PV=NkT. Мы видим, кроме того, что ρV есть масса газа, которую можно записать как Nm или μ, где m — масса молекулы, а μ — молекулярный вес. Таким образом, находим
(47.24)
откуда видно, что скорость звука зависит только от температуры газа и не зависит от давления или плотности. Мы уже отмечали, что
(47.25)
где <v2> — средняя квадратичная скорость молекул. Отсюда следует, что сs2=γ/3 <v2>, или
(47.26)
Это равенство означает, что скорость звука есть средняя скорость молекул воздуха (точнее, корень квадратный из средней квадратичной скорости), умноженная на некоторое число, грубо говоря, на 1/(3)1/2. Другими словами, она того же порядка величины, что и скорость молекул, но на самом деле несколько меньше средней скорости молекул.
В общем-то мы могли этого ожидать, потому что такое возмущение, как изменение плотности, передается в конечном счете движением молекул. Однако подобного рода соображения не подсказывают нам точного значения скорости; могло ведь оказаться, что звук переносится самыми быстрыми или самыми медленными молекулами. Разумно и весьма утешительно, что скорость звука оказалась равной приблизительно половине средней молекулярной скорости.
Глава 48 БИЕНИЯ
§ 1. Сложение двух волн
Не так давно мы довольно подробно обсуждали свойства световых волн и их интерференцию, т. е. эффект суперпозиции двух волн от различных источников. Но при этом предполагалось, что частоты источников одинаковы. В этой же главе мы остановимся на некоторых явлениях, возникающих при интерференции двух источников с различными частотами.
Нетрудно догадаться, что при этом произойдет. Действуя так же, как прежде, давайте предположим, что имеются два одинаковых осциллирующих источника с одной и той же частотой, причем фазы их подобраны так, что в некоторую точку Р сигналы приходят с одинаковой фазой. Если это свет, то в этой точке он очень ярок, если это звук, то он очень громок, а если это электроны, то их очень много. С другой стороны, если приходящие волны отличаются по фазе на 180°, то в точке Р не будет никаких сигналов, ибо полная амплитуда будет иметь здесь минимум. Предположим теперь, что некто крутит ручку «регулировка фазы» одного из источников и меняет разность фаз в точке Р то туда, то сюда, скажем сначала он делает ее нулевой, затем — равной 180° и т. д. При этом, разумеется, будет меняться и сила приходящего сигнала. Ясно теперь, что если фаза одного из источников медленно, постоянно и равномерно меняется по сравнению с другим, начиная с нуля, а затем возрастает постепенно до 10, 20, 30, 40° и т. д., то в точке Р мы увидим ряд слабых и сильных «пульсаций», ибо когда разность фаз проходит через 360°, в амплитуде снова возникает максимум. Но утверждение, что один источник с постоянной скоростью меняет свою фазу по отношению к другому, равносильно утверждению, что число колебаний в 1 сек у этих двух источников несколько различно.
Итак, теперь известен ответ: если взять два источника, частоты которых немного различны, то в результате сложения получаются колебания с медленно пульсирующей интенсивностью. Иначе говоря, все сказанное здесь действительно имеет отношение к делу!
Этот результат легко получить и математически. Предположим, например, что у нас есть две волны и забудем на минуту о всех пространственных соотношениях, а просто посмотрим, что приходит в точку Р. Пусть от одного источника приходит волна cosω1t, а от другого — волна cosω2t, причем обе частоты ω1 и ω2 не равны в точности друг другу. Разумеется, амплитуды их тоже могут быть различными, но сначала давайте предположим, что амплитуды равны. Общую задачу мы рассмотрим позднее. Полная амплитуда в точке Р при этом будет суммой двух косинусов. Если мы построим график зависимости амплитуды от времени, как это показано на фиг.48.1, то окажется, что, когда гребни двух волн совпадают, получается большое отклонение, когда совпадают гребень и впадина — практически нуль, а когда гребни снова совпадают, вновь получается большая волна.
Фиг. 48.1. Суперпозиция двух косинусообразных волн с отношением частот 8:10. Точное повторение колебаний внутри каждого биения для общего случая не типично.
Математически нам нужно взять сумму двух косинусов и как-то ее перестроить. Для этого потребуются некоторые полезные соотношения между косинусами. Давайте получим их. Вы знаете, конечно, что
(48.1)
и что вещественная часть экспоненты eia равна cosа, а мнимая часть равна sinа. Если мы возьмем вещественную часть ехр[-i(a+b)], то получим cos(a+b), а для произведения
мы получаем cosacosb-sinasinb плюс некоторая мнимая добавка. Сейчас, однако, нам нужна только вещественная часть. Таким образом,
(48.2)
Если теперь изменить знак величины b, то, поскольку косинус при этом не изменяет знака, а синус изменяет знак на обратный, мы получаем аналогичное выражение для косинуса разности
(48.3)
После сложения этих двух уравнений произведение синусов сократится, и мы находим, что произведение двух косинусов равно половине косинуса суммы плюс половина косинуса разности
(48.4)
Теперь можно обернуть это выражение и получить формулу для cosα+cosβ, если просто положить α=а+b, a β=а-b, т. е. a=1/2(α+β), a b=1/2(α-β):
(48.5)
Но вернемся к нашей проблеме. Сумма cosω1t и cosω2t равна
(48.6)
Пусть теперь частоты приблизительно одинаковы, так что 1/2(ω1+ω2) равна какой-то средней частоте, которая более или менее та же, что и каждая из них. Но разность ω1-ω2 гораздо меньше, чем ω1 и ω2, поскольку мы предположили, что ω1 и ω2 приблизительно равны друг другу. Это означает, что результат сложения можно истолковать так, как будто есть косинусообразная волна с частотой, более или менее равной первоначальным, но что «размах» ее медленно меняется: он пульсирует с частотой, равной 1/2(ω1-ω2). Но та ли это частота, с которой мы слышим биения? Уравнение (48.6) говорит, что амплитуда ведет себя как cos1/2(ω1-ω2), и это надо понимать так, что высокочастотные колебания заключены между двумя косинусоидами с противоположными знаками (пунктирная линия на фиг. 48.1). Хотя амплитуда действительно меняется с частотой 1/2(ω1-ω2), однако если речь идет об интенсивности волн, то мы должны представлять себе частоту в два раза большую. Иначе говоря, модуляция амплитуды в смысле ее интенсивности происходит с частотой ω1-ω2, хотя мы и умножаем на косинус половинной частоты.
Пренебрегая этими небольшими усложнениями, мы можем заключить, что если складывать две волны с частотами ω1 и ω2, то получим волну с частотой, равной средней частоте 1/2(ω1+ω2), «сила» которой осциллирует с частотой ω1-ω2.
Если амплитуды двух волн различны, то можно, конечно, повторить все вычисления снова, умножив предварительно косинусы на различные амплитуды А1 и А2 и произведя массу всяких математических вычислений, перестроек и т. п. с использованием уравнений, подобных (48.2) — (48.5). Однако есть и другой, более легкий путь провести этот же анализ. Известно, например, что гораздо легче работать с экспонентами, чем с синусами и косинусами, поэтому можно представить A1cosω1t как реальную часть экспоненты А1ехр(iω1t). Подобным же образом вторая волна будет реальной частью A2ехр(iω2t). После сложения этих экспонент A1exp(iω1t)+A2exp(iω2t) и выделения в качестве множителя экспоненты со средней частотой мы получим
(48.7)
т. е. снова оказывается, что высокочастотная волна модулируется малой частотой.
§ 2. Некоторые замечания о биениях и модуляции
Предположим теперь, что нас интересует интенсивность волны, описываемой уравнением (48.7). Чтобы найти ее, нужно взять квадрат абсолютной величины либо правой, либо левой части этого уравнения. Давайте возьмем левую часть. Интенсивность при этом будет равна
(48.8)
Видите, интенсивность возрастает и падает с частотой ω1-ω2, изменяясь в пределах между (А1+A2)2 и (А1-A2)2. Если А1≠А2, то минимальная интенсивность не равна нулю.
Те же результаты можно получить и другим путем—с помощью схем, подобных фиг. 48.2.
Фиг. 48.2. Результат сложения двух комплексных векторов с равными частотами.
Изобразим одну из волн в виде вектора длиной A1 в комплексной плоскости, вращающегося с угловой скоростью ω1. Вторую волну изобразим другим вектором, длина которого A2, а угловая скорость вращения ω2. Если эти частоты в точности равны между собой, то мы получим вращающийся вектор, длина которого все время постоянна. Так что интенсивность в этом случае будет все время постоянной фиксированной величиной. Если, однако, частоты хоть немного отличаются одна от другой, то эти два вектора будут крутиться с различными скоростями.
На фиг. 48.3 показано, как выглядит вся картина «с точки зрения» вектора A1exp(iω1t).
Фиг. 48.3. Результат сложения двух комплексных векторов с различными частотами во вращающейся системе отсчета первого вектора. Показаны девять последовательных положений медленно вращающегося вектора.
Мы видим, что вектор А2 медленно «отворачивается» от вектора А1, так что амплитуда, получаемая при сложении этих векторов, сначала велика, а затем, когда второй вектор совсем «отвернется» в другую сторону, т. е. когда угол между ними станет 180°, она будет особенно мала, и т. д. Вектор крутится, амплитуда суммы векторов становится то больше, то меньше, а интенсивность пульсирует. Идея сравнительно простая, и ее можно реализовать множеством различных способов. Этот эффект очень легко наблюдать экспериментально. Можно установить, например, два громкоговорителя, каждый из которых связан со своим генератором колебаний и может давать свой собственный тон. Таким образом, мы принимаем один сигнал от первого источника, а другой сигнал от второго. Если частоты этих сигналов в точности одинаковы, то в результате в каждой точке пространства получится эффект определенной силы. Но если генераторы немного расстроить, то мы услышим некоторые изменения интенсивности. Чем больше мы расстраиваем генераторы, тем более быстрыми будут изменения силы звука. Однако уху становится трудно уследить за изменениями, скорость которых превышает 10 колебаний в секунду или что-то около этого.
Тот же эффект можно наблюдать и на осциллографе, который просто показывает сумму токов двух генераторов. Если частота пульсаций сравнительно мала, то мы просто видим, как на экране перед нами проходят синусоидальные волны, амплитуда которых пульсирует, но если сделать пульсации более быстрыми, то мы увидим нечто похожее на то, что показано на фиг. 48.1. По мере увеличения разницы между частотами «вершины» сближаются все больше и больше. Если амплитуды не равны друг другу, если мы один сигнал сделаем слабее другого, то образуется волна, амплитуда которой, как это и ожидается, никогда не становится равной нулю. Все получается так, как нужно, независимо от того, электричество это или звук.
Но возможно и обратное явление! При радиопередаче используют так называемую амплитудную модуляцию (AM). Вот как это делается. Радиопередатчик возбуждает электрические колебания очень высокой частоты. Для радиовещания, например, используется частота 800 кгц. Если включен этот несущий сигнал, то передатчик будет излучать волны с частотой 800 000 колебаний в секунду, причем амплитуда их постоянна. Информация же (зачастую совершенно бесполезная, вроде того, какую марку автомобиля вам следует приобрести) передается следующим образом: когда кто-то говорит в микрофон, амплитуда несущего сигнала изменяется «в ногу» с колебаниями звука, приходящего в микрофон.
Возьмем простейший с точки зрения математики случай, когда певица берет безупречную ноту с безупречным синусоидальным колебанием голосовых связок, причем получается сигнал, сила которого меняется, как это показано на фиг. 48.4.
Фиг. 48.4. Модуляция несущей волны. На этом схематическом рисунке отношение ωc/ωm=5. В настоящей радиоволне ωc/ωm≈100.
Изменения слышимой частоты принимаются затем приемником; мы избавляемся от несущей волны и смотрим просто на «обертку», которая представляет собой колебания голосовых связок, или звук голоса певицы. Громкоговоритель же производит колебания той же частоты в воздухе, и в принципе слушатель не может обнаружить разницы между настоящим голосом певицы и передачей, слышимой по радио. В действительности же из-за некоторых искажений и других тончайших эффектов можно все же определить, слышим ли мы радио или «живой» голос певицы; в других же отношениях все происходит так, как мы описали.
§ 3. Боковые полосы
Описанную выше модулированную волну математически можно записать в виде
(48.9)
где (ωс— несущая частота, а ωm— частота слышимого звука. Используя теоремы о косинусах или свойства экспоненты exp(iθ) (разницы в этом никакой нет, однако легче работать с экспонентой), мы получаем
(48.10)
Таким образом, с другой точки зрения можно сказать, что выходящая волна состоит из суперпозиции трех волн: обычной волны с частотой ωс, т. е. несущей частоты, и затем двух новых волн с двумя другими частотами. Одна из них равна сумме несущей и модулирующей частот, а другая — разности. Если построить нечто вроде графика зависимости интенсивности излучения генератора от частоты, то сначала мы, естественно, обнаружим большую интенсивность при несущей частоте ωс, но как только певица начнет петь, мы неожиданно обнаружим интенсивность, пропорциональную силе голоса певицы b2 при частотах ωс+ωm и ωс-ωm, как это показано на фиг. 48.5.
Фиг. 48.5. Спектр частот несущей волны ωс, модулированной одной косинусообразной волной ωm.
Они называются боковыми полосами. Если из передатчика выходит модулированный сигнал, то возникают боковые полосы. Если в одно и то же время передаются две ноты, скажем, с частотами ωm и ωm', например играют два инструмента или какая-то другая усложненная волна, тогда из математики видно, что получаются две новые волны, соответствующие частотам ωm±ωm'.
Итак, если происходит какая-то сложная модуляция, которую можно представить в виде суммы многих косинусов[36], то оказывается, что в действительности передатчик работает в целой области частот, именно несущей частоты плюс-минус максимальная частота, содержащаяся в модулирующем сигнале.
Хотя вначале мы могли поверить, что радиопередатчик работает только на номинальной несущей частоте, так как в нем находится большой сверхстабильный кристаллический осциллятор и все подобрано так, чтобы частота была равна в точности 800 кгц, но в тот момент, когда диктор объявляет, что станция работает на частоте 800 кгц, он тем самым модулирует эту частоту и передача уже не идет точно на этой частоте. Предположим, что усилители построены так, что они могут передавать широкую полосу частот в области, воспринимаемой ухом (ухо может слышать частоты вплоть до 20 000 гц, но обычно радиоприемники и радиопередатчики работают ниже частоты 10 000 гц, и по радио мы высших частот не слышим). Так что голос диктора, объявляющего что-то по радио, может содержать частоты вплоть до 10 000 гц, передатчик излучает частоты в области от 790 до 810 кгц. Если при этом на частоте, скажем, 795 кгц работает еще одна радиостанция, то возникают большие помехи. Если мы сделаем наш приемник столь чувствительным, что он будет принимать только частоту 800 кгц и не будет захватывать по 10 кгц с каждой стороны, то мы не услышим, что сказал диктор, ведь информация передается именно на боковых частотах! Поэтому очень важно, чтобы станции были разделены некоторой областью частот и их боковые полосы не перекрывались, а приемник не должен быть столь избирательным, чтобы не позволять принимать боковые полосы вместе с номинальной частотой. Но эта проблема не вызывает больших затруднений при радиопередачах. Мы слышим в области ±20 кгц, а радиопередача ведется обычно в области от 500 до 1500 кгц, так что места должно хватить для множества станций.
Проблема телевидения намного труднее. Когда электронный луч бежит по экрану телевизионной трубки, он создает множество светлых и темных точек. Эти светлые и темные точки и есть «сигналы». Обычно, чтобы «показать» весь кадр, лучу требуется примерно в тридцатую долю секунды пробежать 500 строк. Пусть разрешение по горизонтали и по вертикали более или менее одинаково, т. е. на миллиметр каждой строки приходится ровно столько же точек, сколько строк приходится на миллиметр высоты. Нужно, чтобы мы могли различать последовательность светлое — темное, светлое — темное, светлое — темное на протяжении 500 линий. Чтобы это можно было сделать с помощью косинусообразной волны, требуется длина волны, т. е. расстояние от максимума до минимума, соответствующая длине 1/250 части экрана. Таким образом, получается 250x500x30 «единичек информации» в секунду, поэтому высшая частота, которую нужно передать, оказывается равной приблизительно 4 Мгц. На самом деле, чтобы отделить телевизионные станции одну от другой, мы должны использовать несколько большую ширину — около 6 Мгц. Часть ее используется для передачи звукового сопровождения и другой информации. Таким образом, телевизионный канал имеет ширину 6 Мгц. Разумеется, модулировать с частотой, превышающей частоту несущей волны, невозможно, поэтому телевизионные передачи нельзя вести на частоте, например, 800 кгц.
Во всяком случае, телевизионная полоса начинается с частоты 54 Мгц. Первый телевизионный канал в Соединенных Штатах работает в полосе от 54 до 60 Мгц, т. е. имеет ширину 6 Мгц[37]. «Постойте,— можете сказать вы,— ведь только сейчас мы доказали, что боковые полосы должны быть с обеих сторон, а поэтому ширина должна быть вдвое больше». Оказывается, радиоинженеры довольно хитрый народ. Если при анализе модулирующего сигнала использовать не только косинус, а косинус и синус, чтобы учесть разность фаз, то между высокочастотной и низкочастотной боковыми полосами обнаружится наличие определенного постоянного соотношения. Этим мы хотим сказать, что вторая боковая полоса не содержит никакой новой информации по сравнению с первой, так что одну из них вполне можно выкинуть. Приемник же устроен таким образом, что потерянная информация восстанавливается из несущей частоты и одной боковой полосы. Передача с помощью одной боковой полосы — очень интересный метод уменьшения ширины полосы, необходимой для передачи информации.
§ 4. Локализованный волновой пакет
Следующий вопрос, который мы хотим обсудить,— это интерференция волн как в пространстве, так и во времени. Предположим, что в пространстве распространяются две волны. Вы, конечно, знаете, что распространение волны в пространстве, например звуковой, можно описать с помощью экспоненты exp[i(ωt-kx)]. Такая экспонента удовлетворяет волновому уравнению при условии, что ω2=k2с2, где с — скорость распространения волны. В этом случае экспоненту можно записать в виде ехр[ik(x-ct)], что является частным случаем общего решения f(x-ct). Такая экспонента должна описывать волну, распространяющуюся со скоростью ω/k, равной с, и поэтому здесь все в порядке.
Давайте теперь складывать две такие волны. Пусть первая волна распространяется с одной частотой, а вторая волна — с какой-то другой. Случай неравных амплитуд рассмотрите самостоятельно, хотя существенного отличия здесь нет. Таким образом, мы хотим сложить exp[i(ω1t-k1x)]+exp[i(ω2t-k2x)]. Это можно сделать с помощью математики, аналогичной использованной нами при сложении двух сигналов. Если скорости с обеих волн одинаковы, то сделать это очень легко; за исключением того, что вместо t стоит t'=t-х/с, это будет то же самое, что мы недавно проделали:
(48.11)
При этом, естественно, мы получаем точно такие же модуляции, как и раньше, которые, однако, движутся вместе с волной. Другими словами, если сложить две волны, которые не просто осциллируют, но и перемещаются в пространстве, то получившаяся волна также будет двигаться с той же скоростью.
Хотелось бы обобщить это на случай волн, у которых отношение между частотой и волновым числом k не столь просто, например распространение волн в веществе с некоторым показателем преломления. В гл. 31 (вып. 3) мы уже изучали показатель преломления n и выяснили, что он связан с волновым числом следующим образом: k=nω/с. В качестве интересного примера мы нашли показатель преломления n для рентгеновских лучей:
(48.12)
На самом деле в гл. 31 мы получали и более сложные формулы, однако эта ничуть не хуже, так почему бы нам не взять ее в качестве примера.
Нам известно, что даже в том случае, когда ω и k не пропорциональны друг другу, отношение ω/k все равно будет скоростью распространения данной частоты и данного волнового числа. Это отношение называется фазовой скоростью, т. е. скоростью, с которой движется фаза или узел отдельной волны:
(48.13)
Интересно, что, например, для случая распространения рентгеновских лучей в стекле эта фазовая скорость больше скорости света в пустоте [поскольку n, согласно (48.12), меньше единицы], а это несколько неприятно, ведь не думаем же мы, что можно посылать сигналы быстрее скорости света!
Обсудим теперь интерференцию двух волн, у которых значения ω и k связаны какой-то определенной зависимостью. Например, написанная ранее формула для показателя n говорит, что k есть определенная известная функция частоты ω. Для большей определенности давайте выпишем формулу зависимости k и ω в данной частной задаче:
(48.14)
где a=Nqe2/2ε0m — постоянная. Во всяком случае, мы хотим сложить такие две волны, у которых для каждой частоты существует определенное волновое число.
Давайте сделаем это точно так же, как и при получении уравнения (48.7):
(48.15)
Таким образом, снова получается модулированная волна, распространяющаяся со средней частотой и средним волновым числом, однако сила ее меняется в соответствии с выражением, зависящим от разности частот и разности волновых чисел.
Рассмотрим теперь случай, когда разности между двумя волнами относительно малы. Предположим, что мы складываем две волны с приблизительно равными частотами, при этом (ω1+ω2)/2 практически равно каждой из частот ω. То же можно сказать и о (k1+k2)/2. Таким образом, скорость волны, быстрых осцилляции, узлов действительно остается равной ω/k. Но смотрите, скорость распространения модуляций не та же самая! Как нужно изменить х, чтобы сбалансировать некоторую величину времени t? Скорость этих модулирующих волн равна
(48.16)
Скорость движения модуляций иногда называют групповой скоростью. Если мы возьмем случай относительно малой разности между частотами и соответственно относительно малой разности между волновыми числами, то это выражение переходит в пределе в
(48.17)
Другими словами, чем медленнее модуляции, тем медленнее и биения, и вот что самое удивительное — существует определенная скорость их распространения, которая не равна фазовой скорости волны.
Групповая скорость равна производной ω по k, а фазовая скорость равна отношению ω/k.
Посмотрим, можно ли понять, почему так происходит. Рассмотрим две волны с несколько различными длинами, как это показано на фиг. 48.1. Они то совпадают по фазе, то различаются, то снова совпадают и т. д. Однако теперь эти волны в действительности представляют волны в пространстве, распространяющиеся с немного различными скоростями. Но поскольку фазовая скорость, скорость узлов этих двух волн, не в точности одинакова, то происходит нечто новое. Предположим, что мы едем рядом с одной из волн и смотрим на другую. Если бы они двигались с одинаковой скоростью, то вторая волна оставалась бы относительно нас там же, где и была с самого начала, поскольку мы едем как бы на гребне одной волны и видим гребень второй прямо около себя. Однако в действительности скорости не равны. Частоты немного отличаются друг от друга, а поэтому немного отличаются и скорости. Из-за этой небольшой разницы в скоростях другая волна либо медленно обгоняет нас, либо отстает. Что же с течением времени происходит с узлом? Если чуть-чуть продвинуть одну из волн, то узел при этом уйдет на значительное расстояние вперед (или назад), т. е. сумма этих двух волн имеет какую-то огибающую, которая вместе с распространением волн скользит по ним с другой скоростью. Групповая скорость является той скоростью, с которой передаются модулирующие сигналы.
Если мы посылаем сигнал, т. е. производим какие-то изменения волны, которые могут быть услышаны и расшифрованы кем-то, то это является своего рода модуляцией, но такая модуляция при условии, что она относительно медленная, будет распространяться с групповой скоростью (быстрые модуляции значительно труднее анализировать).
Теперь мы можем показать (наконец-то!), что скорость распространения рентгеновских лучей в куске угля, например, не больше, чем скорость света, хотя фазовая скорость больше скорости света. Чтобы сделать это, нужно найти соотношение dω/dk, которое мы вычислим дифференцированием формулы (48.14): dk/dω=1/c+a/(ω2c). А групповая скорость равна обратной величине, т. е.
(48.18)
что меньше, чем с! Таким образом, хотя фазы могут бежать быстрее скорости света, модулирующие сигналы движутся медленнее, и в этом состоит разрешение кажущегося парадокса! Разумеется, в простейшем случае ω=kc групповая скорость dω/dk тоже равна с, т. е. когда все фазы движутся с одинаковой скоростью, естественно, и групповая скорость будет той же самой.
§ 5. Амплитуда вероятности частиц
Рассмотрим еще один необычайно интересный пример фазовой скорости. Он относится к области квантовой механики. Известно, что амплитуда вероятности найти частицу в данном месте изменяется при некоторых обстоятельствах в пространстве и времени (давайте возьмем одно измерение) следующим образом:
(48.19)
где ω — частота, связанная с классической энергией, E=ℏω, а k — волновое число, которое связано с импульсом соотношением р=ℏk. Мы говорим, что частица имеет определенный импульс р, если волновое число в точности равно k, т. е. если бежит идеальная волна повсюду с одинаковой амплитудой. Выражение (48.19) дает амплитуду вероятности, но если мы возьмем квадрат абсолютной величины, то получим относительную вероятность обнаружения частицы как функцию положения и времени. В данном случае она равна постоянной, что означает вероятность обнаружить частицу в любом месте. Рассмотрим теперь такой случай, когда известно, что обнаружить частицу в каком-то месте более вероятно, чем в других местах. Подобную картину мы описываем волной, которая имеет максимум в данном месте и сходит на нет по мере удаления в стороны (фиг. 48.6).
Фиг. 48.6. Локализованный волновой пакет,
(Это не то же самое, что изображено на фиг. 48.1, где волна имеет целый ряд максимумов, но сними вполне можно расправиться, сложив несколько волн с приблизительно одинаковыми значениями ω и k. Таким способом можно избавиться от всех максимумов, кроме одного.)
При этих обстоятельствах, поскольку квадрат выражения (48.19) представляет вероятность найти частицу в некотором месте, мы знаем, что в данный момент больше шансов найти частицу вблизи центра «колокола», где амплитуда максимальна. Если подождать немного, то волна передвинется, и по прошествии некоторого промежутка времени «колокол» перейдет в какое-то другое место. Зная, что частица вначале где-то была расположена, мы ожидали бы, согласно классической механике, что она будет где-то и позднее, ведь есть же у нее скорость и импульс в конце концов. При этом квантовая теория дает в пределе правильные классические соотношения между энергией, импульсом и скоростью, если только групповая скорость, скорость модуляции, будет равна скорости классической частицы с тем же самым импульсом.
Сейчас необходимо показать, так ли это на самом деле или нет. Согласно классической теории, энергия связана со скоростью уравнением
(48.20)
Точно таким же образом импульс равен
(48.21)
Как следствие отсюда после исключения v получается
т. е. рμрμ=m2. Это величайший результат четырехмерья, о котором мы уже говорили много раз, устанавливающий связь между энергией и импульсом в классической теории. Теперь же, поскольку мы собираемся заменить E и p на ω и k помощью подстановки Е=ℏω и p=ℏk, он означает, что в квантовой механике должна существовать связь
(48.22)
Таким образом, возникло соотношение между частотой и волновым числом квантовомеханической амплитуды, описывающей частицу с массой m. Из этого уравнения можно получить
т. е. фазовая скорость ω/k снова больше скорости света!
Рассмотрим теперь групповую скорость. Она должна быть равна скорости, с которой движется модуляция, т. е. dω/dk.
Чтобы найти ее, нужно продифференцировать квадратный корень; это дело нехитрое. Производная равна
Но входящий сюда квадратный корень есть попросту ω/с, так что эту формулу можно записать в виде dω/dk=c2k/ω. Далее, так как k/ω равно р/Е, то
Но, согласно (48.20) и (48.21), с2р/Е равно v — скорости частицы в классической механике. Таким образом видно, что, принимая во внимание основные квантовомеханические соотношения E=ℏω и p=ℏk, определяющие ω и k через классические величины Е и р и дающие только уравнение ω2-k2c2==m2с4/ℏ2, теперь можно понять также соотношения (48.20) и (48.21), связывающие Е и р со скоростью. Групповая скорость, разумеется, должна быть скоростью частиц, если эта интерпретация вообще имеет какой-либо смысл. Пусть в какой-то момент, как мы полагаем, частица находится в одном месте, а затем, скажем через 10 минут,— в другом. Тогда, согласно квантовой механике, расстояние, пройденное «колоколом», разделенное на интервал времени, должно равняться классической скорости частицы.
§ 6. Волны в пространстве трех измерений
Мы заканчиваем наше обсуждение волн несколькими общими замечаниями о волновом уравнении. Эти замечания, призванные дать нам картину того, чем нам предстоит заниматься в будущем, вовсе не претендуют на то, чтобы вы поняли их сразу; они должны скорее показать, как будут выглядеть все эти вещи, когда вы несколько больше познакомитесь с волнами. Мы уже записали уравнение для распространения звука в одном измерении:
здесь с — скорость того, что мы назвали волнами. Если речь идет о звуке, то это скорость звука, если о свете — то это скорость света. Мы показали, что для звуковой волны перемещения частиц должны распространяться с некоторой скоростью. Но избыточное давление, как и избыточная плотность, тоже распространяется с некоторой скоростью. Таким образом, можно ожидать, что и давление будет удовлетворять этому же уравнению.
Так оно и есть на самом деле, однако докажите это самостоятельно. Указание: ρu пропорционально скорости изменения χ с расстоянием х. Следовательно, продифференцировав волновое уравнение по х, мы немедленно обнаружим, что ∂χ/∂x удовлетворяет тому же самому уравнению. Другими словами, ρu удовлетворяет тому же самому уравнению. Но Рu пропорционально ρu, поэтому и Рu удовлетворяет тому же самому уравнению. Таким образом, и давление, и перемещение — все описывается одним и тем же уравнением.
Обычно волновое уравнение для звука записывается через давление, а не через перемещение. Это проще, потому что давление — скаляр и не имеет никакого направления. Но перемещение есть вектор, и поэтому лучше иметь дело с давлением.
Следующий вопрос, который нам предстоит обсудить, относится к волновому уравнению в трехмерном пространстве. Мы знаем, что звуковая волна в одномерном пространстве описывается решением ехр[i(ωt-kx)], где ω=kcs. Кроме того, нам известно, что в трех измерениях волна описывается выражением exp[i(ωt-kxx-kyy-kzz)], и в этом случае ω2=k2сs2 [сокращенная запись (kx2+ky2+kz2)cS2]. Сейчас мы хотим просто угадать вид волнового уравнения в трехмерном пространстве. Естественно, что в случае звука это уравнение можно получить с помощью тех же самых динамических соображений, но уже в трехмерном пространстве. Однако мы не будем сейчас делать этого, а просто напишем ответ: уравнение для давления или перемещения (или чего-то другого) имеет вид
(48.23)
правильность этого уравнения может быть легко проверена подстановкой в него функции exp[i(ωt-k·r)]. Ясно, что при каждом дифференцировании по х происходит умножение на -ikx. Если мы дифференцируем дважды, то это эквивалентно умножению на -k2x, так что для такой волны первый член получится равным -kx2Pu. Точно таким же образом второй член окажется равным -kу2Рu, а третий — равным -kz2Pu. С правой же стороны мы получим -ω2/cs2Рu. Если мы вынесем 1 за скобку Ри и изменим знаки всех членов, то увидим, что между k и ω как раз получится желаемое соотношение.
Возвращаясь назад, мы должны прийти к основному уравнению, соответствующему дисперсионному соотношению (48.22) для квантовомеханической волны. Если φ — амплитуда нахождения частицы в момент t в точке с координатами x, y и z, то основное уравнение квантовой механики для свободной частицы имеет вид
(48.24)
Прежде всего заметим, что релятивистский характер этого уравнения гарантируется появлением координат x, y, z и времени t в такой удачной комбинации, что она автоматически учитывает принцип относительности. Кроме того, это уравнение волновое. Если подставить в него плоскую волну, то как следствие мы получим равенство -k2+ω2/c2=m2c2/ℏ2, которое должно выполняться в квантовой механике. В этом волновом уравнении содержится еще одна фундаментальная вещь: любая суперпозиция волн также будет его решением. Таким образом, это уравнение опирается на всю квантовую механику и всю теорию относительности, которая уже обсуждалась нами до сих пор, по крайней мере когда мы имели дело с единственной частицей в пустом пространстве без всяких потенциалов и воздействующих на нее сил!
§ 7. Собственные колебания
Вернемся теперь к другим очень любопытным примерам биений, которые немного отличаются от того, что мы рассматривали до сих пор. Представьте себе два одинаковых маятника, которые связаны между собой слабой пружинкой. Длины их должны быть одинаковыми с возможно большей точностью. Если мы оттянем один маятник и отпустим его, то он будет качаться взад и вперед и будет тянуть то взад, то вперед связывающую пружинку, т. е. получится устройство, создающее силу с собственной частотой второго маятника. Можно заключить из знакомой нам теории резонансов, что если к какому-то предмету прикладывать с надлежащей частотой силу, то она будет двигать этот предмет. Таким образом, ясно, что один маятник, двигаясь взад и вперед, будет раскачивать второй. Однако при этих условиях происходит некое новое явление, связанное с тем, что энергия системы конечна. Первый маятник постепенно растрачивает свою энергию, вызывая движение другого маятника, и в конце концов полностью отдаст свою энергию и остановится. Вся энергия теперь будет сосредоточена во втором маятнике. Но пройдет немного времени и все будет происходить наоборот: энергия из второго маятника будет перекачиваться назад, в первый маятник. Это очень интересное и занимательное явление. Мы сказали, что оно связано с теорией биений, и сейчас мы должны показать, как можно понять это явление с точки зрения этой теории.
Обратите внимание, что движение каждого из двух маятников — это колебания с циклически изменяющейся амплитудой. Поэтому движение одного из маятников можно, очевидно, рассматривать с различных точек зрения, в частности как сумму двух одновременных колебаний с мало отличающимися частотами. Таким образом должно быть возможно обнаружить в этой системе два других движения и утверждать, что поскольку система наша, безусловно, линейная, то мы видим суперпозицию этих двух решений. Действительно, легко найти два способа так запустить нашу систему, что каждый из них даст в результате идеальное абсолютно периодическое колебание с одной частотой. Движение, с которого мы начали, не строго периодично, оно не продолжается все время (один маятник постепенно передает свою энергию другому и изменяет свою амплитуду), но есть способы так начать движение, что не будет никаких подобных изменений. Как только вы узнаете, что это за способы, то сразу же поймете почему. Если, например, мы запустим оба маятника одновременно, то, поскольку длина их одинакова и пружинка в этом случае бездействует, оба маятника так и будут продолжать качаться все время вместе. (Разумеется, если нет трения и все достаточно хорошо подогнано.) С другой стороны, существует еще одна возможность создать строго периодическое движение, которое также имеет определенную частоту,— когда маятники, оттянутые вначале в разные стороны на точно равные расстояния, движутся в противоположных направлениях. Нетрудно сообразить, что пружинка немного увеличивает «восстанавливающую силу», возникающую из-за действия силы тяжести, и система колеблется с несколько большей частотой, чем в первом случае,— вот и все. Почему с большей? Да потому что пружинка тянет, помогая силе тяжести, и это делает систему более «жесткой», так что частота такого колебания чуть-чуть больше.
Итак, создать колебания с постоянной амплитудой в нашей системе можно двумя способами: либо оба маятника качаются все время вместе с одной частотой, либо они качаются в противоположных направлениях с несколько большей частотой.
Действительное же движение системы, поскольку она линейна, можно представить в виде суперпозиции этих двух способов. (Напомним, что предметом этой главы являются эффекты сложения двух движений с различными частотами.) Давайте подумаем, что произошло бы, если бы мы сложили эти два решения. Если в момент t=0 запустить оба эти движения (причем с равными амплитудами и одинаковой фазой), то сумма этих двух движений означает, что один маятник, на который каким-то образом воздействовало первое движение и противоположным образом воздействовало второе, должен оставаться на месте, тогда как другой маятник, двигаясь одинаково при обоих способах движения, качается с удвоенной амплитудой. С течением времени, однако, оба эти основных движения, существуя независимо одно от другого, медленно сдвигаются по фазе одно относительно другого. Это означает, что после достаточно большого промежутка времени, такого, что в первом движении произойдет, скажем, 900,5 колебания, а во втором — только 900, относительная фаза станет как раз обратной по отношению к тому, что было вначале. Иначе говоря, маятник, имевший вначале большую амплитуду, остановится, тогда как маятник, неподвижный вначале, начнет качаться изо всех сил!
Итак, мы видим, что такое сложное движение можно рассматривать в рамках идеи резонансов, когда энергия от одного маятника переходит к другому, или как суперпозицию двух движений с постоянной амплитудой и различными частотами.
Глава 49 СОБСТВЕННЫЕ КОЛЕБАНИЯ
§ 1. Отражение волн
В этой главе мы рассмотрим ряд замечательных явлений, возникающих в результате «заключения» волны в некоторую ограниченную область. Сначала нам придется установить несколько частных фактов, относящихся, например, к колебанию струны, а затем, обобщив эти факты, мы придем, по-видимому, к наиболее далеко идущему принципу математической физики.
Первый пример волн в ограниченном пространстве — это волны в пространстве, ограниченном с одной стороны. Давайте возьмем простой случай одномерной волны на струне. Можно было бы рассмотреть плоскую звуковую волну в пространстве, ограниченном с одной стороны стенкой, или какие-то другие примеры той же природы, но для наших теперешних целей вполне достаточно простой струны. Предположим, что один конец струны закреплен, ну, например, вмурован в «абсолютно жесткую» стенку. Математически это можно описать, указав, что перемещение струны у в точке x=0 должно быть нулем, ибо конец струны не может двигаться. Далее, если бы в этом деле не участвовала стенка, то, как мы знаем, общее решение, описывающее движение струны, можно было бы представить в виде суммы двух функций F(x-ct) и G(x+ct), причем первая описывает волну, бегущую по струне в одну сторону, а вторая — в другую, так что
(49.1)
будет общим решением для любой струны. Но нам, помимо этого, нужно еще удовлетворить условию неподвижности одного конца. Если в уравнении (49.1) мы положим х=0 и посмотрим, какие будут у в любой момент t, то получим y=F(-ct)+G(+ct). Но эта сумма должна быть нулем в любой момент времени, а это означает, что функция G(+ct) должна быть равна -F(-ct). Другими словами, функция G от некоторой величины должна быть равна функции -F от той же величины со знаком минус. Подставляя снова полученный результат в уравнение (49.1), находим решение поставленной задачи:
(49.2)
Ясно, что это выражение всегда даст y=0, если х положить равным нулю.
На фиг. 49.1 представлена волна, идущая в отрицательном x-направлении вблизи точки х=0, и гипотетическая волна, идущая в противоположном направлении с обратным знаком и с другой стороны от начала координат.
Фиг. 49.1. Отражение от стенки как суперпозиция двух бегущих волн.
Я сказал «гипотетическая», потому что с другой стороны, конечно, никакой колеблющейся струны нет. Истинное же движение струны должно рассматриваться как сумма этих двух волн в области положительных х. Достигнув начала координат, они в точке х=0 полностью уничтожат друг друга, а затем вторая (отраженная) волна, идущая, разумеется, в противоположном направлении, окажется единственной волной в области положительных х. Эти результаты эквивалентны следующему утверждению: волна, достигнув защемленного конца струны, отражается от него с изменением знака. Такое отражение всегда можно понять, если представить себе, как нечто дошедшее до конца струны вылетит затем из-за стены «вверх ногами». Короче говоря, если мы предположим, что струна бесконечна и что, где бы ни находилась волна, бегущая в одном направлении, всегда существует симметричная ей относительно точки х=0 другая волна, бегущая в противоположном направлении, то в самой точке х=0 никакого перемещения не будет, а поэтому безразлично, защемлена ли струна в этом месте или нет.
Следующий наш пример — отражение периодической волны. Предположим, что волна, описываемая функцией F(x-ct), представляет собой синусоидальную волну, которая затем отражается. Тогда отраженная волна -F(-х-ct) тоже будет синусоидальной волной той же частоты, но пойдет она в противоположном направлении. Эту ситуацию проще всего описать с помощью комплексных функций
Нетрудно убедиться, что если подставить их в выражение (49.2) и положить х=0, то в любой момент времени t перемещение будет равно нулю и, следовательно, необходимое условие окажется выполненным. Воспользовавшись теперь свойством экспоненты, можно записать результат в более простом виде:
(49.3)
Мы получили нечто новое и интересное. Из этого решения ясно, что если мы посмотрим на любую точку х нашей струны, то увидим, что она осциллирует с частотой ω. Совершенно неважно, где находится эта точка, все равно частота будет той же самой! Однако на струне есть такие места (где sin(ωx/c)=0), которые вообще не перемещаются. Более того, если в любой момент времени t сделать моментальный снимок колеблющейся струны, то на фотографии получится синусоидальная волна, но величина ее амплитуды будет зависеть от времени t. Из выражения (49.3) можно видеть, что длина одного цикла синусоидальной волны равна длине какой-либо из волн:
(49.4)
Неподвижные точки удовлетворяют условию sin(ωx/c)=0, которое означает, что ωx/c=0, π, 2π, ..., nπ, ... . Эти точки называются узлами. Каждая точка между двумя соседними узлами движется синусоидально вверх и вниз, но способ ее движения остается фиксированным в пространстве. Это основная характеристика того, что называется собственным колебанием, гармоникой или модой. Если движение обладает тем свойством, что каждая точка предмета движется строго синусоидально и все точки движутся с одинаковой частотой (хотя одни, может быть, больше, а другие меньше), то мы имеем дело с собственным колебанием.
§ 2. Волны в ограниченном пространстве и собственные частоты
Перейдем к обсуждению следующей интересной задачи. Что произойдет, если струну закрепить с двух концов, скажем в точках x=0 и x=L? Давайте начнем с идеи отражения волны, с некоего горба, движущегося в одном направлении. С течением времени этот горб подойдет к одному концу струны и в конце концов превратится в небольшой всплеск, поскольку здесь он складывается с перевернутым ответным горбом, идущим с другой стороны. Наконец первый горб совсем исчезнет, а в обратном направлении побежит другой, «ответный» горб, и весь процесс повторится уже на другом конце. Как видите, задача решается совсем просто, впрочем здесь возникает интересный вопрос: можно ли в этом случае получить синусоидальную волну (только что описанное решение периодично, но, разумеется, не синусоидально периодично). Давайте попытаемся «вставить» в нашу струну синусоидально периодическую волну. Если один конец струны закреплен, то мы знаем, что должно получиться нечто похожее на наше предыдущее решение (49.3). Но то же самое должно получиться и у второго конца, ведь он тоже закреплен. Поэтому единственная возможность получить периодическое синусоидальное движение—это взять волну, которая в точности укладывается на длине струны. В противном случае мы не получим собственной частоты, с которой струна могла бы продолжать свои колебания. Короче говоря, если по струне пустить синусоидальную волну, которая в точности укладывается на ее длине, то она сохраняет свою идеальную синусообразную форму и будет гармонически колебаться с некоторой частотой.
Математически мы можем задать форму волны в виде функции sinkx, где k=ω/c, как и в уравнениях (49.3) и (49.4). Эта функция обращается в нуль при х=0, однако то же условие должно выполняться и на другом конце струны. Дело в том, что k уже не будет произвольным, как в случае полуограниченной струны. Оба конца могут быть закреплены при одном-единственном условии, что sinkL=0. Но чтобы синус был равен нулю, его угол должен быть кратен целому числу π, например 0, π, 2π и т. д. Поэтому уравнение
(49.5)
в зависимости от того целого числа, которое мы подставим в него, дает полный набор различных чисел k. При этом каждому числу k соответствует частота ω, которая по формуле (49.3) равна просто
(49.6)
Итак, мы нашли, что синусоидальные колебания струны могут происходить только с некоторыми определенными частотами. Это — наиболее важная характеристика волн в ограниченной области. Сколь бы сложна ни была система, всегда оказывается, что в ней могут быть чисто синусоидальные колебания, но частота их определяется свойствами данной системы и природой ее границ. В случае струны возможно множество различных частот, каждой из которых соответствует определенное собственное колебание — движение, синусоидально повторяющее самое себя.
На фиг. 49.2 показаны первые три собственные гармоники нашей струны.
Фиг. 49.2. Первые три гармоники колеблющейся струны.
Длина волны λ первой из них равна 2L. В этом легко убедиться, продолжив волну до точки x=2L и получив полный цикл синусоидальной волны. Угловая частота ω равна в общем случае 2πc, деленному на длину волны λ, а поскольку сейчас у нас λ=2L, то частота будет равна πс/L, что согласуется с формулой (49.6) при n=1. Обозначим эту частоту через ω1 Следующая собственная гармоника напоминает бантик из двух петель с узлом посредине. Ее длина просто равна L. Соответствующая величина k, а следовательно, и частота ω должны быть вдвое большими, т. е частота равна 2ω1. Частота третьей собственной гармоники оказывается равной Зω1 и т. д. Таким образом, различные собственные гармоники кратны целому числу низшей частоты ω1 т. е. ω1, 2ω1, 3ω1 и т. д.
Вернемся теперь к общему движению струны. Оказывается, что любое возможное движение можно рассматривать как одновременное действие некоторого числа собственных колебаний. На самом деле для описания наиболее общего движения должно быть одновременно возбуждено бесконечное число собственных гармоник. Чтобы получить некоторое представление о том, что происходит при таком сложении, давайте посмотрим, что получится при одновременном колебании двух первых собственных гармоник. Пусть первая из них колеблется так, как это показано в ряде схематических чертежей фиг. 49.3, где изображены отклонения струны через равные промежутки времени на протяжении полуцикла низшей частоты.
Предположим теперь, что одновременно с первой собственной гармоникой работает и вторая. Последовательные положения струны при возбуждении этой собственной гармоники показаны тоже на фиг. 49.3 пунктирной линией. По отношению к первой гармонике они сдвинуты по фазе на 90°. Это означает, что в начальный момент никакого отклонения не было, но скорости двух половинок струны направлены в противоположные стороны. Вспомним теперь общий принцип линейных систем: если взять любые два решения, то сумма их тоже будет решением. Поэтому перемещения, полученные сложением двух решений, показанных на фиг. 49.3, будут третьим возможным решением.
Фиг. 49.3. Две гармоники, напоминающие при сложении бегущую волну.
На этом же рисунке показан и результат сложения, который начинает напоминать горб, пробегающий взад и вперед по струне от одного конца до другого, хотя с помощью только двух собственных гармоник нельзя построить достаточно хорошей картины такого движения; их нужно гораздо больше. Этот результат представляет на самом деле частный случай основного принципа линейных систем, который гласит:
Любое движение можно рассматривать как составленное из различных собственных гармоник, взятых с надлежащими амплитудами и фазами.
Значение этого принципа обусловлено тем фактом, что каждое собственное колебание — очень простая вещь — это просто синусоидальное движение во времени. По правде говоря, даже общее движение струны — еще не самая сложная вещь; существует движение куда более сложное, скажем такое, как вибрация крыльев самолета. Тем не менее даже у крыльев самолета можно обнаружить некие собственные кручения с определенными частотами. А если так, то полное движение можно рассматривать как суперпозицию гармонических колебаний (за исключением тех случаев, когда вибрация настолько велика, что система уже не может рассматриваться как линейная).
§ 3. Двумерные собственные колебания
Сейчас мы перейдем к рассмотрению очень интересного поведения собственных гармоник в двумерных колебаниях. До сих пор мы говорили только об одномерных колебаниях: натянутой струне или звуковых волнах в трубе. В конце концов мы должны добраться до трех измерений, но сначала давайте остановимся на более легком этапе — этапе двумерных колебаний. Возьмем для большей определенности прямоугольный резиновый барабан, перепонка которого закреплена по краям так, что на прямоугольном крае барабана она перемещаться не может. Пусть размеры прямоугольника будут равны а и b, как это показано на фиг. 49.4.
Фиг. 49.4. Колебание прямоугольной пластинки.
Прежде всего, каковы характеристики возможного движения? Можно начать с того же, с чего мы начали, когда рассматривали пример со струной. Если бы никакого закрепления не было вовсе, то можно было бы ожидать появления волн, бегущих в некотором направлении, например синусоидальной волны, описываемой функцией ехр(iωt) ехр[-i(kxx)+i(kyy)], направление движения которой зависит от относительной величины чисел kx и ky. А как теперь сделать узел на оси х, т. е. при y=0? Используя ту же идею, что и для одномерной струны, можно добавить волну, описываемую комплексной функцией -exp(iωt)ехр[-i(kxx)-i(kyy)].
Суперпозиция этих волн в результате дает нулевое перемещение при y=0 независимо от того, каковы будут значения х и t. (Хотя эти функции будут определены и для отрицательных значений у там, где никакого барабана нет и колебаться нечему, но на это можно не обращать никакого внимания. Ведь нам хотелось устранить перемещение при у=0, и мы добились этого.) Вторую функцию в этом случае можно рассматривать как отраженную волну.
Однако нам нужно получить узел не только на линии y=0, но и на линии у=b. Как же это сделать? Решение такой задачи связано с некоторыми вещами, которыми мы занимались при изучении отражения света от кристалла. Волны, гасящие друг друга при y=0, могут сделать то же самое и при у=b, только когда 2bsinθ равно целому числу длин волн λ, (θ — угол, показанный на фиг. 49.4):
(49.7)
Точно таким же образом, т.е. сложением еще двух функций [-exp(iωt)]exp[i(kxx)+i(kyy)] и [+exp(iχt)]exp[i(kxx)-i(kyy)], каждая из которых представляет отражение другой от линии х=0, можно устроить узел и на оси у. Условие того, что линия х=а будет тоже узловой, получается так же, как и условие при у=b, т. е. 2acosθ должно быть равно целому числу длин волн:
(49.8)
Тогда окончательный результат таков: волны, «заключенные» в ящике, имеют вид стоячей волны, т. е. образуют какие-то определенные собственные гармоники.
Таким образом, если мы хотим иметь дело с собственными гармониками, то должны удовлетворить двум написанным выше условиям. Для начала давайте найдем длину волны. Исключив из уравнений (49.7) и (49.8) угол θ, можно выразить длину волны через a, b, n и m. Легче всего это сделать так: сначала разделить обе части уравнений соответственно на 2b и 2a, а затем возвести их в квадрат и сложить. В результате мы получим уравнение
которое легко разрешить относительно λ:
(49.9)
Итак, мы определили длину волны через два целых числа, а по длине волны мы немедленно получаем частоту ω, ибо, как известно, частота равна 2πc, деленной на длину волны.
Этот результат настолько важен и интересен, что необходимо теперь получить его строго математически без использования аналогий с отражением. Давайте представим колебание в виде суперпозиции четырех волн, подобранных таким образом, чтобы все четыре линии x=0, х=а, y=0 и у=b были узловыми. Потребуем еще, чтобы все эти волны имели одинаковую частоту, т. е. чтобы результирующее движение представляло собственное колебание. Из главы об отражении света мы уже знаем, что функция exp(iωt)exp[-i(kxx)+i(kyy)] описывает волну, идущую в направлении, указанном на фиг. 49.4. По-прежнему остается справедливым уравнение (49.6), т. е. k=ω/c, с той разницей, что теперь
(49.10)
Из рисунка ясно, что kx=kcosθ, а ky=ksinθ.
Таким образом, наше выражение для перемещения прямоугольной перепонки барабана (назовем это перемещение φ) запишется в виде
(49.11а)
Хотя выглядит это довольно неприглядно, сумма таких экспонент, в сущности, не так уж громоздка. Их можно свернуть в синусы, так что перемещение, как оказывается, приобретает вид
(49.11б)
Другими словами, получились знакомые синусоидальные колебания, форма которых тоже синусоидальна как в направлении оси х, так и в направлении оси у. Граничные условия при x=0 и y=0 удовлетворяются автоматически. Однако мы хотим, кроме того, чтобы φ обращалось в нуль при х=а и у=b. Для этого мы должны наложить два дополнительных условия, а именно kxa и kxb должны быть равны целому числу n (эти целые числа могут быть разными для kxa и kyb!). Но поскольку, как мы видели, kx=kcosθ и ky=ksinθ, то отсюда немедленно получаются уравнения (49.7) и (49.8), а из них следует окончательный результат (49.9).
Возьмем теперь для примера прямоугольник, ширина которого вдвое больше высоты. Если положить а=2b и воспользоваться уравнениями (49.4) и (49.9), то можно вычислить частоты всех гармоник
(49.12)
В табл. 49.1 перечислено несколько простых гармоник и качественно показана их форма.
Таблица 49.1 ПРОСТЫЕ ГАРМОНИКИ И ИХ ФОРМА
Следует отметить наиболее важную особенность этого частного случая — частоты не кратны ни друг другу, ни какому-то другому числу. Представление о том, что собственные частоты гармонически связаны друг с другом, в общем случае неверно. Оно неверно ни для системы размерности, большей единицы, ни даже для одномерной системы, более сложной, чем однородная и равномерно натянутая струна. Простейшим примером может служить подвешенная цепочка, натяжение которой вверху меньше, чем внизу. Если возбудить в такой цепочке гармонические колебания, то возникнут собственные гармоники с различными частотами, однако частоты не будут просто кратными какому-то числу, да и сама форма гармоник больше не будет синусоидальной.
Еще причудливей оказываются гармоники более сложных систем. Человеческий рот, например, представляет собой полость, расположенную над голосовыми связками. Движением языка и губ можно создать либо трубу с открытым концом, либо трубу с закрытым концом, причем диаметры и формы этой трубы будут раз личными. В общем это страшно сложный резонатор, но тем не менее все же резонатор. При разговоре мы с помощью голосовых связок создаем какой-то тон. Тон этот довольно сложен, в него входит множество звуков, но благодаря различным резонансным частотам полость рта еще больше модифицирует его. Певец, например, может петь различные гласные: «а», «о», «у» и еще другие с той же самой высотой, но звучат они по-разному, ибо различные гармоники по-разному резонируют в этой полости. Огромную роль резонансных частот полости в образовании голосовых звуков можно продемонстрировать на очень простом опыте. Как известно, скорость звука обратно пропорциональна квадратному корню из плотности, поэтому для разных газов она различна. Если вместо воздуха мы используем гелий, плотность которого меньше, то скорость звука в нем окажется больше и все резонансные частоты полости будут больше. Следовательно, если бы мы могли перед тем, как начать говорить, наполнить наши легкие гелием, то, хотя голосовые связки по-прежнему колебались бы с той же частотой, характер нашего голоса резко изменился бы.
§ 4. Связанные маятники
Напоследок необходимо подчеркнуть, что гармоники возникают не только в сложных непрерывных системах, но и в очень простых механических системах. Хорошим примером этого служит рассмотренная в предыдущей главе система двух связанных маятников. Там мы показали, что общее движение этой системы можно рассматривать как суперпозицию двух типов гармонических движений с различными частотами, так что даже такую систему можно рассматривать с точки зрения собственных гармоник. В струне возбуждается бесконечное число собственных гармоник, у двумерной поверхности их тоже бесконечно много. В каком-то смысле здесь получается даже двойная бесконечность (если бы мы только знали, как работать с бесконечностями!). Но в простом механическом устройстве, обладающем только двумя степенями свободы и требующем для своего описания лишь двух переменных, возбуждаются всего две гармоники.
Попробуем найти математически эти две гармоники для случая, когда длины маятников одинаковы. Пусть отклонение одного маятника будет х, а другого — y, как это показано на фиг. 49.5.
Фиг. 49.5. Два связанных маятника.
При отсутствии пружины сила тяжести, действующая на первый маятник, пропорциональна его отклонению. Если бы здесь не было пружины, то для одного маятника появилась бы некоторая собственная частота ω0, а уравнение движения в этом случае приобрело бы вид
(49.13)
Второй маятник при отсутствии пружины качался бы точно так же, как и первый. Однако при наличии пружины в дополнение к восстанавливающей силе, возникающей в результате гравитации, появляется еще добавочная сила от пружины, которая стремится «стянуть» маятники. Эта сила зависит от превышения отклонения х над отклонением у и пропорциональна их разности, т. е. она равна некоторой постоянной, зависящей только от геометрии, умноженной на (х-у). Та же сила, но в обратном направлении действует на второй маятник. Поэтому уравнения движения, которые мы должны решить, будут следующими:
(49.14)
Чтобы найти движение, при котором оба маятника колеблются с одинаковой частотой, мы должны определить, насколько отклоняется каждый из них. Другими словами, маятник А и маятник В будут колебаться с одинаковой частотой и с какими-то амплитудами А и B, отношение которых фиксировано. Давайте проверим, насколько подходит такое решение:
(49.15)
Если подставить его в уравнения (49.14) и собрать подобные члены, то получим
(49.16)
При выводе этих уравнений мы сократили общий множитель еiωt и разделили все на m.
Теперь мы видим, что получились два уравнения для, казалось бы, двух неизвестных. Однако на самом деле здесь не два неизвестных, ибо общие масштабы движения нельзя найти из этих уравнений. Они могут дать нам только отношение А к В, причем оба уравнения должны дать одинаковую величину. Требование согласованности уравнений друг с другом накладывает требование на частоту: она должна быть какой-то очень специальной.
Но найти частоту в этом частном случае довольно легко. Если перемножить оба уравнения, то мы получим
(49.17)
В обеих сторонах можно сократить произведение АВ, за исключением тех случаев, когда либо А, либо В равно нулю, что означает отсутствие движения вообще. Но если движение есть, то должны быть равны между собой и другие сомножители, что приводит к квадратному уравнению. В результате получаются две возможные частоты:
(49.18)
Более того, если подставить эти значения частот снова в уравнения (49.16), то для первой частоты мы получим А=В, т. е. пружина вообще не будет растягиваться и оба маятника колеблются с частотой ω0, как если бы пружины вообще не было. В другом решении, когда А=-В, пружина увеличивает восстанавливающую силу и частота возрастает. Более интересен случай, когда маятники имеют различные длины. Анализ этого случая, который очень похож на то, что мы недавно проделали, рекомендуем в качестве упражнения провести самим читателям.
§ 5. Линейные системы
Давайте теперь подытожим рассмотренные выше идеи, которые все являются аспектами, по-видимому, наиболее общего и удивительного принципа математической физики. Если у нас есть линейная система, характеристики которой не зависят от времени, то движение ее, вообще говоря, не обязано быть каким-то особенно простым. На самом деле оно может быть чрезвычайно сложным, однако существуют такие особые движения (обычно их целый ряд), при которых форма колебания синусоидально зависит от времени. Для колеблющихся систем, о которых сейчас шла речь, мы обычно получали мнимую экспоненту, но вместо того, чтобы сказать «экспоненциально», я предпочел сказать «синусоидально». Однако если стремиться к большей общности, то нужно говорить о каких-то особых движениях, очень специальной формы, изменяющихся экспоненциально со временем. Наиболее общее движение систем всегда можно представить в виде суперпозиции движений, включающих каждую из различных экспонент.
Есть смысл подчеркнуть еще раз специально для случая синусоидального движения: линейная система не обязательно должна двигаться чисто синусоидально, т. е. с одной определенной частотой, но как бы она ни двигалась, это движение можно представить в виде суперпозиции чисто синусоидальных колебаний. Частота каждого из этих колебаний, как и форма волны, зависит от свойств системы. Общее движение любой такой системы характеризуется заданием амплитуды и фазы каждой из гармоник при их сложении. Можно сказать это и по-другому: колебание любой линейной системы эквивалентно набору гармонических независимых осцилляторов, частоты которых соответствуют частотам собственных гармоник данной системы.
Эту главу мы закончим замечанием о связи гармоник с квантовой механикой. Колеблющимися объектами и величинами, которые изменяются со временем в квантовой механике, являются амплитуды вероятности, которые определяют вероятности обнаружения электрона или системы электронов в данном месте. Эта амплитуда может изменяться в пространстве и времени и удовлетворяет линейному уравнению. Но при переходе к квантовой механике происходит переименование. То, что мы называли частотой амплитуды вероятности, переходит в энергию в ее классическом смысле. Поэтому установленный выше принцип можно перевести на язык квантовой механики, заменив слово частота словом энергия. Получится примерно так: квантовомеханическая система, например атом, не обязательно обладает определенной энергией, точно так же, как простая механическая система не обязательно имеет определенную частоту, но каково бы ни было поведение системы, его всегда можно представить в виде суперпозиции состояний с определенной энергией. Энергия каждого состояния, как и форма амплитуды, которая дает вероятность нахождения частицы в различных местах, определяется свойствами атома. Общее движение может быть описано заданием амплитуд каждого из различных энергетических состояний. Именно здесь кроется причина возникновения энергетических уровней в квантовой механике. Поскольку квантовая механика все описывает в виде волн, то при некоторых обстоятельствах, когда электрон не обладает достаточной энергией, чтобы бесповоротно оторваться от протона, он представляет собой просто волну в ограниченном пространстве. Поэтому, так же как и для ограниченной струны, при решении волнового уравнения в квантовой механике в подобном случае возникают определенные дискретные частоты. В квантовомеханической интерпретации это будут определенные энергии. Следовательно, квантовомеханическая система, вследствие того что она описывается с помощью волн, может иметь определенные состояния с фиксированной энергией; примером могут служить дискретные энергетические уровни атомов.
Глава 50 ГАРМОНИКИ
§ 1. Музыкальные звуки
Говорят, что Пифагор первый обнаружил тот интересный факт, что одновременное звучание двух одинаковых струн различной длины приятнее для слуха, если длины этих струн относятся друг к другу как небольшие целые числа. Если длины струн относятся как 1:2, то это — музыкальная октава; если они относятся как 2:3, то это соответствует интервалу между нотами до и соль и называется квинтой. Эти интервалы считаются «приятно» звучащими аккордами. На Пифагора произвело такое впечатление это открытие, что на его основе он создал школу «пифагорийцев», как их называли, которые мистически верили в великую силу чисел. Они полагали, что нечто подобное будет открыто и в отношении планет, или «сфер». Иногда можно услышать такое выражение: «музыка сфер». Смысл его в том, что в природе предполагалось существование числовой связи между орбитами планет или между другими вещами. Это считается чем-то вроде суеверия древних греков. Но далеко ли от этого ушел наш сегодняшний научный интерес к количественным соотношениям? Открытие Пифагора, помимо геометрии, было первым примером установления числовых связей в природе. Поистине должно быть было удивительно вдруг неожиданно обнаружить, что в природе есть такие факты, которые описываются простыми числовыми соотношениями. Обычное измерение длин позволяет предсказать то, что, казалось бы, не имеет никакого отношения к геометрии,— создание «приятных» звуков. Это открытие привело к мысли, что арифметика и математический анализ, по-видимому, могут служить хорошим орудием в понимании природы. Результаты современной науки полностью подтверждают такую точку зрения.
Пифагор смог сделать свое открытие лишь с помощью экспериментальных наблюдений. Однако все значение этого открытия, по-видимому, не было ему ясно. А случись это, и развитие физики началось бы гораздо раньше. (Впрочем, всегда легко рассуждать о том, что сделал кто-то когда-то и что на его месте следовало бы сделать!)
Можно отметить еще одну, третью сторону этого интересного открытия: оно касается двух нот, которые звучат приятно для слуха. Но далеко ли ушли мы от Пифагора в понимании того, почему только некоторые звуки приятны для слуха? Общая теория эстетики, по-видимому, ненамного продвинулась со времен Пифагора. Итак, одно это открытие греков имеет три аспекта: эксперимент, математические соотношения и эстетику. Физики пока добились успеха только в первых двух. В этой главе мы расскажем о современном понимании открытия Пифагора.
Среди звуков, которые мы слышим, есть такой сорт, который называется шумом. Ему соответствуют какие-то нерегулярные колебания барабанной перепонки уха, вызванные нерегулярными колебаниями находящихся поблизости объектов. Если начертить диаграмму зависимости давления воздуха на барабанную перепонку (а следовательно, и перемещения ее) от времени, то график, соответствующий шуму, будет выглядеть так, как это изображено на фиг. 50.1,а.
Фиг. 50.1. Давление как функция времени. а — для шума; б — для музыкального звука.
(Такой шум может, например, вызвать топание ногой.) А музыкальный звук имеет другой характер. Музыка характеризуется наличием более или менее длительных тонов, или музыкальных «нот». (Кстати, музыкальные инструменты тоже умеют производить шум!)
Тон может длиться сравнительно недолго, например когда мы ударяем по клавише фортепьяно, или неопределенно долго, когда, скажем, флейтист берет длинную ноту.
В чем состоит особенность музыкальной ноты с точки зрения давления воздуха? Музыкальный звук отличается от шума тем, что график его периодичен. Форма колебаний давления воздуха со временем пусть даже какая-то неправильная, но она должна повторяться снова и снова. Пример зависимости давления от времени для музыкального звука показан на приведенной выше фиг. 50.1.б.
Обычно музыканты, говоря о музыкальном тоне, определяют три его характеристики — громкость, высоту и «качество». «Громкость», как известно, определяется величиной изменения давления. «Высоте» соответствует период времени повторения основной формы давления («низкие» ноты имеют более длинный период, нежели «высокие»). А под «качеством» тона понимается разница, которую мы способны уловить между двумя нотами одинаковой громкости и высоты. Мы прекрасно различаем звучание гобоя, скрипки или сопрано, даже если высота издаваемых ими звуков кажется одинаковой. Здесь уже дело идет о структуре периодически повторяющейся формы.
Давайте кратко рассмотрим звук, производимый вибрирующей струной.
Если оттянуть струну, а затем отпустить ее, то последующее движение будет определяться волнами, которые мы возбудили. Эти волны, как вы знаете, пойдут в обоих направлениях по струне, а затем отразятся от ее концов. Так они будут бегать взад и вперед довольно долго. И сколь бы сложны ни были эти волны, они будут повторяться периодически снова и снова.
Период этих повторений равен просто времени T, которое требуется волне, чтобы пробежать дважды всю длину струны. Ведь это как раз то время, которое необходимо для того, чтобы любая волна, отразившись от каждого конца, вернулась в начальное положение и продолжала движение в первоначальном направлении. Время, необходимое для того, чтобы волна достигла конца струны в любом направлении, одинаково. Каждая точка струны после целого периода возвращается в свое исходное положение, затем опять отклоняется от него и снова, спустя период, возвращается, и т. д.
Возникающий при этом звук тоже должен повторять те же колебания; вот почему мы, тронув струну, получаем музыкальный звук.
§ 2. Ряд Фурье
В предыдущей главе мы познакомились с другой точкой зрения на колеблющуюся систему. Мы видели, что в струне возникают различные собственные гармоники и что любое частное колебание, которое только возможно получить из начальных условий, можно рассматривать как составленную в надлежащей пропорции комбинацию нескольких одновременно осциллирующих собственных гармоник. Для струны мы нашли, что собственные гармоники имеют частоты ω0, 2ω0, 3ω0, .... Поэтому наиболее общее движение струны складывается из синусоидальных колебаний основной частоты ω0, затем второй гармоники 2ω0, затем третьей гармоники Зω0 и т. д. Основная гармоника повторяется через каждый период T1=2π/ω0, вторая гармоника — через каждый период T2=2π/2ω0; она повторяется также и через каждый период Т1=2Т2, т. е. после двух своих периодов. Точно таким же образом через период Т1 повторяется и третья гармоника. В этом отрезке укладываются три ее периода. И снова мы понимаем, почему задетая струна через период T1 полностью повторяет форму своего движения. Так получается музыкальный звук.
До сих пор мы говорили о движении струны. Однако звук, который представляет собой движение воздуха, вызванное движением струны, тоже должен состоять из тех же гармоник, хотя здесь мы уже не можем говорить о собственных гармониках воздуха. К тому же относительная сила различных гармоник в воздухе может быть совсем другой, чем в струне, особенно если струна «связана» с воздухом посредством «звучащей доски». Разные гармоники по-разному связаны с воздухом.
Если для музыкального тона функция f(t) представляет давление воздуха в зависимости от времени (скажем, такая, как на фиг. 50.1.б), то можно ожидать, что f(t) записывается в виде суммы некоторого числа простых гармонических функций от времени (подобных cosωt) для каждой из различных гармонических частот. Если период колебаний равен Т, то основная угловая частота будет ω=2π/Т, а следующие гармоники будут 2ω, 3ω и т. д.
Здесь появляется небольшое усложнение. Мы не вправе ожидать, что для каждой частоты начальные фазы обязательно будут равны друг другу. Поэтому нужно пользоваться функциями типа cos(ωt+φ). Вместо этого, однако, проще использовать для каждой частоты как синус, так и косинус. Напомним, что
(50.1)
а поскольку φ — постоянная, то любые синусоидальные колебания с частотой ω могут быть записаны в виде суммы членов, в один из которых входит sinωt, а в другой — cosωt.
Итак, мы приходим к заключению, что любая периодическая функция f(t) с периодом Т математически может быть записана в виде
(50.2)
где ω=2π/T, а a и b — числовые постоянные, указывающие, с каким весом каждая компонента колебания входит в общее колебание f(t). Для большей общности мы добавили в нашу формулу член с нулевой частотой а0, хотя обычно для музыкальных тонов он равен нулю. Это просто сдвиг средней величины звукового давления (т. е. сдвиг «нулевого» уровня). С этим членом наша формула верна для любого случая. Уравнение (50.2) схематически показано на фиг. 50.2.
Фиг. 50.2. Любая периодическая функция f(t) равна сумме простых гармонических функций.
Амплитуды гармонических функций аn и bn выбираются по специальному правилу. На рисунке они показаны только схематически без соблюдения масштаба. [Ряд (50.2) называется рядом Фурье для функций f(t).]
Мы сказали, что любую периодическую функцию можно написать в таком виде. Следует внести небольшую поправку и подчеркнуть, что в такой ряд можно разложить вообще любую звуковую волну или любую функцию, с которой мы сталкиваемся в физике. Математики, конечно, могут придумать такую функцию, что ее нельзя будет составить из простых гармонических (например, функцию, которая «заворачивает» назад, так что для некоторых величин t она имеет два значения!). Однако здесь нам не стоит беспокоиться о таких функциях.
§ 3. Качество и гармония
Теперь мы уже можем описать, чем определяется «качество» музыкального тона. Оно определяется относительным количеством различных гармоник, т. е. относительными величинами а и b. Тон, содержащий только первую гармонику, называется «чистым», а тон с несколькими сильными гармониками называется «богатым». Скрипка дает гармоники в одной пропорции, а гобой — в другой.
Можно «изготовить» различные музыкальные тоны, если подсоединить к громкоговорителю несколько «осцилляторов». (Осциллятор обычно дает приблизительно чистые простые гармонические колебания) В качестве частот осцилляторов мы выберем ω, 2ω, 3ω и т. д. Приделав к каждому осциллятору регулятор громкости, можно смешивать гармоники в любой желаемой пропорции и тем самым создавать звуки различного качества. Примерно так работает электрический орган. Клавиши выбирают частоту основного осциллятора, а педали контролируют относительную пропорцию различных гармоник. С помощью этих регуляторов можно заставить орган звучать как флейту, или как гобой, или как скрипку.
Интересно, что для получения такого «искусственного» звука нет никакой необходимости разделять осцилляторы на «синусные» и «косинусные» — для каждой частоты нам достаточно только одного осциллятора. Наше ухо не очень чувствительно к относительной фазе гармоник. Оно воспринимает «синусную» и «косинусную» части частоты в целом. Поэтому наш анализ более точен, чем это необходимо для объяснения субъективной стороны музыки. Однако реакция микрофона или другого физического инструмента все-таки зависит от фазы, и наш полный анализ для таких случаев просто необходим.
«Качество» разговорной речи определяется гласными звуками. Форма рта определяет частоты собственных гармоник колебаний звука в нем. Некоторые из этих гармоник возбуждаются звуковыми волнами от голосовых связок. Таким способом происходит усиление одних гармоник по сравнению с другими. Когда мы меняем форму рта, мы даем преимущество гармоникам разных частот над другими. Благодаря этому эффекту, например, имеется разница между звуком «о—о—о» и звуком «а—а—а».
Всем известно, что каждый гласный звук, скажем «о—о—о», когда мы говорим или поем, всегда похож сам на себя как при высоких, так и при низких частотах. Из описанного нами механизма мы бы ожидали, что когда мы открываем рот и произносим звук «а—а—а», то тем самым мы выделяем какие-то определенные частоты, которые не должны измениться при повышении голоса. Таким образом, с изменением высоты отношение важных гармоник к основному тону, т. е. то, что мы называем «качеством», должно как будто изменяться. Очевидно, механизм, с помощью которого мы узнаем звуки речи, основан не на соотношении различных гармоник.
Что же можно теперь сказать об открытии Пифагора? Мы понимаем, что основные частоты двух струн, длины которых относятся как 2:3, тоже будут относиться как 3:2. Но почему же вместе они «приятно звучат»? Разгадку, по-видимому, нужно искать в частотах гармоник. Вторая гармоника короткой струны будет иметь ту же самую частоту, что и третья гармоника длинной струны. (Легко показать или просто поверить, что, задев струну, мы возбуждаем несколько сильных нижних гармоник.)
По-видимому, справедливо следующее правило: ноты звучат гармонично, когда у них есть гармоники с одинаковой частотой. Ноты диссонируют, если их высшие гармоники имеют частоты, близкие друг к другу, но достаточно отличающиеся для того, чтобы между ними возникали быстрые биения. Однако, почему биения звучат неприятно и почему унисон высших гармоник звучит приятно, мы не умеем ни определить, ни описать. Исходя из наших знаний, мы не можем сказать, что должно приятно звучать, так же как, например, что должно приятно пахнуть. Иными словами, наше понимание этого явления не идет дальше простого утверждения, что когда ноты звучат в унисон, то это приятно. Но отсюда, кроме свойства гармонии в музыке, нам ничего не вывести.
Гармонические соотношения, которые мы только что описали, легко проверить, проделав несложный опыт на фортепьяно. Давайте обозначим три последовательные ноты до в середине клавиатуры через до, до' и до", а три последовательные ноты соль, расположенные непосредственно выше их, через соль, соль' и соль". Основные гармоники при этом будут иметь следующие относительные частоты:
Вот как можно продемонстрировать эти гармонические соотношения. Давайте медленно нажмем клавишу до' так, чтобы она не зазвучала, но чтобы демпфер приподнялся. Если теперь нажать до, то вместе с основной гармоникой будет возбуждена и вторая гармоника, которая возбудит основную гармонику струны до'. Если теперь отпустить клавишу до (оставляя нажатой клавишу до'), то демпфер заглушит струну до, и мы можем услышать, как замирает тихий звук струны до'. Точно таким же образом третья гармоника до может вызвать звучание струны соль' или шестая гармоника до (которая звучит гораздо тише) может вызвать колебание основной гармоники струны соль".
Совершенно другой результат получится, если мы сначала потихоньку нажмем соль, а затем ударим по клавише до'. Третья гармоника до' будет соответствовать четвертой гармонике соль, так что будет возбуждена только четвертая гармоника соль. Мы можем услышать (если слушать очень внимательно) звук соль", который на две октавы выше, чем соль, которую мы нажали! Можно придумать еще очень много комбинаций этой игры.
Попутно заметим, что мажорный лад можно просто определить условием, что каждый из трех мажорных аккордов (фа— ля—до), (до—ми—соль) и (соль—си-бемоль—ре) представляет последовательность тонов с отношением частот (4:5:6). Эти отношения и тот факт, что в октаве (до—до', соль—соль' и т. д.) частоты относятся как 1:2, определяют в «идеальном» случае весь строй, который называется «натуральным, или пифагорийским строем». Но обычно клавишные инструменты типа фортепьяно не настраиваются таким образом, а устраивается небольшая «подтасовка», так что для всех возможных начальных тонов отношение частот только приблизительно верно. При таком строе, названном «темперированным», октава (для которой отношение частот по-прежнему равно 1:2) делится на 12 равных интервалов, так что отношение частот для каждого интервала равно (2)1/12. Для квинты отношение частот будет уже не 3/2, а (2)7/12=1,499, но для большинства людей оно достаточно близко к 3/2[38].
Итак, мы установили правила благозвучия через совпадение гармоник. Может быть, это совпадение и является причиной благозвучия? Кто-то утверждал, что два абсолютно чистых тона, т. е. тщательно очищенных от высших гармоник, не дают ощущения благозвучия или неблагозвучия (диссонанса), когда их частоты равны или приблизительно равны ожидаемому отношению. (Это очень сложный эксперимент, поскольку приготовить чистые тоны очень трудно по причинам, которые мы увидим дальше.) Мы не можем с уверенностью сказать, сравнивает ли ухо гармоники или занимается арифметикой, когда мы решаем, что звук нам нравится.
§ 4. Коэффициенты Фурье
Вернемся теперь к утверждению о том, что каждую ноту, т. е. любое периодическое колебание, можно представить в виде надлежащей комбинации гармоник. Хотелось бы знать, как можно найти нужную долю каждой гармоники. Конечно, если нам даны все коэффициенты а и b, то, пользуясь формулой (50.2), легко подсчитать функцию f(t). Теперь же вопрос состоит в том, как можно найти коэффициенты при различных гармониках, если нам задана функция f(t)? (Нетрудно испечь пирог, если есть рецепт, но как, отведав пирог, написать его рецепт?)
Фурье открыл, что на самом деле сделать это не очень трудно. Член а0 уж наверняка нетрудно найти. Мы говорили, что он равен среднему значению f(t) на протяжении одного периода (от t=0 до t=T). Легко увидеть, что это действительно так. Среднее значение синуса или косинуса на протяжении одного периода равно нулю. На протяжении двух, или трех, или другого целого числа периодов оно тоже равно нулю. Таким образом, среднее значение всех членов с правой стороны (50.2), за исключением только а0, равно нулю. (Напомним, что мы должны выбрать ω=2π/T.)
Далее, поскольку среднее значение суммы равно сумме средних, то среднее значение функции f(t) равно просто среднему от а0. Но ведь а0 — просто постоянная, и ее среднее значение равно ей самой. Вспоминая определение среднего, мы получаем
(50.3)
Найти остальные коэффициенты ненамного труднее. Чтобы сделать это, используем один фокус, открытый самим Фурье. Предположим, что мы умножили обе стороны уравнения (50.2) на какую-то гармоническую функцию, скажем на cos7ωt. При этом получается
(50.4)
А теперь усредним обе стороны равенства. Среднее от члена a0cos7ωt по периоду Т пропорционально среднему от косинуса по семи его периодам. Но последнее просто равно нулю. Среднее почти всех остальных членов тоже будет равно нулю. Действительно, давайте рассмотрим член с а1. Мы знаем, что в общем случае
(50.5)
так что член с а1 равен
(50.6)
Таким образом получаются два косинуса: один с восемью полными периодами, а другой с шестью. Оба они равны нулю. Поэтому среднее значение этого члена тоже равно нулю.
Для члена с а2 мы получаем cos9ωt и cos5ωt, каждый из которых при усреднении превратится в нуль. Для члена с а9 получится cos16ωt и cos(-2ωt). Но cos(-2ωt) — это то же самое, что cos2ωt, так что опять оба члена дадут при усреднении нуль. Ясно, что все слагаемые с косинусами, за исключением одного, дадут при усреднении нуль. Этим единственным слагаемым будет член с а7. Для него же мы получим
(50.7)
Косинус нуля равен единице, а среднее от него, разумеется, тоже равно единице. Итак, мы получили, что среднее от всех членов с косинусами уравнения (50.4) равно 1/2а7.
Еще легче расправиться с синусами. Когда мы умножаем их на косинус типа cos nωt, то таким же методом можно показать, что все они при усреднении обращаются в нуль.
Мы видим, что способ, придуманный Фурье, действует как своеобразное сито. Когда мы умножаем на cos7ωt и усредняем, то все члены, кроме а7, отсеиваются и в результате остается
(50.8)
или
(50.9)
Пусть читатель сам докажет, что коэффициенты b7, например, находятся с помощью умножения (50.2) на sin 7ωt и усреднения обеих частей. Результат таков:
(50.10)
Но то, что верно для 7, очевидно, верно и для любого другого целого числа. Теперь мы запишем результат нашего доказательства в следующей, более элегантной математической форме. Если m и n — целые отличные от нуля числа и если ω=2π/T, то
(50.11)
(50.12)
(50.13)
(50.14)
(50.15)
(50.16)
В предыдущих главах для описания простого гармонического движения было удобно пользоваться экспоненциальной функцией. Вместо cosωt мы использовали Re ехр(iωt) —действительную часть экспоненциальной функции. В этой главе мы использовали синус и косинус, потому что с ними, пожалуй, немного проще проводить доказательства. Однако наш окончательный результат, уравнение (50.13), можно записать в более компактной форме:
(50.17)
где аn — комплексное число аn-ibn (с b0=0). Если мы всюду будем пользоваться одним и тем же обозначением, то должны также написать
(50.18)
Итак, теперь мы умеем раскладывать периодическую волну на ее гармонические компоненты. Эта процедура называется разложением в ряд Фурье, а отдельные члены называются фурье-компонентами. Однако до сих пор мы не показали, что, определив все фурье-компоненты и затем сложив их, мы действительно придем назад к нашей функции f(t). Математики доказали, что для широкого класса функций (в сущности, для всех функций, интересных физикам), которые можно проинтегрировать, мы снова получаем f(t). Но есть одно небольшое исключение. Если функция f(t) разрывна, т. е. если она неожиданно прыгает от одного значения к другому, сумма Фурье такой функции даст в точке разрыва значение, лежащее посредине между верхним и нижним значениями. Таким образом, если у нас есть странная функция f(t)=0 для 0≤t<t0 и f(t)=1 для t0≤t≤T, то ее сумма Фурье всюду даст нам правильную величину, за исключением точки t0, где вместо единицы получится 1/2. Во всяком случае, физически даже нельзя требовать, чтобы функция была всюду нулем вплоть до точки t0, а в самой точке t0 вдруг стала равной единице. Может быть, стоило бы специально для физиков издать такой «указ», что любая разрывная функция (которая может быть только упрощением настоящей физической функции) в точке разрыва должна принимать среднее значение. Тогда любая такая функция, с любым конечным числом «ступенек», как и все другие интересные для физики функции, будет правильно описываться рядом Фурье.
В качестве упражнения предлагаем читателю найти ряд Фурье для функции, показанной на фиг. 50.3.
Фиг. 50.3. Ступенчатая функция. f(t)=+1 для 0<t<T/2, f(t)=-1 для T/2<t<T.
Поскольку эту функцию нельзя записать в точной алгебраической форме, то брать интеграл от 0 до Т обычным способом невозможно. Однако если разделить его на две части: по интервалу от 0 до T/2 [на котором функция f(t)=1] и по интервалу от T/2 до T [на котором f(t) -1], то интеграл легко берется. В результате должно получиться
(50.19)
где ω=2π/T. Таким образом, оказывается, что для нашей ступенчатой волны (со специально выбранной фазой) будут только нечетные гармоники, причем их амплитуды обратно пропорциональны частотам.
Давайте проверим, что для некоторого значения t результат (50.19) действительно дает снова f(t). Возьмем f=T/4или ωt=π/2. Тогда
(50.20)
(50.21)
Сумма этого ряда[39] равна π/4, а, стало быть, f(t)=1.
§ 5. Теорема об энергии
Энергия волны пропорциональна квадрату ее амплитуды. Для сложной волны энергия за один период пропорциональна 0∫Tf2(t)dt. Эту энергию можно связать с коэффициентами Фурье. Напишем
(50.22)
После раскрытия квадрата в правой части мы получим сумму всевозможных перекрестных членов типа a5cos5ωtb7cos7ωt. Однако выше мы уже показали [уравнения (50.11) и (50.12)], что интегралы от всех таких членов по одному периоду равны нулю, так что останутся только квадратные члены, подобные a25cos25ωt. Интеграл от любого квадрата косинуса или синуса по одному периоду равен Т/2, так что получаем
(50.23)
Это уравнение называют «теоремой об энергии», которая говорит, что полная энергия волны равна просто сумме энергий всех ее фурье-компонент. Применяя, например, эту теорему к ряду (50.19), мы получаем
поскольку [f(t)]2=1. Таким образом мы узнали, что сумма квадратов обратных нечетных чисел равна π2/8. Точно так же, выписав сначала ряд Фурье для функции и используя затем теорему об энергии, можно доказать результат, понадобившийся нам в гл. 45, т. е. что 1+1/24+1/34+... равно π4/90.
§ 6. Нелинейная реакция
Наконец, в теории гармоник есть одно очень важное явление, которое необходимо отметить, учитывая его практическую важность, но это уже относится к области нелинейных эффектов. Во всех рассмотренных нами до сих пор системах все предполагалось линейным; реакция на действие силы, например перемещение или ускорение, всегда была пропорциональна силам. Токи в электрической цепи были тоже пропорциональны напряжениям и т. д. Теперь мы хотим рассмотреть случаи, когда строгая пропорциональность отсутствует. Представим на минуту устройство, реакция которого xвыход≡xвых в момент t определяется внешним воздействием xвход≡xвх в тот же момент t.
Например, xвх может быть силой, а хвых — перемещением, или хвх — ток, а xвых — напряжение. Если бы устройство было линейное, то мы бы получили
(50.24)
где К — постоянная, не зависящая ни от t, ни от хвх. Предположим, однако, что устройство только приблизительно линейное, т. е. на самом деле нужно писать
(50.25)
где ε мало по сравнению с единицей. Такие линейная и нелинейная реакции показаны на фиг. 50.4.
Фиг. 50.4. Реакции, а — линейная, xвых=kxвх; б—нелинейная, xвых=k(хвх+εx2вх).
Нелинейная реакция приводит к нескольким важным практическим следствиям. Некоторые из них мы сейчас обсудим. Посмотрим сначала, что получается, если пропустить через подобное устройство «чистый» тон. Пусть xвх=cosωt. Если мы построим график зависимости xвых от времени, то получим сплошную кривую, показанную на фиг. 50.5.
Фиг. 50.5. Реакция нелинейного устройства на входящий сигнал cosωt. Для сравнения показана линейная реакция.
Для сравнения там же проведена пунктирная кривая, представляющая реакцию линейной системы. Мы видим, что на выходе получается уже не косинусообразная функция. Она более острая в вершине и более плоская в основании. Поэтому мы говорим, что выходной сигнал искажен. Однако, как известно, такая волна не будет уже чистым тоном, а приобретает какие-то высшие гармоники. Можно найти эти гармоники. Подставляя xвх=cosωt в уравнение (50.25), получаем
(50.26)
Используя равенство cos2θ=1/2(l-cos2θ), находим
(50.27)
Таким образом, в выходящей волне присутствует не только основная компонента, которая была во входящей волне, но и некоторая доля второй гармоники. Кроме того, в выходящей волне появился постоянный член К(ε/2), который соответствует сдвигу среднего значения, показанному на фиг. 50.5. Эффект возникновения сдвига среднего значения называется выпрямлением. Нелинейное устройство будет выпрямлять и давать на выходе высшие гармоники. Хотя предположенная нами нелинейность только добавляет вторую гармонику, нелинейность высшего порядка, например хвх3 или xвх4, даст уже более высокие гармоники.
Другим результатом нелинейной реакции является модуляция. Если входящая функция содержит два (или больше) чистых тона, то на выходе получатся не только их гармоники, но и другие частотные компоненты. Пусть хвх=Аcosω1t+Bcosω2t, причем ω1 и ω2 не находятся в рациональном отношении друг к другу. Тогда в дополнение к линейному члену (равному произведению К на входящую волну) на выходе мы получим
(50.28)
(50.29)
Первые два члена в скобках уравнения (50.29) — старые знакомые. Они дают нулевую и вторую гармоники, но последний член — это уже нечто новое.
На этот новый «перекрестный член» АВcosω1tcosω2t можно смотреть с двух сторон. Во-первых, если две частоты сильно отличаются друг от друга (например, ω1 много больше ω2), то мы можем считать, что перекрестный член представляет косинусообразные колебания с переменной амплитудой. Я имею в виду такую запись:
(50.30)
где
(50.31)
Мы говорим, что амплитуда колебаний cosω1 модулируется с частотой ω2.
Во-вторых, этот же перекрестный член можно рассматривать с другой точки зрения:
(50.32)
т. е. можно сказать, что возникают две новые компоненты, одна из которых равна сумме частот ω1+ω2, а другая — разности ω1-ω2.
Таким образом, существуют два различных, но эквивалентных способа толкования одного и того же явления. В предельном случае ω1≫ω2 можно связать эти две различные точки зрения, заметив, что поскольку (ω1+ω2) и (ω1-ω2) близки друг к другу, то между ними должны наблюдаться биения. Но эти биения дают в результате модуляцию амплитуды колебаний со средней частотой ω1, половинкой разности частот 2ω2. Теперь вы видите, почему эти два описания эквивалентны.
Итак, мы обнаружили, что нелинейная реакция дает несколько эффектов: выпрямление, возникновение гармоник и модуляцию, т. е. возникновение компонент с суммой и разностью частот.
Обратите внимание, что все эти эффекты пропорциональны не только коэффициенту нелинейности ε, но и произведению амплитуд: либо A2, либо В2, либо АВ. Поэтому мы ожидаем, что они будут более важны для сильных сигналов, чем для слабых.
Описанные нами эффекты находят множество практических приложений. Во-первых, что касается звука, то, как полагают, наше ухо — нелинейный аппарат. Такое представление возникло из того факта, что, даже когда звук содержит только чистые тоны, при большой громкости возникает ощущение, что мы слышим высшие гармоники, а также сумму и разность частот.
Аппараты, используемые обычно в звуковоспроизводящих устройствах,— усилители, громкоговорители и т. д.— всегда имеют какие-то нелинейности. Они искажают звук, порождая гармоники, которых вначале не было. Эти новые гармоники воспринимаются ухом и, несомненно, нежелательны. Именно по этой причине высокочастотная аппаратура должна быть как можно «более линейной». (Почему нелинейность нашего собственного уха не «неприятна» и откуда нам знать, что нелинейность «сидит» в громкоговорителе, а не в нашем ухе,— не ясно!)
Однако в некоторых случаях нелинейность совершенно необходима, и в некоторых частях радиопередающих и принимающих устройств она намеренно делается побольше. При радиопередачах с помощью амплитудной модуляции сигналы от «голоса» (частоты порядка нескольких килогерц) комбинируются с «несущим сигналом» (с частотой порядка нескольких мегагерц) в нелинейной цепи, которая называется модулятором. При этом получаются модулированные колебания, которые затем излучаются в эфир. В приемнике сигнал снова попадает в нелинейный контур, который складывает и вычитает частоты модулированного сигнала, выделяя снова звуковой сигнал.
Когда мы разбирали вопрос прохождения света через вещество, мы предполагали, что вынужденные колебания зарядов пропорциональны электрическому полю света, т. е. мы брали линейную реакцию. Это действительно очень хорошее приближение. Только в последние несколько лет были построены источники света (лазеры), которые дают интенсивность, достаточную для наблюдения нелинейных эффектов. Теперь можно создавать гармоники световых частот. Если пропускать через кусок стекла сильный красный свет, то выходит он оттуда с небольшим добавком второй гармоники — голубого света!
Глава 51 ВОЛНЫ
§ 1. Волна от движущегося предмета
Мы закончили количественный анализ волн, но посвятим еще одну дополнительную главу некоторым качественным оценкам различных явлений, связанных с волнами; для подробного анализа они слишком сложны. Волнами мы занимаемся уже на протяжении нескольких глав, поэтому предмет настоящей главы было бы вернее назвать «некоторые из более сложных явлений, связанных с волнами».
Первым объектом нашего обсуждения будет эффект, производимый источником волн, движущимся со скоростью, превышающей скорость распространения волн, т. е. быстрее их фазовой скорости. Рассмотрим сначала волны, которые, подобно звуку или свету, имеют определенную постоянную скорость. Если источник звука движется со сверхзвуковой скоростью, то произойдет нечто вроде следующего. Пусть в данный момент источник, находящийся в точке x1, порождает звуковую волну (фиг. 51.1), тогда в следующий момент источник переместится в точку х2, а волна из точки х1 распространится в радиусе r1, который меньше расстояния, пройденного источником, а из точки х2, разумеется, пойдет другая волна.
Фиг. 51.1. Фронт ударной волны, образующий конус с вершиной в источнике и углом полураствора θ=arcsin(cw/v).
Когда источник переместится еще дальше, в точку х3, и отсюда тоже пойдет волна, то волна из точки х2 распространится в радиусе r2, а волна из точки х1— в радиусе r3. Конечно, все это происходит непрерывно, а не какими-то этапами, и поэтому получается целый ряд таких волновых колец с общей касательной линией, проходящей через центр источника. Мы видим, что источник, вместо того чтобы порождать сферические волны, как это произошло бы, будь он неподвижен, порождает фронт, образующий в трехмерном пространстве конус или в двухмерном пару пересекающихся прямых линий. Из рисунка нетрудно найти угол между этими двумя линиями. За данный отрезок времени источник проходит расстояние, пропорциональное его скорости v, скажем х3-х1. Тем временем фронт волны распространится на расстояние r3, пропорциональное cw— скорости волны. Ясно поэтому, что синус угла полураствора равен отношению скорости волны к скорости источника, а это может быть только тогда, когда cw меньше v, или скорость объекта больше скорости волны:
(51.1)
Интересно, что движущийся предмет вовсе не обязан быть источником звука, оказывается, что когда предмет движется быстрее скорости звука, то он сам производит звук. Ему для этого вовсе не обязательно вибрировать. Любой предмет, движущийся через среду быстрее, чем эта среда переносит волны, будет автоматически порождать волны просто благодаря своему движению. Это проще понять для случая звука, но тоже самое происходит и со светом. Сначала может показаться, что ничто не может двигаться быстрее скорости света. Однако фазовая скорость света в стекле, например, меньше, чем в пустоте, а через кусок стекла можно пропустить такую частицу, скорость которой будет очень близка к скорости света в пустоте, тогда как фазовая скорость света в стекле может быть равна только 2/3 этой скорости. Частица, летящая быстрее света в среде, порождает коническую световую волну с вершиной в источнике, подобно волнам, вызванным лодкой (эти волны одной и той же природы). Измеряя угол при вершине конуса, мы можем определить скорость частицы. В физике это используется для измерения скорости частиц как один из методов определения их энергии при высокоэнергетических исследованиях. Единственное, что приходится измерять,— это направление излучения света.
Такое излучение называют излучением Черенкова, который первый наблюдал его. Тамм и Франк теоретически выяснили, насколько оно должно быть интенсивным. За эту работу этим ученым в 1958 г. совместно была присуждена Нобелевская премия.
Подобное же явление для случая звука показано здесь на фиг. 51.2; это фотография объекта, движущегося через газ со скоростью, превышающей скорость звука.
Фиг. 51.2. Ударная волна в газе, вызванная снарядом, движущимся быстрее звука.
Изменение в давлении приводит к изменению показателя преломления, поэтому границу волн с помощью специальной оптической системы можно сделать видимой. Итак, предмет, движущийся быстрее скорости звука, действительно дает коническую волну. Однако при более внимательном рассмотрении оказывается, что граница на самом деле искривлена. В асимптотике это действительно прямая линия, но вблизи вершины она искривлена, и сейчас мы обсудим, отчего так может получаться. Это непосредственно приводит нас ко второй теме данной главы.
§ 2. Ударные волны
Зачастую скорость волны зависит от ее амплитуды, и в случае звука эта зависимость возникает следующим образом. Движущийся в воздухе предмет должен сдвигать его со своего пути, вызывая при этом возмущение в виде какой-то ступенчатой функции давления, причем давление за волновым фронтом оказывается выше, чем в невозмущенной области, т. е. в области, куда волна (которая распространяется с нормальной скоростью) еще не добралась. Воздух за волновым фронтом оказывается адиабатически сжатым, поэтому температура его будет выше, чем перед фронтом. Но скорость звука с температурой увеличивается, поэтому в области позади скачка она оказывается больше скорости звука впереди него.
Это означает, что любое другое возмущение за скачком, вызванное, например, постоянным напором тела или чем-то другим, будет бежать быстрее, чем сам фронт: с увеличением давления скорость увеличивается. Эта картина показана на фиг. 51.3, причем для большей наглядности дополнительные возмущения взяты в виде небольших горбиков.
Фиг. 51.3. «Мгновенные снимки» ударного фронта в последовательные моменты времени.
Мы видим, что области высокого давления с течением времени «подгоняют» фронт волны, пока волна давления в конце концов не превратится в волну с резким фронтом. Если сила волны очень велика, то «в конце концов» означает — сразу же; если же волна довольно слабая, то это займет сравнительно много времени; обычно звук скорее рассеивается и замирает прежде, чем это превращение успеет произойти.
Давление, вызываемое звуком нашей речи, очень мало по сравнению с атмосферным — только одна миллионная часть или что-то в этом роде. Но при изменении давления на величину порядка 1 атм скорость волны увеличивается примерно на 20% и «заострение» фронта волны происходит соответственно быстрее. В природе, по-видимому, ничего не протекает бесконечно быстро и то, что мы называем «резким» фронтом, на самом деле имеет все же небольшую толщину; он не бесконечно крут. Расстояние, на котором все это происходит,— порядка средней длины свободного пробега молекулы, но на таких расстояниях волновое уравнение становится несправедливым, ведь при выводе его мы не учитываем молекулярной структуры газа.
Вернемся снова к фиг. 51.2. Мы видим, что кривизну легко объяснить, если понять, что давление вблизи вершины выше, чем вдали от нее, поэтому угол θ здесь больше. Таким образом, кривизна возникла вследствие зависимости скорости от силы волны. Например, волна от взрыва атомной бомбы в течение некоторого времени движется гораздо быстрее звука, пока не отойдет достаточно далеко и в результате расплывания не будет ослаблена в такой степени, что перепад давления станет малым по сравнению с атмосферным. При этом скорость фронта приближается к скорости звука в газе, в котором он распространяется. (Скорость ударной волны всегда оказывается выше скорости звука в газе перед ней и ниже скорости звука в газе за ней. Таким образом, импульсы, идущие сзади, будут догонять фронт, но сам он движется в среде быстрее, чем нормальная скорость звукового сигнала. Поэтому только по звуку никто не в силах предсказать появление ударной волны, пока не становится слишком поздно. Конечно, свет от взрыва бомбы виден раньше, но предугадать приход ударной волны невозможно, никакого звукового сигнала впереди нее нет.)
Накапливание волн — очень интересное явление, и в основном причина его состоит в том, что после прохода одной волны скорость следующей за ней волны должна возрасти.
Рассмотрим еще один пример того же явления. Представьте себе длинный канал конечной ширины и глубины, заполненный водой. Если с достаточной быстротой двигать вдоль канала поршень, то вода будет собираться перед ним, как снег перед снегоочистителем. Теперь вообразите ситуацию, подобную изображенной на фиг. 51.4, когда где-то в канале вдруг возникает скачок высоты уровня воды.
Фиг. 51.4. Падение воды и водовороты.
Можно показать, что длинные волны в канале идут быстрее по глубокой воде, чем по мелкой. Поэтому любой новый толчок или какие-то иные нерегулярности в энергии, поступающей от поршня, побегут вперед и соберутся на фронте волны. Теоретически мы снова в конце концов должны получить резкий фронт. Однако (см. фиг. 51.4) здесь возникают некоторые усложнения. Вы видите волну, идущую вверх по каналу, причем поршень находится где-то далеко с правой стороны канала. Сначала может показаться, что это хорошая волна, такая, какую и следует ожидать, но дальше она становится острее и острее, пока не произойдет то, что изображено на рисунке. Вода на поверхности начинает сильно бурлить и переливаться вниз, но, что самое существенное, край по-прежнему остается резким, и впереди него нет никакого возмущения.
В действительности волна на воде — вещь куда более сложная, чем звук. Однако для иллюстрации мы попытаемся проанализировать скорость так называемого высокого прилива в канале. Дело не в том, что это очень важно для наших целей (никакого обобщения здесь не будет), это только иллюстрация того, как законы механики, которые мы хорошо знаем, способны объяснить подобное явление.
Фиг. 51.5. Два разреза высокого прилива в канале. Разрез б сделан на интервал времени Δt позднее разреза а.
Вообразите на минуту, что поверхность воды имеет такой вид, как изображено на фиг. 51.5,а, и что на верхнем уровне h2 она движется со скоростью v, а фронт со скоростью u надвигается на невозмущенную поверхность, высота которой h1. Мы хотим определить скорость, с которой движется фронт. За промежуток времени Δt вертикальная плоскость, проходившая вначале через точку x1 передвинется на расстояние vΔt, т. е. от х1 до х2, а фронт волны пройдет расстояние uΔt.
Применим теперь законы сохранения вещества и импульса. Возьмем сначала первый из них: мы видим, что на единицу ширины канала количество вещества h2vΔt, прошедшее мимо точки x1 (область, заштрихованная на фиг. 51.5,б), компенсируется другой заштрихованной областью, представляющей количество вещества (h2-h1)uΔt. Разделив на Δt, получим vh2=u(h2-h1). Но этого еще недостаточно, так как, хотя нам известны h1 и h2, мы еще не знаем ни u, ни v, а хотим найти обе величины.
Следующим шагом будет использование закона сохранения импульса. Мы еще не касались вопросов давления в воде и прочей гидродинамики, но и так ясно, что давление в воде на какой-то глубине должно быть как раз достаточным, чтобы поддерживать столбик воды над этой глубиной. Следовательно, давление воды равно произведению плотности ρ на g и на глубину. Так как давление воды возрастает линейно с глубиной, то среднее давление на плоскость, проходящую, например, через точку х1, равно 1/2ρgh2, что также представляет среднюю силу на единичную ширину и на единичную длину, толкающую плоскость к точке х2. Чтобы получить полную силу, давящую на воду слева, мы должны еще раз умножить на h2. С другой стороны, давление на рассматриваемую область справа дает противоположно направленную силу, которая по тем же причинам равна 1/2ρgh12. Теперь мы должны приравнять эти силы к скорости изменения импульса. Таким образом, нам нужно выяснить, насколько в случае, изображенном на фиг. 51.5,6, импульс больше, чем в случае, показанном на фиг. 51.5,а.
Мы видим, что дополнительная масса, которая приобрела скорость v равна просто ρh2uΔt—ρh2vΔt (на единицу ширины), а умножение ее на v дает дополнительный импульс, который должен быть приравнен к импульсу силы FΔt:
Исключая из этого уравнения v подстановкой vh2=u(h2-h1) и упрощая его, получаем окончательно u2=gh2(h1+h2)/2h1.
Если разность высот очень мала, так что h1 и h2 приблизительно одинаковы, то скорость будет равна √(gh). Как мы увидим позднее, это справедливо только при условии, что длина волны много больше глубины канала.
Аналогичную вещь можно сделать и для ударных волн, только теперь нужно добавить уравнение сохранения внутренней энергии, потому что ударная волна — явление необратимое. Действительно, если в задаче о высокой приливной волне проверить закон сохранения энергии, то мы увидим, что он не выполняется. Когда разность высот мала, то энергия почти сохраняется, но как только разность высот становится более заметной, возникают большие потери. Это проявляется в падении воды и водоворотах, показанных на фиг. 51.4.
С точки зрения адиабатического процесса в ударной волне тоже происходит аналогичная потеря энергии. Энергия в звуковой волне за ударным фронтом уходит на нагревание газа, что соответствует бурлению воды при высоком приливе. Оказывается, что необходимо решить три уравнения, чтобы описать все это для случая звука, причем нужно учесть, что температура за ударной волной и перед ней, как мы видели, не одинакова.
Если мы попытаемся пустить высокий прилив в обратную сторону (h2<h1), то окажется, что потеря энергии отрицательна. Но поскольку энергию взять неоткуда, высокий прилив не может поддерживать сам себя — он не стабилен. Если попытаться создать волну такого вида, то дальше она становится все более и более плоской, ведь зависимость скорости от высоты, которая раньше давала резкий фронт, в нашем случае будет работать в обратную сторону.
§ 3. Волны в твердом теле
Следующий тип волн, о которых нам следует поговорить,— это волны в твердом теле. Мы уже рассмотрели звуковые волны в жидкости и газе, а между ними и звуковыми волнами в твердом теле имеется непосредственная аналогия. Если резко толкнуть твердое тело, то оно сожмется. Оно сопротивляется сжатию и в нем возникнут волны, аналогичные звуковым. Однако в твердом теле могут быть волны и другого рода, которых не бывает в жидкости. Если мы возбудим колебания твердого тела с помощью бокового давления (это называется сдвигом), то тело стремится вернуться в начальное положение. Именно этим, по определению, твердое тело отличается от жидкого. Если искривить жидкость и подержать ее так немного, чтобы она успокоилась, а затем отпустить, то она останется в том же состоянии, но если мы возьмем твердое тело, похожее на дрожащий кусок желе, надавим на него и отпустим, то оно вернется назад, а в теле возникает волна сдвига, которая распространяется так же, как и волна сжатия. Во всех случаях скорость этих волн меньше скорости продольных волн. В каком-то отношении волны сдвига больше напоминают световые волны, ибо здесь мы тоже имеем дело с поляризацией. У звука нет никакой поляризации, это просто волна сжатия, а световые колебания имеют характерную ориентацию, перпендикулярную к направлению их распространения.
Итак, в твердом теле могут быть волны обоих сортов. Во-первых, там распространяются волны сжатия, аналогичные звуку в воздухе, и, во-вторых, волны сдвига. Если наше твердое тело не кристалл, то волна сдвига может быть поляризована в любом направлении. (Конечно, все твердые тела — кристаллы, но если мы возьмем кусок, состоящий из микрокристаллов всех ориентации, то кристаллическая анизотропия усредняется.)
Есть еще один интересный вопрос, касающийся звуковых волн. Что получится, если длина волны в твердом теле становится все меньше и меньше? До каких пор может это продолжаться? Ясно, что она не может стать меньше расстояния между атомами, ибо если под волной мы понимаем такое явление, когда одна точка идет вниз, а следующая — вверх и т. д., то кратчайшая возможная длина волны при этом, очевидно, равна межатомному расстоянию. Вам известно, что колебания могут быть как продольные, так и поперечные, длинноволновые и коротковолновые.
Если мы рассматриваем длины волн, сравнимые с межатомным расстоянием, то скорость уже не будет постоянной; возникает дисперсионный эффект, когда скорость становится зависимой от волнового числа. А высшая гармоника поперечных волн все же должна характеризоваться именно тем, что каждые два соседних атома делают нечто противоположное друг другу.
С атомистической точки зрения ситуация здесь напоминает два связанных маятника, о которых мы уже говорили. У них могут быть два вида собственных колебаний: один — когда они качаются вместе, и другой — когда в противоположные стороны. Так что волны в твердом теле можно рассматривать и с иной точки зрения — как колебания связанных гармонических осцилляторов, подобных огромному числу связанных маятничков, причем высшая гармоника получается, когда маятнички колеблются в противоположные стороны, и низшие — при других соотношениях фаз.
Эти кратчайшие волны настолько малы, что обычно их невозможно получить технически. Однако они очень интересны, поскольку свойства этих коротких звуковых волн помогают нам объяснить в термодинамической теории твердого тела его тепловые свойства, в частности удельную теплоемкость. Переход к предельно коротким звуковым волнам означает переход к индивидуальному движению атомов; это в конечном счете одно и то же.
Очень интересным примером звуковых волн в твердом теле являются волны, идущие по земному шару, как продольные, так и поперечные. Хотя нам и не известно почему, но внутри Земли время от времени происходят землетрясения. Одни породы сдвигаются относительно других, и это движение сходно с очень низким звуком. Из такого источника выходят и путешествуют по всей Земле волны, подобные звуковым, и хотя их длина значительно больше длины обычных звуковых волн, но все же это звуковые волны. Наша Земля не однородна: давление, плотность, сжимаемость и т. д. изменяются с изменением глубины, а поэтому изменяется и скорость. Возникает нечто похожее на показатель преломления, и волны идут не по прямому пути, а по некоторой кривой. Кроме того, картина осложняется тем, что продольные и поперечные волны распространяются с разной скоростью, а поэтому и решения для них будут разными. Если мы в каком-то месте поставим сейсмограф и будем наблюдать, как скачет его самописец после того, как где-то произошло землетрясение, то мы увидим не просто какие-то неправильные прыжки. Мы увидим, как самописец сначала запрыгает, затем успокоится, затем опять запрыгает. Более конкретные детали происходящего зависят от положения сейсмографа. Если он расположен достаточно близко к месту землетрясения, то сначала мы примем продольные волны от возмущения, а уж потом, несколько секунд спустя,— поперечные, ибо они идут медленней. Измеряя разницу времени между их приходами, можно сказать, насколько далеко произошло землетрясение, разумеется, если мы достаточно хорошо знаем скорости и состав внутренних областей.
На фиг. 51.6 показан пример поведения различных видов волн в Земле.
Фиг. 51.6. Схема земного шара. Показаны пути продольных и поперечных звуковых волн.
Два сорта волн обозначены различными значками. Если в каком-то месте (назовем его «источник») произошло землетрясение, то поперечные и продольные волны, идущие по прямому пути, придут на станцию в разные моменты времени. Кроме того, возникнут отражения от границ неоднородности, дающие в результате другие пути и времена. Подобные исследования показали, что у Земли есть некое ядро, не проводящее поперечных волн. Однако даже если станция расположена диаметрально противоположно источнику, то поперечные волны все же приходят, но с неправильной фазой. Это получается оттого, что поперечные волны, падающие наклонно на поверхность, разделяющую два вещества, всегда рождают две новые волны: поперечную и продольную. Но внутри ядра Земли поперечные волны не распространяются (по крайней мере в отличие от продольных волн для них этого не обнаружено). Затем на границе ядра оба вида волн возникают вновь и попадают на станцию.
Именно по поведению волн, вызванных землетрясениями, было обнаружено, что поперечные волны не могут распространяться в некоторой сфере внутри Земли. Это означает, что центр Земли жидкий в том смысле, что он не проводит поперечных волн. Изучение землетрясений — это единственный источник наших сведений о внутреннем строении Земли. Таким образом, в результате большого числа наблюдений на различных станциях в период многих землетрясений были выяснены все детали; известно все: скорости, кривые и т. д. Мы знаем скорости различных сортов волн на любой глубине. А зная это, мы, следовательно, можем выяснить, каковы собственные гармоники Земли, ибо нам известна скорость распространения звуковых волн: другими словами, известны упругие свойства на любой глубине. Предположим, что мы приплюснули земной эллипсоид и затем отпустили его. Задача определения периода и формы свободных колебаний сводится просто к вопросу о суперпозиции волн, идущих по эллипсоиду. Мы уже выяснили, что при подобном возмущении возникает множество гармоник, начиная от низшей, которая для Земли эллипсоидальна, и вплоть до более высоких и более сложных.
Чилийское землетрясение в мае 1960 г. произвело такой «шум», что его эхо много раз обошло вокруг Земли. Как раз к этому времени были изготовлены новые высокочувствительные сейсмографы, с помощью которых определялись основные гармоники Земли и сравнивались с величинами, вычисленными из теории звука по известным скоростям, найденным из других независимых землетрясений. Результат этого эксперимента показан на фиг. 51.7, где отложена сила сигнала в зависимости от его частоты (фурье-анализ).
Фиг. 51.7. Зависимость силы от частоты, зарегистрированная сейсмографом в городах Нака (Перу) и Изабелла (Калифорния). Согласованность (или когерентность) обозначает степень связанности сигналов, регистрируемых этими станциями.
Заметьте, что одни из принимаемых частот оказывались более сильными, чем другие; наблюдались очень четкие максимумы. Это и есть собственные частоты Земли, поскольку они являются главными частотами ее колебаний.
Иными словами, если все движение Земли сводится к суперпозиции множества различных гармоник, то можно надеяться, что запись нерегулярных толчков на любой станции даст одну и ту же суперпозицию многих частот. Если проанализировать это в терминах частот, то мы сможем определить характеристические частоты Земли. Тонкие вертикальные линии на рисунке изображают рассчитанные частоты, и мы видим замечательное согласие, убеждающее нас, что теория звука вполне работает и внутри Земли.
Очень интересный факт обнаруживается на фиг. 51.8, где представлены очень точные измерения (с еще большим разрешением) низшей эллипсоидальной гармоники.
Фиг. 51.8. Фурье-анализ записи высокочувствительного сейсмографа на станции Изабелла. Хорошо виден спектральный дублет.
Заметьте, что здесь не один, а два немного отличающихся максимума: первый — с периодом 54,7 мин и второй — 53,1 мин. Природа этих двух максимумов не была известна, когда они были обнаружены, хотя с тех пор ее могли найти. Существуют по крайней мере два правдоподобных объяснения. Одно из них — это возможная асимметрия в распределении вещества Земли, которая может дать два подобных максимума. Другое, еще более интересное объяснение состоит в следующем. Вообразите волны, идущие от источника вокруг Земли в двух направлениях. Если мы в уравнениях движения учтем эффект вращения Земли, которым обычно пренебрегали при анализе, то скорости этих волн окажутся разными. Движение во вращающейся системе из-за действия кориолисовой силы изменяется, и это может вызвать наблюдаемое расщепление.
Коротко о методе получения этих кривых. На сейсмографе мы записываем не зависимость амплитуды от частоты, а перемещение как функцию времени, причем всегда какой-то очень неправильной и причудливой формы.
Чтобы найти из нее долю различных синусообразных волн для всех частот, мы уже знаем, что нужно делать. Фокус состоит в умножении полученных данных на синусообразную волну данной частоты и интегрировании, т. е. усреднении; при этом усреднении все другие частоты исчезают.
Таким образом, на рисунках фактически показаны графики интегралов от произведения полученных данных на синусообразные волны с различным числом периодов в минуту.
§ 4. Поверхностные волны
Следующий интересный тип волн, которые, несомненно, видел каждый и которые обычно в элементарных курсах служат примером волн,— это волны на поверхности воды. Вы скоро убедитесь, что более неудачного примера придумать трудно, ибо они нисколько не похожи ни на звук, ни на свет; здесь собрались все трудности, которые только могут быть в волнах. Давайте начнем с длинных волн на глубокой воде. Если считать океан бесконечно глубоким и на его поверхности происходят какие-то возмущения, то возникнут волны. Вообще говоря, возможны любые возмущения, но синусоидальное движение с очень небольшим возмущением дает волны, напоминающие обычные гладкие океанские волны, идущие к берегу. Вода, разумеется, в среднем остается на месте, а движутся сами волны. Что ж это за движение — поперечное или продольное? Оно не может быть ни тем, ни другим: ни поперечным, ни продольным. Хотя в каждом данном месте горбы чередуются со впадинами, оно не может быть движением вверх и вниз просто из-за закона сохранения количества воды. Куда должна деваться вода из впадины? Ведь она же практически несжимаема. Скорость волн сжатия, т. е. звука в воде, во много раз больше: мы сейчас их не рассматриваем. Итак, для нас сейчас вода несжимаема, поэтому при образовании впадины вода из этого места может двигаться только в стороны. Так оно и получается на самом деле: частички воды вблизи поверхности будут двигаться приблизительно по окружности. Как-нибудь, когда вы будете нежиться на воде, лежа на круге, и придет такой гладкий вал, посмотрите на соседние предметы и вы увидите, что они движутся по окружностям. Так что картина получается неожиданная: здесь мы имеем дело со смесью продольных и поперечных волн. С увеличением глубины круги уменьшаются, пока на достаточной глубине от них ничего не останется (фиг. 51.9).
Фиг. 51.9. Волны, на глубокой воде образуются частицами, движущимися по окружности. Обратите внимание на систематический сдвиг фазы от одной окружности к другой. Кок может при этом двигаться плавающий предмет?
Очень интересно определить скорость таких волн. Это должно быть какой-то комбинацией плотности воды, ускорения силы тяжести, которая в данном случае является восстанавливающей силой, и, возможно, длины волны и глубины. Если мы рассмотрим случай бесконечной глубины, то скорость больше не будет зависеть от нее. Но какую бы формулу для фазовой скорости волн мы ни взяли, она должна содержать эти величины в такой комбинации, чтобы давать правильную размерность. Испробовав множество различных способов, мы найдем, что только одна комбинация g и λ может дать нам размерность скорости, именно √(gλ), которая совсем не включает плотности. На самом деле эта формула для фазовой скорости не вполне точна, и полный анализ динамики, в который мы не будем входить, показывает, что все действительно получится так, как у нас, за исключением √(2π), т. е.
Интересно, что длинные волны бегут быстрее коротких. Так что когда проходящая вдали моторная лодка создает волны, то после некоторого промежутка времени они достигнут берега, но сначала это будут редкие всплески, поскольку первыми приходят длинные волны. Затем приходящие волны становятся все короче и короче, ибо скорость падает как квадратный корень из длины волны.
«Это же неверно,— может возразить кто-нибудь,— ведь чтобы делать такое утверждение, мы должны смотреть на групповую скорость». Правильно, конечно. Формула для фазовой скорости не говорит нам о том, что приходит первым; об этом может нам сказать только групповая скорость. Так что мы должны получить групповую скорость и мы сможем показать, что она равна половине фазовой скорости. Для этого нужно только вспомнить, что фазовая скорость ведет себя как квадратный корень из длины волны. Так же, т. е. как квадратный корень из длины волны, ведет себя и групповая скорость. Но как может групповая скорость быть вдвое меньше фазовой? Посмотрите на группу волн, вызванных проходящей мимо лодкой, и проследите за каким-то определенным гребнем. Вы обнаружите, что он бежит вместе с группой, но постепенно становится все меньше и меньше, а дойдя до переднего фронта, совсем умирает. Но таинственным и непостижимым образом на смену ему с заднего фронта поднимается слабенькая волна и становится она все сильнее и сильнее. Короче говоря, по группе движутся волны, тогда как сама группа движется вдвое медленнее этих волн.
Поскольку групповая и фазовая скорости не равны друг другу, то волны, вызванные движущимся объектом, будут уже не просто коническими, а гораздо более сложными и интересными. Вы можете видеть это на фиг. 51.10, где показаны волны, вызванные движущейся по воде лодкой.
Фиг. 51.10. След прошедшей моторной лодки.
Заметьте, что они совсем не похожи на то, что мы получали для звука (когда скорость не зависит от длины волны), где фронт волны был просто распространяющимся в стороны конусом. Вместо него мы получили волны позади движущегося объекта, фронт которых перпендикулярен его движению, да еще движущиеся под другими углами небольшие волны с боков. Всю эту картину движения волн в целом можно очень красиво воссоздать, зная только, что фазовая скорость пропорциональна квадратному корню из длины волны. Весь фокус заключается в том, что картина волн стационарна относительно лодки (движущейся с постоянной скоростью); все другие виды волн отстанут от нее.
До сих пор мы рассматривали длинные волны, для которых восстанавливающей силой была сила тяжести. Но когда волны становятся очень короткими, то основной восстанавливающей силой оказывается капиллярное притяжение, т. е. энергия поверхностного натяжения. Для волн поверхностного натяжения фазовая скорость равна
где Т — поверхностное натяжение, а ρ — плотность. Здесь все наоборот: чем короче длина волн, тем большей оказывается фазовая скорость. Если же действуют и сила тяжести и капиллярная сила, как это обычно бывает, то мы получаем комбинацию
где k=2π/λ — волновое число. Как видите, скорость волн на воде — вещь действительно довольно сложная. На фиг. 51.11 показана фазовая скорость как функция длины волны.
Фиг. 51.11. График зависимости фазовой скорости от длины волны для воды.
Она велика для очень коротких волн, велика для очень длинных волн, но между ними существует некоторая минимальная скорость распространения. Исходя из этой формулы, можно вычислить и групповую скорость: она оказывается равной 3/2 фазовой скорости для ряби и 1/2 фазовой скорости для волн «тяжести». Слева от минимума групповая скорость больше фазовой, а справа групповая скорость меньше. С этим фактом связано несколько интересных явлений. Поскольку групповая скорость с уменьшением длины волны быстро увеличивается, то, если мы создадим какие-то возмущения, возникнут волны соответствующей длины, которые идут с минимальной скоростью, а впереди них с большей скоростью побегут короткие и очень длинные волны. В любом водоеме можно легко увидеть очень короткие волны, а вот длинные волны наблюдать труднее.
Таким образом, мы убедились, что рябь, которая столь часто используется для иллюстрации простых волн, на самом деле гораздо сложнее и интереснее: у нее нет резкого волнового фронта, как в случае простых волн, подобных звуку или свету. Основная волна, которая вырывается вперед, состоит из мелкой ряби. Благодаря дисперсии резкое возмущение поверхности воды не приводит к резкой волне. Первыми все равно идут очень мелкие волны. Во всяком случае, когда по воде с некоторой скоростью движется объект, то возникает очень сложная картина, поскольку разные волны идут с разной скоростью. Взяв корыто с водой, можно легко продемонстрировать, что самыми быстрыми будут мелкие капиллярные волны, а уже за ними идут более крупные. Кроме того, наклонив корыто, можно увидеть, что там, где меньше глубина, меньше и скорость. Если волна идет под каким-то углом к линии максимального наклона, то она заворачивает в сторону этой линии. Таким способом можно продемонстрировать множество различных вещей и прийти к заключению, что волны на воде — куда более сложная вещь, чем волны в воздухе.
Скорость длинных волн с круговым движением воды уменьшается на мелком месте и увеличивается на глубоком. Таким образом, когда волна идет к берегу, где глубина меньше, она замедляется. Но там, где вода глубже, волна движется быстрее, так что мы снова сталкиваемся с механизмом ударной волны. Однако на этот раз, поскольку волна не столь проста, ударный фронт ее гораздо больше искажен: волна «перегибается через себя» самым привычным для нас образом (фиг. 51.12).
Фиг. 51.12. Морская волна.
Именно это мы видим, когда волна набегает на берег: в ней выявляются все присущие природе трудности. Никому до сих пор не удалось вычислить форму волны в тот момент, когда она разбивается. Это очень легко сделать, когда волны малы, но когда они становятся большими, все слишком усложняется.
Интересное свойство капиллярных волн можно наблюдать при возмущении поверхности движущимся объектом. С точки зрения самого объекта вода течет мимо него, и волны, которые в конечном итоге останутся вместе с ним, всегда будут волнами, которые как раз имеют нужную скорость, чтобы оставаться на воде вместе с объектом. Точно так же если поместить объект в поток, который будет омывать его, то картина волн окажется стационарной и как раз нужной длины волны для того, чтобы двигаться с той же скоростью, что и вода. Но если групповая скорость меньше фазовой, то возмущение идет по потоку назад, поскольку групповая скорость недостаточна для того, чтобы догнать поток. Если же групповая скорость больше фазовой, то волновая картина появится перед объектом. Если пристально следить за плывущим в потоке объектом, то можно заметить впереди него небольшую рябь, а позади него — длинные волны.
Другие интересные явления подобного рода можно наблюдать в льющейся жидкости. Если, например, быстро выливать молоко из бутылки, то можно заметить, как струя молока пересекается множеством перекрещивающихся линий. Это волны, вызванные возмущением на краях бутылки; они очень похожи на волны, вызванные объектом, плывущим по потоку. Но теперь такой эффект возникает с обеих сторон, поэтому получается картина пересекающихся линий.
Итак, мы познакомились с некоторыми интересными свойствами волн, с различными усложнениями, зависящими от фазовой скорости и длины волны, а также с зависимостью скорости волны от глубины и т. д.; все это приводит к весьма сложным, а потому и интересным явлениям природы.
Глава 52 СИММЕТРИЯ ЗАКОНОВ ФИЗИКИ
§ 1. Симметричные операции
В этой главе мы будем говорить о том, что мы называем симметрией физических законов. Подобные симметрии уже обсуждались нами в ряде мест нашего курса, когда говорилось о векторном анализе (вып. 1, гл. 11), теории относительности (вып. 2, гл. 16) и вращениях (вып. 2, гл. 20).
Почему же симметрии так интересуют нас? Прежде всего потому, что симметрия импонирует нашему складу ума, каждому доставляет удовольствие любоваться предметом, который в каком-то смысле симметричен. Любопытно, что окружающий нас мир буквально заполнен симметричными объектами, созданными самой природой. Пожалуй, самый симметричный объект, который только можно себе представить,— это сфера, а природа дает нам массу примеров сферических тел: звезды, планеты, капельки воды в облаках и т. д. А сколько различных, порой причудливых примеров симметрии находим мы в кристаллах горных пород! Изучение их позволяет нам заглянуть внутрь вещества и получить важные сведения о структуре твердого тела. Столь же полон симметриями окружающий нас животный и растительный мир, хотя симметрия цветка или бабочки уже не столь совершенна и не столь фундаментальна, как симметрия кристалла.
Но тема этой главы все же не симметрия предметов, а куда более удивительная симметрия Вселенной — симметрия тех фундаментальных законов, которые управляют всеми процессами физического мира.
Однако что же такое симметрия? Каким образом физический закон может быть «симметричным»? Проблема определения симметрии — одна из основных. Мы уже говорили об очень хорошем определении, которое было дано Вейлем. Суть его состоит в том, что объект считается симметричным, если с ним можно сделать нечто такое, после чего он будет выглядеть точно так же, как и прежде. Например, симметрична ваза, которая, отразившись в зеркале или будучи повернута вокруг своей оси, выглядит точно так же, как и до поворота или отражения. Вопрос, который мы хотим разобрать здесь,— это, что можно сделать с физическим явлением или ситуацией, возникшей при эксперименте, чтобы получился тот же самый результат. Список операций симметрии, в результате которых различные физические явления остаются неизменными, приведен в табл. 52.1.
Таблица 52.1 операции симметрии
§ 2. Симметрия в пространстве и времени
Самое простое, что можно попытаться сделать — это переносить (транслировать) различные явления в пространстве. Если мы в некотором месте сделаем какой-то опыт, а потом построим такую же установку (или просто перенесем старую) в другом месте и повторим наш опыт, то все должно повториться, причем в той же самой последовательности. При этом, конечно, все детали окружения и условия работы, существенные для нашего опыта, на новом месте должны быть теми же, что и прежде, т. е. должны быть тоже перенесены вместе с нашей аппаратурой. О том, что существенно и что не существенно, мы уже говорили и больше не будем останавливаться на этом.
Насколько нам сегодня известно, перемещение во времени тоже не должно изменять физических законов. (Впрочем, обо всем, содержащемся в этой главе, можно сказать: насколько нам известно сегодня!) Это означает, что если мы построим какую-то установку и запустим ее в некоторый момент времени, скажем в 10 часов утра во вторник, а затем построим вторую, точно такую же установку и запустим ее при тех же самых условиях, но ровно на три дня позднее, то эта вторая установка будет работать точно так же, как и первая, т. е. она будет повторять те же действия, в той же последовательности и с теми же интервалами длительности. При этом, конечно, снова подразумевается, что существенные свойства окружения изменяются со временем точно таким же образом, как и прежде.
Необходимо обращать внимание и на разницу, вносимую географией, ибо с изменением положения на Земле некоторые характеристики могут тоже меняться. Если мы в каком-то месте измеряем магнитное поле, а затем вместе со всей аппаратурой переедем куда-то в другое место, то приборы могут и не работать точно таким же образом, как раньше, поскольку магнитное поле в этих различных районах может быть разным. Однако всю ответственность за разницу в этом случае мы можем свалить на магнитное поле Земли. Но если вообразить, что мы передвигаем аппаратуру вместе со всем земным шаром, то, разумеется, никакой разницы быть не должно.
Другое свойство, которое мы тоже подробно обсуждали,— это вращение в пространстве. Если мы повернем нашу аппаратуру на некоторый угол, то она будет работать точно так же, как и прежде, но, разумеется, при непременном условии, что вместе с ней мы повернем все существенное для работы аппаратуры окружение. Проблеме симметрии при вращении в пространстве была посвящена глава 11. Там вы познакомились и с векторным анализом — математическим аппаратом, который наиболее полно и изящно учитывает вращательную симметрию.
Поднявшись в изучении природы на ступеньку выше, мы познакомились с более сложной симметрией — симметрией при равномерном и прямолинейном движении. Это поистине замечательная вещь. Если мы погрузим нашу работающую установку на автомашину (со всем, конечно, существенным окружением) и поедем с постоянной скоростью по прямой дороге, то явления, происходящие в движущейся машине, будут протекать точно так же, как если бы она стояла на месте, т. е. все законы физики остаются теми же самыми.
Нам даже известно, как математически выражается эта симметрия: все математические уравнения должны оставаться неизменными при преобразованиях Лоренца. Кстати, именно изучение проблем теории относительности заострило внимание физиков на симметриях физических законов.
Однако все упомянутые виды симметрии имеют геометрическую природу, причем в некотором смысле утверждается эквивалентность пространства и времени. Но существуют симметрии совершенно другого рода. Например, можно заменить один атом другим атомом того же сорта, или (в несколько другой постановке) существуют атомы одного и того же сорта, т. е. существуют такие группы атомов, что если мы переставим любые два из них, то ничто не изменится. То, что может сделать один атом кислорода определенного сорта, способен сделать и второй.
«Ерунда какая-то,— может возразить какой-нибудь скептик,— ведь это же просто определение того, что означают атомы одного и того же сорта!» Согласен, это может быть просто определением, но все дело в том, что до опыта нам не известно, существуют ли в природе атомы «одного и того же сорта», а экспериментальный факт состоит в том, что таких атомов много, очень много, так что наше утверждение все-таки что-то означает. В указанном смысле одинаковы и так называемые элементарные частицы, из которых сделаны атомы; одинаковы все протоны, одинаковы все положительные π-мезоны и т. д.
После столь длинного списка того, что можно делать, не изменяя при этом явлений, может создаться впечатление, что практически позволено делать все что угодно. Совсем нет. Вот вам пример — просто для того, чтобы продемонстрировать разницу. Допустим, что нас интересует вопрос: «А не остаются ли законы физики теми же самыми при изменении масштаба?» Пусть вы построили какую-то машину, а затем построили точную ее копию, но увеличенную, скажем, в пять раз. Будет ли копия работать точно так же? Нет, не будет! Длина волны света, испускаемого, например, атомами кальция, находящимися внутри ящика, и длина волны, излученная газом атомов кальция, которых в пять раз больше, будет не в пять раз больше, а в точности той же самой. Так что изменится отношение длины волны к размеру излучателя.
Возьмем другой пример. Время от времени в газетах вы видите фотографии моделей знаменитых соборов, сделанные из спичек, — удивительное произведение искусства, более удивительное и потрясающее, чем настоящий собор. А представьте себе, что такой деревянный собор в самом деле построен в натуральную величину. Вы уже чувствуете, что из этого получится! Он не будет стоять, он рухнет, ибо такие увеличенные модели из «спичек» недостаточно прочны. «Правильно,— может сказать кто-нибудь из вас, —но ведь существует внешнее влияние, которое тоже необходимо изменить в соответствующей пропорции!» Вы имеете в виду способность предметов противостоять силе тяжести? Хорошо. Сначала, когда мы взяли модель собора, сделанного из настоящих спичек, и настоящую Землю, то все было отлично и устойчиво. Но потом, когда мы увеличили собор, то должны увеличить и Землю, а это для собора будет еще хуже: ведь сила тяжести станет еще больше!
Сейчас вы, конечно, понимаете, что в основе зависимости явлений от размеров лежит атомная природа строения вещества. Если бы нам удалось построить аппаратуру, которая была бы так мала, что содержала бы всего пять атомов, то такую штуку нельзя было бы произвольно уменьшить или увеличить. Ведь размер отдельного атома не произвольный, он совершенно определенный.
Тот факт, что законы физики не остаются теми же при изменении масштаба, открыл еще Галилей. Он понял, что прочность материалов изменяется не в прямой пропорции с их размерами, и иллюстрировал это свойство на примере, очень похожем на наш собор из спичек. Он рисовал два скелета собаки, один из них обычный, в той пропорции, которая необходима для поддержания ее веса, а второй — необходимый для некой воображаемой «суперсобаки», которая в десять или, может быть, в тысячу раз больше обычной. Получилось нечто громадное и внушительное с совершенно другими пропорциями. Не известно, привели ли Галилея эти соображения к заключению о том, что законы природы должны иметь определенный масштаб; ясно лишь одно, что он был настолько потрясен своим открытием, что счел его столь же важным, как и открытие законов движения. Именно поэтому Галилей опубликовал оба эти закона в одном и том же томе под заглавием «О двух Новых Науках».
Другой хорошо известный пример несимметрии законов — это вращение. В системе, вращающейся с постоянной угловой скоростью, законы физики будут выглядеть совсем иначе, чем в покоящейся. Если мы произведем какой-то опыт, а затем погрузим всю аппаратуру в космический корабль и заставим его вращаться в межпланетном пространстве с постоянной угловой скоростью, то аппаратура из-за наличия центробежных и кориолисовых сил уже не будет работать так, как раньше. В сущности, ведь о вращении Земли мы узнаем, наблюдая лишь за поведением маятника (так называемого «маятника Фуко»). Нам вовсе не нужно для этого «выглядывать наружу», т. е. смотреть на звезды, например.
Следующей в нашем списке стоит очень интересная симметрия. Это обращение времени. На первый взгляд кажется, что оно неверно, что физические законы не могут быть обращены. Ведь всем ясно, что в нашем обычном масштабе явления необратимы.
«Скользит по бумаге перо, За строчкой написанной — новая строчка...»Насколько нам сейчас известно, причиной этой необратимости является огромное число частиц, принимающих участие в обычных процессах. Но если бы мы видели отдельные молекулы, то не могли бы сказать, работает ли вся машина вперед или назад. Поясним, что мы имеем в виду: построим такой прибор, в котором нам известно, что делает каждый из атомов (мы можем наблюдать за всеми их проделками). Построим теперь второй, точно такой же прибор, но запустим его в обратную сторону, т. е. установим его в конечном положении, а все скорости изменим на противоположные. После этого мы увидим в точности то же самое движение, но только все будет происходить в обратной последовательности. Возьмем другой пример. Предположим, что мы засняли на киноленту какой-то процесс, происходящий с веществом, и запустили пленку задом наперед. Тогда ни один из физиков не мог бы сказать: «Это противоречит физическим законам, происходит что-то не то». Если деталей не видно, то все становится совершенно ясно. Например, когда на тротуар падает яйцо и разбивается вдребезги, то вы сразу скажете: «Этот процесс необратим; если мы заснимем его на кинопленку и прокрутим ее наоборот, то яйцо само соберется в скорлупу, которая тут же склеится обратно, а это бессмыслица!» Но если мы видим отдельные атомы, то все кажется нам полностью обратимым. Открыть эту симметрию было, конечно, гораздо труднее, чем другие, но все-таки то, что фундаментальные законы физики, управляющие атомами и молекулами, обратимы во времени, по-видимому, верно.
§ 3. Симметрия и законы сохранения
Даже на этом уровне симметрии физических законов очень увлекательны, но оказывается, что они куда более интересны и удивительны при переходе к квантовой механике. Факт, причину которого я не могу вам объяснить с вашим запасом знаний, но который до сих пор потрясает большинство физиков своей глубиной и красотой, состоит в следующем: в квантовой механике каждой из симметрии соответствует закон сохранения — существует вполне определенная связь между законами сохранения и симметриями физических законов. Сейчас мы можем только это констатировать, не пытаясь вдаваться в объяснения.
Оказывается, например, что симметрия законов физики по отношению к переносу в пространстве вместе с принципами квантовой механики означает сохранение импульса.
То, что законы симметричны при перемещении во времени, означает в квантовой механике сохранение энергии.
Неизменность (инвариантность) при повороте на фиксированный угол в пространстве соответствует сохранению момента количества движения. Среди наиболее мудрейших и удивительнейших вещей в физике эти связи — одни из самых интересных и красивых.
В квантовой механике, кроме того, возникают некоторые симметрии, которые, к несчастью, не имеют классического аналога; их нельзя описать методами классической физики. Вот одна из них. Если ψ — это амплитуда некоторого процесса или чего-то другого, то, как мы знаем, квадрат ее абсолютной величины будет вероятностью этого процесса. Пусть теперь некто сделал свои вычисления, используя не ψ, а ψ', которая отличается от ψ только по фазе [т. е. прежняя ψ умножается на ехр(iΔ), где Δ — какая-то постоянная], тогда квадрат абсолютной величины ψ', который тоже будет вероятностью события, равен квадрату абсолютной величины ψ:
(52.1)
Следовательно, физические законы не изменяются от того, что мы сдвигаем фазу волновой функции на некоторую произвольную постоянную. Это еще одна симметрия. Природа физических законов такова, что сдвиг квантовомеханической фазы не изменяет их. В начале этого параграфа мы говорили, что в квантовой механике каждой симметрии соответствует закон сохранения. И вот оказывается, что закон сохранения, связанный с квантовомеханической фазой, не что иное, как закон сохранения электрического заряда. Словом, это удивительнейшая вещь!
§ 4. Зеркальное отражение
Перейдем к следующему вопросу, который будет занимать нас до конца главы,— это симметрия при отражении в пространстве. Проблема заключается в следующем: симметричны ли физические законы при отражении? Можно ее сформулировать и по-другому. Предположим, что мы построили некое устройство, например часы с множеством колесиков, стрелок и пр. Они идут, внутри у них есть устройство для заводки. Посмотрим теперь на часы в зеркало. Дело не в том, как они выглядят в зеркале. Нет, давайте построим другие часы, в точности такие же, как те первые, отраженные в зеркале. Там, где у первых часов находится винт с правой резьбой, мы поставим винт с левой резьбой, там, где на циферблате стоит цифра «XII», мы на циферблате вторых часов нарисуем «IIX», каждая спиральная пружина закручена в одну сторону у первых часов и в противоположную у зеркально отраженных. Когда все будет закончено, получатся двое часов, каждые из которых будут точным зеркальным отражением других, хотя заметьте, что и те и другие настоящие физические материальные объекты. Возникает вопрос: а что, если и те и другие часы запущены при одинаковых условиях, если пружины их закручены одинаково туго, будут ли они идти и тикать, как точное зеркальное отражение? (Это чисто физический, а вовсе не философский вопрос.) Наша интуиция и наше знание физических законов подсказывают, что будут.
Мы подозреваем, что по крайней мере в этом случае отражение будет одной из симметрии физических законов, т. е. если заменить «право» на «лево», а все остальное оставить тем же самым, то никакой разницы при этом мы обнаружить не сможем. Предположим на минуту, что все это верно. Тогда никакими физическими явлениями невозможно различить, где «право», а где «лево», точно так же, как, скажем, никаким физическим опытом невозможно найти абсолютной скорости движения. Таким образом, с помощью каких-то опытов невозможно абсолютно определить, что мы понимаем под «правым», как противоположностью «левого», поскольку все физические законы должны быть симметричны.
Разумеется, мир наш не должен быть симметричным. Если, например, взять то, что мы называем «географией», то здесь вполне можно определить, где правая сторона. Пусть мы находимся в Нью-Орлеане и смотрим в сторону Чикаго. Тогда Флорида будет от нас справа (конечно, если мы стоим ногами на Земле!). Так что в географии можно определить, где «право» и где «лево». В любой системе реальное положение не должно иметь ту симметрию, о которой идет речь, вопрос в том — симметричны ли законы? Другими словами, противоречит ли физическим законам наличие подобного Земле шара с «левосторонней поверхностью» и человеком, подобным нам, смотрящим в сторону города, подобного Чикаго, с места, подобного Нью-Орлеану, но со всем остальным, перевернутым наоборот, так что Флорида у него будет уже с другой стороны? Ясно, что такая ситуация не кажется невозможной, физическим законам не противоречит такая замена всего левого на правое.
Еще одно обстоятельство: наше определение «правой» стороны не должно зависеть от истории. Иначе было бы очень просто отличить «левое» от «правого» — пойти в магазин запчастей и наугад взять какой-нибудь болт. Вообще говоря, у нас в руках не обязательно окажется «правый болт», но все же более вероятно, что он будет именно правым, а не левым. Но это вопрос истории, или условностей, или общего положения вещей, а не фундаментальных законов. Ведь кто-то может начать выпускать болты с левой резьбой.
Таким образом, нам нужно поискать какие-то другие явления, где бы «правое» входило более фундаментальным образом. Рассмотрим следующую возможность. Известно, что поляризованный свет, пропущенный через сахарный раствор, поворачивает свою плоскость поляризации. Как мы видели в гл. 33 (вып. 3), плоскость поляризации при определенной концентрации сахара поворачивается направо. Казалось бы, мы нашли способ определения «правой стороны», потому что, растворив в воде некоторое количество сахара, мы можем повернуть плоскость поляризации вправо. Но сахар получается из живых организмов, а если мы сделаем его искусственно, то обнаружим, что он не поворачивает плоскости поляризации. Если в этот искусственный сахар, который не поворачивает плоскости поляризации, напустить бактерий (они съедают некоторое количество сахара) и затем отфильтровать их, то обнаружится, что, хотя сахар остался (почти половина первоначального количества), и он поворачивает плоскость поляризации, но теперь уже в другую сторону! Этот факт кажется очень обескураживающим, однако его можно легко объяснить.
Приведем другой пример. Одно из веществ, общее для всех живых существ, основа жизни — это белки (протеин). Белок состоит из цепочек аминокислот. На фиг. 52.1 показана модель аминокислоты, выделенной из белка.
Фиг. 52.1. Модели молекул аланина. Слева — L-аланин; справа — D-аланин.
Эта кислота названа аланином, и на фиг. 52.1 (слева) показано расположение атомов в молекуле аланина, выделенного из белка живых существ. Если же мы попытаемся создать аланин из двуокиси углерода, этана и аммиака (что в самом деле можно сделать — это не столь уже сложная молекула), то обнаружим, что получились не только такие молекулы, но и другие, подобные показанной на фиг. 52.1 (справа), причем в равных количествах! Первые молекулы, те, которые произошли от живых существ, называются L-аланином. Другие же, одинаковые с ним химически в том смысле, что состоят из тех же атомов с теми же связями между ними, образуют «правосторонние» молекулы, которые в отличие от «левосторонних» молекул L-аланина называются D-аланином. Интересно, что если мы будем приготовлять аланин в лаборатории из простых газов, то получится смесь обоих сортов в равных количествах. Жизнь, однако, использует только L-аланин. (Но не без исключения, конечно: то там, то здесь в живых существах встречается и D-аланин, однако эти случаи очень редки. Во все белки входит исключительно L-аланин.) Если мы приготовим оба сорта и будем этой смесью кормить животных, которые любят «есть» его (т. е. усваивают аланин), то окажется, что они не смогут использовать D-аланин, а «съедят» только L-аланин. В результате получится то же, что и с нашим сахаром; после того как бактерии «съедят» тот сахар, который им нравится, остается только «ненастоящий» сорт! (Левосторонний сахар тоже сладкий, а все же не такой, как настоящий, правосторонний!)
Итак, похоже, что явления жизни позволяют отличить «правую» сторону от «левой», поскольку две молекулы химически отличны одна от другой. И все-таки — нет, не могут! Пока мы занимались физическими измерениями, подобными определению энергий или скоростей химических реакций и т. д., эти два сорта вели себя совершенно одинаковым образом, если, разумеется, все остальное тоже было зеркально отражено. Одни молекулы поворачивают свет направо, а другие, проходя то же количество раствора,— налево на точно ту же величину. Таким образом, с точки зрения физики можно использовать любую из этих двух аминокислот. Насколько мы понимаем основу вещей сегодня, уже в уравнение Шредингера заложено, что две молекулы должны вести себя в точности одинаковым образом, хотя там, где у одной правая сторона, у другой — левая. Но в природе тем не менее все устроено только одним способом!
Как полагают, причина этого состоит в следующем. Представьте себе, например, что в один прекрасный момент возникли такие условия, что все белки у каких-то существ содержали только левосторонние аминокислоты. Это привело к тому, что все на свете «перекосилось», «перекосились» все вещества в живых клетках, «перекосились» все ферменты— все стало несимметричным. Когда пищеварительные ферменты пытались сменять химию своей пищи с одного сорта на другой, то один сорт пищи «подходил» им, а другой — нет (совсем как золушкин башмачок, с тем исключением, что мы меряем его на «левую ногу»). Насколько нам известно сейчас, в принципе возможно создать такую лягушку, у которой, например, каждая молекула окажется «перевернутой», т. е. создать точное зеркальное отражение настоящей лягушки, так сказать, «левостороннюю» лягушку. Некоторое время эта «левосторонняя лягушка» чувствовала бы себя вполне нормально, но не смогла бы найти себе пищи: если бы она проглотила муху, то ее ферменты не способны были бы переварить ее. Ведь муха-то настоящая, с правосторонней аминокислотой (разумеется, если мы не разведем специально для нашей лягушки «левосторонних мух»). Итак, насколько нам сегодня известно, химические и жизненные процессы, если бы мы все «перевернули», протекали бы точно так же, как и сейчас.
Если жизнь — полностью физико-химическое явление, то факт «закрученности» всех белков только в одном направлении можно понять лишь с той точки зрения, что с самого начала совершенно случайно победил какой-то один сорт молекул. Где-то однажды органическая молекула как-то «перекосилась», и правая сторона оказалась выделенной; какой-то случай в истории создал одностороннюю ситуацию, и с тех пор «перекос» разрастался все шире и шире. Но, возникнув однажды, ситуация, которую мы наблюдаем сейчас, будет продолжаться вечно: все ферменты переваривают и приготовляют только «правосторонние» вещества. Когда в листья растений входит углекислый газ, водяной пар и другие вещества, то ферменты, приготовляющие из них сахар, делают его правосторонним, ибо они сами правосторонние. Если бы в более позднее время возник какой-то новый сорт вирусов или каких-то других живых существ, то они смогли бы выжить только, если оказались бы способны питаться уже существующими органическими веществами. А, стало быть, и сами они должны быть того же сорта.
Для правосторонних молекул не существует закона сохранения их числа. Жизнь может только увеличивать его. Предположение, таким образом, состоит в том, что жизненные явления говорят нам не об отсутствии симметрии физических законов, а, наоборот, об универсальности природы и общности начала всех живых созданий на Земле в описанном выше смысле.
§ 5. Полярный и аксиальный векторы
Пойдем дальше. Вы видели, что в физике имеется масса примеров применимости правила правой и левой руки. В самом деле, когда мы изучали векторный анализ, то узнали о правиле правой руки, которым необходимо пользоваться, чтобы получить правильный момент количества движения и момент силы, магнитное поле и т. п. Например, сила, действующая на заряд в магнитном поле, равна F=qv×B. Но представьте себе такое положение: пусть мы знаем F, v и В. Как ив этого узнать, где у нас правая сторона? Если вернуться назад и посмотреть, откуда произошли векторы, то увидим, что правило правой руки — просто соглашение, своего рода трюк. В самом начале такие величины, как угловая скорость и момент количества движения и другие, подобные им, в действительности вообще не были настоящими векторами! Все они каким-то образом связаны с определенными плоскостями, и только благодаря тому, что наше пространство трехмерно, эти величины можно связать с направлением, перпендикулярным данной плоскости. Мы же из двух возможных направлений выбрали правое.
Представьте себе, что какой-то озорной чертик, решив подшутить над физиками, пробрался во все лаборатории и всюду заменил слово «правое» на «левое». И в результате, где было написано правило правой руки, мы вынуждены были бы пользоваться правилом левой руки. Ну что ж, физики бы просто не заметили этого, ибо ни к какому изменению в физических законах это бы не привело, разумеется, если физические законы симметричны.
Покажем это на примере. Вы знаете, что существуют два сорта векторов. Имеются обыкновенные, «настоящие» векторы, подобные, например, отрезку расстояния Δr в пространстве. Пусть в нашей аппаратуре что-то находится «здесь», а нечто другое — «там», тогда те же самые «что-то» будут присутствовать и в зеркально отраженной аппаратуре. Если мы в обоих случаях проведем векторы от «сюда» до «туда», то один вектор будет отражением другого (фиг. 52.2), причем направление стрелки вектора точно, как и все пространство, «выворачивается наизнанку».
Фиг. 52.2. Отрезок в пространстве и его зеркальное отражение.
Такие векторы мы называем полярными.
Но второй сорт векторов, связанных с вращением, имеет совсем другую природу. Представьте себе нечто вращающееся в трехмерном пространстве (фиг. 52.3).
Фиг. 52.3. Вращающееся колесо и его зеркальное отражение. Заметьте, что направление «вектора» угловой скорости не изменяется.
Если посмотреть на это в зеркало, то вращение будет происходить так, как показано на рисунке, т. е. как зеркальное изображение первоначального вращения. Условимся теперь представлять зеркальное вращение с помощью того же самого правила. В результате мы получим «вектор», который в отличие от полярного вектора не изменяется при отражении и оказывается перевернутым по отношению к полярному вектору и геометрии всего пространства. Такой вектор мы называем аксиальным.
Если физический закон симметрии относительно отражения правилен, то уравнения должны быть устроены так, чтобы при изменении знака каждого аксиального вектора и каждого векторного произведения (что соответствует отражению) ничего не произошло. Например, когда мы пишем формулу для момента количества движения L=r×p, то здесь все в порядке, потому что при переходе в левую систему координат мы изменяем знак L, а знак р и r не изменяется. Кроме того, изменится и векторное произведение, поскольку мы должны правило правой руки заменить правилом левой руки. Возьмем другой пример.
Известно, что сила, действующая на заряд в магнитном поле, равна F=qv×В, но если мы от правой системы перейдем к левой, то, поскольку, как известно, F и v — полярные векторы, изменение знака из-за наличия векторного произведения должно компенсироваться изменением знака В, а это означает, что В должен быть аксиальным вектором. Другими словами, при таком отражении В должен переходить в —В. Таким образом, если мы изменяем левые координаты на правые, то одновременно нужно северный полюс магнита изменить на южный.
Давайте посмотрим на примере, как это все получается. Пусть у нас имеются два магнита, похожих на изображенные на фиг. 52.4.
Фиг. 52.4. Электромагнит и его зеркальное отражение.
Один из магнитов выглядит в точности так, как зеркальное отражение другого, т. е. витки его накручены в другую сторону, и все, что происходит внутри катушки, должно быть в точности обращено в другую сторону; ток течет, как это показано на рисунке. Теперь из законов магнетизма (которые вы хотя еще и не знаете официально, но, по-видимому, помните из школьного курса) получается, что магнитное поле направлено так, как это показано на рисунке. Там, где у первого магнита южный полюс, у другого магнита будет северный, ибо у него ток течет в другую сторону, а магнитное поле перевернуто. Таким образом, выходит, что при переходе от правой системы к левой мы действительно должны заменить северный полюс на южный!
Но северный и южный полюсы — это просто договоренность, и замена их еще ничего не означает. Давайте посмотрим на само явление. Предположим, что электрон движется от нас через магнитное поле перпендикулярно к плоскости страницы. Тогда, если воспользоваться формулой для силы v×В (не забудьте, что электрон отрицательный!), мы получим, что в соответствии с этим физическим законом электрон должен отклоняться в указанном направлении. Таким образом, явление заключается вот в чем. Если в катушке в определенном направлении течет ток, то электрон как-то отклоняется. Это и есть физика, и неважно, как мы будем называть все по дороге.
А теперь проделаем тот же опыт с зеркально отраженным магнитом: пошлем электрон в соответствующем направлении. Теперь на него будет действовать обратная сила. Вычислив ее по тем же правилам, мы получим правильный результат: соответствующее движение будет зеркальным отражением предыдущего!
§ 6. Какая же рука правая?
Дело в том, что существует один интересный факт: в любом явлении правило правой руки всегда встречается два или вообще четное число раз, и в результате любое явление всегда выглядит симметричным. Короче говоря, раз мы не можем отличить северный полюс от южного, то не можем отличить и правую сторону от левой. Может показаться, что определить, где находится северный полюс магнита, очень просто. Северным концом магнитной стрелки компаса будет тот, который указывает на север. Но это опять локальное свойство, связанное с географией Земли, все равно, что указание, в какой стороне находится Чикаго, и поэтому не идет в счет. Если вы видели стрелку компаса, то, вероятно, заметили, что ее северный конец окрашен в какое-то подобие синего цвета. Но это уже дело рук человека, который окрасил стрелку. Так что все это — условные критерии.
Вот если бы магнит обладал тем свойством, что, посмотрев на него внимательно, мы бы обнаружили на его северном полюсе растущую бороду, которой нет на южном, и это было бы общим правилом, т. е. если бы существовал какой-то единый способ, позволяющий отличить северный полюс магнита от южного, то это было бы концом симметрии при отражении.
Чтобы яснее представить себе всю проблему в целом, вообразите, что вы разговариваете по радио с каким-то существом, находящимся очень далеко от вас. Мы не можем послать ему какого-нибудь образца, чтобы он его увидел; вот если бы мы, к примеру, могли послать пучок света, то мы послали бы свет, поляризованный по кругу в правую сторону, и сказали бы: «Обрати внимание на направление вращения поляризации этого света, мы называем его правым». Но мы не можем послать ему ничего подобного, а можем только говорить с ним. Наш собеседник находится очень, очень далеко, в каком-нибудь неизвестном мире, и не может видеть того, что видим мы. Мы не можем сказать: «Взгляни на Большую Медведицу. Смотри, как расположены ее звезды. Под правой стороной мы понимаем...» Мы можем только говорить с ним по радио.
Предположим, нам захотелось рассказать ему о себе. Ну, лучше всего начать с чисел: «Тик, тик — два, тик, тик, тик — три...», так что постепенно он выучит эти два слова, а потом больше. Спустя некоторое время вы настолько познакомитесь с ним, что он вас спросит: «Послушай, приятель, а как ты выглядишь?» Вы начнете описывать себя и первым делом скажете: «Мой рост один метр 75». «Подожди,— скажет он,— что такое метр?» Можно ли объяснить ему, что такое метр? Конечно, можно! Вы скажете: «Тебе известен диаметр атома водорода, так вот, мой рост составляет 17 000 000 000 диаметров атома водорода!» Это возможно, ибо физические законы не инвариантны относительно изменения масштаба, а поэтому мы можем определить абсолютную длину. Итак, мы определили размер нашего тела; можно описать и общую форму тела: рассказать, что у нас есть конечности с пятью отростками на концах и т. д., и так без особых трудностей он из нашего описания поймет, как мы выглядим. Он даже может вылепить нашу модель и, поглядев на нее, сказать: «Э-э, да ты, приятель, совсем, недурен. Но вот что у тебя внутри?» И мы начнем описывать ему наши внутренние органы, дойдем до сердца, тщательно опишем его форму и скажем: «Помести его в левую сторону груди». «Куда, куда? В левую сторону? А что это такое?» — удивится он. И вот как же описать ему, в какой стороне находится сердце, если он не может видеть то, что видим мы, и никогда не получал от нас ничего, что позволило бы ему понять, где же собственно левая сторона. Можно ли это сделать?
§ 7. Четность не сохраняется!
Оказывается, что законы тяготения, законы электричества и магнетизма, законы ядерных сил — все подчиняется принципу симметрии при отражении, так что ни эти законы, ни все, что получено из них, не может помочь нам. Однако в природе было обнаружено явление, которое может происходить со многими частицами, и называется оно бета-распадом, или слабым распадом. Один из видов слабого распада, связанный с частицей, открытой в 1954 г., задал физикам трудную головоломку. Есть такая заряженная частица, которая распадается на три π-мезона, как это схематически показано на фиг. 52.5.
Фиг. 52.5. Схематические диаграммы распадов τ- и θ-мезонов.
Частицу эту временно назвали τ-мезоном. На том же рисунке показана и другая частица, которая распадается на два π-мезона. По закону сохранения заряда один должен быть нейтральным. Эта частица была названа θ-мезоном. Итак, у нас есть τ-мезон, распадающийся на три π-мезона, и есть θ-мезон, распадающийся на два π-мезона. Вскоре, однако, обнаружилось, что массы τ и θ почти равны друг другу, точнее, в пределах экспериментальных ошибок они просто равны. Кроме того, где бы они ни появлялись, они всегда рождаются в одной и той же пропорции, скажем 14% τ-частиц и 86% θ-частиц.
Кто подогадливей, тот сразу поймет, что здесь мы имеем дело с одной и той же частицей, т. е. что рождаются не две частицы, а всего лишь одна, которая может распадаться двумя различными способами. Поэтому мы получали один и тот же процент рождения (ведь это же просто процент, отражающий способы, которыми она распадается).
Однако квантовая механика из принципа симметрии при отражении позволяет доказать (сейчас я, к сожалению, не могу объяснить вам, как это делается), что совершенно невозможно, чтобы оба эти способа распада принадлежали одной частице: одна частица никак не может распадаться двумя различными способами. Закон сохранения, соответствующий принципу симметрии при отражении, не имеет аналога в классической физике, и этот специфический закон сохранения в квантовой механике был назван законом сохранения четности. Таким образом, вследствие закона сохранения четности, или, точнее, из симметрии квантовомеханических уравнений слабого распада относительно отражения, получалось, что одна и та же частица не может распасться обоими способами, так что здесь мы встречаемся с каким-то удивительным совпадением в массах, временах жизни и т. д. Но чем больше изучалось это явление, тем более удивительным становились совпадения и постепенно росло подозрение в несправедливости фундаментального закона симметрии природы относительно отражения.
Это кажущееся нарушение побудило физиков Ли и Янга предложить поставить другие эксперименты и проверить, будет ли закон сохранения четности выполняться в других родственных распадах. Первый такой эксперимент выполнила By в Колумбийском университете. Заключался он в следующем. Оказывается, что у кобальта, который является хорошим магнетиком, существует изотоп, распадающийся с испусканием электронов. Поместим его в очень сильное магнитное поле при очень низкой температуре, так чтобы тепловые колебания не слишком сильно сбивали атомные «магнитики», тогда все они «выстроятся» вдоль магнитного поля. Таким образом, все атомы кобальта «выстраиваются» в этом сильном поле одинаковым образом. Потом они распадаются, испускают электроны, и вот оказалось, что когда атомы «выстраиваются» в магнитном поле с направленным вверх вектором В, то большинство электронов летит вниз.
Тому, кто не очень «на ты» с миром физики, это замечание мало что говорит, однако тот, кого волнуют тайны природы, увидит, что это наиболее удивительное открытие нашего времени. Если поместить атомы кобальта в очень сильное магнитное поле, то вылетевшие электроны более охотно летят вниз, чем вверх. Поэтому если бы мы отразили этот опыт в зеркале так, чтобы атомы кобальта были «выстроены» наоборот, т. е. вверх, то они бы испускали свои электроны вверх, а не вниз, и симметрия исчезла бы.
Теперь мы знаем, что южный полюс магнита это тот, от которого летят β-распадные электроны; таким образом, физически возможно отличить северный полюс от южного.
После этого было сделано множество других экспериментов: распад π-мезона на μ и v, распад μ-мезона на электрон и два нейтрино, распад Λ-частицы на протон и π-мезон, распад Σ-частицы и много других распадов. И почти во всех тех случаях, где этого можно было ожидать, обнаружено отсутствие принципа зеркальной симметрии! Фундаментальный закон физики — закон симметрии при отражении — оказался на этом уровне несправедливым.
Короче говоря, теперь мы уже могли бы объяснить нашему приятелю из космоса, где у нас расположено сердце.«Послушай,— сказали бы мы ему,— сделай себе магнит, намотай на него проволоку и пусти по ней ток. Затем возьми кусок кобальта, охлади его до низкой температуры. Расположи все устройство так, чтобы испущенные электроны летели от ног к голове, тогда направление тока в катушке скажет тебе, какую сторону мы называем правой, а какую — левой: ток входит с правой стороны и выходит с левой». Итак, с помощью эксперимента такого рода можно определить, где правая, а где левая сторона.
Было предсказано множество других свойств. Оказалось, например, что спин, т. е. угловой момент, или момент количества движения ядра кобальта, до распада равен пяти единицам ℏ, а после распада — четырем. Половину этого момента количества движения уносит электрон, а половину — нейтрино. Нетрудно теперь сообразить, что момент количества движения, уносимый электроном, должен быть направлен по линии его движения, как и момент количества движения нейтрино. Казалось, что электрон вертится справа налево; это тоже было проверено. Сделано это было прямо здесь в КАЛТЕХ'е. Бем и Вапстра, поставившие эксперимент, обнаружили, что электрон действительно крутится налево. (Были и другие эксперименты, дававшие противоположный ответ, но они оказались неверными!)
Следующей задачей было нахождение правила нарушения закона сохранения четности. Есть ли какое-нибудь правило, говорящее нам, насколько велико должно быть это нарушение? Оно оказалось следующим: нарушение происходит только в очень медленных реакциях, названных слабыми распадами, и если уж оно произошло, то частицы, уносящие спин, такие, как электрон или нейтрино, вылетают, преимущественно вращаясь налево. Это как бы «правило перекоса», оно связывает полярный вектор скорости и аксиальный вектор момента количества движения и говорит, что моменту количества движения более присуще направление против вектора скорости, нежели по нему. Таково правило, но мы еще не очень понимаем всех его «почему» и «поэтому». Почему справедливо именно это правило, в чем его фундаментальная причина и как оно связано с другими явлениями? Сейчас мы настолько потрясены самим фактом несимметрии мира, что до сих пор еще не можем оправиться и понять, как же оно отразится на всех остальных правилах. Тем не менее проблема эта интересная, животрепещущая и, увы, до сих пор не решенная. Поэтому сейчас самое время обсудить некоторые вопросы, связанные с этим правилом.
§ 8. Антивещество
Когда исчезает одна из симметрии, то первым делом нужно немедленно обратиться к списку известных или предположенных симметрии и посмотреть, не может ли еще нарушиться какая-то из них. Мы не упомянули одну операцию из нашего списка, а к ней наш вопрос относится в первую очередь — это отношение между веществом и антивеществом. Дирак предсказал, что в дополнение к электронам в мире должны существовать другие частицы, называемые позитронами (открытые Андерсоном в КАЛТЕХ'е), и они тесно связаны с электронами. Все свойства этих двух частиц подчиняются определенным правилам соответствия: энергии их равны, массы равны, заряды противоположны, но самое важное, столкнувшись, они могут уничтожить друг друга (аннигилировать), превратив всю свою массу в энергию, например γ- излучение. Позитрон называется античастицей электрона, и эти свойства являются основными свойствами частицы и ее античастицы. Из рассуждений Дирака было ясно, что у всех остальных частиц тоже должны быть соответствующие античастицы. Например, наряду с протоном должен существовать и антипротон, который сейчас обозначается символом р. У него должен быть отрицательный электрический заряд, та же, что и у протона, масса и т. д. Однако наиболее важным свойством является то, что протон и антипротон, столкнувшись, могут уничтожить друг друга. Я особенно подчеркиваю это потому, что люди обычно удивляются, когда говоришь, что наряду с нейтроном существует и антинейтрон; они говорят: «Как антинейтрон может иметь противоположный заряд, ведь он нейтральный?» Приставка «анти» означает не просто противоположный заряд, частица характеризуется целым набором свойств, многие из которых становятся противоположными. Антинейтрон можно отличить от нейтрона следующим способом: если поместить рядом два нейтрона, они так и останутся двумя нейтронами, но если мы поместим рядом нейтрон и антинейтрон, то они уничтожат друг друга, причем выделят большое количество энергии в виде разных π-мезонов, γ-квантов и т. п.
Далее, если у нас есть антипротоны, антинейтроны и позитроны[40], то из них в принципе можно составить антиатомы. Это еще не сделано, но в принципе вполне возможно. В атоме водорода, например, в центре расположен протон, вокруг которого крутится электрон. Вообразите теперь, что мы сделали антипротон и запустили вокруг него позитрон. Будет ли он крутиться? Ну прежде всего антипротон заряжен отрицательно, а позитрон — положительно, так что они будут притягиваться друг к другу с соответствующей силой, а поскольку массы у них одинаковы с протоном и электроном, то одинаково будет и все остальное. В этом состоит один из принципов симметрии в физике: уравнения, по-видимому, говорят нам, что если сделать одни часы из вещества, а другие, точно такие же, из антивещества, то они будут идти совершенно одинаково. (Разумеется, если мы поместим эти часы рядом, то они уничтожат друг друга, но это уже совсем другое дело.)
Тогда немедленно возникает вопрос. Можно сделать двое часов из вещества, причем одни «правосторонние», а другие «левосторонние». Можно, скажем, сделать не простые часы, а часы с кобальтом, магнитами и детекторами, регистрирующими β-распадные электроны и считающими их. Всякий раз, когда регистрируется электрон, секундная стрелка слегка подвигается. Но тогда зеркально отраженные часы, в которые приходит меньше электронов, не будут идти с той же скоростью. Итак, теперь нам ясно, что возможно построить такую пару часов, что правосторонние не будут согласовываться с левосторонними. Давайте сделаем часы из вещества и назовем их стандартными, или правосторонними, и сделаем еще часы тоже из вещества и назовем их левосторонними. Мы только что установили, что эти двое часов, вообще говоря, не будут идти одинаковым образом, а до этого выдающегося открытия в физике считалось, что будут. Далее мы, кроме того, полагали, что вещество и антивещество эквивалентны, т. е. если бы мы сделали часы из антивещества, такие же правосторонние, той же самой формы, то они шли бы точно так же, как и правосторонние часы из вещества, а если бы мы сделали такие же левосторонние часы, то и они тоже ходили бы точно таким же образом. Другими словами, первоначально мы полагали, что все четверо таких часов должны работать совершенно одинаково. Но теперь мы знаем, что правосторонние и левосторонние часы из вещества не одинаковы. А следовательно, право- или левосторонние часы из антивещества тоже, по-видимому, не одинаковы.
Теперь возникает очевидный вопрос: есть ли пара часов, которые идут одинаково? Иначе говоря, ведет ли себя правостороннее вещество так же, как правостороннее антивещество? Или же правостороннее вещество ведет себя так же, как левостороннее антивещество? Эксперименты с β-распадом, но не с электронным, а с позитронным β-распадом, указывают, что эта связь такова: «правое» вещество ведет себя точно так же, как «левое» антивещество.
Итак, в конечном счете право-левая симметрия все же реабилитирована! Если мы изготовим левосторонние часы, но изготовим их из материала совершенно другого рода — из антивещества, а не из вещества, то они будут идти точно таким же образом. В итоге произошло вот что: вместо двух независимых правил в нашем списке симметрии мы получили одно новое комбинированное правило, гласящее, что правостороннее вещество симметрично с левосторонним антивеществом.
Таким образом, если наш приятель из космоса сделан из антивещества и мы даем ему указания, как сделать нашу «правостороннюю» модель, то он, разумеется, сделает все наоборот. Что произошло бы, если бы после долгих переговоров мы научились другу друга строить космические корабли и договорились бы о встрече где-то в космическом пространстве, на полпути между ним и нами? Разумеется, мы бы предварительно рассказали друг другу о своих обычаях и прочем, и вот наконец вы спешите навстречу, чтобы пожать ему руку. Но будьте внимательны. Если он протянет вам левую руку — берегитесь[41]!
§ 9. Нарушенная симметрия
А что нам делать с законами, которые только приблизительно симметричны? Самое удивительное здесь то, что в широкой области важнейших явлений—ядерные силы, электромагнитные явления и даже некоторые слабые взаимодействия типа гравитации, словом, все законы в широчайшей области физики оказываются симметричными. Но, с другой стороны, вдруг всплывает какое-то слабенькое явление и говорит: «Нет, не все на свете симметрично!» Но как могло случиться, что природа почти симметрична, а не абсолютно симметрична? Что нам с ней делать? Прежде всего давайте все-таки посмотрим, нет ли каких-то других примеров подобного рода? Да, такие примеры есть и даже не один. Например, ядерные части сил между протоном и протоном, между протоном и нейтроном или нейтроном и нейтроном в точности равны друг другу. Это некая новая симметрия — симметрия ядерных сил: в ядерных взаимодействиях протон и нейтрон вполне могут заменять друг друга. Но она, очевидно, не всеобщая симметрия, ибо между двумя нейтронами не существует электрического отталкивания, как между двумя протонами. Поэтому мы не можем всегда заменять протона нейтроном, это, вообще говоря, неверно, хотя и является хорошим приближением. Почему хорошим? Да потому, что ядерные силы гораздо больше электрических. Так что это тоже «почти симметрия». Итак, подобные примеры все же есть и в других областях.
Нас всегда тянет рассматривать симметрию как некоего рода совершенство. Это напоминает старую идею греков о совершенстве кругов. Им было даже страшно представить, что планетные орбиты не круги, а только почти круги. Но между кругом и почти кругом разница немалая, а если говорить об образе мыслей, то это изменение просто огромно. Совершенство и симметрия круга исчезают как только чуть-чуть исказить его. Деформируйте немного круг, и это будет концом его симметрии и совершенства. Спрашивается, почему же орбиты только почти круги? Это куда более трудный вопрос. Истинное движение планет, вообще говоря, должно происходить по эллипсам, но в течение веков благодаря приливным силам они превратились в почти окружности. Но везде ли есть подобная проблема? Если бы пути планет были действительно кругами, то проблема не требовала бы пространных объяснений — они просты. Но поскольку эти пути только почти круговые, то объяснить нужно очень многое. Результат же превращается в большую динамическую проблему, и теперь нам нужно объяснить, привлекая приливные силы или что-то еще, почему они приблизительно симметричны.
Итак, наша цель понять, откуда взялась симметрия. Почему природа столь близка к симметрии? По этому вопросу ни у кого нет никакой разумной мысли. Единственное, что я могу предложить вам,— это старое японское предание. В японском городе Никко есть ворота, которые японцы называют самыми красивыми воротами страны. Они были построены в период большого влияния китайского искусства[42]. Это необычайно сложные ворота, со множеством фронтонов, изумительной резьбой и большим количеством колонн, на основании которых вырезаны драконьи головы, божества и т. п. Но, приглядевшись, можно заметить, что в сложном и искусном рисунке на одной из колонн некоторые из его мелких деталей вырезаны вверх ногами. В остальном рисунок полностью симметричен. Спрашивается, для чего это было нужно? Как говорит предание, это было сделано для того, чтобы боги не заподозрили человека в совершенстве. Ошибка была сделана намеренно, дабы не вызвать зависти и гнева богов.
Мы можем, вообще говоря, подхватить эту мысль и сказать, что истинное объяснение приблизительной симметрии мира состоит в следующем: боги сотворили свои законы только приближенно симметричными, чтобы мы не завидовали их совершенству!
Примечания
1
В русском издании содержание тома II войдет в выпуски 5—7. Том III будет содержать квантовую механику. — Прим. ред.
(обратно)2
Алмаз тоже может сгореть в воздухе.
(обратно)3
Как лихо я управился с этим! Как много скрыто за каждой фразой этого короткого рассказа. «Звезды и Земля сделаны из одинаковых атомов». Обычно мне одной такой темы хватает на целую лекцию. Поэты утверждают, что наука лишает звезды красоты, для нее, мол, звезды — просто газовые шары. Ничего не «просто». Я тоже любуюсь звездами и чувствую их красоту. Но кто из нас видит больше? Обширность небес превосходит мое воображение... Затерянный в этой карусели, мой маленький глаз способен видеть свет, которому миллион лет. Безбрежное зрелище Вселенной... и я сам — ее часть... Быть может, вещество моего тела извергнуто какой-нибудь забытой звездой, такой же, как вон та, чей взрыв я вижу сейчас. Или я смотрю на звезды гигантским оком Паломарского телескопа, вижу, как они устремляются во все стороны от той первоначальной точки, где, быть может, они некогда обитали бок о бок. Что это за картина и каков ее смысл? И зачем все это? Таинству Вселенной не причинит ущерба наше проникновение в какие-то ее секреты, ибо правда более поразительна, нежели то, что было нарисовано воображением художников прошлого! Почему же нынешние поэты не говорят об этом? Что за народ эти лирики, если они способны говорить о Юпитере только как о человеке, и молчат, если это огромный вращающийся шар из метана и аммиака?
(обратно)4
Нас здесь интересует не столько итоговая формула (4.3) (она вам, должно быть, знакома), сколько возможность получить ее теоретическим путем.
(обратно)5
Об этом ученые договорились в конце 1964 г., когда готовилось русское издание этой книги. — Прим. ред.
(обратно)6
Это равенство справедливо только тогда, когда площадь, занимаемая ядрами, составляет малую долю общей площади, т. е. (n1-n2)/n1 много меньше единицы. В противном же случае необходимо учитывать поправку на частичное «загораживание» одного ядра другим.
(обратно)7
Эти последние 97 экспериментов проводились следующим образом. Ящик, в котором находились 30 монет, энергично встряхивался; затем подсчитывалось число выпадений «орла».
(обратно)8
Максвелл получил выражение Cv2e-av^2, где а — некоторая связанная с температурой постоянная, а С выбирается таким образом, чтобы полная вероятность была равна единице.
(обратно)9
Отрезок, соединяющий Солнце с точкой орбиты.
(обратно)10
Иначе говоря, на сколько окружность (орбита Луны) отходит от касательной к ней на протяжении пути, проходимого Луной за 1 сек.
(обратно)11
В нашем курсе нет этого доказательства.
(обратно)12
В книгах вектор обозначается полужирной буквой; в рукописях же используется стрелка.
(обратно)13
Энергия в единицах табл. 9.2 есть ½(v2x+v2y)-1/r
(обратно)14
Правда, видимый свет проиграет гонку из-за преломления в воздухе. А γ-излучение ее, несомненно, выиграет.
(обратно)15
Что это действительно так, доказывается с помощью рассмотрения перемещения частиц твердого тела за бесконечно малый промежуток времени Δt. Это не самоочевидно, и я предоставляю тем, кто интересуется, доказать это.
(обратно)16
Квадратный корень лучше всего извлекать не тем способом, которому обычно учат в школе, а немного иначе. Чтобы извлечь квадратный корень из числа N, выберем достаточно близкое к ответу число а, вычислим N/a и среднее а'=1/2[a+(N/а)]; это среднее будет новым числом а, новым приближением корня из N. Этот процесс очень быстро приводит к цели: число значащих цифр удваивается после каждого шага.
(обратно)17
Решения, которые нельзя выразить линейно одно через другое, называются независимыми решениями.
(обратно)18
В новейших супергетеродинных приемниках дело, конечно, обстоит сложнее. Усилители приемника настроены на определенную промежуточную частоту; осциллятор с переменной настраивающейся частотой связан с входным сигналом нелинейной связью, порождая новую частоту (равную разности частот сигнала и осциллятора) —промежуточную частоту, которая и усиливается. Об этом мы поговорим в гл. 50 (вып. 4).
(обратно)19
Его можно вывести, если дополнительно предположить, что при добавлении слоя одной среды к поверхности другой угол преломления на выходе из последней среды не меняется.
(обратно)20
Предельный угол имеет величину порядка λ/D, где D — диаметр линзы. Сможете ли вы показать, как это получается?
(обратно)21
В нашем случае T=Δ/с=mnλ,/с, где с — скорость света. Частота v=c/λ, так что δv=cδλ/λ2.
(обратно)22
Прежде всего потому, что сам критерий Рэлея приближенный. Он только указывает область углов, где трудно разобрать, сколько звезд на изображении — одна или две. А в действительности, если точно измерить распределение интенсивности, можно различить два источника при углах θ, даже меньших λ/L.
(обратно)23
Такая же формула получается и с помощью квантовой механики, однако интерпретация ее в этом случае иная. В квантовой механике даже одноэлектронный атом, например водород, имеет несколько резонансных частот. Поэтому вместо числа электронов Nk с частотой ωk появляется множитель Nfk где N — число атомов в единице объема, а число fk (называемое силой осциллятора) указывает, с каким весом входит данная резонансная частота ωk.
(обратно)24
Выпуск 2
(обратно)25
Разумеется, за исключением того случая, когда один из трех цветов получается смешением двух других.
(обратно)26
Эти цвета зависят от скорости вращения, яркости освещения и в какой-то степени от того, кто смотрит на диск и насколько пристально.
(обратно)27
Человеческий глаз тоже слегка чувствителен к направлению поляризованного света, и научиться угадывать направление солнца в общем можно! Здесь используется явление, называемое хайдингеровской гребенкой (Haidinger's brush). Это бледное желтоватое пятно в центре поля зрения, напоминающее по форме песочные часы; видно оно через поляризационные очки на фоне безграничного бесцветного пространства. Впрочем, его можно видеть и без поляризационных очков на голубом небе, если поворачивать голову то туда, то сюда вокруг оси зрения.
(обратно)28
Этот аргумент, который приводил еще Максвелл, несколько коварен. Хотя окончательный вывод и справедлив, но он не следует непосредственно из соображений симметрии, которыми мы пользовались раньше. Ведь перейдя к движущейся через газ системе отсчета, мы можем обнаружить искаженное распределение скоростей. Мы не смогли найти простого доказательства этого результата.
(обратно)29
Стоградусная шкала— это шкала Кельвина, в которой за нуль принята температура 273,16°, так что T=273,16+стоградусная температура.
(обратно)30
То, что химики называют молекулярным весом, есть не что иное, как масса моля молекул в граммах. Моль определяется так, что масса моля атомов изотопа углерода 12 (ядра которого состоят из 6 протонов и 6 нейтронов) равна в точности 12 г.
(обратно)31
Чтобы вычислить этот интеграл, положим
Тогда
а это двойной интеграл в xy-плоскости. Но его можно вычислить и в полярных координатах:
(обратно)32
Это не только способ удержать число атомов на каждом уровне постоянным, но и действительный путь, который избирает природа. При тепловом равновесии каждый процесс должен уравновеситься противоположным процессом, это так называемый принцип детального равновесия.
(обратно)33
Раньше мы определяли температурную шкалу иначе. Мы утверждали, что средняя кинетическая энергия молекулы идеального газа пропорциональна температуре или, согласно закону идеального газа, что pV пропорционально Т. Эквивалентно ли это новому определению? Да. Ведь окончательный результат (44.7), выведенный из закона идеального газа, совпадает с приведенным здесь результатом. Мы еще поговорим об этом в следующей главе.
(обратно)34
Поскольку (ex-1)-1=е-x+е-2x+..., то интеграл равен n=1∑∞0∫∞e-nxx3dx.
Но 0∫∞e-nxdx=1/n, поэтому, дифференцируя три раза по n, мы получаем 0∫∞e-nxx3dx=6/n4, так что интеграл равен 6 (1+1/16+1/81+...), и несколько первых членов ряда дают уже хорошее приближение. В гл. 50 мы сможем показать, что сумма обратных четвертых степеней целых чисел равна π5/90.
(обратно)35
При таком выборе Pотн Р — уже не максимальная амплитуда звукового давления, а «среднее квадратичное» давление, равное максимальному, деленному на 1/√2.
(обратно)36
Следует сделать здесь небольшое примечание: в каких случаях кривая может быть представлена в виде суммы множества косинусов? Ответ: Почти всегда, за исключением небольшого числа случаев, которые могут присниться разве только математику. В каждой точке кривая, разумеется, должна иметь только одно значение и она не должна быть безумной кривой, прыгающей до бесконечности на протяжении бесконечно малого промежутка времени или что-нибудь в этом же духе. Однако если отвлечься от этих ограничений, то любая разумная кривая (в частности, и та, которая получается при колебании голосовых связок певицы) всегда может быть представлена в виде суммы косинусоидальных волн
(обратно)37
В Советском Союзе изображение имеет 625 строк и ширина каналов несколько больше.— Прим ред.
(обратно)38
В основе деления октавы на 12 ступеней лежит открытие Пифагора. Он брал струну, зажимал ее посредине и получал звук на октаву выше, нем звук незажатой струны. Затем половину струны он опять зажимал посредине и получал звук еще на октаву выше и т. д. Точно так же, зажимая последовательно струну на 1/3 длины, он каждый раз получал звук выше на квинту. И вот оказалось, что 12 квинт почти точно укладываются на интервале в 7 октав [т. е. 27~=(3/2)12]. Если же теперь от каждой квинты отложить целое число октав вверх и вниз, то каждая первоначальная октава разделится на 12 частей. Так возник пифагорийский строй. Однако беда в том, что 12 квинт только приблизительно равны 7 октавам, поэтому в разных местах диапазона «лесенки» получались неровные. При развитии мелодии эти неточности накапливались и возникали противные уху интервалы, так называемые «волки», которые страшно досаждали музыкантам. Иногда дело доходило до курьезов. Рассказывают, что известный композитор Жак Рамо сумел так ловко извлекать из органа «волчьи» звуки, что однажды, желая отказаться от должности церковного органиста, привел своей «игрой» в ужас святых отцов и убедил их в своей «бесталанности». Много сил было потрачено на изгнание «волков». Этим, в частности, безуспешно занимались такие умы, как Кеплер и Эйлер. Однако сделать это удалось не физику и не математику, а органисту Андрею Веркмейстеру. Решение его гениально просто: он отказался от чистых квинт, укоротив их как раз настолько, чтобы дюжина вместилась в 7 октав, и несовместимое совместилось, а «волки» исчезли. Так возник современный темперированный строй.— Прим. ред.
(обратно)39
Ее можно вычислить следующим образом. Во-первых, заметим, что 0∫xdx/(1+x2)=arctgx.
Во-вторых, разложив подынтегральное выражение в ряд, получим 1/(1+x2)=l-x2+x4-x6+... . Интегрируя затем почленно этот ряд (от нуля до х), получаем arctgx:=l-х3/3+х5/5-x7/7+..., а положив x=1, мы докажем использованный результат, поскольку arctg1=π/4.
(обратно)40
Сейчас уже научились делать еще два антиизотопа водорода: антидейтрон и антитритий. — Прим. ред.
(обратно)41
Автор не зря предупреждал, что обо всем содержании этой главы можно сказать: «насколько нам известно сегодня». Ведь это уже «передний край» физики, где возможны любые изменения. Так и вышло. Совсем недавно было установлено, что симметрия между правым веществом и левым антивеществом не всегда существует. Комбинированная симметрия тоже оказалась приближенной. Мы пока не знаем, как и почему это происходит, пока строим только гипотезы, но вполне возможно, что, когда дело дойдет до встречи с нашим приятелем из другого мира, мы предварительно сможем выяснить, сделан ли он из вещества, как и мы, или из антивещества. — Прим. ред.
(обратно)42
Их построил архитектор и резчик Цингору в середине XVII века. —Прим. ред.
(обратно)
Комментарии к книге «Том 1. Механика, излучение и теплота», Ричард Филлипс Фейнман
Всего 0 комментариев