Е. В. Балановская, О. П. Балановский РУССКИЙ ГЕНОФОНД НА РУССКОЙ РАВНИНЕ
Друзьям юности — Моби Дику и Джонатану Ливингстону
Этнический ареал русского народа на протяжении столетий неуклонно расширялся, включая в себя сначала окраины Восточно-Европейской равнины, а потом Урал, Сибирь, Кавказ и многие иные отдаленные территории. Но популяции, сформировавшиеся исторически недавно в результате переселений или смешений, мало информативны для понимания этногенеза и истории становления русского генофонда. Если мы хотим заглянуть в прошлое, то намного важнее проследить историю
Аналогично и М. В. Битов, изучая антропологию Русского Севера, охватывал лишь те территории, которые были колонизированы в хронологических рамках XII–XVII веков от Уставной грамоты Святослава Ольговича 1137 г. до окончания значительных массовых передвижений русского населения XVII века [Вотов, 1997].
От издателя[1]
Я русский, не потерплю, чтобы меня теснили эти господа
А. В. СуворовС детства всем понятен смысл слов: русский, нерусский, китаец, швед. Мы можем представить образ человека определённой национальности, его привычки, его песни.
Например, в Кремлёвский полк набирают солдат физически крепких, высоких и русской внешности. Отцы-командиры успешно решают задачу отбора солдат.
Наука, раздробленная на слабо связанные области, до недавнего времени затруднялась дать ответ на вопрос: «кто такие русские». Мало того, однажды на слушаниях по русской культуре в Государственной думе выступил директор института этнологии и антропологии им. Н. Н. Миклухо-Маклая и заявил, что русских никаких нет, а есть только русскоговорящие; остался мол только русский язык как средство межнационального общения. Этот русскоговорящий «господин» целый час пытался доказать русским, что их нет. Надо заметить, что его теория разошлась с практикой уже на заседании: «господин», который вёл слушания, как выяснилось, хорошо различал русских и нерусских — ни одному русскому слово он не дал.
Подобная позиция не нова. Культура и наука стали в XX веке областями, куда назойливо внедрялись, сначала среди ученых, а затем и в общественном сознании, политически заказанные мифы. Особенно досталось при этом русской истории и культуре. Так, в 1920-е годы РАППовцы (Авербах и Ко) доказывали, что русской литературы не существует, а если даже она всё-таки есть, то её надо «сбросить с корабля современности». Параллельно с РАППовцами трудились их достойные коллеги «историки-марксисты», доказывавшие, что не существует русского народа, а если даже он всё-таки есть, то это финно-угры, скифы, татары, кто угодно — только не славяне и не русские. Например, некогда знаменитый «воинствующий историк-марксист» М. Покровский заявлял: «в жилах так называемого великорусского народа течет восемьдесят процентов финно-угорской крови». И взятые с потолка «восемьдесят процентов», и выражение «так называемый великорусский народ» были продиктованы этому «господину», очевидно, его страстным стремлением поскорее написать «реквием» русскому народу.
Когда в 1930-х годах основной политический заказ на теоретическое, а затем и практическое доказательство «несуществования» русского народа и его культуры перешёл от троцкистов к их коллегам-конкурентам нацистам, последние не стали особо утруждать свою фантазию. Похоже, они просто переписывали троцкистские измышления. Например: «в России утвердились две основные расы: тюрко-монголы и угро-финны… В огромной стране с плохими сообщениями многие слои самых различных народов накладывались друг на друга, не смешиваясь, и огромная монголоидная масса постепенно покрыла все, но в разных пропорция»» (Рене Бинэ, «Национал-социализм против марксизма»). Как видим у этих «господ», германских нацистов, в их «мифах XX века» (а также в следовавших за этими мифами реальных планах «Барбаросса» и «Ост») ни в стилистике, ни в содержании не было особых отличий от троцкистов.
В наши дни заказ на создание сходной политической мифологии возобновился. Опять фабрикуются, на деньги от зарубежных фондов, всё те же троцкистско-нацистские измышления: и русская культура — де ни на что не годится, и русского народа — де нет. Как и в предыдущих случаях (троцкизм и нацизм) эти «господа» в своих политических/культурно-антропологических мифах выполняют заказ на разрушение России как единого государства.
К сожалению, в крупных городах, особенно в Москве, встречаются русские, нередко из числа бывших «лимитчиков», которые забывают свое происхождение. Про таких говорят: «из деревни ушёл, до города не дошёл». Они стесняются своего деревенского происхождения, ошибочно полагают, что западная псевдо-культура является городской русской культурой. Русские народные песни выводят их из душевного равновесия. Такие «русские» хуже прямых врагов. В их среде находит благодатную почву распространяемые вышеупомянутыми «господами» мифы о «пропаже русских».
Издание книг, правдиво показывающих реальное положение дел в культуре, истории, антропологии, генетике будет способствовать искоренению псевдонаучных и направленных против России как государства измышлений.
Помимо изложения важных и интересных научных результатов, в книге развенчивается ряд псевдонаучных идеологем: о «несуществовании рас», об «отсутствии генетических различий между расами», о «доминировании азиатских генов у русских» и так далее.
Мне бы хотелось предостеречь различных «господ» от недобросовестного цитирования данной книги.
Например, в 10-й главе предлагаемой вниманию читателей книги авторы пишут: «по спектру гаплотипов мтДНК русский генофонд приближен скорее к финно-угорскому, чем к «праславянскому» генофонду». Если отбросить первые 4 слова, то можно сделать абсурдное утверждение, проповедуемое украинскими шовинистами: «русские это финно-угры».
Упомянутая выше мтДНК названа первооткрывателями «суперженской», она передаётся только по женской линии. Можно предположить, что у предков нынешних русских, особенно на северо-востоке, невесты из финно-угорской среды пользовались особой популярностью. Надеюсь, что читатель не станет придавать большого значения этой шуточной «гипотезе невест», но четко поймет, что относительно высокое сходство некоторых популяций русских с финно-уграми установлено только по спектру «суперженской» ДНК и притом далеко не во всех областях России. Например, по данным авторов книги: «результаты анализа мтДНК Пинежской популяции русских не выявили никакой генетической связи с современными соседями из финно-угорских народов». В «мужской составляющей» общих линий у русского и финно-угорского генофондов гораздо меньше.
Что реально доказано. В смешении части славянских племен, особенно на северо-востоке Русской равнины, с финно-угорскими народами вряд ли можно сомневаться. Вполне естественна и относительно высокая степень близости по гаплотипам мтДНК (то есть по женской линии) части сегодняшнего населения Русской равнины к финно-уграм. Среди изученных популяций 31 % гаплотипов мтДНК, обнаруженных у русских, встречены также у белорусов и украинцев, а волжские финно-угорские популяции находятся на втором месте, с 25 % (см. рис. 6.2.5.в книге). Однако по мужской линии, т. е. для Y-хромосомы, около 47 %, почти каждый второй, относится к линии R1a, традиционно связываемой с балто-славянской языковой группой. Связь с финно-угорскими популяциями здесь значительно ниже. Таким образом, утверждать, что «мы ближе к финно-уграм, чем к праславянам» конкретные научные данные не дают никаких оснований.
Немало спекуляций сегодня существует и вокруг таких непростых понятий как «нация» и «народ». Это типичные нечеткие множества (см. П. Вопенка «Альтернативная теория множеств», Новосибирск, Институт математики, 2004). Попытки определить эти понятия в рамках классической математики приводят к различным спекуляциям.
Мотивация распространителей «финно-угорского» и других аналогичных мифов, с разными вариациями насаждаемых сегодня в общественном сознании России, трояка:
1) лишить русских своего характерного антропологического облика; разъединить их;
2) разъединить не только русских между собой, но и русских с близкородственными этнически и культурно малороссами и белорусами;
3) «ликвидировать все народы» — поставить под сомнение само понятие «народ», объявить его, в конечном счете, «ненаучным». И тем самым разъединить не только русских, украинцев, белорусов, но и всех людей вообще — оставив лишь отдельных индивидов, которыми гораздо легче манипулировать.
Мифы, что у русских нет своего характерного антропологического облика, распространялись еще в дореволюционное время. «Вздрогнули бы и перевернулись в земле кости Русичей на Какле, если бы они узнали, что в наши дни нашлись сомневающиеся в их этнике и антропологии» (профессор И. А. Сикорский, 1912 г.).
С этой лженаукой успешно боролись наши ведущие антропологи дореволюционного и советского периода. Например, Д. Анучин в статье «Славяне, антропологический тип» в словаре Брокгауза и Ефрона (С-Петербург. Типография Акц. Общ. «Издательское дело», Брокгауз-Ефрон. 1900. Том XXX, 59 полутом, С. 285) писал: «из… известий греческих, римских и арабских писателей о славянах можно вывести заключение, что в эпоху выхода их на историческую сцену и первых столкновений с культурными народами они представляли собою определенный расовый тип, отличный как от типа южных народов области Средиземного моря, так и от типа германцев. Древние писатели упоминают о высоком росте, крепком сложении, румяном цвете лица и русых волосах славян…».
Главная же цель «господ» манипуляторов — внедрение мифа о «несуществовании народов», по отношению к которому догмы типа «поскреби русского — найдешь финно-угра (варианты: скифа, китайца, папуаса….)» являются лишь частными случаями. Он противоречит здравому смыслу большинства людей. Читатель, хотя бы бегло познакомившийся с книгой «Русский Генофонд на Русской равнине», заметит, что тезис о «несуществовании рас» эффектно и доказательно опровергается авторами (глава 2.2). Народы существуют, как существуют и расы, как существуют и изучавшиеся авторами популяции.
Книга «Русский генофонд на Русской равнине» представляет собой взгляд на генофонд русского народа с четырех разных сторон: антропологии, классической и ДНК-генетики, а также многообразия фамилий. Четыре проекции русского генофонда, собранные вместе в этой книге, дают его объёмный образ, индивидуальный и своеобразный. Эти четыре проекции, как подчеёркивают авторы, согласуются между собой, благодаря чему образ Русского генофонда является не только своеобразным и индивидуальным, но и гармоничным, наделённым согласующимися друг с другом чертами.
В рецензии на книгу «Русский Генофонд на Русской равнине» доктор политических наук, автор ряда работ по этнологии, депутат Государственной Думы Федерального Собрания Российской Федерации четвертого созыва А. Н. Савельев писал:
«Изменчивость внешнего облика русского человека столь же характерна для Русской равнины, сколь и отличительные черты русского человека, выделяющие его среди других народов. Установлено, что русские — типичные европеоиды. Установлено, что татаро-монгольское иго не оставило в русском роде практически никаких следов с генетической точки зрения. У русских смешанных браков (за пределами группы восточноевропейцев) — всего около 2 %.
Знание о человеке — важнейший источник обоснованных решений органов государственной власти, выработки ими верных стратегий. Современное производство все больше требует индивидуализации производимой продукции. В особенности это касается всего, что связано непосредственно с человеком. Если говорить о русском народе, то русским нужны врачи и диетологи, которые знают особенности русских на уровне биологических различий, выделяющих их среди народов мира. Русским нужны политики и государственные деятели, знающие, что на Русской равнине живет русский народ со своим «лица необщим выраженьем». Это знание ведет к разработке стратегии восстановления и защиты жизнеспособности русского народа и других коренных народов России» (см. См. также журнал «Золотой Лев», ).
Книга «Русский Генофонд на Русской равнине» проясняет вопрос: «кто такие русские». Ответ на этот вопрос оказался не столь прост, как можно было ожидать.
Надеемся, что читатели, интересующиеся историей и культурой русского народа, найдут в книге «Русский Генофонд на Русской равнине» немало интересного.
А. Н. Маслов
Предисловие
Книга пошла в печать, и к издателю стали поступать первые корректурные листы. Каков же был его ужас, когда он обнаружил, что повесть Мурра то и дело перемежается вставками из совершенно другой книги — биографии капельмейстера Иоганнеса Крейслера.
Что же выяснилось после тщательного расследования и розыска? Оказывается, когда кот Мурр излагал на бумаге свои житейские взгляды, он, нисколько не обинуясь, рвал на части уже напечатанную книгу из библиотеки своего хозяина и в простоте душевной употреблял листы из нее частью для прокладки, частью для просушки страниц. Эти листы так и остались в рукописи, и их по небрежности тоже напечатали, как принадлежащие к повести кота Мурра!
Эрнст Теодор Амадей Гофман «Житейские воззрения кота Мурра вкупе с фрагментами биографии капельмейстера Иоганнеса Крейслера, случайно уцелевшими в макулатурных листах»Два неразрывных вопроса — «Откуда ты, Русь?» и «Какая ты теперь, Русь?» — звучат на изломах истории особенно остро. Ответов даётся много и разных, но как выбрать те, что ближе к истине? Конечно же, наука может говорить лишь о той части истины, которая постигается её научными методами. Но зато научный осмотр этой вершины айсберга можно провести вместе с читателем, раздумывая и точно взвешивая верность ответов.
Именно это мы и предлагаем в книге — попробовать увидеть, как преломляются в русском генофонде эти два неразрывных вопроса. Для большей объективности ответов, мы привлекли разные науки о человеке. Наши обширные экспедиционные обследования Русской равнины сопоставлены с другими данными генетики, антропологии, лингвистики и истории. При этом мы стремились к тому, чтобы любой читатель без специальной подготовки мог создать объёмное представление о русском генофонде и основывался при этом на комплексе последних научных данных. Впрочем, когда приходилось выбирать между «популярностью» и «точностью» изложения, авторы старались быть максимально точными. Так что книга получилась местами слишком научной, за что авторы даже не смеют просить прощения у читателя.
У книги есть ещё три особенности.
1) Во-первых, интересы авторов лежат в области геногеографии — науки, изучающей, как изменяется генофонд в географическом пространстве. Благодаря ей мы легко можем сравнить — как различается русское население на разных территориях? А также — насколько русские популяции отличаются от их соседей по Европе и Евразии? Такое сравнение мы проведём с помощью карт, которые без труда прочитает любой читатель. Именно карты послужат путеводной нитью — и в этом первая особенность книги.
2) Массив накопленных сведений велик, но, как и положено на Руси, «порядка только нет». Собирание воедино таких сведений о генофонде населения русских земель было главным условием создания этой книги — и столь же необходимым, как когда-то было собирание воедино самих этих земель. Для понимания русского генофонда нужны данные обо всех популяциях, разбросанных по его бескрайнему ареалу, обо всех русских землях. И описаны эти земли должны быть не одним, а сразу несколькими «очевидцами». Только так мы получим достоверный «портрет» русского генофонда.
Поэтому вторая особенность книги — собирание воедино не только сведений о разных землях, но и данных разных наук: генетики, антропологии и лингвистики. Каждый из разделов этих наук даёт независимые свидетельские показания об изменчивости русского генофонда. Причём каждая наука, каждый очевидец представляет целый ворох свидетельств — изменчивость множества признаков.
Для генетики — это не только традиционные «классические» маркёры (группы крови, цветовая и вкусовая «слепота», гены, ответственные за белки крови). Но и новейшие данные молекулярной генетики. Причём для полноты картины мы охватили все три типа её признаков: и наследующиеся только по материнской линии (митохондриальная ДНК), и только по отцовской линии (Y хромосома), и сразу по обеим линиям (аутосомные ДНК маркёры).
Для антропологии — это все накопленные данные и о физическом облике русского населения (соматология), и о кожных узорах на пальцах (дерматоглифика).
Для лингвистики — впервые изучено распространение десятков тысяч русских фамилий (антропонимика).
Авторы надеются, что собирание воедино свидетельств столь разных «очевидцев» позволило создать достаточно объёмный и красочный портрет русского генофонда.
Едва ли не важнейший свидетель — физическая антропология. Именно работа антропологов [Происхождение…, 1965] была первым исследованием русского генофонда, проведённым под руководством Татьяны Ивановны Алексеевой и Виктора Валерьяновича Бунака. Лишь полвека спустя генетики смогли добавить к этому свои данные. Вопросы взаимодействия антропологии и генетики были для Татьяны Ивановны столь важны, что мы вместе проводили экспедиции и семинары генетиков и антропологов. И авторы всегда будут благодарны ей за поддержку и интерес к геногеографии. Хотелось бы, чтобы и настоящее исследование, объединяющее антропологические и генетические данные, послужило её светлой памяти.
3) Третья особенность, о которой надо сразу же предупредить читателя: разные разделы книги написаны с разной степенью подробности и в разной манере изложения. Отчасти дело в том, что половина книги написана одним соавтором, а другая половина — другим: главы 2, 4, 5, 7 и Приложение написаны Е. В. Балановской; главы 3, 6, 8, 9 и 10 написаны О. П. Балановским, а в 7 главе — половина разделов написана одним соавтором, а половина — другим. Разные поколения, разный стиль изложения, разное образование (один из нас — антрополог, а другой — генетик)… Мы надеялись, что такое соавторство позволит увидеть русский генофонд с двух разных точек зрения, «бинокулярно» — в объёме, а не плоско — и соавтору разрешалось вносить свои коррективы и в «чужую» главу. Оттого порой книга напоминает записки кота Мурра, написанные на обороте бумаг его хозяина, и так и изданные вперемешку.
Но главная причина кажущейся разнородности книги в ином. Дело в том, что к ней могут обратиться разные читатели. Специалисту всегда важны подробно представленные результаты и формально описанные методы. Написать книгу для специалистов легко. Но тогда генетический раздел стал бы непонятным для антрополога, а антропологический раздел — для генетика. Такая книга была бы бесполезна и для коллег из соседних областей науки — историков, археологов, лингвистов, этнографов, географов, медиков. Ведь каждая глава стала бы информативной только для узких специалистов в этой области, а синтез данных разных наук стал бы невозможен. Мы же стремились к иному — чтобы любой раздел был понятен любому. Поэтому вопросы, важные для специалистов — напечатаны мелким шрифтом или вынесены в Приложение. Это позволило дать пояснения, не перегрузив основной текст книги. Однако и в нём мы оставили немало повторов. Кто сможет прочесть столь многоликую книгу «от корки до корки»? Каждому интересно своё… Поэтому для читателя, не заглядывающего в другие главы книги, мы повторяли кратко то, что необходимо для понимания основной нити рассказа.
Собрав в одной книге разнородные сведения, трудно избежать нестройности. Остаётся надеяться, что интерес к самому объекту превозможет недостатки книги, и русский генофонд сможет стать понятнее и ближе.
Благодарности
Авторы рады сказать слова благодарности очень многим коллегам и друзьям — без их помощи эта многоликая книга не могла бы появиться на свет.
Прежде всего, авторы искренне признательны В. Е. Дерябину, Н. А. Долиновой, А. П. Бужиловой и В. А. Спицыну, благодаря сотрудничеству с которыми начиналось наше исследование русского генофонда. В. Е. Дерябин помог осуществить нашу давнишнюю мечту о совместном анализе данных антропологии и генетики: благодаря составленной им базе данных по соматологии и рассчитанным каноническим переменным стал возможен анализ антропологии как русских популяций, так и всей Восточной Европы. Н. А. Долинова великодушно предоставила для анализа массив дерматоглифических данных о русских и иных популяциях Восточной Европы. В. А. Спицын не только предложил включить в нашу базу данных собранную им информацию о частотах классических маркёров в русских популяциях, но и способствовал нашему решению взяться за широкомасштабный анализ русского генофонда. Только благодаря предложению А. П. Бужиловой провести картографический анализ имеющегося у неё массива данных о русских фамилиях, мы нашли силы обратиться и к этому источнику информации о генофонде. В последовавшем сборе массовых данных о русских фамилиях нам оказали бесценную помощь И. Н. Сорокина, М. И. Чурносов, И. В. Евсеева, Н. Н. Аболмасов, Э. А. Почешхова, М. Б. Лавряшина и М. В. Ульянова. Благодаря любезности Е. К. Гинтера, мы пополнили информацию о Костромской области архивными списками фамилий, собранными под его руководством. Часть работы по анализу списков фамилий была выполнена Д. С. Соловьёвой, а первичная обработка всех данных и расчёт частот фамилий легли на плечи С. М. Субботы.
В экспедиционном изучении русских популяций вместе с авторами трудились М. И. Чурносов и его сотрудники, И. В. Евсеева и её студенты, Э. А. Почешхова и её коллеги. Авторы благодарны им и многим — более тысячи — представителям сельского русского населения, предоставившим образцы крови для анализа ДНК, а также главам районных администраций и больниц, врачам, медсёстрам и всем, кто помогал нам в экспедиционном изучении русского генофонда.
Анализ митохондриальной ДНК и Y хромосомы выполнен в лаборатории Рихарда Виллемса (Эстонский биоцентр) во многом благодаря его руководству и заботе. Авторы глубоко благодарны Сиири Роотси за помощь в генотипировании, всему коллективу Эстонского биоцентра за поддержку, и в особенности Тоомасу Кивисилду, примирившему их с «нерекомби-нирущей» популяционной генетикой.
Анализ генофондов Европы и Евразии по ДНК маркёрам был бы невозможен без сбора информации из многих источников. Последняя версия оригинальной базы данных по митохондриальной ДНК населения мира, использованная в разделе 9.2, составлена и систематизирована В. В. Запорожченко, а сбор и систематизация данных по частотам гаплогрупп Y хромосомы в популяциях Европы проведены А. С. Пшеничновым.
Геногеография палеолита, описанная в разделе 9.1, была изучена благодаря таланту и огромному бескорыстному труду Л. В. Греховой. Разделы 2.2. и 10.5. не были бы написаны без организаторов конференции «Раса: миф или реальность» и второй школы-семинара «Генетическая безопасность». Методология геногеографии создавалась одним из авторов совместно с Ю. Г. Рычковым, и тексты, послужившие основой для разделов 1.1, 2.1, 2.3., были написаны с ним в соавторстве. Особая благодарность О. Л. Курбатовой, В. А. Шнирельману, иерею Д. В. Соловьёву, Р. И. Мансурову и Р. М. Злотникову за внимательное прочтение и комментарии к заключительной главе 10.
Авторы бесконечно благодарны П. Н. Ящуку за поддержку на долгом пути книги от замысла до выхода в свет, а также посетителям нашего сайта за терпеливое ожидание книги.
В оформлении списка литературы нам помогали X. Д. Дибирова, О. А. Васинская, А. В. Горина, М. А. Чернова, Т. А. Лузина.
Значительная часть исследований, которые легли в основу книги, осуществлена при поддержке Российского фонда фундаментальных исследований и Российского гуманитарного научного фонда[2], а публикация книги стала возможна благодаря финансовой поддержке РФФИ (грант 05-06-87024д) и Федеральной целевой программы «Культура России».
Авторы признательны издателю этой книги А. Н. Маслову — она появляется на свет лишь благодаря его настойчивости и терпению.
Введение
Каковы истоки русского генофонда? Какие племена и народы составили основу нашего генофонда? Какие потоки нашествий прошли, как волна над головой, не оставив и следа в генофонде? И какие миграции — часто нешумные и почти не отмеченные в памяти народов — определили многие черты современного генофонда?
На эти вопросы пробуют дать ответ многие науки о человеке. И генетика — один из исторических источников. Популяционная генетика изучает изменчивость генофонда в пространстве и времени. Изучая «устройство» современного русского генофонда, мы стараемся понять пути и историю его формирования.
НАДЁЖНОСТЬ ИСТОЧНИКОВ
История сложения народов часто сложнее интриги хорошего приключенческого романа. Чтобы её распутать, нужно множество исторических источников, множество очевидцев, каждый из которых свидетельствует о той или иной стороне событий. Чисто теоретически, генетика — хороший свидетель. Гены как зонды, пронизывая весь пласт истории, доносят до нас сведения именно о наших предках, именно о тех группах населения, которые смогли передать свои гены из прошлого вплоть до современности, о тех, кто не затерялся на перепутьях истории, а сумел передать эстафету генов вплоть до наших дней. Генетика всё чаще выступает свидетелем исторических событий, создавая особого рода исторический источник. Однако надёжность её свидетельств зависит от достоверности исходной информации.
Впрочем, все исторические источники различаются по достоверности.
Вот первый пример — исторический источник, каждое слово которого насыщено бесценной информацией о становлении русского народа, которое доносит дыхание истины, глубины времени и пространства. Это летописец XI века (возможно, преподобный Нестор)[3]:
«И от техъ словенъ разидошася по земле и прозвашася имены своими, где седше на котором месте.
И тако разидеся словеньский языкъ, тем же и грамота прозвася словеньская.
Поляномъ же жившимъ особе по горамъ сим, бе путь изъ Варягъ в Греки и изъ Грекъ по Днепру, и верхъ Днепра волокъ до Лo-воти, и по Ловоти внити в Ылмерь озеро великое, из него же озера потечетъ Волховъ и вътечеть в озеро великое Нево, и того озера внидеть устье в море Варяжьское. И по тому морю ити до Рима, а от Рима прити по тому же морю ко Царю-городу, а от Царя-города прити в Понтъ море, в не же втечет Днепръ река. Днепръ бо потече из Оковьскаго леса, и потечеть на польдне, а Двина ис того же леса потечет, а идеть на полунощье и внидеть в море Варяжьское. И с того же леса потече Волга на въстокъ, и вътечеть семьюдесятъ жерель в море Хвалисьское. Тем же и из Руси можеть ити по Волзе в Болгары и въ Хвалисы, и на въстокъ доити въ жребий Симовъ, а по Двине въ Варяги, изъ Варягъ до Рима, от Рима же и до племени Хамова. А Днепръ втечеть в Понетьское море жереломъ, еже море словеть Руское, по нему же училь святый Оньдрей, братъ Петровъ, яко же реша».
Теперь второй пример — также реального и уважаемого исторического источника, но достоверность некоторых сведений которого мы сейчас оцениваем лишь восхищённой улыбкой: например, о народах, впадающих в зимнюю дрему. Это — отчет европейского дипломата (XVI век), созданный пятью веками позже летописи.
«Народы грустинцы и серпоновцы получили имя от крепости Серпонова, лежащей в Лукоморье на горах за рекою Обью. С людьми же Лукоморья, как говорят, случается нечто удивительное, невероятное и весьма похожее на басню; именно говорят, будто каждый год, и притом в определенный день XXVII ноября, который у русских посвящён св. Георгию, они умирают, а на следующую весну, чаше всего к XXIV апреля, наподобие лягушек, оживают снова. Народы грустинцы и серпоновцы ведут и с ними необыкновенную и неизвестную в других странах торговлю. Именно, когда наступает установленное время для их умирания или засыпания, они складывают товары на определённом месте; грустинцы и серпоновцы уносят их, оставив меж тем и свои товары по справедливому обмену; если те, возвратясь опять к жизни, увидят, что их товары увезены по слишком несправедливой оценке, то требуют их снова. От этого между ними возникают весьма частые споры и войны»[4].
Чтобы надёжность генетических свидетельств об истории народов не была подобна второму примеру, необходимо соблюдать строгие правила. Причём неважно, молекулярная или классическая генетика дают исходную информацию. Важно иное. Поскольку решаются популяционные задачи, то необходимо, чтобы исследование уже с самого начала проводилось с соблюдением требований популяционной генетики: важны размер выборки, отсутствие в ней родственников, изучение коренного населения и многое другое. Решающее значение имеет определение регионов обследования, спектра и количества популяций, на основе которых делаются выводы об истории народов.
Каков же выход? Как можно получить надёжные свидетельства генетики об истории? Есть два пути.
Во-первых, можно кропотливо работать и терпеливо ждать, пока наберётся достаточное число популяций с достоверной информацией по генетике. Но это процесс длительный, причём многие данные с низкой достоверностью (те, которые не соответствуют строгим правилам популяционной генетики) придётся исключать из анализа.
Во-вторых, можно собрать и иные — «не генетические» — свидетельства о генофонде, а затем, используя универсальную методологию геногеографии, провести комплексный анализ всех исторических источников, включая генетику. Ведь генетики стали изучать историю генофонда вовсе не на пустом месте. За предыдущие десятилетия тщательной работы антропологи, лингвисты и этнографы собрали детальную информацию практически обо всех народах мира. Огромные массивы информации накоплены биологическими науками о человеке — соматологией, дерматоглификой, одонтологией, палеоантропологией.
Первым путём мы прошли — он описан в пятой и шестой главах. Но, увы, число и надёжность этих сведений всё равно оставляют ощущение незавершенности, нехватки. Поэтому вся книга целиком — попытка пойти вторым путем.
ОБЪЕДИНЕНИЕ СВИДЕТЕЛЬСТВ
До сих пор исследование массивов данных о популяциях человека протекало параллельными потоками: генетика, антропология, лингвистика, этнография, археология изучали каждая свои данные, а потом обменивались общими выводами, сопоставляли отдельные результаты, порой произвольно отобранные. На пути слияния этих параллельных потоков стояла реальная преграда: не было технологии единого анализа столь разных признаков, изученных к тому же в совершенно разных популяциях.
Преодолеть эту серьёзную преграду и объединить потоки сумела геногеография. Её новые технологии позволяют из самых разнородных данных извлечь общие сведения о генофонде и свести потоки в единое русло. Может быть, столь сложная задача оказалась по плечу именно геногеографии оттого, что она сама комплексная наука, да и создана усилиями нескольких наук. Антропология ввела географический метод. Генетика добавила к нему генетическое мировоззрение и компьютерную технологию анализа карт. Симбиоз географии и генетики — геногеография — позволил выявлять генезис народов, открывать центры их происхождения. Именно здесь объединяются имена Е. М. Чепурковского, А. С. Серебровского и Н. И. Вавилова.
Основатель геногеографии Александр Сергеевич Серебровский настаивал на том, что она является наукой исторической, а не биологической! Неслучайно, что вопросы истории народов всё больше занимают умы генетиков, особенно в стремительно развивающейся молекулярной генетике. Быть может, именно поэтому вопросы генетической науки сегодня всё чаще оказываются в центре общественного внимания?
ГЕНОФОНД И «ИСКОННЫЙ» АРЕАЛ
Термин «генофонд» сегодня чаще используется политиками, журналистами и домохозяйками, нежели в самой науке: в сознании общества судьбы народа переплелись с судьбами его генофонда. Мысли о разрушении и вырождении генофонда, о средствах его спасения и оздоровления высказывают не столько учёные, сколько общественные деятели и публицисты. Почему же молчат учёные? Потому, что учёный может позволить себе высказаться, только располагая достоверными знаниями. Увы, таких знаний пока немного. Наука, в отличие от публицистики, не имеет права ни утверждать, ни отвергать соображения о том, что кризис, переживаемый обществом и народом, связан с процессами, происходящими в генофонде. Чтобы получить строго научный ответ, необходимы специальные знания, добытые профессиональными исследователями. И геногеографическое изучение генофонда — один из путей добычи таких знаний. Но для этого надо, прежде всего, знать, что такое генофонд, какие его изменения могут стать необратимыми и представлять для него угрозу. И первый шаг к прогнозу будущего генофонда — это обратиться к его прошлому. В древних китайских хрониках варвар виделся как человек, который не помнит прошлого, не думает о будущем.
В этой книге мы и пытаемся вспомнить прошлое, запечатлённое в русском генофонде, раскинувшемся на Русской равнине. С помощью геногеографии мы объединили свидетельства нескольких «очевидцев» (антропологии, классической и молекулярной генетики, фамилий) об устройстве современного русского генофонда. Но весь анализ направлен на то, чтобы в современном нам с Вами генофонде различить не веяние новых перемен, а непреходящие черты истории его сложения. Именно для этого мы изучаем коренное сельское население. Именно поэтому мы ограничиваем рассмотрение «исконным», то есть исторически сложившимся ареалом русского народа. Эта территория, охватывая центр Восточной Европы и Русский Север, составляет лишь часть от современного ареала русского населения. Но именно в её пределах сформировался русский народ.
Особо подчеркнём — исторический, «исконный» ареал задан вовсе не генетикой! Нет, он определён историческими науками, науками о прошлом. Именно они определяют, в каких пределах и на каких землях сложился русский народ. А генетика лишь послушно следует им, исследуя современный генофонд в границах этой исторической территории.
При этом «исконный» ареал мы всегда берём в кавычки, помня, что история дославянского населения на этой-территории на порядок дольше славянского. Генетическая память пронизывает все слои генофонда, все напластования, пришедшие от разных обитателей Восточной Европы. Поэтому предупредим: анализируя «исконный ареал», мы никогда НЕ говорим об «исконно русском генофонде», об «исконно русских» генах. Дело в том, что нельзя какие-то гены «привязать» к какому-либо народу. Есть генофонд, раскинувшийся в этом ареале и вобравший в себя (как и все другие генофонды) гены многих популяций, живших здесь прежде и оставивших в ходе многих тысячелетий свой генетический след. Попытка любой привязки гена к народу уже исходно неверна — это просто разные системы координат. Принадлежность к народу определяется самосознанием человека. Генофонд определяется концентрацией генов в исторически определённом ареале. Поэтому в нашем исследовании, говоря о русском генофонде, мы говорим обо всех генах, собранных всем долгим ходом истории в «исконном» русском ареале и запечатлённых в нём. А уж какие гены в него попали — это дело истории, не нам судить.
МЕРЫ ПРЕДОСТОРОЖНОСТИ
Не будите ассоциаций, если не способны их усыплять.
Ежи Лец.
И ещё два предостережения. Они касаются интерпретации карт в терминах исторических событий.
В книге Вы найдёте много карт самых разных признаков — антропологии, генетики, фамилий. И каждая карта в чём-то похожа на другие — ведь каждая отражает один и тот же генофонд. И в то же время каждая карта неповторима — каждая как бы видит генофонд по-своему. Для того чтобы разглядеть «общую модель» генофонда в её мелькающих отражениях, в книге использованы специальные технологии. Именно они и позволяют обнаруживать общие черты устройства русского генофонда.
Но есть опасность, от которой мы хотим предостеречь читателя — нельзя восстанавливать историю генофонда по карте отдельного признака. Нельзя хотя бы потому, что следующая карта покажет уже несколько иной облик, и рассмотрение генофонда вскоре превратится в рассмотрение калейдоскопа — занятие увлекательное, но не научное. Чтобы наши опасения стали понятны, поясним печальным, но реальным примером.
Авторитетный специалист в области гуманитарных наук рассматривал сто карт генофонда крупного региона. Каждая карта отражала распределение одного из ста генетических признаков — например, групп крови АВ0, резус и многих других. Все карты выглядели по-разному, но каждая карта находила у специалиста историческое объяснение. Одна объяснялась нашествием гуннов, другая — сарматов, третья — походом аланов и так далее. Поскольку специалист обладал широчайшей эрудицией, сразу стало ясно, что как бы причудливо ни распределились гены на карте — им всегда подыщется соответствующее историческое объяснение: за многие тысячелетия истории случилось столь много событий и прошло столь много потоков самых разных миграций! Число «объяснимых» карт целиком зависело от богатства ассоциаций, широты интересов и смелости воображения интерпретатора. Мы пытались объяснить ограничения возможностей генетики: карта — это лишь вероятностная модель распространения гена; данные генетики собраны лишь в разрозненных популяциях; для каждого гена изучен «свой» набор популяций, что и могло привести к различиям между картами; на каждый ген мог влиять естественный отбор, искажая печать, наложенную историей; множество случайных факторов отражены на картах отдельных генов. Но наши попытки предостеречь в расчёт не принимались. Карта воспринималась не как вероятностная модель распространения гена, не как одно из множества мелькающих отражений генофонда, а как последнее слово модной науки.
Поэтому мы сразу предупреждаем читателя, что такой подход не имеет никакого отношения к нашей науке. Да и к истории генофонда — тоже. Для того мы и собрали в этой книге такое множество карт, чтобы иметь возможность объективно сравнить их и извлечь то общее, что реально присутствует в большинстве карт и что подтверждается большинством свидетелей. Лишь эта «общая модель», эти общие «сквозные» черты и несут достоверную информацию об истории и о структуре русского генофонда, его пространственной архитектонике.
И второй пример в качестве второго предостережения. Он относится уже не к отдельным картам отдельных признаков, а к обобщённым картам, отражающим «общую модель» всей совокупности карт. Одни и те же карты таких «главных сценариев» регионального генофонда независимо обсуждались с четырьмя археологами, изучающими четыре разные эпохи в истории населения этого региона: палеолит, неолит, бронзовый век, железный. И каждый из четырёх специалистов говорил — как удивительно! Эти карты описывают события именно «моей» эпохи, именно так в «моем» временном срезе распределялись основные археологические культуры, именно в этих направлениях мигрировало население! Каждый из специалистов был профессионалом высокого класса.
Для нас, генетиков, это означало, что нет той единственной координаты времени, в которой возник наш «главный сценарий», когда сформировалась наблюдаемая нами пространственная архитектоника данного генофонда. Этих координат может быть несколько. Сходные пространственные структуры как бы наслаивались друг на друга от палеолита до современности. И причина в том, что реально существуют географические структуры, которые в разные времена направляли потоки генов в сходном направлении. По мнению географов, «чем дольше существовала та или иная территориальная структура, тем она устойчивее и способнее к самовосстановлению. Сколько уже столиц возродилось после разрушения на прежних местах… Караванные пути и почтовые тракты сменялись железными дорогами и авиалиниями; на месте деревянных кремлей ныне высятся столичные мегаполисы, но сохранились прежние направления большинства путей и относительное иерархическое значение многих центров. Похоже, что само географическое положение обладает инерцией или потенциальной энергией, которая легко высвобождается и ускоряет развитие на проторённых путях, но тормозит необоснованные новации» [Родоман, 1990, с. 42]. Поэтому не отдельная эпоха, культура и племя, а самые разные племена и в самые далеко отстоящие друг от друга времена — от палеолита до средневековья — могли оставить память в современном генофонде, отпечатавшись в одной и той же части его ареала «след в след».
Но к каким выводам мы бы пришли, если бы положились на своё собственное знание прошлого? Или если бы призвали не четырёх, а только одного специалиста по одной из эпох? Мы бы получили в высшей степени квалифицированную и аргументированную оценку времени сложения архитектоники генофонда. Но и не заподозрили бы, что существует целый ряд других, столько же аргументированных оценок, выводящих генофонд из совсем иных эпох. Нам кажется, что этот пример может послужить серьёзным предостережением для тех, кто увидит в картах знакомые черты того или иного ушедшего времени.
Эти примеры показывают, сколь непроста интерпретация пространственной изменчивости генофонда в терминах времени и исторических событий. Они показывают, как опасно полагаться на ассоциацию с историческим событием, возникающую при первом взгляде на карту — однажды разбуженную ассоциацию потом нелегко усыпить! Примеры объясняют и ту осторожность в обращении с прошлым генофонда, которой старались следовать авторы, и которую, как мы надеемся, разделят с нами и читатели.
Предмет нашего исследования — русский генофонд — многогранен, и каждый из нас может видеть его по-своему, вкладывать в этот термин свой смысл. Поэтому, чтобы не обмануть ненароком ожидания читателя, перечислим четыре главные особенности нашего взгляда на русский генофонд:
1. рассматривая современность, изучать историю;
2. думать на языке карты;
3. искать единство в разноголосице очевидцев;
4. в русском генофонде видеть Генофонд «в русских одеждах».
Рассмотрим эти четыре особенности подробнее.
1. ИСТОРИЯ
Мы рассматриваем только биологические различия между русскими популяциями разных регионов, причём под углом зрения популяционного генетика. Эта книга обращена лицом не к будущему русского генофонда, а к истории его сложения. Но как генетика «читает» прошлое в настоящем? Ведь всем известно, что генетика пока может широко исследовать лишь современное население, а вовсе не древнее? Конечно. Но мы специально организуем исследование так, чтобы в современном генофонде увидеть историю его формирования. Именно поэтому мы ограничили анализ пределами «исконного» исторического русского ареала. Именно поэтому мы изучаем сельское население, а не города — ведь сельское население в прошлом резко преобладало. Именно поэтому мы не рассматриваем группы населения, образовавшиеся в результате недавних миграций. Именно поэтому и процессы урбанизации, и миграции советского или постсоветского периодов специально выносятся за скобки. Поэтому мы и говорим, что наше исследование обращено к прошлому генофонда, к его истории. Живя в современности и не имея машины времени, мы вынуждены изучать современное население. Но мы пытаемся сконструировать такой «магический кристалл», сквозь который мы увидим в современном генофонде лишь те не эфемерные черты, которые свойственны ему не только сейчас, но и в прошлом.
2. ПРОСТРАНСТВО
В книге собраны показания разных наук о русском генофонде. Разнородные данные проанализированы одними и теми же методами и всегда — с акцентом на пространственной структуре генофонда. Подражая известному географу[5], мы можем сказать что «геногеография — субкультура, озабоченная пространством». Поэтому в книге всё внимание сосредоточено не на исходных данных, а на результатах их «пространственного» видения и анализа. Своеобразие книги в том, что результаты разных наук описаны одним и тем же языком — языком геногеографии, который является родным для авторов.
3. СВИДЕТЕЛИ
Мы сравнили разные типы данных о русском генофонде, полученных разными науками. Однако их истинный синтез, когда они не просто сравниваются, а как бы сплавляются воедино, и этот сплав рождает новое знание, отсутствующее во всех исходных системах данных — такой синтез оставлен на будущее. Это отдельная большая работа, время которой еще не пришло. Однако уже в этой книге подобраны и приведены данные, которые понадобятся для последующего шага. Например, сравнение русского генофонда с его соседями по Восточной Европе или с народами Евразии в целом. Такие «отклонения от темы» подобраны именно так, чтобы обрисовать архитектонику той симфонии, которая наиболее полно отразит внутреннее строение русского генофонда. А каждый тип признаков («свидетелей») — это как тип инструментов (духовых, струнных или же ударных), звучащих в лад при исполнении одной симфонии.
4. ГЕНОФОНД
Наконец, надо сразу же признаться, что авторов интересует не просто русский генофонд сам по себе, а пространственная структура Генофонда вообще. Для нас русский генофонд — это вовсе не генофонд «титульной» нации. Для нас это — Генофонд с русским ликом и в русских одеждах. Любуясь его особенностями, мы всё же пытаемся разглядеть в нём то общее, что есть в любом генофонде любого народа. Поэтому читатель, любящий русскую историю, может быть опечален, не найдя в книге описания интересных деталей русского генофонда, или же интерпретации региональных особенностей в плане любопытных событий русской истории. Иными словами, мы в русском генофонде пытаемся отыскивать общие закономерности для генофондов человека.
Те, кто рассчитывают найти прямолинейные ответы на животрепещущие вопросы: «Где гены татаро-монгольского ига?» или «Что сделал Пётр Первый с русским генофондом?» будут разочарованы. Мы старались задавать русскому генофонду только те вопросы, с которыми он хорошо знаком, и на которые мы можем получить от него ответы на более или менее строгом языке науки.
Русский генофонд (хотя авторы люди вполне русские) являлся для нас не единственным, а одним их многих, и, разговаривая с ним, мы хотели что-то понять о генофонде вообще, о генофонде других народов. Все генофонды в равной степени важны и заслуживают внимания. Для нас любой генофонд — в том числе и русский — уникальный, неповторимый, единственный. Но, рассказывая об уникальном русском генофонде, мы стараемся понять, а что же такое Генофонд? Поэтому в книге мы выходим далеко за пределы русского ареала — специальные главы посвящены генофондам населения Восточной Европы и Евразии. Но и в «русских» главах, и в методических разделах мы рассматриваем русский генофонд как модельный, как один из многих, как ту грань кристалла, которая ярко проявляет свойства целого.
Только поняв общее, можно оценить особенное.
Часть 1. ГЕНОФОНД В ПРОСТРАНСТВЕ И ВО ВРЕМЕНИ
Глава 1. ГЕНОГЕОГРАФИЯ: ЗРИМЫЕ ОБРАЗЫ ГЕНОФОНДА
«…Современная география генов является результатом длительного исторического процесса, и когда мы научимся читать то, что записано в образах современного распространения генов, мы сможем прочитать подробную историю… человечества…»
А. С. СеребровскийЭта глава — единственная во всей книге — чисто методическая. Нам пришлось её ввести для того, чтобы изучение русского генофонда не повисло в воздухе — без предыстории, без научных основ, без инструментария. Однако читатель, не любящий общие разделы, может смело пропустить эту главу: самые необходимые методы мы в двух словах опишем в тех местах, где они будут применяться; а если всё же какие-то термины и понятия окажутся незнакомыми, то можно за пояснениями вернуться к первой главе. Наиболее вдумчивых читателей, которых интересует «как это сделано?» и «почему именно так?», мы просим время от времени открывать Приложение — в нём приведены методология и доказательства объективности геногеографии. А в этой главе мы лишь бегло оглядим общие идеи геногеографии и поясним её основную терминологию. В Приложении изложены с некоторой последовательностью основы геногеографии — к ним стоит обратиться, если возникнет интерес не только к результатам, но и к «механизму» этой науки.
1.1. ИДЕИ ГЕНОГЕОГРАФИИ
Путь в прошлое — Отпечаток истории — Один на всех генах — Пристрастность биологического — Объединяй и властвуй — География генов — География генофонда — История в пространстве — Генетика здоровья — Популяция и ее генофонд — Генофонд и его земля — Генетические процессы — Клеймо биологии, ярмо демографии, иго истории… и покорность генофонда — Маятник поколений — След в пространстве — История не зависит от генов — Гены зависят от истории — Щепки в потоке — Невидим, но занимает место — Становится видим на карте — Летопись, составленная из карт — Не требует переводчика — Где центр мира? — Разнообразие народов — Этнические генофонды
ГЕНОГЕОГРАФИЯ И ПРОШЛОЕ
Геногеография способна напрямую связывать генетическую действительность современных поколений с древностью, какой бы глубокой она ни была. Ограничение только в том, что геногеография, идя от современных генов, имеет дело в прошлом лишь с предшественниками именно этих генов. Иными словами «потухшие» линии, «угасшие» генофонды, не оставившие потомков, геногеография не обнаруживает. Но в этом ограничении заключено очень важное преимущество геногеографии: в прошедших временах она открывает не вообще всё, что в них существовало, а лишь то, что генетически «проросло» в современность. И в этом её важное отличие от палеоантропологии и археологии: геногеография точно знает, что анализируемые ею древние популяции оставили потомков в нашей современности. Геногеография реконструирует именно те группы древнего населения, которые по историческим обстоятельствам сумели передать свои гены в генофонд современных поколений. Вот почему геногеография может служить новым источником исторической информации.
Мы уже упоминали во Введении, что основатель геногеографии А. С. Серебровский считал её наукой исторической, а не биологической. Геногеография, используя биологические маркёры, исследует с их помощью географическое отражение исторического процесса. Однако каждый отдельный ген в своей географии запечатлевает, кроме общей для всех генов исторической судьбы популяции, ещё и запись о своей собственной биологической истории, связанной с его «личными обязанностями» в отношении организма и взаимодействия с внешней средой. Поэтому, чтобы избежать такого искажения исторической информации, свойственного каждому отдельному гену, надо подняться на более высокую ступень геногеографического анализа — анализа не отдельных генов, а их совокупности. Здесь уже полностью реализуется замечательное свойство генов — свидетельствовать об исторических процессах.
Если со средой (внешней или внутренней) гены взаимодействуют по-разному, то для исторического процесса все гены одинаковы. Можно даже сказать — одинаково безразличны, так как не имеют отношения ни к содержанию, ни к направлению исторического процесса. Гены вовлекаются в него не сами по себе, а через своих носителей — членов популяции, которые являются, прежде всего, носителями культуры. Поэтому гены вовлекаются в исторический процесс, как щепки в поток, и позволяют следить за потоком истории сколь угодно долгое время, будучи сами вечными в масштабе исторического времени.
Поэтому надо только найти способ следить сразу за множеством генов, отслеживая не их «индивидуальные» биологические особенности, а именно ту общую историю, перед которой они все равны. Геногеография заменяет отслеживание во времени наблюдением в пространстве, а обобщённые («синтетические») карты позволяют отслеживать одновременно микроэволюци-онные траектории множества генов. Чем больше и чем более разных генов включено в синтетическую карту, тем надёжнее она восстановит географию исторического процесса в ареале генофонда.
ГЕНОГЕОГРАФИЯ + ГЕНОФОНД
Понятие «геногеография» ввёл русский ученый А. С. Серебровский ещё в начале XX века [Серебровский, 1928, 1930]. Рассматривая распространение генов в земном пространстве, геногеография осуществляет переход из микромира генов в макромир планеты. При этом геногеография обнаруживает длительно сохраняющиеся «запасы» генов, в которых А. С. Серебровский призывал видеть такое же естественное богатство, как в запасах нефти, золота, каменного угля и других невосполнимых природных ресурсов. Этот невосполнимый «генетический запас» Серебровский обозначил термином «генофонд» [Серебровский, 1928], и в 30е годы это понятие уже было перенесено Ф. Г. Добржанским в англоязычную литературу в форме gene pool [Dobzhansky, 1937]. Так и вошли в науку «геногеография» и «генофонд» рука об руку, как неразрывно связанные понятия: основной задачей геногеографии стало изучение генофонда.
Сопряжённые понятия «геногеография» и «генофонд» предназначались А. С. Серебровским для решения проблемы, находящейся на стыке генетики, эволюционной биологии, географии и истории [Серебровский, 1928, 1930]. Беда в том, что понятия «генофонд» и «геногеография», введённые в науку А. С. Серебровским [1928, 1930] как нераздельное целое, были разведены печальной историей генетики нашей страны. Живя собственной раздельной жизнью, они, как днища старых кораблей, обросли собственными ассоциативными рядами, и теперь попытки их воссоединения порождают громоздкие конструкции понятий и слов (например: «… геногеографическое изучение генофондов народонаселения…»).
Насильственное разлучение понятий «геногеография» и «генофонд» привело к совершенно разной их научной судьбе. Понимание генофонда как основы популяционного уровня жизни сохранилось лишь в отечественной науке, да и в ней постепенно вытеснилось понятием «генетической структуры популяции». С перенесением же на англоязычную почву проблемное содержание, заложенное А. С. Серебровским, утратилось. «Gene pool» стал скорее маловыразительным образом, чем обозначением глобальной научной задачи. Но самое печальное, что и на том, и на другом пути, утратилась исходная и необходимая связь геногеографии и генофонда, их идей, понятий и проблем. Изучение генофонда превратилось в генетико-статистический анализ свойств популяции.
Геногеография, замкнувшись в себе, превратилась в географию лишь генов, но не генофонда.
География генов и география генофонда — совершенно разные понятия. Разные хотя бы потому, что ареал есть неотъемлемое свойство генофонда, но никак не гена. Ген в общем случае вечен (пока с ним не случилась мутация), и уже поэтому он не может быть постоянно сопряжён с ограниченным в пространстве и времени популяционным ареалом. География гена может передать лишь отдельные сюжеты из жизни генофонда — правда, наиболее драматичные, когда ген на какое-то время оказывается «пленён» пространством. Такое может случиться в пору перехода единичной мутации в состояние популяционного полиморфизма или же при возникновении столь сильной зависимости от факторов среды на определённой территории, что ген становится приуроченным к ней. Этот сюжет обычно особенно привлекает внимание, поскольку здесь география приоткрывает физиологию действия гена в организме [Козлов и др., 1998; Limborska et al., 2002]. Но недаром А. С. Серебровский, относя генетику к наукам «физиологическим», исключал геногеографию из их числа. Он считал геногеографию особой отраслью исторического знания. И причина, по нашему мнению, в том, что география гена необходима, но не достаточна для географии генофонда. Геногеография, даже обращаясь к отдельным генам, исследует общую проблему — проблему генофонда, то есть факторов, условий и истории его формирования.
«География по отношению к человеку есть не что иное, как История в пространстве, подобно тому, как История является Географией во времени» [Реклю, 1906, с.1]. Это ясное и элегантное выражение принципа эргодичности, то есть взаимозаменяемости пространства и времени, как нельзя лучше отражает понимание геногеографии как истории генофонда, неотделимой от естественной и общественной истории популяций человечества.
ПОПУЛЯЦИЮ ЧЕЛОВЕКА можно определить как относительно обособленную группу населения, которая исторически сложилась на определённой территории и воспроизводит себя в границах этого «исторического» ареала из поколения в поколение. Это нестрогое и невнятное определение позволяет привлечь внимание к крайне важному моменту: для популяционной генетики «популяция» — это не просто случайная группа людей (например, газетное выражение «популяция роддома номер шесть» — к популяционной генетике никакого отношения не имеет!). Нет, популяция — это особый, исторически сложившийся, и главное — стабильный суперорганизм, живущий в конкретных рамках исторического времени и географического пространства. В этих же рамках времени и пространства существует и генофонд популяции.
ГЕНОФОНД ПОПУЛЯЦИИ — вся совокупность генов, которыми она обладает — имеет свой географический ареал, свои географические и историко-культурные границы. Эти границы, конечно же, не представляют собой непроходимые «заборы» — сквозь них проходят потоки генов, но они не столь интенсивны, как внутри границ ареала. Эти границы плывучи, текучи, неоднозначны, но при этом абсолютно реальны: их можно обнаружить и зафиксировать, например, изучая структуру брачных миграций. Поэтому генофонды разных популяций неизбежно различаются друг от друга.
Генофонд обладает свойством изменяться в поколениях. Поэтому необходимо всмотреться не только в «устройство» генофонда на данный момент времени, но и в те генетические процессы, которые формируют и реформируют генофонд. И здесь геногеография смыкается с демографией, экологией и географией населения, с антропологией, этнологией, археологией и историей народов, то есть с целым рядом сфер не только естественного, но и гуманитарного знания.
ГЕНЕТИЧЕСКИЕ ПРОЦЕССЫ
В генофондах и малых популяций, и всего человечества непрерывно происходят генетические изменения. Даже одно и то же поколение в период своего нарождения и в период ухода из жизни по генетическому составу не тождественно само себе. Причина — в связи жизнеспособности людей с их генотипами. Лишь в случаях внутриутробной гибели и ранней детской смертности эта связь проявляется зримо, чаще она улавливается лишь статистически. Обладатели разных генотипов при прочих равных условиях имеют неравную вероятность дожить до одного и того же возраста.
Ещё большие изменения в общем составе генофонда производит неравная рождаемость — разная вероятность для разных генотипов воспроизвести себя в поколениях. По параметрам рождаемости отличаются разные семьи даже в одной популяции, отличается городское население от сельского, отличаются разные районы страны друг от друга, отличаются, как все мы знаем, разные народы. Так что урбанизация, миграции, экономические условия, образ жизни, традиции вызывают неравный прирост разных частей генофонда и тем самым меняют общие характеристики генофонда от поколения к поколению. Изменения в составе генофонда как бы покорно следуют за всеми другими изменениями, в том числе в социально-экономической и культурной сферах жизни населения.
Отбор и обусловленные культурой изменения в рождаемости — это лишь самая очевидная поверхность тех глубинных генетических процессов, которые приводят к становлению, развитию или гибели генофонда. Основная цель популяционной генетики — изучить эти генетические процессы.
ВРЕМЯ
Время, в котором свершаются генетические процессы в популяциях, неторопливо — оно измеряется поколениями. От поколения к поколению происходят генетические изменения, которые и накапливаются в генофонде. Поэтому генофонды популяций, даже имеющих единое происхождение и единый прагенофонд, под действием таких медленных, но неумолимых изменений, начинают генетически удаляться друг от друга. Генетические изменения рано или поздно проявляются в различных свойствах населения, в том числе и в его антропологическом своеобразии.
Понятно, что проследить течение генетического процесса во времени весьма затруднительно для исследователя. Вся его исследовательская жизнь слишком коротка: она укладывается между двумя-тремя взмахами маятника, отмеряющего время популяции. Однако можно вполне успешно вести «отсчёт от обратного»: регистрировать ход генетического процесса по современному воплощению тех его итогов, которые оказались запечатлёнными в географическом пространстве. Почти всё, происходящее на Земле во времени, оставляет свой след в географическом пространстве. И изменения, происходящие в генофонде народонаселения,
— не исключение. Их след оставлен нам в неоднородном, иногда удивительно упорядоченном, а иногда причудливо сложном распределении человеческих генов в ареале генофонда.
Чтобы правильно читать эти следы, надо представлять характер причинно-следственных связей. Истоки генетического процесса уходят вглубь тысячелетий. В ходе истории изменение социальной среды вызывает изменение важнейших генетико-демографических параметров воспроизводства населения (изоляция, миграция, инбридинг), а через эти параметры уже воздействует и на генетическую структуру популяций.
Именно поэтому мы исходим из аксиомы, полагающей, что генофонд популяции несет на себе печать исторического процесса, ведёт его генетическую летопись (с присущими всем летописям искажениями, упущениями и ремарками), но генофонд сам непосредственно не направляет и не детерминирует этот исторический процесс. Ещё раз подчеркнём. Гены, как щепки в потоке истории, указывают («маркируют») её основное русло, водовороты и заводи — но сами гены не определяют ход истории популяции.
Разумеется, существует и обратная связь. Сложившиеся в определённой социальной и природной среде особенности генофонда адаптированы именно к этой среде. И поэтому при расселении, колонизации, любом ином изменении среды популяция заплатит меньшую цену, избирая внешние условия близкие к тем, в которых она формировалась.
ПРОСТРАНСТВО
Если отразить генетические характеристики популяций на географических картах, то окажется, что в пространстве они распределены не хаотично. Увеличение и уменьшение частоты встречаемости генов происходят более или менее плавно, так что не отдельные географические точки, а целые области пространства характеризуются сходными значениями генных частот. География распространения генов в населении является итогом и зримым пространственным воплощением тех генетических процессов, которые нам трудно проследить во времени. Так геногеография становится инструментом познания структуры генофонда и его истории.
Генофонд — реальный земной объект. Хотя и не видимый ни в какие приборы, он имеет определённые физические параметры, свою собственную структуру, занимает достаточно чётко ограниченное пространство — ареал. В нём он распределён с определённой «плотностью», и состав генофонда порой явственно меняется при переходе от одного популяционного ареала к другому. Географическое картографирование генофонда — единственный способ своими глазами увидеть этот объект в зримых образах карт; разглядеть процессы, протекающие в генофонде.
Конечно же, геногеографические карты имеют и прикладное значение. Например, они могут указывать районы с повышенным генетическим риском заболевания или концентрации генов, важных при переливании крови, трансплантации органов и тканей. Перед демографами такие карты могут раскрыть генетические последствия социально-демографических процессов, а археологам и этнографам — помочь обнаружить наиболее любопытные районы для поиска исторических корней современного населения. Геногеографическая информация может приобрести большое значение при использовании трудовых ресурсов. Геногеографические карты нужны и при решении задач криминалистики, спорного отцовства, идентификации личности и других практических целей — они количественно оценивают вероятность встретить тестируемый ген в данной точке пространства.
Но всё же главные и блестящие возможности геногеографии видятся нам в иной, «непрактичной» сфере: в разработке тех фундаментальных проблем, которые лежат на стыке естественных и гуманитарных наук, приоткрывая нам знание о самих себе — об истории племён и народов, о путях формирования современного населения, о его генетической адаптации и здоровье. С помощью геногеографии историки, этнографы, археологи получают в руки карты географического распространения своеобразных исторических памятников — генофондов. Гены не детерминируют историю, но выступают как свидетели истории. С помощью геногеографии мы можем прочитать генетическую летопись исторических событий, а карты являются страницами таких летописей.
Важно то, что геногеография не просто увеличивает объём научной информации, а упорядочивает и преобразует эту информацию так, что она становится легко читаема и доступна для самого широкого круга специалистов. Современная геногеография строит компьютерные карты и проводит их компьютерный анализ. И это не дань моде, а необходимость и условие масштабного геногеографического исследования, результаты которого, к тому же, оказываются доступными для специалистов из смежных областей.
НАРОДЫ
Результаты изучения генофондов мира оказались куда более неожиданны и впечатляющи, чем можно было бы предположить даже в самой острой, но непрофессиональной дискуссии о генофонде. Не в пылу полемики, а в результате специально проведённого анализа генофондов народов всего мира, мы можем сегодня утверждать, что именно генофонд Северной Евразии (основную часть которого составляет Россия) сохраняет в себе максимум характеристик общечеловеческого генофонда. Такого сходства с генофондом человечества нет ни в одном другом генофонде коренного населения мира [Балановская, Рычков, 19906; Balanovska, 2001; Балановская, 2004]. Если основываться только на этих свойствах и на минуту забыть, о сколь северной окраине ойкумены идёт речь, то можно было бы подумать, что мы имеем дело с некой самой центрально расположенной частью мировой суши или же с прародиной человечества. Но поскольку первое предположение неверно, а второе невероятно, то тем самым мы стоим перед самой настоящей загадкой, представляющей серьёзную научную проблему.
В генофонде населения Северной Евразии сохранена наибольшая часть мирового генетического разнообразия (см. подробно Приложение). Но какие силы поддерживают это разнообразие? Ведущим фактором оказался не некий элемент природной среды, а этносы, народы. Специально проведённый анализ показал, что именно этническое разнообразие, то есть разнообразие народов, возникавших в пределах Северной Евразии на протяжении всех прошедших тысячелетий, хранит основную часть межпопуляционного генетического разнообразия [Балановская, Балановский, 1999; Балановская, 2004]. И потому изучение происхождения народов и их истории оказывается неотделимо от темы геногеографического изучения генофонда.
1.2. ИНСТРУМЕНТАРИЙ ГЕНОГЕОГРАФИИ
§ 1. Генетические маркёры: Как их изучают: экспедиции, ДНК и анализ — Наследование аутосомных маркёров и однородительских — Полиморфизм генов и их рекомбинация — Отсутствие рекомбинации: гаплотипы, гапло-группы — Как ошибки переписчиков рождают новые гаплотипы — Типы генетических маркёров
§ 2. Карты: Как по одной таблице сделать два противоположных вывода — Чем карта лучше таблицы — Как было написано первое письмо — Когда карта показывает больше сведений, чем на неё нанесли — Частота признака на разных территориях — Цифровые карты — Пространство, разложенное по ячейкам — Расселение человека дискретно — Но его карта непрерывна — Как «цифровую» карту сделать «видимой» — Стереть случайные черты… — Трендовые карты
§ 3. Опрос очевидцев: Много очевидцев одного события — Много субъективных мнений объективнее одного — Многоочий или мультиокулярный? — Комплексный анализ — Уже наполовину синтез — Необходимость карты — Много простых карт и одна обобщённая — Каждой науке по обобщённой карте — Обобщая обобщённое — Как прогресс ДНК технологий постепенно приближал нас… к уже известному — Перспективность однородительских или надёжность аутосомных — Карты прошлого — Новые виды обобщённых карт
§ 1. Генетические маркёры
Мы уже говорили о том, что изучение отдельных генов — не цель геногеографии, а только средство для достижения главной цели: изучения генофонда. Но без этого средства не обойтись. В этом разделе кратко рассматриваются разнообразные типы генов, которые используются в геногеографии.
КАК ИЗУЧАЮТ ГЕНЕТИЧЕСКИЕ МАРКЁРЫ
Изучение генов трудоёмко — оно требует намного больших затрат времени и средств, чем, например, изучение антропологического состава населения. Для того чтобы изучить ДНК маркёры (а именно ими интересуется сейчас популяционная генетика человека), надо сначала выехать в экспедицию и обследовать популяцию. При изучении коренного населения (а именно на него ориентирована мировая популяционная генетика), для каждого обследуемого составляется краткая родословная. Ведь надо собрать образцы венозной крови лишь у тех индивидов, которые не связаны между собой родством и достойно представляют свою популяцию: все предки обследуемых на протяжении двух поколений должны относиться не только к данному народу, но и к данной региональной популяции. Если учесть, что образцы крови берутся сейчас только у мужчин (чтобы одновременно в одной и той же выборке изучать все генетические маркёры, в том числе Y хромосомы) и каждый подписывает свое информированное согласие на обследование, то ясно, что экспедиционная работа становится нелёгким этапом в изучении генетических маркёров.
Образцы крови, хранящиеся на холоде, срочно доставляются в молекулярно-генетический центр. Там из крови выделяется ДНК — достаточно хлопотное, трудоёмкое и дорогое занятие. Особенно, если ДНК выделяется теми методами, которые обеспечивают максимальную очистку ДНК от примесей и поэтому долгосрочное хранение ДНК коллекций. После этого ДНК уже может спокойно храниться в морозильных камерах.
И начинается третий, самый интересный, но и самый длительный, разнообразный и дорогостоящий этап — определение у каждого индивида тех вариантов генов (или точнее — вариантов ДНК), по которым одни популяции отличаются от других. Этот чисто технический процесс, требующий, однако, высокой квалификации и обширных познаний, приводит к выявлению ДНК полиморфизма изучаемых популяций. Причём нельзя ограничиться одним или несколькими генами — для полноценного изучения генофонда панель анализируемых генов должна быть велика и разнообразна. Уже сейчас есть технологии, которые позволяют одновременно выявлять полиморфизм сотен и даже сотен тысяч генов. Однако эти технологии слишком дороги для большинства (в особенности — российских) лабораторий, которым приходится довольствоваться иными, весьма трудоёмкими методиками и ограничиваться изучением полиморфизма десятка, а не сотен генов. Впрочем, корректность выбора популяций часто оказывается важнее числа изученных генов, и даже по немногим генам удаётся выявить устойчивую структуру генофонда.
Именно из-за большей сложности изучения генетического полиморфизма (от сбора образцов крови до дорогостоящего анализа) данные по распространению генов обычно охватывают куда меньшее число популяций, чем данные по антропологии или же по частоте встречаемости фамилий (которые также служат источником знаний о генофонде и подробно обсуждаются в главе 7). Однако лишь генетические маркёры несут прямую информацию о генофонде.
АУТОСОМНЫЕ И «ОДНОРОДИТЕЛЬСКИЕ»
От каждого из родителей мы получаем по Одному «комплекту» генов — потому-то каждый ген имеется у нас в двойном наборе. Такие гены, один из которых получен от отца, а другой — от матери, называют «аутосомными».
Практически все гены относятся к аутосомным. Однако есть и малые, но важные для изучения истории человека, исключения — это гены, переданные только от одного из родителей, и потому именуемые «однородительскими» (uniparental). Иными словами, комплекты генов, переданных от каждого из родителей, оказываются не совсем полными и идентичными друг другу. Только мужчины и только от отца получают Y хромосому. У женщин её нет. Только от матери все мы получаем ДНК, содержащуюся в митохондриях клетки.
Митохондрии передаются потомкам только от матери с яйцеклеткой, содержащей всё необходимое для начала развития нового организма. Сперматозоид приносит от отца практически только ядро с наследственной информацией — митохондрии он не передаёт новому организму. Поэтому и мужчины, и женщины имеют митохондриальную ДНК (мтДНК), полученную ими от матери. Но следующему поколению передают мтДНК только женщины
— на мужчинах цепь передачи информации митохондриальной ДНК как бы обрывается. Поэтому, если число потомков в какой-то родословной вдруг оказывается невелико, и на свет появятся только мальчики — вся длиннейшая цепь передачи информации мтДНК из глубины тысячелетий оборвётся, и никогда уже не будет восстановлена. Впрочем, цепь обрывается и тогда, когда на свет появляются только девочки — в этом случае обрывается цепь передачи Y хромосомы. Для аутосомных генов такая угроза утраты информации намного меньше.
Если гены человека представить как слова универсального языка человеческой наследственности, то геном (или генотип) каждого из нас, включающий и аутосомные, и однородительские гены — это особый неповторимый текст, составленный на этом языке. Тогда генофонд популяции представляет собой на каждый конкретный момент времени совокупность индивидуальных текстов. Генофонд всей популяции содержит весь «словарный запас» данной популяции, из которого в каждом поколении черпаются слова и строятся новые индивидуальные тексты. «Тексты» велики, их разнообразие огромно и обеспечивает биологический фундамент неповторимости человеческой личности.
ПОЛИМОРФИЗМ
Популяционная генетика занимается полиморфными генами — то есть такими генами, которые встречаются в популяциях не в одном, а в разных вариантах (аллелях). Каждый из аллелей является результатом тех или иных мутаций гена, происшедших обычно в далёком прошлом и передающихся в цепи поколений. Причём для целей популяционной генетики важно, чтобы эти варианты не были очень редкими — согласно разным критериям полиморфизма, аллели полиморфного гена должны встречаться в популяции с частотой не менее 1 % или даже 5 %. У полиморфного гена семейство таких аллелей может быть самым разным по величине. Если оно минимально — всего два аллеля — гены называются диаллельными. Если же семейство аллелей очень велико — мультиаллельными. Но сколь бы ни было велико семейство аллелей, каждый отдельный человек в своём тексте не может содержать больше двух вариантов одного слова (два аллеля одного гена): один он получает от матери, и один — от отца. Если полученные аллели данного гена оказались одинаковы, то человек гомозиготен по данному гену. Если аллели отличаются друг от друга — то человек гетерозиготен по данному гену. Соотношение в популяции гомозигот и гетерозигот по множеству генов служит очень ценной характеристикой генофонда — уровня его гетерозиготности (о важности этой характеристики см., например, [Алтухов, 2003]).
Все мы знаем, что дети, к счастью, не являются ни копией друг друга, ни лишь одного из родителей: мы говорим — глаза отцовские, а характером весь в бабушку. Почему в каждом из детей уникальным образом сочетаются полиморфные гены, передаваемые в поколениях? Потому что при передаче в следующее поколение разные аутосомные гены ведут себя независимо друг от друга. Одному из детей отец передаст один из своих аллелей, другому — другой, а какой из них отец получил от своего отца, а какой от своей матери — это уже равновероятно и при передаче собственным детям не имеет значения. Аутосомных генов много, и каждый раз при передаче в поколениях они «перетасовываются». Поэтому сочетание аллелей у каждого из детей окажется неповторимым. Но такой процесс рекомбинации происходит только с аутосомными генами.
Можно представить себе весь передаваемый генетический «текст» в виде многих томов личной библиотеки. Получил человек в наследство от отца и от матери по полному собраний сочинений: скажем Марка Твена от отца и Агаты Кристи от матери. Пусть каждое собрание состоит, например, из ста томов-генов. Теперь подрос его собственный ребенок. И что отец оставляет ему в наследство? Не глядя, берет, скажем, 1 и 2 тома из отцовского Марка Твена; 3, 4 и 5 тома — из материнской Агаты Кристи, 6, 7 и 8 том — снова Марк Твен, а 10 — Агата Кристи, и так далее в совершенно случайном порядке. Ребенок получит от отца, как ему и положено, сто томов собрания сочинений, но вот какие тома будут из Марка Твена, а какие из Агаты Кристи — неведомо. От матери ребенок получит тоже сто томов, но в нём будут в столь же случайном порядке представлены тома из сочинений Карла Маркса и Иоанны Хмелевской. Своим детям он оставит в наследство вновь библиотеку из положенных ста томов, но в ней будут случайно чередоваться произведения Карла Маркса, Агаты Кристи, Марка Твена и Иоанны Хмелевской. Библиотека следующего поколения будет еще более пестрой.
ГАПЛОГРУППЫ. ГАПЛОТИПЫ
С однородительскими маркёрами рекомбинации не происходит — ведь дети получают генетическую информацию только от одного из родителей. Поэтому и весь генетический текст, записанный в митохондриальной ДНК или нерекомбинирующих участках Y хромосомы, они целиком передают потомству. Так целиком всё собрание сочинений однородительских маркёров, том к тому, передаётся от отца к сыну, а от матери — дочерям. Этот генетический текст (полное собрание сочинений) называют гаплотипами мтДНК и Y хромосомы. Но сразу возникает вопрос. Если эти гаплотипы передаются неизменными во всей чреде поколений, то все ли дочери Евы одинаковы? Разве у всех одинаковые «библиотеки» мтДНК? Откуда же берётся полиморфизм, различия по гаплотипам мтДНК?
Чтобы ответить на этот замечательный вопрос, напомним, что прежде, чем передать потомкам генетический текст, его сначала отдают в «переписку». Ведь если у Вас четырнадцать детей, Вы каждому должны оставить в наследство свою генетическую библиотеку? Переписчики очень старательны, но время от времени в долгой чреде поколений случаются и ошибки. Выпала страница из книги. Или как у Гофмана, перепутались странички сочинений кота Мурра и его хозяина. Всякое может случиться. Но следующие переписчики этого не ведают — они переписывают всё подряд из того, что им досталось в наследство. Поэтому в чреде поколений передаются неизменными эти «ошибочные» странички. Но, конечно же, эти «ошибочные» странички есть только у многочисленных потомков того индивида, у которого произошла данная «ошибка». У других этой «ошибки» нет, но могут быть иные «опечатки». Так, потомки каждого из индивидов, отмеченного «опечаткой», отличаются от потомков иных индивидов. Такие линии передачи генетической информации называются «линиджами» (lineage), и в каждой из них постепенно накапливаются свои собственные ошибки. Настоящие рукописи именно так различаются и датируются — можно сравнить и определить, к какому «изводу» относится старинная рукопись по наличию характерных разночтений и ошибок, копируемых от переписчика к переписчику.
Такие группы родственных гаплотипов, собранных в «линиджи» той или иной степени протяженности, объединяют в гаплогруппы. Каждая гаплогруппа состоит из «куста» родственных линиджей, в разной степени разветвлённого. Да и гаплогруппы подразделяются на разные иерархические уровни (см. главы 6 и 9).
В целом, картина похожа на генеалогическое древо древнего и знатного рода. Но она намного проще — для мтДНК записывается в этом генеалогическом древе происхождение только по материнской линии (от Евы ко всем её нынешним дочерям), а для Y хромосомы — записывается генеалогия только по отцовской линии (от Адама — ко всем его нынешним сыновьям). Много проще она и тем, что записываются на генетическом древе не имена, а только мутации («ошибки переписчиков»), а они случаются нечасто. Зато корни генетического древа уходят на огромную глубину — на все время существования человечества.
ТИПЫ ГЕНЕТИЧЕСКИХ МАРКЁРОВ
В следующем разделе мы даём краткую справку о разных типах генетических маркёров. Поэтому здесь мы обрисуем лишь общую картину. Сейчас принято молекулярно-генетические маркёры, изучаемые при прямом анализе ДНК, называть ДНК маркёрами. Все остальные признаки, с которыми работала популяционная генетика до «ДНК эры», стали называть общим именем — «классические генетические маркёры». Такое деление удобно.
Среди классических маркёров (см. подробнее также главу 5, им посвящённую) выделяются три основных подтипа, которые перечислим в «историческом» порядке их использования. 1) Физиологические маркёры — те физиологические признаки, проявление которых контролируется одним геном. Например, цветовая слепота, вкусовая чувствительность к фенилтиокарбамиду или тип ушной серы. 2) Иммунологические маркёры — белки иммунной системы, определяемые иммунологическими (серологическими) методами. Например, всем известные группы крови АВ0 и резус. 3) Биохимические маркёры — ферменты (обычно сыворотки или эритроцитов крови), определяемые биохимическими методами, такими как электрофорез и изоэлектрофокусирование.
ДНК маркёры, используемые в популяционной генетике, имеют несколько разных критериев классификации (см. раздел 7.5.). И поэтому эти классификации перекрываются друг с другом. Мы уже говорили, что есть аутосомные маркёры, а есть однородительские (мтДНК и Y хромосомы). Но среди и аутосомных генов, и среди однородительских есть и диаллельные маркёры, и мультиаллельные маркёры. Среди диаллельных ДНК маркёров обычно выделяют три типа: «точечные» замены (их обычно называют «снипы», то есть SNP — single nucleotide polymorphism, однонуклеотидный полиморфизм); инсерции (например, вставки мобильных элементов — Alu-повторы); делеции (например, см .раздел 6.1, где описывается распространение делеции в гене CCR5, определяющей устойчивость к СПИДу). Из мультиаллельных ДНК маркёров в популяционной генетике кроме таких, например, систем как HLA (гистосовместимости), самой природой нацеленных на максимальный полиморфизм, обычно изучают минисателлитные и микросателлитные (STR — short tandem repeats) маркёры. Эти маркёры любопытны тем, что аллели одного гена отличаются друг от друга просто количеством повторов одного и того же «мотива»: только у минисателлитных маркёров «мотив» подлиннее, а у микросателлитных состоит из сочетания всего нескольких букв, но это сочетание многократно и монотонно повторяется. Мутации в этих маркёрах накапливаются довольно быстро — просто на один повтор становится больше или меньше. Именно благодаря такой повышенной скорости мутаций эти маркёры и важны — их используют как «минутную» стрелку при датировке гаплогрупп Y хромосомы, а медлительные «снипы» — как «часовую» стрелку.
Мы видим, что отнесение к одному из подтипов классических маркёров или же к ДНК маркёрам целиком определяется технической стороной, например, методом тестирования гена. Суть всех генетических маркёров едина: в результате того или иного метода тестирования (показываем ли книжку с цветными картинками для определения цветовой слепоты или же проводим секвенирование ДНК, выявляя точную последовательность нуклеотидов) мы по результату тестирования однозначно определяем наличие или отсутствие у человека конкретных аллелей конкретного гена. Поэтому определяемые признаки и называются «маркёрами» гена, генетическими маркёрами — потому что они прямо и совершенно однозначно указывают на этот ген, маркируют этот вариант ДНК.
Почему мы это подчёркиваем? Оттого, что порой сталкиваешься с тем, что к генетическим маркёрам относят просто признаки с большой долей наследственной компоненты — например, цвет глаз или признаки кожных узоров. Это неверно. Как бы ни был велик вклад наследственности, но если мы не можем однозначно указать, какие именно гены стоят за данным фенотипом, каков точный тип наследования, мы не имеем права называть эти фенотипические признаки генетическими маркёрами. Только однозначное определение аллелей генов, стоящих за данным фенотипом, позволяет отнести признак к генетическим маркёрам.
Подобная ситуация и с квазигенетическими маркёрами (глава 7). Но к ним относят те маркёры, у которых никто и не подозревает «генетическую предрасположенность» — например, фамилии, название рода, демографические параметры. Всем сразу ясно, что эти признаки не имеют не только генетической, но и биологической природы. Поэтому честно и заявляется, что они квазигенетические, то есть «псевдогенетические». Однако, несмотря на такой «псевдоним» и то, что они не определяются генами (фамилия — явление языка и культуры, а не биологии), квазигенетические маркёры порой себя ведут почти так же, как и настоящие гены — и даже благодаря истории иногда оказываются в одной связке с генами. Такая связь между фамилиями и генами рассмотрена в 7 главе, посвящённой фамилиям.
§ 2. Карты
Географию занимают бесплотные и долговечные души земного мира, а не наполняющие его плотные, но тленные вещи.
Б. Б. РодоманДОСТОИНСТВА КАРТ
Речь пойдёт о главном рабочем инструменте этой книги — компьютерных картах, показывающих, какова вероятность встретить тот или иной признак в любой точке изученного ареала генофонда.
Конечно же, бесконечное генетическое разнообразие человека сложно охватить и представить даже в самых общих чертах — основная часть нашего наследственного полиморфизма выражается в нашей индивидуальности, в неповторимости каждого из нас, в бескрайней многоликости человечества. И всё же даже на бытовом уровне осознания мы умеем среди этой многоликости выделять некие общие популяционные черты и порой идентифицировать даже единичных представителей разных популяций, народов и регионов. Науки о биологии человека — антропология, генетика — различают популяции не интуитивно, а с помощью объективных мер. Оценивая количественно самые разные признаки антропологического покрова (измеряя тело, голову, лицо, оценивая в баллах форму носа, цвет глаз или рост бороды) и генетического фундамента (частоты встречаемости в популяции разных вариантов самых разных генов), мы объективно фиксируем черты «портрета» данной конкретной популяции. Но когда надо охватить сразу множество таких популяционных портретов — здесь уже не хватает нашего воображения. И тогда на помощь приходит компьютерная картография.
Карта — уникальный способ передачи и обобщения информации. Благодаря ей, мы можем своими глазами увидеть всё разнообразие отдельного признака на огромной территории. Но самое главное, что этот образ не будет результатом нашего индивидуального
— и неизбежно субъективного — обобщения. Опыт показывает, что даже специалисты очень высокого класса, обобщая табличные данные без карты, приходят порой к совершенно разным выводам! Все мы видим по-разному, в зависимости от опыта, силы воображения, накопленных знаний и порой неосознаваемых нами установок. Компьютерная карта позволяет избежать субъективности, позволяет не только создать объективный и математически точный образ пространства, но и передать его без искажений всем читателям карты. И тогда уже опыт, воображение и обширные познания пригодятся при интерпретации карты, позволяя всем её читателям на одном языке обсуждать пространственную изменчивость населения.
КАРТОГРАФИЯ
Карта, по-видимому, древнее письменности. И это не удивительно, ибо язык карты универсален. Он был понятен разным племенам и носителям разных культур, объединял людей, говорящих на разных языках. И до сих пор он не утратил эту функцию — на языке карты могут общаться и полноценно сотрудничать специалисты разных отраслей знания, даже столь отдалённых, как генетика, антропология, лингвистика, археология.
Картографирование столь разных признаков (цвета волос, частоты гаплогруппы митохондриальной ДНК, встречаемости костей мамонта на стоянках древнего человека) относится к одной науке — тематической картографии. Поэтому — при условии использования общей системы основных концепций, моделей и технологий — карты признаков генетики, антропологии, лингвистики, археологии становятся принципиально сопоставимы. А анализ общих закономерностей, выявляемых этими картами, может быть поставлен на строгую научную и математическую основу.
КАРТА — СПОСОБ ОТОБРАЖЕНИЯ ИЛИ СРЕДСТВО АНАЛИЗА?
В современной картографии существуют две основные концепции. Первая парадигма — коммуникативная. Она рассматривает картографию как отрасль информатики, науку о передаче графической информации, а карту — как особый информационный канал. В центре её внимания — процесс восприятия и качественной передачи информации, задача уменьшения потерь информации в канале связи.
Вторая парадигма — гносеологическая. Согласно ей картография рассматривается как наука о познании окружающей действительности с помощью картографического моделирования, а сами карты служат образно-знаковыми моделями действительности. Ядро гносеологической парадигмы составляют проблемы отражения природных и социальных геосистем, картографического синтеза, научной генерализации, картографического метода изучения закономерностей.
Таким образом, при первом подходе карты рассматриваются как канал передачи уже накопленной информации, при втором — как метод познания действительности, добывающий новые сведения об объекте картографирования.
Мы в своей работе исходили из второй парадигмы. Подход к картам только как к каналу информации резко сужает возможность исследования явлений природы и общества, поскольку при этом постулируется, что информация, считываемая с карты, не может превышать количество исходной информации. При этом исчезает сам феномен карты, которая в действительности определяется не только и не столько объёмом знаковой информации, сколько пространственными соотношениями между картографированными объектами.
Картографическое моделирование позволяет провести анализ пространственных закономерностей в изменчивости отдельных признаков и геосистем в целом. Карта, как образно-знаковая модель действительности, является носителем информации и служит инструментом формирования и приобретения новых знаний о пространственно-временных связях картографируемых явлений [Берлянт, 1986; Салищев, 1990]. Картографическую модель от других носителей информации отличает создание картографического образа, в котором присутствуют взаимное расположение и иные пространственные отношения картографированных объектов и явлений.
КАРТА КАК МОДЕЛЬ
Рассмотрение карты не как иллюстрации, не как справочного пособия, не как наглядной сводки данных, а как модели действительности, создающей новую информацию о картографируемых явлениях, — вот что лежит в основе картографического моделирования всех — столь разных! — признаков в данной книге.
В зависимости от параметров моделирования на основе одних и тех же исходных данных можно создать целое семейство моделей. И с помощью моделирования мы можем перейти к активному эксперименту, объективно сравнить разные подходы и теории. Картографическая модель — не мёртвое изображение, а рабочая гипотеза, позволяющая провести как строгую математическую, так и экспертную проверку.
Кратко сформулируем принципы картографического моделирования.
1) Количественное представление признаков. Значительную часть признаков можно охарактеризовать частотой их встречаемости в конкретной популяции. Такая частота означает вероятность встретить данный признак на данной территории. Качественные признаки антропологии представляются также в количественном виде — в баллах.
2) В основе карты — цифровая модель. Это центральный элемент нашей картографической технологии. В каждой точке карты находится число — значение признака. Такое представление данных позволяет обращаться с картой не как с иллюстрацией, а скорее как с таблицей, точнее, как с матрицей данных — например, проводить разнообразные вычисления, количественно сравнивать разные карты и многое другое.
На карту как бы накинута густая равномерная сеть. В каждом узле сети находятся цифровые значения признака. Например, на картах Восточной Европы такая сеть насчитывает более 9000 узлов, и в каждом из них — рассчитанное нами значение картографированного признака. Цифровая модель карты — это двумерная матрица, позволяющая проводить все виды математической обработки.
3) Непрерывность картографического распределения. В обоснование этого принципа лишь процитируем Ж. П. Дюшмена: «Хотя расселение дискретно, освоение пространства человеком непрерывно» [Дюшмен, 1983]. Картографируя освоенное человеком пространство, мы с необходимостью переходим от дискретности исходных данных к непрерывному распределению карты. Для каждой точки карты мы получаем вероятностную характеристику популяции — даже если поблизости от этой точки в данный момент времени нет ни одного постоянно проживающего человека. Именно так мы переходим от дискретно расположенных населённых пунктов к непрерывному ареалу популяции.
4) Интерполяционная процедура картографирования. Между точками с исходными значениями признака (мы их называем «опорными» точками) интерполируется градиент этих значений, то есть значения признака в промежуточных точках прогнозируются согласно заданной математической процедуре. За пределами изученных областей проводится экстраполяция (по той же процедуре) градиента значений признака. Прогноз строится не по соседним точкам, а по всем опорным точкам в пределах радиуса в сотни километров. На карте градиент значений визуализируется с помощью изолиний.
При этом мы постулируем отсутствие непреодолимых границ между группами населения. Такие границы в освоенном человеком пространстве сомнительны даже при одномоментном временном срезе очень малой территории. При охвате же больших ареалов и, следовательно, целого слоя времён, сформировавших генофонд в этом ареале, нивелируются частные события истории: мы как бы усредняем множество изменчивых границ в пределах всего хронологического среза. Поэтому для моделирования динамики явления не годятся ни значковые карты (когда в центре ареала популяции помещается значок с фиксированным значением признака), ни широко распространённые карты качественного фона (весь ареал популяции заливается одним и тем же фиксированным значением признака; на этих картах смежные ареалы залиты каждый своим значением признака, как бы предполагая неприступные для человека и его генофонда «заборы»). Если же какое-то пространство действительно непреодолимо, и такие границы существуют, то они проявятся и на интерполяционных картах, опровергая «нулевую» гипотезу изоморфного пространства.
Например, Атлас генофонда народов Кавказа был создан нами без учёта каких бы то ни было географических препятствий для потоков генов. Карты были построены в предположении изоморфности пространства. Процедура построения карт не накладывала никаких ограничений — интерполяция шла равновероятно и в сторону непроходимых гор, и в направлении оживлённых торговых путей. Однако сами генетические различия между популяциями уже содержали информацию об интенсивности потока генов в том или ином направлении. Поэтому на «синтетических» обобщённых картах мы к своему изумлению увидели резкий перелом, перепад значений, который полностью вторил своими изгибами Большому Кавказскому хребту (т. рис. 10.2.2. в главе 10). Большой Кавказ проявился на генетических картах благодаря реальным различиям между генофондами, то есть объективно, а не по причине заложенных нами в технику построения карт препятствий для потока генов.
5) Генерализация карты. Генерализация карты — это обобщение, выделение основных черт карты, при этом степень генерализации может быть разной и должна соответствовать масштабу исследования. Эпиграфом генерализации можно было бы взять слова А. Блока «Сотри случайные черты — и ты увидишь…».
Согласно модели Мерке, вероятность создания правильного картографического образа, отражающего пространственные закономерности карты, обратно пропорциональна насыщенности исходной информацией. Карта исходных данных перегружена историческими случайностями, и генерализация карты — это не сворачивание, а «проявка» истинной информации.
В качестве «бесстрастной меры» для генерализации карты мы использовали метод выделения трендов. Тренд — это основные тенденции пространственных распределений, общие и региональные черты рельефа карты. Из множества реализованных нами вариантов построения трендовых поверхностей в данной книге использованы методы выявления тренда путем осреднения в скользящем окне заданного размера и моделирования сквозного тренда в предположении распространения признака из единого центра. Краткое описание методов приводится в Приложении. Использование трендовых моделей (а не исходных карт) принципиально при анализе динамики на значительных пространствах и мощных хронологических пластах.
Конечно же, любая картографическая модель — это всего лишь один вариант из множества возможных моделей распространения признака. Но важно то, что он полностью воспроизводим, объективен, и доступен столь же однозначной и воспроизводимой коррекции. Более того, мы обычно создаём не одну, а множество таких картографических моделей, варьируя их параметры — и тогда серия карт распространения одного и того же признака позволяет увидеть его «объёмно» и отделить устойчивые черты от случайных.
Способ построения карт, их разновидности, картографические технологии подробно описаны в Приложении, к которому читатель может обратиться в любой момент, когда созреет вопрос о том, как были созданы рассматриваемые им многочисленные картографические модели.
§ 3. Опрос очевидцев
Тебе дано бесстрастной мерой
Измерить все, что видишь ты.
Твой взгляд — да будет твёрд и ясен
— Сотри случайные черты —
И ты увидишь — мир прекрасен.
Александр БлокВопрос объективности получаемого «портрета» генофонда является решающим. Каждая наука, каждый тип признаков субъективны — каждый видит генофонд по-своему. Как же найти реально существующую структуру генофонда среди разнобоя мнений очевидцев?
Одним из главнейших средств выявления объективного «портрета» генофонда является параллельный анализ одного и того же генофонда по разным типам признаков. Разные типы признаков — классические и ДНК маркёры генетики, антропологические признаки, фамилии и даже археологические характеристики — несут в своей изменчивости информацию о генофонде. А картографическая технология геногеографии позволяет сделать эту информацию явной. Множество типов признаков современная геногеография рассматривает как множество очевидцев одних и тех же событий в истории генофонда. Поэтому и совместный анализ этого множества данных мы предлагаем называть много-очевидческим, а проще — многоочим подходом (для нынешней научной терминологии, увы! — привычнее калька «мультиокулярный», нежели «многоочий»). Этот подход действительно мультиокулярный, потому что позволяет исследователю не ограничиваться лишь взглядом на генофонд через единственную призму выбранного типа признаков. Такой подход позволяет исследователю смотреть на генофонд одновременно глазами самых разных признаков. Тем самым мультиокулярный подход дарит недоступный раньше уровень объективности и независимости от случайностей, свойственных анализу отдельного типа признаков.
Именно такой подход — совместного использования данных разных наук для объективного изучения русского генофонда — положен в основу нашего исследовании. Синтез данных антропологии, этнологии, археологии, лингвистики и генетики для изучения истории и пространственной изменчивости генофонда столь же необходим, сколь и сложен. Если ранее обмен информацией мог идти только по пути косвенного сопоставления выводов и гипотез каждой из наук, то теперь, благодаря развитию компьютерных картографических технологий, можно перейти к прямому сопоставлению самих данных разных наук, к их комплексному анализу.
СТРАТЕГИЯ КОМПЛЕКСНОГО ИЗУЧЕНИЯ ГЕНОФОНДА
Технологии геногеографии позволили разработать мультиокулярный (многоочий, полисистемный) подход к изучению генофонда. Он состоит в прямом — качественном и количественном — сопоставлении тех картин мира, которые дают разные науки, разные типы признаков, то есть разные очевидцы одних и тех же явлений. Провести такое прямое сравнение можно только через анализ карт, построенных и анализируемых строго одними и теми же технологиями. Такие карты позволяют выявить основные тенденции в пространственной изменчивости населения и обойти основное препятствие — различную изученность населения по разным типам признаков. Иными путями это препятствие непреодолимо — набор изученных популяций просто несопоставим. Например, для Восточной Европы не оказалось ни одной популяции, изученной по всему спектру анализируемых нами генетических маркёров (глава 8). И это в пределах лишь одного раздела науки! Что же говорить о совсем разных признаках — фамилий, антропологии или ДНК маркёров?
А ведь многомерные методы статистики требуют, чтобы все популяции были изучены по всем признакам.
В нашей книге представлены первые результаты мультиокулярного подхода. В этой широкомасштабной работе участвовали ведущие специалисты в каждой отрасли науки: А. П. Бужилова, Р. Виллеме, Л. В. Грехова, В. Е. Дерябин, Н. А. Долинова, В. А. Спицын, Г. Л. Хить и многие другие.
Например, для народов Восточной Европы (подробно эти результаты рассматриваются в главе 8) анализировались четыре типа признаков — ДНК маркёры, классические маркёры, соматология, дерматоглифика. Для каждого типа признаков одним и тем же способом были построены карты отдельных признаков и главных компонент. Все типы признаков резко различались и по числу изученных популяций, и по числу изученных признаков. Однако, несмотря на это, карты первых главных компонент каждого из четырёх типов признаков продемонстрировали одну и ту же картину, один и тот же паттерн изменчивости. Эту «общую модель» можно описать как встречу «запада» и «востока»: в целом на всех картах изолинии следуют меридианам. Какие можно сделать выводы? Если четыре независимых свидетеля дают одни и те же показания, то можно быть уверенным, что мы обнаружили ту реальную архитектонику генофонда, которая пробивается сквозь все несовершенства наших исследований.
Эти и подобные исследования других генофондов позволили предложить стратегию комплексного изучения генофонда:
1) На первом этапе одним и тем же методом строятся карты отдельных признаков для каждого типа признаков.
2) На втором этапе — создаются обобщённые карты каждого типа признаков
3) На третьем этапе — проводится мультиокулярный (многоочий) анализ всех типов признаков. Его итогом является сравнение и геногеографический синтез данных разных наук: выявление искомой «общей модели» генофонда — тех структурообразующих элементов, которые проявились на картах большинства типов признаков, засвидетельствованы большинством очевидцев.
4) После выявления «общей модели» можно перейти к следующим этапам и, например, рассмотреть, что нового внёс каждый тип признаков в описание структуры населения, каковы особенности отдельных признаков при описании различий между популяциями.
Намного забегая вперед, перечислим всё же некоторые аспекты и выводы мультиокулярного анализа.
ПРОГНОЗ ДЛЯ ДНК МАРКЁРОВ
Выявленное сходство между картинами мира антропологии и генетики позволяет сформулировать вывод о том, что данные антропологии (а это фенотипические признаки — например цвет глаз, рост бороды или же кожные узоры) отражают реальную структуру генофонда. Из этого следует неординарный вывод: именно обобщённые карты антропологии,
благодаря чрезвычайно широкому спектру изученных популяций, являются эталонными и обладают предсказательной силой для молекулярной генетики (а вовсе не наоборот!).
Этот тезис был проверен экспериментально. В первом варианте картографирования аутосомных ДНК маркёров карта первой компоненты изменчивости генофонда Восточной Европы по своему общему паттерну соответствовала картам антропологии и классической генетики, но с одним существенным отличием: экстремум на «ДНК-карте» был явно смещён на северо-восток. Однако когда и число изученных ДНК маркёров, и число изученных популяций возросло почти вдвое, новый вариант карты по ДНК маркёрам значительно приблизился к картам антропологии (см. главу 8). Можно надеяться, что когда по ДНК маркёрам будут изучены не 30 популяций, как сейчас, а те же 600 популяций, что и по антропологии, то их карты совпадут полностью. Таким образом, молекулярная генетика не меняет картину мира, а лишь по мере собственного совершенствования постепенно приближается к уже известной по данным антропологии.
Этот вывод получен не только картографическим, но и чисто статистическим методом. Например, для классических и ДНК маркёров, изученных строго в одних и тех же этносах Восточной Европы, получены одинаковые оценки различий между популяциями: GST=2.69 и GST=2.58, соответственно (см. главу 8). Таких примеров много. Вывод: когда исследование проведено корректно, результаты антропологии, старой «классической» генетики и современной молекулярной генетики совпадают: ДНК маркёры не дают иной картины мира. Расхождения возникают тогда, когда использованы неудачные выборки, популяции и маркёры.
РАЗНЫЕ ТРАЕКТОРИИ МИКРОЭВОЛЮЦИИ ДНК МАРКЕРОВ
Говоря о ДНК маркёрах, нельзя не упомянуть об их одном несомненном преимуществе перед классическими маркёрами — о значительном разнообразии типов ДНК маркёров. Когда мы достигаем такой изученности ДНК маркёров, что обобщённые карты, созданные по выборке разных типов ДНК маркёров, совпали с «общей моделью» (полученной по данным разных наук), то мы получаем надёжную точку отсчёта. Следующий шаг — сравнение «общей модели» и карт отдельных типов ДНК маркёров. Ведь разные типы маркёров могут различаться эволюционной траекторией, и тогда сравнение с «общей моделью» позволит выявить характер и причины этих отличий.
Особое значение для антропологии имеют ДНК маркёры с «однородительским наследованием» (главы 6, 8, 9): по материнской линии — митохондриальная ДНК[6]; по отцовской линии — нерекомбинирующие участки Y хромосомы. Поскольку в популяциях разнообразие этих типов признаков очень велико и каждая популяция имеет своеобразный «генетический портрет», то они могут служить уникальными маркёрами миграционных потоков. Именно однородительские маркёры могут, наконец, разрешить проблему «промежуточных» антропологических типов: являются они метисными или же сохраняют недифференцированный прототип. Следует лишь помнить, что у однородительских маркёров есть серьёзные ограничения. Поскольку генетически эффективный размер популяции (Ne) по «однородительским» генам в 4 раза меньше, чем в среднем по геному, они подвержены значительно большему влиянию дрейфа генов и потому более «забывчивы»: дрейф генов может во многом стереть и существенно исказить генетическую память популяции.
Именно поэтому на нынешнем витке науки вновь возникает поворот в сторону исследования аутосомных маркёров. Новые технологии — анализа панели сотен тысяч аутосомных ДНК маркёров со всех хромосом или же анализ гаплотипов (тесно сцепленных — рядом «сидящих» ДНК маркёров) — позволят сделать новый рывок в выявлении еще более устойчивой «общей модели» генофонда.
ВРЕМЯ
Анализ временных срезов генофонда… Изучение минувших генофондов… Задача, своей увлекательностью и масштабом завораживающая многих исследователей, не исключая и авторов этой книги. Что же может дать для решения этой задачи наш мультиокулярный подход, то есть знание того, что самые разные признаки при корректном анализе рисуют единую общую структуру генофонда?
Большие надежды в решении этой задачи возлагаются обычно не столько на разработку методов синтеза данных археологии и генетики, сколько на чисто генетический анализ древней ДНК. Однако сбор достоверной популяционной информации потребует значительного времени. Да и тогда анализ палеоДНК будет нуждаться в контроле со стороны археологии. И как раз здесь возможности компьютерной картографии и мультиокулярного подхода велики. Построенные нами карты распространения материальной культуры Восточной Европы [Балановская и др., 2003] для двух этапов палеолита (26–16 тыс. лет и 15–12 тыс. лет) обнаружили высокое сходство и друг с другом, и с картами современного генофонда (см. раздел 9.7.), что подтверждает объективность выявленной ими картины. Однако и тут следует помнить о серьёзном ограничении: карты археологических культур и современности нельзя бездумно трактовать в терминах преемственности между древним и современным генофондами: передвижения населения столь велики, что генофонд прошедших времен можно проецировать в ту же точку географического пространства, что и современный генофонд, только в том случае, если есть доказательства прямой преемственности генофондов в столь длинной цепи поколений.
КАРТОГРАФИЧЕСКАЯ ТЕХНОЛОГИЯ
У мультиокулярного подхода есть мощный картографический арсенал для выявления «общей модели» генофонда.
Обобщённые карты в зарубежной науке обычно представлены лишь «синтетическими» картами главных компонент. Поэтому и мы взяли этот метод за основу для сравнения «мнений очевидцев» о строении русского генофонда. Но этот инструмент лишь ведёт основную мелодическую нить. Его звучание мы дополнили множеством других инструментов, специально разработанных нами. Из них, пожалуй, самый перспективный — картографирование генетических расстояний. Он позволяет формулировать и проверять гипотезы о сходстве и различиях любых популяций. И авторы надеются, что он займёт достойное место в будущих исследованиях не только русского, но и иных генофондов. Его применение в этой книге показывает, что карты генетических расстояний, например, построенные по классическим и по ДНК маркёрам Европы, высоко коррелируют (раздел 8.3.). То есть новый инструмент
— карты генетических расстояний — не менее успешно выявляет согласованность разных типов признаков, чем «синтетические» карты главных компонент. Однако спектр звучания нового инструмента намного шире — он позволяет отвечать на множество вопросов о степени сходства популяций, причём отвечать отчётливо и образно. Напомним и о таких незаменимых инструментах картографической технологии, как карты надёжности наших моделей или же корреляционные карты, наглядно показывающие, как связаны признаки в разных частях ареала. Не будем забывать и о столь важных обобщённых картах, как карты генетического разнообразия.
Эти и другие инструменты описаны в Приложении — их слаженная игра позволяет объединить неизбежно односторонние мнения «очевидцев» в стройную симфонию генофонда.
1.3. СЛОВАРЬ ГЕНОГЕОГРАФИИ
Ареал генофонда — «Исконный» ареал — Этнос и этническое самосознание — Структура генофонда — Геногеогра-фия — Карта — Генное разнообразие — Типы признаков — Множество генов и единство генофонда — Опрос очевидцев — Генетический маркёр — Классические маркёры — ДНК маркёры — Квазигенетические маркёры — Признаки антропологии — Банк данных — Система популяций — Северная Евразия — Восточная Европа — Замысел книги
Верно определяйте слова, и вы освободите мир от половины недоразумений.
Рене ДекартАвторы очень просят вдумчивого читателя уделить несколько минут этому разделу — это своего рода словарь геногеографического языка. Многие понятия раскрываются по ходу книги, многие — детально описаны в Приложении. Но здесь они изложены как можно короче и конкретнее. Мы постарались избежать общих определений, оставив лишь конкретный смысл тех терминов и понятий, которые необходимы для понимания книги. Причём дали их описания в простой форме — в виде примеров, либо аналогий, или же отталкиваясь «от обратного».
Порядок терминов не алфавитный, а следует смысловым связкам.
Вместе с терминами мы привели и их «синонимы», которые используем в этой книге. Их нельзя назвать синонимами в обычном смысле — скорее это круг близких понятий, которые могут заменять друг друга, в зависимости от контекста. Не слова-близнецы, а круг родственников. Теоретически — у каждого термина свой смысловой оттенок. На практике — они взаимозаменяют друг друга в этой книге. Нам было важно показать, что эти слова очерчивают один и тот же круг понятий. Для неспециалистов эти списки синонимов могут служить своеобразным путеводителем в дебрях геногеографии.
Итак, каковы же те основы — понятия, подходы, методы, материалы, — на которых построено наше изучение русского генофонда?
АРЕАЛ ГЕНОФОНДА
«Синонимы»: зона расселения, территория обитания, ареал популяции.
Например, ареал русского генофонда — территория, населённая русскими; ареал поморов — полоса побережья, где размещены поморские сёла (в него не входят зона промысла — пространство Белого моря, например, или незаселённые острова); ареал человечества — все материки, кроме Антарктиды. Ареал — лишь та часть территории, на которой популяция воспроизводит себя в течение нескольких поколений, а далёкие кратковременные миграции не расширяют ареал.
Например, высадка человека на Луне не расширила ареал человечества: он по-прежнему ограничен свободной ото льда сушей Земли (обитаемой частью Земли — ойкуменой).
«ИСКОННЫЙ» АРЕАЛ
«Синонимы»: исторический ареал, зона формирования, область происхождения, территория сложения популяции, исходный ареал.
«Исконный» ареал — это та территория, где популяция исторически сформировалась. Иными словами — где сложился её генофонд. Впоследствии ареал может расширяться или сжиматься, но для понимания истории генофонда (то есть того, как сформировался генофонд до своего расширения на другие территории) важно изучать в первую очередь «исконный» ареал.
Для русского генофонда таким «исконным» ареалом можно считать территорию Московского государства до начала присоединения им земель с неславянским населением. Но только в самом первом приближении. Для каждой конкретной территории только историки — но ни в коем случае не генетики! — могут определить, включать эту территорию в «исконный» ареал, в область исторического формирования русского народа или же — в область последующего расширения его ареала. В определении «исконного» ареала генетика не может сказать своего слова — она обязана целиком полагаться на сведения исторических наук. И поскольку однозначно определить «исконный» ареал невозможно, мы обычно заключаем это слово в кавычки.
Впоследствии русские расселились далеко за пределами «исконного» ареала, чересполосно с коренным населением Поволжья, Урала, Кавказа, Средней Азии, Сибири, Аляски. Однако наше исследование проведено только в пределах «исконного» ареала. Именно такой анализ «русского генофонда на Русской равнине» даёт сведения о его формировании. Анализ же русского населения на остальных территориях важен для решения иных задач, для уточнения хода дальнейшего развития генофонда.
ЭТНОС И ЭТНИЧЕСКОЕ САМОСОЗНАНИЕ
«Синонимы»: народы, племена, нации; этническое самоопределение.
Этнос как универсальная единица популяционной системы обладает свойствами целостности и системности[7]. Эти свойства проявляются, прежде всего, в этническом самосознании, цементирующем популяцию в единое — хотя и многоликое — целое. В самосознании народа переплетены как сознание общности происхождения («мы с тобой одной крови — ты и я!»), так и сознание общности исторической судьбы, отличной от других народов. Но именно сознание общности исторических судеб обычно играет главенствующую роль в этническом самосознании и в формировании генофонда этноса. Объединяющее начало этнического самосознания приводит к тому, что постепенно все части этноса — независимо от их происхождения — рано или поздно генетически сближаются, становятся обладателями некоторых общих генов, образуя некий общий и неповторимый «портрет» генофонда.
Очень ярко это проявилось в истории русского народа. Он включил в себя — кроме славянского — множество иных составляющих не только финно-угорского и тюркского происхождения, но также, видимо, и балтские, иранские, германские элементы. Попытки XIX века реанимировать сознание единства по происхождению («по крови») и противопоставить «великороссов» и «инородцев» не выдержали критики со стороны общественности и науки — слишком очевидны были факты включения этнически инородных компонентов в сам русский народ. Не последнюю роль сыграли в этом и данные антропологии [Зограф, 1892], выявившие внутреннюю неоднородность антропологического типа русских: географически разные части «ареала великоросса» различны и по физическому облику русского населения. Как описывается в разделе 2.3., в русском генофонде и поныне улавливаются следы и летописных славян, колонизовавших Восточно-Европейскую равнину (и превративших её в равнину Русскую), и следы дославянского населения.
Этот процесс слияния генофондов даже спустя многие века далёк от завершения, в то время как этническое самосознание давно уж выкристаллизовалось в единое целое, выстраданное общностью исторических судеб населения Русской равнины.
СТРУКТУРА ГЕНОФОНДА
«Синонимы»: основные закономерности (тренды, паттерны, структурообразующие элементы), архитектоника, каркас, обобщённый портрет, генетическая структура популяции.
Пространственная структура генофонда — это закономерности изменчивости генофонда в его ареале, основные генетические различия между разными популяциями в пределах ареала генофонда. Для геногеографа генофонд — это не точка, а зона на карте, состоящая из многих точек (локальных популяций). И структура генофонда — это закономерности в генетических свойствах этих географически разнесённых точек, в генетических различиях между ними.
В нашем случае «структура генофонда» и «пространственная структура генофонда» оказываются синонимами. Вообще говоря, можно представить и непространственные закономерности в генофонде, например, различия между кастами в Индии. Но в данной книге мы всегда имеем в виду пространственную структуру генофонда.
ГЕНОГЕОГРАФИЯ
«Синонимы»: популяционная генетика человека[8], наука о структуре генофонда, генофондика, ареальная генетика.
Вся книга целиком — попытка рассказать о том, что такое геногеография. Поэтому здесь отметим лишь, что эта наука: 1) немолода; 2) находится на стыке различных дисциплин, но основатель геногеографии А. С. Серебровский [1928] считал её наукой исторической; 3) у неё большое будущее, поскольку геногеография может стать общим языком для разных наук.
Классификация методов геногеографии:
картографический анализ — построение и анализ карт;
статистический анализ — расчёт показателей изменчивости без размещения их на карте.
На самом деле многие виды анализа являются картографостатистическими — они включают не только создание карты, но и предварительный статистический анализ.
Классификация отраслей геногеографии:
историческая геногеография — изучает историю генофонда;
экологическая геногеография — изучает влияние среды на генофонд.
К одним и тем же данным историческая и экологическая геногеография подходят по-разному: историческая пытается, например, выявить в них результат миграции, а экологическая — результат адаптации. Данная книга почти целиком написана в русле исторической геногеографии.
Для описания карт в геногеографии сложился свой язык.
Основные геногеографические термины:
Генетический рельеф, генетический ландшафт, паттерн карты — главные черты карты, её характер, её суть, её душа, её образ. Например, к Африке Н. Гумилев обращается «Ты, на дереве древнем Евразии, исполинской висящая грушей». Генетический ландшафт — самое общее понятие, которое включает ряд более конкретных.
Структурообразующий элемент — те явления, видимые на карте, которые задают основные очертания генетического ландшафта. Так, на физической карте Чёрное море мы легко узнаем, увидев очертания Крыма посреди маловыразительного овала. А, например, карта материальной культуры палеолита Северной Евразии (раздел 9.1) задаётся двумя противоположными по значениям областями с узкой перемычкой между ними — это её «личные» структурообразующие элементы.
Область, зона — часть карты, характеризующаяся сходными значениями признака. Иногда говорят о зоне перепада, переходной зоне — в данном случае «сходство» значений зоны оказывается в их промежуточности между крайними значениями, между «полюсами», между «плато» и «впадиной».
Возвышенность, нагорье, плато — область высоких значений того признака, который мы картографируем.
Равнина — область средних значений.
Низменность, впадина, долина — область низких значений.
Хребет, пояс, гряда — протяжённая область повышенных значений, ограниченная с двух сторон областями низких значений.
Коридор — протяжённая область пониженных значений, ограниченная с двух сторон областями высоких значений (длинная впадина).
Рифтовая зона — узкая полоса низких значений между обширными областями высоких значений[9]. Иначе говоря — коридор, выраженный настолько резко, что его можно считать структурообразующим элементом.
Ядро, ядерная структура — область, резко выделяющаяся на общем фоне карты. То есть область, значения в которой значительно отличаются от окружения.
Тренд — постепенное изменение значений в определённом географическом направлении.
Клинальная изменчивость, клина — простейший случай тренда. Постепенное, монотонное увеличение значения признака при движении по прямой линии.
КАРТА
«Синонимы»: геногеографический рельеф, генетический ландшафт, картографическая модель, цифровая модель карты (ЦМ).
История генофонда зачастую определяется географией. Такой географический детерминизм очень трудно опровергнуть и очень легко подтвердить. Высокая генетическая дифференциация народов Кавказа или Пиренеев вызвана изоляцией, которая вызвана гористым рельефом: география. Сниженная гетерозиготность и нуклеотидное разнообразие на севере Европы вызваны низкой плотностью населения, которая вызвана низкой продуктивностью территории: география. Наибольшее разнообразие мтДНК в Африке вызвано происхождением популяций человека именно на этом континенте, которое, как обычно считается, вызвано его климатогеографическими условиями: география. Абсолютный географический детерминизм авторам не по душе. Но если не господство, то принципиальная важность географии не вызывает сомнений и положена нами в основу изучения генофонда. А географию лучше всего изучать по картам.
Сила и особенность геногеографической карты в том, что она одновременно и алгебраическая (точная), и графическая (наглядная). Поэтому она позволяет и рассмотреть, и измерить генофонд. Компьютерная геногеографическая карта — это наглядная и точная математическая модель. Как всякая модель, она может отличаться от реальности и зависит от справедливости допущений. Как всякая хорошая модель (если, конечно, карта построена хорошо), она описывает реальность достаточно точно. Как всякая математическая модель, она позволяет проводить количественные вычисления. Как всякая карта, она показывает взаимное расположение и пространственные связи объектов.
Геногеографическая карта может быть «простой» (география конкретного признака) или «обобщённой», «синтетической» (география обобщённого признака).
Простая карта обычно показывает, какова частота одного признака во всех частях ареала. Для простой карты исходные данные — это значения признака в изученных популяциях, разбросанных по картируемой территории. По этим значениям в исходных популяциях (опорных точках) рассчитываются значения признака в каждом узле карты, т. е. предсказываются значения в тех точках, где ни одной исследованной популяции не оказалось. Расчёт представляет собой математически точную интерполяцию значений из исходных популяций на все узлы карты, с тем, чтобы получить прогноз для каждого узла. В результате в каждом из тысяч узлов сети, равномерно покрывающей территорию, записано прогнозируемое значение признака. Совокупность значений всех узлов и является простой картой.
Обобщённая карта построена по данным множества карт, которые она обобщает. Исходные данные для построения обобщённой карты, — это несколько простых карт. По значениям в узлах простых карт, тем или иным методом рассчитываются значения в узлах обобщённой карты. Поэтому обобщённая карта показывает не изменчивость отдельного признака, а изменчивость какого-либо обобщённого параметра генофонда.
В геногеографии есть три основных вида обобщённых компьютерных карт:
Карты главных компонент показывают «главные сценарии», основные закономерности в изменчивости частот генов.
Карты генетических расстояний показывают степень сходства населения каждой области карты с одной,
выбранной исследователем популяцией («реперной популяцией»).
Карты разнообразия показывают значения того или иного показателя генетического разнообразия. Например, карта гетерозиготности, карта межпопуляци-онных различий, карта гаплотипического разнообразия мтДНК.
ГЕНЕТИЧЕСКОЕ РАЗНООБРАЗИЕ
«Синонимы»: гетерогенность, дифференциация, GST, FST, средние генетические расстояния, гетерозиготность, гаплотипическое разнообразие.
Общее генетическое разнообразие включает в себя две составляющие:
1) Внутрипопуляционное разнообразие (HS) отражает различия между индивидами внутри популяции. Для аутосомных генов оно выражается через гетерозиготность, для «однородительских» маркёров (мтДНК, Y хромосома) — через гаплотипическое разнообразие.
2) Межпопуляционное разнообразие (GST, FST) 5 отражает различия между популяциями нижнего ранга в пределах популяции более высокого уровня.
Например, различия между региональными русскими популяциями в пределах русского народа. Или же различия между русским, украинским и белорусским народами в пределах восточных славян. Или различия между всеми народами в пределах Великобритании — ирландцами, шотландцами, валлийцами и англичанами.
«Гетерогенностью» в этой книге мы называем частный случай межпопуляционного разнообразия, а именно межпопуляционное разнообразие внутри этноса. То есть гетерогенность — это генетические различия популяций, относящихся к одному и тому же народу.
В популяционной генетике принято обозначать так: внутрипопуляционное разнообразие — HS, межпопуляционное разнообразие — GST (или FST), а их совокупность — общее (тотальное) генетическое разнообразие — НT.
ТИПЫ ПРИЗНАКОВ
«Синонимы»: очевидцы, несколько свидетелей, данные разных наук, проекции генофонда, классы маркёров, типы маркёров, системы признаков.
Генофонд — невидим. Поэтому о структуре генофонда судят по географическому распространению видимых признаков (маркёров). Самые разные типы признаков могут маркировать изменчивость генофонда. Например, географическое распространение резус фактора маркирует постепенные изменения в генофонде Евразии — от Европы до Азии.
В геногеографии в качестве маркёра может выступать любой ген, по которому наблюдается полиморфизм — генетические маркёры. Генетики применяют также данные о фамилиях, выступающих в качестве квазигенетических маркёров (глава 7). Можно привлекать многие биологические признаки, варьирующие в популяциях человека — цвет кожи и волос, пропорции тела, особенности отпечатков пальцев, строение черепа и множество иных. Все они позволяют сравнивать популяции между собой и таким образом выяснять историю генофондов. Для использования таких признаков наряду с генетическими маркёрами необходимо, чтобы признаки в той или иной мере наследовались. Наследственность может быть как биологической природы, так и культурной (например, фамилии): «культурные» признаки тоже порой раскрывают историю генофонда.
Более того, зная законы влияния демографии на структуру генофонда, можно в качестве квазигенетиче-ских маркёров использовать и демографические данные (например, особенности воспроизводства населения, брачная структура). Лингвистические данные и даже география фольклора также нередко несут информацию об истории популяций и, следовательно, об их генофонде. Не стоит забывать и об археологических данных, несущих (хотя и опосредованно) основную информацию о далёком прошлом популяций, когда закладывалось генетическое разнообразие человечества.
Итак, хотя генофонд и является объектом генетики, самые разные типы признаков, находящиеся в ведении других наук — антропологии, лингвистики (включая фольклористику и ономастику), археологии, этнологии, демографии — несут ценную информацию о генофонде. И привлечение этих других (кроме генетики) свидетелей необходимо для комплексного изучения генофонда.
МНОЖЕСТВО ГЕНОВ И ЕДИНСТВО ГЕНОФОНДА
«Синонимы»: множество очевидцев одного события.
Пространственная изменчивость каждого признака уникальна. Но отдельные признаки (маркёры) важны для нас не сами по себе — нас больше всего интересуют общие закономерности генофонда. Структура генофонда так или иначе проявляется в каждом отдельном маркёре. (Иначе, какой же он маркёр, если не маркирует генофонд?) Поэтому каждый ген мы рассматриваем как одну из проекций генофонда. И, изучив много проекций, надеемся восстановить многомерную картину структуры генофонда.
В таком случае становится неважным, какие именно гены мы изучаем. Изучим ли набор из ста одних генов или из тысячи других — если эти наборы адекватно отражают генофонд, мы должны получить один и тот же результат. Этот результат будет описывать структуру генофонда в целом (включая и неизученные гены). Разумеется, одни проекции могут быть точнее, другие искажённее. Но каждый ген нас интересует не сам по себе, а лишь в той мере, в какой он описывает структуру генофонда.
ОПРОС ОЧЕВИДЦЕВ
«Синонимы»: совместный анализ данных разных наук, полисистемный подход, многоочий подход, мультиокулярный подход.
Каждый генетический маркёр несёт информацию о генофонде в целом, но эта информация в той или иной степени своеобразна, случайна, искажена, недостаточна, фрагментарна. Целые классы маркёров (типы признаков), сгруппированные по тому или иному свойству, могут в силу своего сходства вносить похожие искажения в портрет генофонда. Каждый маркёр и каждый тип признаков несовершенен для составления общего портрета генофонда. Но можно обойти эту проблему — если воспользоваться одновременно разными типами маркёров.
Самое важное здесь, что геногеографические методы приложимы почти к любым типам признаков — классическим маркёрам, ДНК маркёрам, данным антропологии, лингвистики, археологии, демографии. Поэтому мы можем провести анализ самых разных типов признаков одними и теми же методами. Это открывает блестящую перспективу единого анализа данных всех наук, имеющих отношение к генофонду. И чем больше используется разных типов признаков (как разных очевидцев), тем выше надёжность результатов. Такой подход позволяет получить не только самые обширные и разносторонние, но и наиболее достоверные знания о генофонде.
Это подход «опроса очевидцев».
Мы хотели бы назвать его «многоочим» или «мультиокуляр-ным» подходом авторы разошлись во мнениях в зависимости от склонности к славянофильству или западничеству. Известно преимущество бинокулярного зрения, дающего объёмное изображение. По аналогии, опрос многих очевидцев — это мультиокулярное зрение, создающее многомерное изображение многомерного генофонда.
Независимо от названия, суть подхода в следующем: поскольку каждый тип маркёров (каждый очевидец) несовершенен, необходимо опросить множество очевидцев, собрать воедино их свидетельства и искать общую правду.
Многоочий (мультиокулярный) подход включает несколько шагов.
Первый шаг — анализ разных типов признаков одними и теми же методами;
Второй шаг — сравнение результатов, полученных по разным типам признаков. Совпадение результатов служит критерием их способности выявлять «общую модель» генофонда, его каркас, его архитектонику. Иными словами, структуру генофонда, не зависящую от инструментария исследования.
Третий шаг — сравнение отдельных признаков с «общей моделью» генофонда. Поиск тех «особых» очертаний генофонда, которые стёрлись при обобщении, но могут дать важные штрихи к его «портрету».
ГЕНЕТИЧЕСКИЙ МАРКЁР
«Синонимы»: генный маркёр, полиморфный ген, аллели, полиморфный сайт.
Генетический маркёр — любой признак, по характеру проявления которого у данного индивида можно однозначно опознать данный вариант данного участка ДНК. Признак должен нести точную информацию о конкретном гене, только тогда этот признак — генетический маркёр (однозначно маркирует конкретный ген). Если такая связь неоднозначна — признак не является генетическим маркёром.
Классические маркёры. Изначально «генетический маркёр» обозначал признаки, которые сейчас чаще называют «классическими» маркёрами. Гены тогда могли изучаться только через анализ их внешних проявлений, и было важно различать, какие внешние признаки маркируют гены, а какие — нет. Например, сворачивание крови в присутствии определённого вещества однозначно свидетельствует о наличии в крови антигена, а наличие антигена — о наличии у индивида определённого варианта (аллеля) данного гена. Влажная или сухая консистенция ушной серы однозначно свидетельствует о наличии соответствующего аллеля другого гена. Но множество других особенностей внешнего облика человека (например, кожные узоры или цвет глаз, несмотря на высокую наследуемость таких признаков) не имеют однозначной связи с конкретным вариантом того или иного гена, и поэтому не являются генетическими маркёрами.
ДНК маркёры. Для ДНК маркёров ситуация проще. Анализ ДНК маркёров — это прямой анализ «самих генов», точнее — самой ДНК. Поэтому практически все ДНК маркёры являются генетическими маркёрами. Но можно привести пример мультилокусной пробы («ДНК фингерпринт»), где для полос фореграммы соответствующие им гены остаются неизвестными. Поэтому ДНК фингерпринт является ДНК маркёром, но не является генетическим маркёром.
Не-генетические и квазигенетические маркёры. Наряду с генетическими маркёрами, геногеография использует целый ряд иных типов признаков, которые несут информацию о структуре генофонда — например, фамилии, кожные узоры, археологические, лингвистические, антропологические или демографические признаки.
КЛАССИЧЕСКИЕ МАРКЁРЫ
«Синонимы»: полиморфизм белков, группы крови, иммунологические маркёры, генетикобиохимический полиморфизм.
Понятие «классические маркёры» появилось (с легкой руки L. L. Cavalli-Sforza) в эру ДНК маркёров, когда возникла необходимость как-то назвать все «старые» маркёры. Классическими называют те маркёры, которые определяются без анализа ДНК. Различие между классическими и ДНК маркёрами чисто методическое — бывает, что для типирования одного и того же гена (например, HLA или АВ0) годятся оба метода. Классические маркёры определяются по проявлению гена — например, по белку, кодируемому геном. Поэтому классические маркёры отражают не весь геном, а только его структурные гены (кодирующие участки). Обязательное условие для включения «кандидата» в число классических маркёров — однозначное соответствие между внешним проявлением маркёра и вариантом гена, стоящим за ним.
В популяционной генетике классические маркёры подразделяются на три подтипа в соответствии с методом генотипирования.
Иммунологические — белки иммунной системы, определяемые иммунологическими (серологическими) методами (антиген-антитело).
Биохимические — ферменты (обычно крови), определяемые биохимическими методами, такими как электрофорез и изоэлектрофокусирование.
Физиологические — те полиморфные физиологические признаки, проявление которых контролируется одним геном (разные типы цветовой слепоты, вкусовой чувствительности, консистенции ушной серы и другие).
ДНК МАРКЁРЫ
«Синонимы»: ДНК полиморфизм, молекулярногенетические маркёры.
Полиморфизм ДНК — различия в последовательностях ДНК, когда в одном и том же сайте (в одной «точке» или в одном «отрезке» ДНК) у разных индивидов могут находиться разные нуклеотиды. ДНК маркёры определяются путём прямого анализа самой ДНК. (В отличие от классических маркёров, которые определяются по результатам функционирования ДНК, её работы, её внешнего проявления в фенотипе).
В популяционной генетике ДНК маркёры классифицируются по пяти основным параметрам.
1) КЛАССИФИКАЦИЯ ДНК МАРКЁРОВ ПО ЛОКАЛИЗАЦИИ В ГЕНОМЕ.
Аутосомные маркёры — расположенные на аутосомных хромосомах, (т. е. тех, которые не определяют пол).
Маркёры половых хромосом — локализуются на ¥ хромосоме или X хромосоме.
Маркёры мтДНК — находятся в митохондриальной ДНК.
МтДНК — единственная ДНК в клетках человека, которая локализуется вне ядра клетки. Поэтому её называют внеядерной ДНК, а все прочие маркёры — маркёрами ядерной ДНК.
2) КЛАССИФИКАЦИЯ ДНК МАРКЁРОВ ПО ТИПУ ИЗМЕНЧИВОСТИ.
Инсерционно-делеционные — вставка или потеря фрагмента ДНК.
Микросателлитные (STR) и минисателлитные — многократный (гуськом) повтор одного и того же фрагмента ДНК («мотива»). Полиморфизм проявляется только в разном числе повторов данного фрагмента ДНК у разных индивидов: сколько раз повторен мотив. Но само число нуклеотидов в повторяющемся фрагменте (в мотиве) постоянно для данного ДНК маркёра. У разных маркёров мотив может состоять либо из небольшого числа нуклеотидов (2–5 нуклеотидов — такой маркёр относят к микросателлитным), либо из большого числа нуклеотидов (20–50 нуклеотидов — такой маркёр называют минисателлитным).
Однонуклеотидный полиморфизм (SNP, именуемые по-русски «снипами») — аллели различаются лишь по одному нуклеотиду (из целой последовательности).
3) КЛАССИФИКАЦИЯ ДНК МАРКЁРОВ ПО СКОРОСТИ МУТИРОВАНИЯ.
Это подразделение полезно, но условно.
Быстро мутирующие («горячие точки») — участки ДНК, мутации в которых происходят часто.
Медленно мутирующие — «обычные» участки ДНК, мутации в которых редки.
Перечисленные классификации описывают маркёр с разных точек зрения, рассматривают разные характеристики маркёров. Например, маркёр CCR5 — аутосомный, делеционный, медленно мутирующий; ГВС1 — набор митохондриальных, однонуклеотидных, быстромутирующих маркёров; DYS390 — микросателлитный бы-стромутирующий маркёр Y хромосомы.
4) КЛАССИФИКАЦИЯ ДНК МАРКЁРОВ ПО ТИПУ НАСЛЕДОВАНИЯ.
Эта классификация тесно связана с локализацией в геноме: разные части генома характеризуются несколько различными типами наследования. Аутосомные маркёры, и небольшая часть маркёров половых хромосом наследуются обычным образом: от обоих родителей потомству. Основная часть Y хромосомы (NRY — нерекомбинирующая часть) наследуется только по отцовской линии — от отца к сыну. Митохондриальная ДНК передаётся только по материнской линии — от матери к её детям.
У женщин Y хромосомы нет. Митохондриальная ДНК присутствует и у мужчин, и у женщин, но лишь женщины могут передать её своим детям. Термин «од-нородительские» маркёры объединяет Y хромосому и мтДНК, поскольку они передаются по линии только одного из родителей — либо только по отцовской, либо только по материнской линии.
5) КЛАССИФИКАЦИЯ ДНК МАРКЁРОВ ПО НАЛИЧИЮ РЕКОМБИНАЦИИ.
Характерная черта однородительских маркёров — отсутствие рекомбинации («перетасовывания») генов при передаче потомству. Поэтому мтДНК и Y хромосома называются нерекомбинирующими, а почти все прочие маркёры — рекомбинирующими. Впрочем, отдельные участки аутосомных хромосом также характеризуются низкой, почти нулевой рекомбинацией. Например, система групп крови резус состоит из трех тесно сцепленных локусов RH-C, RH-D и RH-E, рекомбинация между которыми — редкое историческое событие.
КВАЗИГЕНЕТИЧЕСКИЕ МАРКЁРЫ
«Синонимы»: фамилии.
К квазигенетическим относят наследуемые признаки небиологической природы, которые ведут себя подобно генам. Например, те или иные именования людей, передаваемые от родителей детям в цепи поколений (названия родов, фамилии). Квазигенетическими маркёрами иногда называют и параметры демографической генетики, генеалогии, данные по брачным миграциям и т. п.
Фамилии передаются в поколениях от родителей к детям, то есть ведут себя точно так же, как и гены. Поэтому фамилии могут выступать маркёрами генов. Формально говоря, буквы, записанные в паспорте, могут маркировать гаплогруппу Y хромосомы точно так же, как сворачивание крови в присутствии сыворотки маркирует ген группы крови[10].
Квазигенетические маркёры можно анализировать теми же методами, что и обычные генетические данные. Разработан и ряд специальных методов анализа фамилий (например, способ оценки случайного инбридинга).
АНТРОПОЛОГИЧЕСКИЕ ПРИЗНАКИ
«Синонимы»: фенофонд, данные этнической антропологии, расовые признаки, физический облик, антропологический покров.
Антропологические признаки — это полиморфные морфологические признаки человека, то есть варьирующие особенности физического облика или анатомии (признаки физической антропологии). Чтобы такие признаки могли использоваться при изучении популяций, необходимо выполнение двух условий: высокая наследуемость и относительная устойчивость к воздействиям среды. Этим требованиям соответствуют признаки, которые в течение многих десятилетий успешно использует этническая (историческая) антропология. Антропологические признаки включают четыре подтипа.
1) Соматологические признаки — «обычные» антропологические признаки: особенности строения лица, головы и иногда тела (обычно только рост), пигментация (например, цвет глаз), третичный волосяной покров (например, рост бороды).
2) Дерматоглифические признаки — особенности только тех кожных узоров на пальцах, ладонях и стопах, которые отличаются высокой наследуемостью. К ним относят линии, видимые на отпечатках пальцев или ладоней, но не сгибательные складки, используемые в хиромантии.
3) Одонтологические — полиморфные признаки зубной системы.
4) Дискретно варьирующие признаки черепа включают такие детали строения костей черепа, которые определяются по принципу «есть-нет» и, как предполагается, наследуются. К этим признакам относят многие редкие вставные кости черепа и швы (например, метопический — разделяющий лобную кость, обычно единую).
БАНК ДАННЫХ
«Синонимы»: базы данных, БД, компьютерные сводки данных, массивы данных, накопленная информация, геоинфосистема.
Для надёжного анализа генофонда необходимо большое количество данных. Для этого надо собрать воедино материалы, добытые всеми специалистами, работавшими в изучаемом регионе — как генетиками, так и представителями смежных наук.
Во-первых, это требует сбора литературных (опубликованных) данных.
Например, данные по мтДНК в популяциях Евразии сегодня рассеяны более чем в 300 статьях в различных научных журналах.
Во-вторых, возникает проблема сопоставимости данных разных авторов, необходимость унификации данных, приведения к некоему единому стандарту — иначе невозможно их объединять и совместно анализировать.
Продолжим тот же пример с мтДНК. Гаплогруппы мтДНК в разных статьях определены разными способами (маркёры ПДРФ, ГВС1, ГВС2 в разных сочетаниях). Отсутствие однозначного соответствия между этими способами считается твёрдо установленным фактом, и корректно сравнивать можно лишь гаплогруппы, определённые одинаковым способом.
В-третьих, объёмы данных часто становятся труднообозримыми, и для обработки данных нужны специальные средства.
Например, сводка данных по частотам русских фамилий представляла бы собой таблицу с 900 столбцами и 67000 строками (изучено 900 популяций, обнаружено 67000 разных фамилий). Без использования Банка данных такую таблицу было бы затруднительно даже хранить (она превышает ограничения Excel), и тем более обрабатывать данные.
Компьютерные банки данных создаются для того, чтобы решить все эти проблемы. Информацию из конкретной публикации нужно ввести в банк данных только один раз и впоследствии её легко преобразовать в любой нужный вид (однако структура базы данных требует унификации вводимой информации). Наконец, базы данных для того и придуманы, чтобы облегчить работу с большими массивами.
Первый банк данных о генофонде СССР (БД «GENEPOOL», классические маркёры и их карты) разрабатывался коллективом программистов под руководством одного из авторов этой книги[11]. В 1992–1994 годах был создан археологический банк данных палеолита Северной Евразии [Балановская и др., 1997]. В 2001–2005 годах под руководством другого автора был создан банк данных о русском генофонде (классические и ДНК маркёры, антропологические признаки). Нашим коллективом разрабатываются и другие специализированные базы данных, в том числе программное обеспечение для анализа разнообразия русских фамилий и ДНК маркёров. Уже много лет наша работа просто немыслима без этих баз данных. Их разделы мы постепенно будем размещать на своем сайте . Сравнение с другими базами данных (ALFRED, YHRD, HVRBASE [Osier et al., 2002; Roewer et al., 2001; Handt et al., 1998]) показывает, что все они, включая и наши БД, построены по единому плану, задаваемому спецификой популяционно-генетических задач, и стремятся реализовать одни и те же функции (в чём отечественная продукция вполне преуспевает).
СИСТЕМА ПОПУЛЯЦИЙ
«Синонимы»: популяционная система, иерархия популяций, уровни организации популяционной системы.
Популяции мира в совокупности образуют то, что мы называем человечеством, а в географическом плане — ойкуменой. Однако эта совокупность — не простая сумма популяций, а сложно организованная система.
От локальных популяций мы поднимаемся к народам, от народов — к населению крупных регионов (Западной Европы, Индии или же Африки), от регионов — к ойкумене. К примеру, русский генофонд входит в состав Восточной Европы, та в свою очередь — в состав Северной Евразии, которая «вложена» в Евразию, а самой большой матрёшкой оказывается мир в целом. Возможны и другие классификации популяций: не только географическая (по географическому положению популяций), но и лингвистическая, расовая, этнографическая и прочие.
Все классификации пытаются на основе разных признаков отразить реально существующую систему популяций, и каждая классификация даёт свое «родословное древо» популяций, свою реконструкцию их родства. Но почти во всех классификациях есть общая, универсальная единица, их связующая, — народ. Народ лишь в чрезвычайно редких случаях соответствует самому нижнему уровню популяционной системы, её кирпичику — элементарной популяции. Таким редким примером могут служить кубачинцы — одноаульный народ Дагестана. Обычно же каждый народ и сам является иерархически организованной системой популяций. И яркий пример этому — русский народ. Его «кирпичиками» — локальными популяциями — являются города, деревни, села, погосты[12], починки, посёлки, выселки… Группа локальных популяций составляет популяцию более высокого уровня — волость (сельсовет), сельсоветы объединяются в районы, районы — в области, области — в регионы (например, Русский Север), и только далее уже следует этнос (русский народ). Возможны и не «административные» классификации русских популяций.
СЕВЕРНАЯ ЕВРАЗИЯ
«Синонимы»: бывший СССР, Россия и сопредельные страны.
Северная Евразия охватывает территорию бывшего СССР и объединяет такие историко-географические регионы, как Восточная Европа, Урал, Сибирь, Кавказ (включая Закавказье), Средняя Азия (включая Казахстан).
Мы видим, что Северная Евразия выделяется довольно условно — в соответствии с административными границами уже не существующего государства. Представление о существовании самостоятельного генофонда в этих границах сложилось в науке исторически. Советская наука развивалась в значительной степени изолировано, причём только она имела возможность изучать население СССР Научные связи в пределах Северной Евразии сохраняются и по сей день; эта территория представляет собой целостное научное пространство.
С точки зрения истории популяций этот регион состоит из двух резко различающихся частей — западной и восточной. Но взаимодействие этих частей имеет столь долгую историю — со времен палеолита (см. раздел 9.7.), что привело к формированию непрерывного градиента промежуточных генофондов, спаявших эти две части в единую цепь (Восточная Европа — Урал — Сибирь). Что же касается двух южных частей Северной Евразии (Кавказа и Средней Азии), то их «срединное» географическое положение и сложная история населения позволяют включать их в самые разные крупные регионы, в том числе и в Северную Евразию.
Итак, понимание того, что территория СССР представляет собой целостный регион для антропологического и генетического изучения, было широко распространённым. После распада СССР возник вопрос, как теперь называть этот регион. Его изредка именуют как «территория бывшего СССР» или «Северо-Восточная Евразия». Однако в самых разных областях науки (палеогеография, экология, антропология, популяционная генетика) независимо возник и стал широко употребляться термин «Северная Евразия», который и нам кажется более точным и предпочтительным.
ВОСТОЧНАЯ ЕВРОПА
«Синонимы»: Европейская часть бывшего СССР.
Этот регион понимается по-разному. В советской экономической географии термин «Восточная Европа» означал социалистические страны Европы — к западу от границы СССР. В то же время он нередко понимался и как Европейская часть СССР — то есть к востоку от той же границы. Мы предпочитаем второе понимание. Тогда Европа хорошо подразделяется на две примерно равные по территории половины — западную и восточную.
Но и в этом случае Восточная Европа в разных исследованиях рассматривается или в широком, или в узком смысле. В широком понимании Восточной Европы к ней относят Приуралье (Волго-Уральский регион) и Северный Кавказ. В узком понимании Восточной Европы Приуралье и Северный Кавказ из нее исключают. В этом случае Приуралье вместе с Уралом и Зауральем образуют регион «Урал». Северный Кавказ вместе с Закавказьем образуют регион «Кавказ». А все три региона — Восточная Европа (в узком смысле), Урал и Кавказ — рассматриваются как равноправные. Мы будем пояснять, какое именно понимание Восточной Европы имеется в виду в том или ином месте книги.
ПОДХОД К ИЗУЧЕНИЮ РУССКОГО ГЕНОФОНДА
«Синонимы»: стратегия изучения, продуманный подход, замысел книги.
На предыдущих страницах мы описали те понятия, которыми оперируем в нашей книге. И теперь, без опасений остаться непонятыми, попробуем сформулировать цель исследования.
Цель книги — изучить структуру русского генофонда в «исконном» ареале с помощью геногеографического анализа. Объединить свидетельства многих «очевидцев» (данные классической, молекулярной генетики, антропологии, ономастики и смежных наук) в рамках «мультиокулярного» подхода. Воспользоваться по возможности всей имеющейся информацией по разным типам признаков, создав банки данных для геногеографического анализа. Рассмотреть генофонд на разных уровнях популяционной системы — этническом, Восточной Европы, Северной Евразии и Евразии в целом. Представить результаты исследования в виде картографических атласов генофонда.
1.4. ИСТОРИЯ ИЗУЧЕНИЯ РУССКОГО ГЕНОФОНДА
Полтора века антропологии — Столетие групп крови — Полувек биохимических маркёров — Тридцатилетие квазигенетики — Десятилетие ДНК — Эра синтеза
В мире, ревущем:
— Слава грядущим!
Что во мне шепчет:
— Слава прошедшим!
Марина ЦветаеваАНТРОПОЛОГИЯ
Изучение физического облика русского населения насчитывает уже почти полтора века. Его начало было заложено основополагающими трудами А. П. Богданова [1867], Д. Н. Анучина [1889], Н. Ю. Зографа [1892], Е. М. Чепурковского [1913] и продолжено такими известными исследователями советской школы, как В. В. Бунак, А. Т. Трофимова, А. Н. Чебоксаров, Г. Ф. Дебец, Т. И. Алексеева. В пятидесятые годы антропологическое изучение русского населения было особенно интенсивным. Благодаря тщательно спланированной Русской антропологической экспедиции под руководством В. В. Бунака и Т. И. Алексеевой, а также усилиям М. В. Витова, исследовавшего Русский Север, русский народ стал одним из наиболее изученных в антропологическим отношении среди всех народов Северной Евразии и мира в целом [Происхождение…, 1965; Битов, 1997; Алексеев и др., 1994]. Анализ этого обширного массива антропологических данных, с необычайной подробностью покрывающих карту Европейской России, продолжается и доныне [Рычков, Балановская, 1988; Балановская и др., 2000; Дерябин, 2002; Маурер, Перевозчиков, 2002].
ГЕНОГЕОГРАФИЯ
Геногеографическое изучение генетических особенностей русского народа в разных частях его огромного ареала началось ещё задолго до формирования антропогенетики как самостоятельного направления науки. В середине XIX века было установлено наследование цветовой слепоты — дальтонизма. А уже в 1885 году появилось первое геногеографическое исследование цветовой слепоты среди почти 17 тысяч русских — новобранцев, происходящих из самых разных губерний европейской части России [Любинский, 1885].
ИММУНО-БИОХИМИЧЕСКИЕ ГЕНЕТИЧЕСКИЕ МАРКЁРЫ
Однако интенсивные геногеографические исследования начались лишь на рубеже 20х годов XX века — их стимулировало открытие широкого полиморфизма групп крови.
Толчком послужили события первой мировой войны, на фронтах которой впервые была обследована и выборка русских солдат [Hirsfeld, Hirsfeld, 1919].
Практически одновременно выходят работы
Н. К. Кольцова [1922] и В. В. Бунака [1923] по частотам групп крови AB0 в популяциях восточных славян. В 1927 г. была создана «Постоянная комиссия по изучению кровяных групп». В 30е годы в практику антропогенетических исследований русского народа вводится изучение полиморфизма восприятия вкуса (РТС) и системы групп крови MN. В 40е годы — системы групп крови резус (RH). Далее расширяется как программа генетических исследований, так и география изученных русских популяций. Накопление геногеографических данных продолжалось даже во времена гонений на генетику — главным образом, благодаря усилиям медиков, собиравшим данные по частотам иммунологических маркёров.
Новый виток исследований начался в 60е годы. В программу популяционных исследований, до тех пор ограниченную иммунологическими и физиологическими генными маркёрами, был включен генетикобиохимический полиморфизм. Их исследование в русских популяциях проводилось в основном под руководством В. А. Спицына и Ю. Г. Рычкова.
Накопленная к настоящему времени генетическая информация по русскому населению — от первых работ 1930-50х годов вплоть до исследований недавних лет (см. сводки данных [Генофонд и геногеография народонаселения…, 2000; Спицын и др., 2001]) — хотя и значительно уступает по полноте и детальности антропологической информации, тем не менее ставит русский народ и в генетическом отношении в положение одного из добротно изученных народов мира.
Однако после возрождения популяционной генетики в нашей стране её основной интерес был направлен на изучение изолятов (небольших изолированных популяций). Особенно много исследований было проведено среди коренных народов Сибири и Дальнего Востока [Генофонд и геногеография народонаселения…, 2000]. Большие народы, в том числе русский, вызывали меньший научный энтузиазм. Поэтому данные по русским популяциям, хотя и накапливались, но довольно бессистемно, случайно, и специальные геногеографические исследования русских популяций в то время не проводились. Зачастую популяционно-генетические данные были как бы побочным результатом: изучались ассоциации маркёров с заболеваниями на выборках больных, а популяционные выборки служили в качестве контроля.
В наши дни на страницах отечественных и международных генетических журналов ежегодно появляются новые данные по генетическому полиморфизму русского населения. Однако теперь эти данные относятся почти исключительно к ДНК маркёрам, что связано с всеобщим переходом на этот тип признаков. Новых данных по классическим генетическим системам, изучению которых отданы десятилетия усилий популяционных генетиков, очень немного. Лишь некоторые лаборатории ещё отчасти сохраняют традиции изучения классических маркёров. Среди них выделяется молодой коллектив под руководством профессора М. И. Чурно-сова в Белгородском университете, который, помимо анализа ДНК полиморфизма, систематически проводит изучение и классических, и квазигенетических маркёров в южных и центральных русских популяциях. Но в целом трудно ожидать, что объём имеющейся сейчас информации по классическим маркёрам кардинально увеличится, тогда как по ДНК маркёрам объём информации растёт, как лавина.
ДНК МАРКЁРЫ
ДНК полиморфизм в русском населении изучается с начала 90х годов, когда появились первые работы по маркёрам митохондриальной ДНК. В 90е годы те или иные ДНК маркёры, в отдельных русских популяциях, исследовались многими лабораториями. Как правило, это были маркёры, тесно ассоциированные с заболеваниями, а популяционные выборки служили в качестве контроля. В конце 90х годов планомерные исследования ДНК полиморфизма в русском населении были начаты в лаборатории С. А. Лимборской совместно с авторами этой книги [Лимборская и др., 2002].
Эти исследования опирались на аутосомные ДНК маркёры. Однако одновременно в Москве и Магадане в лабораториях Н. К. Янковского и Л. Л. Соловенчука разворачивались и работы по полиморфизму митохондриальной ДНК в русских популяциях [Orekhov et al., 1999, Malyarchuk and Derenko, 2001], а несколько позднее началось изучение Y хромосомы. Исследования русских популяций, расположенных за пределами «исконного» ареала, проводились по аутосомным и однородительским маркёрам в научных центрах Уфы (под руководством Э. К. Хуснутдиновой), Томска (под руководством В. А. Степанова, В. П. Пузырева), Новосибирска (под руководством Л. П. Осиповой, М. И. Воеводы).
Популяции «исконного» русского ареала по аутосомным маркёрам широко изучаются в Белгороде под руководством М. И. Чурносова. Что же касается маркёров митохондриальной ДНК и Y хромосомы, то основная часть данных по русским популяциям «исконного» ареала получена Б. А. Малярчуком и авторами этой книги.
Поскольку ДНК полиморфизм в русском населении изучается лишь немногим больше десяти лет, то общий накопленный объём данных невелик сравнительно с антропологическими признаками и классическими маркёрами, изучавшимися в течение многих десятилетий. Однако исследования ДНК полиморфизма находятся на своем пике, и в ближайшее время можно ожидать лавинообразного роста информации.
ФАМИЛИИ
Кроме трех основных проекций генофонда — антропологии, классической генетики и молекулярной генетики, — есть и еще один очевидец, еще один независимый источник информации о генофонде. Это фамилии. Русские фамилии в качестве источника генетической информации широко изучаются с 70х годов. Эти исследования связаны с именами А. А. Ревазова, Е. К. Гинте-ра и их учеников, Г. И. Ельчиновой, А. П. Бужиловой, М. И. Чурносова, И. Н. Сорокиной. Передаваясь в поколениях, фамилии ведут себя как гены и могут рассматриваться как их аналог. Поэтому А. А. Ревазов и назвал их квазигенетическими маркёрами. Фамилии маркируют не непосредственно гены, а генофонды (например, общность фамилий двух удаленных популяций может указывать на имевшую место миграцию или общность происхождения, см. главу 7). Конечно, эти маркёры очень изменчивы — частота их «мутаций» велика. Однако у них есть и примечательное достоинство — по этим маркёрам мы впервые можем изучать не выборку, а всю популяцию целиком, собирая данные о фамилиях всех членов популяции. Иными словами, такое тотальное исследование генофонда по частотам фамилий вообще лишено выборочной ошибки. И такой «безошибочный» источник информации, наряду с тремя остальными очевидцами (антропологическими, классическими генетическими и ДНК маркёрами) создаёт важную четвертую проекцию генофонда. Четыре проекции, четыре независимых «свидетеля» в комплексе дают убедительные и объективные сведения о структуре, каркасе и архитектонике генофонда.
СИНТЕЗ
Данная книга была задумана как анализ, сравнение и картографирование накопленной информации с тем, чтобы созданные карты могли подытожить результаты полуторавековой работы антропологов, многих десятилетий работы антропогенетиков и нескольких лет работы молекулярных генетиков. Этот анализ, надеемся, поможет перекинуть мост от антропологии и антропогенетики к начинающемуся интенсивному изучению русского генофонда по ДНК маркёрам.
Говоря образами основателя геногеографии А. С. Се-ребровского: перебросить мост — через волнующееся море генофонда — от древнего континента антропологии к поднимающемуся в дыме вулканов материку ДНК исследований, на бескрайних просторах которого рождаются все новые молекулярно-популяционные лаборатории.
Судьба такого моста, очевидно, будет печальна (все-таки сейсмоопасная зона), но попробовать мы обязаны. Любое нарушение преемственности в науке ведет не только к утере целых массивов информации, но и к куда более печальным утратам — обеднённости ассоциативных связей, некритическому восприятию новых данных и в целом — к утрате культуры научного мышления. Без анализа данных антропологии и классических генетических маркёров изучение ДНК полиморфизма повисает в воздухе — весь фундамент, целые научные пласты и эпохи в изучении русского генофонда исчезают из научного оборота, создавая провалы в интерпретации геногеографического ландшафта ДНК маркёров и стиль поверхностно-смелых выводов.
Не только в геногеографии, но и в антропологии сейчас преобладаёт интерес к обобщению данных и комплексным исследованиям. Процесс накопления данных в антропологии достиг этапа насыщения, и исследователи перешли к интенсивной разработке приёмов анализа и к обобщению результатов. Таким образом, на нынешней ступени развития и генетики, и антропологии одной из важнейших научных задач стали анализ, синтез и осмысление накопленной информации.
Глава 2. СОЮЗ ГЕНЕТИКИ И АНТРОПОЛОГИИ
Двух станов не боец, но только гость случайный,
За правду я бы рад поднять мой добрый меч,
Но спор с обоими досель мой жребий тайный,
И к клятве ни один не мог меня привлечь;
Союза полного не будет между нами —
Не купленный никем, под чье б ни стал я знамя,
Пристрастной ревности друзей не в силах снесть,
Я знамени врага отстаивал бы честь!
Алексей Константинович ТолстойПоскольку во введении прямо объявлено о синтезе генетики и антропологии, которому надеются способствовать авторы, надо столь же прямо признать, что эта задача не так проста, как может показаться на первый взгляд. Казалось бы, оба стана — антропология и генетика — стремятся к союзу. Более того, один из авторов антрополог, а второй — генетик. Вроде бы остается лишь преодолеть технические сложности объединения информации этих двух потоков исследований, и синтез двух наук будет обеспечен. Но проблема оказалась вовсе не в технических сложностях — их мы преодолели с помощью геногеографии. Сложность оказалась в разных позициях, в разных методологиях, в разном стиле мышления и интерпретаций, принятых в этих науках.
Этническая антропология, изучив внешний, фенотипический облик народов, реконструирует историю их сложения. Популяционная генетика, исследовав генофонд, реконструирует генетическую историю тех же самых народов. Обе науки ставят одни и те же вопросы, изучают одно и то же население, и разнятся между собой, на первый взгляд, лишь инструментарием — одна имеет дело с морфологическими признаками, другая — с генами. Одна изучает фенофонд, другая — генофонд тех же самых народов. Казалось бы, союз двух наук благотворен и неизбежен. Однако различия в инструментарии оказались переплетены с непростой историей этих наук (вспомним разгромленную в 40е годы генетику и чудом, но уцелевшую, этническую антропологию), с различиями в накопленном ими опыте и традициями, различиями в методологии, с труднопреодолимыми различиями в самом научном языке, отражающем суть изучаемых явлений.
Чтобы попробовать найти пути воссоединения обеих заинтересованных сторон, мы даже устроили вместе с антропологами семинар под названием «Антропология и молекулярная генетика: союз или противостояние?». На его заседаниях, пользовавшихся определённым успехом, представители обоих станов настойчиво заявляли об отсутствии какого-либо противостояния между ними! Однако и союз не состоялся. Семинар распался, поскольку антропологи считали само собой разумеющимся, что юная наука («этногеномика» — так нескладно стали именовать популяционную генетику, использующую ДНК маркёры) должна послушно следовать правилам, привычным для антропологов, давно у них принятым, устоявшимся и потому казавшимся естественными и единственно приемлемыми. С другой стороны, этногеномика порой позволяла себе столь беспечное использование знаний, с трудом добытых и глубоко продуманных антропологией, что вызывала совершенно справедливое разочарование.
Итак, поводов для несостоявшегося союза достаточно. Подспудное противостояние остается[13]. Но причины его — ни в коем случае не во взаимоотношениях двух наук или их представителей, а намного глубже. И прежде, чем проводить синтез данных этих наук о человеке, надо попытаться понять эти причины.
2.1. СОЮЗ ИЛИ РАЗЛАД?[14]
§ 1. Былой союз: Разгром генетики — Галилеево отречение антропологии — Его последствия — Позабытая магистраль — Развитие антропологии: без опоры на генетику — Возрождение генетики: без традиций антропологии
§ 2. Пути воссоединения: Ценность антропологических данных — Бесценность антропологической методологии — Территориальная гетерогенность в генетике — Перспективные генетические маркёры — История без Адаптации! — Генетический камертон — География генофонда — Кратчайший путь к союзу
Стремление к синтезу знаний о человеке традиционно присуще антропологии. Однако, она осуществляет этот синтез в узком поле морфологических исследований физического облика населения, не выходя за очерченные вокруг себя границы. Смежные направления, коренящиеся в антропологии, но переступившие эти границы, перестают в глазах антропологов быть антропологией и порождают своего рода научных кентавров вроде антропогенетики. Сразу оговоримся, что нам это создание кажется весьма привлекательным, и в его судьбе авторы пытаются принимать самое деятельное участие. Но беда в том, что такое создание подстерегает трудная научная судьба: отторгаемое антропологией, оно должно утвердить себя в другой науке, быть ею признанной как необходимая её часть, и тем самым как бы потерять свое значение для «классической» антропологии (в традиционном её понимании антропологами-морфологами). Такой и оказалась судьба антропогенетики, изгнанной из антропологии и обретшей себе приют в генетике.
§ 1. Былой союз
Отношение к антропогенетике со стороны отечественных антропологов сложилось такое же, как к самой антропологии у археологов: минимальное и вовсе не обязательное привлечение информации из смежной области знания при изучении одной и той же комплексной проблемы. Но оставим археологию, посмотрим на историческую антропологию: способствует ли её развитию такая десятилетиями усиливающаяся изоляция от генетики?
Термин «историческая антропология» часто используется как синоним «этнической антропологии» в описании антропологического состава популяций. Знания об антропологическом составе населения (фе-нофонде) историческая антропология использует для реконструкции истории формирования популяций. А те особенности антропологического состава, которые объясняются адаптацией к экологическим условиям, относят к другому разделу — к антропоэкологии. Историческая антропология формировалась на протяжении столетия, если не более, и прошла ряд этапов, прежде чем сложилось её современное понимание и оформилось её название [Алексеев, 1979]. Ключевыми оказались этапы 20–30х и 40–50х годов XX века. Первый этап был связан с интенсивной разработкой теории и методов расового анализа, а второй — принципов и методов этнической антропологии и палеоантропологии. Органическая связь и преемственность между этими этапами, как и их значение для становления исторической антропологии и антропоэкологии, очевидны. Между ними есть и принципиальный разрыв, отнюдь не очевидный, до сих пор не осознанный, с течением времени всё более трудный для осознания и всё более тормозящий развитие исторической антропологии.
Разрыв этот был в свое время обусловлен разгромом в нашей стране генетики, а вслед за ней и ряда других естественных и гуманитарных наук, включая физиологию и языкознание. На первый взгляд, антропология менее других пострадала, по крайней мере, организационно и структурно. Но это лишь на первый взгляд, потому что трудно определить структурный эквивалент потерям оттого, что стены Московского университета вынужден был навсегда покинуть Виктор Валерьянович Бунак, а другие ведущие антропологи Института и Музея антропологии вынуждены были давать клятвенные заверения на ученом совете в принятии мичуринской биологии как основы своей преподавательской и научной антропологической деятельности. Приобрела или же потеряла наука вообще и антропология в частности оттого, что после разгрома Медико-генетического института крупнейший наш генетик-математик М. В. Игнатьев всю последующую жизнь разрабатывал вопросы теории и практики антропологической стандартизации? Отказ от генетического мышления, на который пришлось пойти основателям этнической антропологии и палеоантропологии, это — чем-то перекликающееся с Галилеевым — вынужденное отречение, чтобы избежать разгрома своей науки. Это отречение читается даже не между строк, а в строках основополагающих работ наших ученых [Происхождение человека…, 1951].
Сегодня, когда для нескольких поколений антропологов стало привычным и даже само собой разумеющимся вести исследование без оглядки на генетический фундамент изучаемых явлений, может возникнуть вопрос: а было ли такое отречение? Занимала ли генетика сколь либо значимое место у истоков исторической антропологии? Да, такое действительно было! Антропология развивалась в активном взаимодействии с генетикой в различных своих разделах. Но наиболее систематическое взаимодействие с генетикой наблюдалось в зарождающейся исторической антропологии. Здесь были свои предтечи — прежде всего Е. М. Чепурковский, который при разработке географического метода в антропологии опирался, помимо цветности, на головной указатель как на признак с высокой степенью наследуемости [Чепурковский, 1913]. Здесь было сотрудничество и своеобразное конструктивное соперничество антрополога В. В. Бунака с генетиком Н. К. Кольцовым: первые в нашей стране две работы о распределении групп крови — соответственно у белорусского и русского населения — были выполнены настолько синхронно, что в одной содержится ссылка на верстку другой статьи. Было здесь и ученичество антрополога Н. Н. Чебоксарова у генетиков А. С. Серебровского и С. С. Четверикова, сказавшееся вскоре в блестящих работах по географии монголоидных признаков у населения северных областей Европы. Здесь была первая попытка применить теорию А. С. Серебровского, Н. П. Дубинина и Д. Д. Ромашова о генетико-автоматических процессах: Я. Я. Рогинским — к анализу распределения групп крови АВ0 в населении мира, а А. И. Ярхо — к депигментации алтайцев. Здесь были фундаментальные исследования М. В. Игнатьевым генетикоматематических основ изменчивости полигенных количественных признаков и применение этих моделей к изолированным популяциям Петровских озер, изученным Г. Ф. Дебецем.
Но главное, что характерно для 20–30х годов, — это ведущая роль антропологов в полевых популяционно-генетических исследованиях народов нашей страны. Фактически антропологами было положено начало исследования генофонда народонаселения Северной Евразии, к которому генетики приступили лишь полстолетия спустя. Если еще учесть, что всё это виделось антропологам того времени не креном в сторону генетики, а магистральной линией развития самой антропологии, станет очевидным, сколь от многого пришлось отрекаться антропологам во имя спасения своей науки после печально известной сессии ВАСХНИЛ.
События в биологии, приведшие в 1948 г. к известной дискуссии «О положении в биологической науке», завершившей разгром генетики, приостановили накопление генетических данных. Однако полного перерыва, к счастью, не произошло, благодаря еще одному источнику генетической информации о населении — медицине. Нужды медицины в области переливания крови и судебно-медицинской экспертизы требовали изучения групп крови, в том числе и в разных популяциях. Тем более что в послевоенные годы началось стремительное открытие всё новых систем групп крови.
При первой возможности основатели расоведения и этнической антропологии предпринимали попытки восстановления генетического фундамента теории и методов антропологических исследований. Это прежде всего работы В. В. Бунака, М. Г. Левина, Я. Я. Рогинского, Ю. Г. Рычкова, Н. Н. Чебоксарова [Бунак, 1965; Левин, 1959; Рогинский, Рычков, 1970; Чебоксаров, Чебоксарова, 1971]; это и публикация по инициативе Я. Я. Рогинского в «Советской антропологии» статьи о группах крови одного из народов Сибири, набор которой для «Антропологического журнала» был рассыпан еще в 1937 году.
Но упущенное время взяло свое, и вынужденный отрыв от генетики стал уже привычен для антропологии. Даже при совершенствовании методов статистического анализа, при поиске и введении новых диагностических признаков историческая антропология становилась всё более описательной наукой по мере того, как всё более забывала о генетических основах изучаемых ею явлений. Изучение групп крови и других систем генетического полиморфизма населения возобновилось. Но — увы! — теперь к генетическим маркёрам, включавшимся в антропологические программы исследования, стали относиться не как к новой магистрали антропологии, не как к фундаменту фенофонда, а лишь как к очередным антропологическим признакам. К ним стали применяться привычные для антропологов методы сравнительного статистического анализа, а не специально разработанные генетикой методы сравнительного анализа генофондов, требующие иного взгляда, других подходов, дополнительных усилий.
Воссоединение не состоялось. Традиция, заложенная еще в первой половине XX века, почти иссякла, а разрыв антропологии с генетикой сохраняется. Хотя давно исчезли исходные его причины, но и сегодня в антропологии можно встретить молчаливое неприятие воссоединения с генетикой.
А возродившаяся популяционная генетика также пошла своим путем, и уже не чувствует своей коренной связи с антропологией, рассматривая её лишь как еще один (наряду с лингвистикой, археологией и географией) «справочник». В этот справочник иногда заглядывают, но лишь для того, чтобы уточнить положение изучаемой популяции в антропологической (или лингвистической) классификации — подобно тому, как в географическую карту заглядывают для того, чтобы уточнить географическое положение популяции.
§ 2. Пути воссоединения
Такой разрыв между антропологией и генетикой особенно печален для исторической антропологии.
Ген является «вечным» в том смысле, что он объединяет древние популяции и их ныне живущих потомков. Ген — это наследство, которое современное население получило (порой в неизменном виде, порой с наслоениями накопившихся мутаций) от предковых популяций. Палеоантрополог может обнаружить древние находки. Но он никогда не знает, дошли ли до наших времён, сквозь всю длинную цепь поколений потомки тех, чьи останки он держит в своих руках? Не прервалась ли эта цепь еще в глубокой древности? И, может быть, современное население уже не имеет к этим находкам никакого отношения? Только генетик может подтвердить, что их след дошёл по непрерывающейся цепи поколений до современного населения. Поскольку генетик прослеживает путь гена в обратном направлении — от современных потомков вглубь времён. Поэтому мы точно знаем, что этот путь нигде не прервался, что предки современного населения пронесли этот ген на всем протяжении его существования, во всей мыслимой древности поколений. И тогда следующий этап — синтез палеоантропологических, антропологических и генетических знаний — позволит исторической антропологии сделать новый шаг в познании происхождения народов.
Но возможно ли и нужно ли воссоединение исторической (этнической) антропологии и антропогенетики? Не осталась ли его необходимость в прошлом? А современная генетика и антропология, не могут ли гармонично развиваться друг без друга, ничего не теряя при этом? Да и уцелело ли общее поле деятельности?
На этот вопрос мы можем ответить однозначно: уцелело. Среди достижений современной популяционной генетики немало таких, которые необходимы исторической антропологии. В этом разделе мы рассмотрим некоторые из них. Они прокладывают пути к воссоединению антропологии и генетики, в котором обе науки, как нам кажется, нуждаются в равной степени.
ЧЕМ АНТРОПОЛОГИЯ МОЖЕТ ПОМОЧЬ ГЕНЕТИКЕ?
Очень многим.
Во-первых, обширными знаниями о взаимном сходстве и истории популяций — ведь практически каждый народ на Земном шаре изучен (и, как правило, изучен очень хорошо) антропологами. Когда генетика еще лишь начинает описывать и сравнивать популяции, антропология уже знает «кто на кого похож» и «кто от кого произошёл». И генетик может проводить свои исследования не в неизведанных дебрях, а в местах, разведанных и исхоженных антропологами, местах, для которых составлены подробные описания и карты. Это практичнее, удобнее и несравненно полезнее, поскольку уберегает генетиков от запоздавших на сто лет «открытий».
Во-вторых, антропология дольше изучает популяции человека, и накопила, путем проб и ошибок, большой методологический опыт. Генетика может, конечно, сама «открыть» типологический подход и со временем убедиться, что этот путь не ведет никуда. Но генетика может учесть богатый опыт антропологии в этом отношении. Генетика, наверное, смогла бы и сама придти к открытию географического метода, но вряд ли он достигнет той полноты и выстраданности, как географический метод в антропологии (раздел 4.4.). То же самое относится к крайностям миграционизма и изоляционизма, нумерической таксономии и принципу неравноценности признаков — все эти крайности уже пройдены антропологией, найдены их плюсы и их минусы. И генетик может сэкономить свое время и не тратить свои силы в научных баталиях, отстаивая, например, миграционизм — достаточно лишь заглянуть в антропологические работы, чтобы найти аргументы в пользу этой концепции, но при этом убедиться, что аргументов против — не меньше. Методологический опыт антропологии бесценен для молодой молекулярной генетики — он уберегает её от наивных крайностей, передавая из рук в руки зрелый взгляд на общий предмет исследования.
ЧЕМ ГЕНЕТИКА МОЖЕТ ПОМОЧЬ АНТРОПОЛОГИИ?
Не меньшим. То, что союз с антропологией был бы плодотворен для генетики, это бесспорно и осознается уже многими «этногеномиками». Но не столь очевидной кажется антропологам необходимость возвращения генетики в лоно антропологии — не как гостьи, а как необходимой составляющей части исторической антропологии. Поэтому подробнее, на четырех примерах, рассмотрим обратную сторону — почему популяционная генетика так нужна исторической антропологии?
1. ГЕТЕРОГЕННОСТЬ НАСЕЛЕНИЯ. ЧЕМ ОНА ВЫЗВАНА?
Главной задачей геногеографии является познание «ареальной» изменчивости генофонда — генетической изменчивости в пределах его ареала.
Мы даже считаем, что название «ареальная генетика» более полно отражает дух и букву этой науки, чем традиционное название «геногеография». Проблема ареала близка и исторической антропологии. Её важной задачей является выделение антропологического типа, которое предполагает оконтуривание его ареала. В генетике изучение ареальной изменчивости основывается на хорошо разработанной теории и моделях пространственной дифференциации популяций. Эти теории и модели необходимы антропологии.
Например, антропология пространственные различия в антропологическом составе популяции традиционно трактует исключительно как свидетельство формирования этой популяции из разных источников (как вариант — проявление субстратных и суперстратных антропологических типов). Геногеография, наблюдая аналогичную картину в генофонде, допускает возможность возникновения территориальной гетерогенности вследствие внутренних процессов саморазвития, присущих генофонду под действием систематических и случайных факторов (простейший вариант — в результате дрейфа генов). Антропологией же пространственная гетерогенность рассматривается лишь как свидетельство гетерогенного происхождения.
Воссоединение генетических и антропологических исследований помогло бы антропологии различать эти принципиально разные ситуации.
К тому же у современной популяционной генетики человека появился и новый инструмент — однородительские ДНК маркёры, передающиеся «единым текстом» от матерей к дочерям, внучкам и правнучкам или же от отцов к сыновьям, внукам и правнукам. Знание этих «текстов», изучение распространения, истории и географии их видоизменений намного «прицельнее» позволяет прослеживать миграции, выявлять их источники и примерные пути. Этот инструмент создаёт уникальную фактографическую базу, недоступную ранее антропологии и позволяющую давать точную оценку эффективности миграций, обнаруживать источники и определять время миграционных событий.
Обладая всеми этими сведениями, можно, говоря в терминах популяционной генетики, различать эффекты миграций, дрейфа генов и отбора. Это означает, что механизмы возникновения и поддержания гетерогенности населения, различий между популяциями в пределах ареала можно описать точным количественным языком генетики. Это может стать хорошим подспорьем в решении проблем исторической антропологии.
2. ОТБОР. ИСТОРИЯ И СЕЛЕКТИВНО-НЕЙТРАЛЬНЫЕ ПРИЗНАКИ
Расширение программы антропологических исследований как современного, так и древнего населения породило методологический «дрейф» от проблемы таксономической неравноценности признаков в сторону нумерической таксономии. Этот «дрейф» сопровождается появлением сопутствующих методов кластерного анализа, анализа главных компонент обобщённой дисперсии множества признаков, факторного анализа, расчёта обобщённых расстояний. Подобные методы широко применяет и популяционная генетика.
Но есть и разница. Расширение генетической программы предопределено самой природой — исследованию становятся доступны всё новые и новые гены, более того — различные классы генов, требующие особого математического аппарата анализа, адекватного природе этих генов. Расширение же антропологической программы является, прежде всего, творчеством исследователя, которое лишь интуитивно следует творчеству природы. Когда генетик включает в программу новый маркёр, он выбирает из тех полиморфных сайтов, которые реально существуют в геноме. Это объективно существующая реальность. Когда же новый признак вводит антрополог, то он много более субъективен — он сам выбирает, например, те точки на черепе, расстояние между которыми он будет измерять. Конечно же, и генетическая программа в какой-то мере произвольна — из множества полиморфных маркёров генетик пока выбирает лишь несколько. Но антропологическая программа произвольна в намного большей мере — антрополог выбирает не только, какие признаки изучать, но и что понимать под тем или иным «признаком».
Впрочем, таксономическая неравноценность[15] признаков проявляет себя в полной мере, как в антропологии, так и в генетике. Она является следствием естественного отбора, по-разному действующего на разные гены. Например, если изменчивость одного из генов (или признаков) сформирована в основном отбором, то для изучения истории популяций его ценность невелика. Другой ген (или признак) селективнонейтрален — то есть не подвержен отбору. Его изменчивость вызвана лишь историей, эволюцией популяций, и для таксономии популяций это ценный признак. Конечно, в понятие таксономической ценности входит и требование высокого уровня изменчивости, и требование географической упорядоченности в этой изменчивости. Но всё-таки требование селективной нейтральности является определяющим. А оно, увы, почти никогда не выполняется. Различно давление отбора не только на разные гены, но и селективное значение одного и того же гена различно на разных территориях и в разные эпохи (см. главу 5 и Приложение).
Что же делать, если требование селективной нейтральности столь важно, а гены и антропологические признаки не желают ему соответствовать?
В популяционной генетике разработаны специальные методы «снятия» селективной разно-качественности генов. Достигается это путем перевода наблюдаемых межпопуляционных различий в их селективно-нейтральный эквивалент (см. Приложение и главу 5). Он соответствует изменчивости некоего идеального «обобщённого гена», не подверженного отбору и обладающего поэтому максимальной таксономической ценностью. Тем самым как бы «снимается» влияние экологии, адаптации, отбора, и остается только влияние истории. Благодаря этому обобщённые генетические расстояния между популяциями могут быть переведены, например, в эквивалент времени, требующегося на образование такого расстояния, то есть времени разделения этих популяций. Такой способ, разработанный генетикой, наиболее отвечает потребностям исторической антропологии. Ведь антропологи всегда стремились избавиться от влияния средовых факторов на те закономерности, которые выявляются при анализе антропологических признаков.
3. КООРДИНАТА ВРЕМЕНИ
Все межгрупповое (межпопуляционное) генетическое разнообразие, накопленное популяцией за время её существования, может быть выражено в генетических расстояниях, а затем в эквивалентах исторического времени. Такой анализ можно провести для любых популяций — например, сначала для народов, затем для их лингвистических групп, далее — для лингвистических семей. В этом случае мы как бы всё более опускаемся по координате времени вглубь времён — к времени образования этих популяций. Это позволяет перейти к анализу формирования этого разнообразия от древности к современности по координате исторического времени. Причём историческое время может быть выражено не только в единицах астрономического времени или поколений. Его можно выразить в этапах этногенеза [Рычков, Ящук (Балановская), 1980, 1983, 1985, 1986]. Когда эта часть анализа выполнена, возникает возможность рассматривать накопившееся генетическое разнообразие населения как продукт этногенеза, а генофонд — как напластование генетических отложений, возникших в ходе этногенеза.
Здесь открывается широчайшее поле для совместной работы генетиков и антропологов. Бесконечное описание и классификация этнических популяций сами по себе не приведут историческую антропологию к познанию законов роста древа этносов. Нужны критерии правильности этих классификаций, критерии приближения того или иного реконструированного древа к истинной родословной этносов. И такие критерии даёт генетика: она служит тем чутким камертоном, который позволяет отличать исторически верные классификации от тех, которые поют «на свой лад» — отражают историю «своих» признаков, но не историю народов.
Все-таки наследуются и от корней достигают кроны этого древа не антропологические признаки как таковые, а стоящие за ними гены. Поэтому генетике проще, чем антропологии, проследить путь от современной кроны к корням родословного древа этносов [Рычков, Ящук (Балановская), 1980, 1983,1985, 1986]. Наличие упорядоченности в этом дереве («квантуемости» этногенеза) и служит своеобразным камертоном, однозначно свидетельствует, что процесс этногенеза подчиняется постоянно действующим законам, которые еще предстоит открыть. Но здесь, чтобы компенсировать неизбежные упрощения, чтобы тестировать модели, создаваемые генетикой, нужны общие усилия этнологов, антропологов и генетиков.
На машине времени лучше путешествовать вместе.
4. КООРДИНАТЫ ПРОСТРАНСТВА
Еще одно направление исследований генофонда, сближающее генетику народонаселения с исторической антропологией — это геногеография. Тем более что географический метод в антропологии имеет давние традиции. Но очень важно отчётливо представлять особенность генетического подхода: геногеография является не географией генов, а географией генофонда.
Генофонд охватывает всю совокупность всех генов, имеющихся в популяции. География отдельных генов этой совокупности практически неисчерпаема — как индивидуальны кожные узоры на наших пальцах, так и неповторимы узоры генетического рельефа каждого гена. Но совсем иное дело с географией генофонда. Она едина для всех генов. Она выявляется при изучении совокупности генов и далее остается неизменной, сколько бы новых генов мы не изучали.
При этом география генофонда служит основой географии комплексов антропологических признаков, то есть географии антропологических типов. Методами статистической картографии можно не только определить меру общего сходства геногеографической и антропогеографической карт, но и выделить те области ареала, где это сходство нарушено, с тем, чтобы в дальнейшем исследовать причины такого несоответствия. Компьютерная картография позволяет провести совместный анализ генофонда, фенофон-да и физико-географических карт, на основе которого можно выделить ведущие факторы внешней среды при формировании населения. Но самое главное, что геногеография позволяет искать (и иногда отыскивать — см. раздел 2.3.) следы давно ушедших поколений, следы исторических событий, запечатлённых в географии современного населения.
Из всех путей воссоединения антропологии с генетикой география генофонда становится сегодня кратчайшим путем. И именно он положен в основу нашей книги. Он обещает быть плодотворным потому, что именно на этом пути и генетика, и антропология начинают изучать не гены или фены, а то, что их в действительности интересует — историю и географию популяций.
2.2.ГЕНЕТИКА И РАСЫ[16]
§ 1. Генетический фундамент расы: Как наследуются расовые признаки — Но это не важно для проблемы расы — Расы перед судом генетики — Расовые классификации популяций — Статистическая проверка классификаций — Картографическая проверка классификаций — Оправдательный приговор
§ 2. Миф о несостоятельности рас: Пятнадцать процентов — Много или ничто? — Существуют ли популяции? — Существуют ли расы? — Существуют ли народы? — Существуют ли индивиды? — Существуют ли звезды? — Популяции не существуют, но их деревья опровергают расы? — Миф, миф, миф…
§ 3. Генетические свидетельства: Как генетики нашли расы — Но не узнали их — Придумали классификацию — И её опровергли — Незнакомы с предметом — Но его модно отрицать — «Лысенковщина» для генетики — «Антирасизм» для антропологии
Никогда разум не в силах был определить добро или зло, или даже отделить зло от добра, хотя бы приблизительно; напротив, всегда позорно и жалко смешивал; наука же давала разрешения кулачные. В особенности этим отличалась полунаука, самый страшный бич человечества, хуже мора, голода и войны, не известный до нынешнего столетия. Полунаука — это деспот, каких еще не приходило до сих пор никогда. Деспот, имеющий своих жрецов и рабов, деспот, пред которым всё склонилось с любовью и суеверием, до сих пор немыслимым, пред которым трепещет даже сама наука и постыдно потакает ему.
Ф. М. Достоевский. «Бесы»Разрыв наук, взаимосвязанных по своей природе, не проходит для них бесследно. И если антропогенетика, вынужденно утратив органичную связь с антропологией, стала порой страдать, на наш взгляд, поверхностными суждениями, то антропология пострадала значительно сильнее.
Блестящие достижения этнической антропологии в разработке проблем рас и антропологических типов подверглись такому шквалу «антирасистской» критики, что даже упоминание о них считается в мировой науке дурным тоном. Понятно, что эта ситуация связана с борьбой с расизмом, то есть с неправомерным переводом биологических различий между людьми в плоскость их различий по способности к социальному успеху, социальной адаптации. Однако с водой выплескивается и ребенок. Борьба с ненаучным отношением к биологическому многоообразию человека переходит в печальный отказ от разработки расовых классификаций на строго научной основе. Ведь каждый из нас биологически неравен любому другому, отличен от него. И эта биологическая многоликость — залог устойчивости и процветания нашего вида. Надо ли говорить, что научные классификации не имеют отношения ко всему, что наносит ущерб достоинству человека, служит средством разжигания розни и обоснованием антигуманных действий?
При этом самым главным — и даже единственным — собственно научным аргументом против теории рас оказались данные генетики. Во всяком случае, именно этот генетический аргумент (который мы в этом разделе и рассмотрим тщательно) всегда используется наукой и околонаукой как основной инструмент критики при нападках на расу. Такое положение дел не просто усугубляет разрыв между генетикой и антропологией — оно ставит под вопрос и принципиальную возможность синтеза данных этих наук. Поэтому мы вынуждены подробно рассмотреть те данные генетики, которые околонаука обращает против самих основ существования исторической антропологии.
Существует взгляд, что в какой-то степени разная научная судьба термина «расы», скажем в США и в России, связана и с тем, что для английского языка это слово родное, многозначное, а для русского — пришлое, узкое, обозначающее лишь научное понятие. В научной фантастике американцы спокойно называют инопланетян «иной расой». В русском языке слово «раса» к инопланетянам неприменимо: инопланетяне — это хотя бы «иной вид», но никогда не «раса», если они не похожи на людей. Когда в Америке три века назад называли индейцев, а затем африканцев «иной расой», это могло означать, что те произошли не от Адама и Евы, а потому общечеловеческие ценности на них не распространяются и требования человечности по отношению к ним не обязательны. И сейчас борьба с расизмом для американцев в каком-то смысле означает вновь возведение всех людей к потомкам Адама и Евы, это путь покаяния. Беда лишь в том, что этот благородный порыв порывает с наукой, с её объективностью, но при этом хочет оправдать себя научными обоснованиями.
Русский язык, принявший термин «раса» именно для обозначения разных стволов человечества, не воспринял негативный «ино-видовой» смысл этого слова. Например, термин «расоведение» имеет в русском языке абсолютно нейтральный оттенок и говорит лишь о том, что есть такая наука. Облегчило ситуацию и то, что Россия, хотя и включила в себя народы двух больших рас, но не знала расизма — расовой дискриминации. И в России классификации рас и антропологических типов могли разрабатываться безболезненно с точки зрения этики — они не несли и не несут обидной для кого бы то ни было смысловой нагрузки. Поэтому в какой-то мере на судьбе термина «расы» сказывается и разное восприятие этого термина носителями разных языков. И порой, когда один журналист доказывает, что раса есть, а другой — что её нет, то, похоже, как если бы один доказывал, что трамваи бывают, а другой — что ковров-самолетов нет. Оба правы — спор о терминах. Надо лишь следовать Декарту: «Правильно определяйте слова, и вы освободите мир от половины недоразумений».
Но, договорившись о терминах, мы избавимся лишь от одной половины недоразумений. Вторая половина недоразумений коренится уже в самом стремлении разделить людей на категории высшие и низшие, хорошие и плохие, достойные править или достойные уничтожения. И рост немецкого расизма или французского расизма, сейчас менее известного, но распускавшегося еще более буйно (его расцвету помешала мировая война), уже не объяснишь смысловыми оттенками слов. В Германии или во Франции тех лет не было речи о принадлежности рас к разным путям эволюции человека. Здесь уже в явном виде любые, даже самые малые физические различия между любыми группами людей, зафиксированные наукой, полунаука поставляла политике для оправдания насилия и теорий превосходства одних людей над другими.
Мы не можем избавить мир от этой половины недоразумений — это за пределами возможностей и обязанностей науки. «Полунаука — это деспот, каких еще не приходило до сих пор никогда. Деспот, имеющий своих жрецов и рабов, деспот, пред которым всё склонилось с любовью и суеверием, до сих пор немыслимым, пред которым трепещет даже сама наука и постыдно потакает ему» [Достоевский, «Бесы»]. Но обязанность науки — тщательно следить, чтобы научные выводы не искажались жрецами полунауки или околонауки. И поскольку до сих пор встречаются заявления о якобы существующем «биологическом превосходстве» одних людей (рас, народов) над другими, мы считаем себя обязанными подчеркнуть в этой книге, что генетика не даёт им для этого никаких оснований.
Определяя, есть ли генетический фундамент у расы или нет его, подтверждает ли генетика основы антропологии или опровергает их, мы обязаны строго следовать рамкам науки. Любое отклонение от точного знания науки в угоду переменам ветра в обществе, в угоду полунауке будет только способствовать процветанию этого деспота. Оба противоположных отклонения — и отрицание существования рас, и расизм любой расцветки — могут лишь дезориентировать людей, доверяющих науке. Поэтому задача науки — не решая вопросы добра и зла, точно сформулировать те выводы, на которые может опереться человек, ищущий научные ориентиры при осмыслении мира. И не потакать полунауке, которая может использовать эти выводы в любых своих целях. Она с одинаковым успехом использует одни и те же данные науки и для обоснования расизма, и для обоснования «несуществования» рас. Поэтому, не оглядываясь на опасность с обеих сторон и положась на добрую волю и здравый смысл читателя, попробуем выяснить, какова же реальная картина соотношения генетики и расы.
§ 1. Генетический фундамент расы
При рассмотрении генетического аспекта расы обычно привлекают внимание две стороны проблемы.
ГЕНЕТИЧЕСКИЙ ФУНДАМЕНТ ОТДЕЛЬНЫХ РАСОВЫХ ПРИЗНАКОВ
Первая сторона проблемы связана с вопросом о наследовании расовых признаков. Их высокая наследуемость не только постулируется антропологией, но и была косвенным образом показана. Однако успехи молекулярной генетики пробудили надежды на то, что вскоре можно будет не только констатировать наследуемость, но и выявить конкретные гены, принимающие участие в генетической детерминации тех конкретных признаков, по которым выделяются расы. Это звучит очень заманчиво: почему-то представляется, что генетика, дав «генетический паспорт» расы, тем самым её «легализует» и даст ей право на научно обоснованное существование в тени генетики. В основе таких ожиданий лежит, скорее всего, вера в неограниченное могущество молекулярной генетики, в истинную научность только того, что показано на молекулярном уровне, и забвение тех важных и действительно научных реалий, которые уже давно созданы этнической антропологией.
Экспансия молекулярной генетики уже захватывает антропогенетику. Порою приходится слышать, что антропогенетику представляют как будущий частный раздел молекулярной генетики человека, задача которого — изучить генетическую обусловленность антропологических признаков. А вовсе не как популяционную генетику человека, в рамках которой антропогенетикой уже давно получены много более важные результаты.
Однако за этими ожиданиями, скорее всего, последует разочарование. Успехи молекулярной генетики в выявлении генетических основ мультифакториальных заболеваний (таких, которые определяются не одним, а многими генами — например, ишемическая болезнь сердца, бронхиальная астма, сахарный диабет), несмотря на чрезвычайные усилия и огромные материальные затраты мирового сообщества, очень скромны, чтобы не сказать более. Дело в том, что взаимодействие многих генов при определении полигенного признака (а именно такими в большинстве своем являются как расовые признаки, так и мультифакториальные заболевания) представляет слишком сложную систему, для анализа которой недостаточно знать эти гены «в лицо». Даже если мы всех их «узнаем», может оказаться, что это будут гены с малыми фенотипическими эффектами. Даже если, к радости генетиков, обнаружится, что хотя бы некоторые расовые признаки контролируются «главными генами» (как предполагается сейчас для пигментации), история изучения моногенной наследственной патологии с её сложной и столь полиморфной клинической картиной показывает, сколь далеко такое знание «главных генов» от точного предсказания фенотипической картины. Но еще важнее, быть может, другое. Даже узнав генетическую подоплёку расовых признаков, мы не получим нового научного знания о самой расе: эти знания уже добыты этнической антропологией, собраны и научно обобщены. Генетике останется лишь уточнить, конкретизировать эти знания, но принципиально нового здесь ей добавить просто нечего.
Единственная небольшая, но самостоятельная и захватывающая задача, которая здесь видится для молекулярной генетики — это реконструкция по данным о палеоДНК для древних популяций таких расовых признаков, как цвет, форма и мягкость волос, цвет глаз и кожи, степень роста бороды, развития третичного волосяного покрова и некоторых других расовых признаков, которые мы не можем реконструировать по костным останкам наших предков. Эта задача психологически близка и понятна. Нам так важно представить живой образ наших предшественников — во плоти и крови, увидеть те признаки, по которым мы обычно различаем современных нам людей. Палеоантропология воссоздает по костным останкам лишь костную основу этого облика. Может быть, со временем генетика по палеоДНК, выделенной из костного материала, достроит и внешний облик наших предков. Но всё же эта задача является очень частной, хотя и по-человечески привлекательной. К тому же и эта частная задача пока бесконечно далека от разрешения — надо ждать нового прорыва в технике исследований палеоДНК, прогнозировать который пока у нас нет оснований.
Таким образом, рассмотрение первой стороны проблемы — генетических основ самих расовых признаков — не только на данный момент не даёт важной информации, но и в принципе не сможет существенно продвинуть решение проблемы генетического фундамента расы.
ГЕНЕТИЧЕСКИЙ ФУНДАМЕНТ РАСЫ КАК СИСТЕМЫ ПОПУЛЯЦИИ
Именно поэтому так важна вторая сторона проблемы: популяционный анализ генетических основ рас как таковых, а не отдельных расовых признаков. И главный вопрос, который при этом надо решить: имеет ли сама раса — то есть группа популяций, в нее входящих (а не те признаки, по которым она выделяется) — генетический фундамент? А если имеет, то сколь глубок этот фундамент — насколько раса коррелирует с генофондом в целом? Обладает ли группа популяций, выделенная расовой классификацией, выраженным генетическим своеобразием, своеобразным генофондом? Пояснить эти вопросы можно следующим образом.
Рис. 2.2.1. Генетический критерий: раса — реальность или миф?
А) Человечество, состоящее из отдельных популяций (малые кружки). F0 — величина генетических различий между всеми популяциями человечества.
Б) Человечество подразделяется на три «искусственные расы», а «расы» — на популяции. F1 — величина различий между популяциями одной «расы». F2 — различия между «расами». Популяции попадают в ту или иную «расу» случайно — например, в первую «расу» попала и популяция-шашечки, и популяция-штриховка, и популяция-точки. Поскольку в одну и ту же «расу» попали самые разные популяции, то различия в пределах «расы» очень большие (F1 велико). Л различия между «расами» минимальны (F2 намного меньше F1). ВЫВОД: у таких «рас» нет генетического фундамента.
В) Тот же случай, но человечество подразделено на три реальные расы: популяции объединены в группы не случайно, а на основе их сходства (первая группа — шашечки, вторая группа — штриховки, третья группа — точки). В этом случае различия внутри рас и между расами становятся одинаково большими (F1 примерно равно F2). ВЫВОД: расы генетически реальны.
ПЕССИМИСТЫ И ОПТИМИСТЫ
Может быть два способа генетического видения расы.
При первой — пессимистической — точке зрения предполагается, что расовая классификация населения опирается только на ту горстку генов, что лежат в основе расовых признаков. Поскольку эти гены охватывают ничтожную часть всего генома, то и расы описывают ничтожную часть всего генофонда популяций человека, всей совокупности генов. Из этого следует, что расы представляют слишком частный интерес для истории генофонда, чтобы расовым классификациям придавать сколько-нибудь важное генетическое значение. Иными словами, предполагается, что если по расовой классификации две популяции очень близки, то они близки лишь по немногим генам, а по большинству генов они могут быть как близки, так и различны. Расовая классификация, в таком случае, не может прогнозировать генетическое сходство популяций. Иными словами, генетический фундамент мал, ненадёжен, и потому расы просто неинтересны с точки зрения генетики и истории генофондов.
Вторая — оптимистическая — точка зрения предполагает, что гены, отвечающие за совокупность расовых признаков, представляют собой репрезентативную выборку генов из генома в целом. Именно поэтому они отражают географическую изменчивость генофонда человека в целом. Иными словами, генетический фундамент столь глубок, что расовая классификация популяций даёт ценную информацию об истории и генофонде этих популяций. И если какая-то группа популяций выделяется антропологией как отдельная раса, то и генетика обнаружит сходство этих же популяций друг с другом и их общую историю.
Если эта точка зрения верна, то генетика и антропология изучают одно и то же строение, но разными способами. Генетика пытается от изучения генетического фундамента, от генетических основ перейти к пониманию архитектоники[17] генофонда в целом, его каркаса, его несущих конструкций. То есть перейти к пониманию структуры генофонда популяций, которые составляют данную расу. А антропология исходит из антропологического покрова, то есть от изучения внешнего облика и стиля того же здания переходит к познанию его замысла и истории.
Существуют разные способы проверить, какая же из точек зрения — пессимистическая или оптимистическая — более верна.
ИЗМЕНЧИВОСТЬ ВНУТРИ РАСОВЫХ ГРУПП И МЕЖДУ НИМИ
Одним из испытанных способов является сравнительный анализ двух величин генетических различий: первой — различий между расами, второй — различий между популяциями в пределах расовой общности (то есть гетерогенности расы). Идеология этого способа проста, и мы попробуем её изложить в несложных обозначениях и цифрах, чтобы читатель в столь спорном вопросе сам мог выбрать верную точку зрения.
Возьмём очень большую совокупность генетически изученных популяций мира и количественно оценим размах их генетических различий (рис. 2.2.1.А). Он будет численно равняться средним различиям между любыми двумя случайно выбранными популяциями. Обозначим эту величину FST=F0. Затем разделим — чисто случайным образом — всю совокупность популяций на три случайные группы (рис. 2.2.1.Б). Рассчитаем величину генетических различий популяций в пределах каждой группы и обозначим их FST=F1. Теперь рассчитаем различия между случайно созданными нами группами и обозначим эти различия FST=F2. При этом, как доказывается в теории популяционной генетики, всегда F1+F2=F0, то есть общая величина генетических различий F0 в сумме всегда остается прежней: она лишь подразделяется на две части F1 и F2. Здесь F1 мы обозначили различия популяций внутри группы, a F2 — различия между группами популяций.
Если популяций было достаточно много, и они были разделены на группы совершенно случайным образом, то каждая группа представляет собой случайную выборку из генеральной совокупности. И тогда (следуя всем канонам статистики) изменчивость популяций в каждой подгруппе останется той же, какой она была в генеральной совокупности (F1=F0). С другой стороны, это означает, что генетические различия между самими случайно выделенными группами (F2) равны нулю (F2=0). Это и интуитивно понятно (рис. 2.2.1.Б) — если в группы популяции попали чисто случайно из одной и той же генеральной совокупности, то неоткуда и взяться различиям между группами — любая из них отражает одну и ту же генеральную совокупность и потому неотличима от своего близнеца — другой такой же случайной группы (F2=0).
Однако, если популяции будут попадать в ту или иную группу не случайно, а в соответствии с их происхождением и сходством, картина станет совсем иной (рис. 2.2.1.В.). Если генетически сходные популяции отобраны и помещены в отдельную группу, то такая группа будет генетически отличаться от другой группы. Например, в группу № 1 поместим все популяции с низкими значениями признака, в группу № 2 — все популяции со средними значениями, в группу № 3 — все популяции с высокими значениями признака. Иными словами, если мы выделим группы не случайным образом, а в соответствии со сходством их генофондов, то F2 уже станет величиной, отличной от нуля (F2>0). И чем больше различаются выделенные нами группы по их генетическому фундаменту, чем больше генетическое своеобразие этих групп, тем больше F2 будет отличаться от нуля.
В реально существующих и устойчивых системах популяций F2 по своей величине бывает сравнима с F1, так что общая величина генетических различий F0 подразделена примерно на две равные части: F1≈F2. Этот принцип «генетической эквидистантности» иерархических популяционных структур (Fi≈Fi+1) был выявлен внутри столь разных популяционных систем коренного народонаселения как Европа, Сибирь, Америка — и подтвержден генетико-математическим моделированием [Рычков, Ящук (Балановская), 1980, 1983, 1985, 1986]).
КАК РАБОТАЕТ ИНСТРУМЕНТ «ЭКВИДИСТАНТНОСТИ»?
Таким образом, мы получаем в руки инструмент для проверки гипотез: применяя ту или иную классификацию популяций, мы по соотношению F1 и F2 можем оценить прочность генетического фундамента классификации. Если F1≈F2, то классификация отражает реально существующую устойчивую популяционную систему, а каждая группа популяций имеет свой собственный генетический фундамент. Если же F1>>F2 (F2≈0), то классификация «надуманная», случайная по отношению к реальной популяционной системе, и выделенные нами группы своего генетического фундамента не имеют (F2≈0).
Возьмём, к примеру, такой анализ расовой классификации из классической работы [Levontin, 1972], на которую всегда ссылаются при анализе генетических основ расы.
К сожалению, в этом анализе по разным генам «участвовало» чрезвычайно разное число народов — от 10 до 101. Соответственно, по разным генам анализировалось и разное число больших рас — от трех до семи рас. Это могло вызвать значительные случайные колебания в оценках изменчивости по разным генам (размах различий всего лишь для 14 изученных генов оказался стократным: от F0=0.3 до F0=36.4) и привести к ошибочным выводам. Но даже в тех случаях, когда было изучено примерно одно и то же число народов мира и рас, оценки по разным генам варьировали чрезвычайно [Levontin, 1972]. Так, например, для групп крови АВ0 (70 народов шести рас; F0=9.3) различия этносов в пределах расы (Fl=6.3) оказались намного выше, чем различия между расами (F2=3.0). А для групп крови Резус (RH*D, 61 народ шести рас; F0=32.6) наоборот: различия этносов в пределах расы (F 1=7.3) оказались в три раза меньше, чем различия между расами (F2=25.3). Такие колебания показателей F — от гена к гену — объясняются действием отбора и «индивидуальными» особенностями гена, его истории в том или ином регионе. Чтобы нивелировать такие случайные колебания по отношению к генофонду (как совокупности всех генов), переходят от отдельных генов к «обобщённому гену», усредняя показатели F по всем изученным генам (Приложение).
Поэтому перейдем к «обобщённому гену». Генетические различия между всеми народами мира F0, рассчитанные в среднем по всем 14 генам [Levontin, 1972] оказались равны F0=14.6. Её первая составляющая F1 (средние генетические различия между этносами в пределах рас) равна F1=8.3. Её вторая составляющая F2 (средние различия между расами) примерно такая же по величине: F2=6.3. Эти две составляющие (F1 и F2) достоверно друг от друга не отличаются. Их можно считать приблизительно равными, учитывая огромные колебания исходных оценок по 14 разным маркёрам (стократные различия: от F0=0.3 до F0=36.4).
Таким образом, Р. Левонтиным [Levontin, 1972] получено соотношение, примерно соответствующее равенству F1 и F2. Такое соотношение (F1=F2), как мы видели выше, означает, что расовая классификация хорошо отражает историю генофонда человечества, его подразделение на генетически своеобразные группы. Иными словами, Р. Левонтиным [Levontin, 1972] показано, что большие расы имеют глубокий генетический фундамент. Напомним, что если бы расы были «безразличны» к генофонду (если бы расы и генофонд отражали совершенно разные, независимые явления), то различия между расами должны были бы быть равны нулю (F2=0), а не вбирать в себя половину всех накопленных за время эволюции Homo Sapiens различий между популяциями[18].
Это исследование (как и ряд аналогичных) основано на анализе классических генных маркёров. Позднее молекулярногенетические (ДНК) маркёры лишь подтвердили выявленную ранее картину. Например, при обобщающем анализе по 109 ДНК маркёрам 16 популяций мира, представляющих большие расы [Barbujani et al., 1997] получены следующие оценки: F0=15.6; F 1=4.7; F2=10.8. Это означает, что при той же, что и по классическим маркёрам, оценке общих различий между популяциями мира (F0=15), различия между расами не только отличны от нуля (F2=11), но и в два раза превышают различия популяций внутри рас (F1=5).
Иными словами, по данным молекулярной генетики генетический фундамент рас оказался даже в два раза более обширным и глубоким, чем предполагалось по данным классической генетики. Таким образом, можно констатировать, что изучение и классических, и ДНК маркёров в населении мира подтвердило основательность генетического фундамента рас.
СРАВНЕНИЕ КЛАССИФИКАЦИЙ
Однако «валовые» оценки — народы мира, большие расы, человечество — слишком общие, а инструмент анализа может оказаться слишком грубым и идеологически направленным. Намного важнее рассматривать конкретные регионы и решать уже не идеологические, а корректно поставленные научные вопросы. Например, отражает ли данная антропологическая классификация[19] в данном регионе историю формирования регионального генофонда? И здесь мы уже имеем возможность корректно сравнивать разные классификации — антропологические, лингвистические, этнографические, конфессиональные — по степени их соответствия подразделённости генофонда. При этом мы предполагаем: что генофонд — хранит историческую информацию; что его подразделённость — отражает узловые моменты древней истории населения; что классификации — каждая в своей мере — реконструируют тот же путь, реальное родословное древо популяций. Поэтому мы можем использовать генетику как универсальную количественную меру сравнения классификаций. Мы можем сравнить разные классификации (не только расовые, но и лингвистические или этнографические) по их генетическому фундаменту.
Что же оказывается? Что в одних регионах — например, в коренном населении Сибири — расовая классификация несколько менее эффективна, чем лингвистическая и даже конфессиональная (классификация коренных народов по типу используемых ими шаманских бубнов). Для коренных народов других регионов — Кавказа, Урала и Средней Азии — напротив, антропологические классификации более эффективны, чем лингвистические, и соответствуют требованиям к «идеальной» реконструкции истории генофонда, узловых моментов его формирования. Такой анализ, проведённый для многих регионов и основанный на строгих научных подходах, убедительно показал, что расовые (антропологические) классификации хорошо описывают географическую изменчивость генофонда. Генетика свидетельствует о том, что группы популяций, выделяемые по антропологическим признакам, генетически отличаются друг от друга не менее, чем группы популяций, выделяемые, например, по признакам лингвистики.
Итак, расы, как группы популяций, обладают своеобразными генофондами. Поэтому можно уверенно говорить о прочном генетическом фундаменте рас.
Но на всякий случай напомним, что, проведя такой анализ, мы можем говорить о генетическом фундаменте рас только в популяционном плане, и ни в коем случае — в плане наследуемости расовых признаков. О генах расовых признаков мы не узнали ничего нового. Даже если этих генов вообще нет — результат от этого не меняется. Если в Сибири генетически эффективной оказалась классификация шаманских бубнов, мы же не станем утверждать, что нашли гены, ответственные за форму шаманского бубна, его орнамент и количество подвесок на нем? Или если в Европе генетически эффективной оказалась лингвистическая классификация, мы же не будем утверждать, что есть гены, ответственные за строй языка? Или если в Северной Евразии есть свидетельства о генетической эффективности классификации археологии палеолита (см. раздел 9.7.), мы не станем заявлять о генетике каменных орудий — рубил или наконечников из кремня? Точно также мы не имеем права рассуждать о генах, стоящих за расовыми признаками, сравнив расовые классификации и генофонды популяций. Мы знаем об этих генах столько же, сколько о несуществующих генах шаманских бубнов, грамматических правил или палеолитических рубил. Для популяционной генетики просто неважно в данном случае, а есть ли вообще гены расовых признаков и хорошо ли расовые признаки маркируют стоящие за ними гены? Для нее важно, что расы хорошо маркируют исторически сложившиеся популяции и их генофонды. И этого достаточно.
ГЕНОГЕОГРАФИЯ РАС И ИХ ГЕНОФОНДОВ
Однако попробуем сделать еще один шаг и не только оценить генетический фундамент рас с помощью всего лишь нескольких статистических оценок (F1, F2), но и увидеть зрительные образы геногеографии рас, то есть географии их генофондов. Конечно, статистические показатели, численно описывая многообразие популяций, просты и удобны, однако пространственная изменчивость народонаселения требует своего воплощения и на карте. Карта даёт уже не некую среднюю величину, не единственное число, а показывает, как реально меняются во всем ареале и генофонд, и его внешнее проявление — фенофонд (отражаемый через призму расовых признаков). И здесь мы уже мы не в столбике цифр, а своими глазами можем увидеть закономерности географической изменчивости.
Что же нам показывают карты? Удивительное сходство в пространственной изменчивости и фенофонда, и генофонда. Причём это сходство выявляется для регионов самых разных иерархических уровней.
Например, такое сходство генофонда и фенофонда, выявленное для населения Северной Евразии [Шереметьева и др., 2001], можно было ожидать: в этом ареале «встречаются» запад и восток, Европа и Азия, две большие расы — монголоидная и европеоидная. В этом бескрайнем и резко дифференцированном регионе параллелизм в географической изменчивости по оси «запад-восток» наблюдается по всем изученным типам признаков — от археологии до молекулярной генетики (раздел 9.1)
Однако когда мы перешли к рассмотрению лишь одной части этой огромной территории — к Восточной Европе, то вновь обнаружили сходство в изменчивости генофонда и фенофонда. Оказалось, что карты первых главных компонент и антропологических, и генетических признаков демонстрируют одну и ту же картину пространственной изменчивости (глава 8). В этом регионе такое совпадение уже является неожиданностью — территория Восточной Европы не столь велика и не имеет каких-либо серьёзных географических преград для распространения генов. Напротив, Восточная Европа впитала столько разновременных и разнонаправленных потоков миграций, пересекавших её вдоль и поперёк, что мы не надеялись обнаружить соответствие в изменчивости фенофонда и генофонда. Тем не менее, компьютерное картографирование выявило полный параллелизм в изменчивости антропологических и генетических признаков.
Тогда мы перешли на самый дробный уровень иерархии, к самой малой «матрёшке», и рассмотрели изменчивость в пределах лишь одного этноса Восточной Европы — русского народа (главы 4, 5, 6). И хотя русский народ считается антропологически довольно гомогенным, мы вновь обнаружили всё то же удивительное сходство в пространственной изменчивости генофонда и фенофонда. При этом основной вектор изменчивости генофонда русского народа («север<=>юг») оказался иным, чем у народов Восточной Европы в целом («запад<=>восток»). Это значит, что при переходе от средней матрёшки к малой матрёшке и генофонд, и фе-нофонд дружно сменили закономерность — но остались опять в полном согласии друг с другом: этот вектор совершенно одинаков и на картах русского генофонда, и на обеих картах фенофонда, построенных как по данным соматологии, так и по данным дерматоглифики.
Таким образом, данные компьютерной картографии обнаружили параллелизм в пространственной изменчивости антропологических и генетических признаков в регионах самых разных иерархических уровней. Эти результаты так же, как и статистические выкладки, свидетельствуют о справедливости «оптимистической» точки зрения на генетическую основу рас — их прочного генетического фундамента.
Оптимистическая точка зрения на генетическую основу расы получила разнообразные подтверждения, как для генофонда человечества в целом (большие расы), так и для отдельных регионов (малые расы). В тех редких случаях, когда расовые классификации оказываются генетически мало эффективными, встает вопрос о необходимости уточнения данной антропологической классификации, а не о том, что расы вообще лишены генетического фундамента. Иными словами, расовые классификации (антропологические типы) служат одним из эффективных инструментов — как диагностического, так и прогностического характера — при анализе генофондов.
§ 2. Миф о несостоятельности рас
Ну. это уж положительно интересно… Что же это у вас, чего ни хватишься, ничего нет!
Михаил Булгаков. «Мастер и Маргарита»Однако возникает вопрос: если всё так хорошо, если генетическое и антропологическое отражения структуры населения оказываются столь сходны, то из чего же родился миф о коренном противоречии данных генетики и антропологии? К сожалению, ответ на этот вопрос уводит нас навсегда за пределы науки — в область идеологии, мировоззренческих установок, околонаучных мифов.
Мы не случайно так подробно привели выше данные классической и всюду цитируемой работы известного (и нами очень уважаемого и любимого) генетика Р. Левонтина [Levontin, 1972] по соотношению генетической изменчивости популяций внутри рас (F1) и между расами (F2). Мы видели, что результаты его работы убедительно свидетельствуют о генетической реальности рас (F1-F2). Однако автор сделал прямо противоположный вывод: расы не имеют генетического значения. И именно на этот вывод, а не на реальные результаты его работы, предпочитают ссылаться столь многие нелюбители рас. Как можно, получив доказательства генетической реальности рас, сделать противоположный вывод? Просто «забыть» о нем и перейти на другой — не популяционный, а организменный уровень изменчивости. Сравнивать не две составляющие межпопуляционной изменчивости (F0=F1+F2), а всю межпопуляционную изменчивость F0 с внутрипопуляционной («межорганизменной»).
ВИДОВАЯ ХАРАКТЕРИСТИКА
Как это сделать? Напомним, что доля суммарных межпопуляционных различий от общей генетической изменчивости человечества (F0) составила F0≈15 %. Это означает, что для человечества примерно 15 % генетической изменчивости соответствует различиям между всеми популяциями мира, а примерно 85 % — приходится на различия между организмами[20]. Примерно такое же соотношение — 15 % и 85 % — получено многократно (см. Приложение): множеством иных авторов, для иных популяций мира, иных наборов генов (в том числе, и для ДНК маркёров) и на основе иных мер генетического разнообразия. Левонтин использовал общую Шенноновскую меру информации, но существует ряд более корректных мер, специально предназначенных для измерения генетического разнообразия. Таким образом, можно считать, что такое устойчивое соотношение -15 % и 85 % — это наша видовая характеристика. Она находится в общем ряду, характерном для других видов с половым размножением, хотя имеется и значительный разброс. Итак, это соотношение — 15 % на межпопуляционное разнообразие и 85 % на гетерозиготность индивидуумов — не имеет никакого отношения к вопросу о расе, а является видовой характеристикой человечества.
ОТРИЦАНИЕ ПОПУЛЯЦИЙ
Поскольку на различия между членами одной популяции приходится основная часть общего генетического разнообразия (85 %), а на различия между популяциями — много меньшая (15 %), то делается (совершенно верный) вывод, что принадлежность индивида к той или иной популяции лишь в незначительной степени позволяет предсказать его генотип. Однако далее на этом основании постулируется генетическая незначимость классификации индивидов на популяции вообще (в конце данного раздела мы покажем, как сама молекулярная генетика опровергла этот постулат).
При таком подходе объявляются несущественными все межпопуляционные различия (F0), то есть фактически отрицается существование отдельных популяций. Это отрицание популяций означает признание, например, панмиксии у человека в пределах всей ойкумены. Иными словами, признание несущественными межпопуляционных различий означает признание несущественными при выборе супруга и расстояния до его места жительства, и всего того, что связано с региональными особенностями населения — языком, вероисповеданием, этнической принадлежностью, особенностями традиционной культуры. Причём это признается несущественным не только сейчас, но и на протяжении всей истории человечества, в процессе которой формировались наши генетические различия. Все, что мы знаем о человеке — противоречит этому взгляду! И заодно с остальными популяциями, как их частный случай, отрицается существование рас — в качестве популяций одного из иерархических уровней.
Можно, разумеется, поставить вопрос так: если основная часть изменчивости приходится на организменный (межин-дивидуальный или даже межгеномный) уровень организации, а на популяционный уровень приходится лишь 15 % генетической изменчивости, то существуют ли популяции? (Правда, далее, следуя этой логике, непременно должен последовать вопрос, существуют ли индивиды? И на этот вопрос — следуя той же логике — придётся дать отрицательный ответ). Можно, разумеется, вопреки данным науки и здравому смыслу, считать, что популяционный уровень организации отсутствует и у человека, и у большинства видов животных. Можно, разумеется, пойти и дальше, и, например, на основании того, что межзвёздное пространство (по аналогии с межиндивидуальным) составляет основную часть Вселенной, считать существование галактик и звёздных систем несущественной деталью Вселенной. А отличия черных дыр от голубых гигантов, красных карликов от сверхновых звезд и скромных планет, вроде нашей Земли — по той же аналогии с генетическими различиями между популяциями — принять незначительными и неважными по сравнению с всепоглощающей пустотой межзвёздного пространства. Такой агностицизм и в генетике, и в астрономии (и в существовании самого индивида-отрицателя) — дело вкуса, установок и мировоззрения, он выходит за рамки чистой науки, и потому научные контраргументы здесь неуместны и бессмысленны.
ОТРИЦАНИЕ РАС
Но что уже не вненаучно, а антинаучно, и на что ученый не имеет права в такой печальной ситуации — это делать вывод об отсутствии не всех типов популяций (во всем бесконечном множестве их проявлений), а об отсутствии только лишь одних рас (самом болезненном и идеологически значимом типе популяций). И всё же осуществляется именно такая подмена — отсутствие популяционного уровня как такового если и звучит, то между строками. А в те выводы, которые затем широко цитируются научной и ненаучной общественностью, выносится отсутствие одних лишь рас. Потому что отрицать существование рас — престижно и конъюнктурно, а отрицать, например, существование народов — не всегда безопасно, и не всегда будет одобрено широкими массами, всё еще считающими себя принадлежащими к реально существующим народам (и часто очень настойчивыми методами требующими, чтобы их таковыми народами признавали и другие).
Мы привели в пример лишь одну работу. Но при помощи именно такой подмены научные работы, в которых все основные результаты доказывают генетическую реальность существования рас (F1≈F2 и даже F1<F2), используются для обоснования идеологической позиции отсутствия рас. И далее цитируются в целой лавине научных и околонаучных публикаций со столь популярной и всепобеждающей ссылкой «на генетику».
Осмелимся высказать свой взгляд на отношение самого Р. Левонтина к этому вопросу. Насколько мы можем судить, он имел в виду лишь то, что расы не очень важны при генетической классификации индивидов и что принадлежность человека к расе еще не определяет однозначно его генотип. Он использовал расы (а не скажем, лингвистические классификации или шаманские бубны), потому что в его стране это были самые наглядные и знакомые из популяций. На их примере было проще показать, что многообразие индивидов в популяции столь велико, что, зная популяцию, нельзя однозначно указать генотип принадлежащего к этой популяции человека. А уже околонаука проделала все дальнейшие шаги, сделав вывод о «несуществовании» рас. И увела нас от науки.
«РОДОСЛОВНЫЕ» ДРЕВА ПОПУЛЯЦИЙ
Не менее печальные подмены или умолчания делаются при сравнении расовых классификаций и «родословных» деревьев популяций, построенных по данным генетики. Когда такие «генетические и родословные деревья» сравниваются с расовыми классификациями, всё внимание уделяется обнаруживаемым расхождениям, совпадения игнорируются и делается вывод о «генетической несостоятельности концепции расы». Когда, например, те же «генетические деревья» сравниваются с лингвистическими классификациями (в генетике принято на них полагаться), то внимание акцентируется на сходстве, а не на различиях, которых и здесь немало. Но непродуктивность таких сравнений лежит глубже субъективной интерпретации. Беда в том, что любое «генетическое древо» здесь безоговорочно принимается как критерий истины, как воспроизведение истинного древа происхождения и родства популяций. Как «древо генезиса», а не как очередная гипотеза генетики. В то время как на самом деле любое «генетическое древо» — лишь текущий, рабочий результат генетики, который, как любой результат науки, зависит и от несовершенства наших знаний, и от особенностей объекта — генофонда популяций.
Авторов такого рода критических разборов не смущает, что если мы будем столь же прямолинейно, как при сравнении с расами, анализировать сами «генетические деревья» (даже самые известные, например, [Cavalli-Sforza et al., 1994, стр. 268]), то обнаружим длинный ряд аномалий: саамы соседствуют с сардинцами, баски с исландцами, русские с шотландцами, а чехи с норвежцами. И мы должны бы тогда сделать вывод о несостоятельности самой генетики — или уж не отрицать и расы. Увы, подобные аномалии на генетических деревьях, находящиеся в противоречии со всей совокупностью данных об этногенезе этих народов, не мешают заинтересованным авторам принимать такие генетические деревья в качестве эталонов при критике расовых классификаций. Остается лишь констатировать, что генетические деревья не могут служить объективным научным критерием для проверки любых классификаций. И если мы намерены оставаться в рамках науки, нам следует привести иные аргументы.
Но самое печальное, когда в одних и тех же работах для доказательства пессимистического подхода создается «генетическая химера» — объединяются два несовместимых типа аргументации: и соотношение внутригрупповой/межгрупповой изменчивости (где критика рас целиком построена на отрицании существования у человека популяционного уровня организации); и «родословные» деревья (целиком построенные на анализе именно популяционного уровня организации). Такая «всеядность» более всего и свидетельствует об отсутствии научного подхода к анализу генетического фундамента расы, об адаптации к общественному климату, когда «всяко лыко в строку», когда поиск научной истины подменяется направленным (сознательным и бессознательным) подбором даже в принципе противоречивых фактов и ссылками на авторитет модной науки.
§ 3. Генетические свидетельства
Трудно сказать, что именно подвело Ивана Николаевича — изобразительная ли сила его таланта или полное незнакомство с вопросом, по которому он собирался писать, — но Иисус в его изображении получился ну совершенно как живой, хотя и не привлекающий к себе персонаж. Берлиоз же хотел доказать поэту, что главное не в том, каков был Иисус, плох ли, хорош ли, а в том что Иисуса-то этого, как личности, вовсе не существовало на свете и что все рассказы о нем — простые выдумки, самый обыкновенный миф.
Михаил Булгаков. «Мастер и Маргарита».В заключение, чтобы не утомлять читателя разбором множества работ, приведём лишь одну из статей по молекулярной генетике человека [Wilson et al., 2001]. Её мы не выбирали — она сама случайно попалась на глаза как раз тогда, когда предыдущая часть текста уже была написана. Её выводы — отрицают генетические основы расы, в то время как сами результаты — однозначно и очень любопытно свидетельствуют о противоположном. Такие свидетельства, как и рассмотренная выше работа Р. Левонтина, чрезвычайно ценны. Мы могли бы с недоверием отнестись к аргументации сторонников генетической основы рас. Однако когда противники генетической основы рас, вопреки собственной идеологической позиции, приводят стройные доказательства существования такого генетического фундамента расы, то таким доказательствам можно смело доверять.
В этой статье [Wilson et al., 2001] анализируется связь между «географическими типами генетической изменчивости» и реакцией на лекарства. В ней сравнивается расовая классификация и генетическая классификация «искусственных популяций» — генетических кластеров, объединяющих изученных индивидуумов в соответствии только с их генотипами (по ферментам метаболизма лекарств). Авторы приходят к основному выводу, что «общепринятые этнические метки» (под которыми подразумеваются большие расы!) «недостаточны и не точно отражают выявленные генетические кластеры» [Wilson et al., 2001].
Что же получено на самом деле?
ИСХОДНЫЕ ДАННЫЕ И КЛАССИФИКАЦИИ
По 39 генам (39 микросателлитным локусам первой и X хромосомы) изучены 354 индивида, представляющие 8 популяций мира — банту (Южная Африка), эфиопы (из Аддис-Абебы), евреи-ашкенази, армяне, норвежцы, китайцы, папуасы Новой Гвинеи и «афро-карибы», привезенные в Лондон. Под «традиционными этническими метками» — увы! — подразумеваются вовсе не этносы, а три большие расы: 1) негроиды — к которым, по странному мнению авторов, почему-то относятся не только банту и «афро-карибы», но и эфиопы! (что противоречит всем расовым классификациям); 2) европеоиды — норвежцы, евреи-ашкенази, армяне; 3) монголоиды — к которым, по еще более странному мнению авторов, кроме китайцев, относятся и папуасы Новой Гвинеи! (это вновь противоречит всем расовым классификациям).
МЕТОД
Сначала полученные генотипы всех индивидов были объединены в общую — полностью смешанную — группу. А затем был применён следующий чисто статистический подход: на основании только генотипов этих индивидов, при полном игнорировании их истинной популяционной принадлежности, «вслепую» были сформированы генетические кластеры — «искусственные популяции». И только после этого как бы заглядывали в реальное происхождение индивидов — рассматривали, какова истинная этническая, географическая и расовая («этнические метки») принадлежность индивидов, попавших в один и тот же генетический кластер? То есть сравнивали, совпадают ли «искусственная» и реальная популяции.
РЕЗУЛЬТАТЫ
В результате выделились четыре генетических кластера, по которым распределились все индивиды на основании их личных генотипов. Сравнение генетического сходства индивидов и их происхождения выявило такую картину.
Четыре генетических кластера по происхождению индивидов, в них попавших, примерно соответствовали четырем географическим регионам. Поэтому кластерам индивидов дали соответствующие географические названия — «Западная Евразия», «Африка южнее Сахары» (в дальнейшем для краткости — «Африка»), «Китай» и «Новая Гвинея» [Wilson et al., 2001]. При этом 62 % эфиопов попали в кластер «Западная Евразия», в который вошли евреи, армяне и норвежцы. И только 24 % эфиопов, как и следовало ожидать из «правильной» расовой классификации, расположились в кластере «Африка» вместе с банту и большинством «афро-карибов». Из этого авторы делают совершенно справедливый вывод, что «помещение эфиопов в разряд негроидов неверно отражает генетическую структуру»… Наконец, (цитируем): «китайцы и новые гвинейцы почти все расположены в отдельных кластерах, что указывает на то, что этническая метка «азиаты» или «монголоиды» не точно описывает их популяционную структуру» [Wilsonetal., 2001]. Авторы этой статьи и не подозревают, что под этим заявлением с чувством глубокого удовлетворения подпишется любой антрополог.
СРАВНЕНИЕ РАС И ГЕНЕТИЧЕСКИХ КЛАСТЕРОВ
Мы специально так подробно изложили полученные результаты, что к ним просто нечего добавить — у любого, даже поверхностно знакомого с классификациями рас человека, вызывает изумление, как удивительно точно столь малочисленные и не совсем корректные исходные данные соответствуют расовым классификациям! Возьмём, к примеру, одну из наиболее общепризнанных классификаций — Виктора Валерьяновича Бунака [Бунак, 1980], (смрис. 9.3.2. в главе 9).
Эфиопы, которые всеми рассматриваются как промежуточная раса между типичными европеоидами и негроидами, входят в кушитскую ветвь западного ствола классификации В. В. Бунака. То есть они относятся к европеоидам (кластер «Западная Евразия» по [Wilson et al., 2001]), тяготея при этом к африканской ветви тропического ствола (кластер «Африка»). Такое положение эфиопов в расовой классификации В. В. Бунака полностью подтверждено авторами статьи, где основная часть «эфиопских» генов (62 %) вошла в кластер «Западной Евразии», а меньшая часть (24 %) — в кластер «Африки».
Новая Гвинея. Столь же полное соответствие генетической [Wilsonetal.,2001] и расовой классификаций обнаружилось и для коренного населения Новой Гвинеи. Новая Гвинея, второй после Гренландии по величине остров Земли, является крупнейшей частью Меланезии — «Черных островов». При этом названии сразу всплывает в памяти, что её население, представленное меланезийской и папуасской расами, разными авторами может сближаться с австралоидами или же с негроидами, но никогда никем не относилось к монголоидам и тем более к «азиатам», как пишут авторы рассматриваемой статьи [Wilsonetal.,2001]. В. В. Бунак [Бунак, 1980] относит обе эти расы Новой Гвинеи (меланезийскую и папуасскую) к океанийской ветви тропического ствола, которая в расовом отношении чрезвычайно удалена от монголоидов (составляющих восточный ствол по В. В. Бунаку). Таким образом, выделение генотипов населения Новой Гвинеи в самостоятельный кластер, не имеющий отношения к китайцам, полностью соответствует любым расовым классификациям.
«Афро-карибы Лондона». Здесь можно лишь удивляться, что, несмотря на столь причудливый путь миграций, они полностью сохранили генетический образ своей исторической прародины, и практически полностью вошли в кластер «Африки»: всего лишь 1 % «афро-карибов Лондона» располагается в кластере Западной Евразии!
Остальные группы. Если бы провести эксперимент и предложить любому исследователю, даже поверхностно знакомому с расовыми классификациями, разместить изученных индивидов в соответствии с представлениями расоведов по четырем кластерам, он бы подразделил именно так, как описывают авторы статьи (лишь «афро-карибы» вызвали бы затруднение, поскольку нельзя предсказать, каков был поток инородных генов на их пути из Африки в Лондон).
Однако даже при таком изумляющем соответствии полученных генетических результатов и расовой классификации сделан прямо противоположный вывод: о несостоятельности расовой классификации [Wilson et al., 2001]! Скорее всего, лишь потому, что авторы статьи просто не знали ни одной классификации рас, но вот о том, что рас нет — были наслышаны. Но к науке эти выводы уже никакого отношения не имеют.
НАШИ ВЫВОДЫ
Подводя итог, можно сформулировать четыре принципиальных вывода из анализа рассмотренной статьи [Wilson etal., 2001].
Во-первых, вопреки собственной идеологической позиции авторы выявили полное соответствие данных молекулярной генетики и расовой классификации (методами объективной кластеризации индивидов).
Во-вторых, такое полное соответствие расовой классификации получено не по популяционным данным, а по индивидуальным (кластеризовались конкретные гены индивидов, каждый из которых получен от одного из родителей). Этот вывод является важнейшим аргументом против сторонников «пессимистического взгляда» на генетическую основу расы. Напомним, что Р. Левонтиным и целым рядом его последователей на основании видового соотношения индивидуальной (85 %) и межпопуляционной изменчивости (15 %) делается вывод о том, что индивидуальная генетическая изменчивость многократно перекроет все расовые различия. Иными словами — «из-за индивидов расы не видно». И потому рас нет. Мы видим, что независимая проверка этого вывода, проведённая именно на индивидуальном уровне и сторонниками той же идеологической позиции, дала результаты, этот вывод полностью опровергающие: из-за индивидов поразительно точно различались расы. Это означает, что расы генетически значимы даже при анализе индивидуального геномного разнообразия.
В-третьих, результаты работы [Wilson et al., 2001] показали, что в выделенных кластерах достоверно различается реакция на лекарства. Это означает, что данные, накопленные этнической антропологией и воплощённые в расовых классификациях, могут лечь в основу стратегии лекарственного лечения в различных популяциях человека.
В-четвертых, как мы ярко видели на примере данной работы, критика генетических основ расы вызвана простым невежеством в антропологии. Но в этом невежестве ни в коем случае мы не хотим винить авторов работы: в атмосфере замалчивания антропологических знаний научный подход заменяется случайно всплывающими представлениями и бытовыми мифами (расы — «этнические метки», папуасы — монголоиды, и т. д.), и любая критика концепции расы (а в действительности — собственных мифов) обеспечивает заведомое согласие и одобрение читателя.
Таким образом, в заключение можно сделать еще один вывод: широко распространившееся мнение о том, что генетика (и особенно молекулярная генетика) дала важные контраргументы против расовых классификаций, является не более чем мифом («простые выдумки, самый обыкновенный миф» по словам М. А. Булгакова, приведённым в эпиграфе).
Эти «контраргументы» связаны либо с крайне субъективной «изобразительной силой таланта» интерпретаторов, либо с «полным незнакомством с вопросом» (см. эпиграф). Несмотря на это молекулярная генетика ясно и убедительно говорит, что расы — «ну совершенно как живые персонажи» (эпиграф), но давление мифов всё равно заставляет авторов утверждать обратное — что расы «вовсе не существовали на свете» (эпиграф). Мы позволили себе такую подробную аналогию с нашим эпиграфом в надежде, что сила таланта Михаила Александровича поможет увидеть всю нелепость «генетического несуществования расы». А также и то, что «самым обыкновенным мифом» является не «миф» о существовании рас, а напротив — столь распространённый сейчас миф об их несуществовании.
Мы видели на примере рассмотренной статьи, как расовой классификации приписаны категории, ей не свойственные (расы — «этнические метки», папуасы — монголоиды, эфиопы — негроиды) и на этом основании критикуется концепция расы, но не собственное незнание. Аналогичная ситуация происходит с целым рядом категорий, которые сначала приписываются расе, затем успешно опровергаются. Жаль лишь, что вместе с выдуманными категориями отвергаются и расы. Вряд ли стоит упоминать все такие упреки расоведению — к ним относятся и постулирование четких границ между расами (хотя расоведением всегда выделялись переходные расы и типы, но генетика предпочитает считать это собственным открытием, почему-то опровергающим расоведение); и отсутствие консенсуса в числе рас (классификации лингвистики и других наук заслуживают на этой же почве более сурового упрека) — примеры можно было бы умножить ad nauseam[21].
Обе эти причины — и субъективность интерпретации, и мифические представления о критикуемом предмете — вызваны к жизни адаптацией к тому научному климату, в котором любое отрицание расы обеспечивает успех. Однако в таких условиях обращение к науке просто излишне. И генетика не является исключением — накопленные ею факты и закономерности указывают, что путь сотрудничества этнической антропологии и генетики является чрезвычайно плодотворным научным путем. Но лишь до тех пор, пока ученые верны науке, а не мифам.
Возвращаясь к началу главы — истории взаимоотношений антропологии и генетики — добавим лишь, что если во времена «лысенковщины» антропологам приходилось открещиваться от генетики и тем самым наносить урон фундаментальной базе своей науки, то примерно к тем же печальным последствиям для генетики мог бы привести её отказ от достижений антропологии.
2.3. ПРАПАМЯТЬ РУССКОГО ГЕНОФОНДА
§ 1. Потерянные предки: Синтез антропологии и генетики — Славянская колонизация Финно-угорской равнины — Где же славяне? — Геногеография выходит на поиски
§ 2. Геногеографические следы летописных славян: Антропологические карты — Два масштаба — Хитросплетённая скрижаль — Обобщая, упрощай! — Особый восток, типичный центр, особый запад — Смена масштабов и финно-угорский восток — Смешанный центр — Славянский запад? — Славянские племена на антропологической карте — Каждому племени по ядру — Новая Древняя Русь — Зона смешений — «Чистых» генофондов нет — К счастью
§ 3. Через пространство — вглубь времён: Историческая геногеография — Старые ручные карты — И новые электронные карты — Незабытое старое — Как Восточно-европейская равнина стала Русской равниной — Какой у карты масштаб, такая на ней и эпоха — Стабильность генофондов — Союз генетики и антропологии
География по отношению к человеку есть не что иное, как История в пространстве, подобно тому, как История является Географией во времени
Элизе РеклюПосвятив целую главу «взаимоотношениям» генетики и антропологии, мы не можем обойти вниманием самую первую попытку восстановления их союза, которую осуществила геногеография — попытку реконструкции «прапамяти», той генетической летописи, которую ведет и хранит русский генофонд.
Эта работа, осуществлённая более 20 лет назад, знаменательна уже тем, что была вообще первым шагом отечественной геногеографии. Она и была задумана именно так: проверить на данных антропологии, насколько эффективны создаваемые нами геногеографические технологии. В этой работе исходные данные — принадлежат антропологии, а подход, методы, сам стиль мышления — генетические, точнее геногеографические.
В отличие от генетики, данные по антропологии собраны для очень широкого круга популяций и — что особенно важно! — во всех популяциях по единой (или близкой, поддающейся коннексии) программе. А русский народ антропологически изучен наиболее детально. Русская антропологическая экспедиция, осуществлённая Виктором Валерьяновичем Бунаком, Татьяной Ивановной Алексеевой и их коллегами в 50е годы, до сих пор служит образцом и планирования, и проведения антропологического исследования. Поэтому проверка геногеографических технологий именно на модели русского народа была решающей: если геногеография сумеет привнести что-либо новое в описание столь прекрасно изученного народа, то у геногеографии есть будущее.
К счастью для геногеографии, такая проверка себя более чем оправдала. Наиболее подробно результаты были давно изложены в небольшой книжке Е. В. Балановской, Ю. Г. Рычкова «Геногеография (гены человека на карте СССР)» [1990]. Мы решили эти результаты в данной книге привести в исходном варианте, сохранив даже карты, построенные вручную и потребовавшие почти каторжного труда. Мы надеялись, что такое изложение сохранит некий дух времени и создаст историческую ретроспективу геногеографии. Но главное — нам хотелось сохранить память о Юрии Григорьевиче Рычкове, который мечтал о создании геногеографической технологии и геногеографического Атласа задолго до наших с ним совместных работ. И задача геногеографии ставилась им именно так, как она реализована теперь — геногеографические карты должны стать не иллюстрацией, а объективным инструментом статистического анализа генофонда. Мы старались, чтобы вопреки вынужденным сокращениям и дополнениям, сохранился строй размышлений и стиль изложения именно той первой геногеографической работы. Недавно мы провели анализ тех же данных методами современной компьютерной геногеографии. Эти результаты, подтвердившие правильность прежних выводов, приведены в конце данного раздела и главе 4.
§ 1. Потерянные предки
Мелькающее отраженье потерянного навсегда
Н. Гумилев. «Прапамять»Приступая к первой попытке синтеза геногеографии и антропологии, пробуя извлечь историческую информацию методами геногеографии, мы понимали, что очень важно (как и в случае генохронологии — см. Приложение) иметь контрольные исторические данные. Среди народов России история русского народа — одна из наиболее документированных не только летописными материалами, но и результатами археологических исследований, данными иных гуманитарных и биологических наук, включая антропологию.
Вся совокупность летописных и исследовательских данных указывает на то, что в позднем средневековье происходил процесс славянской колонизации обширной Восточно-Европейской равнины. В то время она не была заселена славяноязычными племенами: финская, балтская, возможно, иранская и тюркская речь звучала на этих пространствах. Антропология со своей стороны подтверждает это тем, что и в современном русском населении отчётливы черты так называемых «субстратных» антропологических типов. Основным из них является «финно-угорский субстратный пласт», то есть антропологический тип дославянского населения, говорившего на финно-угорских языках.
Говорить о некой исконной чистоте русского антропологического типа и исходной однородности русского генофонда — как, впрочем, и генофонда любого другого народа — не приходится. Заметим, что этот вывод был сделан (и с тех пор многократно подтверждён) еще в 80-х годах XIX века профессором Московского университета Н. Ю. Зографом. Именно Н. Ю. Зограф первым показал, что «классические великороссы» во Владимирской, Ярославской, Костромской губерниях несут в своем физическом облике отчётливые черты финно-угорского происхождения.
Но вот загадка. Идя таким путем, антропология может выделить в составе русского населения и финно-угорский, и балтский, и иные субстратные пласты. Однако, увы, антропология не может обнаружить сам «суперстрат» — тот собственно славянский антропологический тип, который включил в себя все до-славянские субстраты. Даже в бесспорно славянских курганных могильниках[22], исследованных археологами на тех территориях, где летописи помещают средневековые племена вятичей, кривичей, радимичей, северян, новгородских словен и других летописных славян, антропологическими методами выявляются лишь досла-вянские черты древнего населения. Антропология как бы тоньше улавливает субстратные структуры, чем этнография и археология. Но это её отличие и привело к представлениям об ограниченности возможностей антропологии в реконструкции истории средневековых славян.
Разлад между археологией и антропологией русского народа получил даже некоторое теоретическое объяснение: «…племенное деление восточного славянства, детально изученное археологами, не нашло какого-либо соответствия в антропологической дифференциации славянского населения эпохи раннего средневековья. Антропологическая карта Восточной Европы X–XIV вв. оказалась весьма отличной от синхронной археологической, что с исторической точки зрения представляется вполне оправданным. Племенное деление восточного славянства сложилось только во второй половине I тысячелетия новой эры и было результатом широкого расселения славян и отчасти их взаимодействия с местным населением. В отличие от материальной культуры антропологическое строение не подвержено быстрым изменениям. Истоки антропологического членения восточного славянства относятся к более древней поре и во многом зависят от антропологии субстратного населения, вошедшего в состав славянства. Поэтому палеоантропология славян не может быть прямо связана с основными проблемами настоящего исследования» [Седов, 1982, с.7].
Сложилась парадоксальная ситуация. Славянская колонизация Русской равнины — неоспоримый факт. Но в антропологии русского населения улавливаются главным образом черты самых разных субстратных групп дославянского населения. Однако геногеография решила попробовать выяснить: действительно ли антропологический состав, а, следовательно, и генофонд русского народа, не согласуются с летописями и археологическими данными об истории сложения этого народа? И геногеография отправилась на поиск потерянных предков-славян.
Шансы найти следы летописных славян в материале, столь детально изученном антропологами, были крайне малы. Отрицательный результат поиска потерянных славянских предков с помощью геногеографии подтверждал бы правильность прежних выводов антропологии. Он указывал бы на то, что гены летописных славян не дошли до современности в виде целостных, стабильно воспроизводящихся структур генофонда и распылены в нем в результате бесконечного смешения народов, происходившего на Русской равнине за прошедшее тысячелетие.
Ведь археологи, проводя раскопки славянских могильников, не могут утверждать, что погребённые в них славяне имеют своих потомков в современном русском населении. Археологическими и палеоантропологическими методами на самом деле регистрируется лишь факт существования в прошлом группы людей, о которых неизвестно, дошла ли долгая цепь их потомков до наших дней или утрачена навсегда, осталась тупиковой ветвью без отголоска в современности.
На вопрос Федора Ивановича Тютчева:
«От жизни той, что бушевала здесь, От крови той, что здесь рекой лилась, Что уцелело, что дошло до нас?»археология может дать лишь всё тот же тютчевский ответ:
«…Два-три кургана, видимых поднесь… Да два-три дуба выросли на них, Раскинувшись и широко и смело. Красуются, шумят, — и нет им дела, Чей прах, чью память роют корни их. Природа знать не знает о былом, Ей чужды наши призрачные годы, И перед ней мы смутно сознаём Себя самих — лишь грезою природы. Поочередно всех своих детей, Свершающих свой подвиг бесполезный, Она равно приветствует своей Всепоглощающей и миротворной бездной»Но генохронология (см. Приложение) показывает, что человеческой природе наши «призрачные годы» чужды не совсем. Человеческая природа несет их в себе, хранит их в «генетической летописи» с такой надёжностью, которая пока недоступна изобретённым человеком способам хранения информации о его долгой истории. И это дало некоторую надежду на успешность поиска. Так что же может ответить на вопрос о потерянных предках геногеография?
§ 2. Геногеографические следы летописных славян
География признается как хранительница специфической древней субкультуры, озабоченной пространством.
Б. Б. РодоманГеногеография, восстанавливая летопись событий, хранящуюся в географии современных антропологических типов, использовала нехитрые приёмы. Рассмотрим их.
МАТЕРИАЛЫ. МЕТОДЫ. ПОДХОДЫ
ОТ «ДИСКРЕТНЫХ» КАРТ — К «НЕПРЕРЫВНЫМ». Сразу оговорим необычность ситуации: первоисточником для нашего исследования послужили не первичные данные (значения антропологических признаков в русских популяциях), а сами карты антропологических признаков, составленные В. В. Бунаком для русского народа (33 признака) и Т. И. Алексеевой — для всех народов Восточной Европы (13 признаков) [Происхождение и этническая история…, 1965]. То, что построенные ими карты послужили для нас первоисточником, не только избавляло нас от возможной неточности в соотнесении первичных данных с местностью, но главное — сохраняло в неизменном виде всю картографическую информацию наших предшественников. Это обеспечило строгость эксперимента по проверке информативности нового геногеографического метода.
Из всего перечня картографированных ими признаков (33 признака для русских и 13 признаков для народов Восточной Европы) лишь 8 признаков удовлетворяли одновременно двум условиям: эти признаки были относительно независимы друг от друга и позволяли напрямую сопоставить «русские» карты В. В. Бунака с «восточноевропейскими» картами Т. И. Алексеевой. Для этих восьми признаков мы и построили новые карты методами геногеографии.
Подчеркнём, что построенные нами карты отличаются от оригинальных карт В. В. Бунака и Т. И. Алексеевой только лишь методом построения и полностью сохраняют все первичные данные, приведённые этими авторами на картах [Происхождение и этническая история…, 1965]. В отличие от дискретного метода картографирования («значковые» карты В. В. Бунака и Т. И. Алексеевой) мы использовали метод непрерывного картографирования (интерполяционные карты — см. Приложение).
Для плотно заселённой Восточной Европы наиболее подходит именно непрерывное картографирование: для нее свойственен интенсивный обмен генами как в пределах одного народа, так и между ними. «Хотя расселение дискретно, освоение человеком пространства непрерывно» [Дюшмен, 1983]. Границы между европейскими популяциями были проницаемы и в древности, судя по данным и археологии [Седов, 1982, 1994], и генетики [Рычков, Ящук (Балановская), 1983].
ДВЕ СЕРИИ КАРТ. Итак, методами геногеографии картографировались восемь ведущих расоводиагностических признаков: цвет глаз, рост бороды, процент вогнутых спинок носа, горизонтальная профилировка лица, скуловой диаметр, носовой указатель, головной указатель, длина тела.
По данным о восьми признаках были построены две серии карт:
1) «русская серия» — в масштабе антропологической изменчивости русского народа и в пределах его «исконного» исторического ареала;
2) «восточноевропейская серия» — в масштабе размаха антропологической изменчивости народов Восточной Европы и в пределах их суммарного ареала.
На картах первой серии учтены только русские популяции, на картах второй серии — популяции, принадлежащие к разным народам Восточной Европы, включая и русских.
«СМЕНА МАСШТАБОВ». В дальнейшем анализе эти серии карт использовались при реализации важного принципа геногеографии — «масштабирования» генетического ландшафта. Предполагается, что особенности генофонда, связанные с историческим «саморазвитием» этноса, могут быть выявлены при «внутриэтническом» масштабе (первая серия карт — «русская»). Особенности же генофонда, воспринятые народом от его предшественников на данной территории или при контактах с окружающими народами, можно выявить при «надэтническом» масштабе с охватом генофонда всего того ареала, на сцене которого происходили все интересующие нас события этногенеза (вторая серия карт — «восточноевропейская»). Предполагается, что «смена масштабов» — сравнение карт двух генетических масштабов — позволяет отделить первое от второго и ответить на вопросы: образованы ли данные структурообразующие элементы генетического ландшафта данного народа его собственной историей? Или же они унаследованы от «доисторического» прошлого этого народа? Или же получены от соседних народов?
ИНТЕРПОЛЯЦИЯ. Подробно интерполяционная процедура описана в [Рычков, Балановская, 1988]. С формальной точки зрения, применённый метод линейной интерполяции является картографическим вариантом простейших методов сглаживания кривой. Значения признака рассчитывались в точках, находившихся в узлах равномерной сетки. Густота такой сети задаётся в соответствии с задачами исследования: увеличивая её, мы выявляем новые детали карты. Поэтому для каждой восточноевропейской карты были проведены два варианта картографирования — с сеткой, состоящей из 88 узлов, и с сеткой из 176 ячеек. Для каждой карты русского народа интерполированные значения признака заносились в «мелкоячеистую» сеть с 364 узлами, чтобы обеспечить точность карты. В точках карты, промежуточных между изученными популяциями, признак принимает промежуточные значения. Этого достаточно, чтобы в любой географической точке вычислить интерполированное значение признака, определить географическое положение границ между смежными классовыми интервалами и передать характер и направление этих интервальных границ с помощью горизонталей (то есть линий, соединяющих одинаковые — в пределах данного интервала — значения признака). Таким образом, каждый изгиб горизонталей является результатом расчёта, а не предположения.
ОТКЛОНЕНИЕ ОТ СРЕДНЕЙ — ПО ЧИСЛУ ИНТЕРВАЛОВ. Интервал, вмещающий среднее значение, обозначался как нулевой (интервал 0). Интервалы со значениями выше среднего — брались со знаком «плюс» (+1, +2, +3, +4). А интервалы со значениями ниже среднего брались со знаком «минус» (-1, -2, -3, -4). Каждое число означает как бы еще один «шаг» удаленности от среднего значения. Например, если на «русской» карте указано «+2», это означает, что значение признака в этой точке на два «шага» (два интервала) выше среднего значения данного признака для русского народа, а если указано «-4», то значит на 4 «шага» удалено от среднего значения в меньшую сторону. Такое «картографирование по отклонению от средней» не просто удобно. Оно обеспечивает унификацию карт разных признаков, из которых одни представляют измерительные признаки, другие — балловые. Оно позволяет легко сопоставлять любые карты друг с другом по важнейшей характеристике: насколько далеко значение в данной точке уклонилось от средних значений признака.
ОБОБЩЕНИЕ КАРТ. Признаков много, а их значительная независимость друг от друга оборачивается тем, что построенные нами карты этих признаков также оказываются независимыми и отличными друг от друга. А это значит, что необходим метод, который бы позволил трансформировать множество карт в одну-единственную — называемую «синтетической», «интегральной», но, проще говоря — обобщённую.
Признаемся, метод создания обобщённых геногеографических карт возник вовсе не в результате, как можно было бы ожидать, углубленного академического размышления. Нет, он родился, попросту говоря, от некоторой растерянности, которая возникает при взгляде на построенные нами карты отдельных признаков. Пример их приведён на рис. 2.3.1, и читатель легко представит себе отчаяние исследователей, если учесть, что таких карт множество и ни одна из них не повторяет другую. Для хитросплетений хода горизонталей — интервальных линий, отражающих изменчивость признаков по территории исторического расселения русских — может быть, несомненно, множество истолкований. И все они будут субъективны! Поэтому, если верить, что на этих скрижалях записана история сложения русского народа, то следовало найти картографический метод, которым эта историческая запись читалась бы более отчётливо. Надо было свести всё необозримое разнообразие таких карт к его первопричине — некой общей закономерности, основе, каркасу, архитектонике, несущей конструкции, «общей модели» — присутствующей на всех картах признаков в скрытом виде, но явно проявляющей себя, как мы надеялись, на обобщённой карте (рис. 2.3.2.).
Рис. 2.3.1. Картографирование одного из антропологических признаков в историческом ареале русского народа.
Рис. 2.3.2. Обобщённая карта антропологического состава русского населения.
Заштрихованная территория (7) соответствует восточным границам Древнерусского государства с IX по XI век и разделяет этнический ареал русских на западную, центральную и восточную зоны: 1 — ядерные структуры с указанием географических границ и интенсивности выраженности антропологического комплекса; 2 — области наибольшей нивелировки локальных особенностей и приближения к общерусскому антропологическому типу; 3 — следы новгородско-словенской ядерной структуры; 4 — восточная граница Руси в конце IX века; 5 — восточная граница Руси в X веке; 6 — восточная граница Руси в XI веке; 7 — область продвижения Руси на восток в период IX–XI вв. I–XIV — нумерация ядерных структур.
Чтобы открыть эту «общую модель», надо было перейти от множества карт отдельных признаков к единой обобщённой. Только на такой карте антропологические признаки, с которых снята вуаль биологической конкретности, обнаруживают свое историческое лицо.
ЧТЕНИЕ ОБОБЩЁННЫХ КАРТ. На «русских» обобщённых картах интервал «О» означает нулевое расстояние до средних характеристик русского народа, то есть очень близкие к «среднерусским» значениям признака. Это значит, что нулевой интервал на обобщённых картах, окрашенный в самые светлые тона, выявляет территории, близкие по комплексу всех признаков к средней характеристике русского народа. А отклонения от средней как бы взяты по абсолютной величине, и поэтому они выявляют, на сколько баллов отличаются эти территории от «среднего» русского антропологического типа.
Для серии «восточноевропейских» карт, соответственно, нулевой интервал выявляет территории, близкие к средней характеристике восточноевропейского региона.
Отсчёт от нуля удобен — чем больше значение интервалов, тем на большее число «шагов» данная популяция-узел отличается от среднего типа, тем более она своеобразна. Иными словами, обобщённые карты выявляют территории, население которых с неодинаковой полнотой воспроизводит средние антропологические характеристики этноса.
Обобщённые карты передают степень антропологического своеобразия различных групп населения по отношению к средним показателям: либо восточноевропейским, либо русским.
При прочтении карт удобно ориентироваться на средний уровень этого своеобразия (для всех карт это интервал 2). Тогда области, занятые меньшими значениями (интервалы <2) — это области наименее антропологически своеобразные, так сказать «средние»: население этих территорий очень похоже на «среднюю популяцию» изучаемого региона. Такие области минимальных отличий от среднего типа, будут дальше обозначаться как «долины», «котловины» и «впадины» рельефа. Соответственно области со своеобразием выше среднего (интервал >2) далее обозначаются как «возвышенности», «нагорья», «поднятия», «плато», «горные системы» с их вершинами. Население этих территорий очень своеобразно, непохоже на «среднюю популяцию». В антропологическом отношении области наибольшего своеобразия, называемые нами как «ядра» или «ядерные структуры», по существу указывают на области распространения того или иного антропологического типа — своеобразного, имеющего свои особенности, которые и делают его отличным от «среднего» типа.
ГЕНОГЕОГРАФИЧЕСКИЙ ЛАНДШАФТ
На обобщённой карте русского народа (рис. 2.3.2.) всё множество горизонталей предшествующих исходных карт отдельных признаков свернулось в ограниченное число замкнутых контуров. И чтобы понять смысл этих фигур, расположившихся в разных частях исторического ареала русского народа, надо иметь в виду только одно — на карте оконтурены различные степени отклонения местного населения от современного «среднерусского» антропологического типа.
«СРЕДНЕРУССКАЯ ДОЛИНА» ЛАНДШАФТА.
Здесь и далее термин «среднерусский» означает некий общий усреднённый антропологический портрет, а не географическое положение в середине русского ареала. Можно сказать, что он воплощает черты облика некоего «среднего» русского человека — средний рост, средняя профилировка лица, средний рост бороды, наиболее распространённый цвет глаз и волос, средние соотношения в форме носа и головы, средний процент курносых. Где же этот «среднерусский» тип более всего выражен? Местам сосредоточения этого «среднерусского» типа должны соответствовать некие «котловины» — впадины и долины антропологического ландшафта, то есть территории с наименьшими отклонениями от среднерусского антропологического типа. Карта выявляет, что ряд таких котловин, отражающих «среднерусский» тип, протянулся цепочкой с севера на юг, разделяя ареал на практически равные западную и восточную части. Это что-то вроде рифтовой долины, делящей «русский материк» на две части. К западу и к востоку от рифтовой зоны четко обозначились большие и малые районы «возвышенностей» ландшафта карты — выраженных отличий от «среднерусского» антропологического типа.
ВОСТОЧНО-РУССКИЕ «ВОЗВЫШЕННОСТИ» ЛАНДШАФТА. Природа этих отличий в восточной части русского ареала легко разгадывается, если сравнить обобщённую карту русских с такой же обобщённой антропологической картой народов Восточной Европы (рис. 2.3.3).
Рис. 2.3.3. Обобщённая карта антропологического состава населения Восточной Европы.
Мы видим яркие отличия в общей морфологии ландшафта этих двух карт. На «восточноевропейской» карте (рис. 2.3.3.) горные системы ядерных структур расположены подковообразно с котловиной в центре ареала. На «русской» карте (рис. 2.3.2.) видно отчётливое, почти меридианальное деление ландшафта на три области: западной возвышенности, центральной полосы низменностей («рифтовая» долина) и восточной возвышенности. Важнейшие для нас различия между картами сосредоточены в западной части «русского» ареала: на месте равнин (2 интервал) и впадин (О и 1 интервалы) «восточноевропейской» карты на «русской» карте как бы вырастает целый ряд возвышенностей (интервалы >2). Они говорят о собственной истории русского народа, и в них мы внимательно вглядимся чуть позже — при рассмотрении западной возвышенности «русской» карты. А сейчас для нас важно, что сходство между картами обнаруживается только в восточной зоне русского ареала. Восточно-русская антропологическая возвышенность «русской» карты оказывается аналогичной возвышенностям «восточноевропейской» карты, указывая на дославянское, субстратное происхождение антропологических особенностей в этой части русского ареала.
Итак, наибольшее соответствие между двумя картами — «русской» и «восточноевропейской» — наблюдается в восточной области русского ареала.
Видные на обобщённой «восточноевропейской» карте три крупных «ядра» на севере, северо-востоке и востоке (рис. 2.3.3.) связаны с финно-угорскими и тюркскими народами этой территории.
Антропологическая характеристика этих ядер приведена в работе [Рычков, Балановская, 1988].
Продолжения этих же трех ядер отчётливо видны и на карте только русского населения (рис. 2.3.2). Это означает, что в восточной части русского ареала «русская» карта выявила субстратные финно-угорские элементы в составе русского народа и тем самым подтвердила данные антропологии о наличии финно-угорского субстрата.
ЗАПАДНОРУССКИЕ «ВОЗВЫШЕННОСТИ» ЛАНДШАФТА. Что же касается западной части русского ареала (рис. 2.3.2), то, сравнив две обобщённые карты, мы обнаружим, что западные отклонения от среднерусского типа никак нельзя свести к влияниям других народов Восточной Европы. В западной области соответствия между «русской» и «восточноевропейской» картами практически нет! Это говорит о таких антропологических особенностях русского населения, которые несводимы к субстратным, иноэтничным элементам. На обобщённой карте Восточной Европы западная половина русского ареала выглядит как единообразная равнина: с точки зрения Восточной Европы все русские этой половины ареала — одинаково русские. Её структурированность выявляется лишь при «смене масштаба» — при переходе к русскому масштабу.
Таким образом, наименьшее соответствие между двумя картами — «русской» и «восточноевропейской» — наблюдается в западной области русского ареала. Ядра западной области несводимы к субстратным структурам «восточноевропейской» карты и, следовательно (согласно принципу «смены масштабов»), связаны не с долгой предысторией коренного населения Восточной Европы, а с собственной историей формирования русского этноса. Этим задаётся нижняя (то есть ранняя) граница времени формирования таких ядерных структур — начало сложения генофонда русского народа. На этой территории произошли события, которые дали толчок и легли в основу формирования русского генофонда. Чуть позже мы вернемся к этому и попытаемся понять, какие же исторические реалии отражают эти западные ядра.
ПРИРОДА ТРЕХЧЛЕННОГО «РУССКОГО» ЛАНДШАФТА. Но ключ к пониманию всего обобщённого картографического ландшафта находится не в западной области, а в центральной «среднерусской» цепи впадин и провалов, в этой своеобразной «рифтовой» долине, делящей русский «материк» на две части. Биологическая сторона происхождения этой долины ясна: антропологи ческие характеристики населения приближаются к среднему общеэтническому уровню в результате интенсивного смешения, метисирования. Совмещение антропологической карты с исторической, представленной на рис. 2.3.4., освещает историческую сторону этого явления. Эта долина расположена там, где с IX по XI в. продвигалась на восток граница Древнерусского государства. При этом расширении Древнерусского государства местные финно-угорские элементы включались в состав русского населения. Наша «рифтовая» долина указывает, где именно происходили качественные изменения в антропологическом составе: это зона интенсивного смешения славянского и финно-угорского населения. Благодаря исторической привязке этой «среднерусской» долины возникает вектор времени: западнорусская антропологическая «возвышенность» оказывается связанной с более ранними, а восточнорусская «возвышенность» — с более поздними этапами русской истории.
Рис. 2.3.4. Заключительный этап обобщённого картографического анализа: совмещение обобщённой антропологической и обобщён ной историко-археологической карт.
В историко-археологической карте соединены карта расселения восточных славян в IX–XI вв [Седов, 1982] и карты восточной границы Древнерусского государства в этот период [Колчин, Куза, 1985].
1) формирование древнерусского населения до заселения Волго-Окского междуречья (западная зона);
2) приобретение новых антропологических особенностей за счет метисации — включения местных элементов в Волго-Окском междуречье (центральная «рифтовая» зона);
3) значительное усиление субстратных влияний по мере дальнейшего расселения (восточная зона).
ГИПОТЕЗЫ
ПЕРВЫЙ ЭТАП: ЛЕТОПИСНЫЕ СЛАВЯНЕ? «Что уцелело и что дошло до нас» от этого самого раннего этапа русской истории, что отразилось в обобщённой антропологической картине?
Отметим, прежде всего, множественность, дробность обобщённых ядерных структур. Казалось бы, опускаясь в более древний период истории, следует ожидать прямо противоположного — выявления единого центра происхождения этноса, как это ожидается из теории центров происхождения Н. И. Вавилова и наблюдалось при обобщённом геногеографическом анализе монголов [Рынков, Батсуурь, 1987; Балановская и др., 1990]. Но при изучении русского народа оказалось, что наблюдаемая картина расходится с ожидаемой. Это расхождение тем более значимо, что после сопоставления с европейской картой мы знаем, что множественность западных ядерных структур нельзя свести к множественности субстратных включений. Тогда что же или кто же даёт о себе знать в этой пестрой картине локальных антропологических типов современного русского народа? В чем же тогда причина отклонений от среднерусского типа в западной половине ареала? Эти отклонения сосредоточены на Псковщине, Смоленщине, в Твери, в междуречье Москвы и Оки, в верховьях Оки на Орловщине и по Сейму на Курщине. Если их нельзя свести к влиянию других восточноевропейских народов, то остается искать причины в истории самого русского народа, обратившись к самым начальным этапам его становления.
В поисках ответа вспомним, что период летописного славянства отличался значительным разнообразием племён и дробностью некоторых из них: кривичи (псковские, полоцкие, смоленские и, возможно, тверские), словене новгородские, вятичи, северяне, радимичи, дреговичи и другие, находящиеся за рамками рассматриваемой русской территории. Учтем еще возможность исходной разнородности этих племён вследствие предполагаемого их восхождения к двум (а не к одной) древнеславянским археологическим культурам. Но где же найти подтверждение того, что выделяемые элементы антропологического ландшафта представляют след именно летописных славянских племён? Оно — в согласованности нашей антропологической карты с историко-археологической картой расселения славянских племён в IX–XI веках (рис. 2.3.4).
НАЛОЖЕНИЕ КАРТ АНТРОПОЛОГИЧЕСКИХ ТИПОВ И ПЛЕМЁН. Результат наложения этих двух карт — антропологической и исторической — свидетельствует, что исторический разрез «западнорусской возвышенности» обобщённого антропологического ландшафта действительно приходится на эпоху летописных славянских племён. В кажущейся неупорядоченности расположения ядер проявилась простая закономерность: они оказались связанными с ареалами летописных славянских племён, повторяя иногда в деталях археологические данные и исторические сведения. «Ядра» — скопления генов, отличающихся от общих свойств русского генофонда, получают весьма точный исторический адрес: каждое из них оказалось привязано к ареалу того или иного из летописных племён северо-восточных славян.
Псковское ядро — псковские кривичи.
Волго-Тверское ядро — тверские (?) кривичи.
Орша-Полоцкое ядро — полоцкие кривичи (полочане); возможно, дреговичи.
Смоленское ядро — смоленские кривичи.
Орловско-Брянское ядро — ранние вятичи.
Московско-Окское ядро — вятичи (после их расселения).
Сейминское ядро — северяне.
Белозёрское ядро — славянизированная весь.
Мещёро-Муромское ядро — кривичи (менее вероятно — словене) при заселении ими Окско-Клязьминского междуречья; возможно, славянизированная мещёра и мурома.
Кривичи, судя по археологическим данным, имели уже в то время локальные культурные различия, разделившись на псковских, полоцких, смоленских, тверских. Мы видим, что и на обобщённой антропологической карте кривичи представлены соответствующими ядрами. Известно также, что вятичи, сформировавшись первоначально в верховьях Оки, затем продвинулись в её среднее течение. Соответственно этому на нашей обобщённой карте обозначился и район первоначального их расселения, и район последующего сосредоточения их в Московско-Окском междуречье.
Менее отчётлив след новгородских словен, но при увеличении геногеографического разрешения и его удалось выявить к северу от озера Ильмень.
И лишь в ареале радимичей не удалось обнаружить собственной ядерной структуры по данным о современном населении. Зато на стыке их ареала с ареалом северян, вятичей и кривичей оконтурилась область наибольшего приближения к среднерусским особенностям. Такая область могла возникнуть лишь при смешении племён, генофонды которых существенно отличались друг от друга.
Укажем и на некоторые трудности увязки антропологических ядерных структур обобщённой карты с летописными славянскими племенами. Орша-Полоцкое ядро трудно однозначно связать или с полоцкими кривичами (они же — полочане), или с дреговичами, поскольку оно выявлено на самой границе картографируемой территории и его дальнейшее простирание неизвестно. Волго-Тверское ядро, самое выраженное на обобщённой антропологической карте, при соотнесении с археологической картой приходится на территорию, представляющую почти белое пятно в отношении всех ведущих археологических признаков. Археологические [Седов, 1982] и исторические [Древняя Русь. Город, замок, село…, 1985] карты, на которых мы основывались, не содержат указаний на самостоятельный кривичский центр в Тверской земле, хотя и помещают здесь кривичей.
Если ориентироваться только на поднятия и вершины обобщённой карты, окажется, что ни от новгородских словен, ни от радимичей не осталось никаких следов в виде ядерных структур: в ареалах этих племён находятся обширные впадины, указывающие на близость населения этих отнюдь не центральных территорий к среднерусскому антропологическому типу. Мы констатируем это, не берясь здесь выяснять, какие события в истории Великого Новгорода и новгородцев, а также радимичей повлекли столь значительное стирание их антропологического своеобразия, несомненно, существовавшего в прошлом, как и у других племён. След этого исчезнувшего своеобразия удалось обнаружить, по крайней мере, у новгородцев, еще более сгустив сеть учитываемых точек на картах антропологических признаков. Небольшое поднятие на обобщённой карте выявилось к северо-западу от озера Ильмень. На карте оно оконтурено штриховой линией.
Мы не считаем бесспорной предлагаемую «славянскую» идентификацию выявленных ядер антропологического ландшафта и рассматриваем её в качестве рабочей гипотезы, которая кажется правдоподобной и конструктивной для дальнейшего изучения русского генофонда.
ГДЕ И КАК СКЛАДЫВАЛСЯ «СРЕДНЕРУССКИЙ» АНТРОПОЛОГИЧЕСКИЙ ТИП? Конечно, применённый здесь метод совмещения карт, несущих совершенно разную информацию и относящихся одна — к современной, а другая — к средневековой эпохе, при всей красоте слияния ареалов, разделённых тысячелетием, не служит прямым доказательством правильности исторической расшифровки геногеографической карты. Но есть и другое доказательство, может быть, более убедительное.
Мы начали рассмотрение обобщённой геногеографической карты со «среднерусской» долины — районов концентрации среднерусских черт. Удивительно, что эта долина тянется вдоль меридиана по территории, где никаких географических причин для этого нет. Видимо, причиной такого необычного расположения является не природа Русской равнины, а история её народов. Но может ли история иметь четкое географическое направление? Как правило, нет. Но при колонизации одним народом земель, заселённых другим народом, этот исторический процесс, конечно, может иметь географическое направление, будь то походы Александра Македонского, Великое переселение народов, колонизация «дикого запада» США или татаро-монгольское завоевание Руси.
Это был процесс постепенного продвижения на северо-восток нескольких восточнославянских племён, к тому же, судя по летописям и археологическим данным, не очень многочисленных. Они были носителями не только новых для коренного населения культуры и языка, но и новых генетических особенностей. Этих генетических различий оказалось достаточно, чтобы на восточной окраине ареалов племён летописных славян (рис. 2.3.2.), где происходило наиболее интенсивное взаимодействие с коренным неславянским населением, началось формирование нового генофонда и нового антропологического типа («среднерусская» долина). Именно этот тип мы сегодня называем собственно русским, типично русским.
На рис. 2.3.2. показаны восточные границы Древнерусского государства в период с IX по XI века. За эти три столетия граница продвинулась на восток, образовав меридианально ориентированную полосу пограничья. Нетрудно увидеть, что именно к этой полосе и приурочены районы «среднерусского» типа, наша «рифтовая» долина. Можно предполагать, что на колонизацию земель, лежащих к востоку, у летописных славян уже не хватало людских ресурсов. И процесс славянской колонизации перешёл в новую фазу христианизации и чисто культурной колонизации местного населения при сохранении генофонда дославянского населения.
К ВОПРОСУ О «ЧИСТЫХ» РАСАХ
Если согласиться с таким историческим прочтением геногеографических карт, мы придём к неизбежному выводу: о генетической однородности, генетической «чистоте» русского народа (как, впрочем, и других народов) не может быть речи! Искать такую генетическую однородность, а тем более пытаться доказывать её — всё равно, что настаивать, что данный народ находится вне истории, выпал из мирового исторического процесса. Пока он живет и взаимодействует с другими народами, историче- ское время неизбежно создаёт не только культурные, но даже, как мы видели, биологические структуры, играющие роль хранилища исторической памяти народа. Именно благодаря этому генофонд приобретает свойство своего рода летописи истории народа.
§ 3. Через пространство — вглубь времён
В предыдущем разделе мы обратили время вспять: от географии современного населения вернулись на тысячелетие назад — к географии летописных славянских племён, в ту эпоху, когда формировался антропологический облик русского народа. Мы уже не раз вспоминали девиз Элизе Реклю, помещённый им на первой странице своего труда «Человек и Земля»: «География по отношению к человеку есть не что иное, как История в пространстве, подобно тому; как История является Географией во времени» [Реклю, 1906]. История и География — как двуликий Янус[23], как две стороны древней монеты. И потому историческая геногеография специально разрабатывает подходы и технологии для того, чтобы не разрывать связь истории и географии, а выявлять её.
Много методологических вопросов нуждается в дальнейшей совместной разработке. Как изучать хронологию геногеографического ландшафта? Как, выявляя связь времён, использовать «смену масштаба» геногеографических ландшафтов и контролировать результаты? Насколько устойчив геногеографический ландшафт? Надо определить и то, насколько структурообразующие элементы ландшафта зависят от технических приёмов картографирования: методов построения карт, их анализа, набора данных — от числа популяций и от числа признаков? И надо ответить на принципиальный вопрос, а возможна ли вообще пространственная стабильность выявляемых элементов ландшафта на таком огромном протяжении времени?
С тех пор прошли годы. Была разработана компьютерная картографическая технология, позволяющая и корректнее провести интерполяцию (для каждой точки карты учесть все изученные популяции, а не только самых ближних соседей), и корректнее оценить расстояния (Приложение). Появилась возможность оценить, насколько выявленные «возвышенности» и «долины» ландшафта зависят от техники картографирования: от методов построения карт и их анализа, от набора данных — числа популяций и числа признаков. Поэтому мы создали несколько серий компьютерных карт антропологии русского народа. Подробно они рассмотрены в разделе 4.4., а здесь мы приведём лишь одну из них: «электронную» карту (рис. 2.3.5), опирающуюся в точности на те же данные — те же популяции, те же признаки — что и «ручные» карты. Отличаются только методы.
Рис 2.3.5. Карта генетических расстояний от среднерусских значений до русских популяций.
Для расчёта расстояния использованы две меры — «интервальные» и евклидовы расстояния (квадрат разности между значением в данной точке и средним значением, нормированный на дисперсию). Впрочем, эти два метода очень близки: только при «интервальном» методе вместо самих значений признаков используется номер интервала, и, поскольку все признаки измеряются в номерах интервалов, отпадает необходимость в нормировке. Карты, полученные двумя методами, были похожи, и мы рассматриваем карту, полученную усреднением этих двух карт.
Некоторые из ответов — в этом разделе.
ОТ «РУЧНЫХ» КАРТ — К ЭЛЕКТРОННЫМ
Рассмотренные карты были самыми первыми и строились нами «вручную». Этот процесс столь трудоёмок, что интерполяцию можно было провести с учетом только ближайшего соседа, а расстояния от среднерусских характеристик рассчитать самым прямым способом: на сколько шагов-интервалов отличается данная популяция от среднего значения.
АЛГОРИТМЫ ПОСТРОЕНИЯ КОМПЬЮТЕРНЫХ КАРТ. Мы сделали всё для того, чтобы «ручная» и «электронная» карты были максимально сопоставимы. В конце концов, мы получили карты для всех тех восьми признаков, для которых 20 лет назад строились «ручные» карты. Теперь надо было перейти к картам многомерных расстояний. Для каждого признака рассчитали «удаленность» значения в каждом узле сетки карты до среднего русского значения по данному признаку. Затем как бы наложили восемь карт друг на друга, и в результате получили карту многомерных расстояний — удаленности каждого узла карты от «среднерусских» параметров.
На этой карте (рис. 2.3.5.) области, близкие к среднерусским характеристикам окрашены в светлые тона, а чем больше отличия — тем интенсивнее окраска.
РЕЗУЛЬТАТЫ СРАВНЕНИЯ КОМПЬЮТЕРНЫХ И «РУЧНЫХ» КАРТ свидетельствуют об устойчивости основных структурообразующих элементов обобщённого ландшафта.
Компьютерная карта вновь выявляет три основные зоны — западную, центральную и восточную. «Долины» среднерусских значений тянутся в ме-ридианальном направлении и расположены в центральной части ареала. С обеих сторон от долины расположены возвышенности — западные и восточные.
Как показывает сравнение «ручных» и «компьютерных» карт, конкретные очертания ядер непостоянны и зависят от метода картографирования. Также отметим, что ядерные структуры могут в действительности представлять собой группу близко расположенных, но различающихся между собой ядер.
Несмотря на различия в деталях, сходство основных структурообразующих элементов «ручных» и компьютерных карт указывает на устойчивость обобщённого ландшафта.
КАК ВОСТОЧНО-ЕВРОПЕЙСКАЯ РАВНИНА СТАЛА РУССКОЙ РАВНИНОИ?
Отметим, что лишь один из трех основных итогов повторяет и подтверждает выводы наших предшественников в изучении антропологии русского народа. Он относится к восточной части обобщённой карты, ядерные структуры которой подтверждают давнее заключение антропологов о значительной роли дославян-ского субстрата в формировании антропологического состава русского населения.
Два других итога принципиально новы. Первый из них относится к центральной зоне русского этнического ареала. Второй — к западной части русского народа. Насколько нам известно, еще ни в одном исследовании современного русского населения не удавалось обнаружить иных элементов в его антропологическом составе, кроме как субстратных. Новизна выявленных нами антропологических структур — в их отчётливой связи с историко-археологическими данными о летописных славянских племенах.
Это и есть то новое, что привносит геногеография в еще далекое от ясности понимание связи между славянской колонизацией Русской равнины, летописными славянскими племенами и современными поколениями русского народа. Внешне тривиальный результат отнюдь не таков по существу. Историческая преемственность между летописными славянскими племенами и современным русским населением не нуждается в подтверждении. Но их физическая преемственность ставилась под сомнение, так как антропология обнаруживала лишь субстратную, дославянскую основу современного антропологического состава. Вот почему представленная картина преемственности фенофонда и генофонда от летописных племён до современности нетривиальна по сути.
Новое, что привносит геногеография — то, что не только итог, но и сам процесс славянской колонизации становится зримым на обобщённых антропологических картах.
Западные области были не просто славянизированы, а заселены племенами древних славян. Лишь их численным преобладанием над местным дославянским населением — или более быстрым демографическим развитием — можно объяснить отчётливое отражение этого этапа истории в антропологическом составе современного населения. Однако уже при продвижении в Волго-Окское междуречье соотношение масс населения выравнивается, а далее на восток меняется в пользу местного дославянского населения. Заселение земель как главная составляющая первого этапа славянской колонизации постепенно сменяется ведущей тенденцией этнокультурной ассимиляции коренного населения. Становление русского этнического самосознания в восточных пределах Русской равнины во всё большей степени происходит на местной, неславянской антропологической основе.
Главные фазы превращения Восточно-Европейской равнины в Русскую равнину (географические синонимы) проявились на обобщённой антропо-географической карте современного русского населения. География здесь действительно выступает в качестве Истории, развертывающейся в пространстве [Реклю, 1906]. Благодаря этому, три указанные зоны на карте русского населения отражают три фазы славянской колонизации Русской равнины, различающиеся по своему этно-антропологическому и генетико-демографическому содержанию.
Главный итог проведённого исследования — трёхчленное географическое деление этнического ареала русских и различное происхождение населения этих зон: собственно славянское в западной части ареала, дославянское (преимущественно финно-угорское) в восточной части ареала и центральная долина метисации, интенсивного смешения этих двух пластов населения. Этот итог получен на материалах Русской антропологической экспедиции, к которым были применены подходы и методы геногеографии. Этот итог не повторяет заключений наших предшественников-антропологов и тем самым даёт новую жизнь материалам, добытым их трудами.
ПРОСТРАНСТВО И ВРЕМЯ
Геногеографические карты бывают не только разного географического масштаба — их генетический масштаб еще важнее. Карта разного генетического масштаба — популяций разного иерархического уровня (разного размера «матрёшек», вложенных друг в друга), охватывая различные просторы пространства, могут охватывать и разный диапазон времён.
Свои историко-хронологические рамки имеет и восточноевропейская карта (рис. 2.3.3). На ней отражён более древний слой истории. Не вдаваясь в частные вопросы хронологии обобщённого ландшафта, повторим лишь основной методологический тезис нашего исследования. Пространство и время взаимосвязаны в геногеографии. Обобщённая карта представляет срез определённого этапа формирования генофонда. То, через какую именно эпоху прошёл этот срез, задаётся масштабом карты и иерархическим уровнем популяций, охваченных исследованием. Ни одно картографическое построение не может выявить сразу все хронологически разные элементы генофонда. Главные структурообразующие элементы зависят от масштаба охваченной популяции, от её уровня в популяционной иерархии.
ОТ СОВРЕМЕННОСТИ — ВГЛУБЬ ВРЕМЁН
Мы надеемся, что представленные свидетельства (отражение летописного славянства в антропологии современного русского населения) говорят сами за себя. Во всяком случае, мы не можем указать иной фактор истории, который породил бы пространственную взаимосвязь исторической географии Древнерусского государства и антропологической географии современного русского населения. Но может ли вообще существовать пространственная стабильность ядерных структур при значительной их протяжённости во времени?
Чтобы попробовать ответить на этот вопрос, надо охватить самые разные характеристики популяций, Причём так, чтобы они отражали и время-историю, и пространство-географию. При таком рассмотрении оказывается, что пространственная стабильность ядерных структур, во-первых, является общим свойством и обнаруживается не только при антропологическом картографировании; а во-вторых, она охватывает огромные диапазоны времён.
АНТРОПОЛОГИЧЕСКИЙ ЛАНДШАФТ русского населения уходит корнями на глубину почти тысячи лет — от IX–XIII веков до современного населения доходят следы летописных славян.
АРХЕОЛОГИЧЕСКАЯ КУЛЬТУРА является таким же обобщённым понятием, как и антропологический тип. Особенно важно, что при картографировании археологических культур было прослежено сохранение такого географического ядра для ряда преемственных культур, связываемых с праславянами, на протяжении с XV века до н. э. по VII век н. э. [Рыбаков, 1984]. Это значит, что в диапазоне времени более двух тысяч лет сохраняются очертания пространственных структур.
ГЕНОФОНД является такой же обобщённой характеристикой населения, как антропологический тип и археологическая культура. Поэтому важно, что при обобщённом геногеографическом анализе современного населения было выявлено географическое ядро монгольского генофонда, стабильное и преемственно существующее на территории Центральной Азии на протяжении не менее двух последних тысячелетий [Рычков, Батсуурь, 1987].
ЦЕНТРЫ ПРОИСХОЖДЕНИЯ СОВРЕМЕННЫХ КУЛЬТУРНЫХ РАСТЕНИЙ, открытые Н. И. Вавиловым, связывались им с центрами происхождения древних земледельческих культур. Это означает, что была обнаружена географическая стабильность таких центров, по крайней мерё, с неолита [Вавилов, 1926]. Ведь зона, где в древности произошло окультуривание данного вида растений, определялась Н. И. Вавиловым по зоне максимального современного генетического разнообразия в популяциях этого вида. Здесь диапазон времени стабильности пространственных структур достигает уже десяти тысячелетий.
ИСТОРИЧЕСКАЯ ГЕНОГЕОГРАФИЯ И АНТРОПОЛОГИЯ. Легко видеть, что во всех сопоставленных случаях речь идет отнюдь не о географической периферии исторического процесса (где такая стабильность легче объяснима), а о тех районах, где интенсивность исторического развития наиболее велика, а, следовательно, велики и изменения этнокультурных и биологических характеристик населения. Столь высокая стабильность — на протяжении тысячелетий — пространственных структур открывает перед гено-географией широчайшее поле исторических исследований.
Все это вместе взятое, включая результаты синтеза геногеографических методов и данных антропологии, указывает на далеко идущие возможности геногеографии при изучении истории населения. И здесь союз антропологии и генетики не только необходим, но и реально осуществим — идя рука об руку, в тесном сотрудничестве они могут шаг за шагом воссоздавать историю генофонда и фенофонда населения.
Часть 2. ПОРТРЕТЫ РУССКОГО ГЕНОФОНДА
Ах ты гой еси, правда-матушка! Велика ты, правда, широка стоишь! Ты горами поднялась до поднебесья, Ты степями, государыня, раскинулась, Ты морями разлилася синими, Городами изукрасилась людными, Разрослася лесами дремучими! Не объехать кругом тебя во сто лет, Посмотреть на тебя — шапка валится! Выезжало семеро братиев, Семеро выезжало добрых молодцев, Посмотреть выезжали молодцы, Какова она, правда, на свете живет? А и много про нее говорено, А и много про нее писано, А и много про нее лыгано. Поскакали добры молодцы, Все семеро братьев удалыих, И подъехали к правде со семи концов, И увидели правду со семи сторон. Посмотрели добры молодцы, Покачали головами удалыми И вернулись на свою родину. А вернувшись на свою родину, Всяк рассказывал правду по-своему: Кто горой называл ее высокою, Кто городом людным торговыим, Кто морем, кто лесом, кто степию. И поспорили братья промеж собой, И вымали мечи булатные, И рубили друг друга до смерти, И, рубяся, корились, ругалися, И брат брата звал обманщиком. Наконец полегли до единого Все семеро братьев удалыих. Умирая ж, каждый сыну наказывал, Рубитися наказывал до смерти, Полегти за правду за истину. То ж и сын сыну наказывал, И доселе их внуки рубятся, Все рубятся за правду за истину На великое себе разорение. А сказана притча не в осуждение, Не в укор сказана — в поучение, Людям добрым в уразумение. Алексей Константиновиич Толстой. «Правда»Эта часть книги главная. В ней собраны воедино свидетельства четырёх наук — как четырёх очевидцев. Каждая наука, каждый очевидец дают свое видение русского генофонда: антропология (глава 4) классическая антропогенетика (глава 5), молекулярная генетика (глава 6) и фамилии (глава 7). Эти четыре свидетеля по-своему описывают генофонд. Более того, каждая из этих наук говорит на своем языке. Методология, понятийный аппарат, терминология, стиль — всё различно в этих науках.
Конечно же, даже просто собрать в одной книге итоги этих наук чрезвычайно полезно для создания общей картины русского генофонда. Однако мы решили сделать ещё один шаг — помочь этим наукам заговорить на одном языке. Этим языком стала геногеография: сведения о русском генофонде, добытые каждой из этих наук, мы переводили на универсальный язык карт. Карты — это образы. Яркие, ясные, явные и не менее объективные, чем «числовая», табличная информация. «Географическая карта — это вербализованное изображение» [Родоман, 1990, с. 44].
Карты древнее письменности. Они могут быть использованы в виде некоего «эсперанто» для общения разных наук. Для чтения карт любой науки не надо быть специалистом. Достаточно лишь желания освоиться с чтением карт, чтобы пролистывать любой из Атласов — картографировано ли в нём распространение роста бороды, групп крови АВ0, гаплогрупп митохондриальной ДНК или же фамилий.
Но, конечно же, мы оказались не просто «переводчиками» на геногеографический язык. Разговор на одном языке ещё не гарантирует успешность встречи.
Ведь и семеро братьев говорили на одном языке, но не поняли, что их рассказы повествуют об одном и том же. Для того, чтобы встреча четырёх наук состоялась, каждая из «договаривающихся сторон» должна не просто сообщить о себе, о своих вкусах, привычках и достижениях. Она должна в какой-то мере забыть о себе и согласиться обсуждать общий предмет, интересующий и объединяющий всех. Этим предметом стала изменчивость русских популяций в географическом пространстве. Все иные темы, как бы ни были они важны для каждой из наук, оставлены за пределами этой книги. Главной темой первой встречи наук стала изменчивость русского народа в его историческом ареале — на Русской равнине. Для первой встречи такое самоограничение необходимо, чтобы соблюсти единство и стройность книги.
Только если мы зададим всем очевидцам один и тот же вопрос, мы сможем непредвзято сравнить их свидетельства. Только если мы составим все портреты генофонда одним и тем же методом, мы сможем определить, действительно ли они так же различны, как рассказы семи братьев. Или же, напротив, хорошо согласуются друг с другом и рассказывают нечто общее о русском генофонде. Каждая из следующих глав могла бы составить отдельную книгу. Однако все вместе они дают максимально полное, разностороннее описание генофонда. И мы не просто объединили их под одной обложкой. Но объединили их одним методом, общим языком, единой задачей, объединили их свидетельства в целостную картину генофонда.
Какой иной путь может приблизить нас к правде о русском генофонде?
Глава 3. КАРТЫ И АТЛАСЫ
— Но ты ведь и сам путешественник! Расскажи мне о своей планете…
— Ну, у меня там не так уж интересно, — промолвил Маленький принц. -
У меня все очень маленькое. Есть три вулкана… Потом у меня есть цветок.
— Цветы мы не отмечаем, — сказал географ.
— Почему?! Это ведь самое красивое!
— Потому, что цветы эфемерны.
— Как это — эфемерны?
— Книги по географии — самые драгоценные книги на свете, — объяснил географ. — Они никогда не устаревают. Ведь это очень редкий случай, чтобы гора сдвинулась с места. Или чтобы океан пересох. Мы пишем о вещах вечных и неизменных…
— А что такое «эфемерный»?
— Это значит: тот, что должен скоро исчезнуть.
Антуан де Сент-ЭкзюпериВ этой маленькой главе очень кратко описывается план картографического исследования генофонда и то, как построены те или иные карты книги. Общих методик построения, чтения и анализа карт здесь мы почти не касаемся. Детальное описание картографической технологии и материалов, на которых построено исследование русского генофонда, приведено в Приложении — там читатель найдёт ответы на многие вопросы.
Материалы нашей книги охватывают данные только по коренному населению и только в пределах «исконного» ареала — все прочие популяции эфемерны в глазах геногеографа (отмеряющего время не годами, а поколениями), а мы хотим обнаружить именно те черты русского генофонда, которые с наибольшим правом могут считаться «вечными и неизменными».
Основу всей книги составляют картографические Атласы. Они черпают свою информацию из специально созданных банков данных. Прежде всего, это созданный нами комплексный банк данных «Русский генофонд», который вобрал в себя и результаты исследований русского народа по классическим генетическим маркёрам (группы крови, биохимические, физиологические маркёры), и по ДНК маркёрам (аутосомные, мтДНК, Y хромосомы), и результаты изучения антропологами облика русского населения (соматология, дерматоглифика). Во-вторых, для анализа русских фамилий была создана специальная база данных «ONOMA» о географическом распространении десятков тысяч фамилий. В-третьих, создан банк данных о полиморфизме митохондриальной ДНК в популяциях мира («World Mitochondrial»). Он занимает особое положение, поскольку является сейчас наиболее полной мировой сводкой об изменчивости мтДНК. Однако эту главу мы посвятим не столько банкам данных, сколько картографическим атласам, созданным на их основе.
Почему же мы столько внимания уделяем картам и атласам? Потому что они являются стержнем нашего исследования. Именно благодаря картам мы можем увидеть структуру русского генофонда. И только благодаря картам можем сопоставить и объединить данные разных наук и разных типов признаков. Комплексное изучение объединяет все проекции генофонда, все его «портреты», созданные по каждому типу маркёров — будь то черты физического облика, фамилии, группы крови или ДНК маркёры. Цель такого синтеза — создать единый «портрет» генофонда, который выявит не эфемерные, а наиболее общие и устойчивые элементы генофонда, его архитектонику, тот каркас генофонда, который проявляется в большинстве карт самых разных признаков.
3.1. ЕДИНЫЙ ПЛАН
Карты отдельных признаков — Обобщённые карты одного раздела науки — Сравнение обобщённых карт разных разделов — Единый план анализа для всех разделов — Не только карты
Основу всех наших баз данных составляет однотипная информация: данные по географической изменчивости признаков в русских популяциях, а также в популяциях других народов. Каждый из этих признаков является геногеографическим маркёром. Изменчивость любого маркёра сформирована как его «личными» особенностями (для получения «общего портрета генофонда» они становятся второстепенными), так и общими тенденциями, объективно существующими в генофонде. Именно эти общие тенденции — не эфемерные, но наиболее устойчивые — мы и хотели выявить. Для этого мы от «простых» карт геногеографических маркёров переходили к их обобщённым картам. А далее — сравнивали обобщённые карты уже разных наук.
Мы старались на протяжении всей книги — вопреки разным традициям собранных нами наук — везде следовать единому плану исследования. Иначе как им заговорить на одном языке? Как обнаружить их видение русского генофонда?
ОДИН ПРИЗНАК — ОДНА «ПРОСТАЯ» КАРТА
Сначала мы картографировали изменчивость каждого признака каждой науки. И получили «простые» карты — карты для отдельных признаков.
Однако не всё так просто. По одной карте на каждый признак мы получаем только для одного и того же ареала. Если мы изменяем изучаемый ареал (например, выходим за пределы исторического ареала русского народа), то мы должны построить другую карту — географической изменчивости того же признака, но уже в новом ареале. Поэтому во второй части книги мы рассмотрели карты изменчивости признаков в ареале русского народа. А в третьей части книги — карты изменчивости этих же признаков, но уже в ареале населения Европы и Евразии.
МАССИВ «ПРОСТЫХ» КАРТ — ОДНА ОБОБЩЁННАЯ КАРТА
Затем для каждого массива «простых» карт строили обобщённые карты — по очереди для каждого раздела науки. Например, для одного из разделов антропологии (соматологии) мы построили тридцать «простых» карт, показывающих географическую изменчивость каждого из тридцати признаков физического облика. А затем на основе всех этих карт создали одну обобщённую карту — она дает «портрет» изменчивости русского народа по данным соматологии. И такие же операции провели для каждого раздела каждой науки: 1) соматология; 2) дерматоглифика; 3) классические генные маркёры; 4) маркёры мтДНК; 5) маркёры Y хромосомы; 6) аутосомные ДНК маркёры; 7) фамилии. В результате мы получили семь типов «портретов» — обобщённые карты для каждого из семи разделов антропологии, генетики и антропонимики.
Такие обобщённые карты показывают, как видится структура генофонда с точки зрения данного раздела науки. Географические закономерности, сходство определённых популяций друг с другом, сходство с соседними народами и многое другое удаётся выявить на каждой из обобщённых карт.
Однако вновь всё не так просто. Дело в том, что для каждого массива карт мы можем построить разные типы обобщённых карт — например, разные карты генетических расстояний, или генетического разнообразия, или же «синтетические» карты главных компонент. Но суть всех этих карт одна: по массиву «простых» карт создается одна обобщённая карта данного типа, раскрывающая облик генофонда, а не отдельных его признаков.
СРАВНЕНИЕ ОБОБЩЁННЫХ КАРТ РАЗНЫХ РАЗДЕЛОВ НАУКИ
И, наконец, на последнем этапе мы сравнивали портреты генофонда, полученные по разным типам признаков (по данным разных разделов наук). И те общие черты, которые проявились на большинстве портретов, мы сочли основными, важнейшими закономерностями в структуре генофонда.
Конечно, реальный анализ сложнее. Он включает не только картографирование, но и другие методы. Да и в самом картографировании не всё сводится к обобщённым картам. Последующие главы содержат много разнообразной информации по каждому типу признаков, и мы провели много разных видов анализа. Но всё-таки, если вычерчивать схему нашего исследования, его маршрут, его суть, то они именно таковы: 1) сначала «простые» карты отдельных признаков; 2) потом обобщённые карты по каждому из разделов науки; 3) и венчает работу сравнение основных закономерностей по разным типам признаков.
ПЛАН АНАЛИЗА
Анализ проведён для семи типов признаков: соматологии, дерматоглифики, классических генетических маркёров, аутосомных ДНК маркёров, митохондриальной ДНК, Y хромосомы, фамилий.
Для русского народа анализ каждого типа признаков проведён по единому плану. Сначала рассматривается специфика данного типа маркёров, история его изучения в русском генофонде и описывается накопленный массив данных. Затем картографируются отдельные признаки, даётся описание «простых» карт и количественные показатели их изменчивости, интерпретация выявленных закономерностей. На следующем этапе проводится обобщённый картографический анализ: строятся синтетические карты, объединяющие информацию всех карт отдельных признаков. Основным инструментом являются карты главных компонент, также используются карты генетических расстояний и показателей генетического разнообразия.
После того, как такой анализ проведён для каждого отдельного типа признаков, основные результаты сравниваются с данными других наук, что позволяет сделать общие выводы об объективной структуре русского генофонда, истории его формирования и взаимоотношениях с соседними популяциями.
В основу изучения каждого типа признаков нами положен картографический метод. Этот метод позволяет: 1) рассмотреть географическую изменчивость каждого признака; 2) рассчитать статистические показатели изменчивости каждого признака; 3) выявить общие статистические параметры генофонда по совокупности признаков данного раздела науки; 4) дать «геногеографический портрет» генофонда с точки зрения данного раздела науки (обобщённые карты по совокупности признаков этого типа); 5) наконец, количественно сравнить, насколько похож полученный «портрет» генофонда на «портреты», независимо созданные другими разделами науки.
На каждом этапе картографический анализ широко дополняется другими методами — многомерного шкалирования, сравнения спектра гаплотипов мтДНК, оценки разнообразия и инбридинга, спектра фамилий и другими. Но наша задача — изучить русский генофонд через его географию. Поэтому и главным инструментом, и главным итогом работы являются геногеографические карты.
3.2. КАК СОЗДАНЫ КАРТОГРАФИЧЕСКИЕ АТЛАСЫ
Универсальный адаптер — Карта-это матрица — И лишь потом картинка — Что такое обобщённые карты — Что такое. Атласы — И как они устроены
БЕЗ КАРТ НЕТ СРАВНЕНИЙ
Почему только картографический подход позволяет объединять и сравнивать данные по разным типам признаков?
Признаки, изученные в разных популяциях, нельзя сравнить напрямую. Но можно сравнить интерполяционные карты распространения этих признаков. Так картографический подход становится единственным инструментом комплексного анализа.
Например, классические и ДНК маркёры изучены в разных популяциях. И сравнить результаты этих работ напрямую невозможно, если пользоваться лишь статистическими методами. Картографирование позволяет создать карты, на которых значения обоих признаков показаны в одних и тех же точках. Тем самым снимается проблема неравномерной и различной изученности разных признаков. Оценка надёжности позволяет не заходить при этом слишком далеко, чтобы не сравнивать данные по тем областям карты, которые недостаточно обеспечены исходной информацией.
ЧТО ТАКОЕ КАРТА
Любые карты мы всегда видим в графическом виде, как образ, картинку. Но эти изображения являются лишь производными от «базовых» компьютерных карт — цифровых моделей карты (ЦМ). Исходным материалом для построения цифровой модели служат значения признака в изученных популяциях, эта информация берется из банков данных. К этим данным применяется интерполяционная процедура и создаётся цифровая модель. Она представляет собой трёхмерный массив чисел, моделирующий геногеографические характеристики каждой точки карты: географическую широту, географическую долготу и значение картографируемого признака. Именно эти истинные «базовые» карты, которые для человеческого глаза предстают лишь как матрицы чисел, дают возможность строить графические карты.
Исходные популяции разбросаны в ареале неравномерно. Ареал как бы накрывается равномерной сетью, и для каждого узла сети рассчитываются интерполированные значения признака. Поскольку полностью идентичные сети набрасываются на распределение разных признаков, результаты оказываются полностью совместимыми. Каждый узел одной сети аналогичен соответствующему узлу другой сети. У них одинаковые координаты. И переходя от карты одного признака к карте другого, мы находим в аналогичном узле значение уже другого признака. Поэтому можно сравнить значения всех признаков в аналогичных узлах разных сетей. Мы можем количественно сравнивать любые интерполяционные карты друг с другом, если у этих карт одинаковые сети. Каждый узел сети — элемент общей матрицы. С матрицами можно проводить любые статистические операции. Матрица, сеть, цифровая модель интерполяционной карты — синонимы.
На основе цифровых моделей (а не графических образов) ведется весь точный картографический анализ: анализируются закономерности «простых» карт и строится множество специальных обобщённых карт.
Одну и ту же цифровую модель можно представить в разных графических вариантах, если использовать разные шкалы. При этом получаются различные картографические образы, отвечающие конкретным задачам исследования и особенностям зрительного восприятия. На рис. 10.3.1. (глава 10) в качестве примера показана одна и та же карта (одна и та же ЦМ), представленная в двух разных шкалах. В результате возникли два разных картографических образа. Поэтому при рассмотрении любых карт надо помнить, что непрерывный изменяющийся ряд значений ЦМ при создании графического образа превращён в небольшое число интервалов. И в зависимости от шкалы (границ интервалов) создаются разные графические образы. Это значит, что точное положение изолиний, каких-либо особенностей рельефа на карте не стоит абсолютизировать. Достаточно немного изменить шкалу, и изолиния пройдёт несколько иначе, и особенности очертаний изменятся. Поэтому мы говорим о выявлении резких границ только тогда, когда границы выявляются в самых разных шкалах, или выделяются по двум и более изолиниям.
ТИПЫ ОБОБЩЁННЫХ КАРТ
Важнейшим инструментом нашего исследования являются обобщённые карты. Мы создаём три типа обобщённых карт: карты главных компонент, карты генетических расстояний и карты разнообразия. Каждая из обобщённых карт показывает одну из главных тенденций в генофонде, концентрирует те закономерности, которые в картах отдельных признаков присутствовали только в очень «разбавленном виде».
КАРТЫ ГЛАВНЫХ КОМПОНЕНТ (synthetic maps) — самые популярные обобщённые карты и в отечественных, и в зарубежных геногеографических работах. Анализ главных компонент — это известный статистический метод, который позволяет от множества исходных признаков перейти к нескольким новым, которые называются главными компонентами и являются максимально информативными. При этом первые несколько главных компонент высоко коррелируют с большинством исходных признаков. То есть нам не нужно рассматривать всё множество исходных признаков — достаточно рассмотреть две-три главные компоненты, и при этом мы не потеряем информацию — главные компоненты покажут нам то главное, что есть во всей совокупности исходных признаков.
Две геногеографические школы, возглавляемые Ю. Г. Рычковым и L. L. Cavalli-Sforza, независимо пришли к мысли, что метод главных компонент идеален для выявления основных тенденций в генофондах. Эти два коллектива разработали оригинальные технологии картографирования главных компонент [Menozzi et al., 1978; Рычков, Балановская, 1992]. Точнее, методы расчёта карт главных компонент через карты отдельных признаков.[24]
Карты главных компонент — это карты новых, чрезвычайно информативных признаков. В отечественной традиции принято говорить, что они выявляют основные закономерности генофонда, за рубежом говорят более образно — о сценариях истории генофонда. Для признаков соматологии карты главных компонент заменяются их математическим аналогом — картами канонических переменных. Различие заключается лишь в методике расчёта (см. раздел 4.1.), а для интерпретации карт безразлично, какой показатель использован.
КАРТЫ ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ часто используются в отечественных исследованиях. Странно, что их не изобрели также за рубежом. Ведь в отличие от главных компонент, являющихся математической абстракцией, карты генетических расстояний проще для понимания. Генетические расстояния — интуитивно понятный и очень распространённый инструмент: они показывают величину различий между парой популяций. Чтобы получить карты генетических расстояний, нужно лишь нанести значения генетических расстояний на карту. В каждую точку карты нужно поместить величину расстояния от этой популяции (расположенной в данном месте карты) до одной и той же выбранной нами популяции. Эта популяция, от которой отсчитываются генетические расстояния до всех точек карты, в геногеографии называется «реперной популяцией». Реперную популяцию можно выбрать произвольно: англичане, угличане, смоляне, куряне, пене-ги, печенеги, немцы, ненцы, талыши, латыши, или же, например, «средние показатели Восточной Европы». Карта расстояний покажет, население каких территорий генетически сходно с реперной популяцией, а где генофонд резко отличен от генофонда реперной популяции.
Этот подход может применяться к любым признакам. Но если при анализе генов мы говорим о «генетических расстояниях», то при анализе антропологических данных используются другие формулы расчёта расстояния (степени различий двух популяций). Для геногеографии словосочетания «генетические расстояния», «многомерные расстояния», «обобщённые расстояния» — синонимы. Метод картографирования генетических расстояний описан в Приложении, а также главах 8 и 9.
КАРТЫ РАЗНООБРАЗИЯ — третий тип обобщённых карт — ещё проще и очевиднее. Тем удивительнее, что, хотя показатели генетического разнообразия популяций рассчитываются всеми популяционными генетиками, эти значения наносились на карту обычно лишь в отечественных геногеографических работах. Карты разнообразия показывают уровень генетического разнообразия для каждой точки карты. Есть несколько показателей разнообразия, например — гетерозиготность. Или гаплотипическое разнообразие, карты которого могут быть двух видов: 1) карты общего гаплотипического разнообразия популяции (аналог гете-розиготности для гаплоидных однородительских ДНК маркёров) и 2) карты разнообразия гаплотипов в пределах одной гаплогруппы (показатель возраста гаплогруппы).
Большинство карт разнообразия, рассматриваемых в этой книге, отражают внутрипопуляционное разнообразие. Однако иногда мы создаём и карты межпопуляционной изменчивости. Такие карты полезны как для выявления различий в степени межпопуляционной изменчивости в разных регионах, так и для поиска «генетических границ», то есть зон резких изменений в генофонде (близкий подход использован в работах [Barbujani, Sokal, 1990; Rosser et al., 2000]). Наконец, особым видом карт разнообразия являются карты случайного инбридинга (см. раздел 7.6.).
«КОМБИНИРОВАННЫЕ» КАРТЫ. Кроме карт главных компонент, карт генетических расстояний и карт разнообразия в этой книге использованы и иные карты, представляющие алгебраическую комбинацию нескольких «простых» карт.
Суммарные карты. Эти карты являются суммой отдельных карт, объединяемых по характеру их генетического ландшафта или иным свойствам. При построении таких карт суммируются значения, находящиеся в аналогичных узлах всех исходных карт (карт отдельных признаков). Мы приводим карты суммарной частоты западно-евразийских и восточно-евразийских гаплогрупп мтДНК (разделы 8.2. и 9.2.).
«Карты прародины» (см. раздел 9.2.) являются произведением двух карт: карты частоты гаплогруппы и карты разнообразия той же гаплогруппы. «Карты прародины» показывают, где одновременно высоки и частота, и разнообразие, то есть оконтуривают возможную область прародины гаплогруппы.
Карты генетического риска (раздел 5.2.) рассчитываются по алгебраическим формулам из карт аллелей. Они показывают уровень генетической предрасположенности населения к тем или иным заболеваниям с учетом взаимодействия генов.
В зависимости от задач исследования, можно создавать множество различных комбинированных карт — «алгебраичность» цифровых моделей и разработанное нами программное обеспечение GGMAG и MAPSTAT предоставляют для этого неограниченные возможности.
ЧТО ТАКОЕ АТЛАС
Рабочее название этой книги звучало так: «Атласы русского генофонда». Карты переполняют её, являются тем стержнем, который объединяет анализ всех типов признаков — антропологии, классической генетики, молекулярной генетики, фамилий. Но случайная подборка бесчисленных карт ещё не позволяет ни сравнить разные типы признаков, ни понять генофонд. Для этого нужны картографические атласы.
Необходимым инструментом геногеографии служат «простые» карты — карты распределения признака по ареалу популяции. Однако каждая отдельно взятая «простая» геногеографическая карта заранее неизвестным образом соединяет в себе как бы две карты. Одна составляющая («общий ландшафт») отражает универсальные свойства пространственной структуры генофонда, его каркас, его архитектонику. Общий ландшафт одинаков во всех «простых» картах, он как бы является подстилающей основой. Вторая составляющая («особенное») простой карты вбирает все особенности в географии данного признака — особенности взаимодействия отдельного гена с окружающей средой, особенности истории дрейфа генов и отражения миграций. Чтобы отделить общее от особенного, надо от создания «простых» карт перейти к созданию геногеографического атласа изучаемого генофонда.
Картографический атлас представляет собой «систематическое собрание географических карт, выполненное по общей программе как целостное произведение» [Салищев, 1982]. Чтобы стать геногеографическим атласом, собрание геногеографических карт должно удовлетворять следующим требованиям, сформулированным еще 15 лет назад [Балановская и др., 1990]:
1) Должны быть соблюдены единые критерии организации исходных популяционно-генетических данных в отношении автохтонности населения, популяционных ареалов и других параметров.
Это означает, что ко всем популяциям надо предъявить одни и те же требования (например, коренное сельское население, в пределах «исконного» ареала, объём выборки не ниже такого-то, данные только по маркёрам определённого типа). И включить в анализ только те популяции из имеющихся в банке данных, которые удовлетворяют этому единому набору критериев. Если часть данных не удовлетворяет этим критериям (например, не коренное население) — такие данные нельзя включать в тот же атлас, но можно создать отдельный «атлас современного населения».
2) Должны быть выдержаны единые принципы построения карт, единая техника их расчёта и приёмов изображения, унификация географического и генетического масштабов, легенды карты и т. д.
Все карты должны быть построены одной программой, с одними и теми же параметрами картографирования. Все карты атласа должны относиться к одному региону. При наложении таких карт друг на друга все моря и реки совпадают. Шкалы должны подбираться по общим принципам, например, только равномерные шкалы, постоянное число интервалов для всех карт данного типа.
3) Выполнение этих требований должно обеспечивать единство правил прочтения и анализа всех ге: ногеографических карт, высокий и единый уровень воспроизводимости всех карт атласа.
Все карты одного типа читаются одинаково — например, тёмно-окрашенные (на цветных картах коричневые) области на любой карте означают максимальные значения признака. Но карты разного типа читаются по-разному. Например, на картах генетических расстояний минимальные значения означают сходство с реперной популяцией (и близки к нулю), а на картах главных компонент — область одного из двух экстремумов (отрицательные значения).
4) Геногеографический атлас должен завершаться картографическим обобщением частных карт, дающим интегральные характеристики географической структуры генофонда популяции.
Действительно, именно раздел обобщённых карт несет важнейшую информацию о генофонде. Это обычно небольшое количество обобщающих карт.
КАК УСТРОЕНЫ АТЛАСЫ
В нашем исследовании по каждому типу признаков создан отдельный картографический Атлас: по одному атласу на данные каждой науки. Все Атласы являются геногеографическими. Именно это их объединяет — методы построения, цели их создания, способ интерпретации. А сами данные различны: антропологические признаки, классические генетические маркёры, ДНК маркёры, фамилии.
Полностью совместимые электронные картографические Атласы русского генофонда по данным соматологии, дерматоглифики, антропонимики, классической и молекулярной генетики созданы впервые — и впервые эта книга дает возможность напрямую сопоставить результаты, полученные всеми этими науками.
Масштаб Атласов русского генофонда задан историческим ареалом русского народа — все карты построены в пределах «исконного» русского ареала. Однако для ряда признаков мы создали и картографические Атласы в масштабе двух других регионов: Восточной Европы и Евразии. Карты Восточной Европы особенно важны для понимания взаимодействия русского генофонда с соседями. Эти карты показывают изменчивость во всех популяциях Восточной Европы, включающих наряду с русским генофондом и популяции всех других генетически изученных народов этого региона. Карты Евразийского генофонда позволяют рассмотреть русский генофонд в общемировом масштабе изменчивости, позволяют определить его место в системе генофондов человечества.
В разделе 5 Приложения мы приводим основную «техническую» информацию о картографических атласах, на которых построена книга. Эта информация справочного характера — к ней можно обращаться по необходимости, читая интересующую главу. Однако она может служить и путеводителем, позволяя решить — стоит ли заглядывать в ту или иную главу? Поэтому для каждого атласа мы указали, в каких главах рассматриваются его карты.
Глава 4. ЛИКИ РУССКОГО НАРОДА — ВЗГЛЯД АНТРОПОЛОГА
Антропологические измерения предоставляют историку чрезвычайно обильный и многочисленный, но однообразный и односторонний материал.
М. В. ВитовЭтнический ареал русского народа на протяжении столетий неуклонно расширялся, включая в себя сначала окраины Восточно-Европейской равнины, а потом Урал, Сибирь, Кавказ и многие иные отдалённые территории. Но популяции, сформировавшиеся исторически недавно в результате переселений или смешений, мало информативны для понимания этногенеза и истории становления русского генофонда. Если мы хотим заглянуть в прошлое, то намного важнее проследить историю формирования основной «исконной» части этнического генофонда, чем судьбы отдельных, поздно выделившихся или смешанных субпопуляций. Поэтому для целей нашей книги важнее ограничиться этническим ядром русского народа — «исконной» территорией формирования генофонда. В геногеографическом разнообразии населения именно этой территории отражены основные события этногенеза и этнической истории. Ведь мы ищем следы событий, сформировавших генофонд народа, а не следы его последующего расширения и смешения.
Если наша книга — это взгляд в прошлое, то для изучения истории становления русского генофонда нет необходимости рассматривать русское население на тех территориях, где оно появилось исторически недавно — в XX веке, в XIX, в XVIII. Все эти популяции мало информативны для решения основной задачи книги, и поэтому мы их касаться не будем.
Недаром при планировании Русской антропологической экспедиции, доныне остающейся образцом антропологического изучения, Виктор Валерьянович Бунак указывал, что её цель — характеристика «основных антропологических элементов, вошедших в состав русского населения, и изучение общих вопросов его этногенеза, поэтому в плане работ экспедиции первое место занимала этническая зона формирования русского населения в XI–XIV веках» [Происхождение…, 1965, с. 24]. Иные территории — Поволжья, Дона, Урала и т. д. «были прочно заселены русскими в эпоху, когда этнический тип русских уже сформировался. Все эти территории… при всём их антропологическом интересе не имеют решающего значения» для изучения состава русского населения [Происхождение…, 1965, с. 24].
Аналогично и М. В. Битов, изучая антропологию Русского Севера, охватывал лишь те территории, которые были колонизированы в хронологических рамках XII–XVII веков — от Уставной грамоты Святослава Ольговича 1137 г. до окончания значительных массовых передвижений русского населения XVII века [Битов, 1997]. Он не включал в своё исследование последние этапы этого процесса: «Я имею в виду, конечно основную территорию Русского Севера, или Поморья, как именуют эту область документы XVII столетия, т. е. Заонежье, бассейн Двины с Сухоной и Югом, побережья Белого моря, бассейн Мезени, и оставляю в стороне окраинные области, заселённые в значительной степени позднее: Кольский полуостров, Вятку и Пермь Великую. Впрочем, последние две области лишь административно входили в число поморских уездов в XVII в., а с историко-географической и с историко-культурной точки зрения долгое время представляли собой особые, отличные от Поморья территории» [Битов, 1997, с. 9].
И мы, определяя основной («исконный», «исторический») ареал русского народа, следуем авторитетному мнению В. В. Бунака и М. В. Витова. Как мы видим из приведённых цитат, конкретные временные рамки могут варьировать для разных территорий. Но смысл один — это те территории, где формировался русский народ (а не те, где он впоследствии расселился). Картографирование данных о русском генофонде мы проводим именно в пределах «исконного» ареала, как его понимали В. В. Бунак и М. В. Битов.
4.1. АНТРОПОЛОГИЧЕСКИЕ АТЛАСЫ РУССКОГО НАРОДА
Трудности сравнения классификаций — Возможность сравнения карт — Карты соматологии и дерматоглифики Карты простые и обобщённые — Коннексия — Традиционность и новизна приводимых карт
Картографические атласы изменчивости признаков антропологии в историческом ареале русского народа включают разнообразные компьютерные карты — как распространения отдельных признаков, так и разные виды обобщённых карт. Атласы являются своеобразным итогом многолетнего изучения антропологии русского народа. Отдельно проведён картографический анализ признаков соматологии, отдельно — признаков дерматоглифики. Наша задача — во-первых, отыскать наиболее общие черты в структуре фенофонда (фенофонд — совокупность антропологических признаков населения). А во-вторых — проверить, есть ли сходство в изменчивости фенофонда и генофонда русского народа?
Антропология всегда привлекалась генетиками для объяснения своих результатов. Поиск аналогий между популяциями, близкими по частотам генов, и антропологическими типами региона — постоянный мотив такого рода исследований. Но при этом поле взаимодействия двух наук очень узко: генетики просто проверяют, соответствуют ли их результаты антропологической классификации. Но ведь она была разработана совсем другими методами и для иных целей! К тому же генетики далеко не всегда могут уследить за причудливой иерархией антропологических типов. Отсутствие жёсткой и однозначной классификации антропологических типов является несомненным достоинством антропологии. Оно отражает объективную картину — между антропологическими вариантами действительно нет резких границ. Потоки миграций и смешения, чутко выявляемые антропологией, создают плавный узор антропологического покрова. Однако лабильность антропологических классификаций порой приводит генетиков в отчаяние. Оттого они порой применяют классификации, созданные антропологами, не всегда умело, или же используют лишь те варианты или разделы, которые «подходят» к их генетическим данным. По-видимому, есть лишь один путь для корректного применения антропологических классификаций в генетике: нужна совместная, рука об руку, работа антропологов и генетиков. Этим путём мы и шли.
ГЕНОГЕОГРАФИЯ
Нам помогло очень важное обстоятельство: методы обобщённого анализа применимы в обеих науках. Это значит, что можно не просто сравнивать результаты, но и сам анализ исходных данных обеих наук — антропологии и генетики — проводить одним и тем же методом, параллельно. Иными словами, можно сравнивать не окончательные итоги (выводы, классификации, кластеры), а сами первичные данные обеих наук изучать строго одними и теми же методами. Тогда полученные результаты будут сопоставимы на всех шагах анализа. Именно такой подход, когда методические различия между анализом генетических и антропологических данных сведены к минимуму, и применён нами для изучения генофонда (и фенофонда) русского народа.
СТРУКТУРА КАРТОГРАФИЧЕСКИХ АТЛАСОВ
Устройство двух антропологических атласов русского народа описано ниже (раздел 5 Приложения). Мы провели картографический анализ двух систем антропологических признаков: соматологии (физического облика) и дерматоглифики (кожных узоров). Под термином «антропологические» часто имеют в виду данные только соматологии, и мы тоже порой будем использовать их в этом привычном значении. Но правильнее все же различать сома-тологические, дерматоглифические, одонтологические, палеоантропологические признаки, объединяемые под общим понятием «антропологических» данных.
В основу анализа данных соматологии легла сводка, составленная профессором кафедры антропологии МГУ В. Е. Дерябиным (раздел 5 Приложения). В нее вошли все основные данные по антропологии русского населения (работы В. В. Бунака, Т. И. Алексеевой, М. В. Витова, В. П. Алексеева). В основу анализа данных дерматоглифики легла сводка, составленная известным специалистом в этой области — сотрудником Института этнологии и антропологии РАН к.б.н. Н. А. Долиновой. В нее вошли все основные данные по дерматоглифике русского населения. Работа по составлению сводок и их включению в геногеографический анализ велась в сотрудничестве генетиков и антропологов в рамках проектов РФФИ[25].
Напомним (глава 3, раздел 3.2., раздач 5 Приложения), что картографические атласы антропологии включают несколько разделов «простых» карт и «обобщённых» карт.
1) География каждого признака соматологии по данным Русской антропологической экспедиции («РАЭ»): 107 популяций, 30 признаков. Изученные РАЭ популяции охватывают весь «исконный» ареал русского народа. Лишь Русский Север изучен менее подробно. Он был основным предметом исследований М. В. Витова, работавшего почти одновременно с РАЭ.
2) География каждого признака соматологии по объединённым данным РАЭ и М. В. Витова («АБВ»[26]): 180 популяций, 18 признаков. Совместный анализ этих массивов данных выполнен впервые. С 1953 по 1957 годы М. В. Битовым были обследованы около восьми с половиной тысяч русских мужчин (82 популяции). Чтобы включить в единый анализ все популяции, изученные РАЭ и М. В. Битовым, нам пришлось сократить перечень признаков: далеко не все они поддаются коннексии. Объединив данные из двух источников, и анализируя уже не 107, а 180 русских популяций, мы можем создать карты лишь 18 признаков. Однако эти признаки являются ведущими и дают весьма полное представление об антропологическом облике русского народа.
3) География каждого признака дерматоглифики: 28 популяций, 7 ведущих признаков дерматоглифики. Дерматоглифические данные по русскому народу картографируются впервые.
4) География ведущих закономерностей антропологии. Эти разделы Атласа включают: обобщённые карты многомерных расстояний (РАЭ и АБВ) и канонических переменных (РАЭ и АБВ) по соматологии; обобщённые карты главных компонент по дерматоглифике. Именно эти разделы Атласа мы рассматриваем как основные. Они позволяют, во-первых, обобщить антропологические данные, и, во-вторых, сравнить данные антропологии со свидетельствами прочих «очевидцев».
Фрагменты Атласа представлены на сайте . Общая характеристика карт разделов «отдельные признаки соматологии (АБВ)» и «отдельные признаки дерматоглифики» приведены в таблице 4.1.1.
«Простые» карты (для каждого отдельного признака) позволяют наглядно изобразить, рассмотреть и проанализировать изменчивость тех черт, которые составляют физический облик населения.
Обобщённые карты выявляют основные закономерности, скрытые в картах изменчивости отдельных признаков соматологии и дерматоглифики. Именно обобщённые карты выявляют пространственную структуру фенофонда.
Формально, уже карты отдельных признаков антропологии можно напрямую сравнивать с картами классических и ДНК маркёров. Ведь все они построены по одной технологии, по единой методике. Но намного информативнее и привлекательней будет сравнение иных — обобщённых карт антропологии и генетики. Здесь мы уже отвлекаемся от множества исходных признаков и переходим к признакам обобщённым, к обзору того единого здания, которое до этого рассматривалось каждой наукой со своей стороны. Такое сравнение пространственных структур генофонда и фенофонда русского народа позволит нам отделить «частное» (выявляемое только данной наукой) от «общего» каркаса генофонда, его архитектоники, его истории, который должен проявиться и в антропологических, и в генетических итогах изучения русского народа. Сравнение фенофонда и генофонда, сравнение свидетельств разных «очевидцев» является одной из главных задач нашей книги и её «многоочего» подхода.
Сопоставить антропологическую и генетическую обобщённые карты, когда они уже получены, несложно. Но когда генетик пытается создать антропологические карты, его поджидают как минимум две трудности.
Первая вызвана необходимостью в коннексии разных антропологических данных (в генетике коннексия обычно не нужна). Вторая — в методике многомерного анализа: для данных соматологии (связанных внутригрупповыми корреляциями) необходимо рассчитывать канонические переменные вместо привычных генетикам главных компонент.
КОННЕКСИЯ ДАННЫХ
Особенностью антропологических исследований является неизбежная поливариантность при измерениях одних и тех же признаков, причём разные антропологические школы используют несколько отличающиеся правила измерений. Поэтому при сопоставлении данных, полученных разными антропологическими школами (или даже одной, но в разные годы), возникает необходимость в коннексии данных. Коннексия — это пересчёт, приведение «к общему знаменателю», сведение в единую систему, перевод на «единый язык» данных разных исследователей. Для возможности такой коннексии разные авторы намеренно изучают ряд одних и тех же популяций — это даёт возможность найти коэффициенты для пересчёта данных в единую систему. Генетикам важно знать, что прямое объединение опубликованных антропологических данных (без коннексии) может привести к резкому искажению результатов. Немаловажно поэтому, что в нашем случае коннексия данных проведена специалистом-антропологом — профессором В. Е. Дерябиным.
КОМПЬЮТЕРНАЯ КАРТОГРАФИЯ
Напомним, что первые (значковые) карты изменчивости отдельных антропологических признаков в русском населении были созданы и описаны В. В. Бунаком и Т. И. Алексеевой в 1965 г. [Происхождение…, 1965], а их обобщённые значковые карты созданы недавно В. Е. Дерябиным [Дерябин, 1999,2002]. Однако значковые карты являются лишь иллюстрацией уже выявленных закономерностей — они не могут служить объектом дальнейшего статистического анализа. Их нельзя напрямую сопоставлять с данными генетики. Напротив, компьютерная геногеография, создаёт полностью сопоставимые интерполяционные карты любых признаков — и генетики, и антропологии. Поэтому методами геногеографии мы можем объективно сравнить антропологический и генетический портреты русского народа, у нас появляется возможность картографического синтеза данных антропологии и генетики.
Созданные картографические Атласы антропологии русского народа имеют и самостоятельную ценность: в них впервые представлены интерполяционные (а не значковые) карты отдельных признаков и обобщённых параметров фенофонда. Полезная особенность Атласов еще и в том, что в них впервые построены карты для соматологических признаков, учитывающие данные и В. В. Бунака, и М. В. Витова. Поэтому раздел атласа (по данным АБВ) является наиболее полным на данный момент источником картографической информации об изменчивости соматологических признаков в русском населении.
Таблица 4.1.1.
Статистические характеристики карт антропологических атласов
4.2. ГЕОГРАФИЯ ПРИЗНАКОВ СОМАТОЛОГИИ
§ 1. Рост бороды и длина тела: Бородатый Юг — Бороды и реки — Высокорослый Запад — Без акселерации — Северные минимумы
§ 2. Скуловой диаметр, цвет глаз и волос: Широколицый Запад — Темноглазый Юг — От Поволжья на Русский Север — Различия карт цвета глаз и волос — Широтная изменчивость
§ 3. Горизонтальная профилировка лица и форма носа: Полосатая карта — Юго-западные спинки
Многие карты антропологического Атласа можно будет просмотреть на сайте . Поэтому здесь приведем карты лишь семи соматологических признаков (рис. 4.2.1–4.2.7), построенных по объединенным данным экспедиции В. В. Бунака и Т.П. Алексеевой и экспедиции М. В. Витова («АБВ»).
§ 1. Рост бороды и длина тела
РОСТ БОРОДЫ
Рассмотрение антропологических признаков стоит начать с самого примечательного — роста бороды.
Для каждого мужчины старше 30 лет он измеряется в баллах так, как показано на рис. 4.2.1.А. Балл 1 соответствует наименьшему росту бороды, а балл 5 — наибольшему, причём в общемировом, а не в региональном масштабе.
Рис. 4.2.1. А. Рост бороды. Схема определения баллов роста бороды (по [Рогинский, Левин, 1978]).
1 — очень слабый, 2 — слабый, 3 — средний, 4 — сильный, 5 — очень сильный.
Рис. 4.2.1.Б. Карта распределения роста бороды
Географические закономерности в распределении роста бороды показывает карта на рис. 4.2.1.Б. Картографируется популяционный показатель: для каждой популяции берется средняя величина между всеми индивидуальными баллами роста бороды (полученными для каждого из мужчин, обследованных в данной популяции). На карте светлые тона означают малые значения признака. Тёмные тона — большие значения признака.
Мы видим в «исконном» русском ареале чёткий градиент в направлении «север<=>юг». Малые значения роста бороды (с минимальным показателем 2.1 балла в Пермской, Вологодской и Архангельской областях) сосредоточены в северной части ареала русского народа. Тёмные тона, указывающие на более интенсивный рост бороды (с максимальным показателем 3.1 балла), находятся в южной части ареала. Условная граница легко проводится примерно по 59 параллели. Таким образом, условный рубеж проходит примерно по широте Новгорода Великого, а более южные Тверь и Кострому уже можно отнести к области более интенсивного роста бороды.
В таком элегантно простом распределении признака можно выделить два симметричных исключения: северо-восточный и юго-западный «коридоры» среднерусских значений (интервал от 2.5 до 2.6 балла, включающий в себя среднее значение карты 2.59). Северо-восточный «коридор» тянется вдоль Двины, Мезени и Печоры до самого побережья Баренцева моря. Юго-западный «коридор» средних и несколько пониженных значений роста бороды проходит в основном по Смоленской области, по границе России и Белоруссии.
Любопытный «язык» высоких значений тянется вдоль верхней Волги, тогда как Волго-Окское междуречье характеризуется промежуточной интенсивностью роста бороды.
Ту же закономерность можно описать и несколько иначе — менее схематично, пробуя найти географические факторы в изменчивости признака. Условная граница, разделяющая области с малыми и средними (конечно же, в «русском» масштабе) показателями роста бороды, достаточно точно следует извивам Волги. Популяции, расположенные на самой Волге и по её правым (южным) притокам, характеризуются среднерусскими баллами роста бороды. Популяции по левым, северным притокам Волги и вообще все северные популяции (т. е. бассейнов Белого и Балтийского морей) характеризуются низкими показателями роста бороды. Любопытно, что граница между областями со средними и высокими баллами роста бороды, в свою очередь, проходит по Оке. То есть при таком рассмотрении мы опять видим три области: северную (севернее Волги) с низкими показателями роста бороды, среднюю (Волго-Окское междуречье) со средними значениями роста бороды и южную (южнее Оки) с высокими баллами роста бороды. «Юго-западный коридор» пониженных значений хорошо укладывается в такую «речную» схему, поскольку популяции «коридора» относятся к бассейну Днепра, то есть они (как и северные популяции с низкими баллами роста бороды) не входят в бассейн Волги. Высокие баллы роста бороды свойственны в особенности популяциям на правобережье Оки и в территориально смежном бассейне Дона.
ДЛИНА ТЕЛА
Другие антропологические признаки не имеют столь ясного географического распределения, как только что рассмотренная интенсивность роста бороды. Коэффициент вариации (табл. 4.1.1.) позволяет сравнить степень изменчивости признаков, измеренных в разных шкалах (например, сантиметры длины тела и баллы роста бороды). Коэффициент вариации длины тела составил только 0.7, а для роста бороды — на порядок больше (7.9). Возможно, именно из-за этой небольшой изменчивости, карта длины тела (рост, измеряемый в сантиметрах, рис. 4.2.2.) не обнаруживает таких чётких закономерностей, как для роста бороды. Можно лишь указать общий тренд уменьшения длины тела в направлении с запада на восток и на север.
Рис. 4.2.2. Карта распределения длины тела
Напомним, что все приводимые антропологические карты описывают мужское население. Подчеркнём, что картографировались «послевоенные» показатели: обследования РАЭ и М. В. Витова проведены в пятидесятые годы. Для такого признака, как рост, это имеет решающее значение. Экспедиции проведены еще в то время, когда процессы акселерации мало затронули русское на- селение: наиболее интенсивна акселерация была в 60е-70е годы, а к 90м годам её процесс уже стал затухать [Харитонов и др., 2004]. Поэтому воплощённые на карте «послевоенные» данные «АБВ» информативны для изучения этногенеза. Они отражают интересующую нас историю формирования русского населения, а не временные флуктуации длины тела, по-разному проявляющиеся не только в разных регионах, но и в разных популяциях одного региона — на селе или же в городах.
Максимальные значения «послевоенной» длины тела у русских мужчин (более 168.2 см) встречаются на самом западе русского ареала. Цепочка популяций с высокими значениями тянется по западной границе ареала — от Финского залива до Брянской области. Следующий интервал (значения выше среднерусской величины 167 см) формирует обширное плато, объединяющее Волго-Окское междуречье и северо-западные области. Это плато, как подковой, охватывается с востока областью со значениями ниже среднерусских. На остальной территории русского ареала значения выше и ниже среднерусских сменяют друг друга неупорядоченно. Минимальные значения (длина тела ниже 165.8) концентрируются главным образом на севере. Первая из этих областей охватывает Онежское озеро и бассейн Онеги (с минимумом 164 см у онежских русских, обследованных РАЭ); вторая — низовье Мезени и бассейн Печоры (с минимумом 164.8 см у русских мужчин Нарьян-Мара). Эти две области низких значений разделяются полосой повышенных значений, тянущейся вдоль Северной Двины. Карта показывает области низких значений также на Ветлуге и на востоке той же Брянской области, на западе которой мы видим максимальные значения длины тела.
§ 2. Скуловой диаметр, цвет глаз и цвет волос
СКУЛОВОЙ ДИАМЕТР
В распределении скулового диаметра (ширина лица, измеряемая в мм) также не прослеживается явных географических закономерностей в ареале русского народа (рис. 4.2.3).
Можно лишь указать, пожалуй, что максимальные значения тянутся полосой на западе русского ареала. Самые широкие лица встречаются на границе с Белоруссией и странами Прибалтики. К северу от 60й параллели лица более узкие — характерны значения скулового диаметра меньше среднерусского. Наименьшие значения ширины лица обнаруживаются на северо-западе ареала, в области, расположенной западнее Онеги и к северу от Онежского озера. В целом карта показывает треугольник повышенных значений, имеющий основание на западе ареала и направленный вершиной на восток. Но эта картина значительно осложнена локальными максимумами значений на Ветлуге и в Поволжье. Как показывает гистограмма карты, два интервала значений, близких к среднерусским, занимают больше половины всей площади карты. Это выражается и в небольшом коэффициенте вариации, равном 0.8 (табл. 4.1.1).
Рис. 4.2.3. Карта распределения скулового диаметра.
ЦВЕТ ГЛАЗ
В сравнении с картой скулового диаметра, географическое распределение цвета глаз (рис. 4.2.4) представляется довольно выразительным.
Рис. 4.2.4. Карта распределения цвета глаз (средний балл).
Окраска радужины глаз измеряется шкалой, состоящей из 12 номеров, от № 1 — радужина настолько темно пигментирована, что не отличается от зрачка, до № 12 яркого синего цвета без каких-либо вкраплений других тонов [Рогинский, Левин, 1978]. Однако для вычисления популяционной оценки — среднего балла всей популяции — 12 номеров группируются в три класса. Светлые глаза — балл 0 (№ 9-12); смешанная пигментация радужины — балл 1 (№ 5–8); тёмные глаза- балл 2 (№ 1–4). Таким образом, признак имеет общемировой размах от 0 до 2.
В русских популяциях выражен достаточно отчётливый градиент увеличения тёмной пигментации глаз в направлении с северо-запада на юго-восток, хотя мы и не видим неразрывного ареала сходных значений пигментации на обширной территории. Самые тёмные (в русском масштабе) оттенки глаз сосредоточены, главным образом, на юге и на востоке «исконного» ареала русского народа. Здесь расположены значения выше среднерусского показателя — 1.6 балла. К западу и к северу от Москвы становятся более распространёнными оттенки глаз светлее среднерусских значений — смоленские, тверские, новгородские популяции попадают в эту область значений. Наименьшие значения признака (т. е. наиболее светлые оттенки радужины) вновь, как и для скулового диаметра, находятся в области, расположенной западнее Онеги и к северу от Ладожского озера. К востоку от этой области светлых оттенков глаз расположен «коридор» темноглазого населения, тянущийся от верхней Волги в северном направлении и доходящий почти до Мезени.
Этот и некоторые другие признаки, обнаруживающие схожее распределение (большее развитие третичного волосяного покрова, округлая форма головы, сравнительно невысокая верхняя губа и ряд иных признаков), позволили М. В. Витову выделить верхне-волжский комплекс, очень близкий к валдайскому антропологическому типу Е. М. Чепурковского. М. В. Витов указывает, что «верхневолжский комплекс распространен вдоль южных пределов Русского Севера. В собственно поморские области он как бы устремляется через Сухону и Юг — далее через Кокшеньгу и верхнюю Вагу на среднюю Двину и Пинегу» [Витов, 1997, с. 13].
ЦВЕТ ВОЛОС
Следующая карта (рис. 4.2.5) даёт представление о распределении цвета волос в ареале русского народа. Для этого признака характерен наибольший коэффициент вариации среди всех рассмотренных карт соматологии — 49.6 (табл. 4.1.1).
Рис. 4.2.5. Карта распределения цвета волос (частота тёмных волос).
К сожалению, в Русской антропологической экспедиции и в полевых исследованиях М. В. Витова цвет волос определялся с помощью разных стандартных шкал: М. В. Битовым — по шкале Фишера; в РАЭ — по шкале Бунака. Однако тёмные волосы (номера 4, 5 и 27 по шкале Фишера) определялись обеими группами исследователей одинаково. Поэтому на карте приведена частота (в %) встречаемости именно тёмных волос в русских популяциях.
Прежде всего, отметим, что географическое распределение цвета волос не только более чётко, чем для цвета глаз, но и отлично от него по географическому направлению изменчивости. Это хотелось бы особо подчеркнуть. Два показателя пигментации — глаз и волос — географически распределены в русском ареале достаточно независимо. Для пигментации волос мы видим ярко выраженную широтную изменчивость «север<=>юг». Наибольший процент тёмных оттенков волос (более 18 %) сосредоточен в южной части русского ареала, достигая в Воронежских, Брянских, Тульских, Тамбовских землях 25 % и выше. Причём территория с несколько более тёмной пигментацией волос, чем средний русский показатель (равный 12 % тёмных волос) занимает области к югу от Оки и основную часть Волго-Окского междуречья. В ряде северных популяций тёмные оттенки волос практически не встречаются. Частота тёмных волос составляет менее 6 % во многих популяциях Архангельской и Вологодской, а также Смоленской, Тверской, Новгородской, Ленинградской, Кировской областей.
Примечательны два «коридора» низких значений признака (т. е. более светло пигментированного населения), идущих к югу. Восточный коридор огибает Волго-Окское междуречье с востока и тянется с севера к Мордовии. Западный коридор огибает Волго-Окское междуречье с запада и тянется к Смоленску (частота тёмных волос менее 6 %). Однако в целом, можно провести условную границу между «светловолосыми» и «темноволосыми» (опять-таки в русском масштабе) популяциями — она проходит примерно по 58 широте. Конечно же, есть исключения из этого правила — они хорошо видны на карте. Например, ядро тёмной пигментации волос на самом северо-востоке русского ареала (21–22 %). Оно определяется двумя популяциями Печоры (русские Нарьян-Мара и Усть-Цилемского района Коми) и может быть объяснено процессами метисации: эта область по многим признакам (см., например, рис. 4.2.4.-4.2.7) выпадает из основных направлений изменчивости русского генофонда.
§ 3. Горизонтальная профилировка лица и форма носа
Ц е з а р ь: Клеопатра, ты хорошо видишь мое лицо? (Зловеще) Ты не находишь, что у меня очень длинный нос?
К л е о п а т р а (отшатываясь от него и замирая в ужасе): Ой!
Ц е з а р ь: Это римский нос, Клеопатра.
Бернард ШоуГОРИЗОНТАЛЬНАЯ ПРОФИЛИРОВКА ЛИЦА
Этот признак отражает степень ушющённости лица — обычно по нему в быту различают европеоидов и монголоидов. В антропологии для каждого индивида горизонтальная профилировка оценивается по трехбалльной системе в общемировом масштабе: балл 1 — уплощённое лицо типичного монголоида (когда, например, карандаш будет лежать на скулах, и нос не будет мешать этому!); балл 3 — резко выдающееся относительно горизонтальной плоскости лицо типичного римлянина или перса.
Карта распределения горизонтальной профилировки лица в русском генофонде (рис. 4.2.6.) отличается сложным, но очень любопытным рельефом: в нём чередуются широтно расположенные области пониженных и повышенных значений. На самом юге ареала расположена область значений несколько ниже среднерусских (менее 2.1). За ней между 52–55 параллелями следует область высоких значений (более профилированные лица). Далее вновь широкая область средних и пониженных значений признака (несколько уплощённые лица). А на севере (и на побережье Онежского озера) вновь отмечаются повышенные значения профилировки лица. В целом выделяется одна область пониженных значений (на востоке, по Ветлуге и Каме) и две области повышенных значений: одна на юге, по Днепру и Оке, другая, напротив, на севере вокруг Онежского озера и Белого моря. Однако основную часть карты занимают популяции со средней профилировкой лица и в целом колебания горизонтальной профилировки лица невелики — интервалы значений, близких к средней (от 2.05 до 2.15) занимают почти 60 % площади ареала. Соответственно, и коэффициент вариации для этого признака составляет не очень большую величину 3.8 % (табл. 4.1.1).
Рис. 4.2.6. Карта распределения горизонтальной профилировки лица.
ФОРМА НОСА
И, наконец (рис. 4.2.7.), последний из рассматриваемых карт признаков соматологии — форма носа (частота выпуклой спинки носа). Хотя размах изменчивости этого признака в «исконном» русском ареале четырехкратный (от 7 % до 28 %), но интервалы значений, близких к среднерусской (от 12 % до 18 %) занимают 70 % площади ареала. Коэффициент вариации при этом велик — 27.8 (табл. 4.1.1). Может быть, поэтому картографированием удаётся выявить достаточно чёткий тренд. Выпуклые спинки носа чаще встречаются на юго-западе русского ареала, простираясь и к центральным областям: популяции с частотой более 26 % встречены в Брянской, Калужской, Тверской областях. Реже выпуклая форма носа встречается на севере (около 7 % в Архангельской области и Карелии) и на востоке ареала — здесь становятся более частыми, напротив, варианты с вогнутой спинкой носа.
Рис. 4.2.7. Карта распределения формы носа (частота выпуклой спинки носа).
4.3. ГЕОГРАФИЯ КОЖНЫХ УЗОРОВ
§ 1. Кожные узоры: Узоры на кончике хвоста — Дуги, петли, завитки — Наследуемость — Изученные популяции
§ 2. Пальцевые узоры: дельтовый индекс: Уменьшается с юго-запада к северу — Четкий тренд при малой изменчивости
§ 3. Европеоидно-монголоидный комплекс: Круги на воде — Нет влияния Востока!
§ 4. Индекс основных ладонных линий: Широтные волны
Среди всех антропологических признаков наследственная компонента особенно велика у признаков дерматоглифики [Гладкова, 1966; Хить, 1983; Ящук (Балановская), 1985; Хить, Долинова, 1990]. Поэтому они могут служить своеобразным мостом между данными соматологии и генетики.
§ 1. Кожные узоры
Мы переходим к рассмотрению карт второй системы антропологических признаков — кожных узоров. Обычно изучается дерматоглифика ладоней и пальцев рук; реже — дерматоглифика стопы, и (для приматов) узоры на кончике хвоста.
Рельеф кожных узоров на них разнообразен и неповторим. Однако и его можно систематизировать и свести к определённым типам узоров и их комбинаций. Таких признаков выделено довольно много, но они обычно коррелируют друг с другом. Поэтому известными российскими специалистами в области дерматоглифики и этнической антропологии Г. Л. Хить и Н. А. Долиновой были выделены семь ведущих признаков, не связанных между собой внутригрупповой корреляцией [Хить, 1983; Хить, Долинова, 1990]. Вот эти признаки: дельтовый индекс пальцевых узоров; характеристики ладонных узоров — узоры на гипоте-наре, узоры на тенаре/I межпальцевой подушечке, дополнительные межпальцевые трирадиусы, положение осевых трирадиусов, индекс Камминса; а также общий показатель европеоидно-монголоидного комплекса признаков. Карты семи ведущих признаков мы и анализировали для русского генофонда.
ЧТО ЖЕ ТАКОЕ «КОЖНЫЕ УЗОРЫ»?
Приглядевшись к собственным кожным узорам (к кружеву кожных гребешков, а не к пересекающим их грубым линиям ладонных складок), можно различить непрерывные потоки кожных гребешков, которые растекаются по поверхности, не пересекаясь. А также несколько точек, где такие потоки сходятся, образуя так называемые дельты или трирадиусы. На рис. 4.3.1. представлены три основных типа пальцевых узоров — дуга (А — “arch”), петля (L — “loop”) и завиток (W — “whorl”) [Гладкова, 1966]. Простейший из узоров — дуги — дельт не образует. Петля образует одну дельту. Завиток обычно — две дельты, но может и три, поскольку к этому типу обычно относят и сложные составные узоры — из двух или трёх петель, из петли и завитка, из петли и Т-образных узоров и так далее. Обобщённый показатель — дельтовый индекс — рассчитывается как DL10=10(L + 2W)/(A+L+W). Если на всех пальцах только дуги (что является редчайшим исключением), то DL10=0. Если на всех пальцах только петли (что у европеоидов встречается довольно часто), то DL10=10. Если на всех пальцах только завитки (что часто встречается у монголоидов), то DL10=20.
Рис. 4.3.1. Три основных типа пальцевых узоров (из [Рогинский, Левин, 1978])
Для характеристики ладонных узоров поверхность ладони разбивается на 13 полей (рис. 4.3.2): узоры на гипотенаре — поле 4; узоры на тенаре/I межпальцевой подушечке — поле 1; дополнительные межпальцевые трирадиусы расположены на межпальцевых подушечках — поля 7, 9, 11; положение осевых трирадиусов — поля 2 и 3. Индекс Камминса служит обобщённым показателем направления линий А, В, С, D на ладонях. Например, на рис. 4.3.2. линия D оканчивается в 11 поле, С — в 9 поле, В — в 7 поле, А — в 5 поле.
Рис. 4.3.2. Схема выделения ладонных узоров и линий (из [Рогинский, Левин, 1978])
Рис. 4.3.3. Карта распределения дельтового индекса.
НАСЛЕДУЮТСЯ ЛИ «КОЖНЫЕ УЗОРЫ»?
Хотя тип наследования пальцевых узоров так окончательно и не установлен, однако общепризнанно, что компонента их наследуемости очень велика, причём за них отвечает небольшое число локусов [Хить, Долинова, 1990; Гладкова, 1966; Ящук (Балановская), 1985]. Для ладонных узоров наследуемость ниже, чем для пальцевых узоров. Однако в целом для признаков дерматоглифики она, несомненно, выше, чем для признаков соматологии. Именно поэтому признаки дерматоглифики особенно интересны и потенциально информативны при изучении генофонда.
По-видимому, комплекс генов, ответственных за кожные узоры, не так велик, как для остальных признаков антропологии. Не потому ли известно множество расхождений между классификациями популяций, основанными на признаках дерматоглифики, и привычными расовыми классификациями, основанными на соматологических признаках? Для дерматоглифики «…при значительной межгрупповой изменчивости нет полного совпадения с традиционными классификациями. Это вполне согласуется с фактом отсутствия взаимосвязи между дерматоглифическими и расоводиагностическими признаками. Некоторая географическая упорядоченность есть в признаке так называемого гребневого счёта, при котором делается подсчёт числа гребешков от дельты трирадиуса до центра узора» [Хрисанфова, Перевозчиков, 1999, с. 244–245].
ПРОСТЫЕ КАРТЫ
Приведём лишь три карты (рис. 4.3.3.-4.3.5.) для ведущих признаков дерматоглифики (полностью дерма-тоглифический Атлас будет представлен на сайте ). Число изученных по дерматоглифике русских популяций намного меньше, чем для признаков соматологии — 28 популяций. Соответственно меньше и «надёжный» картографируемый ареал.
Следуя правилу анализа «исконного» ареала, мы не включили данные по русским Симферополя — Крым находится за пределами «исконного» русского ареала. Другую удалённую от Центральной России выборку (г. Чердынь в бассейне Камы, Пермская обл.) мы, напротив, включили в анализ, поскольку эта территория, хотя и с натяжкой, может включаться в зону этногенеза русского народа. Сошлёмся здесь на авторитет В. В Бунака, включившего Пермскую область в программу Русской антропологической экспедиции. Эта популяция, расположенная далеко от основного массива данных, видна на картах как отдельный островок значений на востоке ареала. Остальные 27 популяций, по которым имеются дерматоглифические данные, без сомнения, относятся именно к «исконному» ареалу русского народа.
§ 2. Пальцевые узоры: дельтовый индекс
Дельтовый индекс DL10 равен сумме дельт на всех десяти пальцах рук, обобщая в количественной форме все пальцевые узоры человека. Чем больше у человека дуговых узоров — тем меньше DL10, чем больше завитковых узоров — тем больше DL10. Дельтовый индекс DL10 — единственный представитель пальцевых узоров среди семи ведущих признаков дерматоглифики. Остальные признаки описывают узоры на ладонях.
Карту географического распределения DL10 в русском ареале (рис. 4.3.3.) отличает чёткий рельеф и достаточно ясно выраженный градиент уменьшения дельтового индекса (т. е. уменьшения доли завитковых узоров) в направлении с юго-запада на север. Только две популяции несколько осложняют эту закономерность — на самом западе ареала Островский район Псковской области (низкие значения дельтового индекса) и на самом севере ареала Холмогорский район Архангельской области (средние значения). Такой чёткий тренд тем более удивителен, что размах изменчивости дельтового индекса невелик — от 11.7 до 13.3 при среднем значении для русских популяций DL10=12.5. Область средних значений занимает всего лишь 25 % площади ареала, подтверждая наличие двух зон: на юге высоких (в «русском масштабе») значений DL10, на севере — пониженных значений DL10.
Рис. 4.3.4. Карта распределения европеоидномонголоидного комплекса признаков.
Рис. 4.3.5. Карта распределения индекса Камминса.
§ 3. Европеоидно-монголоидный комплекс кожных узоров
Можно было ожидать, что наиболее яркие закономерности проявятся на карте европеоидно-монголоидного комплекса признаков, ведь этот показатель объединяет в себе наиболее информативные расово-диагностические признаки дерматоглифики. Градиент европеоидно-монголоидных признаков обычно следует направлению «западовосток». Однако оказалось (рис. 4.3.4.), что распределение этого комплекса в ареале русского народа не имеет ожидаемой клинальной изменчивости «западовосток». Напротив, при первом взгляде на карту мы вообще не видим никакой закономерности! Лишь вглядевшись, можно заметить своеобразный паттерн «кругов на воде». В центре ареала, охватывающем Москву, Калугу, Рязань, Тверь, Ярославль и доходящем на севере до Белозерья, находится область минимальных значений комплекса. Его окружает плотное кольцо максимальных (конечно же, в «русском» масштабе) значений комплекса. Однако на самой окраине картографируемого ареала вновь намечается новое кольцо — минимальных значений, которые мы видим и на севере, и на западе, и на юге русского ареала.
Отсутствие клинальной изменчивости по оси «европеоиды запада<=>монголоиды востока» может говорить о том, что для выявления внутренней подразделённости русских популяций нужен иной «диагностический» комплекс признаков. Иными словами, по вектору «монголоидности-европеоидности» кожных узоров русские популяции достаточно близки друг к другу и чёткие географические тренды отсутствуют. Это означает, что мы не обнаруживаем никаких «монголоидных» влияний на русский фенофонд — вопреки мифу о мощном влиянии «татаро-монгольского ига» на антропологический тип русского народа.
§ 4. Индекс основных ладонных линий
Индекс Камминса, обобщающий ход всех основных линий на ладонях, также на первый взгляд не обнаруживает чётких географических закономерностей (рис. 4.3.5). Тем не менее, за исключением трёх популяций Брянской, Курской и Воронежской областей с высокими значениями индекса, его рельеф можно смело отнести к типу широтно чередующихся волн высоких и низких значений (как, например, у горизонтальной профилировки лица, рис. 4.2.6). Значения индекса Камминса варьируют в русских популяциях от 8 до 9 условных единиц. Однако площадь, занятая популяциями со средними значениями признака (Jc=8.48) невелика — 19 % картографируемого ареала, что указывает на выраженную дифференциацию русских популяций по этому признаку.
На севере ареала (Архангельская область) мы видим высокие значения индекса Камминса. Южнее, вдоль 60й параллели, простирается широкая зона низких значений, охватывающая значительное число популяций: от Псковской области на западе — через новгородские, вологодские, костромские популяции — вплоть до Пермской области на востоке. Эта зона включает в себя и популяции с минимальными значениями индекса Камминса (Jc=8) — в Вологодской и Пермской областях. Южнее она сменяется вновь широтно тянущейся волной повышенных значений признака — с максимальными значениями для русского народа, фиксируемыми в Смоленской области. Еще южнее — вновь намечается широтная волна пониженных значений индекса Камминса, включающая в себя орловские, тамбовские и саратовские популяции.
4.4. ОСНОВНЫЕ ЧЕРТЫ ФЕНОФОНДА
§ 1. Обобщённые расстояния: Карта отличий от «среднерусского» генофонда — Меняем исходные данные — Меняем методы — Паттерн карты неизменен!
§ 2. Главные сценарии: Синтетические карты — 107 популяций по 30 признакам соматологии — Широтная изменчивость — 180 популяций по 18 признакам соматологии — Широтная изменчивость — 28 популяций по 6 признакам дерматоглифики — Широтная изменчивость — Верхневолжская и северная аномалии — Фенофонд и генофонд
§ 3. Географический метод: Полвека назад — И сейчас — Необходимость обобщённых карт — Карты расстояний — На них следы племен — Карты сценариев — Их единство — И все же генофонд!
«Когда с кого-нибудь снимут оковы, заставят вдруг встать, повернуть шею, пройтись, взглянуть вверх — в сторону света… он не сможет смотреть при ярком сиянии на те вещи, тень от которых он видел раньше. И что он скажет, когда ему начнут говорить, что раньше он видел пустяки, а теперь, обратившись к более подлинному, он обрёл правильный взгляд? Не считаешь ли ты, что это крайне его затруднит и он подумает, будто гораздо больше правды в том, что он видел раньше, чем в том, что ему показывают теперь?»
Платон «Государство»Мы не будем описывать все 55 карт отдельных признаков из Атласа антропологии русского народа — достаточно и десятка примеров! Хотя распределение каждого признака является фактом антропологической науки, но для нас все они в равной степени вспомогательные, все они служат промежуточными ступенями для достижения цели нашего исследования — выявления общей архитектоники генофонда. Именно поэтому мы привели десять не связанных между собою признаков кожных узоров и соматологии. Выбор мы осуществляли «не глядя», т. е. независимо от распределения признака по ареалу. Поэтому и можно считать, что такая небольшая выборка из многих антропологических признаков даёт некое общее представление об их изменчивости в «исконном» русском ареале. Во всяком случае, этой выборки оказалось достаточно, чтобы увидеть, сколь разные типы и направления изменчивости можно обнаружить, разглядывая лишь десяток карт!
Каждый из признаков по-своему рассказывает о генофонде. Гены, лежащие в основе этих признаков, имеют свою историческую судьбу, и потому каждый из них описывает лишь одну из многих сотен или тысяч версий истории народа и его генофонда. Каждый из них фиксирует лишь часть миграционных потоков, сложных переплетений межэтнических и внутриэт-нических взаимодействий, случайных событий дрейфа генов. Каждый даёт своё видение, свою проекцию генофонда. Пытаться проследить по отдельной карте судьбу генофонда — все равно, что описывать судьбу страны по биографии отдельного её жителя. Можно представить, сколь будут различаться описания многострадальной России, созданные пусть даже современниками, но представителями разных слоев населения. А карта отдельного признака сложнее — она включает напластования разных времён… Поэтому, если у нас нет оснований считать, что какие-то из признаков более правдивы, то надо пытаться выявить то общее и объективное, что есть во всем множестве признаков — рассказов «очевидцев».
Такие общие черты можно было разглядеть уже в описании отдельных карт — просматривая их, улавливаешь какие-то общие мотивы, часто встречающиеся паттерны. Видишь, как сквозь случайности начинают проступать некие общие черты. Но это видение может оказаться субъективным — оно зависит и от проницательности, и от опыта исследователя, и от многих часто не осознаваемых установок. Поэтому для описания общих закономерностей генофонда необходимо тем или иным образом объективно обобщить информацию по всем признакам.
Но как обобщить? Обычные статистические оценки дадут лишь одинокие цифры — единственный показатель для всего этноса, для всего многообразия его межпопуляционной изменчивости. Но для понимания пространственной структуры генофонда, понимания его географии необходимо знать, как конкретно эта изменчивость реализуется в каждой части русского ареала. Поэтому, чтобы не терять из вида всю сложность антропологического ландшафта, нам надо своими глазами увидеть обобщённую изменчивость для каждой части ареала, то есть увидеть карты обобщённых признаков.
Для такого обобщения и созданы карты фенофонда русского народа. Они составили последнюю и главную часть Антропологического атласа, к рассмотрению которой мы переходим. Главный вопрос, на который мы будем искать ответ с помощью карт генетических расстояний — насколько устойчивы выявляемые элементы структуры фенофонда? Насколько они зависят от метода построения карт и их анализа? От анализируемых признаков и популяций? Затем рассмотрим главные сценарии в изменчивости русского фенофонда — карты канонических переменных и их аналогов — главных компонент. И в заключение мы вспомним о традициях географического подхода в антропологии русского народа и рассмотрим, как они продолжаются в создаваемых геногеографией обобщённых ландшафтах карт.
Рис. 4.4.1. Карта генетических расстояний от общерусских характеристик по объединённым данным «АБВ» (РАЭ и М. В. Витова).
§ 1. Обобщённые расстояния
Карта многомерных расстояний уже описывалась в главе 2 (рис. 2.3.5.). Там же приведена её интерпретация — выявление западных и восточных ядерных структур (связанных соответственно со славянскими и финно-угорскими племенами, вошедшими в состав русского народа) и срединной «рифтовой зоны» — зоны интенсивных смешений обоих пластов населения.
Но на самом деле мы построили не одну, а целую серию карт обобщённых расстояний русского фенофонда. С одной стороны, все карты этой серии должны быть похожи друг на друга. Ведь все они отражают одно и то же важнейшее свойство: степень сходства значений каждой точки русского ареала со среднерусскими показателями, со средним русским «портретом». Но с другой стороны, все карты и отличаются друг от друга — методом построения, числом анализируемых признаков или популяций. Сравнивая разные карты этой серии, можно своими глазами увидеть и оценить, насколько различия в материалах и методах влияют на закономерности, выявляемые картой. Но мы не будем утомлять читателя всей серией карт — не все склонны к методическим изыскам.
Пролистнём все промежуточные карты и заглянем в конец этой части Атласа. Там находится карта (рис. 4.4.7.), отличающаяся от предыдущей (рис. 2.3.5.), почти по всем параметрам.
Во-первых, отличаются исходные данные. Для построения этой карты использованы не данные РАЭ, а объединённые («АБВ», см. раздел 4.1. и раздел 5 Приложения).
Во-вторых, отличается число популяций. Мы включаем в анализ более обширной круг русских популяций: 180 вместо 107 популяций.
В-третьих, и это главное — отличается ареал. Теперь мы охватываем более широкий ареал, ведь М. В. Битов основное внимание уделил Русскому Северу, менее представленному в данных РАЭ. Мы можем заглянуть теперь, как продолжаются (и продолжаются ли?) выявленные нами закономерности на Русском Севере.
В-четвертых, отличается число признаков. Число признаков стало больше: 18 вместо 8. Все эти признаки являются ведущими и дают достаточно полное представление об антропологическом облике русского народа.
В-пятых, отличается мера расстояний. При построении этой карты использованы наиболее корректные для анализа антропологических признаков многомерные расстояния Махаланобиса.
Итак, карта по всему массиву данных о русском фенофонде («АБВ», рис. 4.4.1.) отличается от карты, приведённой в главе 2 (рис. 2.3.5.), практически по всем мыслимым исходным параметрам. Насколько это сказалось на её ландшафте? Насколько он устойчив к изменению числа популяций, признаков, размера ареала, мер расстояний? Если ландшафт совершенно меняется при изменении каждого параметра, то говорить о том, что мы познали основные черты строения фенофонда русского народа, нельзя. Если же есть некие константы, есть неизменные структурообразующие элементы, которые не зависят от перемены параметров — то можно считать, что мы разглядели каркас пространственной структуры фенофонда. Тогда дальнейшее изучение антропологии русского народа будет «наращивать» информацию на этот каркас, уточнять выявленную картину, но не менять её кардинально.
Что же показывает сравнение этих карт?
Мы не будем подробно описывать картину, которую читатель может оценить и сам. Главный вывод налицо: обнаруживается удивительная устойчивость ландшафта.
Нам представляется крайне важным, что подробно рассмотренная ранее (глава 2) «рифтовая зона», следующая вдоль 38 меридиана (светлые области на черно-белых картах), становится еще более чётко выраженной (рис. 4.4.1). Это важно потому, что «рифтовая зона» отражает среднерусские значения. Именно эта область, её паттерн, должны быть наиболее чувствительны к малейшим изменениям параметров карты. Причём среднерусские значения, после введения данных М. В. Витова по Русскому Северу изменились — средняя величина теперь рассчитана не по 107, а по 180 популяциям, и северные русские популяции представлены более равноправно. Однако положение и характер «рифтовой зоны» остались прежними, несмотря на все изменения.
Для «ядерных структур» соотношение иное. Если два ядра отличаются от средних значений (тёмные ядра на черно-белых картах), это совершенно не означает, что они похожи друг на друга, поскольку они могут различаться, образно говоря, «в разные стороны». Подобно двум кометам, удаляющимся от эпицентра взрыва, которые могут следовать параллельным курсом или же стремительно разлетаться друг от друга, так же и значения «ядерных структур» могут быть сходными между собой или диаметрально различными. Поэтому близость или отдалённость тёмных ядер друг к другу/ от друга выявляется по их антропологическому «содержанию». Описание антропологического облика для всех «ядерных структур» мы дали в работе [Рычков, Ящук (Балановская), 1988]. Западные и восточные «ядерные структуры» приобрели большую чёткость и локализацию в пространстве на картах «АБВ», то есть при дополнении данных РАЭ данными М. В. Витова (рис. 4.4.1.). Введение в анализ столь большого массива новых популяций (он увеличился почти в два раза!) не изменило самих основ прежней картины, но прояснило многие её черты.
Такая устойчивость основных черт обобщённой карты достойна удивления! Мы в серии карт изменяли всё: метод построения исходных карт («компьютерные» или «ручные»), способ их обобщения (расстояния по Бунаку, по Махаланобису), количество анализируемых признаков (8 или 18), количество изученных популяций (107 или же 180). Но структурообразующие элементы не исчезали! Они меняли контуры и интенсивность проявления, но присутствовали на всех картах.
Это убеждаёт исследователя в объективности картографического анализа. Этот вывод важен для всего последующего изложения, для всего анализа генофонда. Мы будем помнить, что, используя те или иные маркёры, популяции, методы, способы обобщения, мы стремимся выявить те общие элементы каркаса генофонда, его структуры, его архитектоники, которые не сводимы к особенностям конкретных изученных маркёров, популяций, методов, способов обобщения.
§ 2. Главные сценарии
Убедившись в объективности картографического анализа, в качестве следующего шага рассмотрим главные сценарии в изменчивости фенофонда. Так образно именуют [Cavalli-Sforza et al., 1994] «синтетические» карты, за то, что они выявляют самые главные направления изменчивости генофонда, свойственные большинству признаков. Обобщённые карты предыдущего раздела отражали близость каждой точки ареала к средним показателям. Такие карты расстояний являются очень чутким, но вовсе не единственным методом картографического обобщения множества признаков. Из палитры этих методов наибольшей популярностью пользуются как раз синтетические карты — главных компонент или же их аналогов, канонических переменных (см. Приложение, раздел 3.).
Карты главных компонент создаются на основании карт исходных признаков. Эти новые карты обладают двумя важными свойствами — они не скоррелированы друг с другом и ранжированы по их «важности»: карта каждой последующей компоненты отражает меньшую долю изменчивости (дисперсии) всех исходных признаков, чем предыдущая компонента. Поэтому карта первой главной компоненты описывает «самый главный» сценарий изменчивости всех признаков — ту закономерность, которая встречается в изменчивости большинства признаков. Карта второй главной компоненты — второй по важности сценарий и так далее.
Для ведущих признаков дерматоглифики, не коррелирующих между собой [Хить, Долинова, 1990], нами созданы карты главных компонент. Для признаков соматологии, связанных внутригрупповой корреляцией, вместо главных компонент рассчитаны их математические аналоги — канонические переменные.
Карты главных «сценариев» изменчивости всех рассмотренных систем признаков — соматологии, дерматоглифики и генетики — построены с помощью одной и той же картографической технологии и потому полностью сопоставимы. Хотя анализировались первые три главных компоненты, здесь для краткости рассмотрим только «самые главные» сценарии (первой канонической переменной для соматологии и первой компоненты для дерматоглифики).
I. Данные соматологии: «РАЭ». Число популяций: 107. Число признаков: 30
С помощью многомерного статистического анализа данных Русской антропологической экспедиции ранее было показано, что первая каноническая переменная характеризуется изменчивостью, близкой к широтной [Дерябин, 2002]. Эта закономерность иллюстрировалась значковой картой.
Однако объективность значковых карт эфемерна. Значковые карты помещают «значок значения» только в те точки, где расположены изученные населённые пункты. Эти карты предлагают каждому читателю произвести интерполяцию на всю прочую территорию «в уме», причём эта процедура не всегда даже осознается создателями и читателями карт. Субъективные картины, возникающие в читательских умах, обычно не сравниваются — предполагается, что все видят то же самое, что и создатель значковой карты. К сожалению, нам не раз приходилось сталкиваться с тем, насколько по-разному интерпретируют значковую карту её читатели. А порой — и сами создатели. Оказывается, что при формальной объективности значковой карты (сама по себе она не содержит никакой интерполяции), её прочтение всегда субъективно. А ведь карта для того и строится, чтобы все читатели увидели объективно существующие пространственные закономерности во всём ареале. Конечно же, и компьютерные карты не могут избежать субъективности в их интерпретации — все мы видим мир по-разному! Но это происходит уже на следующем, неконтролируемом автором карты этапе, когда мировоззрение читателя берет верх над очевидностью карты. Самый важный этап — интерполяция данных из точек на ареал — проводится на наших картах однозначно, строго и объективно, позволяя нам всем интерпретировать одну и ту же карту, а не каждому из нас обсуждать с собой своё же собственное создание.
Поэтому рассмотрим интерполяционные карты, отражающие «главные сценарии» изменчивости фенофонда (антропологического покрова) в «исконном» ареале русского народа. Карта первой канонической переменной (рис. 4.4.2., 19.4 % общей изменчивости 30 признаков) описывает общую изменчивость 107 популяций, изученных Русской антропологической экспедицией. Основное направление ландшафта можно описать как широтное: максимальные значения расположены на юге «исконного» русского ареала, минимальные — на севере, а промежуточные значения тянутся между ними (рис. 4.4.2). От этой закономерности есть лишь одно, но чрезвычайно любопытное отклонение: гряда высоких значений тянется вдоль верхней Волги. К югу от Оки мы видим основное плато высоких значений первой канонической переменной. В Волго-Окском междуречье значения резко снижены, но по северной границе междуречья, вдоль Волги, тянется эта гряда высоких значений. Она как бы ответвляется от основного южного плато и заходит далеко на север. Наличие этой гряды было отмечено В. Е. Дерябиным и на значковых картах [Дерябин, 1999, 2002].
Обнаруженный широтный сценарий можно сопоставить с данными лингвистики — с подразделением на северные и южные русские говоры. Причём эта изменчивость чуть более сложна, чем просто «север<=>юг», — на самом севере, уже выходя за пределы надёжного пространства, намечается иная группа, возможно, указывающая на отличия поморов. Итак, первый главный сценарий изменчивости показывает, что в русском фе-нофонде основные различия обнаруживаются между северными и южными популяциями. Это не подразделение в таксономическом смысле, поскольку зоны экстремумов (максимальных и минимальных значений) на карте невелики, и основная часть ареала занята переходными значениями. Скорее можно говорить, что генофонды локальных русских популяций постепенно изменяются при движении по оси «юг-север».
Рис. 4.4.2. Карта первого сценария (первой канонической переменной) изменчивости по данным РАЭ (Русской антропологической экспедиции).
Впрочем, с тем же основанием эту закономерность можно обозначить и как «север-юг». Дело в том, что такие обобщённые признаки, как канонические переменные и главные компоненты позволяют выявить “ось” изменчивости, но её направленность, вектор можно интерпретировать, лишь привлекая косвенные данные смежных наук.
II. Данные соматологии; «АБВ». Число популяций: 180. Число признаков: 18
Рассмотрим теперь, какие общие закономерности можно выявить по объединённым данным РАЭ и М. В. Витова — «АБВ» (рис. 4.4.3.,
18.5 % общей дисперсии 18 признаков). Напомним, что эти карты опираются на число популяций, почти в два раза большее. На них хорошо представлен Русский Север, лишь фрагментарно отраженный на предыдущих картах. Резко меняется и спектр признаков — сценарии РАЭ основаны на картах 30 отдельных признаков антропологии, но сценарии по данным «АБВ» опираются лишь на 18 карт признаков. В связи со столь значительным изменением фактографической базы можно ожидать, что и карты резко изменятся.
Однако мы вновь видим, сколь велика устойчивость ландшафтов главных сценариев! Все структурообразующие элементы карт «АБВ» остаются теми же, что и на картах по данным РАЭ. Но данные М. В. Витова уточняют и проясняют многие закономерности, которые лишь намечались на картах РАЭ.
Так же, как основной сценарий РАЭ (рис. 4.4.2), эта карта характеризуется изменчивостью, близкой к широтной (рис. 4.4.3). Но это не просто “север-юг”. На карте РАЭ (рис. 4.4.2) лишь намечалась «северная аномалия» — при неуклонном снижении значений вдруг на самом севере вновь начиналось повышение рельефа, указывая на наличие иного антропологического варианта. Карта канонической переменной, построенная с учетом многочисленных данных М. В. Витова о населении Русского Севера, подтвердила наличие «северной аномалии», которая занимает значительную территорию по берегам Белого моря, в низовьях Двины и Печоры (рис. 4.4.3). Предположение о её связи с поморами кажется наиболее вероятным, хотя и требует проверки.
Отметим, что на карте сохраняется также и гряда повышенных значений вдоль верхней Волги, огибающая небольшое ядро пониженных значений в Волго-Окском междуречье.
III. Данные дерматоглифики. Число популяций: 28. Число признаков; 6.
Главный сценарий изменчивости признаков кожных узоров (рис. 4.4.4., 31.1 % общей дисперсии шести признаков) вновь выявляет все тот же уже знакомый ландшафт. Конечно, ведущих признаков дерматоглифики немного. К тому же, в отличие от соматологии, они отражают лишь один канал фенотипических проявлений генофонда — только кожные узоры пальцев и ладоней. Тем важнее, что основной сценарий по данным дерматоглифики следует той же закономерности, что и данные соматологии — широтной изменчивости. При этом «северная аномалия», выявленная по данным соматологии, здесь проявилась очень ярко, причём проявилась точно там же — в низовьях Северной Двины.
Рис. 4.4.3. Карта первого сценария (первой канонической переменной) изменчивости признаков по объединенным данным «АБВ» (РАЭ и М. В. Витова).
Другая особенность дерматоглифики: ядро максимальных значений, которое на карте соматологии располагалось на юго-востоке, в междуречье Волги и Дона (рис. 4.4.3), на карте первой компоненты дерматоглифики сместилось на запад, к бассейну Днепра.
Напомним крайне важное обстоятельство. При анализе данных соматологии и дерматоглифики мы использовали не только разные системы признаков, но и совершенно разные популяции! Более того, разнится не только спектр изученных популяций, но и их количество: по дерматоглифике изучено в шесть раз меньше популяций, чем по данным «АБВ». Поэтому, хотя и стоит обратить внимание на перечисленные особенности дерматоглифической карты, но частные элементы карты требуют проверки при дальнейшем увеличении числа изученных популяций. А вот характер основного ландшафта карты — в данном случае широтной изменчивости — чрезвычайно устойчив. Основная закономерность обычно выявляется даже при ограниченном числе популяций.
IV. Сходство «портретов» русского генофонда по разным типам маркёров
Можно ли оценить количественно степень сходства «портретов» русского генофонда, обрисованных двумя очевидцами — соматологией и дерматоглификой? И имеем ли мы вообще право говорить о русском генофонде, изучив только его фенофонд? Ведь мы пока оперируем только данными антропологии и используем только «внешние» черты облика русского населения. Оба вопроса столь важны, что мы, забегая вперёд, приведём из общей таблицы связей всех карт главных компонент (глава 10) ту её часть, которая имеет прямое отношение к антропологии (табл. 4.4.1). В таблице приведены коэффициенты корреляции между всеми картами первых, вторых и третьих главных компонент всех пяти очевидцев. Мы имеем редкую возможность сравнить показания антропологии с показаниями еще трёх свидетелей — фамилий, классических и ДНК маркёров. Наиболее важны в нашем случае последние двух очевидца, показывающие связь антропологии и генетики в их изучении русского генофонда.
Мы видим удивительную картину: антропологический портрет русского генофонда оказался очень сходен с портретами, нарисованными другими, столь разными очевидцами! Коэффициенты связи (г) варьируют от 0.52 до 0.85, в среднем составляя р=0.7! Причём самый низкий показатель связи оказался между главными сценариями самой антропологии — соматологии и дерматоглифики (r=0.52). Связь соматологии (1РСА) с обоими генетическими портретами очень велика — r=0.85 с классическими маркёрами и r=0.73 с гапло-группами Y хромосомы.
Этот результат — один из важнейших итогов книги. Именно он позволяет нам использовать данные антропологии как важнейший источник информации о генофонде. Это возможно лишь благодаря картографическому методу — карты впервые позволили антропологии и генетике заговорить на одном языке. И результат диалога оказался впечатляющим — обе науки рассказывают об одной и той же структуре русского генофонда.
Рис. 4.4.4. Карта первого сценария (первой главной компоненты) изменчивости признаков дерматоглифики.
Однако не оба раздела антропологии одинаково информативны — к данным генетики (1PCG и 1РСу) намного ближе оказались данные соматологии (1РСА: средняя корреляция с генетикой r=0.79), чем данные дерматоглифики (1PCD: средняя корреляция с генетикой r=0.46). Поэтому портрет русского генофонда, созданный дерматоглификой, отходит как бы на второй план. Он помогает увидеть особые своеобразные черты генофонда, но при характеристике «общей модели» генофонда, его архитектоники нам следует обращаться в первую очередь к соматологии.
§ 3. Географический метод
Антропология русских популяций — хорошо разработанная область. Уже само число изученных популяций показывает, что русский народ изучен подробнее большинства народов мира. Имена исследователей, которые изучали антропологию русского населения, широко известны и говорят сами за себя. Что же может добавить наше исследование? Свою задачу мы видели в том, чтобы ввести антропологические данные в изучение генофонда. И сделать это можно благодаря использованию карт.
ГЕОГРАФИЧЕСКИЙ МЕТОД В АНТРОПОЛОГИИ
При рассмотрении хорошо изученного русского народа исследователей привлекала не столько изменчивость отдельных признаков, сколько выделение ареалов антропологических типов. Поэтому в работах и М. В. Витова (1997), и В. Е. Дерябина (2002) анализ отдельных признаков целиком подчинён выделению антропологических комплексов (описания изменчивости отдельных признаков можно найти только в коллективной монографии РАЭ [Происхождение…, 1965]).
Позволим себе привести один пример эффективности географического подхода для выделения антропологических типов и для анализа истории генофонда. Этот подход применён более полувека назад — до появления компьютерной картографии. Его элегантность и широта мышления показывают, что компьютерные технологии — лишь техническое усовершенствование. Они показывают и то, что традиция «географического мышления», берущая начало от Е. М. Чепурковского — самый прочный фундамент для современных геногеографических построений.
Успешное использование географического подхода в антропологии продемонстрируем на одном лишь примере — на характеристике М. В. Битовым ильменско-беломорского антропологического комплекса. Он был выделен М. В. Битовым в Приильменье, по южному берегу Белого моря, на Мезени, в бассейне Двины. Этот тип отличают светлая пигментация глаз и волос, относительно высокий рост, удлинённая форма головы и лица, большие размеры головы и ряд иных особенностей. М. В. Битов связывает распространение этого антропологического типа с процессом новгородской колонизации, предполагая, что его первоначальными носителями были новгородские словене. Его антропологическая близость к населению северной Европы объяснима тем, что в состав и того, и другого типа вошли одни и те же элементы, восходящие к верхнепалеолитическому населению [Битов, 1997]. Аргументируя связь ильменско-беломорского комплекса с новгородской колонизацией, М. В. Битов приводит ряд доказательств.
К первому ряду доказательств относится сопоставление ареала ильменско-беломорского типа с древнейшим документом, описывающим ареал новгородских территорий в XII веке — Уставной грамотой Святослава Ольговича. Такой «палеогеографический» анализ выявил очень хорошее совпадение ареала ильменцев и территории «Святославовых погостов», главный сгусток которых был сосредоточен на нижней Двине, а также по южному и восточному берегам Онежского озера, на Онеге, верхней Сухоне и Ваге. Полного совпадения, конечно, не могло быть. В частности, «южные пределы территории, описанной в Уставе (земли по Сухоне и верхней Ваге), были перекрыты низовской колонизацией, шедшей с юга из бассейна верхней Волги, которая не могла не изменить физического облика первоначальных русских насельников» [Битов, 1997, с. 16].
Таблица 4.4.1.
Сходство главных компонент изменчивости антропологии, генетики и фамилий
Примечания:
1) Рассчитаны ранговые коэффициенты корреляции между картами первых трёх главных компонент пяти типов признаков: соматологии, дерматоглифики, классических маркёров, фамилий, гаплогрупп Y хромосомы.
2) Значения ниже 0.2 не показаны (обозначены как «-»).
3) Значения около 0.5 и выше выделены шрифтом и заливкой.
4) Коэффициент корреляции указан по модулю.
Корреляции между компонентами одного ранга (например, между всеми первыми компонентами) выделены прямоугольниками.
Второй ряд доказательств относится к данным лингвистики. Ареал ильменско-беломорского антропологического типа почти полностью соответствует распространению трёх близких северных диалектов — новгородского, поморского и олонецкого (частично). Убедительно звучит элегантное исследование М. В. Битовым географии диалектных терминов. Так, на Русском Севере широко используется термин «шелонник» — как особое имя для юго-западного ветра. Конечно же, крестьяне Поморья, рыбаки Белого моря и Мезени давно забыли происхождение этого диалектного слова. Но исторически оно легко объяснимо: этот термин «мог возникнуть только в Новгороде, река Шелонь впадаёт в Ильмень как раз с юго-западной стороны. На этот чрезвычайно важный распознавательный признак для истории колонизации обратил внимание известный русский этнограф Д. К. Зеленин» [Битов, 1997, с. 17]. Мы не можем отказать себе в удовольствии привести карту распространения диалектного термина «шелонник» (рис. 4.4.5), составленную М. В. Битовым [1997]. Население, называющее юго-западный ветер «шелонником», доныне характеризуется преобладанием ильменско-беломорского антропологического комплекса.
Рис. 4.4.5. Распространение названия «шелонник» для юго-западного ветра (по [Битов, 1997]).
Рис. 4.4.6. Распространение былинной традиции на Русском Севере (по [Битов, 1997]).
К третьему ряду доказательств относится сопоставление антропологических ареалов с этнографическими и фольклорными. Самым ярким и впечатляющим является сравнительный картографический анализ ареала распространения былинной традиции, которая характерна только для Русского Севера. На рис. 4.4.6. приведены центры распространения былин [Битов, 1997]. Территории, на которых записаны былины, обнаруживают замечательное совпадение с беломорской половиной ареала ильменцев. Это совпадение «с высокой степенью вероятности свидетельствует о том, что распространение ильменско-беломорского типа и былинной традиции является отражением одного и того же исторического процесса — новгородской колонизации» [Битов, 1997, с. 18]. При этом на исконной новгородской территории былины исчезли, что может быть одним из печальных последствий известных исторических причин — борьбы Москвы и Новгорода. Напомним, что и антропологический след новгородских словен — в отличие от остальных славянских племен — не обнаружен при геногеографическом анализе (раздел 2.3.)
Таким образом, географический метод в приложении к данным антропологии позволил разглядеть ход исторических процессов при формировании русского генофонда.
Мы ограничились лишь одним примером — обоснованием выделения ильменско-беломорского типа. Однако географический метод был применён для решения целого ряда вопросов формирования фенофонда русского народа. Это и путь расселения новгородцев. И борьба Новгорода и низовских земель за северные территории. Вдоль основной линии их борьбы в Подвинье удалось выявить постепенный переход в антропологическом типе населения — например, процент светлых оттенков глаз закономерно падает вдоль этой линии с севера на юг — от 67 % до 40 %. «Эта картина постепенной смены антропологического типа соответствует медленному освоению древних новгородских земель на Двине, которое шло со стороны Ростова, а позднее Москвы… Использование данных антропологии в сочетании с показаниями письменных источников даёт возможность проследить…» географию и историю русского народа [Битов, 1997, с. 29].
Приведённый пример показывает необходимость географического мышления при изучении истории народонаселения. Именно географический метод лежит в основе современной геногеографии. Но, кроме испытанного географического метода, у современной геногеографии появилась и мощная картографическая технология, то есть совокупность алгоритмов построения, преобразования и анализа карт, а также программная реализация всех этих функций.
Применение нашей картографической технологии к антропологическим данным имеет особую историю. Как рассказывалось в главе 2, начальный этап создания технологии был связан именно с данными по русской антропологии [Рычков, Ящук (Балановская), 1988]. Сознавая перспективы нового инструмента-обобщённого картографического анализа, обобщённых ландшафтов карт — авторы стремились показать то новое, что открывается на этом пути даже в столь тщательно и авторитетно разработанной области, как этническая история русского народа. Соединение географического, картографического и генетического подходов позволило извлечь из антропологических данных информацию по истории формирования русского населения. Мы имеем в виду и обнаружение трёх зон в ареале генофонда, соответствующих трёмэтапам его формирования, и обнаружение следов летописных славянских племен.
Геногеографическая технология из данных об антропологии современного населения извлекает информацию об его историческом прошлом — то есть осуществляет именно то, что пока не удавалось выявить в прямом палеоантропологическом изучении. Одно дело — дать краниологическую характеристику каких-либо курганных серий. Совсем иное — доказать, что это характеристика именно славян, а не славянизированного, образно выражаясь, «обращённого в славянство» населения, принявшего славянский язык и культуру. И, наконец, еще сложнее доказать, что те, кто погребён по позднему славянскому курганному обряду, передали свои гены длинной цепочке поколений, и их потомки составляют ныне ядро в антропологическом составе русского народа. От прошлого к настоящему — такая задача не имеет строгого решения. Мы никогда не знаем, дошла ли эта «эстафета» до нас, или же цепь передачи генетической информации прервалась на каком-то этапе. В этом случае до нашего времёни не дошли «гонцы» из изученных палеоантропологами популяций, разорвалась связь времён.
Зато постановка задачи и решение возможны, когда исследование ведется в обратном направлении — от современности к истокам.
Такая логика — чисто генетическая в своей основе, ведь последующие эпохи наследуют от предыдущих именно гены, а не антропологические признаки. Как же именно сочетать генетический подход, антропологию и картографирование? Ответ мы обсуждали выше — ключевым здесь является использование обобщённых карт. Карты отдельных признаков слишком разнообразны. Хотя на нескольких картах мы встретили четкую кли-нальную изменчивость, но этот тип рельефа карт оказался довольно редок. На других картах чередуются полосы высоких и низких значений, причём эти полосы могут идти как в широтном, так и в долготном направлении. Встретился и тип изменчивости, при котором области высоких и низких значений, также чередуясь, образуют концентрические круги. На некоторых картах вообще не удаётся увидеть никакой географической закономерности, столь сложен рельеф этих карт — мы отнесли их к типу «лоскутного одеяла».
Среди карт, которые мы не приводим в книге, встречаются самые разные типы изменчивости. Возможно, даже на приведённых картах читатель разглядит иные закономерности, нежели мы. Но вот что абсолютно невозможно: нет никакой надежды, что обнаружится какой-то один частный признак (будь то форма носа или гаплотип мтДНК), в карте которого раскроется общая история всего генофонда. Этого можно ожидать лишь от всей совокупности признаков, от всей совокупности карт. Чтобы из всего этого многообразия отдельных признаков извлечь информацию о структуре генофонда, нужно применить тот или иной метод обобщения.
ОБОБЩЁННЫЙ ЛАНДШАФТ: МНОГОМЕРНЫЕ РАССТОЯНИЯ
Первым типом обобщённых карт стали карты расстояний. Как говорилось, самая первая такая карта выявила три зоны в русском населении. Срединная «рифтовая зона» — близка к среднерусским характеристикам, а западная и восточная — отличаются от них. Чтобы проверить объективность этого результата, впервые опубликованного еще в 1989 году, мы построили целую серию таких карт, варьируя исходные данные и метод построения. Оказалось, что на всех картах выявляются эти три зоны.
Что же представляют собой западная и восточная зоны скопления «ядерных структур»? По самой технике анализа это территории, которые существенно отличаются от среднерусских величин, причём отличаются не по одному, а по совокупности антропологических признаков. Такие области с антропологически особенным русским населением включают целый ряд компактных «ядер», отделённых друг от друга «среднерусским» по антропологическому облику населением. Была предложена гипотеза, хорошо объясняющая такую картину: каждое из ядер представляет собой след одного из племен, населявших эту территорию. Тогда становится понятным, почему ядра разделены областями с характеристиками, близкими к среднерусским. При смешении населения, относившегося к разным ядрам (разным племенам), локальные популяционные характеристики нивелировались, усреднялись, что мы и видим сейчас на границах между ядрами. Это первое, что бросается в глаза при взгляде на карту — её составленность из многих «ядер».
Предложенная гипотеза хорошо объясняет и наличие западного и восточного скоплений ядер: западное скопление она связывает со славянскими племенами, причём расположение многих ядер соответствует локализации конкретных летописных славянских племен (см. главу 2). Восточное скопление — связывается с финно-угорскими племенами. А срединная полоса — с той зоной, где происходило интенсивное перемешивание этих двух пластов народонаселения, и как следствие — формирование обширной полосы среднерусских значений.
ГЛАВНЫЕ СЦЕНАРИИ
Вторым типом рассмотренных обобщённых ландшафтов стали карты канонических переменных или главных компонент. По выражению известного генетика Луиджи Луки Кавалли-Сфорца, каждая из карт главных компонент показывает один из главных сценариев, одну из основных схем, по которым шло формирование генофонда. Такие карты первых (по важности) сценариев, построенные по данным соматологии и по данным дерматоглифики, оказались удивительно похожи. По сути, это один и тот же сценарий постепенных изменений в населении при движении в широтном направлении (с юга на север или наоборот). То есть наиболее различаются южные и северные популяции, а посредине расположена широкая область постепенных переходов.
Итак, главные сценарии антропологии — как соматологии, так и дерматоглифики (а также и данные генетики, представленные в следующих главах) выявляют один и тот же тип ландшафта. Мы видели (табл. 4.4.1) что корреляция между главными сценариями антропологии и классических маркёров достигает r=0.85, а между главными сценариями антропологии и ДНК маркёров r=0.73. Если совершенно разные признаки, изученные по совершенно разному набору популяций, выявляют один и тот же строй в архитектонике генофонда, это может указывать лишь на одно: именно эта, пробивающаяся сквозь все несовершенства наших исследований, структура генофонда существует объективно.
Выявленное широтное направление изменчивости русского народа известно по данным лингвистики — северные, южные и промежуточные среднерусские говоры. В таком случае можно предположить, что широтная изменчивость отражает иной процесс, чем описанные ранее три зоны («славянская», «рифтовая» и «финно-угорская). Обобщённые антропологические карты расстояний (выявляющие три зоны) отражают расселение восточнославянских племен и смешение их генофонда с местным финно-угорским населением. А обобщённые карты главных компонент (выявляющие широтную изменчивость) выявляют либо два разных (северный и южный) потока славянской колонизации, либо две разных (северную и южную) субстратные группы финно-угорского населения. Можно выдвинуть и третью гипотезу — что широтная изменчивость, как некая поляризация внутри единого поля, возникла или же усилилась уже после формирования русского народа, параллельно с формированием северного и южного наречий единого русского языка.
Важно и иное. Говоря не об обобщённых картах, а о картах отдельных признаков, можно заметить, что, хотя в целом карты русского народа подчиняются тенденциям изменчивости того же признака на картах населения Восточной Европы, однако — благодаря внутриэтниче-скому антропологическому масштабу — они позволяют уловить и иные, собственно русские, закономерности (см., например, карты роста бороды и горизонтальной профилировки лица). Это значит, что в антропологической структуре русского народа геногеографические карты позволяют видеть не только результаты взаимодействия монголоидов и европеоидов, населения леса и степи, Прибалтики и Приуралья, но и структуры, связанные с этногенезом собственно русского народа. В следующей главе, рассматривая классические маркёры популяционной генетики, мы вновь увидим «особенную стать» русского генофонда.
АНТРОПОЛОГИЯ + ГЕНОГЕОГРАФИЯ=ГЕНОФОНД
И в заключение этой главы скажем о примечательной терминологической путанице, проходящей по главе красной нитью. Например, в предпоследнем абзаце: «антропологические карты… отражают… генофонд». Конечно же, правильнее было бы везде говорить об «антропологическом покрове» или возрождать термин «фенофонд». Формально правильнее, но вовсе не точнее. И хотя в названии раздела нам пришлось использовать понятие «фенофонд», мы предпочитаем подчёркивать, что антропологические данные несут прямую информацию именно о генофонде. Это признается большинством генетиков, судя хотя бы по тому, сколь охотно они привлекают данные по физической антропологии [см., например, самую основную и толстую геногеографическую монографию Cavalli-Sforza et al., 1994]. И если лингвистическое сходство или географическое соседство популяций рассматривается как указание на возможную общность их генофондов, то тем более за антропологическими данными надо признать право на прямую связь с генофондом. Необходимо лишь найти язык изложения научных знаний, на котором антропология и генетика могут объективно сравнить свои результаты и обсудить свои итоги. И мы надеемся, что карты, и в особенности обобщённые ландшафты антропологических и генетических данных, послужат таким общим языком, могут стать тем искомым «общим аршином», который позволит измерить, наконец, «особенную стать» русского генофонда.
Глава 5. КЛАССИЧЕСКИЕ МАРКЁРЫ
Никем не выявленной загадкой было утверждение, что группы крови равномерно распределены на земном шаре… Трагедия мировой войны помогла разрешить эту загадку. На македонском фронте было великое скопление народов и рас: солдаты английские, французские, сербские, русские, войска цветных — мальгашей, индусов и негров. Весь этот калейдоскоп рас и народов жил вместе в одном климате, все одетые одинаково и болевшие одними болезнями. В итоге различия в группах крови обнаруживались ярчайшим образом…
Л. Гиршфельд, Г. ГиршфельдОбрисовав в предыдущей главе черты антропологического портрета русского генофонда (глава 4) мы переходим к следующему его портрету — генетическому. Его мы восстанавливаем уже не по чертам внешнего облика русского населения, а по данным об изменчивости генов. Мы, наконец, делаем решительный шаг от фенофонда к генофонду. Поэтому в этой главе следует задать генофонду именно те вопросы, на которые лучше всего смогут ответить именно классические, а не иные генетические маркёры.
В чем достоинства классических генных маркёров, этих свидетелей, рассказывающих нам о генофонде? Есть ли у них недостатки? Насколько подробный портрет генофонда смогут они нарисовать? Каким способом лучше проанализировать эти данные, чтобы извлечь полную и достоверную информацию о генофонде? Что даёт статистический способ анализа? И почему мы всё же отдаём предпочтение картографическому способу? Если мы будем изучать генофонд с помощью карт, то изменятся ли при этом статистические параметры (средние частоты, разнообразие)? И если изменятся, то как? Попытки ответить на эти и иные вопросы, общие для всех генетических маркёров, даны в разделе 5.1.
Какова географическая изменчивость каждого из классических генетических маркёров? Их изменчивость в пределах «исконного» русского ареала рассмотрена в разделе 5.2. В нём приведены карты распространения аллелей, предложено их описание и интерпретация. Отметим одну особенность. В предыдущей главе — при анализе антропологии — мы строго ограничили себя только русскими популяциями, не включая в анализ даже ближайших иноэтничных соседей. Такое ограничение позволительно в области антропологии, где имеются прекрасные обобщающие работы по сравнительной антропологии народов Восточной Европы [см., например, коллективные монографии Происхождение…., 1965; Восточные славяне, 2002; а также Дерябин, 1998, 2002]. Однако по генетике русского народа и его соседей обобщающих работ практически нет. Поэтому, геногеографию русского народа мы рассматриваем не изолированно, а на фоне генетической изменчивости соседних народов, регионов или порой всей ойкумены. Это позволяет понять, какие черты русского генофонда объясняются обменом генами с соседями, а какие — собственной историей русского народа.
На сайте и в Приложении (раздел 6) приведены сводки данных о средних частотах и показателях межпопуляционной изменчивости (GST) классических маркёров как в русских популяциях, так и в крупных регионах мира. В сводке представлены Европа и Юго-Западная Азия, Индостан, Восточная Азия, Америка, Меланезия, Океания, Австралия, Африка, Северная Евразия. Для Северной Евразии приведены также данные и по субрегионам — Восточной Европе, Кавказу, Уралу, Средней Азии, Сибири. Пользуясь этими данными, читатель сможет сам сравнивать изменчивость классических маркёров в любых, интересующих его регионах.
Однако анализ карт отдельных генов (основное содержание раздела 5.2) — не самоцель, а лишь промежуточный этап для познания русского генофонда, его географии, его структуры, его истории. Насколько генетически различны популяции русского народа? Одинакова ли такая генетическая гетерогенность для русского и других народов Евразии? Различаются ли по уровню гетерогенности «типичные» народы Западной Европы, Восточной Европы, Кавказа, Урала, Сибири? Каковы основные географические закономерности в структуре русского генофонда? Эти главные вопросы рассматриваются в разделе 5.3.
Вопрос о том, каково положение русского генофонда среди окружающих народов Евразии, также требует ответа — хотя авторы сознают, что пока ответ может быть только предварительным. Этим вопросам посвящены заключительные главы книги (главы 8 и 9) где привлечены данные разных наук и рассмотрение проведено на широком фоне генофондов Евразии.
5.1. ОБЩИЕ ВОПРОСЫ И «КЛАССИЧЕСКИЕ» ОТВЕТЫ
§ 1. Смещены ли оценки разнообразия по классическим маркёрам? Описывают генофонд — Подробно изучены — Смещение оценок — миф! — Но живучий
§ 2. Зачем нужны карты? У каждого гена свои популяции — Статистик отрубит неизученное — Картограф изучит недоизученное — Искать закономерности в толпе цифр? — Лучше увидеть их на карте!
§ 3. Кого изучать? Только «исконный» ареал — Все его части — Коренные популяции — Коренные семьи — Правило третьего поколения — Одного из семьи
§ 4. Как устроены карты? Построение карты — Анализ карты — Выбор генов для атласа — Сорок четыре карты — Шагреневая кожа надёжного ареала.
§ 5. Что мы увидим на картах? Исходные данные и карты — Карты точнее! — Фактор числа точек — Фактор неравенства ареалов — Замечаем действие отбора — По отклонению от селективно-нейтральной изменчивости — Замечаем действие истории — По величине селективно-нейтральной изменчивости — А также по рельефу карты — Сфинкс
§ 6. Иерархия популяций: «матрёшки». В ойкумену вложены регионы — В регионах этносы — В этносах локальные популяции — Промежуточные матрёшки — Такова модель генофонда — Частота в локальной популяции — Этническая частота как средняя локальных — Региональная как средняя этнических — Но никак не средняя всех локальных! — Дисперсия локальных частот — Дисперсия этнических частот — Когда внутриэтническая нулевая — Можно прыгать через матрёшку — Но лучше проходить их все подряд — Всё это важно знать!
В этом разделе мы объединили общие вопросы, которые всегда возникают при изучении генофонда. На многие из этих вопросов из всех разнообразных генетических маркёров пока могут дать ответ именно классические маркёры.
§ 1. Смещены ли оценки разнообразия по классическим маркёрам?
КЛАССИЧЕСКИЕ МАРКЁРЫ
Классическими маркёрами принято называть гены, изучаемые не по их строению, а по их проявлению на уровне белков, на уровне фенотипа. Поэтому к группе «классических» маркёров (см. главу 1) относят все те многообразные генетические маркёры, с которыми работала популяционная генетика до наступления «ДНК-эры». Это и иммунологические маркёры, в длинный список которых входят всем известные группы крови (АВ0, Резус). Это и физиологические маркёры — генетически заданные особенности ощущения цвета и вкуса. Это и генетико-биохимические маркёры — различные ферменты эритроцитов и сыворотки крови (изредка — других тканей).
Все эти признаки объединяет то, что по их фенотипическому полиморфизму (разным проявлениям у разных людей) можно однозначно судить о генетическом полиморфизме — о конкретных вариантах генов (генотипах этих людей). Поэтому эти признаки фенотипа и называются генетическими маркёрами — ведь они маркируют гены, то есть дают нам знать, какой аллельный вариант гена скрывается за данным внешним проявлением признака.
И классические маркёры, и антропологические признаки мы определяем по их проявлению, по фенотипу. Однако разница есть, и немаловажная. Изучая антропологические признаки, мы знали, что за ними скрываются группы генов, но не знали — какие именно, не могли назвать эти гены по именам, узнать их «в лицо», не могли извлечь чисто генетическую информацию. Переходя к классическим маркёрам, мы переходим к столь простым признакам, что за каждый из них отвечает всего лишь один ген. Считается, что у классических генных маркёров путь от гена до признака столь невелик, что другие гены (или условия среды) не успевают вмешаться в результаты работы гена. И поэтому по внешнему проявлению, по фенотипу мы можем однозначно судить о генотипе. Следовательно, по множеству классических маркёров мы можем восстанавливать структуру самого генофонда, а не его преломление в фенофонде, как по признакам антропологии.
В следующей главе мы сделаем ещё один шаг и рассмотрим генетический портрет русского генофонда уже по молекулярно-генетическим (ДНК) маркёрам. Для них нам уже не надо будет знать даже фенотипического проявления генов — многие из ДНК маркёров такого проявления и не имеют. Для ДНК маркёров мы напрямую отслеживаем изменения самого генетического материала. Это проще и удобнее. Однако пока наиболее изученные в русских популяциях ДНК маркёры, на которые можно опереться — это гаплогруппы митохондриальной ДНК и Y хромосомы (глава 6). Но при всех их достоинствах, только двух — и столь своеобычных!
— генных локусов явно недостаточно для изучения всего генофонда. Поэтому до тех пор, пока не накопится достаточно данных по остальным ДНК маркёрам, наиболее надёжные данные о русском генофонде можно добыть, только опираясь на классические маркёры.
ОЦЕНКА РАЗНООБРАЗИЯ ГЕНОФОНДА
«Нет в мире совершенства» — справедливо считал Лис [Сент-Экзюпери, «Маленький принц»]. Наверное, и у классических маркёров есть изъяны? Надо сразу сказать, что основной упрёк классическим маркёрам
— смещение оценок разнообразия относительно всего генофонда — оказался несправедливым. Этот упрёк основывался на том, что классические маркёры тестируются по их белковым продуктам, которые обычно подпадают под действие естественного отбора. А ДНК маркёры тестируются прямо по нуклеотидным последовательностям, которые могут быть не подвержены отбору. И предполагалось, что из-за действия отбора различия между популяциями, рассчитанные по классическим маркёрам, искажены. Поэтому на заре «ДНК эры» широко распространилось мнение, что пора отрешиться от анализа генофонда по классическим маркёрам!
Оказалось, что этот шаг поспешен и неверен — классические маркёры точно и правильно оценивают разнообразие генофонда. В действительности, предположение, что классические маркёры дают искажённую оценку, неверно даже теоретически: ещё до появления первых оценок по ДНК маркёрам нами теоретически было показано, что среднее разнообразие популяций GST должно быть одинаково и по ДНК, и по классическим маркёрам [Рычков, Балановская, 1987, 19906]. Самая первая работа по межпопуляционной изменчивости ДНК маркёров, осуществленная коллективом L. L. Cavalli-Sforza ([Bowcock et al., 1987], см. подробно Приложение) подтвердила этот прогноз. И с тех пор все корректно проведённые сравнительные исследования давали тот же результат (см. Приложение и главу 8): полное соответствие межпопуляционной изменчивости, рассчитанной по классическим и по ауто-сомным ДНК маркёрам.
Уж скоро минет пятнадцать лет, как с классических маркёров было полностью «снято обвинение» в смещённости оценок [Bowcock et al., 1987; 1991а; Bowcock, Cavalli-Sforza, 1991; Cavalli-Sforza, Piazza, 1993]. И, тем не менее, до сих пор из диссертации в диссертацию кочует поверье, что по классическим маркёрам разнообразие не определишь. Научные мифы живучи. И эхо необдуманных предсказаний может десятилетиями тормозить развитие науки. До сих пор многие учёные, работающие с ДНК маркёрами, из-за этого поверья считают себя вправе не знать всё, что было получено по классическим маркёрам их предшественниками. Образовавшийся разрыв в преемственности науки создаёт ту свободу от прошлого, которая рождает легковесность и необязательность утверждений: «Свобода веток от ствола и корня, свобода плеч от тяжкой головы…».[27]
§ 2. Зачем нужны карты?
НЕРАВНОМЕРНОСТЬ ИЗУЧЕННОСТИ
Итак, упрёк в смещённости оценок разнообразия оказался неоправданным. Однако у классических маркёров всё же есть существенный изъян, хотя совсем иной — это крайняя неравномерность их изученности. Антропологические маркёры, как мы видели в главе 4, исследованы в большинстве популяций по единой программе — это обеспечивает полную сопоставимость популяций по всему набору признаков. По панелям однородительских ДНК маркёров также многие популяции изучены идентично. А по классическим маркёрам и аутосомным ДНК маркёрам программа исследований не была стандартизирована: в одних популяциях изучались одни маркёры, в других популяциях — другие маркёры. Если составить сводную таблицу, то мы увидим, что для каждой популяции изучен свой набор маркёров, а для каждого из маркёров изучен свой набор популяций. Это делает популяционную информацию по классическим маркёрам плохо сопоставимой.
Например, наше геногеографическое изучение генофонда Восточной Европы (глава 8) опирается на данные по 100 аллелям (34 локусов) в 1586 популяциях. Но ни одна из полутора тысяч популяций не изучена по всем 34 генам. Поэтому напрямую провести статистический анализ невозможно: в матрице 1586x100 большинство ячеек пустуют.
Эта проблема несопоставимости данных по разным популяциям постоянно возникает при анализе классических маркёров и затрудняет использование методов многомерного статистического анализа — главных компонент, генетических расстояний и так далее.
ГОРДИЕВ УЗЕЛ
Обычный выход из этой ситуации — резкое сокращение числа анализируемых популяций и числа анализируемых генов. В результате в анализ включаются лишь немногие подробно изученные популяции и немногие общепринятые маркёры
Например, из матрицы 1586x100 останутся в лучшем случае только 20x8, но зато все ячейки будут заполнены — каждая из 20 оставшихся популяций изучена по каждому из 8 аллелей.
Решение простое. Оно уничтожает не только проблему, но и информацию, с трудом собранную поколениями генетиков. Такой способ обращения с гордиевыми узлами могут позволить себе полководцы, а не исследователи. «Македонское решение» приводит к анализу лишь малой части всего генофонда и, следовательно, к малой надёжности результатов. Ведь несколько случайных популяций, которым посчастливилось быть изученным по этой панели маркёров, не могут надёжно представлять всю популяционную систему. А малый набор маркёров также не может служить характеристикой генофонда. В этом случае анализируется лишь случайный ряд популяций по нескольким генам, но не сам генофонд.
Иной — «не македонский» — выход из этой ситуации даёт геногеография. Она осторожно распутывает гордиевы узлы классических и аутосомных ДНК маркёров. По сведениям о популяциях, изученных по данному аллелю, геногеограф прогнозирует частоту этого аллеля в остальных, «пропущенных» популяциях. Специальные процедуры картографической интерполяции помогают найти наиболее вероятные значения признака для тех популяций, по которым исходная информация отсутствует. В результате заполняются «пробелы» вырожденной матрицы и в анализ включаются все изученные популяции и репрезентативный набор генных маркёров. Карты «надёжности» [Нурбаев, Балановская, 1997, 1998] позволяют выбрать из всей совокупности интерполированных (прогнозируемых) значений лишь те, которые обладают высокой надёжностью (см. Приложение).
ОБЪЕКТИВНОСТЬ КАРТЫ
Есть и ещё одно важное достоинство карт. Сравним таблицу исходных данных и карту, построенную на её основе. Сводку всех основных данных по изменчивости классических генных маркёров в русских популяциях мы привели в Приложении (раздел 6) и на сайте . Однако читатель, заглянув туда, сразу убедится, сколь непросто проследить по этим табличным
§ 3. Кого изучать?
— Сколько дипломов надо иметь, чтобы считаться интеллигентным человеком?
— Нужны три диплома о высшем образовании: дедушкин, папин и свой собственный.
Поскольку мы перешли к «настоящим» генетическим маркёрам, перечислим первые вопросы, которые следует задать при создании их картографического атласа. В пределах какого ареала нужно изучить генофонд данного народа? Какая территория может считаться этническим ареалом при исследовании его истории? Какие необходимо изучить популяции, чтобы выявить реальные генетические различия в пределах ареала? Каковы должны быть выборки? Иными словами, какие части этнического ареала и какие части населения мы непременно должны изучить, чтобы выявить реальную структуру генофонда? Перечисленные ниже правила формирования выборок относятся не только к классическим — к любым генетическим маркёрам.
ТОЛЬКО «КОРЕННОЕ» НАСЕЛЕНИЕ
В подавляющем большинстве геногеографических исследований — не только наших, но и в мировой науке — используется принцип изучения «только коренного населения». Он включает несколько правил, которые помогают решить: какие ареалы, какие популяции и каких именно индивидов стоит включить в обследование, чтобы удалось реконструировать историю генофонда? Расскажем о некоторых из этих правил.
ПРАВИЛО ПЕРВОЕ: ИСТОРИЧЕСКИЙ АРЕАЛ ЭТНОСА
Этим правилом задаётся круг генетически обследуемых популяций. Обычно анализируются только популяции в пределах «исконного» ареала этноса, то есть той территории, на которой этот народ исторически сформировался.
Подчеркнём: границы «исконных» этнических ареалов определяются не генетиками, а специалистами в области этнографии, лингвистики и других гуманитарных наук. Генетики всегда только используют данные гуманитарных наук и никогда не определяют «исконность» ареала по данным генетики! Не потому, что не хотят (кто-то, может быть, и захочет…) — а потому, что это невозможно по определению.
Для определения «исконного» ареала не так важно, что народ после своего формирования мог расширить, сузить или сменить территорию расселения.
Примером могут служить адыги, после Кавказской войны переселившиеся не только в Турцию, но и во многие страны Передней Азии, Ближнего Востока и даже Мадагаскара. Однако их «исконный» ареал по-прежнему остается на Западном Кавказе, несмотря на то, что ныне там плотность славянского населения намного превышает плотность коренных народов.
Важно учесть и то, что набор анализируемых популяций должен представлять все основные части этнического ареала. Если все изучаемые популяции будут сосредоточены лишь в одной части ареала (например, все изученные русские популяции будут только из Саратовской области), то мы получим характеристику не всего народа, а лишь изученной части (подменим русский генофонд генофондом русских Поволжья).
ПРАВИЛО ВТОРОЕ: АРЕАЛ ПОПУЛЯЦИИ
Этим правилом задаётся круг населённых пунктов, которых можно изучить для характеристики локальной популяции, принадлежащей к данному этносу и живущей в пределах его исторического ареала. Например, в нашей экспедиционной работе из всех населённых пунктов в пределах изучаемой популяции обследуются те, которые в наименьшей степени были подвержены влиянию миграций и потому могли сохранить наиболее древний, коренной генофонд.
Для выполнения этого правила необходимо каждый раз чётко формулировать, какая именно популяция представляет интерес для изучения генофонда. И уже в пределах её ареала отбирать индивидов для включения в выборку.
Например, если мы хотим изучить популяцию коренного населения Краснодарского края, то корректнее изучить не всё проживающее там русское население, а только потомков кубанских казаков. Они могли сохранить те генетические черты, которые помогут реконструировать веками складывавшуюся структуру русского генофонда. Современное же население Краснодарского края (в котором потомки кубанских казаков составляют лишь очень малую часть) из-за мощных ветров миграций скорее внесёт путаницу в деле реконструкции истории генофонда. Поэтому для изучения истории русского народа в выборку индивидов, представляющих Краснодарский край, мы включили только потомков кубанских казаков.
Если же встанет иная задача — изучение недавних событий в русском генофонде — то правила выбора индивидов и ареала, из которого они должны происходить, станут совсем иными. Если нам потребуется изучить «мгновенный» (сиюминутный, эфемерный) срез генофонда Краснодарского края — мы должны будем обеспечить создание такой выборки.
Но даже в этом случае нельзя брать первых попавшихся представителей населения края — они не создадут случайную репрезентативную выборку даже для «сиюминутного» среза. Ведь всё будет зависеть, где эти люди нам «попались» — ведь та часть края (или та поликлиника, в которой мы решили собирать выборку) может быть совершенно отличной от реальной структуры генофонда. Например, если мы организуем наш сбор образцов в аэропорту, всё будет зависеть, откуда или куда отправлялись в «сию минуту» самолеты.
ПРАВИЛО ТРЕТЬЕ: «ПРАВИЛО ТРЕХ ПОКОЛЕНИЙ»
При изучении истории русского генофонда мы старались следовать «правилу трёх поколений»: включению в выборку только тех индивидов, ВСЕ предки которых до третьего поколения (все бабушки и деды) не только относились к данному этносу, но и родились в пределах ареала данной популяции.
Конечно, для этого надо составлять родословные. Соблюдение этого требования позволяет избежать влияния недавних миграций. Следуя ему, мы исключаем из генетико-исторического исследования, например, тех людей, чьи родители переселились на эту территорию из иных областей. Пока ещё неизвестно, оставят ли они свой генетический след в популяции? Поэтому «правило трёх поколений» позволяет учесть только те миграции, которые уже оставили реальный след в генофонде (например, ныне многочисленных потомков семьи, переселившейся на изучаемую территорию столетие назад).
Применение этого правила можно проиллюстрировать следующим примером. При изучении генофонда Псковской области мы выбрали для обследования две популяции, в которых и ныне сохраняется коренное население и которые достаточно полно представляют сложную историю русского населения Псковской земли: отражают и собственно псковское, и новгородское население. Первая популяция — Островский район, собственно псковитяне. И обследуя её, мы формируем выборку так, чтобы в нее попали только те индивиды, все бабушки и дедушки которых родились в Островском районе. Вторая популяция — Порховский и Дедовиче-ский районы — сначала входили в земли Новгородские, и лишь после падения Новгорода отошли ко Пскову. Поскольку оба района (и Порховский, и Дедовический) представляют популяцию с единой историей и в равной степени отражают интересующее нас население, то, обследуя эту популяцию, мы формируем выборку так, чтобы в нее попали только те индивиды, все бабушки и дедушки которых родились в пределах этих двух районов (Порховского и Дедовического). В этом случае мы не требуем принадлежности предков к одному району, как в случае Островского района — а к любому из двух, соседних и исторически сходных. Этот пример показывает, что выбор популяций определяется целиком историей формирования народа — не имея возможности генетически изучить все популяции, мы выбираем для анализа ключевые для понимания истории и структуры генофонда. Ареал изучаемой популяции в первом примере равен одному району, а во втором — двум.
ПРАВИЛО ЧЕТВЁРТОЕ. ИСКЛЮЧЕНИЕ РОДСТВА
Родословные надо знать и для того, чтобы не включать в выборку родственников — родство между индивидами в выборке также исключается до третьего поколения.
Например, если на обследование пришли два индивида, и обнаружилось, что их бабушки или дедушки являются друг другу братьями или сестрами, то мы включаем в выборку лишь одного из двух пришедших. Это и понятно — если мы включим в выборку родственников, то повторно возьмём одни и те же гены. Из-за этого реальная выборка становится меньше, да к тому же может произойти «смещение» частот генов популяции в сторону какой-либо семьи. В русских селах такое смещение может произойти даже тогда, когда мы обследуем только один край села — ведь родственники чаще селятся рядом.
ПОПУЛЯЦИИ ДЛЯ АНАЛИЗА КЛАССИЧЕСКИХ МАРКЕРОВ
При картографировании классических маркёров в русских популяциях мы сочли возможным — в порядке эксперимента — несколько отклониться от буквы первого из правил. В историческую территорию формирования и «исконного» расселения русского народа никак не могут быть включены территории Прибалтики, Причерноморья, Предкавказья, Нижней Волги, Приу-ралья, не говоря об Урале и Кавказе. С другой стороны, последние столетия характеризуются массовым распространением русского населения на этих обширных территориях, их смешением с автохтонным населением и даже формированием новых популяционных образований (например, камчадалы, изоляты сибирских староверов, Ленские старожилы и др.). Поэтому в анализ мы включили данные не только по территории формирования русского народа, но и некоторые популяции из смежных областей, оставаясь при этом в пределах Восточной Европы. Результаты такого эксперимента подробно описываются во многих разделах данной главы.
Мы отобрали для анализа русские популяции, расположенные от 43° до 70° северной широты и от 24° до 60° восточной долготы[28]. При всей условности такого отбора данных, он позволил автоматически исключить из рассмотрения многие территории, оторванные от основного ареала. Хотя при этом мы несколько вышли за пределы «исконного» ареала, подчеркнём, что только такая особенность русского народа, как его массовое расселение на огромных территориях Евразии, вынудила нас рассматривать, строго говоря, и некоторые «некоренные» популяции. В заданную область пространства попадает небольшая часть территории соседних с Россией государств — Прибалтики, Белоруссии, Украины. Однако особо подчеркнём: только русское население этих территорий включалось в анализ! Так что и в статистическом анализе, и на картах русского генофонда присутствуют только русские популяции, расположенные в пределах заданной области.
ИНДИВИДЫ ДЛЯ АНАЛИЗА КЛАССИЧЕСКИХ МАРКЕРОВ
Что же касается третьего правила (формирование выборки индивидов), то здесь мы ограничены подходом авторов, публикации которых использованы при создании Банка данных о русском генофонде. В отечественных генетических исследованиях выборка из популяции обычно составляется из неродственных лиц, которые рождены на данной территории и родители которых относятся к данному этносу. Некоторые авторы, к сожалению, определяли принадлежность к популяции и этносу лишь по происхождению самого индивида, а не его предков. Однако многие другие авторы собирали данные много тщательнее — учитывались места рождения и этническая принадлежность всех четырех бабушек и дедушек пробанда. Это позволяло избежать случайных колебаний миграционного потока и учесть в выборке только наиболее устойчивые миграции, генетический след которых сохранился в популяции и по прошествии двух поколений. Именно такие выборки дают наиболее полное представление об исторически сложившейся структуре генофонда.
§ 4. Как устроены карты?
Главным «прибором», показывающим структуру русского генофонда, служат геногеографические карты. Технология создания карт достаточно подробно описана в Приложении. Для читателя, не заглядывающего в другие разделы, кратко повторим основные моменты, необходимые для лёгкого чтения и понимания карт, приведённых в этой главе и всей второй части книги.
СТРОИМ КАРТУ
Для построения карты используется информация об изученных русских популяциях. Каждая из этих популяций служит «опорной точкой». По совокупности опорных точек рассчитываются значения частоты аллеля в каждой точке карты. Для карт классических маркёров число изученных популяций (опорных точек — К) варьирует от 8 (локус HLA*B) до 182 (группы крови АВ0). Число же точек карты (узлов сетки) очень велико — 9064, и значение в каждой точке карты рассчитывается по данным обо всей совокупности опорных точек (К) — исходных популяций, изученных по данному маркёру.
Географическое положение опорных точек указано (тёмными кружками с белым обрамлением) на самой карте. Понятно, что в тех областях карты, где опорных точек много, можно получить надёжно прогнозируемые значения во всех узлах сетки, во всех точках этой области. А там, где опорных точек мало (например, в периферийных областях карты), рассчитанные значения в узлах сетки карты будут ненадёжны. Такие «ненадёжные» точки карты мы не анализируем. Поэтому, хотя общее число узлов сетки одинаково для всех карт русского генофонда (9064 точек), число надёжных точек намного меньше — от 895 (локус KEL) до 4355 (локус АВ0). Именно это число — число надёжных точек карты — указано в легенде карты (N). Только эти точки отображаются на карте и включаются в любые виды статистического анализа. Число опорных точек (К) также приведено в легенде карты.
Чтобы карта была информативна, важно легко на ней ориентироваться, соотносить выявляемые зоны генетического рельефа с другими географическими объектами — странами, областями, городами, реками, природными зонами, этническими ареалами и так далее. Для этого на всех картах приведены береговые линии морей и гидрографическая сеть (озера, реки), горные хребты, государственные границы, несколько крупных городов (значимых, согласно замыслу книги, скорее для средневековой, чем современной, России), а самой надёжной привязкой карты к реальному географическому пространству служит, разумеется, градусная сетка.
ЦИФРОВАЯ МОДЕЛЬ КАРТЫ. Процедуры построения и анализа компьютерных карт подробно описаны в Приложении. Здесь напомним лишь, что в основе компьютерных карт лежат их цифровые модели (ЦМ) — двумерные числовые матрицы частот аллеля, а значения частоты аллеля прогнозируются для каждого узла сетки карты. Для создания такой матрицы пространство карты было покрыто густой равномерной сетью, состоящей из 9064 узлов. Для каждого узла сетки с помощью интерполяционной процедуры рассчитано значение частоты аллеля. В расчёте значений каждого узла участвовали все изученные русские популяции в пределах заданного радиуса, взятые с весом, обратным расстоянию от популяции до данного узла сетки. Параметры картографирования для русского генофонда: использована нулевая степень полинома, шестая степень весовой функции и учитывалась информация об исходных популяциях в радиусе 2000 км. Такой расчёт проводился независимо для каждого узла сетки. Это означает, что для каждого из 9064 узлов сетки учитывались одни и те же опорные точки (реально изученные популяции), но расстояния до популяций и, следовательно, вес каждой популяции при определении частоты аллеля в данном узле сетки — менялись. Часто спрашивают: зависит ли карта от того, с какого угла мы начнём её строить? Еще раз подчеркнём — рассчитанные значения в каких-либо узлах сетки никак не влияют на определение частоты аллеля в других её узлах. Отвечаем на вопрос: поэтому-то совершенно неважно, откуда мы начнём и в каком порядке будем проводить расчёт для разных узлов карты.
СОЗДАНИЕ ИЗОБРАЖЕНИЯ. Но цифровая модель — это матрица, таблица. Чтобы отобразить её в виде карты, каждое значение окрашивается своим цветом — в зависимости от того, в какой из интервалов попадает это значение. Шкала интервалов задаётся исследователем-автором карты. Понятно, что образ одной и той же карты (одной и той же ЦМ) может различаться в зависимости от избранной шкалы. Поэтому так важно следовать определённым правилам выбора шкалы (см. Приложение). Шкала обязательно приводится в легенде каждой карты. Граничные значения интервалов шкалы приводятся под гистограммой. Сама гистограмма и числа над столбцами гистограммы указывают долю площади карты, занятой точками, значения в которых попали в данный интервал.
НАДЁЖНОСТЬ. Карта каждого аллеля сопровождается специальной картой надёжности — она для каждого узла сетки указывает достоверность рассчитанного значения частоты аллеля [Нурбаев, Балановская, 1998]. Значения принимались как достоверные, когда вероятность правильного прогноза составляла Р>0.95 при уровне строгости[29] r=0.3. «Ненадёжные», то есть слабоизученные области, залиты на картах белым цветом и заточкованы, и все характеристики карты рассчитываются только по надёжному пространству. Число узлов карты (N), вошедших в «надёжное пространство» данного аллеля, указано в легенде каждой карты.
После того, как для каждого «надёжного» узла сетки получен независимый прогноз частоты аллеля, создание цифровой модели (ЦМ) карты завершено. Далее с ЦМ (как с обычными матрицами) проводим все дальнейшие преобразования и статистические расчёты — корреляций, трендов, главных компонент, получая количественные оценки связей и закономерностей. При этом карта, содержащая прогнозированные значения для каждой точки, становится не иллюстрацией, а математической моделью пространственной изменчивости. Карта служит инструментом количественного анализа генофонда. Это значит, что карта становится не «графическим», а «алгебраическим» объектом.
КОРРЕЛЯЦИИ. Связь частоты аллеля с широтой и долготой оценивалась не только обычным — единственным — значением коэффициента корреляции, но ещё и строились три корреляционных карты. Одна такая карта содержала в каждом узле показатели корреляции значения признака с широтой. Другая — с долготой. Третья — показатель множественной корреляции с широтой и долготой. Среднее значение корреляции по всем точкам карты является аналогом обычного коэффициента корреляции. Сама же карта показывает, какова теснота связи в том или ином регионе, в той или иной части карты. Ведь вполне возможна ситуация, когда в одном регионе изменчивость аллеля широтна, а в другом — коррелирует с долготой. Более того, при переходе от региона к региону может измениться даже знак корреляции. В этом случае обычный коэффициент корреляции неэффективен, и реально существующую закономерность может выявить только корреляционная карта.
Для построения корреляционных карт используется разработанная нами процедура «плывущего окна» (см. Приложение, а также [Балановская и др., 1994а, б; Балановская, Нурбаев, 1995]). В каждом узле сетки указан показатель корреляции, рассчитанный для «плывущего окна» — области карты заданной площади, в центре которой находится данный узел. Иными словами, для совокупности всех узлов сетки, попавших в это «окно», рассчитывался коэффициент корреляции между частотой аллеля в этих точках и географическими координатами (широтой, долготой) этих точек. И полученное значение коэффициента корреляции заносилось в центральный узел окна. Затем окно перемещалось на один узел сетки, и операция повторялась. После того, как окно «проплыло» по всей карте и все её узлы побывали центральными, каждый из «надёжных» узлов получил свое значение корреляции признаков. Из этих значений построена карта корреляций, показывающая, как меняется уровень связи (корреляции) в различных частях карты. В таблице 5.2.1 приведены MIN, MEAN, МАХ, — соответственно минимальное, среднее и максимальное значения коэффициента корреляции. Напомним, что в статистике коэффициенты частной корреляции меняются от -1 до +1, а множественные — всегда положительны (от 0 до 1).
ТРЕНДЫ. Для большей простоты и наглядности в работе приведены карты, полученные при небольшом окне сглаживания (фоновые карты или «карты трендов», см. Приложение, а также [Балановская, Нурбаев, 1995]). Эти карты, также как и корреляционные, получены с помощью процедуры «плывущего окна». Только в центральный узел заносились не коэффициенты корреляции, а средняя частота по всем узлам сетки, попавшим в «плывущее» окно. В результате «сглаживались» резкие колебания частоты гена — ведь такие колебания частоты между соседними популяциями обычно связаны с несовершенством популяционных выборок. В таблице 5.2.1. и в легендах соответствующих карт раздела 5.2 приведены статистические характеристики исходного (несглаженного) генетического рельефа.
СТАТИСТИКИ КАРТ. Использованы следующие обозначения: MIN, MAX, MEAN — соответственно минимальное, максимальное и среднее значения частоты аллеля, GST — межпо-пуляционная изменчивость, HS — вклад данного аллеля в общую гетерозиготность локуса. Построенные нами компьютерные геногеографические карты характеризуют изменчивость 44 классических генетических маркёров в русском ареале. Конечно, в данной главе мы можем обсудить лишь часть этих карт. Однако в сводной таблице 5.2.1. приведены основные характеристики всех 44 аллелей. Напомним также, что многие карты Атласа русского генофонда, в том числе и раздел классических генных маркёров, представлены на сайте .
АТЛАС
Картографический Атлас русского народа по классическим генным маркёрам состоит из двух основных разделов — «простых» и обобщённых карт (глава 3 и Приложение, раздел 5).
Первый раздел Атласа вобрал карты географического распределения в «исконном» русском ареале частот отдельных аллелей, а также результаты их анализа. Каждую простую карту (каждого аллеля) сопровождают карты трендов различной степени «сглаженности» и корреляционные карты — с географической широтой и долготой.
Второй раздел Атласа содержит карты, обобщающие изменчивость не одного аллеля или локуса, а всех вместе. Они отражают средние показатели разнообразия всего русского генофонда по классическим маркёрам: карты гетерозиготности и межпопуляционных различий, карты корреляционных связей, карты генетических расстояний и главных компонент изменчивости в историческом «исконном» ареале.
При создании Атласа из банка данных «Русский генофонд» по классическим маркёрам были выбраны гены, по которым изучено хотя бы около десятка популяций. При этом мы учитывали географию изученных популяций — они должны представлять самые разные части «исконного» русского ареала. Иначе — если все популяции относятся лишь к одной части ареала — то, хотя бы этих популяций было и много, но такая информация не охватывает всю реальную изменчивость гена. И такой ген лучше не включать в анализ русского генофонда (это относится к локусам АK, C3F, GD, КР, LU, Р). В итоге, хотя карты были построены для всех 66 аллелей, в картографический Атлас вошли карты 44 аллелей 17 локусов — ABO, АСР, ESD, GC, GLO1, HP, MN, 6PGD, PGM1, PI, PTC, RH*d, TF, CV, KEL, LEW и HLA. Для всех 17 локусов был проведён картографо-статистический анализ, но в обобщённый анализ последние 4 локуса (CV, KEL, LEW и HLA) мы не включали — слишком слаба их изученность в «исконном» русском ареале.
Подробная информация о каждой из карт — частоты (минимум, максимум, средняя), гетерозиготность и межпопуляционная изменчивость, корреляция с широтой и долготой, число изученных популяций и величина «надёжного» ареала картографирования — приведена в разделе 5.2. Даже эта информация показывает, насколько неравно изучены классические маркёры! Из таблицы 5.2.1. мы видим, что локус LEW представлен всего лишь 9 русскими популяциями, в то время как локус АВ0 (известный всем как «группы крови») — 182 русскими популяциями. Среднее число популяций, изученных по 17 локусам, составило 35. Много это или мало? Конечно, по сравнению с данными антропологии, охватывающими 180 популяций (см. главу 4) классические маркёры изучены в пять раз хуже. Однако всё познаётся в сравнении — классические маркёры в среднем изучены в два-три раза лучше, чем ДНК маркёры (см. главу 6).
На всех картах значения показаны только для «надёжной» зоны, а все остальные территории показаны как «белые пятна» в изученности русского генофонда. «Надёжная» зона — это территория, хорошо обеспеченная исходными данными, которую карта надёжности оценивает как область достоверного прогноза. Если карты антропологии (глава 4) охватывали одну и ту же территорию, а их «надёжные» зоны были всегда одинаковы, то для классических маркёров всё переменчиво: по одним маркёрам «надёжные» зоны оказываются в пять раз меньше, чем по другим. Это привело к тому, что обобщённые карты русского генофонда, представленные в разделе 5.3., по площади невелики. Их «надёжная» зона, как шагреневая кожа, сокращается при включении слабо изученных маркёров. Она определяется надёжным ареалом наименее изученных генов — только так можно обеспечить надёжность карт, обобщающих изменчивость всех генов.
§ 5. Что мы увидим на картах?
ОТ ТАБЛИЦЫ — К КАРТЕ
Но прежде, чем переходить к анализу карт, следует представить: а что же собственно происходит с исходной информацией, когда мы её картографируем? Ведь мы как бы возвращаем табличные популяционные данные, безразличные к пространству, в собственный географический ареал этих популяций, где эти данные вновь начинают жить в двумерном пространстве карты и соотноситься в нём с другими популяциями. Они находят своих географических соседей, и лишь в согласии (или в споре) с ними рождается карта. Но что при этом происходит с исходными оценками популяционных частот? Изменяются ли статистические параметры признаков (средние частоты, разнообразие), когда мы их картографируем? И если изменяются, то как?
Вопрос не праздный. Мы недаром приводим в разделе 5.3. две средние оценки гетерогенности русского народа (генетических различий между русскими популяциями — GST). Одна из них (GST=2.00) получена по табличным данным для того, чтобы сравнить её с табличными данными по другим народам Евразии. Вторая оценка гетерогенности (GST=1.36) получена по картографированным значениям для того, чтобы сравнить её с изменчивостью каждой из карт русского народа (см. раздел 5.1). Причём мы специально рассчитали обе оценки строго по одним и тем же популяциям и строго по одним и тем же генетическим маркёрам (44 аллеля 17 локусов). Однако, как мы видим, различия между этими двумя оценками велики (GST=2.00 и GST=1.36). И возникают эти различия в результате процедуры картографирования.
Так какая же оценка более «правильная»? Решающим аргументом служит то, что при картографировании учитывается новый параметр — география, учитывается важнейший атрибут популяции — её ареал. Если до этого для изменчивости гена было как бы одно измерение — лишь его частота, то теперь появляются ещё два измерения — двумерное пространство геногеографической карты. Карта учитывает географию гена. И поэтому мы считаем, что оценка, полученная по карте, является более точной — она уточняет статистические параметры изменчивости гена, рассчитанные просто по табличным данным, при игнорировании реального географического пространства, в котором живут популяции.
Но чтобы это утверждение не было голословным, рассмотрим на конкретных примерах, что в действительности происходит при переходе от таблицы к карте.
ЕСТЬ ЛИ РАЗЛИЧИЯ МЕЖДУ СТАТИСТИКАМИ КАРТ И ТАБЛИЦ?
Для ответа на этот вопрос проведём моделирование на разных генофондах. Возьмём в качестве модельных объектов три иерархически соподчинённых генофонда: 1) Белоруссия; 2) Черноморо-Балтийский регион (для краткости назовём его «Западным»), который включает в себя, кроме Белоруссии, также Украину, Молдавию, Литву, Латвию, Эстонию; 3) Северная Евразия, которая включает в себя и Черноморо-Балтийский, и все остальные регионы бывшего СССР. Мы видим, что каждый последующий генофонд включает в себя, как матрёшка, предыдущий и позволяет прослеживать закономерности более высокого порядка. Такой «принцип матрёшки» позволяет выявлять общее и особенное в пространственной структуре каждого из генофондов, а с методической стороны даёт возможность провести анализ с внутренним контролем. В качестве модельных генетических маркёров возьмём два самых подробно изученных. Это, конечно же, группы крови — всем известные как I, II, III и IV группы локуса АВ0 и резус (RH).
Таблица 5.1.1.
Сравнение средних частот (М) и межпопуляционных различий (GST) для исходных («таблица») и картографированных («карта») значений признаков
Примечание: состав регионов указан в тексте.
Чтобы критически оценить новую информацию, которую вносит учёт географического ареала популяций, рассмотрим для каждой из «матрёшек» по два распределения. Первое распределение («табличное») характеризует данные таблиц до картографирования — частоты гена в изученных популяциях. А второе распределение («карточное») характеризует карты — картографированные значения. Мы не будем утомлять читателя гистограммами (они приведены на картах модельных регионов в [Балановская и др., 1994; Балановская, Нурбаев, 1995]), и приведем только средние значения частоты аллеля (М) и межпопуляционные различия (GST) до и после картографирования (табл. 5.1.1).
Сравнение таблиц и карт показывает, что нет единой закономерности изменений при картографировании: всё зависит от самого гена, от особенностей его распределения и изученности. Каждый из показателей (М и GST) при переходе от таблиц к картам может как уменьшаться, так и увеличиваться!
В чем причина таких разночтений? То новое, что вносит карта, связано с двумя основными факторами, действующими противоположно.
Первый фактор — большее число анализируемых точек. На карте всегда больше число промежуточных значений, чем в таблице: число узлов сетки N всегда намного больше числа исходных популяций К. Поэтому только за счёт появления множества промежуточных значений между опорными точками дисперсия (и, соответственно, GST) картографированных значений уменьшается (по сравнению с дисперсией табличных значений), а гистограмма на карте становится более плавной.
Второй фактор — неравенство популяционных ареалов — обычно сказывается противоположным образом, то есть увеличением разнообразия карты (GST). Этот фактор оказывается ведущим тогда, когда есть связь между частотой признака и площадью, занятой данным интервалом частоты. Этот фактор не только увеличивает разнообразие, но и меняет среднюю частоту признака на карте, сдвигая его в сторону значений, распространённых на большем ареале.
Например, пусть зоны с минимальными (частота равна 0) и зоны с максимальными (частота равна 1) частотами признака резко различаются по площади их ареалов. Пусть площадь зоны минимумов (Nmin) в 10 раз меньше, чем площадь зоны максимумов (Nmax):(Nmin)=10. А в таблице число изученных популяций для каждой из зон одинаково: Kmax=Kmin. Тогда из таблицы мы получим среднее значение частоты равное 0.5.
А на карте — среднее значение частоты будет близко к единице (0.91). И карты дадут более корректный результат — он учитывает географическое пространство и размер популяционных ареалов. И этот пример невыдуманный. Например, мы можем изучить множество популяций кавказских народов на небольшом пространстве Кавказских гор — и столько же популяций на бескрайних просторах Сибири. Причём изученность народов (среднее число популяций, изученных для одного народа) может быть одинаковой — просто размеры этнических ареалов резко различны на Кавказе и в Сибири. И, характеризуя изменчивость Евразии, мы не имеем права смещать её средние оценки в сторону меньшего по площади Кавказа только потому, что на этой небольшой территории проживает множество народов.
Есть и третий фактор — влияние интерполяционной процедуры. Но его воздействие на изменчивость карты неоднозначно и зависит от параметров интерполяции.
При интерполяции ортогональными полиномами нулевой степени узлы сетки могут содержать только значения частот аллеля, промежуточные между значениями в опорных точках. Например, узлы сетки, расположенные вокруг исходных популяций с частотами 0.2 и 0.6, будут нести только промежуточные значения — 0.21, 0.30, 0.40, 0.50, 0.59. Это уменьшает дисперсию (и GST) при переходе от таблиц к карте. Однако при интерполяции ортогональными полиномами первой степени картина иная. При продолжении географического тренда признака на области, не обеспеченные опорными точками, в этих областях формируются значения не промежуточные, а соответствующие продолжению тренда. Например, увеличение частоты аллеля от 0.2. до 0.6 может сопровождаться продолжением тренда в узлах сетки — частотами 0.70,0.80, 0.90. Это увеличивает дисперсию карты (GST).
Рассмотрим действие первых двух факторов в наших модельных регионах.
Действие первого фактора ярко проявляется для населения Белоруссии и Западного региона (табл. 5.1.1): разнообразие карт (GST) примерно в полтора раза меньше табличных, хотя средние частоты (М) не изменились при создании карт обоих генов (АВ0 и RH). В этих регионах различия в популяционных ареалах не очень велики, а потому и действие второго фактора сведено к минимуму. Он практически не действует и тогда, когда нет систематических различий в частоте гена между популяциями с резко различными ареалами. Именно это характерно для гена АВ0*0 в Северной Евразии (табл. 5.1.1). Поэтому картографирование гена АВ0*0 в Северной Евразии не изменило ни его среднюю частоту, ни межпопуляционное разнообразие.
Иной случай отражён на карте распределения частоты гена RH*d в Северной Евразии (табл. 5.1.1.), где большое число европейских и кавказских популяций с высокими значениями частоты гена обладает малыми ареалами, в то время как для популяций Сибири и Казахстана характерны низкие значения признака при обширных популяционных ареалах. Поскольку задача карты — представить распределение признака по всему географическому пространству, «вес» азиатских популяций при построении карты настолько выше, насколько больше их ареал. Именно это отражено и в различной форме гистограмм карты RH*d (двухвершинной для таблиц, одновершинной для карт), и в увеличении (по сравнению с табличным) разнообразия карты (GST), и в изменении среднего значения (М) в сторону сибирских величин.
Если задать вопрос: а какие значения «правильней»? То ответ будет однозначным — конечно, значения карт. Табличные значения вынужденно «забывают» о популяционных ареалах и потому игнорируют различия в них. Кроме того, европейские популяции с высокими частотами RH*d изучены намного более подробно, чем азиатские, и потому резко «перевешивали» при прямом анализе табличных данных. Возвращение к географическому пространству карт восстанавливает равновесие и справедливость.
Подобное моделирование позволило ответить на вопрос: что происходит с информацией, когда мы картографируем исходные данные? Зная ареалы и частоты, параметры интерполяции, можно предсказать, как изменятся статистические параметры признаков (средние частоты, разнообразие) при построении карты. При этом статистические показатели карты, как мы видели, более точны и справедливы.
МЕНЯЮТСЯ ЛИ ИСХОДНЫЕ ЧАСТОТЫ В
ИЗУЧЕННЫХ ПОПУЛЯЦИЯХ?
Но остался ещё один вопрос, который всегда нам задают: что происходит с исходными популяционными данными? Меняются ли при переходе от таблицы к карте частоты генов в самих изученных популяциях? Здесь ответ всегда однозначен — нет!
При любых параметрах интерполяция всегда затрагивает только промежуточные точки пространства (картографический прогноз), а сами изученные популяции (опорные точки) всегда сохраняют на карте ту частоту, которая была указана в таблице. Это одно из основных условий алгоритма построения карты. А вот последующие трансформации карты уже могут затрагивать исходные популяционные частоты, поскольку при всех последующих операциях все узлы карты равноправны — как те, которые были изучены при экспедиционном обследовании, так и узлы с интерполированными значениями. Например, при создании «сглаженных» карт для выявления трендов (основных направлений изменчивости) происходит усреднение в пределах заданного окна карты. Это помогает найти «золотую середину», когда соседние популяции из-за ошибок выборки дают разные показания, при этом значения в опорных точках немного сдвигаются в сторону среднего значения.
ЕСТЕСТВЕННЫЙ ОТБОР
Теперь зададимся иным вопросом. В какой степени карты классических маркёров могут отражать действие естественного отбора в популяциях?
Эритроциты и сыворотка крови человека содержат целый ряд белков разнообразного функционального назначения. Серия аллелей каждого локуса контролирует синтез серии вариантов белка, причём эти варианты могут различаться активностью, термостабильностью, степенью сродства к субстрату, количеством соответствующего белка в организме, различными иммунными характеристиками и другими особенностями. Поэтому география аллелей может быть вызвана — наряду с эффектами дрейфа и миграций — и действием отбора на тот или иной аллель (см. Приложение). Если действие отбора различно в разных частях ареала (дифференцирующий отбор), то разнообразие картографируемых значений возрастает. Если же действует стабилизирующий отбор
— то разные популяции становятся более похожими друг на друга, чем при селективной нейтральности, и мы видим на карте сниженное разнообразие. Однако «отделить» эффекты отбора от действия иных факторов микроэволюции — задача непростая [Алтухов, 2003; Динамика популяционных генофондов…., 2004]. Целый цикл работ [Балановская, Нурбаев, 1997, 1998а, б, в] мы посвятили технологии выявления эффектов отбора через анализ генетических различий между популяциями. Но, поскольку это большая и самостоятельная тема, то мы откладываем её рассмотрение на будущее. А в этой книге возможное действие отбора оцениваем лишь предварительно, через сравнение межпопуляционной изменчивости данного аллеля и селективно-нейтрального уровня дифференциации (см. Приложение, раздел 2).
Селективно-нейтральная изменчивость русского генофонда оценена в среднем по всем картам: GST=1.36 (44 аллелей 17 локусов, наиболее подробно изученных в русском генофонде). Карты аллелей, демонстрирующие более низкую изменчивость (GST<1.36) позволяют предположить действие стабилизирующего отбора, а более высокие межпопуляционные различия (GST>1.36) — действие дифференцирующего отбора (см. Приложение, раздел 2.; а также [Алтухов, 2003; Динамика популяционных генофондов…., 2004]).
Отвечая на вопрос «Зачем нужны карты?», мы обсуждали в § 2, насколько неравномерно изучены популяции по разным классическим маркёрам. Достаточно взглянуть на таблицу 5.2.1., чтобы убедиться, что число изученных популяций по одним генам в двадцать раз меньше, чем по другим. Конечно же, поэтому неодинаковы и «надёжные» ареалы этих генов, достигая пятикратных различий. Тогда возникает вопрос: сравнивая межпопуляционные различия GST с селективно-нейтральной GST, действительно ли мы оцениваем отбор? Не может ли так случиться, что гены, картографированные на меньшем ареале, только по этой причине будут и менее изменчивыми, то есть обладать меньшей величиной GST? А гены, детально изученные и с большим картографируемым ареалом, — обладать большей величиной GST? Чтобы разрешить это сомнение, мы рассчитали коэффициенты ранговой корреляции между изученностью и GST для 44 анализируемых карт по данным таблицы 5.2.1. Оказалось, что связи нет — корреляция между величиной межпопуляцион-ных различий GST и числом изученных популяций К равна r=0.041. А корреляция между GST и размером ареала (измеряемым в числе узлов равномерной сетки карты N) составила r=0.096. Это означает, что сравнивая межпопуляционные различия GST с селективнонейтральной GST, мы действительно оцениваем эффект отбора, а не изученность гена.
ИСТОРИЯ
Другим фактором, отражённым на картах, является история населения. Если действие отбора «индивидуально» для каждого аллеля, то история одинаково беспристрастна к любым генам. Лишь однородительские маркёры (митохондриального генома, Y хромосомы) однобоко — или только с материнской, или только с отцовской стороны — описывают историю генофонда. Но в случае с классическими маркёрами мы практически всегда имеем дело с основным массивом генов — с аутосомными генами, регистрирующими миграционные события независимо от пола мигрантов.
Разумеется, те или иные исторические миграции могут быть ярче отражены на карте какого-либо отдельного аллеля, чем генофонда в целом. К примеру, если родина «исхода» мигрантов и принявшее их автохтонное население различаются по частоте какого-то аллеля, а по остальным маркёрам неразличимы, то такая миграция может быть выявлена только с помощью карты этого единственного аллеля. Но такие случаи нечасты и, главное, неважны — такая миграция генетически не эффективна и не важна для истории генофонда в целом. Чем по большему числу генов и резче различаются генофонды — «исхода» и «новой родины» — тем больше генетическая эффективность миграции, тем больше её влияние на генофонд. Но и обнаруживаем мы тогда следы миграции на картах практически всех маркёров!
Поэтому в общем случае, когда мы ставим целью изучение истории сложения генофонда, для нас важны лишь генетически эффективные миграции, отражённые в изменчивости большинства генов. В тех частных случаях, когда генетика выступает как исторический источник для изучения истории конкретных миграций населения, карты некоторых генов, зафиксировавших эти миграции, могут оказать неоценимую помощь. Важно только очень осторожно пользоваться этим инструментом, учитывая все особенности карты и гена. Слишком часто желаемое принимается за действительное, и тогда начинает казаться, что чуть ли не каждая карта каждого гена сообщает об интересующем историческом событии. Много миграций протекло за века. И при достаточной исторической эрудиции можно на карте любого гена увидеть отражение той или иной миграции: в распоряжении истории миграций больше, чем в нашем распоряжении — хорошо изученных генов. Такие авторы не учитывают бедность фактографического материала, лежащего в основе карт, и действие других факторов микроэволюции — дрейфа генов, включая эффекты основателя, бутылочного горлышка, да и просто ошибки выборки! Нам бы хотелось уберечь читателя от искуса в каждой особенности карт видеть след той или иной исторической миграции. Не зря Теодор Иоаннович Тютчев предупреждал:
Природа — сфинкс. И тем она верней Своим искусом губит человека, Что, может статься, никакой от века Загадки нет и не было у ней.В целом, два главных фактора микроэволюции — дрейф генов (через генетически эффективный размер популяции Ne) и миграции генов (через генетически эффективные миграции Ме), — противодействуя друг другу, задают исторически устойчивый уровень межпопуляционных различий GST. Эти же факторы формируют и генетический рельеф распространения гена, те черты его географической изменчивости, которые мы видим на картах. Карта показывает нам сам генетический рельеф, а величина межпопуляционной изменчивости GST — среднюю степень «гористости», разнообразия этого рельефа.
И дрейф, и миграции, одинаково безразличны к любым генам и одинаково обращены только к истории генофонда, к истории народа. Поэтому основная наша задача — рассматривая калейдоскоп генов, найти то общее и неизменное, что есть на всех картах, что просвечивает сквозь индивидуальную биографию гена — архитектонику русского генофонда.
§ 6. Иерархия популяций: «матрёшки»
И ещё одно пояснение, необходимое для понимания главы. Как уже не раз говорилось, мы пользуемся двумя подходами — статистическим и картографическим. И если важнейшая для нас картографическая методология описана во многих местах книги, то скажем, наконец, несколько слов и о нашем статистическом подходе. В его основе лежит концепция иерархических популяционных систем (см. Приложение). Её можно назвать и попроще: концепция «матрёшек». Это означает, что всё человечество мы рассматриваем как систему популяций, вложенных одна в другую — меньшая в большую: локальные популяции — вложены в этносы, этносы — в регионы, регионы — в ойкумену. Может быть и множество «матрёшек» промежуточного размера. Это неважно. Здесь главное — иерархичное устройство популяций, то есть важна сама возможность вложить одну «матрёшку» в другую.
ПОПУЛЯЦИИ КАК «МАТРЁШКИ»
ЛОКАЛЬНАЯ ПОПУЛЯЦИЯ (или просто «популяция») — это самый нижний уровень. Обычно к ней относят население какого-либо конкретного небольшого района, чаще всего это небольшая группа селений, тесно переплетённых взаимными браками, или даже один населённый пункт. Для такой популяции обычно сложно или не имеет смысла выделять более мелкие субпопуляции[30]. Популяционные выборки — то есть те данные о генофонде, которые появляются в научных статьях — чаще всего относятся именно к локальным популяциям.
ЭТНИЧЕСКИЙ УРОВЕНЬ. Все локальные популяции данного народа в совокупности образуют этническую популяцию. Этнический уровень определить всё же проще других — благодаря этническому самосознанию членов этноса. Люди обычно сами говорят, к какому этносу их следует относить.
УРОВЕНЬ РЕГИОНОВ. Если этнический уровень объективно задан (хотя и бывают сложности с различением этносов и субэтносов), то выделение регионов целиком подвластно произволу (таланту, научной интуиции) исследователя. Мы обычно выделяем девять основных регионов мира (табл. 4.4. Приложения). А в пределах регионов выделяем субрегионы разных уровней. Например, в регионе Северной Евразии можно выделить пять субрегионов — Восточную Европу, Урал, Кавказ, Среднюю Азию, Сибирь (глава 8). Далее в пределах Сибири — Западную Сибирь, Среднюю Сибирь, Восточную Сибирь (см. Приложение, рис. 4.2.).
Нередко популяции регионального уровня мы выделяем и чуть иначе — не чисто географически, а комбинируя географическую и лингвистическую классификации. Например, в главе 8 в пределах субрегиона «Восточная Европа» мы выделяем «индоевропейские народы Восточной Европы», «алтаеязычные народы Восточной Европы» и «уралоязычные народы Восточной Европы». В данном случае уровень лингвистических семей встраивается между этническим и региональным уровнями.
ОЙКУМЕНА — это уже самый высокий уровень для популяций человека. Человечество представляет единый вид и является той самой большой «матрёшкой», в которую вложены все остальные.
Если мы освоимся с таким представлением о популяциях человека, то при виде любой генетической характеристики (например, частоты гена) у нас сразу будет возникать вопрос — к популяции какого уровня она относится? Насколько опасны ошибки со смещением популяционного уровня или смешением разных «матрёшек», рассказано, например, в Приложении (раздел 4.).
Но сейчас нас занимает более практичный вопрос. Как же нам описать генетические характеристики популяционной системы? Какие инструменты для этого нужны? Для самого простого описания достаточно элементарных понятий статистики — средней величины и дисперсии.
СРЕДНЯЯ ЧАСТОТА
Чтобы узнать этническую частоту гена, нужно просто усреднить все частоты в локальных популяциях этого этноса.
Предположим, что имеются данные по частоте какого-то гена q в пяти украинских популяциях: Староконстантиновского района Хмельницкой области (частота аллеля составляет q=0.1), г. Стрый Львовской области (частота q=0.2), Ивано-Франковская область (q=0.1), Полтавская область (q=0.3) и Черкасская область (q=0.3). Тогда частота у «украинцев вообще» — этническая частота — составит q=(0.1+0.2+0.1+0.3+0.3)/5=0.2. Именно эта среднеэтническая частота q=0.2 и будет характеризовать украинский народ — популяцию этнического уровня. И мы можем на время «забыть» о частотах в локальных популяциях и оперировать в дальнейших рассуждениях этнической частотой.
ДИСПЕРСИЯ
Но для полноты картины среднюю величину, как известно, желательно дополнить и дисперсией, которая покажет, как далеко частоты в локальных популяциях уклоняются от своей средней. В популяционной генетике рассчитывают не обычную «статистическую» дисперсию, а родственный ей «генетический» показатель межпопуляционной изменчивости (чаще всего GST или FST). Формулы расчёта приведены в Приложении.
Эта величина и будет представлять межпопуляционные различия. На нее же можно посмотреть и с другой стороны и назвать её с приставкой не «меж», а «внутри». Действительно, эта величина характеризует различия популяций внутри этноса. И так всегда у «матрёшек» — изменчивость между популяциями нижнего уровня одновременно характеризует изменчивость внутри популяции более высокого уровня (что, конечно же, самоочевидно).
Итак, при переходе от локального уровня к этническому нам нужно рассчитать две величины — среднюю частоту q и межпопуляционную изменчивость (внутриэтническую изменчивость, гетерогенность этноса) GST.
ВАРИАЦИОННЫЙ РАЗМАХ
Добавим, что иногда бывает полезен и третий показатель — вариационный размах (разность между максимальной и минимальной частотой). По смыслу он близок к дисперсии, поскольку отвечает на тот же вопрос: как сильно локальные популяции различаются между собой?
ОТ МЕНЬШЕЙ МАТРЁШКИ — К БОЛЬШЕЙ: РАСЧЕТ СРЕДНЕЙ ЧАСТОТЫ
Итак, получены характеристики этнической популяции. Как же теперь перейти от этносов на следующий уровень — регионов? И как описать региональную популяцию — например, Восточной Европы? Нам опять нужны все те же две величины — средняя частота и межпопуляционная изменчивость. Применительно к региональной популяции — мы должны рассчитать среднерегиональную частоту (как среднюю по всем этносам данного региона) и внутрирегиональную изменчивость (между этносами данного региона).
Например, для Восточной Европы, кроме украинцев, у нас есть данные по двум популяциям литовцев (литовцы-аукшайты с частотой q=0.6 и литовцы-жемяйты с частотой q=0.4) и по двум популяциям тундровых ненцев Восточной Европы (частоты q=0.6 и q=0.8). Очевидно, что этническая частота для литовцев составляет q=0.5, а для ненцев q=0.7. Следовательно, чтобы получить среднерегиональную частоту, нам нужно усреднить все три этнические частоты — у украинцев, литовцев и ненцев. Эта региональная частота составит q=(украинская этническая частота + литовская + ненецкая)/3=(0.2+0.5+0.7)/3=0.47.
Но тут обычно рождается вопрос. Мы сказали, что для расчёта региональной частоты нужно усреднить этнические частоты. Но разве нельзя усреднить частоты в локальных популяциях? Разве нельзя получить среднюю частоту региона Восточная Европа как среднюю частоту по всем изученным локальным популяциям этого региона? Рассчитаем её: суммируем 0.1 (Хмельницкая область) + 0.2 (Львовская) + 0.1 (Ивано-Франковская) + 0.3 (Полтавская) + 0.3 (Черкасская) + 0.6 (аукшайты) + 0.4 (жемяйты) + 0.6 (ненцы) + 0.8 (ненцы) и разделим на число популяций (9). Мы видим, что полученная величина — частота 0.38 — заметно отличается от первой оценки (0.47). Какая же оценка правильней? Конечно же, первая — рассчитанная по этническим частотам. Почему?
Подробно этот вопрос разбирается в Приложении (раздел 4). Но и без специальных пояснений в нашем простом примере читатель легко заметит, что при втором способе расчёта (по локальным популяциям) восточно-европейская частота приблизилась к украинской — и только лишь потому, что по украинцам у нас больше изученных популяций. Мы не можем избежать неравномерности изученности разных народов — кому-то из них повезло больше, кому-то — нет. Но, рассчитывая региональные частоты не из частот в локальных популяциях, а из этнических частот, мы можем ослабить влияние этой неравномерности.
Итак, рассчитывая среднюю частоту на каждом последующем уровне, мы усредняем частоты в популяциях предыдущего уровня. Средняя частота по Восточной Европе — это средняя по этническим частотам (а не по локальным популяциям), средняя по Северной Евразии — это средняя по региональным частотам (а не по этническим) и так далее.
ОТ МЕНЬШЕЙ МАТРЁШКИ — К БОЛЬШЕЙ: РАСЧЕТ ДИСПЕРСИИ
Для региона мы также должны рассчитать не только среднюю, но и показатель межпопуляционной изменчивости. И тут мы сталкиваемся с чрезвычайно полезным аддитивным свойством GST: изменчивость, рассчитанную для разных уровней, можно суммировать! Рассмотрим получившуюся систему.
В нашем примере Восточная Европа состоит из украинцев, литовцев и ненцев. Но украинцы, в свою очередь, состоят из пяти популяций, со своей величиной внутри-украинской изменчивости между этими пятью популяциями; литовцы состоят из двух популяций, со своей внутри-литовской изменчивостью, ненцы состоят из двух популяций, со своей внутри-ненецкой изменчивостью. Усреднив эти три показателя внутриэтнической изменчивости, мы получим среднюю величину изменчивости — внутри «среднего» восточноевропейского народа. Теперь суммируем эту величину (изменчивость на внутриэтническом уровне) и изменчивость межэтническую (между средними частотами у украинцев, литовцев, и ненцев) и получим общую изменчивость Восточной Европы.
Важно лишь всегда отслеживать, по каким частотам рассчитана изменчивость региона. И если она рассчитана по этническим частотам, то необходимо понимать, что мы имеем лишь часть (межэтническую часть) региональной изменчивости (Приложение, раздел 4.). Чтобы узнать величину всей региональной изменчивости, нам нужно приплюсовать средний уровень внутриэтнической изменчивости (либо, как описывается ниже, пересчитать региональную изменчивость по популяционным, а не этническим частотам).
ЕСЛИ НАРОД ИЗУЧЕН ТОЛЬКО ПО ОДНОЙ ПОПУЛЯЦИИ
В нашем примере у нас было по несколько изученных популяций на каждый народ. Но бывает, что таких подробных данных нет. Допустим, в дополнение к имеющимся, появились данные по одной популяции удмуртов (частота q=0.6). Тогда среднеэтническая для удмуртов, очевидно, останется той же — 0.6. Но как быть с дисперсией? Формально, мы должны приписать удмуртам нулевую внутриэтническую изменчивость. Хотя понятно, что как только появятся данные по ещё одной популяции удмуртов, у них появится ненулевая внутриэтническая изменчивость (обнаружатся генетические различия между этими популяциями). Но пока таких данных нет, изменчивость удмуртов остается «условно-нулевой», и если мы теперь учтем удмуртов при расчёте средней внутриэтнической изменчивости, мы занизим эту величину за счёт «условно-нулевых» удмуртов. И если в наших данных многие народы будут изучены лишь по одной популяции, эта особенность данных сильно исказит результат. Поэтому мы пользуемся правилом — популяции, представленные единственной субпопуляцией, не учитываются при анализе GST.
ПРЫГАЯ ЧЕРЕЗ ОДНУ «МАТРЁШКУ»
Повторимся, что величину изменчивости в пределах Восточной Европы мы получили сложением изменчивости между этническими частотами и изменчивости между локальными популяциями внутри этносов. Но разве не могли мы её получить более прямым способом — рассчитав изменчивость между всеми локальными популяциями, не обращая внимания на этническую принадлежность этих популяций? Могли бы, и получили бы примерно ту же величину GST. Именно в этом и состоит одно из преимуществ GST статистики — общая изменчивость многоуровневой системы складывается из изменчивости на всех её уровнях (свойство аддитивности). Если же мы проигнорируем все промежуточные уровни и рассчитаем изменчивость среди локальных популяций («прыгая» через уровень), то получим ту же самую величину.
Отметим, что для совпадения оценок изменчивости, полученными двумя методами (последовательным иерархическим и «прыгая» через уровень), нужно пользоваться «правильными» средними частотами. Например, изменчивость локальных популяций Восточной Европы должна рассчитываться не относительно средней частоты в этих девяти популяциях, а относительно средней между тремя этническими частотами. Это необходимо для того, чтобы избежать влияния неравной изученности народов или регионов — для того, чтобы наиболее изученные народы не «перетягивали одеяло» на себя. Мы уже упоминали об этой сложности при расчёте региональных частот — для большей «матрёшки» брать частоты у «матрёшки» поменьше. Итак, даже прыгая через «матрёшку», для расчёта «правильной» изменчивости надо всё равно использовать частоты пропущенной «матрёшки». Надо всегда брать частоты у популяций предыдущего уровня (этнические частоты — при расчёте субрегиональной средней, субрегиональные частоты — при расчёте региональной средней, и так далее).
ЗАЧЕМ ВСЁ ЭТО ЗДЕСЬ НУЖНО?
Потому что иначе нельзя описать изменчивость русского народа среди его соседей по Евразии. Мы вкратце описали общие свойства иерархических популяционных систем (подробнее см. Приложение). Человечество действительно представляет собой такую популяционную систему, и чтобы ориентироваться в его генетической изменчивости, очень полезно освоиться с такой терминологией и таким способом мышления. Локальные популяции — и этнические. Этнические — и региональные. Далее регионы могут вкладываться в макрорегионы, а те — в ойкумену. На каждом уровне мы рассчитываем среднюю частоту и «дисперсию» — меж-популяционную изменчивость. В таких терминах мы и описываем изменчивость русского народа по каждому гену.
Причём часто полезно бывает сравнить этническую частоту гена у русских с региональными частотами для Урала, Кавказа, Сибири… Или частоту в локальной русской популяции — с этническими частотами соседних марийцев, татар, украинцев… Надо только при этом помнить, что чем больше «матрёшка», тем устойчивее её частота (если, конечно, её определили не по одной первой попавшейся популяции). Например, частота в меньшей «матрёшке», скорее всего, изменится сильнее, чем в большой, если мы проведём их повторные генетические обследования.
Но когда мы сравниваем не просто средние частоты, а их диапазон, то здесь забывать о ранге «матрёшек» уже никак нельзя! Например, нам приходится сравнивать диапазон частот в русских популяциях с диапазоном частот в Северной Евразии. Здесь нас подстерегает одна из сложностей, о которых мы предупреждали выше — диапазон частот между локальными русскими популяциями может парадоксальным образом оказаться больше «евразийского», то есть изменчивость части — больше изменчивости целого. И это потому, что оценка «евразийского» диапазона частот будет точнее, если взять этнические частоты — они более устойчивы. Если же мы включим в анализ все известные локальные популяции Евразии (со всеми ошибками их выборок), то «евразийская» изменчивость мгновенно перерастёт «русскую», и парадокс благополучно разрешится.
Когда же все вычисления закончены, мы получаем систему таблиц, в которой в сжатом, логичном и удобном для использования виде представлены основные параметры изменчивости генов. И в этих данных уже нетрудно увидеть и закономерности — что было бы невозможно, имей мы лишь бесконечный перечень частот в локальных популяциях.
Мы надеемся, эти объяснения помогут читателю легко ориентироваться в дальнейшем изложении. При описании изменчивости отдельных генов мы постоянно будем оперировать региональными и этническими частотами, величинами внутриэтнической и межэтнической изменчивости. Сравнение этих показателей оказывается чрезвычайно полезным инструментом, описывающим изменчивость конкретного гена в русских популяциях и показывающим степень изменчивости разных генофондов.
5.2. «ПРОСТЫЕ» КАРТЫ КЛАССИЧЕСКИХ МАРКЁРОВ
Источники информации и маршрут — Прогулка по «матрёшкам» — Карта — Сравнение с соседями — Гипотезы отбора и истории
§ 1. Биохимические маркёры. HP: Широтная изменчивость — GC: Широтная на глобусе, но не на русской карте — PI: Долготная в Евразии и в русском генофонде (Р1*М2) — Аномалии вне «исконного» ареала — TF: Разный отбор на разные аллели? — Мозаика в Европе — Широтные волны в русском ареале (TF*C2) — ACP1: ACP1*А возрастает к юго-востоку — Но частоты у юго-восточных соседей снижены! — PGM1: Долготная изменчивость в Евразии — Мозаика в русском ареале — ESD: Широтные волны — Незаметно влияние соседей — GLO1: Убывает к периферии русского ареала — Но у соседей обратные тренды! — 6PGD: Сниженная изменчивость
§ 2. Группы крови. MN: «Матрёшки» мира — «Матрёшки» Северной Евразии — Гомогенность Восточной Европы — Снижение у русских Мезени — RH*d: Евразийская карта — Долготная изменчивость в Европе — Мозаика в русском ареале — За деревьями исчезает лес — АВ0: Евразийские карты — «А» убывает на восток — «В» убывает на запад — «О» убывает к середине — Русские карты — «А» убывает на северо-восток — Лоскутное одеяло «В» — «О» убывает на юго-запад — Русский Север — Противоречия по MN и АВ0 — Глобальная закономерность не обязывает этносы к её исполнению — Этнос в своем ареале может её отменить!
§ 3. Риск несовместимости матери и плода по группам крови: Несовместимость по Резус-фактору — Несовместимость по АВ0 — Учет обеих систем — Сто пятнадцать промежуточных карт — Итоговая карта риска — Отличия генетического риска от реальной заболеваемости
§ 4. Обзор «простых» карт: Четкие закономерности для нескольких генов — Сложная география многих генов — Или вовсе мозаика — Окраинные аномалии необязательно связаны с соседями — Принцип «матрёшки»
Напомним ещё раз, что география отдельных генов — не самоцель нашей книги. Карты отдельных генов, рассматриваемые в этом разделе, нужны нам лишь для того, чтобы представлять, сколь велико реальное разнообразие генетических рельефов, свернувшееся потом в генетический ландшафт обобщённой карты генофонда. Но и без «простых» карт разных генов обойтись никак нельзя. Без внимательного рассмотрения карт отдельных аллелей представление о пространственной изменчивости генофонда неизбежно страдает излишней абстрактностью, а порой приводит к переоценке универсальности выявленных закономерностей.
ИСТОЧНИКИ ИНФОРМАЦИИ
В этом разделе мы детально рассмотрим изменчивость каждого из классических маркёров в русских популяциях.
Источником информации послужил банк данных «Русский генофонд» (Приложение, раздел 5). Частоты аллелей и оценки межпопуляционных различий GST для популяций русского народа, для пяти регионов Северной Евразии и для девяти регионов мира приведены в Приложении (раздел 6) и на сайте .
Но главным источником информации для нас служат не сами частоты аллелей в русских популяциях, а основанные на них карты (рис. 5.2.1–5.2.22). Карты выявят географию каждого из маркёров, покажут, каковы закономерности его изменчивости в русском ареале. К таблицам же, содержащим частоты генов в русских популяциях, мы будем изредка обращаться лишь затем, чтобы уточнить, что представляет собой популяция, заинтересовавшая нас на карте. Например, если популяция резко отличается от соседей, то стоит проверить, не вызвано ли такое отличие просто малым объёмом её выборки?
Другим источником информации служат результаты статистического анализа карт. Они сведены в таблице 5.2.1. К ним относится, во-первых, GST — степень изменчивости частоты аллеля, рассчитанная по карте. Эту степень изменчивости данного маркёра мы будем сравнивать со средним уровнем изменчивости, рассчитанным по картам всех классических маркёров (GST=1.36). Во-вторых, статистический анализ карт даёт нам частные корреляции частоты аллеля с долготой, широтой и множественный коэффициент корреляции с географическими координатами (табл. 5.2.1). Они рассчитаны по специальным корреляционным картам (см. Приложение), а в таблице указаны среднее, минимальное и максимальное значения коэффициен- еся на картах. Величина дисперсии не приводится, потов корреляции на такой карте. В-третьих, приведены скольку приведён близкий по смыслу показатель GST. и основные статистические показатели: минимальная, средняя и максимальная частоты аллеля, встречающи-
Таблица 5.2.1.
Характеристики пространственной изменчивости наиболее изученных классических генных маркёров
Обозначения: К — число изученных популяций;
N — число узлов сетки в картируемом ареале (с высокой надёжностью прогноза);
MIN, MAX, MEAN — соответственно минимальное, максимальное и среднее значения частоты аллеля или его корреляции с географическими координатами местности;
GST — межпопуляционная изменчивость; HS — вклад данного аллеля в общую гетерозиготность локуса.
Напомним только, что GST рассчитан специально для аллеля. Расчёт для полиаллельного локуса (для двуаллельного локуса он остается таким же) приведён в Приложении, а сами значения GST локуса даны в описании соответствующих карт. В таблице 5.2.1. и показатели гетерозиготности HS приведены своеобразно — показан «вклад» каждого аллеля в гетерозиготность локуса. Для расчёта «правильной» гетерозиготности локуса надо просто сложить аллельные оценки HS.
Наконец, есть и третий источник информации, которым мы будем пользоваться. Это частоты классических маркёров у соседних народов или в соседних регионах. Источником этих сведений служит банк данных «GENEPOOL» (.Приложение, раздел 5), в разделе 6 Приложения приведены средние частоты генов и разнообразие GST для пяти регионов Северной Евразии[31].
Таким образом, мы приводим практически всю исходную информацию и результаты анализа: исходные данные (,Приложение, раздел 6) и результаты анализа на сайте и в табл. 5.2.1., карты на рис. 5.2.1.-5.2.22. Поэтому читатель находится в равных условиях с авторами, располагая той же информацией. И все описания изменчивости классических маркёров, то есть всё последующее изложение в этом разделе 5.2., читатель может проверить, переосмыслить… или переписать иначе.
«МАРШРУТ» РАССМОТРЕНИЯ КАРТ
В описании каждой карты мы старались следовать определенному плану.
1) СПРАВКА. В начале каждого подраздела приводится очень краткая справка о данном гене: его функция, географическое распространение в глобальном масштабе. Эта информация взята главным образом из монографии [Генофонд и геногеография…], при подготовке которой в 1986–1994 годах (с деятельным участием одного из авторов), было учтено и компилировано всё множество доступных на тот момент источников информации по классическим маркёрам.
2) ИЗМЕНЧИВОСТЬ. Описание каждого гена начинается со сведений о размахе его изменчивости. Мы старались следовать принципу «матрёшек» — постепенно доставая из больших «матрёшек» содержащиеся в них всё более дробные регионы. В самых подробных описаниях мы начинали с размаха изменчивости в ойкумене, затем переходили к регионам Евразии, затем рассматривался размах изменчивости между субрегионами Северной Евразии, то есть бывшего СССР, далее — различия между народами Восточной Европы, а завершался маршрут самой маленькой матрёшкой: рассмотрением изменчивости между разными русскими популяциями.
Обратим внимание на важный момент, который может вызвать недоумение. Порой различия между русскими популяциями достигают различий между регионами Евразии. Нет ли здесь ошибки? Нет. Просто надо давать себе всегда отчет, о каких частотах сейчас идет речь — усреднённых (региональных или этнических) или локальных (популяционных). Все региональные частоты и практически все этнические частоты представляют собой усреднённые величины. Например, частота какого-либо аллеля в Сибири представляет собой среднюю по всем изученным сибирским народам. Частота у коми — среднюю по всем изученным популяциям коми. При этом если частота в лишь какой-то одной популяции этноса была необычно высокой или низкой — на средней частоте аллеля в этносе это практически не скажется. И поэтому размах изменчивости между регионами — это различия между устойчивыми, усреднёнными региональными оценками. Для русских же популяций мы приводим размах изменчивости между локальными популяциями. И за счёт отклонений частоты всего в одной лишь популяции размах может стать большим.
3) КАРТА. Главная часть в любом описании — это рассмотрение карты. Сначала мы пытаемся сформулировать первое впечатление от карты — степень сложности рельефа и характер тренда. Затем переходим к деталям и отклонениям от основного увиденного тренда. Смотрим, каковы коэффициенты корреляции с географическими координатами, можно ли описать изменчивость гена в терминах «широтной» или «долготной» изменчивости. Чтобы оценить соответствие карты аллеля генетическому ландшафту всего генофонда, мы приводим и коэффициенты корреляции между данной картой и картами трёх главных компонент. В табл. 5.3.3. перечислены аллели, которые внесли наибольший вклад в главные сценарии генофонда — с коэффициентом корреляции выше 0.4.
4) ЧТО У СОСЕДЕЙ? А что происходит вокруг русского ареала? Эти данные мы берём уже не из карты, а из таблиц. Следует ли изменчивость в русском ареале более общим закономерностям, известным для данного аллеля? В частности, как варьирует частота аллеля у ближайших соседей — других восточноевропейских народов? Если на границе русского ареала частота начинает меняться, то какова частота у соседнего народа? Такое сравнение показывает, может ли это изменение генофонда в окраинных русских популяциях объясняться смешением с соседними народами.
5) ОТБОР. Каков уровень GST для данного аллеля, и как он соотносится со средним уровнем? Может быть, изменчивость данного аллеля сформирована под действием естественного отбора? Если отклонение от среднего уровня велико, то можно предположить действие стабилизирующего или же дифференцирующего отбора.
6) ГИПОТЕЗЫ. Какие ещё особенности видны на карте? Можно ли сформулировать гипотезу, объясняющую обнаруженный геногеографический рельеф? Как правило, нелегко дать объективную интерпретацию карты в терминах истории народа. Для этого необходим особый анализ, специальный инструментарий, совместная работа со специалистами в смежных областях — историками, археологами, этнографами, антропологами. Ассоциативное мышление здесь может сыграть злую шутку — чем оно богаче, чем больше мы знаем об этногенезе и этнической истории данного народа, тем проще любую особенность карты истолковать как древние или недавние миграции, следы прошедших племён и событий. Поэтому те немногие исторические экскурсы, которые мы включили в описания карт, следует рассматривать лишь как одну из множества гипотез.
Этому плану — с теми или иными разумными отклонениями — мы следуем при описании каждого гена. И надеемся дать хотя и краткий, но достаточно объективный обзор его изменчивости.
В конце концов, география отдельных генов — это непосредственная реальность, конкретное воплощение генофонда. Так рассмотрим же её со всем вниманием, ген за геном. И только уже после этого перейдём к самой структуре генофонда — той скрытой от непосредственного наблюдения реальности, которая формирует свои отдельные воплощения, а сама слеплена историей популяции. Её мы попробуем выявить в разделе 5.3., завершающем главу.
Рис. 5.2.1. Карта распределения аллеля НР*1 в русских популяциях.
§ 1. Биохимические маркёры (HP, GC, PI, TF, ACP1, PGM1, ESD, GLO1, 6PGD)
Сначала мы расскажем о ферментах сыворотки крови (HP, GC, PI, TF), а затем перейдем к эритроцитарным биохимическим маркёрам (ACP1, PGM1, ESD, GLO1, 6PGD).
«Биохимическими» эти маркёры называются по методу их определения: ферменты (обычно крови) опознаются биохимическими методами, такими как электрофорез и изоэлектрофокусирование. Упрощённо говоря, это выглядит так: на дорожке геля между катодом и анодом «разгоняется» специально подготовленный образец крови. Легкие молекулы бегут быстрее и обгоняют более тяжёлые молекулы. В результате мы своими глазами видим, какой генотип у данного человека (ведь в биохимических локусах нет доминирования одного аллеля над другим). Например, если у него гетерозигота по данному локусу, — мы увидим сразу две полоски на геле: одну для более «быстрого» аллеля (полученного им от одного из родителей), а вторую полоску для более «тяжелого» аллеля (полученного им от второго родителя). У гомозигот, получивших от обоих родителей одинаковые аллели, мы увидим, конечно, лишь одну полоску. Но, сравнив её с «образцовой» матрицей, где примерно показано, как быстро должны «бегать» какие аллели, мы можем определить, какой именно аллель данного локуса имеется у данного человека.
§ 1.1. СИСТЕМА ГАПТОГАОБИНА (HP)
Белок гаптоглобин играет важную роль в обмене гемоглобина. Полагают, что одна из функций гаптоглобина состоит именно в снижении потери организмом железа. Отмечены незначительные различия в физиологических свойствах разных типов гаптоглобина [Спицын, 1985].
Относится к группе генетико-биохимических маркёров (ферменты сыворотки крови).
АРЕАЛ РУССКОГО ГЕНОФОНДА
Полиморфизм системы гаптоглобина изучен в русском населении довольно подробно — карта распространения аллеля НР*1 основана на данных о 51 русской популяции (рис. 5.2.1). В среднем же, карты 17 наиболее полно изученных классических маркёров основаны на данных о 35 русских популяциях. Частота аллеля НР*1 в «исконном» русском ареале варьирует значительно: от 0.17 в верховьях Северной Двины и Мезени до 0.51 на юго-западе русского ареала. Столь огромный размах изменчивости в русских популяциях почти достигает пределов вариации во всем народонаселении Северной Евразии — от коряков до украинцев (0.10<q<0.57).
Средняя частота в русском генофонде (q=0.37) практически совпала с её уровнем в Западной Европе (q=0.36). Средняя гетерозиготность локуса (HS=0.46) близка к максимально возможному значению для двухаллельного локуса (HS=0.50). Межпопуляционное разнообразие карты (GST=1.68) несколько выше среднего уровня дифференциации в русском генофонде (GST=1.36)[32]. Таким образом, при общем рассмотрении вариации НР*1 в русском генофонде на первый план выходит типичность этого аллеля, его хорошая изученность и огромная изменчивость в русском ареале, что обязывает к внимательному рассмотрению геногеографии НР*1.
Карта НР*1 (рис. 5.2.1.) выявляет изменчивость в русских популяциях, близкую к клинальной. Основной вектор изменчивости: падение частоты аллеля в направлении «юго-запад<=>северо-восток» с заметным преобладанием широтной изменчивости над долготной. Этот вектор отражён и в коэффициентах корреляции с географическими координатами (табл. 5.2.1): с широтой r=0.42[33], с долготой r=0.34. Причём в отдельных областях карты тот или другой коэффициент связи превышает уровень r=0.8 (табл. 5.2.1), указывая на преобладание широтной изменчивости (в Причерноморье, на Русском Севере) или же на преобладание долготной изменчивости (например, в Поволжье).
ГИПОТЕЗЫ
В целом, основной вектор всей карты НР*1 («юго-запад<=>северо-восток») позволяет выдвигать две равноправных гипотезы о природе такой изменчивости. Первая гипотеза — «историческая». Она предполагает, что в геногеографическом рельефе этого гена нашли отражение миграции южных европеоидов на Русскую равнину и диффузия генов, связанная с демографическим давлением из районов с более высокой плотностью населения. Вторая гипотеза — «экологическая» — предполагает прямое влияние климатических факторов. Известно, что максимальные частоты НР*1 характерны для тропического пояса, тогда как в направлении более высоких широт частота аллеля в целом уменьшается. Для выбора между этими гипотезами, или же для выдвижения комплексной гипотезы, учитывающей взаимодействие исторических и экологических факторов, нужны специальные картографические исследования и аргументы.
ЛАНДШАФТ СЕВЕРНОЙ ЕВРАЗИИ
В связи с этим отметим, что падение частот НР*1 с юго-запада на северо-восток является основным вектором и для всего генофонда Восточной Европы.
При средней региональной частоте Восточной Европы q=0.38, наибольшая концентрация НР*1 характерна для восточных славян, населяющих преимущественно юго-западные области (для украинцев в среднем q=0.47, белорусов q=0.44), наименьшая — для финноязычных народов северо-востока Европы — удмуртов, мари и коми-зырян (в среднем 0.31<q<0.34). Однако этот вектор не является общеевразийским. У манси (q=0.40) и лесных ненцев (q=0.41) Западной Сибири частота НР*1 вновь превышает отметку 0.4, а затем, после некоторого падения, вновь достигает в коренном населении Якутии «европейских» значений: в ряде популяций q>0.40 при средней q=0.37. Карта распространения НР*1 в коренном населении Северной Евразии подробно проанализирована нами в работе [Балановская, Нурбаев, 1995]. В целом «хребет» высоких значений тянется от Украины до Якутии с пологим уменьшением частоты аллеля как в северном, так и в южном направлениях. Такой характер изменчивости нельзя свести ни к «европеоидно-монголоидным» взаимодействиям, ни к влиянию широтной изменчивости среды.
РУССКИЙ СЕВЕР
Чрезвычайно любопытно нарушение основного вектора на самом севере русского ареала (рис. 5.2.1). К северу от широкой зоны низких частот, включающей ядро минимальных значений НР*1 в бассейне Северной Двины и верховьях Мезени (q<0.26), частота вновь возрастает до среднерусского уровня (q=0.36). Эта локальная «арктическая» зона относительно повышенной частоты НР*1 расположена на побережье Баренцева моря, в низовьях Мезени и Печоры. В целом «арктическая» зона соответствует миграциям древнего новгородского населения, торговому пути в Мангазею и ареалу расселения поморов. Считается, что население этой территории сформировано преимущественно потомками новгородцев, а население более континентальных районов Русского Севера (в среднем и верхнем течении северных рек) сформировалось, главным образом, за счёт миграций из Ростово-Суздальской, а не Новгородской Руси. К сожалению, система гаптогло-бина не позволяет дифференцировать новгородский и ростово-суздальский («низовой») миграционные потоки, поскольку сами новгородские и ростовские земли мало различаются по частотам НР*1.
Сравнение с общей картиной северо-евразийского ландшафта НР*1 показывает, что повышение частоты в самых северных русских популяциях трудно связать с влиянием «субстратного» населения — поскольку в целом для коренного (дославянского) населения циркумполярной зоны характерны низкие частоты НР*1 (см. карты в работе [Балановская, Нурбаев, 1995]). Русские колонисты осваивали побережье интенсивнее, чем континентальные районы. Потому низкие частоты, выявленные в русских популяциях верховьев Северной Двины и Мезени, можно связать с большим участием «субстрата» (финно-угорских или самодийских племён) в формировании русского населения континентальных районов. Подобная трактовка изменчивости НР*1 на Русском Севере имеет ранг лишь предварительной гипотезы, и для корректных выводов необходимо более полное обследование ряда популяций.
ИТОГ
Итак, основная закономерность для НР*1 в русском населении — изменчивость, близкая к клинальной: с максимумом на юге и снижением частоты к северо-востоку.
Общие закономерности ландшафта аллеля НР*1 в русском населении (включая отличия «арктической зоны») хорошо согласуются с первыми главными компонентами русского генофонда в целом: коэффициенты корреляции со всеми тремя первыми главными компонентами изменчивости классических маркёров варьируют в пределах 0.4<r<0.5. Хорошо они согласуются и с главными компонентами фенофонда русского народа по данным антропологии и дерматоглифики (глава 4). Это может означать, что система НР*1 высоко информативна при изучении структуры русского генофонда.
§ 1.2. СИСТЕМА ВИТАМИН-D ТРАНСПОРТИРУЮЩЕГО Б£АКА (ГРУППОСПЕЦИФИЧЕСКИИ КОМПОНЕНТ GC)
Предполагается, что основная функция группоспецифического компонента GC — связывание и транспорт витамина D3 и его метаболитов. Выделяются два основных аллеля GC*1 и GC*2, причём аллель с большей электрофоретической подвижностью подразделяется на два варианта — GC*1S и GC*1F [Генофонд и геногеография…, 2000]. Локус GC, локализованный на длинном плече 4-й хромосомы в районе сегментов q11-q12, тесно сцеплен с локусом сывороточного альбумина. Есть указания, что некоторые различия в способности аллелей GC связывать витамин D приводят к их корреляции с факторами экологии и климата (тип питания, широта местности, высота над уровнем моря, интенсивность солнечной радиации, среднегодовая температура) [Спицын, 1985]. При этом частота аллеля GC*1 максимальна в наиболее тёмнопигментиро-ванных экваториальных группах населения, а в регионах с относительно низкой солнечной радиацией повышается частота GC*2.
Рис. 5.2.2. Карта распределения аллеля GC*2 в русских популяциях.
Рис. 5.2.3. Карта распределения аллеля GC*1S в русских популяциях.
Относится к группе генетико-биохимических маркёров (ферменты сыворотки крови).
ЛАНДШАФТ ЕВРАЗИИ
При сравнении населения основных регионов мира максимум частот GC*2 (q=0.28) и GC*1S (q=0.58) приходится на популяции Европы. Для Восточной Европы (без Приуралья и Северного Кавказа) частота GC*2 составила в среднем q=0.31, слабо варьируя от q=0.27 у литовцев до q=0.33 у молдаван и украинцев. На Урале наблюдается общее понижение частоты аллеля GC*2, составляя в среднем q=0.26. Средняя частота аллеля у уральских народов — башкир, чувашей, удмуртов, мари, коми, тундровых ненцев — также варьирует в узких пределах: от 0.25 до 0.28. Исключение составляют коми-пермяки, но они представлены лишь одной популяцией с частотой 0.38. В Зауралье у манси частота GC*2 понижается до q=0.19.
Среднерусские частоты аллелей GC*2 (q=0.29 с вариацией от 0.14 до 0.38) и GC*1S (q=0.57 с вариацией от 0.48 до 0.68) — совпадают с размахом изменчивости, характерным для населения всей Европы. Иными словами, частоты этих аллелей в русских популяциях отличаются друг от друга столь же существенно, как среднеэтнические частоты у народов всей Европы — от Скандинавии до Испании! Для Северной Евразии в целом изменчивость GC намного выше, чем в Европе: частоты аллеля GC*2 варьируют от 0.05 до 0.77.
Межпопуляционное разнообразие GC*2 (GST=0.90) и GC*1S (GST=114) несколько ниже среднего для русского генофонда по всем классическим локусам уровня (GST=1.36), что может указывать на незначительное давление стабилизирующего отбора. Гетерозиготность локуса GC составила HS=0.57 (табл. 5.2.1).
АРЕАЛ РУССКОГО ГЕНОФОНДА
Рассмотрим на этом евразийском фоне карты географической изменчивости аллелей GC*2 (рис. 5.2.2.) и GC*1S (рис. 5.2.3), основанные на информации по 22 русским популяциям (К=22). Генетический рельеф карт довольно сложен. Во многом они являются зеркальным отражением друг друга — ранговый коэффициент корреляции между картами составил r=- 0.57. Однако для карты GC*2 (рис. 5.2.2) наиболее характерным элементом является долготный «разлом» (пояс минимальных частот), следующий примерно по 40° долготы. Для карты GC*1S (рис. 5.2.3) наиболее характерна широтная изменчивость с повышением концентрации аллеля к югу от 55° параллели. При этом средняя корреляция частот обеих карт с долготой близка к нулю, а корреляция с широтой для аллеля GC*1S составила r=0.30, достигая в отдельных районах r=0.85 (табл. 5.2.1).
Самыми загадочными являются присутствующие на обеих картах диаметральные различия в частотах между соседними популяциями Вологодской области — бассейнов Онеги (GC*2, q=0.17) и Сухоны (две популяции с частотами GC*2 q=0.36 и q=0.37). Отражают ли они реальные различия между генофондами этих популяций или же обусловлены выборочными эффектами (выборки составили 61, 64 и 163 индивида, соответственно), это покажут лишь дальнейшие генетические исследования Русского Севера.
Рис. 5.2.4. Карта распределения аллеля Р1*М2 в русских популяциях.
ИТОГ
Таким образом, панойкуменный тренд (возрастание GC*2 к северу) не прослеживается в русском генофонде. Однако это предварительное заключение полностью зависит от достоверности низкой частоты этого аллеля на Онеге — если резкое понижение частоты GC*2 до 0.17 (и, соответственно, повышение частоты GC*1S) окажется случайностью и не подтвердится при дальнейших исследованиях, карты GC*2 и GC*1S в целом не будут противоречить гипотезе широтной изменчивости.
Карта аллеля GC*1F высоко коррелирует с главным сценарием изменчивости классических маркёров в русском генофонде: r=0.63. Все три аллеля коррелируют со второй главной компонентой классических маркёров: для GC*1S r=0.66; для GC*2 r=0.43; для GC*1F r=0.37.
§ 1.3. СИСТЕМА ИНГИБИТОРА ПРОТЕАЗ (α1-АНТИТРИПСИНА PI)
Белок обеспечивает до 90 % всей активности ингибитора протеаз в отношении трипсина, ингибируя также ещё целый ряд ферментов — химотрипсин, эластазу, коллагеназу, тромбин и протеазы лейкоцитов. О функциональной важности PI свидетельствуют достоверные ассоциации дефицита этого фермента с рядом заболеваний легких и печени. Система включает три субтипа (Р1*М1, Р1*М2, Р1*МЗ с суммарной частотой более 90 %) основного варианта и значительное число редких вариантов. Все варианты PI функционально различны: уровень белка у гомозигот убывает в ряду М1>М2>МЗ, а редкие аллели продуцируют ещё меньшее количество белка [Генофонд и геногеография…, 2000].
Относится к группе генетико-биохимических маркёров (ферменты сыворотки крови).
ЛАНДШАФТ ЕВРАЗИИ
В населении Северной Евразии частота аллеля в целом убывает в направлении с запада на восток. Средняя частота Р1*М2 составила для коренных народов Кавказа q=0.16, Урала — q=0.14, Сибири q=0.08.
В народонаселении Европы частота аллеля Р1*М2 убывает в ином направлении — с юга (q=0.18) на север (q=0.09). Среднерусская частота аллеля Р1*М2 (q=0.15) находится в этом интервале. Среди 19 изученных русских популяций частота Р1*М2 варьирует от 0.04 до 0.23. Однако межпопуляционное разнообразие P1*M2 (GST=0.52) оказалось намного ниже среднего для русского генофонда уровня дифференциации (GST=1.36), что позволяет предполагать давление стабилизирующего отбора.
АРЕАЛ РУССКОГО ГЕНОФОНДА
Четкий градиент «запад<=>восток» (рис. 5.2.4.), наблюдаемый в Северной Евразии в целом, характерен и для русского генофонда (корреляция частоты Р1*М2 с долготой достигает в отдельных районах значений r=0.9). Однако среднее значение коэффициента корреляции с долготой невысоко (r=0.30), поскольку на самом востоке карты, у русских популяций Урала, вновь наблюдается резкое повышение частоты аллеля.
Карты всех трёх аллелей обнаруживают очень высокую корреляцию со вторым сценарием изменчивости русского генофонда по классическим маркёрам: для Р1*М1 коэффициент связи достигает чрезвычайно высокого значения r=0.87; для Р1*М2 r=0.68; для Р1*МЗ r=0.64.
ПОПУЛЯЦИОННЫЙ ЭКСПЕРИМЕНТ: ВКЛЮЧАЕМ ГОРОДСКОЕ НАСЕЛЕНИЕ
Не только на рассмотренных, но и на многих других картах (P1*S, GC*1S, PGM1*1-, PGM1*2-, TF*C2, TF*DCHI, ACP*A) в русских популяциях Урала также ярко видны резкие нарушения тех трендов, которые характерны для «исконного» русского ареала.
Напомним, что в порядке эксперимента в анализ были включены городские популяции» лежащие за пределами «исконного» русского ареала. Например, для локуса PI это русское население республики Удмуртия, изученное в г. Воткинске (где частота Р1*М2 q=0.16, в то время как для самих удмуртов характерна средняя частота q=0.10), Екатеринбурга (с частотой P1*M2 q=0.15) и Асбеста (с частотой P1*M2 q=0.14). Эти значения лишь воспроизводят (с незначительной вариацией) среднерусскую частоту (q=0.15) и не несут никакой дополнительной информации ни о географии, ни об истории русского генофонда. Городское русское население Урала сформировано, главным образом, в результате исторически недавних миграций. И потому эти значения можно не изучать: их можно просто прогнозировать, исходя из демографических данных о миграционных потоках из «исконного» русского ареала.
Таким образом, проведённый эксперимент подтверждает правильность нашей исходной позиции: население, находящееся за пределами «исконного» ареала народа (и тем более городское!), не информативно для изучения пространственной структуры генофонда. Все усилия целесообразно направить на выявление генетической изменчивости сельских популяций в пределах «исконного» ареала. Зная генофонд «исконного» ареала, зная источники, направление и интенсивность миграционных потоков (откуда и сколько мигрантов прибыло в данную популяцию за пределами «исконного» ареала), мы можем с большой степенью вероятности прогнозировать генетический состав исторически «молодых» популяций.
§ 1.4. СИСТЕМА ТРАНСФЕРРИНА (TF)
Трансферрин образует соединение с железом, нейтрализуя токсичные ионы, и транспортирует его в костный мозг. Множество вариантов трансферрина контролируется тремя сериями аллелей — TF*B, TF*C, TF*d, каждая из которых включает несколько аллелей.
Относится к группе генетико-биохимических маркёров (ферменты сыворотки крови).
Рис. 5.2.5. Карта распределения в русских популяциях аллеля TF*C2
РУССКИЕ ПОПУЛЯЦИИ
Из редких вариантов всегда рассматривается аллель TF*DCHI, поскольку увеличение его частоты традиционно интерпретируется как признак монголоидной примеси [Спицын, 1985; Шнейдер, 1999]. Однако средняя частота TF*DCHI (табл. 5.2.1.) в русском населении находится ниже даже 1 % критерия полиморфизма (q=0.009). Максимальные значения в основном ареале обнаружены в популяциях Рязанской, Костромской и Вологодской областей (q=0.016) при среднем размере выборки менее 100 человек, которая слишком мала для надёжного тестирования столь редкого аллеля. Поэтому, не приводя карту TF*DCHI, лишь укажем, что она намечает слабую тенденцию увеличения частоты TF*DCHI с запада на восток, однако достоверность такого тренда невелика.
Из пяти карт TF, построенных для русского генофонда (их характеристики даны в табл. 5.2.1.), приведем карту аллеля TF*C2 (рис. 5.2.5.), созданную по данным о 20 русских популяциях. Частота TF*C2 варьирует от 0.06 до 0.21 со среднерусским значением q=0.15. Гетерозиготность локуса (по совокупности всех аллелей) HS=0.365. Важно отметить, что межпопуляционное разнообразие других аллелей локуса значительно превышает среднерусский уровень изменчивости (GST=1.36): для TF*B01 GST=2.33, для TF*C3 GST=2.05. Это позволяет выдвигать гипотезу подверженности аллелей TF*B01 и TF*C3 дифференцирующему отбору. Однако для аллеля TF*C2 характерно резко сниженное межпопуляционное разнообразие: GST=0.47. Достоверно сниженный размах
изменчивости TF*C2 может указывать на давление стабилизирующего отбора на этот вариант трансферрина.
ЛАНДШАФТ ЕВРАЗИИ
Хотя частота TF*C2 возрастает до 0.40 в некоторых популяциях Южной Азии, но и для популяций Европы, и для коренных народов Приуралья она лежит примерно в одном диапазоне частот (от 0.07 до 0.27), причём среднеэтнические частоты одинаковы у самых разных народов: 0.10 — и у чувашей, и у финнов; 0.14 — и у мордвы, и у немцев; 0.15 — и у русских, и у испанцев; 0.16-0.18 — у мари, итальянцев, шведов и греков.
АРЕАЛ РУССКОГО ГЕНОФОНДА
Но, несмотря на такое мозаичное распределение на европейском пространстве, в русском ареале карта являет вполне выраженную закономерность: увеличение частоты TF*C2 на севере (0.16<q<0.21) и уменьшения (0.06<q<0.12) — в центральной части (волго-окском междуречье). Граница проходит примерно по широте Твери. Что же касается «юго-западного» ядра высоких значений, то оно связано лишь с одной популяцией — староверов Сибири, искусственно помещённых на карте в Брянскую область по месту происхождения этой популяции [Спицын и др., 2001]. Очевидно, такая популяция не может служить надёжным показателем. Остальные изученные южные популяции — Рязани и Курска — характеризуются среднерусскими частотами (0.14 и 0.15, соответственно).
ИТОГ
Таким образом, на карте распространения аллеля TF*C2 в русском ареале можно выделить три широтных зоны: северная — с высокими частотами TF*C2, центральная — с пониженными частотами TF*C2, южная — со среднерусскими частотами.
Карты всех трёх вариантов аллеля TF*C обнаруживают высокую корреляцию с первым j сценарием изменчивости классических маркёров: для TF*C1 коэффициент связи достигает чрезвычайно высокого значения r=0.80; для TF*C2 r=0.58; для TF*C3 r=0.57. Карта аллеля TF*DCHI, в свою очередь, высоко коррелирует с третьей главной компонентой русского генофонда: r=0.79. А аллель TF*B вносит определённый вклад (r≈0.4) и в первый, и во второй главные сценарии русского генофонда.
Рис. 5.2.6. Карта распределения в русских популяциях аллеля АСР1*А
§ 1.5. СИСТЕМА ЭРИТРОЦИТАРНОЙ КИСЛОЙ ФОСФАТАЗЫ (ACP1)
Предполагается, что основная функция ACP1 состоит в регуляции внутриклеточной концентрации флавиновых ферментов и коферментов. Кроме трёх основных аллелей АСР1*А, АСР1*В, АСР1*С, существует ряд редких вариантов ACP1. Все фенотипы различаются по средней активности фермента, причём количественные эффекты всех аллелей образуют ряд: А<В<С.
Относится к группе генетико-биохимических маркёров (ферменты эритроцитарной фракции крови).
В МАСШТАБЕ ОЙКУМЕНЫ (АСР1*А)
Для аллеля АСР1*А в генофонде ойкумены отмечается положительная связь частоты с географической широтой [Спицын, 1985; Spitsyn et I al., 1998]. Однако для коренного населения Северной Евразии характерна совершенно иная и своеобразная долготная изменчивость этого аллеля. Гряда относительно высоких значений АСР1*А (q>0.40), протянувшаяся от Алтая на север, отделяет западное «плато» средних значений АСР1*А от «низин» Средней Сибири и Саян (области низких частот АСР1*А в интервале 0.17<q<0.30). Далее на северо-восток частота аллеля вновь растёт до максимальных евразийских величин (0.55<q<0.62 у коряков, чукчей и эскимосов). На другом конце континента, на западе евразийского ареала, средняя частота АСР1*А составила q=0.32 (в населении Западной Европы). Эта величина совпадает и со среднерусской частотой q=0.32, и со средней частотой аллеля у коренных народов Урала (q=0.32) и Кавказа (q=0.31). Лишь для народов Средней Азии наблюдается понижение средней частоты АСР1*А (q=0.28) [Балановская, 1998].
АРЕАЛ РУССКОГО ГЕНОФОНДА (АСР1*А)
Карта изменчивости частоты этого аллеля (АСР1*А) в русском населении, построенная по информации о 24 русских популяциях (К=24), приведена на рис. 5.2.6. Она показывает, что для русского населения (так же, как и для населения Северной Евразии в целом) не характерно возрастание частоты аллеля в северных широтах, связываемое с широтной климатической зональностью, с возможным действием отбора. К тому же и уровень межпопуляционной изменчивости (GST=1.28) соответствует селективно-нейтральному (GST=1.36), и тем самым противоречит гипотезе отбора по этому аллелю. Не сказывается и влияние азиатских степей. Поскольку среднеазиатские популяции характеризуются снижением частоты аллеля, то их влияние должно было бы сказаться в убывании частоты АСР1*А в юго-восточном направлении. Например, ближайшие тюркоязычные популяции характеризуются следующими частотами АСР1*А: у казахов q=0.26, у башкир q=0.31, у татар q=0.33, у чувашей q=0.25 [Генофонд и геногеография…, 2000]. Однако карта демонстрирует обратный тренд — не убывание, а возрастание в русском ареале частоты аллеля с северо-запада на юг и юго-восток. При этом вариации частот АСР1*А достаточно велики — от 0.18 до 0.41 (табл. 5.2.1).
Северо-западные русские популяции характеризуются сниженными частотами с минимумами в землях новгородских (q=0.25), псковских, тверских, затем в Поонежье и далее к Архангельску. Высокие частоты характерны для востока и юго-востока с максимумами в землях костромских и рязанских (q > 0.40). Популяции, выходящие за пределы основного ареала (Украина, Урал), демонстрируют частоты аллеля, характеризующие не столько структуру генофонда, сколько структуру поздних переселений (этот вопрос обсуждался в подразделе § 1.3). Эти «внешние» (по отношению к «исконному» русскому ареалу) популяции меняют тренд на противоположный и приводят к резкому снижению средних коэффициентов корреляции как с широтой, так и с долготой местности (табл. 5.2.1).
Рис. 5.2.7. Карта распределения аллеля АСР1*С в русских популяциях.
Ясно видимый на карте тренд увеличения частоты аллеля АСР1*А в направлении «северо-запад<=>юго-восток» в русском населении нельзя объяснить, исходя из данных о его соседях. Например, у литовцев средняя частота АСР1*А составила q=0.34, а у молдаван q=0.25 [Генофонд и геногеография…, 2000], то есть у западных соседей наблюдается падение частоты аллеля с севера на юг — в противоположность тренду, наблюдаемому в русских популяциях — увеличения частоты аллеля с севера на юг. Поскольку данные по украинцам и белорусам отсутствуют, приведем средние частоты АСР1*А среди других славянских народов: у поляков q=0.35, у чехов q=0.32, у хорватов q=0.28, у болгар q=0.16. Мы вновь видим общеевропейский градиент падения частоты аллеля с севера на юг, противоположный наблюдаемому тренду в русском генофонде. В любом случае, данные о славянских народах не дают удовлетворительного объяснения тренду, выявляемому картой (рис. 5.2.6).
ГИПОТЕЗЫ (АСР1*А)
Можно, однако, выдвинуть гипотезу о том, что в выявленном «русском» тренде АСР1*А нашли отражение генетические характеристики финно-угорского субстрата — тех древних насельников Русской равнины, которые освоили её задолго до того, как она стала Русской: до прихода славянских племён.
На возможность такой гипотезы указывает тенденция некоторого увеличения частоты аллеля с севера и запада к югу в современных финно-язычных популяциях: у карел q=0.24, коми-зырян q=0.30, у коми-пермяков q=0.30, у удмуртов q=0.30, у мари q=0.36, у мордвы q=0.39. На севере, в самодийских популяциях, частота аллеля в среднем также невелика: у тундровых ненцев q=0.31, у лесных q=0.16, у нганасан q=0.29.
ИТОГ (АСР1*А)
Можно резюмировать, что наблюдаемый в русском генофонде тренд роста частоты аллеля АСР1*А в направлении «северо-запад<=>юго-восток» не поддаётся объяснению в плане «глобальных» взаимодействий, будь то панойкуменный тренд, славянская экспансия или влияние евразийских степей. Вместе с тем, для ближайших финно-угорских народов также наблюдается нарастание частоты аллеля приблизительно в том же направлении: с севера (и с запада) на юг. Это позволяет предположить, что формирование данного тренда относится ко времени, предшествовавшему славянской экспансии на Восточно-Европейскую равнину, уже населенную финно-угорскими племенами (корела, весь, меря, мурома, чудь Заволочская, пермь, печера, югра и многими другими, имена которых не дошли до нас). Выявленный тренд, возможно, отражает в современном русском населении древний финно-угорский субстрат.
ЛАНДШАФТ ЕВРАЗИИ (АСР1*C)
Другой аллель — АСР1*С — принято называть «европейским». Для населения Европы характерны наибольшие частоты АСР1*С: средняя частота в Европе q=0.05, в то время как в коренном населении всех остальных частей света — меньше 1 %. Средняя частота АСР1*С составила q=0.005 для коренного населения как Сибири, так и Средней Азии и Казахстана. Частота АСР1*С несколько выше в населении Кавказа (q=0.016) и ещё выше у коренных народов Урала (q=0.028), составляя у мордвы, мари, коми-пермяков и коми-зырян 4–5%.
АРЕАЛ РУССКОГО ГЕНОФОНДА (АСР1*Р
Карта аллеля АСР1*С (рис. 5.2.7.) демонстрирует в русском населении несколько иной характер изменчивости, чем предыдущая карта АСР1*А. Можно видеть общее снижение частоты аллеля к северу от волгоокского междуречья (до 1–2%) и повышение частоты АСР1*С в центральных, восточных и южных областях (до 7 %). Однако, хотя корреляция с широтой и составила в среднем r=0.34, для достоверной оценки различий при низких частотах (со средней q=0.03) требуются большие выборки.
Карты всех трёх аллелей локуса ACP1 обнаруживают высокую корреляцию (0.6<r<0.7) с первым сценарием изменчивости классических маркёров. Максимальна связь аллеля АСР1*С r=0.71; но два других аллеля также вносят весомый вклад в изменчивость первой главной компоненты русского генофонда: для аллеля АСР1*В корреляция r=0.59, для аллеля АСР1*А корреляция r=0.56.
§ 1.6. СИСТЕМА ФОСФОГЛЮКОМУТАЗЫ 1 (PGM1)
Фермент фосфоглюкомутаза играет важную роль в метаболизме углеводов. Из серии аллелей локуса pqMi наиболее полно изучено распространение частых аллелей PGM1*1+, PGM1*1-, PGM 1*2+, PGM1*2-.
Относится к группе генетико-биохимических маркёров (ферменты эритроцитарной фракции крови).
Рис. 5.2.8. Карта распределения аллеля PGM1*2+ в русских популяциях.
Рис. 5.2.9. Карта распределения аллеля PGM1*2-в русских популяциях.
ЛАНДШАФТ ЕВРАЗИИ ГРСМ1*1+. РСМ1*2+1
Концентрация наиболее частого аллеля PGM1*1+
(его средняя частота в русских популяциях q=0.59) растёт в Северной Евразии в направлении с запада на восток. Однако для русского населения этот градиент не прослеживается. Впрочем, то же можно сказать и об остальных аллелях локуса (рис. 5.2.8–5.2.10.). Например, для аллеля PGM1*2+ в населении Евразии отмечается выраженный долготный градиент увеличения частоты в западном направлении: средняя частота q=0.18 характерна и для коренного населения Сибири, и для Средней Азии; выше средняя частота в населении Урала (q=0.23), и ещё выше у коренных народов Кавказа (q=0.27). Однако в изменчивости русского народа этот долготный градиент PGM 1*2+ проявляется нечетко.
АРЕАЛ РУССКОГО ГЕНОФОНДА
Этот, второй по частоте аллель PGM1*2+ варьирует в русских популяциях от 0.14 до 0.38 со средним значением q=0.24 (табл. 5.2.1). Но максимум частоты приходится на одну из шести изученных популяций Вологодской области. Такой скачок частоты вероятнее всего связан с особенностями выборки. Ведь в среднем по шести вологодским популяциям частота PGM1*2+ (q=0.23) неотличима от среднерусской (q=0.24). К тому же и объем выборки, давшей максимальную частоту, невелик: n=61 человек. Так что единственным важным структурообразующим элементом генетического рельефа карты PGM1*2+ (рис. 5.2.8.) можно считать снижение частоты аллеля на северо-западе, в землях новгородских и тверских.
Частоты третьего аллеля PGM1*2- варьируют в пределах 0<q<0.16 со средним значением q=0.075. Карта аллеля PGM1*2- (рис. 5.2.9.) выявляет независимое повышение его частоты в трёх удалённых друг от друга популяциях — новгородской, архангельской и рязанской. Эти ядра высоких значений хорошо видны на фоне широкой области низких частот в северной половине русского ареала, вновь демонстрируя мозаичность генетического рельефа. Карта этого аллеля (PGM1*2-, (рис. 5.2.9.) во многих деталях является зеркальным отражением изменчивости карты аллеля PGM1*1-(рис. 5.2.10). Коэффициент ранговой корреляции между этими двумя картами составил r=- 0.62.
Частоты четвёртого аллеля PGM1*1- (рис. 5.2.10) варьируют в тех же пределах: от 0 до 0.18 со средним значением q=0.10 (табл. 5.2.1). Однако некоторую закономерность в генетическом рельефе аллеля PGM1*1- всё же можно предположить. В целом средние и низкие частоты характерны для западных (новгородско-псковских) и волго-окских популяций. Высокие частоты наблюдаются к северу и востоку — в вологодских и костромской популяциях. Нарушают такую широтную изменчивость увеличения частоты аллеля с юга на север лишь две географически
крайних популяции — Курская (q=0.14: n=200 чел.) и Архангельская (q=0.05: n=96 чел.). Средние частоты соседних финноязычных народов Приуралья (мордвы, мари, удмуртов) лежат в интервале 0.12<q<0.14, что в целом согласуется с некоторым увеличением в русском населении частоты аллеля PGM 1*1- в восточном направлении.
Рис. 5.2.10. Карта распределения аллеля PGM1*1-в русских популяциях.
ИТОГ
Средний по всем аллелям локуса уровень меж-популяционной изменчивости (GST=0.75) почти в два раза меньше селективно-нейтральной дифференциации (GST=1.36), что может указывать на действие стабилизирующего отбора. Однако картина изменчивости аллелей столь мозаична, что её сложно интерпретировать как в терминах истории, так и в терминах отбора. Лишь дальнейшее изучение может выявить реально существующую генетическую изменчивость русского генофонда — 23 популяции, изученные по локусу PGM1, не позволяют выдвинуть сколько-нибудь информативную гипотезу о факторах, сформировавших генетический рельеф его аллелей. В целом можно предполагать, что информативность локуса PGM1 для изучения структуры русского генофонда невелика.
Тем не менее, даже в изменчивости локуса PGM1 проглядывают общие закономерности архитектоники русского генофонда. Эти черты мы обнаруживаем, анализируя корреляции между картами аллелей локуса PGM1 и картами главных компонент русского генофонда (табл. 5.3.3.). Карта аллеля PGM 1*2- обнаруживает высокую корреляцию (r=0.76) с первым сценарием изменчивости классических маркёров. Два других аллеля вносят весомый вклад в изменчивость третьей главной компоненты русского генофонда: для аллеля PGM1*1+ корреляция r=0.75, для аллеля PGM1*2+ корреляция r=0.66.
§ 1.7 СИСТЕМА ЭСТЕРАЗЫ D (ESD)
Из всех эстераз наиболее подробно описан полиморфизм локуса ESD, причём фермент эстераза D, гидролизующий эфиры уксусной кислоты, встречается в большинстве тканей организма. Точная метаболическая функция эстеразы D неизвестна [Генофонд и геногеография…, 2000].
Относится к группе генетико-биохимических маркёров (ферменты эритроцитарной фракции крови).
ЛАНДШАФТ ЕВРАЗИИ
Считается, что градиент частот аллеля ESD*2 фиксирует монголоидный генный поток в популяциях Евразии [Спицын, 1985]: частота «азиатского» аллеля ESD*2 достигает максимума (q>0.40) в Южной Азии и в отдельных районах Центральной Азии, а в Европе падает до 0.12. Однако в Северной Евразии градиент частот ESD практически отсутствует. В Европе средняя частота альтернативного аллеля ESD*1 q=0.88, среди коренных народов Кавказа q=0.89, Урала q=0.85, Сибири q=0.83, Средней Азии и Казахстана q=0.81. Эти значения показывают, сколь мала региональная изменчивость ESD*1 в Северной Евразии (от 0.81 до 0.89) и как неприметен градиент падения частоты аллеля с запада на восток. Более того, на северо-востоке Евразии частота аллеля ESD*1 вновь возрастает до «европейских» частот: у восточных эвенков q=0.90, у коряков q=0.89. В целом, диапазон значений во всех изученных локальных популяциях Северной Евразии невелик: в 141 популяции 41 народа частота колеблется в пределах
0.71<q<0.99 при средней q=0.86. При этом диапазон популяционной изменчивости в пределах русского этноса (18 популяций, 0.79<q<0.94, q=0.89) сопоставим с размахом изменчивости во всей Северной Евразии.
АРЕАЛ РУССКОГО ГЕНОФОНДА
Столь слабо выраженные межрегиональные различия не позволяют уверенно интерпретировать генетический рельеф ESD*1 (рис. 5.2.11.) в русском ареале как следы тех или иных миграций. А такое предположение возникает при первом же взгляде на карту — её рельеф как бы задаётся резко выраженной впадиной низких значений на юго-востоке, ограниченной с севера и юга грядами наиболее высоких частот ESD*1. Естественно предположить, что уменьшение частоты в юго-восточной части русского ареала связано с влиянием степных номадов. Однако это предположение маловероятно, поскольку у ближайших тюркоязычных народов, изученных по этому гену, наблюдаются довольно высокие средние частоты ESD*1: у башкир (q=0.88) и татар (q=0.88). У других восточных соседей средние частоты аллеля варьируют следующим образом (двигаясь с юга на север): у мордвы q=0.89, у чувашей q=0.81, у удмуртов q=0.88, у коми-пермяков q=0.83, у коми-зырян q=0.88. На западе у карел частота ESD*1 достигает q=0.91.
На карте ядро относительно низких частот образовано только двумя русскими популяциями — Костромы (q=0.79, n=76 чел.) и Рязани (q=0.81, n=76 чел.). При этом в Курской области и Волго-Окском междуречье частота ESD*1 возрастает до 0.90, а в новгородских и архангельских землях снижается до 0.86.
Рис. 5.2.11. Карта распределения аллеля ESD*1 в русских популяциях.
ИТОГ
Вновь карта генетического рельефа русского народа отражает не «европеоидно-монголоидные» взаимодействия, в терминах которых привычно осмысливать генетическую изменчивость русских популяций, а сложные пути формирования русского генофонда. Объективно мы видим на карте чередование зон — широтных «волн», незначительно отличающихся то повышением, то понижением частоты аллеля. При этом средняя частота аллеля ESD*1 (q=0.89, число популяций К=18) полностью соответствует европейским стандартам, а межпопуляционная изменчивость (GST=0.95) несколько ниже селективно-нейтрального уровня (GST=1.36).
Корреляции карт локуса ESD с картами главных компонент русского генофонда (табл. 5.3.3.) обнаруживают высокую корреляцию с первым (r=0.58) и с третьим (r=0.51) сценариями изменчивости классических маркёров.
§ 1.8. СИСТЕМА ГЛИОКСАДАЗЫ 1 (GLO1)
Локус контролирует одну из форм глиоксалазы, отвечающей за превращения метилглиоксаля в лактат. Известны три варианта GLO1 с активностью фермента, убывающей в ряду: GLO1*2>GLO1*1>GLO1*0 («молчащий» аллель).
Относится к группе генетико-биохимических маркёров (ферменты эритроцитарной фракции крови).
Рис. 5.2.12. Карта распределения аллеля GLO1*1 в русских популяциях.
В МАСШТАБЕ ОЙКУМЕНЫ
Наибольшие частоты GLO1*1 характерны для народов Европы (q=0.41), в остальных частях света среднерегиональные значения q ниже 0.30. Считается, что для Северной Евразии характерен общий тренд увеличения частоты GLO1*1 с северо-востока на запад: диапазон изменчивости GLO1*1 в 147 популяциях 44 этносов Северной Евразии составил 0.08<q<0.58 (q=0.36). Однако максимальные частоты наблюдаются не только в центральных и северных районах европейской части России, но и на севере Западной Сибири, где частота аллеля возрастает до 0.51, приближаясь к мировому максимуму. Однако в среднем народы Сибири (q=0.28) характеризуются значительно меньшей частотой GLO1*1, чем народы Средней Азии (q=0.39), Кавказа (q=0.40), Урала (q=0.41) и Восточной Европы (q=0.42) [Балановская, 1998].
АРЕАЛ РУССКОГО ГЕНОФОНДА
В русских популяциях (К=18) частота аллеля GLO1*1 (рис. 5.2.12.) варьирует в довольно широких пределах 0.27<q<0.48 со средней q=0.37. При этом GLO1 характеризуется несколько сниженной межпопуляционной изменчивостью (GST=1.04) по сравнению с селективно-нейтральным уровнем русского генофонда (GST=1.36). Генетический рельеф GLO1*1 в русском ареале крайне любопытен: максимальные значения частоты GLO1*1 наблюдаются в центре ареала, а на периферии ареала они снижаются. Причём минимумы (0.27-0.30) обнаруживаются как в южной части ареала (включая часть волго-окского междуречья), так и в самой северной части (Архангельская область).
ИТОГ
Однако, исходя из данных о распределении аллеля GLO1*1 в коренном населении Европы, можно было прогнозировать совершенно иную картину для русского генофонда: увеличения частоты аллеля на юге (влияние южных европеоидов) и на севере, поскольку в циркумполярных финно- и самодийскоязычных популяциях частота GLO1*1 достигает значительных величин (например, у карел q=0.44, у тундровых ненцев q=0.51). Наблюдаемый генетический рельеф прямо противоположен ожидаемому, выведенному из основных геногеографических закономерностей у окружающих народов. Остается вновь предположить, что структура генофонда русского народа определяется не столько волнами иноземных миграций, сколько основными течениями собственной истории.
Корреляции карт локуса GLO1 с картами всех трёх главных компонент русского генофонда невелики и колеблются в пределах 0.3<r<0.4.
Рис. 5.2.13. Карта распределения аллеля PGD*C в русских популяциях.
§ 1.9 СИСТЕМА 6-ФОСФОГЛЮКОНАТ-ДЕГИДРОГЕНАЗЫ (6PGD)
Фермент необходим для синтеза нуклеиновых кислот (участвует в превращении гексоз) и присутствует во многих тканях организма. Кроме основных аллелей (PGD*A и PGD*C) описан ряд редких аллелей, причём некоторые приводят к сниженной активности фермента.
Относится к группе генетико-биохимических маркёров (ферменты эритроцитарной фракции крови).
В МАСШТАБЕ ОЙКУМЕНЫ
Во всем мире гетерозиготность локуса мала за счёт резкого преобладания аллеля PGD*A. Самые низкие частоты PGD*C характерны для коренного населения Америки и Европы (q<0.03), в остальных частях света q>0.05 с максимумами в Африке (q=0.09), Меланезии и Индостане (q=0.07). Между регионами Северной Евразии различия недостоверны: в Сибири q=0.06, на Кавказе q=0.05, в Средней Азии q=0.05, на Урале q=0.04, в регионе Восточной Европы (без Приуралья и Северного Кавказа) q=0.04. Предполагается, что несколько большая частота аллеля обычно наблюдается для более южных популяций.
АРЕАЛ РУССКОГО ГЕНОФОНДА
В 12 изученных русских популяциях частота PGD*C слабо варьирует от 0.02 до 0.06 со средней q=0.04 и гетерозиготностью HS=0.035 (табл. 5.2.1). Уровень межпопуляционной изменчивости (GST=0.35) значительно ниже селективнонейтрального уровня (GST=1.36), что может указывать на мощное действие стабилизирующего отбора.
На карте (рис. 5.2.13) обращает на себя внимание ядро повышенных частот PGD*C в центральной и юго-восточной частях ареала. Однако оно в основном связано с интерполяцией на юго-восточные районы и базируется на данных о двух отнюдь не южных популяциях — Вологодской (q=0.06, n=50 чел.) и Московской (q=0.06, n=99 чел.) областей.
Лишь дальнейшее изучение русского генофонда может проверить правильность представленного на карте генетического рельефа — слишком мало изученных популяций и слишком малы выборки для сравнительного изучения низко полиморфного гена. Поэтому эту карту можно оценивать лишь как один из вариантов картографического прогноза, который пока не может служить предметом детального обсуждения.
Тем не менее, карта распространения PGD*C содержит важные структурообразующие элементы русского генофонда: корреляция карты PGD*C с картой первой главной компоненты изменчивости классических маркёров велика: r=0.67.
§ 2. Группы крови (MN, RH, ABO)
Системы групп крови относятся к иммунологическим маркёрам — такова техника выявления этих маркёров. В самом простом случае это выглядит так. Если к эритроцитам, которые обладают так называемым «антигеном», мы добавим сыворотку крови другого человека, в которой есть соответствующие именно этому антигену антитела, то произойдет «слипание» эритроцитов. Мы увидим его невооруженным глазом: вместо обычной капли крови мы увидим сгустки и сыворотку (примерно так, как если в кислое молоко добавить кипяток). Обычно так и открывали многие иммунологические маркёры — если вдруг при переливании крови одного человека другому происходила агглютинация (слипание) эритроцитов, что могло приводить к осложнениям и даже гибели человека. Предназначение иммунологических маркёров — защищать организм от проникновения «чужеродцев», распознавать их и обезоруживать. Поэтому антитела могут вырабатываться организмом только к «чужим» антигенам — тем, которых у самого человека нет.
§ 2.1 СИСТЕМА ГРУПП КРОВИ MN
Система MN относится к кодоминантным локусам: все три генотипа ММ, MN, NN проявляются фенотипически различно, что для иммунологических маркёров — редкость. Локус MN находится на 4 хромосоме. Тесно сцеплен с локусом Ss, образуя единую систему MNSs. Поэтому при совместном анализе обоих диаллель-ных маркёров выявляются четыре различных гаплотипа (MS, Ms, NS, Ns). Но поскольку по системе Ss и гаплотипам MNSs изучено меньшее число популяций, мы рассмотрим геногеографию лишь локуса MN.
Между аллелями М и N нет доминирования одного над другим, поэтому гетерозиготу легко MN различить — она будет реагировать с обоими антителами — анти-М и анти-N. Различия между аллелями М и N связаны с аминокислотными заменами полипеп-тидных цепей антигенной молекулы в позициях от 1 до 5. Антигены М и N обнаружены не только у человека, но и некоторых беспозвоночных. Выявлено присутствие антигенов М и N не только в крови, но и других тканях человека. Известны случаи осложнений после переливания крови, вызванных антителами анти-М. Выявлены некоторые ассоциации групп крови MN с сахарным диабетом, пневмонией, атеросклерозом, остеохондрозом. Однако физиологическая роль антигенов MN неизвестна.
Относится к группе иммунологических генных маркёров.
В МАСШТАБЕ ОЙКУМЕНЫ
Гетерозиготность локуса MN достигает максимальной планки, возможной для двуаллельных локусов, поскольку в среднем для ойкумены частоты обоих аллелей близки к 0.5: среднемировая частота аллеля MN*M составляет q=0.54. Причём равновесие между обоими аллелями поддерживается во всех регионах Старого Света: в Европе средняя частота аллеля MN*M q=0.59, в Северной Евразии q=0.57, в Индостане q=0.66, в Восточной Азии q=0.66, в Африке (южнее Сахары) q=0.55, в Океании q=0.45. Но, тем не менее, мировой размах частот максимально велик (от 0 до 1) за счёт своеобразия остальных континентов. Аллель MN*M редок в Новой Гвинее и Австралии, где его средняя частота равна q=0.30, а в Меланезии — лишь q=0.15. В коренном населении Америки, напротив, аллель MN*M преобладает, достигая средней величины q=0.72.
ЛАНДШАФТ ЕВРАЗИИ
В пределах региона Северной Евразии, среди её локальных популяций, размах изменчивости аллеля MN*M также велик — от 0.17 до 0.90! Весь диапазон изменчивости приходится на популяции Сибирского региона, где величина межпопуляционных различий достигает чрезвычайно высокого уровня GST=8.30.
Причём в Сибири велики не столько различия между локальными популяциями в пределах этноса (то есть гетерогенность внутри этноса): по локусу MN они (GST=2.09) даже меньше, чем в среднем для сибирских этносов (GST=3.85, см. раздел 5.3.). Основная часть межпопуляционной изменчивости локуса MN (%) приходится на различия между этносами Сибири (GST=6.21). Средние этнические частоты варьируют в необычайно широких пределах от q=0.28 до q=0.76 (размах межэтнической изменчивости Δ=0.48). То есть этнические частоты у народов Сибири варьируют почти в тех же пределах, что и различия между локальными популяциями всей Северной Евразии (как говорилось, от 0.17 до 0.90).
Причём не один, а целый ряд этносов (алеуты, долганы, негидальцы, ульчи, шорцы, якуты) характеризуется очень высокой средней частотой около q=0.70. В то же время у другого ряда сибирских народов средние частоты едва достигают отметки q=0.40 (нганасаны, ненцы, чукчи, чулымцы, энцы). При этом средняя частота для сибирского региона находится всё на том же уровне мировых стандартов: q=0.56. На примере Сибири мы видим, что хотя среднерегиональные частоты достаточно постоянны в Старом Свете, внутри региона может наблюдаться значительный разброс частоты у разных народов, живущих в этом регионе.
Среднерегиональная частота MN*M практически та же и в Уральском регионе: q=0.52. И размах межпопуляционных различий MN также велик для населения Урала: GST=4.2. Причём вновь, как и в Сибири, гетерогенность самих народов не велика: на Урале (GST=1.04) она по локусу MN меньше, чем в среднем для региона (GST=1.42). Как и в Сибири, основная часть (вновь %) изменчивости приходится на различия между коренными народами Урала GST=3.20. Этнические частоты на Урале варьируют почти в столь же большом диапазоне, как и в Сибири — от q=0.33 у ненцев до q=0.68 у башкир (размах межэтнической изменчивости Д=0.35).
В Средней Азии диапазон изменчивости этнических частот, напротив, чрезвычайно узок (от q=0.56 до q=0.62, то есть Д=0.06), а средняя региональная частота (q=0.59) опять близка к «стандарту» Старого Света.
Из всех регионов Северной Евразии только на Кавказе наблюдается некоторое повышение средней частоты (q=0.68), а этнические частоты слабо варьируют от q=0.59 у азербайджанцев до q=0.76 у абазин (то есть размах межэтнической изменчивости Д=0.16).
ГЕНОФОНД ВОСТОЧНОЙ ЕВРОПЫ
Размах изменчивости частот MN*M среди народов Восточной Европы столь же невелик, как и на Кавказе: от q=0.54 у литовцев до q=0.70 у саамов (Д=0.16), причём практически у всех остальных народов Восточной Европы частоты колеблются около q=0.60. Соответственно, средняя частота MN*M в Восточной Европе равна q=0.62.
Межпопуляционные различия по локусу MN (табл. 5.2.2.) очень малы (GST=0.99) по восточноевропейским стандартам, где средний уровень различий между всеми популяциями Восточной Европы GST=2.25 (см. подробно главу 8). Эта величина включает в себя как различия между популяциями в пределах народа (гетерогенность этноса), так и межэтническую изменчивость (различия между этносами), которая по локусу MN вообще неощутима: GST=0.11 при средней по Восточной Европе GST=0.82. Но и рассматривая только внутриэтнический уровень, мы видим сниженную изменчивость локуса MN: гетерогенность этноса по локусу MN (GST=0.87) значительно меньше, чем селективно-нейтральная оценка гетерогенности «среднего» этноса восточноевропейского региона (различия между популяциями GST=1.44). Эти сравнения, показывающие сниженную изменчивость локуса MN в Восточной Европе, суммированы в таблице 5.2.2.
Таблица 5.2.2.
Дифференциация (G-.) локуса MN в Восточной Европе
Изумляет и близость этнических частот восточных славян (причём оценки надёжны — каждый народ изучен по большому числу популяций): у русских q=0.59, у белорусов q=0.59, у украинцев q=0.61. То есть при рассмотрении в целом восточноевропейской изменчивости MN бросается в глаза столь безликая межпопуляционная изменчивость, которая предполагает, что локус будет мало информативен для анализа генофонда.
АРЕАЛ РУССКОГО ГЕНОФОНДА
Напомним, что картографируемая территория включает русские популяции, расположенные от 43° до 70° с.ш. и от 24° до 60° в.д. (см. раздел 5.1). Поэтому в анализ попадает и часть территорий. Прибалтики, Белоруссии, Украины. Однако лишь русское население этих территорий включено в анализ русского генофонда! В 32 изученных русских популяциях частота MN*M варьирует от 0.37 до 0.72 (табл. 5.2.1). Различия между русскими популяциями (GST=1.19) чуть ниже селективнонейтрального уровня (GST=1.36). При этом гетерогенность русского народа равна общей изменчивости всех популяций Восточной Европы по этому локусу (как мы сказали, для Восточной Европы по локусу MN GST=1.20). То есть в восточноевропейском масштабе изменчивость русских популяций по этому гену велика и достигает размаха изменчивости всех популяций региона.
Рис. 5.2.14. Карта распределения аллеля MN*M в русских популяциях.
Генетический рельеф аллеля MN*M в русских популяциях приведён на рис. 5.2.14. Рельеф карты задаётся как ядрами с высокой частотой гена, разместившимися и на самом юго-востоке, и на северо-западе ареала, так и областью низких значений на Русском Севере. Эти географически полярно расположенные элементы при почти полной аморфности остальных территорий и создают корреляцию признака с широтой r=0.44 (табл. 5.2.1). Таким образом, мы оказываемся перед фактом, что при полной «безликости» и неинформативности средних частот MN*M, карта выявляет четкий тренд изменчивости в локальных русских популяциях. Присмотримся к нему.
Ядра с высокими частотами MN*M на юго-востоке и северо-западе соединены «нагорьем» повышенных значений частоты. На Верхней Волге (Тверские популяции) это нагорье вырастает почти до уровня северо-западного ядра, формируя третье ядро повышенных значений. Отметим, что пики самых высоких частот аллеля М находятся за пределами «исконного» русского ареала (русские восточной Эстонии и восточной Украины). А русские популяции в «исконном» ареале удивительно похожи друг на друга и лежат в пределах двух средних интервалов (от 0.58 до 0.61 и от 0.61 до 0.64). Эти два интервала занимают две трети (65 %) всей территории, образуя выраженное одновершинное распределение (рис. 5.2.14). Сразу подчеркнём, что «ядра» высоких значений нельзя однозначно вывести из частот у окружающих народов. Частоты русских популяций северо-западного ядра выше, чем в окружающих популяциях эстонцев (q=62, оценка получена по большому числу — 15 популяций эстонцев). Частоты в юго-восточном ядре также выше, чем у восточных соседей русского народа — в популяциях калмыков (q=0.64), татар (q=0.54), мордвы (5=0.57), удмуртов (q=0.59), марийцев (q=0.56). Оказывается, что частоты MN*M в окружающих этносах находятся в пределах всё тех же двух средних интервалов (от 0.58 до 0.64) или даже ниже их, в то время как в окраинных «ядрах» русских популяций значения (q=0.72) заметно превосходят значения средних интервалов (от 0.58 до 0.64).
Вторым структурообразующим элементом является область низких частот на севере[34]. Она задаётся шестью популяциями Архангельской области в бассейне Мезени, изученными А. А. Ревазовым и его сотрудниками. Все шесть популяций попадают в интервал значений q<0.55. В одной из популяций частота опускается до q=0.37, а в остальных колеблется около 0.5. Выборки велики — в среднем по 140 человек из популяции. Поэтому снижение частоты MN*M на севере Архангельской области можно считать твёрдо установленным фактом.
ГИПОТЕЗЫ
Достойное объяснение станет возможным тогда, когда и иные популяции Русского Севера будут детально изучены по MN. Однако и теперь можно высказать предположение, что такое снижение частоты на севере русского ареала связано с влиянием дославянского населения, включенного в русский генофонд в процессе колонизации северных территорий. Эта гипотеза имеет основания в низкой частоте у северо-восточных уралоязычных групп. Градиент частоты у них аналогичен русским популяциям — частота падает к северу (у коми-пермяков q=0.54, у коми-зырян q=0.50, у ненцев q=0.33). Но речь может идти о влиянии именно восточных групп финно-угров, поскольку у западных финноязычных групп частоты MN*M выше, чем у северных русских: у карел q=0.62, у вепсов q=0.64, у эстонцев q=0.62, у саамов q=0.70.
В порядке планирования будущих работ можно высказать ещё одну, ничем не обоснованную, но заманчивую гипотезу. Она касается того «коридора» сниженных частот MN*M, который тянется через весь русский ареал с севера на юг примерно вдоль 32 меридиана. Велик соблазн, объяснить его едва сохранившимся следом пути из «варяг в греки», протянувшимся через озера, реки и волоки от Ладоги до Черного моря. Проверить эту гипотезу просто — надо лишь пройти с экспедиционным обследованием этим же путем, что ходили наши предки.
Корреляция карт аллелей локуса MN выявлена лишь с картами третьей главной компоненты русского генофонда: r=0.5.
§ 2.2. СИСТЕМА ГРУПП КРОВИ РЕЗУС (RH)
Система групп крови Резус всем известна по личному знакомству — её определяют, когда возникает риск иммунологического конфликта: матери и плода, или же при переливании крови. Три тесно сцепленных локуса расположены на 1 хромосоме в порядке D-C-E, образуя единую систему Rhesus (RH), и при анализе всех трёх локусов можно выявить 18 фенотипов, за которыми скрываются 8 гаплотипов. Но поскольку по гаплотипам D-C-E изучено меньшее число популяций, чем только по локусу D, то мы и рассмотрим геногеографию лишь этого локуса. В популяционно-генетических исследованиях он представлен как двуаллельная система (RH*D и RH*d). И именно с локусом RH-D связана основная угроза возникновения гемолитической болезни новорожденных, хотя другие два локуса RH-С и RH-Е также могут быть причиной иммунологического конфликта между плодом и матерью. Антигены образуются у плода очень рано — уже в возрасте 8 недель. Небольшой размер иммуноглобулинов, несущих антитела анти RH, позволяет проникать им через плацентарный барьер, и иммунизация материнского организма приводит к гемолитической болезни новорожденного.
Гомозиготы dd по рецессивному аллелю RH*d (то есть обладатели двух рецессивных аллелей RH*d) всем известны как «резус-отрицательные»; а гомозиготы DD и гетерозиготы Dd (то есть носители хотя бы одного доминантного аллеля) фенотипически неразличимы и известны нам как «резус-положительные». Поясним, что именно из-за доминирования RH*D над RH*d (d внешне никак не проявляется в присутствии D, т. е. в гетерозиготе Dd) и возникают недоумения: почему у «резус-положительных» супругов рождаются «резус-отрицательные» дети? Это происходит, когда оба супруга гетерозиготны (Dd): ведь каждый из них является носителем рецессивного аллеля d, не проявляющегося «внешне», фенотипически. Из-за доминирования D над d оказываются возможны и разные исходы в браках «резус-положительных» и «резус-отрицательных» супругов. В этом случае все зависит от генотипа резус-положительного супруга. Все дети будут «резус-положительными», если его генотип окажется гомозиготой DD. Но если он гетерозиготен (Dd), дети будут «резус-отрицательные» с вероятностью 0.5.
Показана связь системы RH со многими заболеваниями — язвой желудка, остеоартрозом, остеохондрозом, пневмонией, корью, краснухой, а также связь с гормональным статусом.
Относится к группе иммунологических генных маркёров.
В МАСШТАБЕ ОЙКУМЕНЫ
Географическая изменчивость аллеля RH*d, ответственного за «резус-отрицательность», общеизвестна: максимум на западе Евразийского континента у басков Испании и Франции (q=0.74) и постепенное снижение частоты во всех остальных направлениях. Частоты аллеля RH*d в регионах мира приведены в таблице 5.2.3. Даже из таблицы видно, что мир как бы распадается по RH*d на две неравные части. С одной стороны запад Евразии с присоединившимися к нему Африкой, Уралом и Средней Азией. В этих регионах частоты RH*d заметны. С другой стороны — мир без RH*d (частоты RH*d близки к нулю). Это восток Евразии с обеими Америками, Австралией, Меланезией, Океанией. Северная Евразия занимает особое положение, охватывая оба мира — с RH*d и без него. Поэтому в таблице приведены частоты в регионах мира, а для Северной Евразии — ещё и для отдельных субрегионов.
Таблица 5.2.3.
Средние частоты аллелей локусов RH и АВ0 в коренном населении основных регионов мира
ЛАНДШАФТ ЕВРАЗИИ (рис. 5.2.15.)
Прежде всего, поясним, что создание карт евразийских трендов RH*d и АВ0 не было самоцелью. При формировании Банка данных «GENEPOOL» нас интересовал генофонд Северной Евразии на фоне его соседей. Поэтому информация для народов бывшего СССР собиралась максимально тщательно, а прочие регионы характеризовались, конечно, не столь полно. Хотя Европа и покрыта густой сетью изученных популяций, но часть Центральной, Южной и Передней Азии (и тем более Африки) представлены в Банке данных, по нашей лености, лишь отдельными народами. Это не мешает прослеживанию основных трансевразийских трендов. Но хотелось предостеречь читателя от чрезмерного доверия к локальным закономерностям карт RH*d и АВ0 Евразии. Впрочем, это относится к любым картам и таблицам — несовершенство наших знаний всеобъемлюще. Поэтому мы всегда привлекаем внимание читателя к наиболее устойчивым «каркасам» генофонда, его основным закономерностям, а мимолётное и эфемерное стараемся оставить за рамками портрета. Для решения этой же задачи мы приводим карты Евразии слегка «сглаженные» (фоновые, трендовые — см. специально посвящённую этим технологиям статью [Балановская, Нурбаев, 1995] и Приложение). Это позволяет избавиться от случайных флуктуаций в частоте аллелей и привести на «сглаженной» карте наиболее устойчивые значения, достойные внимания и доверия читателя.
Рис. 5.2.15. Карта аллеля RH*d в коренном населении Старого Света.
Генетический ландшафт RH*d в Евразии не требует специальных пояснений — настолько он изысканно прост (рис. 5.2.15.). Максимумы частот RH*d сосредоточены только в Западной Европе. При движении в остальных направлениях частота RH*d плавно снижается. Несомненен основной тренд: неуклонное падение частоты RH*d с запада на восток Евразии. Причём изолинии, делящие диапазон изменчивости на равные интервалы, почти вторят направлению меридианов (рис. 5.2.15.) Границей служит 90й меридиан — коренное население к востоку от него всё «резус-положительно». Восточная Европа — предмет нашего главного интереса — являет собой переходную зону, хотя в целом принадлежит к «европейскому» резус-отрицательному миру.
СЕВЕРНАЯ ЕВРАЗИЯ (бывший СССР)
Среди локальных популяций Северной Евразии размах изменчивости аллеля RH*d хотя и уступает мировому, но очень велик — от 0.00 до 0.54! Причём столь широкий диапазон изменчивости (от 0 до 0.5) среди локальных популяций характерен и для субрегионов Северной Евразии: и Восточной Европы, и Урала, и Средней Азии. Лишь на Кавказе минимальная частота опускается не до 0, а до q=0.16. Зато в коренном населении Сибири и размах изменчивости мал, и сам аллель RH*d встречается очень редко — в среднем q=0.04. Среди сибирских народов RH*d достигает заметных значений лишь у народов Алтае-Саянского нагорья (у шорцев q=0.17, у тофаларов q=0.14, у хакасов q=0.11).
На Урале сниженная средняя частота гена RH*d (q=0.23) связана с популяциями Зауралья и самого севера Урала (у манси q=0.16, у хантов q=0.00, у тундровых ненцев q=0.10). Наиболее близкие восточные соседи русского народа — популяции Приуралья и Южного Урала — по частотам RH*d приближаются к народам восточно-европейского региона: у коми-зырян q=0.30, коми-пермяков q=0.26, мари q=0.37, мордвы q=0.36, чувашей q=0.29, татар q=0.30, башкир q=0.27, и только у удмуртов q=0.17 (оценка получена по 13 популяциям). Межпопуляционная изменчивость RH*d на Урале необычайно велика: GST=7.9.
ВОСТОЧНАЯ ЕВРОПА
В Восточной Европе средние различия по RH*d между всеми её локальными популяциями в два раза меньше, чем на Урале, и равны GST=3.6. Первая составляющая этой величины — гетерогенность «среднего» восточно-европейского народа — по RH*d оценивается как GST=0.87, что несколько ниже селективно-нейтральной оценки GST=1.44 (табл. 5.2.4.). Однако вторая составляющая — различия между народами — по локусу RH*d достигает очень большого размаха (GST=2.75), которыйв три раза больше восточноевропейского стандарта (GST=0.82). Эти сравнения суммированы в таблице 5.2.4.
Таблица 5.2.4.
Дифференциация (GST) локуса RH-D в Восточной Европе
В диапазон этнических частот от q=0.33 у эстонцев и вепсов до q=0.44 у соседних карел «уложились» все народы Восточной Европы. Лишь у саамов (лопарей), своеобразие которых проявляется практически по любым маркёрам, средняя частота RH*d очень низка: q=0.14. Без учета саамов, средняя частота RH*d в Восточной Европе составляет q=0.38. Такая же средняя частота свойственна и русскому этносу: q=0.38 (оценка получена только по тем 96 русским поцуляциям, которые участвовали в построении карты на рис. 5.2.16.). Между восточными славянами, где каждый народ изучен по RH*d очень подробно (по 70-100 популяциям), различия средних частот невелики и варьируют около «русских» частот: у белорусов q=0.41, у украинцев q=0.34.
Характер изменчивости RH*d в Восточной Европе лучше описать с помощью корреляционных карт, показывающих связь частоты гена с широтой и долготой в каждой точке карты (см. карты [Балановская, Нурбаев, 1994а, б; 1995]).
Для основной части Восточной Европы[35] характерна чрезвычайно высокая корреляция с долготой, демонстрирующая падение частоты гена RH*d в направлении «запад-восток» (rMIN=-0.80). Именно такой тренд и ожидается, исходя из простой изменчивости аллеля в Евразии в целом (рис. 5.2.15.). Действительно, высокая отрицательная корреляция с долготой означает, что большему значению географической долготы соответствует меньшая частота аллеля. Поскольку для Восточной Европы значения долготы растут с запада на восток (отсчитываясь, как известно, от Гринвичского нулевого меридиана), мы получаем снижение частоты аллеля RH*d к востоку. Этот пример показывает, как, пользуясь одними лишь корреляционными картами, можно извлекать подробную информацию о географии аллеля — в данном случае мировой тренд падения частоты аллеля к востоку. Однако при переходе от мира на уровень региона, регион обнаруживает и свои собственные закономерности, нарушающие стройный ход мировых закономерностей. Так, северо-западная зона Восточной Европы обнаруживает «обратное» направление связи с долготой (rМАХ=+0.60).
Что же касается корреляции с широтой, то средний коэффициент корреляции приближается к нулю (r=0.01). Однако нулевые корреляции с широтой (-0.10<r<+0.10) занимают лишь 11 % всей площади карты. Выделяются две области: высокой отрицательной связи с широтой (rMIN=-0.86) на севере и почти столь же высокой положительной связи с широтой (гМАХ=+0.56) на юге Восточной Европы.
Корреляционные карты говорят о двух важных явлениях. Во-первых, что средний коэффициент корреляции (то есть обычный, который мы рассчитываем без карт) может ввести в заблуждение.
Если связь между признаками мощная, но существуют две равных по площади области с противоположной по знаку (до r=+1 и r=-1) связью, то средний коэффициент становится равным нулю, и мы можем решить, что связи просто нет! Во-вторых, переходя от глобального рассмотрения к составляющим регионам (все более маленьким «матрёшкам») мы можем обнаруживать исчезновение «глобальных» закономерностей и появление своих собственных, региональных.
Рис. 5.2.16. Карта распределения аллеля RH*d в русских популяциях.
АРЕАЛ РУССКОГО ГЕНОФОНДА
Именно это мы и обнаруживаем для русского генофонда. На карте русского народа (рис. 5.2.16.) мы не видим даже намёка на общий трансевразийский тренд «запад-восток» (рис. 5.2.15). Более того, мы не видим вообще никаких четких закономерностей в ареале русского генофонда! «Русская» карта RH*d подобна «лоскутному одеялу»: на ней области высоких значений мирно соседствуют с областями низких значений RH*d. Если же выделить из всей картографируемой территории[36] тот основной «исконный» ареал, в котором складывался физический облик русского народа[37], то в нём можно разглядеть не очень четкий, но своеобразный рельеф. В центре ареала находятся два пика
(р>0.42) и «нагорья» высоких значений, от которых во всех направлениях частота гена RH*d снижается. На периферии ареала мы видим либо новые повышения частоты (на юге и востоке), либо снижения (на севере, западе и юго-востоке).
Напомним, мы ожидали для локуса MN, что (из-за его безликой изменчивости в Восточной Европе) он будет мало информативен для анализа русского генофонда (подраздел § 2.1.) но обнаружили в русском ареале географический тренд с широтной изменчивостью! Для RH*d картина обратная — ожидая, исходя из глобального тренда, простую закономерноность «запад-восток», мы сталкиваемся со столь причудливым генетическим рельефом, который даже трудно интерпретировать!
Карты показывают, что географическое распространение гена не укладывается в простую схему, предполагающую, что континентальный тренд выложен, как из «кирпичиков», из внутрирегиональных и внутриэтнических трендов, и каждый из этносов отражает ту часть всеобщего тренда, которая приходится на его территорию. Обычно все оказывается сложнее и любопытнее. Например, ожидаемый для RH*d тренд (убывание частоты гена в направлении «запад-восток») ярко проявляется лишь при рассмотрении евразийского континента в целом (рис. 5.2.15). Но с изменением масштаба исследования, при последовательном переходе к более частным субрегионам и далее к этносам (см. карты [Балановская, Нурбаев, 1994а, б; 1995]), за деревьями исчезает лес — континентальный тренд многократно перекрыт более частными событиями истории этих генофондов.
Возвращаясь к русскому генофонду, отметим, что в 96 изученных русских популяциях частота RH*d варьирует от 0.26 до 0.52 (табл. 5.2.1). Но при этом гетерогенность RH*d (GST=0.45) намного ниже селективно-нейтрального уровня (GST=1.36) гетерогенности русских популяций. Столь резкое снижение изменчивости может указывать на действие стабилизирующего отбора на локус RH-D в русских популяциях. При этом изменчивость русского народа по RH*d (GST=0.45) меньше, чем многих других восточно-европейских народов: она в два раза слабее усредненной гетерогенности народов Восточной Европы по этому локусу (GST=0.90, табл. 5.2.4). Напомним, что на межэтническом уровне различия между народами Восточной Европы по RH*d ещё значительней: GST=2.7. В целом, это означает, что трансевразийский тренд RH*d «запад-восток» проявляется в Восточной Европе лишь за счёт иных народов и, скорее всего, на уровне межэтнических различий, но не имеет отношения к русскому народу и не проявляется в гетерогенности русских популяций.
Локус RH*d вносит весомый вклад во второй главный сценарий архитектоники русского генофонда: r=0.73.
Рис. 5.2.17. Карта аллеля АВ0*А в коренном населении Старого Света.
§ 2.3. СИСТЕМА ГРУПП КРОВИ АВ0
Локус АВ0 является самым известным из всех генов человека — все знают его как просто «группы крови» — 1(0), Н(А), Ш(В), IV(AB). Группы крови АВ0, как и Резус, определяют возникновение риска иммунологического конфликта при переливании крови. Благодаря их широкому применению в медицинской практике и, следовательно, обилию данных по разным популяциям, в течение долгого времени эти маркёры являлись излюбленными, а то и просто единственными, маркёрами в арсенале популяционных генетиков. И сейчас группы крови АВ0 и Резус являются абсолютными лидерами по обилию популяционных данных. Пока можно лишь мечтать, что в будущем какой-либо маркёр будет, так же как АВ0, изучен в 182 русских популяциях и в 1230 популяциях Северной Евразии!
Число аллелей в локусе АВ0 велико (особенно выявляемых методами молекулярной генетики), но общеизвестные «группы крови» определяются только тремя аллелями — А, В и 0. Аллели А и В кодоминантны («равноправны») и поэтому гетерозигота АВ проявляется фенотипически — как «четвертая» группа крови IV(AB). Аллель 0 рецессивен («подчинён») по отношению и к А, и к В, поэтому фенотипически мы обнаруживаем лишь его гомозиготу, обозначая её как «первую» группу крови 1(0). Из-за такого «подчинения» гетерозигота АО фенотипически неотличима от гомозиготы АА, и потому вместе они образуют «вторую» группу крови И(А). Точно также оба генотипа ВО и ВВ внешне проявляются как «третья» группа крови III(В). Знание такого «соподчинения» аллелей позволяет ожидать, что в браке супругов с I группой крови все дети будут им подобны. В браке супругов с IV группой крови — дети могут быть любой группы крови, кроме I. А в браке супругов с II и III группами возможны все варианты — от I до IV групп крови (если оба супруга гетерозиготны, т. е. АО и ВО).
Антигены образуются у плода очень рано — уже в возрасте 5 недель. Поэтому при несовместимости матери и плода по АВ0, может возникнуть иммунологический конфликт, который приводит не столько к гемолитической болезни новорожденного, сколько к спонтанным абортам. Но они обычно происходят столь рано, что о них и не подозревают. Если антитела из сыворотки крови матери проникают через плацентарный барьер в кровь ребенка, то они могут вызвать агглютинацию (слипание) его эритроцитов, что приводит к гибели плода на ранних стадиях эмбриогенеза. Такой отбор на ранних стадиях развития плода можно обнаружить лишь статистически — в нехватке детей с определёнными фенотипами среди потомства в несовместимых по АВ0 семьях. В более поздние сроки беременности внутриутробная гибель плода приводит к спонтанным выкидышам.
Показана связь групп крови АВ0 со многими заболеваниями. Вирусный гепатит, грипп, краснуха, скарлатина, язва желудка, язва кишечника, многие виды рака, болезни опорно-двигательного аппарата, заболеваний дыхательных путей и сердечно-сосудистой системы — вот далеко не полный перечень болезней, устойчивость или же подверженность к которым коррелирует с группами крови АВ0. Географическую неравномерность в мировом распределении групп крови АВ0 часто связывают с результатами эпидемий чумы, оспы и холеры: обладатели группы крови 1(0) более восприимчивы к холере и чуме, чем обладатели группы крови 11(A). Причину этого видят в том, что палочка чумы содержит антиген, подобный антигену 0, а вирус оспы — подобный антигену А. Поэтому, например, индивиды с группой крови 1(0), имеющие антиген 0, могут оказаться менее устойчивыми к чуме, потому что им сложнее «опознать» антиген возбудителя болезни как чужеродный и они могут реагировать на него слабее и несвоевременно. Именно с этим феноменом принято связывать низкие частоты группы крови 1(0) в регионах, где свирепствовали эпидемии чумы: Северная Африка, Индия, Монголия.
Относится к группе иммунологических генных маркёров.
В МАСШТАБЕ ОЙКУМЕНЫ
Описание изменчивости аллелей АВ0*А, АВ0*В, АВ0*0 в масштабе ойкумены кочует из учебника в учебник. Поэтому мы ограничимся приведенной выше таблицей с рассчитанными нами средними частотами для всех регионов мира (табл. 5.2.3.) и картами распространения аллелей АВ0 для населения Евразии (рис. 5.2.17.-5.2.19).
За пределами Старого Света (табл. 5.2.3) больше всего поражает резкий сдвиг частот АВ0 в коренном населении Америки — повсеместно распространен аллель AB0*0 (q=0.95), а частоты А и В равно близки к нулю. В коренном населении Австралии также очень высока частота AB0*0 (q=0.78), но при этом аллель АВ0*А (q=0.20) заметно преобладает над AB0*B (q=0.02). В населении Евразии частоты AB0*0 (q=0.61) ниже, но при этом ни в одном из евразийских регионов они не опускаются за отметку q=0.5 (табл. 5.2.3). Аллели А и В в разных регионах Евразии уступают друг другу второе место. В среднем для Евразии частота АВ0*А (q=0.21) несколько выше, чем частота AB0*B (q=0.18). В регионах Евразии оба аллеля достигают высоких частот в Индостане, где наиболее снижена частота мажорного нулевого аллеля.
Рис. 5.2.18. Карта аллеля АВ0*В в коренном населении Старого Света.
Описание евразийского распределения групп крови АВ0 несколько выходит за рамки русского генофонда. Поэтому будем предельно кратки — карты говорят сами за себя. Приводя эти карты, мы вновь делаем исключение, как и для групп крови Резус. И причина этому все та же — карты групп крови АВ0 вызывают всеобщее любопытство. Однако такое исключение помогает решить и непосредственную задачу книги — позволяет на примере наиболее изученных и надежных маркёров рассмотреть, как русский генофонд выглядит «из космоса» и как он вписывается в евразийские ландшафты.
ЕВРАЗИЙСКИЙ ЛАНДШАФТ АВ0*А (рис. 5.2.17.)
Он не столь элегантен, как ландшафт RH*d (рис. 5.2.15), но все же позволяет, генерализуя картину, выделить такой же общий тренд: снижение частоты АВ0*А с запада на восток Евразии. На западе Евразии преобладают нагорья высоких значений АВ0*А, достигая максимальных значений и на самом севере Европы (Фенноскандия), и на самом её юге (Иберийский полуостров). Возвышенность генетического рельефа в Восточной Европе простирается на Украину и юго-запад России. Однако основной ареал Восточной Европы, включая Прибалтику, центр Русской равнины и особенно Русский Север отличаются от Западной Европы более низкими частотами АВ0*А. За пределами Европы значения выше средних частот проходят поясом через Переднюю и Среднюю Азию и далее на восток, вновь возрастая в Японии. К северу и к югу от этого пояса мы видим низкие значения АВ0*А. Впрочем, эта закономерность не всеобщая: например, в Сибири диапазон изменчивости АВ0*А достигает евразийского размаха.
ЕВРАЗИЙСКИЙ ЛАНДШАФТ АВ0*В (рис. 5.2.18.)
Этот ландшафт более выразителен. В Европе сосредоточены минимумы частоты АВ0*В, плавно возрастающей при движении на восток. Второй «полюс» — высоких частот АВ0*В — охватывает огромные пространства Южной и Центральной Азии. Итак, основной тренд: повышение частоты АВ0*В с запада на юго-восток Евразии. В отличие от предыдущей карты, генетический ландшафт Восточной Европы по АВ0*В не отличается своеобразием и исполняет роль переходной зоны: на западе она выглядит вполне европейски, а на востоке встраивается в долготный пояс высоких частот. Этот пояс пересекает Евразию с юга на север и тянется от Индийского океана (с мировым максимумом в Индостане) к Северному Ледовитому океану (к тундровым ненцам). В Сибири диапазон изменчивости частот АВ0*В опять-таки достигает евразийского размаха. Но к югу от Сибири мы видим устойчивое повышение частоты АВ0*В, характерное почти для всей южной части Азии.
Рис. 5.2.19. Карта аллеля АВ0*0 в коренном населении Старого Света.
ЕВРАЗИЙСКИЙ ЛАНДШАФТ АВ0*0 (рис. 5.2.19)
Ландшафт этого аллеля особенно хорош с методической точки зрения. Он показывает, что ареалы с одинаковыми значениями признака вовсе не говорят о родстве населения, там обитающего. Все зависит от географии, от взаимоположения этих ареалов, от их разде-лённости пространством и историко-географическими барьерами. «Положение объекта в пространстве географы считают таким же существенным признаком, как физические свойства и функции» [Родоман, 1990, с.37]. Первой огромной зоной высоких частот АВ0*0 является Сибирь с прилегающими к ней районами. Несмотря на значительные колебания частот, связанные с дрейфом генов в сибирских изолятах, Северная Азия представляет собой обширное нагорье высоких частот АВ0*0. Вторая зона максимумов расположена на западе Западной Европы. Эти два максимума разделяет обширнейшая низменность со значениями АВ0*0 ниже евразийской средней. Эта область простирается от Центральной и Северной Европы до Японии, захватывая Восточную Европу, Урал, юг Западной Сибири, Центральную Азию и почти всю Южную Азию. Поэтому, при обнаружении такого ландшафта — с максимумами, разделёнными пространством, историей формирования населения и областями иных значений — нам не приходит мысль о близком родстве населения Сибири и Западной Европы.
Объяснение такого ландшафта обычно ищут в терминах естественного отбора. Для групп крови АВ0 отбор, как считается, связан с распространением инфекций (оспы, чумы) и других заболеваний, опосредованных демографией (плотностью населения) и внешней средой — в самом широком смысле этого понятия. Однако и эта гипотеза оставляет много недоумений.
Возвращаясь к Восточной Европе, — она наиболее важна для понимания русского генофонда — отметим своеобразие её северных областей. В них расположен локальный максимум частоты АВ0*0, заметный даже в евразийском масштабе. Причём на исходной карте (напомним, что мы приводим слегка «сглаженные» карты, чтобы выявить устойчивые тренды) этот локальный максимум отделен от соседей как на западе, так и на востоке.
СЕВЕРНАЯ ЕВРАЗИЯ
На примере двух столь подробно изученных локусов — групп крови АВ0 и RH — можно убедиться, насколько различна бывает дифференциация одних и тех же регионов по разным маркёрам. Например, на Урале дифференциация популяций по RH*d (GST=7.9) в пять раз выше, чем по АВ0 (GST=1.5). В Восточной Европе — по RH*d (GST=3.6) в два раза выше, чем по АВ0 (GST=1.6). А на Кавказе показатели идентичны — GST=2.4 и по RH*d, и по АВ0. Этот уровень межпопуляционных различий по АВ0 одинаково невелик на Урале (GST=1.5) и в Восточной Европе (GST=1.6), хотя в других регионах Северной Евразии он выше: на Кавказе GST=2.4, в Средней Азии GST=2.5, в Сибири GST=5.5.
Рассмотрим для краткости изменчивость лишь «ведущего» аллеля — АВ0*0, а особенности двух других аллелей читатель сможет сам проследить по картам и таблицам. В генофондах Северной Евразии наибольшая частота АВ0*0 обнаруживается на Кавказе (q=0.63), причём такая же частота характерна и для Западной Европы (q=0.65). У народов Восточной Европы и Урала частота АВ0*0 несколько ниже (q=0.58). В обоих регионах частота АВ0*0 колеблется в широких пределах. В уральском регионе от q=0.49 у тундровых ненцев до q=0.64 у манси Зауралья. При этом тюркоязычные народы (башкиры q=0.56, татары q=0.57, чуваши q=0.56) неотличимы от финно-угров (мари q=0.56, мордва q=0.57, удмурты q=0.58, коми-пермяки q=0.59, коми-зыряне q=0.60) У народов Восточной Европы размах изменчивости вторит уральскому: от q=0.47 у крымских татар до q=0.63-0.64 у карел, вепсов и литовцев.
ВОСТОЧНАЯ ЕВРОПА
На межэтническом уровне, различия между восточнославянскими народами — русскими, украинцами, белорусами — невелики: 0.25<q<0.26 по АВ0*А; 0.14 <q< 0.16 по АВ0*В; 0.59 <q< 0.60 по АВ0*0. Частота АВ0*0 в русских популяциях (q=0.59) совпадает со средней для всей Восточной Европы (q=0.59). Совпадают среднерусские и восточноевропейские частоты и двух других аллелей: для АВ0*А=0.25, для AB0*B q=0.16 (оценки получены только по тем 182 русским популяциям, которые участвовали в построении карты на рис. 5.2.20).
Рис. 5.2.20. Карта распределения аллеля АВ0*А в русских популяциях.
На внутриэтническом уровне, гетерогенность русского народа по группам крови АВ0 намного ниже селективно-нейтрального (GST=1.36) уровня: для AB0*A G=0.88, для AB0*B GST=0.61, для АВ0*0 GST=0.76 (таол. 5.2.1). Это может указывать на действие стабилизирующего отбора на локус АВ0. Гетерогенность не только русского, но и «среднего», «типичного» этноса восточноевропейского региона по АВ0 (GST=0.48) значительно — в три раза! — ниже селективно-нейтральной оценки (GST=1.44, табл. 5.2.5.). Однако отсюда следует, что гетерогенность русского народа по АВ0 (GST=0.8) больше, чем гетерогенность «типичного» этноса Восточной Европы по этому локусу (GST=0.5).
«РУССКИЙ» ЛАНДШАФТ АВ0*А
В отличие от «русской» карты по RH*d, обнаруживается не «лоскутное одеяло», а четкий тренд. Ясно прослеживается-падение частоты аллеля по направлению к северо-востоку: если в западных и южных русских областях частота достигает q=0.30, то на северо-востоке практически нигде не превышает q=0.22. Основная часть популяций лежит в пределах 0.15<q<0.35 (рис. 5.2.20). Несмотря на относительно небольшой размах изменчивости, всё множество популяций соответствует картине снижения частоты к востоку и северу. Удивительно, что лишь одна южная популяция (на нижней Волге) и одна северная (на Кольском полуострове) выбиваются из общего строя, а остальные 180 популяций следуют ему. Такое снижение частоты к востоку в русском ареале является частью общего тренда изменения частоты АВ0*А в Евразии в целом (рис. 5.2.17.) — падения частоты при движении от Западной Европы к Восточной и далее за Урал в Центральную Азию [Cavalli-Sforza et al., 1994].
Таблица 5.2.5.
Дифференциация (GST) локуса АВ0 в Восточной Европе
- | По локусу АВ0 | В СРЕДНЕМ по ряду классических маркёров
ГЕТЕРОГЕННОСТЬ ЭТНОСА: средние различия между популяциями одного народа | 0.48 | 1.44
МЕЖЭТНИЧЕСКИЕ РАЗЛИЧИЯ: средние различия между народами | 1.18 | 0.82
ДИФФЕРЕНЦИАЦИЯ РЕГИОНА: средние различия между всеми популяциями (всех народов) | 1.66 | 2.25
Примечание: расчёт проведён по данным только о тех народах, для которых изучено не менее двух популяций (т. о. по локусу АВ0 анализировалась 361 популяция Восточной Европы)
«РУССКИЙ» ЛАНДШАФТ АВ0*0 (рис. 5.2.21.)
Он является почти зеркальным отражением предыдущей карты — падение частоты с северо-востока (р>0.7) на юг и юго-запад (q<0.5). Если на Русском Севере частота достигает 0.7, то в западных и южных русских областях снижается до 0.5.
Рис. 5.2.21. Карта распределения аллеля АВ0*0 в русских популяциях.
Основная часть популяций лежит в пределах 0.5<q<0.7. И вновь почти все русские популяции следуют рельефу плавного снижения частоты с севера к юго-западу, вновь подтверждая объективность такого тренда для русских популяций.
Основное отличие карт этих двух аллелей (АВ0*А и АВ0*0) связано с северо-западной частью ареала. По АВ0*А в ней наблюдается максимум высоких значений частоты — пик, сформированный Псковскими популяциями и завершающий гряду западных и юго-западных высоких значений. По аллелю АВ0*0 северо-запад тяготеет не 'к южным, а к северным зонам, являясь их закономерным продолжением.
Повышение частоты АВ0*0 на юго-востоке лежит в области интерполяции и сопровождается сниженной (хотя и достоверной) надёжностью такого прогноза.
Это сомнительное ядро (находящееся далеко за пределами «исконного» русского ареала) опирается лишь на три популяции со значениями частоты выше 0.6, в то время как для всего множества остальных русских популяций Поволжья характерны частоты в интервале 0.58<q<0.60. Выше мы привели средние частоты АВ0*0 для коренных народов Уральского региона — все они похожи друг на друга и лежат в узких пределах 0.56<q<0.58, достигая q=0.60 лишь у коми-зырян на севере. У калмыков частота АВ0*0 также невысока: q=0.57. У казахов q=0.58 (это самая высокая частота из всех народов Средней Азии и Казахстана). Поэтому повышение частоты в трёх русских популяциях Поволжья, скорее всего, случайно: оно не соответствует частотам ни в соседних русских, ни в соседних иноэтничных популяциях.
РУССКИЙ СЕВЕР (АВ0*0)
Что же касается повышения частоты АВ0*0 на Русском Севере, то его нельзя объяснить влиянием народов Приуралья. Хотя у них мы обнаруживаем некоторое повышение частоты АВ0*0 к северу, но в северных русских популяциях частота гена АВ0*0 ещё выше и варьирует около 0.7. Коренные народы с высокими значениями АВ0*0 мы находим на северо-западе: и у карел, и у вепсов q=0.64. В целом, опираясь на эти данные и историю колонизации Русского Севера, можно предположить, что повышение частоты АВ0*0 в северных русских популяциях связано с финно-угорским субстратом — теми племенами и народами, которые освоили эти территории задолго до славян. Причём можно предположить, что они были больше похожи на современных западных, чем на восточных финно-угров.
Напомним, что по аллелю MN*M мы также обнаружили снижение частоты на Русском Севере, которое также объясняли влиянием финно-угорского субстрата (подраздел § 2.1). Но по локусу MN вырисовывалась картина влияния не западных, а напротив, восточных групп финно-угров. Это показывает, сколь шатки любые выводы о генофонде, основанные на изменчивости лишь одного гена. Впрочем, нельзя исключить, что в генофонде Русского Севера присутствуют как западный, так и восточный финно-угорский субстрат. И разные гены зафиксировали в своем генетическом ландшафте только один из этих генных потоков. Поэтому описание устойчивой структуры русского генофонда мы даем в разделе 5.3, основываясь на обобщённом анализе всех классических маркёров. А предположениям, формулируемым при описании отдельных генов, отводим ранг лишь предварительных (и, как видим, порой противоречащих друг другу) гипотез.
Однако рискнем высказать ещё одну гипотезу (см. также разделы 2.3. и 4.4). В генетическом ландшафте АВ0*0 на Русском Севере проявляется не только дославянский субстрат, но и потоки славянской колонизации. Исходя из общего генетического ландшафта, можно предположить, что для Новгородской Руси и её северных колоний были характерны более высокие значения АВ0*0. А «низовская» колонизация Ростово-Суздальской, а затем Московской Руси несла на север более низкие частоты АВ0*0, характерные для большинства летописных славян. Тогда тот «прорыв» низких частот на север, который разделяет на две части Русский Север, может являться следом низовской колонизации — в ходе борьбы Новгорода и низовских земель за северные территории.
Напомним, что такой след М. В. Битов прослеживал по данным антропологии (см. раздел 4.4). Однако, хотя по группам крови АВ0 изучено то же число популяций (К=182), что и по данным антропологии (К=180), но генетические данные все равно остаются менее информативными из-за их неравномерного распределения по ареалу — «то пусто, то густо». Достаточно сравнить карту АВ0*0 (рис. 5.2.19.) с любой антропологической картой (например, рис. 4.2.1), чтобы убедиться, насколько антропологами лучше спланировано изучение того же числа русских популяций: они равномерно — в соответствии с историей расселения и плотностью населения — покрывают ареал, в то время как по данным генетики многие важные части ареала не обеспечены информацией. Из этого можно сделать два вывода. Во-первых, нельзя по имеющимся сейчас для русских популяций данным генетики определить точный маршрут генов — его можно набросать лишь очень приблизительно. А во-вторых, для изучения истории русского генофонда необходимо продолжать накопление данных даже по столь изученным классическим маркёрам, как группы крови АВ0!
«РУССКИЙ» ЛАНДШАФТ АВ0*В (рис. 5.2.2)
Карта распространенности аллеля АВ0*В дополняет две предыдущие карты (частоты аллелей, показанные на всех трёх картах, в любой конкретной точке в сумме составляют единицу). Однако четкие тренды в генетическом ландшафте АВ0*В отсутствуют — они как бы исчерпаны предыдущими картами. Основная территория занята средними значениями, а на периферии разбросаны ядра высоких значений (до q=0.43). Низкие значения видны в Псковских землях и на северо-востоке Архангельской области (где аллель АВ0*В практически отсутствует, опускаясь до q=0.01). Однако эти два провала частот АВ0*В разделены северным хребтом высоких значений.
Рис. 5.2.22. Карта распределения аллеля АВ0*В в русских популяциях.
Иными словами, мы вновь, как и для RH*d (рис. 5.2.16.), видим ландшафт «лоскутного одеяла». Напомним, что на евразийских картах именно этот аллель показал четкий тренд изменения частоты с запада на восток. Похожий тренд выявлен и по аллелю RH*d. Генофонд Восточной Европы по обоим маркёрам (рис. 5.2.15. и 5.2.18.) играл роль переходной зоны и обнаруживал четкий тренд «запад-восток». Однако, перейдя с регионального уровня популяционной иерархии (Восточная Европа) на этнический уровень («русские» карты), мы не обнаруживаем в русском генофонде ни такого тренда, ни соответствующей ему связи с долготой. И по RH*d (r=0.05), и по АВ0*В (r=0.08) корреляция с долготой близка к нулевой отметке. А сами карты набросаны вольными мазками разных «красок» значений признака.
ИТОГ
Обе карты — и RH*d, и АВ0*В — обеспечены обширной исходной информацией, и потому позволяют сделать некоторое обобщение: четкая закономерность на региональном уровне не «обязывает» этносы к её «исполнению». В ладу с собственной историей этнический генофонд может её «отменять» или преобразовывать в свою собственную версию генетического ландшафта.
Все три аллеля локуса АВ0 вносят свой вклад в главный сценарий архитектоники русского генофонда. Эти черты мы обнаруживаем, анализируя корреляции карт аллелей локуса АВ0 с картами главных компонент русского генофонда (табл. 5.3.3). Карта аллеля АВ0*А обнаруживают высокую корреляцию (r=0.64) с первым сценарием изменчивости классических маркёров. Вклад двух других аллелей меньше: для аллеля АВ0*0 корреляция r=0.42, для аллеля АВ0*В корреляция r=0.31.
§ 3. Риск несовместимости матери и плода по группам крови
Рис. 5.2.23. Карта распределения генетического риска резус-конфликта матери и плода при учете их совместимости одновременно по группам крови AB0 и RH (число случаев на 100 000 населения).
Раз уж мы позволили себе столь подробно остановиться на изменчивости двух самых популярных классических маркёров — групп крови AB0 и Резус, то нельзя не затронуть и их взаимодействие.
Мы рассмотрим то взаимодействие, которое обычно остается за рамками самых важных «практических» применений групп крови. Мы рассмотрим генетический риск возникновения гемолитической болезни новорожденных при учете совместимости матери и ребенка не только «по резус-фактору», а одновременно по обеим системам групп крови (AB0 и RH). При совместном рассмотрении обнаруживаются неожиданные и важные явления.
Патология беременности, возникающая при несовместимости матери и плода по группам крови резус, общеизвестна.
Проявления её могут быть очень тяжелы, и выражаться не только в анемии новорожденного, но и во множественных очагах кровоизлияний, водянке полостей тела, поражениях дыхательных путей, желудочно-кишечного тракта, печени и селезёнки [Прокоп, Гелер, 1991].
Менее известна патология при несовместимости матери и плода по группам крови AB0. Проявления её различны на разных стадиях развития плода. В первом триместре беременности она влечет за собой увеличение частоты внутриутробной гибели эмбриона или плода. Потери из-за элиминации АВ0-несовместимого с матерью потомства весьма ощутимы: они составляют по разным оценкам от 3–5 % до 15–21 % [Туманов, Томи-лин, 1969; Головачев, 1983].
В конце последнего триместра беременности, перед родами, происходит переход антител и других факторов гуморального иммунитета через плаценту. Такая пассивная иммунизация имеет важнейшее значение для новорожденного, поскольку компенсирует незрелость иммунных систем ребенка [Головачев, 1983]. Побочными эффектами такой иммунизации может быть гемолитическая болезнь и ухудшение функционального состояния новорожденного, связанные с иммунной несовместимостью [Туманов, Томилин, 1969; Головачев, 1983]. Последствия несовместимости по системе АВ0 наблюдаются в 2–3 раза чаще, чем по другим иммунным системам [Доссе, 1959]. Но они, в отличие от резус-несовместимости, проявляют себя раньше — до появления ребенка на свет. Для плода они могут иметь печальные последствия. А для новорожденного серьезной угрозы они обычно не представляют, следовательно, не представляют они и проблемы для здравоохранения.
Логично было бы ожидать, что в случаях двойной несовместимости матери и плода — по АВ0 и по Резус — угроза для плода резко возрастёт. Однако на самом деле все наоборот. И число случаев, и интенсивность патологии при двойной несовместимости — по АВ0 и по Резус — резко снижаются [Доссе, 1959; Соловьева, 1964; Туманов, Томилин, 1969; Головачев, 1983]. Причина этому — «конкуренция антител». Эритроциты плода, попадая в организм матери, разрушаются под влиянием уже присутствующих в её крови АВ0-антител, не успевая вызвать иммунизацию к RH-антигену.
Поэтому в популяциях наибольший риск возникновения иммунного резус-конфликта, значимого с точки зрения здравоохранения, возникает при несовместимости матери и ребенка по RH, сопровождающейся совместимостью по АВ0. То есть при резус-отрицательности матери (RH) и резус-положительности (RH+) плода наибольшая угроза гемолитической болезни новорожденного возникает тогда, когда группы крови АВ0 одинаковы у матери и ребенка: например, А и А, В и В, 0 и 0. Такое сочетание групп крови АВ0 и Резус составляет, по разным оценкам, от 66 % [Соловьева, 1964] до 90 % [Michoud, 1961] всех случаев гемолитической болезни, вызванной резус-несовместимостью матери и плода.
Построив карту, отражающую вероятность того, что у резус-отрицательных матерей с группами крови А, В и 0, будут резус-положительные дети, обладающие группами крови АВ0, идентичными материнским, мы картографируем распространение основной группы генетически обусловленного риска возникновения резус-несовместимости матери и плода.
Мы не раз говорили, что карта является не только графическим, но и алгебраическим объектом, не только «картинкой», но и числовой матрицей, с которой можно производить любые необходимые преобразования. Мы постоянно пользуемся этим неоспоримым достоинством наших карт. Их «сглаживание», корреляция, расчёт главных компонент и генетических расстояний — все эти процедуры включают порой очень длинную цепь преобразований, которые мы совершаем с исходными картами. Покажем эту цепь на примере карты генетического риска: для создания единственной результирующей карты (рис. 5.2.23.) мы построили 115 промежуточных карт.
В табл. 5.2.6. указаны типы браков, в которых возможно появление детей, идентичных матери по группе крови А, В или 0, но с угрозой возникновения RH-конфликта. Чтобы получить карту генетического риска несовместимости матери и плода, были проведены следующие преобразования карт:
1. Получены карты распространения частот аллелей локусов АВ0 и RH (пять карт пяти аллелей);
2. Получены карты распространения генотипов родителей (17 карт, генотипы указаны в табл. 5.2.6.)
3. Перемножая карты родительских генотипов, получаем карты частот указанных типов браков. Сочетания генотипов с нулевой вероятностью возникновения резус-конфликта мы не рассматриваем и карты для них не строим. Для оставшихся 46 сочетаний родительских генотипов мы строим 46 промежуточных карт.
4. Умножив эти карты на вероятность, указанную в табл. 5.2.6., получаем вероятность возникновения RH — несовместимости в каждом из этих браков (ещё 46 карт).
5. Сложением этих карт получаем суммарную карту, которую умножаем на 1/3 (считается, что генетически эффективная часть популяции составляет около 1/3 от её численности).
6. Умножив результирующую карту на 100 000, получим карту генетического риска возникновения RH-конфликта матери и плода, выраженную в числе случаев на 100 000 населения.
Таблица 5.2.6.
Сочетание генотипов у родителей и вероятность появления у них детей с повышенным риском иммунного конфликта (резус-конфликт матери и ребенка при совпадении у них групп крови А, В и 0)
Полученная таким образом карта генетического риска резус-конфликта матери и плода при учете групп крови АВ0 и Резус дана на рис. 5.2.23. Карту для коренного населения всей Северной Евразии мы не приводим, так как в азиатской части частота RH*d близка к нулю и генетический риск минимален. Лишь некоторое его увеличение (около 500 случаев на 100 000) прогнозируется вдоль северной границы Казахстана и в среднеазиатских республиках. Однако в европейских районах с повышенной концентрацией гена RH*d величина генетического риска достигает весьма значимых величин (рис. 5.2.23.). В отдельных районах России, Белоруссии, Литвы и Грузии величина генетического риска резус-несовместимости матери и плода, угрожающей здоровью ребенка, составляет около 2000 случаев на 100 000 населения.
Однако все не так страшно. Обратим внимание, что мы говорим только о генетическом риске резус-конфликта. Дело в том, что генетический риск и риск развития гемолитической болезни новорожденного — это две разные вещи. Даже при наличии фактора несовместимости (генетический риск), гемолитическая болезнь возникает лишь у части детей из группы риска — примерно у 15 % (наш специальный расчёт по совокупности литературных источников). Будь доля больных детей постоянной во всех популяциях, география заболеваемости полностью повторяла бы географию генетического риска. Однако вариабельность этой доли велика. Поэтому география заболеваемости гемолитической болезнью новорожденных начинает зависеть не только от генетического риска, но и средовой компоненты — как внешней (демографической, экологической, социальной), так и внутренней (например, индивидуальный уровень гетерозиготности организма или даже резус-фактор бабушки новорожденного, повлиявший на иммунизацию матери в период её внутриутробного развития). Сопоставление географии наблюдаемой заболеваемости с географией генетического риска и географией гетерозиготности позволяет прогнозировать результативность профилактических мероприятий и соответственно их корректировать.
§ 4. Обзор «простых» карт
Подведем краткий итог рассмотрению географии отдельных классических маркёров в ареале русского народа.
Яркая закономерность выявляется геногеографической картой НР*1: чёткий тренд «юго-запад<=>северо-восток». Клинальная изменчивость с максимумом на юге q=0.51 и снижением частоты к северо-востоку q=0.17 нарушается зоной среднерусских значений на арктическом побережье (q=0.36). Это повышение частоты НР*1 в русских популяциях нельзя объяснить влиянием коренных народов Арктики — народы циркумполярной зоны характеризуются пониженными частотами НР*1. Можно выдвинуть гипотезу об отражении в генетическом ландшафте НР*1 этапа освоения северных окраин Руси новгородцами в XI–XIV веках.
Не менее чёткий тренд наблюдается и в географической изменчивости АВ0*А в русских популяциях: мы вновь видим падение частоты аллеля по направлению к северо-востоку. Несмотря на небольшой размах изменчивости АВ0*А, практически всё множество популяций соответствует картине плавного снижения частоты к востоку и северу, тем самым подтверждая объективность этой закономерности. При этом генетический ландшафт АВ0*А не только русского народа, но и генофонда Восточной Европы своеобразен и необъясним в терминах «переходной зоны» между Европой и Азией.
Генетический ландшафт русского генофонда по АВ0*0 демонстрирует тот же тренд, но является почти зеркальным отражением АВ0*А — с северо-востока на юг и юго-запад идет не увеличение, а падение частоты. И вновь, несмотря на небольшой размах изменчивости, почти все популяции следуют рельефу плавного снижения частоты с севера к юго-западу. Сравнение с окружающими народами не исключает, что повышение частоты АВ0*0 в северных русских популяциях связано с финно-угорским субстратом — теми племенами и народами, которые освоили эти территории задолго до славян. По данному гену реконструируемый генофонд этих популяций тяготеет больше к западным финноязычным народам, чем к восточным, приуральским. Однако в генетическом ландшафте АВ0*0 на Русском Севере проявляется не только дославянский субстрат, но и потоки славянской колонизации. «Прорыв» низких частот, который разделяет на две части Русский Север, может являться следом борьбы за северные территории Новгорода и низовских земель — ростово-суздальских, а затем московских. Возможно, именно их продвижение на север отражено на карте АВ0*0, сохранившей следы этих генных потоков.
По локусу MN различия между всеми популяциями Восточной Европы (GST=1.2) намного меньше селективно-нейтрального уровня (GST=2.6). При этом гетерогенность русского народа (GST=1.2) равна изменчивости всех народов Восточной Европы по MN, то есть охватывает изменчивость всего коренного населения региона. При полной «безликости» и одинаковости этнических частот MN*M по всей Европе, в пределах русского генофонда обнаруживается четкий тренд изменчивости. Рельеф задают полярно расположенные элементы — ядра максимумов на юго-востоке и западе ареала, область низких значений на Русском Севере. При почти полной аморфности основных территорий эти два полюса создают высокую корреляцию MN*M с широтой: r=0.44. Снижение частоты на Русском Севере, возможно, связано с влиянием дославянского населения, включённого в русский генофонд в процессе колонизации северных территорий.
Карта аллеля АСР1*А демонстрирует в «исконном» русском ареале чётко выраженный тренд: рост частоты аллеля АСР1*А (от 0.18 до 0.41) в направлении «северо-запад<=>юго-восток». Этот тренд нельзя объяснить ни панойкуменным возрастанием частоты аллеля в северных широтах, ни влиянием евразийских степей. Вместе с тем, для ближайших финно-угорских народов наблюдается нарастание частоты аллеля в том же направлении: с севера (и с запада) на юг. Это позволило выдвинуть гипотезу об отражении в «русском» тренде АСР1*А финно-угорского субстрата — дославянского населения Русской равнины.
Карта другого аллеля этого локуса — АСР1*С — при средней частоте аллеля в русском ареале q=0.03 выявляет общее снижение частоты к северу от Волго-Окского междуречья (до 1–2%) и повышение частоты АСР1*С в центральных, восточных и южных областях (до 7 %). Однако при столь низких частотах требуются много большие выборки и большее число изученных популяций. Это замечание относится и к карте низко полиморфного аллеля PGD*C (0.02<q<0.06, q=0.04), который к тому же, по-видимому, находится под давлением стабилизирующего отбора (GST=0.35, то есть в 4 раза ниже селективно-нейтрального уровня GST=1.36).
Для аллеля Р1*М2 характерна иная — не широтная, а долготная изменчивость, реже наблюдаемая в русском генофонде. На карте распространения аллеля Р1*М2 в «исконном» русском ареале видна хорошо выраженная клинальная изменчивость: падение частоты в направлении «запад<=>восток» от q=0.23 до q=0.04. Корреляция частоты Р1*М2 с долготой достигает значений r=0.9. Этот тренд совпадает с градиентом частот в Северной Евразии, где частота аллеля в целом убывает в направлении с запада на восток.
Карты других генетических систем не выявляют столь чётких трендов. Однако и для них можно выделить некоторые особенности. Так, для генетического ландшафта аллеля GC*2 структурообразующим элементом является «впадина» (перепад значений от 0.38 до 0.14), следующая вдоль сорокового меридиана (40°
в. д.). Для карты аллеля GC*1S характерна широтная изменчивость с повышением частоты аллеля от 0.48 на северо-западе и северо-востоке русского ареала до q=0.68 к югу от 55 параллели (55° с.ш.).
Своеобразен генетический ландшафт аллеля TF*C2. Для него характерны три широтных зоны: северная — повышенных частот (q=0.21), центральная — пониженных частот (q=0.06), южная — со среднерусскими частотами (q=0.15).
Карты всех аллелей локуса PGM1 являются мозаичными и не поддаются интерпретации, так что информативность локуса PGM1 для изучения русского генофонда невелика. При этом средний по локусу PGM1 уровень межпопуляционной изменчивости (GST=0.75) в два раза меньше селективно-нейтрального уровня (GST=1.36), что указывает на возможное действие стабилизирующего отбора. Лишь в генетическом рельефе аллеля PGM1*1- всё же можно предположить некоторую закономерность. В целом средние (q=0.10) и низкие частоты (q=0.00) PGM1*1- характерны для западных (новгородско-псковских) и волго-окских популяций. Высокие (q=0.18) частоты PGM1*1- наблюдаются к северу и востоку — в вологодских и костромской популяциях, вновь снижаясь на крайнем севере.
В генетическом рельефе ESD*1 мы снова видим чередование четырёх широтно расположенных волн (с колебанием частот от 0.79 до 0.94). При этом впадину низких значений на юго-востоке русского ареала нельзя объяснить влиянием соседних тюркоязычных народов, поскольку у них частота аллеля достаточно велика.
Карта аллеля GLO1*1 ещё своеобразнее: центральная зона занята высокими значениями частоты аллеля (q=0.48), а к северу и к югу частота аллеля снижается до минимальных значений (q=0.27). Причём такой ландшафт прямо противоположен ожидаемому из характеристик соседних народов.
ВЫВОДЫ
Из серии карт изменчивости отдельных генов в ареале русского генофонда удается сделать лишь два общих вывода.
Во-первых, карты классических генных маркёров являют довольно сложные ландшафты, среди которых можно всё же — с определённой степенью достоверности — выделить широтную изменчивость. Хотя при этом непрерывная клинальная изменчивость прослеживается на картах лишь нескольких аллелей — НР*1, АСР1*А, MN*M, АВ0*А, АВ0*0. Широтное направление в целом соответствует географии диалектов и определённым историческим этапам — колонизации северных окраин Руси, освоения степи и др.
Вторым, но более интересным результатом анализа отдельных генов является тот факт, что повышение или понижение частоты какого-либо аллеля на границах русского ареала в большинстве случаев нельзя объяснить обменом генами с соседними народами.
Например, частоты аллеля MN*M в русских популяциях, формирующие ядра высоких значений, нельзя однозначно вывести из частот в популяциях окружающих их народов. И снижение частоты АСР*А у русских Поволжья не объясняется смешением со степными народами, поскольку у последних частота этого аллеля повышена. Мы приводили и другие примеры. Это служит указанием на большую, чем можно было предположить, роль не смешений, а внутриэтнических процессов в формировании русского генофонда (возможно, основным фактором может быть дрейф генов в окраинных популяциях).
Картографирование частот аллелей позволило выявить клинальную изменчивость в русском генофонде для ряда аллелей. Однако для подавляющего большинства изученных генов клинальная изменчивость не обнаружена. В целом, мы видим ряд чрезвычайно разнообразных генетических ландшафтов — долготный тренд, «диагональная» изменчивость, широтно расположенные волны колебания частоты аллеля, «лоскутное одеяло». Какова роль того или иного ландшафта в русском генофонде, покажет дальнейший анализ обобщённых карт (главных компонент и генетических расстояний). Однако уже на этом этапе можно говорить о своеобразии русского генофонда, пространственную структуру которого нельзя понять лишь из знания генофонда окружающих его народов. Этот результат указывает на значительную гетерогенность и сложность формирования русского генофонда.
Мы рассмотрели русский генофонд на фоне не только его соседей, но и в «глобальном» масштабе — в пространстве Северной Евразии и Евразии в целом. При этом оказалось, что, переходя от глобального рассмотрения к регионам (вложенным «матрёшкам»), мы можем обнаруживать исчезновение глобальных закономерностей. Именно это мы и обнаруживаем в генетическом ландшафте АВ0*В и RH*d. На евразийских картах RH*d и АВ0*В генофонд Восточной Европы играл роль переходной зоны и обнаруживал чёткий тренд «запад-восток». Однако перейдя с глобального (Евразия) на этнический уровень (русский ареал), мы не находим в русском генофонде такого тренда: и по RH*d, и по АВ0*В корреляции с долготой нет! На карте русского народа мы не видим даже намёка на общий трансевразийский тренд «запад-восток»! Более того, мы не видим вообще никаких чётких закономерностей. Карты подобны «лоскутному одеялу», где области высоких значений мирно соседствуют с областями низких значений. Как мы говорили, чёткая закономерность на глобальном уровне не «обязывает» этносы к её «исполнению». В ладу с собственной историей этнический генофонд может её «отменять» или преобразовывать в свою собственную версию этнического ландшафта.
Итак, реальность опровергает простую схему, предполагающую, что континентальный тренд выложен, как из «кирпичиков», из этнических трендов, и каждый из этносов отражает ту часть всеобщего тренда, которая ему положена в соответствии с размером и местом его ареала. С изменением масштаба исследования, при последовательном переходе к более частным регионам и далее к этносам континентальный тренд может быть многократно перекрыт более частными событиями истории этих генофондов.
Эти примеры демонстрируют важный методический принцип. Основные — глобальные — тренды формируются под действием факторов истории и природы в течение длительного времени, и для их выявления необходим соответствующий пространственно-временной масштаб. Соответствие масштаба времени действия эволюционного фактора масштабам генофонда и его географического ареала — важнейший принцип в изучении закономерностей формирования генофондов [Рычков, 1973, 1984; Рычков, Ящук (Балановская), 1980, 1983].
5.3. АРХИТЕКТОНИКА РУССКОГО ГЕНОФОНДА
§ 1. Велики ли генетические различия между популяциями? Что такое гетерогенность? — Гетерогенность русского народа — Гетерогенность 63 народов Евразии — Гетерогенность «типичного этноса» региона — Гетерогенность русского народа выше «типичного этноса» в Западной и в Восточной Европе, на Кавказе и на Урале — Фактор русского ареала
§ 2. Главные сценарии генофонда: Метод главных компонент — Ведущий сценарий широтной изменчивости — Второстепенный долготный сценарий — Сходство с антропологией — Неожиданность широтной картины и своеобразие русского генофонда
Сорок четыре генетических маркёра, наиболее подробно изученные в русском населении, обнаружили самые разные генетические ландшафты и направления изменчивости. Мы описали (раздел 5.2.) их полиморфизм, их пространственную изменчивость и разнообразие. Однако закономерности, общие для большинства генов, выявить не удалось. Они лишь неявно просвечивают сквозь плотную вуаль своеобразия отдельных генов. Это означает, что само строение, сам «каркас» генофонда остались почти столь же неведомыми, как и до анализа отдельных генов. Общая структура генофонда — его архитектоника — настоятельно требует проведения специального анализа. Очевидно, что для выявления «общей модели» генофонда надо тем или иным образом обобщить информацию по всем классическим маркёрам.
Один из вариантов такого обобщения — статистический анализ межпопуляционной изменчивости (GST) — мы опишем в § 1. Он позволяет измерить гетерогенность русского генофонда, а затем сравнить её с ближними и дальними соседями по Евразии. Этот вид анализа — GST или FST-статистики — был наиболее разработанным и самым популярным в популяционной генетике человека. Однако, выявляя уровень изменчивости, этот метод не может описать, как эта изменчивость реализуется в ареале генофонда. Чтобы осуществить это, геногеография обычные многомерные методы биометрии переводит на язык карт. Преобразуясь в синтетические карты главных компонент и генетических расстояний, они сообщают, каковы обобщённые параметры генофонда в каждой точке карты. География обобщённых черт русского генофонда рассмотрена в § 2.
§ 1. Велики ли генетические различия между популяциями?
ГЕТЕРОГЕННОСТЬ
Насколько велика генетическая изменчивость русского народа? Насколько генетически различаются его популяции между собой? Ответ на этот вопрос можно получить, лишь сравнив размах генетических различий между русскими популяциями и размах генетических различий между популяциями у других народов Евразии. Эту характеристику для краткости мы назовём «гетерогенностью» этнического генофонда. Чтобы её определить, мы для каждого народа рассчитаем, насколько разные популяции этого народа генетически отличаются друг от друга. И выразим эти различия числом — показателем гетерогенности этноса. А затем, имея такие оценки, мы можем сравнить народы по показателям их гетерогенности. У «монолитных» этносов, где все популяции генетически схожи, как близнецы, гетерогенность будет близка к нулю. У генетически подразделённых народов, где одни популяции совсем непохожи на другие, гетерогенность будет велика.
Популяционная генетика позволяет дать численную оценку гетерогенности с помощью GST- Напомним, что GST≈FST. Этот важнейший показатель (подробно описанный в Приложении), эквивалентен средним генетическим расстояниям между двумя случайно выбранными популяциями. Чем больше GST, тем больше гетерогенность, тем больше генетически различны, тем дальше генетически удалены друг от друга популяции одного и того же народа. Напомним (см. Приложение, раздел 2.), что из-за действия отбора показатели GST могут оказаться очень разными. Эти эффекты мы уже видели в разделе 5.2., рассматривая изменчивость русского народа по разным маркёрам. Но для случайной выборки генов среднее значение GST аннулирует эффекты отбора и близко к селективно-нейтральной изменчивости. Иными словами, такое значение GST позволяет оценить истинные генетические различия между популяциями.
ГЕТЕРОГЕННОСТЬ РУССКОГО НАРОДА
Мы оценили гетерогенность русских популяций по всем сорока четырем классическим маркёрам, включенным в анализ (и перечисленным в табл. 5.2.1).
Гетерогенность русского народа оказалась равной[38] GST=2.00.
Но много это или мало? Чтобы ответить на этот вопрос, надо оценить масштаб изменчивости. Для этого рассмотрим показатели гетерогенности (GST) ряда народов Евразии (табл. 5.3.1), в разное время рассчитанные нами.
ГЕТЕРОГЕННОСТЬ 63 НАРОДОВ ЕВРАЗИИ
Мы видим (табл. 5.3.1), что в сравнении с другими народами Евразии межпопуляционные различия между русскими популяциями можно оценить как умеренные.
Таблица 5.3.1.
Генетическая гетерогенность русского народа и гетерогенность других народов Евразии (генетические различия популяций в пределах этноса)
Есть народы — и их большинство! — гетерогенность которых намного меньше, чем для русских популяций. Но есть и народы (тофалары, эвенки, нанайцы, коряки, нивхи), которые в три раза более гетерогенны, чем русский народ. Становится ясно, что простой перебор разных народов не очень информативен — народы могут попасться разные. Для корректного ответа нам надо классифицировать их, например, разнести по историкогеографическим регионам.
ОДИНАКОВА ЛИ ГЕТЕРОГЕННОСТЬ НАРОДОВ В РАЗНЫХ РЕГИОНАХ ЕВРАЗИИ?
Приглядимся внимательнее к этносам, приведенным в таблице 5.3.1. Даже в этих данных проглядывает закономерность — на западе Евразии гетерогенность народов меньше, чем у коренных народов востока Евразийского континента.
Конечно, колебания гетерогенности в пределах каждого историко-географического региона велики. Обратим внимание (табл. 5.3.1.) и на то, что разные народы изучены совершенно по разному числу классических маркёров: словенцы и чехи по 3 локусам, а адыги, осетины и черкесы — по 18 локусам; чехи по 7 аллелям, а русские — по 44 аллелям. Более того, даже когда народы сходны по числу изученных маркёров, сам перечень этих маркёров обычно различается. Но только анализ по большому числу генетических маркёров (как подробно обсуждается в Приложении) даёт устойчивую величину гетерогенности. Если набор маркёров мал и неслучаен, то величина GST зависит от того, оказалось ли у нас при расчёте GST больше генов, подверженных дифференцирующему отбору (то есть генов с завышенными оценками GST) или же генов, подверженных стабилизирующему отбору (то есть генов с заниженными оценками GST). Поэтому при небольших и неслучайных наборах генов действие отбора может либо завышать, либо занижать оценки гетерогенности этноса. Чтобы избежать этого, лучше всего оценить GST по большому и идентичному набору генов во всех регионах.
Тогда попробуем поставить вопрос корректней. Различаются ли по гетерогенности «средние», «типичные» народы Западной Европы, Восточной Европы, Кавказа, Урала, Сибири? Ответив на этот вопрос, можно будет и сказать, насколько велика гетерогенность русского народа в сравнении с другими народами Евразии. В таблице 5.3.2. для полной сопоставимости результатов мы рассчитали все показатели GST для регионов Северной Евразии по одному и тому же набору генных маркёров — по 39 аллелям 18 локусов.
ЧТО ТАКОЕ ГЕТЕРОГЕННОСТЬ «СРЕДНЕГО» НАРОДА В РЕГИОНЕ?
В этой таблице приведена гетерогенность GST уже не конкретных народов, а как бы «среднего» или «типичного» народа для того или иного региона. Это все тот же показатель гетерогенности GST, показывающий насколько популяции одного народа различаются друг от друга. Только после расчёта для каждого из народов, показатели гетерогенности GST всех народов в регионе усреднены. Таким образом, мы выявляем «средний» для этого региона уровень гетерогенности этноса, то есть типичную гетерогенность для народов данного региона. Можно взглянуть и иначе: мы определяем гетерогенность «среднего», или «типичного», народа каждого региона Северной Евразии — Восточной Европы, Кавказа, Урала, Средней Азии, Сибири. А также и для «Западной» Европы, которую лучше бы назвать «не-Восточной». Она включила в себя все европейские народы за пределами бывшего СССР, то есть все народы, кроме тех, что вошли в Европу Восточную.
СРАВНЕНИЕ ГЕТЕРОГЕННОСТИ «СРЕДНИХ» НАРОДОВ В РАЗНЫХ РЕГИОНАХ.
Сравнивая эти оценки (табл. 5.3.2., рис. 5.3.1.), мы видим, что все шесть регионов занимают три ступени по величине средней гетерогенности их народов. На нижней ступеньке расположились Западная Европа и Кавказ: «средний» народ Кавказа (GST=0.8) близок по невысокому уровню гетерогенности к «типичному» народу Западной Европы (GST=0.7).
Рис. 5.3.1. Гетерогенность русского народа в сравнении с «типичной» гетерогенностью народов разных регионов Евразии
На следующей ступени расположились Восточная Европа, Урал, Средняя Азия. Они делят между собой второе место: по гетерогенности «средние» народы этих трёх регионов близки друг к другу: 1.2<GST<1.4. Эта величина в полтора-два раза выше, чем для народов Кавказа или Западной Европы. Но, конечно же, поражает воображение разнообразие «типичного» коренного народа Сибири, бесспорно занявшего первое место по гетерогенности! Популяции «типичного» народа Сибири (GST=3.9) в три раза генетически разнообразнее, чем популяции «типичного» народа Восточной Европы, Средней Азии, Урала. И в пять раз разнообразнее, чем популяции «типичного» народа Западной Европы и Кавказа (табл. 5.3.2., рис. 5.3.1).
Таблица 5.3.2.
Генетическая гетерогенность «среднего» («типичного») народа в разных регионах Евразии
РУССКИЙ ГЕНОФОНД НА ФОНЕ СОСЕДЕЙ
Теперь мы знаем, насколько отличаются по своей внутренней подразделенности — гетерогенности — генофонды народов в разных регионах Евразии (рис. 5.3.1).
Большинство народов Западной Европы характеризуются существенно меньшей гетерогенностью, чем русский народ: GST для «типичного» народа Западной Европы GST=0.7) в три раза меньше, чем для русского народа (GST=2.0)! Это означает, что популяции в пределах «среднего» западноевропейского народа намного больше похожи друг на друга, чем схожи между собой русские популяции. То есть, в европейском масштабе гетерогенность русского народа чрезвычайно велика, а большинство народов Западной Европы в сравнении с русскими генетически «монолитны».
Сравнивая русские популяции с гетерогенностью «типичных» народов на юге и на востоке от русского ареала, мы вновь видим «нестандартность» русского генофонда. Он намного гетерогенней (GST=2.0), чем народы Кавказа (где GST=0.8). И превосходит даже гетерогенность «типичного» народа Урала (GST=1.4). Это неожиданно.
Ведь Уральский регион включает в себя популяции не только Приуралья, но и южного, и северного Урала, и Зауралья — в него вошли и башкиры, и тундровые ненцы, и даже ханты и манси Западной Сибири. То есть Уральский регион постепенно перетекает в Сибирь — и естественно было ожидать большей гетерогенности уральских народов, их приближения к гетерогенности сибирских этносов (в Сибири GST=3.9).
И, тем не менее, гетерогенность русского народа оказалась выше гетерогенности генетически «среднего» народа Уральского региона. Поэтому уже не является неожиданностью, что русские популяции (GST=2.0) отличаются друг от друга больше, чем в среднем восточноевропейские народы (GST=1.2). А ведь при расчёте этого показателя участвовали и данные по русскому народу, повышая эту оценку. Так что можно считать установленным более высокую гетерогенность русского народа (GST=2.0) по сравнению с соседями со всех сторон: на западе (GST=0.7), на юге (GST=0.8), на востоке (GST=1.4) и в ближайшем окружении на Восточно-Европейской равнине (GST=1.2).
Анализируемая изменчивость русского народа ограничена нами границами «исконного», исторического ареала. Но и в таких скромных рамках русский ареал, несомненно, велик. Большому ареалу — большая изменчивость. Хотя в ареале русского народа нет особых географических преград для распространения генов, но само географическое расстояние уже служит фактором изоляции, создавая генетические отличия популяций друг от друга. Бесспорно, этот фактор целиком подчинен брачным традициям — лишь они судят, велико ли или мало расстояние для поиска брачного партнера. Какое расстояние считать настолько большим, что не стоит искать невесту за его пределами? Каждый народ «структурирует» географическое пространство в лад традициям заключения браков, устоявшимся веками. Но как раз для русского народа был несвойственен большой радиус брачных связей: по поговорке «хоть за курицу, да на соседнюю улицу». Поэтому в столь большом ареале естественно ожидать и большие различия между русскими популяциями, что мы и обнаружили по данным генетики.
Однако этнография не выделяет в русском народе чётко фиксируемых подразделений. И антропологи, прежде всего, указывают на антропологическое единство русского народа, несмотря на его большой ареал [Происхождение…, 1965; Алексеева, 1998, 2002].
Поэтому, установив наличие высокой генетической гетерогенности русского народа, важно выяснить — есть ли пространственные закономерности в изменчивости русских популяций и чем они определяются: влиянием иных народов или собственной историей русского народа? Этим вопросам мы уделили внимание при описании карт отдельных генов (раздел 5.2) и рассмотрим теперь на примере обобщённых карт в следующем § 2.
§ 2. «Главные сценарии» генофонда
Поиск наиболее общих и устойчивых закономерностей в строении русского генофонда пронизывает всю книгу. Он предпринят в каждой главе второй части книги — и проведён в каждой главе по своей системе признаков — антропологии (соматологии и дерматоглифики), классических маркёров, ДНК маркёров, фамилий. Следующая, третья часть будет целиком посвящена взгляду на архитектонику русского генофонда «извне» — в европейском и евразийском масштабах. Во многих разделах книги дается сравнительное рассмотрение полученных обобщённых характеристик генофонда. Карты генетических расстояний от русского народа до всех популяций Восточной Европы рассматриваются в 8 главе (раздел 8.3). Поэтому здесь мы ограничимся описанием синтетических карт главных компонент, полученных по классическим генетическим маркёрам.
КАРТЫ ГЛАВНЫХ КОМПОНЕНТ.
Синтетические карты главных компонент изменчивости русского генофонда построены на основании 35 карт аллелей 13 локу-сов, достаточно полно и равномерно изученных в русском ареале (АВ0, АСР, ESD, GC, GLO, HP, MN, PGD, PGM, PI, PTC, TF, RH) Число степеней свободы этого набора маркёров d.f.=22.
В таблице 5.3.3. приведены коэффициенты корреляции «простых» карт с главными компонентами — первой, второй и третьей. Таблица показывает, какие из аллелей внесли основной вклад в формирование той или иной главной компоненты. Для удобства чтения приведены только те аллели, которые вносят основной вклад в формирование данной компоненты (их связь с главной компонентой выше r=0.4), и расположены они по степени интенсивности их связи с компонентой. Мы видим, что наибольший вклад в формирование карты первой главной компоненты внесли аллели TF*C1, PGM1*2-, АСР1*С, 6PGD, АВ0*А. Наибольший вклад в формирование карты второй главной компоненты внесли аллели P1*M1, RH*d, P1*M2, GC*1S, Р1*МЗ. Наибольший вклад в формирование карты третьей главной компоненты внесли аллели TF*dCHI, PGM 1*1+, PGM 1*2+, ESD, HP.
Таблица 5.3.3.
Классические маркёры, корреляция которых с картами 1, 2 или 3 главных компонент превышает 0.4 (г>0.4)
Первая главная компонента описывает 22 % общей изменчивости классических маркёров, вторая — 15 %, третья — 14 %. Таким образом, первые три главных компоненты описывают половину всей общей изменчивости всех 35 исходных признаков классических маркёров. Первые пять главных компонент отражают уже две трети (67 %) общей дисперсии (четвёртая компонента — 10 %, пятая — 7 %). Первые десять главных компонент отражают 90 % общей дисперсии. Первые пятнадцать главных компонент описывают уже практически всю общую дисперсию — 98 %. Столь резкий перепад между вкладами первых компонент и отражение ими основной дисперсии всех изученных признаков указывает на высокую эффективность метода главных компонент при изучении карт классических маркёров.
При анализе антропологических данных на долю первой компоненты нередко приходится до 60 % и более общей дисперсии, что определяется высокой корреляцией между самими признаками [Дерябин, 2001]. Но при анализе большой совокупности нескорре-лированных генетических маркёров 20 % изменчивости, падающей на первую компоненту, является достаточно высоким показателем, указывающим на информативность применения компонентного анализа [Cavalli-Sforza et al., 1994]. Дело в том, что большинство антропологических признаков связаны между собой внутригрупповой корреляцией (понятно — большой рост и длинные ноги). Для классических маркёров (несцепленных локусов) подобные связи не существуют. Надо только отличать внутригруппповые корреляции от межгрупповых. Примером межгрупповой корреляции может быть связь между курчавыми волосами и темной кожей: единственное, что связывает эти признаки — это то, что они оба они встречаются в популяциях негроидов. Межгрупповые корреляции создаются не физиологией, не анатомией, а историей или экологией, и поэтому могут быть выявлены между любыми признаками, связанными исторической судьбой.
Малость ареала, в котором изображены главные компоненты (рис. 5.3.2–5.3.3) — особенно после анализа генетического ландшафта АВ0 и Резус — вызывает изумление и недоумение. Куда девались популяции, которые мы видели на больших пространствах карт хорошо изученных генов? Отчего так сократился ареал при переходе к обобщенным картам? Напомним, что исходные варианты карты — до оценки надёжности прогноза — были построены для каждого аллеля на просторах всей территории, видимой на карте. Поэтому мы могли создать и синтетические карты в том же обширном ареале, который мы видели на картах АВ0, RH или HP.
Однако если эти три локуса изучены в среднем по 120 русским популяциям, то остальные локусы — в среднем лишь по 21 популяции, и ареал, по которому они разбросаны, намного уже. Если бы мы включили в анализ главных компонент всю территорию, мы бы опирались на ненадежный картографический прогноз, а это опасно. Поэтому при добавлении каждого нового гена «средняя» карта надёжности, как шагреневая кожа, сокращалась в размере, пока не приобрела тот небольшой ареал, который мы видим на рис. 5.3.2–5.3.3. Этот ареал мал, зато надёжен.
ПЕРВЫЙ СЦЕНАРИЙ.
Классические маркёры (рис. 5.3.2.)
Рис. 5.3.2. Карта первой главной компоненты изменчивости русского генофонда по классическим маркерам.
Самый главный сценарий изменчивости русских популяций представлен картой первой главной компоненты. Он отражает изменчивость наибольшего числа карт отдельных маркёров (22 % общей дисперсии) и потому является главным сценарием русского генофонда. В отличие от сложного рельефа карт отдельных маркёров, мы видим простую и четкую закономерность: значения постепенно изменяются от северных к южным русским популяциям. Таким образом, для русского генофонда оказывается характерна в первую очередь широтная изменчивость по оси «юг-север».
Напомним, что ось «юг-север» указывает только на ось и ничего не говорит о направлении изменчивости: с тем же правом мы можем дать этой оси имя «север-юг». Это связано с тем, что главные компоненты — это новые синтетические признаки, и меняются они от «минус бесконечности» до «плюс бесконечности», а их средняя равна нулю. К тому же ещё и каждый из этих «полюсов бесконечности» с равным правом может быть обозначен как «плюс» или «минус». Поэтому понятие минимальных или максимальных значений для главных компонент является чистой условностью. Сами главные компоненты ничего не могут сказать и о направлении миграций — для этого надо привлекать данные других наук, а также смотреть, с какими признаками каждая из главных компонент более всего связана (см. табл. 5.3.3. и табл. 5.3.4.).
Этим то главные компоненты и хороши: они выделяют элементы структуры генофонда и его каркас в чистом виде. Они позволяют провести 7 районирование генофонда — а это главная задача всех наук, так или иначе связанных с географией. «Окружающая среда представляется географу не складом случайных вещей, а в виде сот, состоящих из ячеек — районов. Районирование играет в географии такую же роль, как классификация в биологической систематике. Районированием фиксируются различия от места к месту, формируется каталог «всего сущего на Земле» [Родоман, 1990, с. 41].
Среди второстепенных элементов отметим, что «северный полюс» компоненты б «находится не на самом севере ареала. Еще севернее за ним намечается иной элемент ландшафта с более высокими значениями компоненты. Напомним, такое же явление мы видели на антропологических картах — и соматологии, и дерматоглифики (раздел 4.4). Другим любопытным элементом ландшафта, также отчетливо проявившимся и на карте соматологии, является «коридор» среднерусских значений, опускающийся вдоль западной границы России (рис. 5.3.2).
Наибольшие отличия по оси «юг-север» находят прямые аналогии в диалектологическом членении русского языка на северное, южное наречия и переходные среднерусские говоры. Вместе с тем, история формирования как генофонда, так и государственно-сти на своих важнейших этапах проходила по иной, ортогональной оси «запад-восток». Примерами взаимодействия по оси «запад-восток» могут служить как расселение славянских племён и позднее русских, сопровождавшееся ассимиляцией финно-угорского населения, так и (в определенной степени) татаро-монгольское иго и длительное взаимодействие русских княжеств и татарских ханств, сопровождавшееся вынужденными миграциями населения. Напомним, что различия между западными и восточными популяциями были обнаружены и при первом же геногеографическом анализе антропологических данных (см. разделы 2.3., 4.4): инструментарий многомерных расстояний выделил три зоны: западную («славянскую»), восточную («субстратную»)и промежуточную между ними («рифтовую»).
Поэтому нельзя считать широтную изменчивость однозначно и естественно вытекающей из истории русского народа. Скорее широтную изменчивость можно рассматривать как фактическую выявленную структуру генофонда, в объяснении происхождения и времени формирования которой остается полагаться на авторитет будущих комплексных исследований.
ВТОРОЙ СЦЕНАРИЙ.
Классические маркёры (рис. 5.3.3. )
Второй сценарий изменчивости русского генофонда по классическим маркёрам представлен картой второй главной компоненты. Она описывает меньшую долю общей изменчивости отдельных генов (15 % общей дисперсии) и потому служит воплощением второго по значимости сценария в истории формирования русского генофонда. Основным элементом его является экстремум с минимальными значениями — он занимает центральную часть «исконного» русского ареала и простирается от Волго-Окского междуречья на юге до Онежского озера на севере. Еще севернее — в бассейне Онеги и Северной Двины намечается район с повышением генетического рельефа.
Рис. 5.3.3. Карта второй главной компоненты изменчивости русского генофонда по классическим маркерам.
Но главная зона высоких значений расположена на западе ареала. Она слагается из двух локальных ядер. Одно из них лежит между Ладожским и Чудским озерами. Другое рас- 60° полагается в Брянских и Смоленских землях.
Но в целом коридор экстремумов тянется по западным окраинам ареала, напоминая о пути из варяг в греки.
Такой же западный экстремум мы видели на карте второй компоненты по данным антропологии (раздел 4.4). Но там он был более мощным, являлся основным структурообразующим элементом и формировал долготный каркас всего ландшафта. Корреля- 0 ция с аналогичной картой по дерматоглифике снижена 50 из-за шероховатостей её ландшафта (раздел 4.4). Но в целом второй сценарий кожных узоров выявляет те же структурообразующие элементы: минимум в центральной части ареала, резкое повышение рельефа на самом севере (в устье Онеги), и западные ядра повышенных значений.
ТРЕТИЙ СЦЕНАРИЙ.
Классические маркёры.
Третий сценарий изменчивости русского генофонда 40° по классическим маркёрам представлен картой третьей главной компоненты. Его значимость примерно такая же (14 % общей дисперсии), что и второй компоненты.
Этот третий сценарий сформирован хребтом высоких значений, протянувшимся долготно с севера на юг и занимающим всю восточную часть ареала и часть центральных областей. Он включает ростово-суздальские земли и тянется на север в бассейн Онеги и Северной Двины. В зоне противоположных — низких значений — оказываются земли московские, тверские, новгородские, псковские.
ОБЩИЕ ЧЕРТЫ ДВУХ ПОРТРЕТОВ: ГЕНОФОНД И ФЕНОФОНД
Сравним главные сценарии генофонда и фенофонда. Генофонд представлен обобщёнными картами классических генных маркёров. Фенофонд — обобщенными картами антропологических признаков, полученными в предыдущей главе (раздел 4.4.). Использование геногеографической технологии даёт уникальную возможность — измерить сходство портретов.
КОРРЕЛЯЦИИ. Коэффициенты корреляции между картами главных компонент всех систем признаков — классических генных маркёров, соматологии и дерматоглифики, фамилий, ДНК маркёров — приведены и анализируются в заключительной 10 главе (табл. 10.1.1). Фрагмент этой таблицы, касающийся только классических маркёров, приведён в таблице 5.3.4. При их интерпретации стоит помнить отличие корреляций между картами от «обычных» корреляций. При «обычном» расчёте по табличным данным географическое пространство остается за скобками. Если в таблице указаны «русские Архангельской области», то они могли быть изучены по генетическим маркёрам где-нибудь на востоке около коми Приуралья, а по дерматоглифике — на западе вблизи Карелии. И, несмотря на такую полярность географического положения, в таблице при расчёте корреляций они принимались за одну точку.
При построении карты географическое положение популяции становится решающим. И если две «родственные» популяции изучены по разным признакам в разных точках ареала (а это сплошь и рядом!), то одни и те же элементы ландшафта будут смещены соответственно на запад или на восток. При этом общий образ карты (общий паттерн, общая модель) будут похожи — не так важно небольшое смещение в пространстве одних и тех же элементов! А вот коэффициенты корреляции при этом могут резко упасть и даже приобрести для этой части ареала противоположный знак — ведь корреляция рассчитывается не для «русских Архангельской области», а для каждого узла густой сетки карты. Поэтому коэффициенты корреляции надо использовать, не абсолютизируя их конкретных значений: они служат подсобным средством, а основным — сравнение самих карт, их образов и ландшафтов. Образ, возникающий при внимательном рассмотрении карты, зачастую глубже и правдивее любых её количественных характеристик. «Но карта тем и своеобразна, тем и хороша, что она субъективна в той мере, в какой субъективна даже строго научная работа; она изображает действительность, очеловеченную интуицией, дискретизованную интеллектом. Географическая карта — это вербализованное изображение» [Родоман, 1990, с. 44]. Поэтому, хотя мы многие годы упорно разрабатываем технологии количественного анализа и сравнения карт, мы призываем читателя всё же почаще смотреть на сами карты, а не только на их численные суррогаты.
Мы видим, что карта первой главной компоненты изменчивости классических маркёров 1РСс обнаруживает необычайно высокое сходство с главными сценариями антропологии (r=0.85) и ДНК маркёров (r=0.71). Огромное сходство трёх типов карт — антропологии, классических и ДНК маркёров трудно было ожидать: ведь все они строились по разным изученным популяциям.
Более того, они отражают как бы три этапа в изучении русского генофонда — от определения расовых признаков антропологии через анализ классических маркёров до технологий молекулярной генетики. И то, что на всех трёх этапах изучения русского генофонда мы обнаруживаем одну и ту же его архитектонику, одну и ту же «общую модель» генофонда, один и тот же его план и каркас — это убеждает нас, что мы действительно выявили основные и реальные черты строения русского генофонда. Тем более, что связь первого сценария классических маркёров и ещё двух столь отличных типов признаков — дерматоглифики и фамилий — тоже велика: она превышает r=0.4 (табл. 5.3.4).
Таблица 5.3.4.
Коэффициенты корреляции между главными компонентами изменчивости классических генетических маркёров исоматологии, дерматоглифики, фамилий и ДНК маркёров
Показательно, что и карта второй главной компоненты классических маркёров (2РСс) также коррелирует со всеми вторыми сценариями всех изученных типов маркёров. Конечно, коэффициенты связи намного ниже — они колеблются в пределах 0.2<r<0.4. Если средняя связь между классическими и всеми другими типами признаков для первых сценариев составила r=0.60, то для вторых сценариев она в два раза меньше: r=0.33. Но важно, что связь между всеми вторыми сценариями стабильна, она обнаруживаются с каждым из типов признаков — с соматологией, с дерматоглификой, с фамилиями и с ДНК маркёрами. Среди связей других компонент разных признаков мы видим (табл. 5.3.4.) ещё четыре коэффициента, достигающие значений г≈0.4.
В целом, общая картина связи между тремя главными сценариями пяти типов признаков убедительно свидетельствует, что мы на верном пути: можно быть уверенными, что дальнейшее развитие популяционных исследований русского генофонда прояснит многие детали, которые пока видны, как в тумане: однако основные вехи мы, бесспорно, уже обнаружили.
ШИРОТНАЯ ИЗМЕНЧИВОСТЬ ЛАНДШАФТОВ. Выявление именно широтной изменчивости в русском генофонде тем удивительнее, что ожидать можно было лишь противоположного — долготного — хода изолиний. Для Восточной Европы показана долготная изменчивость (глава 8). Русский народ занимает основную территорию Восточной Европы и сложился на основе многих восточноевропейских племён. Поэтому именно долготная изменчивость и должна была бы проявиться, если русский генофонд действительно складывался, как и Русское государство, «прираста-нием», механическим включением в себя всё новых и новых групп населения, входивших во всё более расширяющиеся границы Русского государства. Соответственно то, что обобщающие карты генофонда и фенофонда выявляют совершенно иную, чем для Восточной Европы, «собственно русскую» широтную изменчивость, указывает на принципиальный факт своеобразия русского генофонда. Это явление сквозило в многообразии географии отдельных генов (раздел 5.2.) — как часто в их описании нам приходилось констатировать, что невозможно объяснить их изменчивость, опираясь на генофонды окружающих народов! Это своеобразие состоит в том, что основное направление изменчивости русского генофонда не сводимо к исходной изменчивости тех племён и народов, во взаимодействии с которыми он формировался. По-видимому, широтная изменчивость возникла или же усилилась в ходе собственной истории русского генофонда.
ДОЛГОТНАЯ ИЗМЕНЧИВОСТЬ ЛАНДШАФТОВ. На картах второго и третьего по значимости сценариев изменчивости русского генофонда мы видели соответственно «западный» и «восточный» хребты, тянущиеся долготно с юга на север. Это значит, долготная изменчивость просто отошла на задний план, уступив приоритет широтной изменчивости, но оставаясь весомым фактором изменчивости русского генетического ландшафта. Это наблюдение вновь подтверждается со стороны антропологии — коэффициентами корреляции между вторыми (долготными) компонентами соматологии, дерматоглифики и генетики.
Общность показаний трёх «заслушанных» свидетелей (соматологии, дерматоглифики, классических маркёров) говорит, что мы уже имеем общий очерк архитектоники русского генофонда. Ограничимся пока таким кратким описанием — в последующих двух главах будут рассмотрены портреты генофонда, данные ещё двумя независимыми свидетелями: ДНК маркёрами (глава 6) и русскими фамилиями (глава 7). Перейдем к ним и сравним показания не трёх, а пяти свидетелей. Это поможет нам повысить достоверность наших знаний о русском генофонде.
Глава 6. ДНК МАРКЕРЫ
ДОСТОИНСТВА… УСЛОВНЫЕ
Не за поколения, а прямо на глазах исследователей меняется инструментарий изучения генофонда: уже сейчас генетическая изменчивость популяций анализируется главным образом на уровне полиморфизма ДНК. И для подрастающего поколения генетиков анализ классических маркёров отходит в область прошлого, а антропологическое изучение — в область преданий.
Однако, цель этой книги — дать возможность каждому самому увидеть, потрогать руками и убедиться, что все эти признаки — и столь ощутимые признаки антропологии, и гены-«невидимки», и фамилии — стоят в одном строю при изучении генофонда. Поэтому и ДНК маркёры мы используем в качестве ещё одной системы с теми же правами, что и все остальные системы признаков.
Конечно, самые популярные ДНК маркёры — митохондриальная ДНК и Y хромосома — очень своеобразные системы. У них отсутствует рекомбинация, и потому они позволяют проводить целый ряд видов анализа, недоступных для всех остальных маркёров. Например, определять время мутаций, и благодаря этому датировать миграции, выявлять множество вариантов со своими чётко очерченными географическими ареалами. Тем не менее, здесь мы используем и эти маркёры «в общем строю» с другими признаками, стараясь каждой системе задавать одни и те же вопросы. Иначе как сопоставить ответы? Поэтому в данной книге особые возможности нерекомбинирующих маркёров задействованы лишь отчасти, а основной акцент сделан на сопоставимости всех типов признаков.
С точки зрения методики — генотипирование ДНК маркёров проще, в большей степени унифицировано, легче поддаётся автоматизации. К тому же образцы ДНК легче хранить, чем образцы крови, по которым изучаются классические маркёры.
С точки зрения методологии — на уровне ДНК можно изучить полиморфизм разных «разделов» генома, тогда так классические маркёры отражают полиморфизм лишь структурных генов, подверженных прямому действию отбора.
С точки зрения геногеографии, однако, ДНК маркёры выглядят пока не столь блестяще. Из данных о ДНК полиморфизме сейчас можно извлечь меньше информации о русском генофонде, чем из классических генетических маркёров и антропологических признаков. И единственная причина в том, что объём данных, накопленный за годы изучения ДНК полиморфизма, существенно меньше массива данных по классическим маркёрам, формировавшегося десятилетиями. При изучении общих свойств генофонда оказывается не так важно, будем ли мы пользоваться аутосомными ДНК маркёрами или же классическими маркёрами — различия между ними невелики. В главе 8 приведены примеры удивительного сходства результатов, полученных по ДНК и по классическим маркёрам; и такое совпадение результатов является не исключением, а правилом (см. Приложение, а также [Рычков, Балановская, 1990; Chikhi etal., 1998а, b, 2002]).
Конечно, привлекательная черта ДНК маркёров — множество их типов: это и митохондриальная ДНК, и гаплогруппы Y хромосомы, микро- и минисателлитные маркёры, диаллельный полиморфизм и многие другие, перечисленные в главе 1. Перспектива сравнения разных типов ДНК полиморфизма выглядит заманчивой и при этом вполне реальной. Прогресс технологий анализа ДНК позволяет уже в ближайшие годы изучить многие популяции по тысячам ДНК маркёров.
Но и тогда будет небесполезно использовать накопленные данные по классическим маркёрам — случилось так, что у совокупности «классических» данных есть важное преимущество перед ДНК маркёрами. Изучение ДНК полиморфизма обычно проводится одновременно по множеству маркёров на ограниченных коллекциях ДНК, представляющих лишь немногие популяции. Можно ожидать, что и в дальнейшем, при быстро растущем числе анализируемых маркёров, они будут изучаться все на тех же ДНК коллекциях, все на том же наборе популяций. Тогда любая случайность в выборке будет умножаться на число изученных маркёров и решающим образом сказываться на результатах. А характер сбора выборок для ДНК маркёров порой оставляет желать лучшего: как правило, экспедиционное обследование проводится исследователями, лишь недавно работающими в области популяционной генетики.
Напротив, разные классические маркёры изучены в разных популяциях. Тем самым случайные смещения в результатах взаимно компенсируются. Это своеобразное преимущество массива данных по классическим маркёрам приобретает всё большее значение по мере лавинообразного умножения ДНК маркёров, которые анализируются для одних и тех же коллекций ДНК, то есть на одних и тех же выборках.
МИЛЛИОН МАРКЁРОВ… НА НЕНАДЕЖНЫХ ВЫБОРКАХ
К тому же нацеленность на охват максимального числа маркёров в таких работах отодвигает в тень число и качество изучаемых популяций. И вполне возможна ситуация, что исследование, лучшее по числу и спектру типированных маркёров, будет проведено не на самых лучших выборках. Последствия этого для изучения генофонда могут быть драматичными.
Представим, что изучены восточные славяне. Украинцы и русские представлены выборками, собранными в столичных вузах (студенты которых съехались из различных частей страны, причём более чем вероятно, что многие студенты-киевляне будут иметь в родословных предков из России, а студенты Москвы — родственников на Украине). А выборка третьего восточнославянского этноса — белорусов — собрана в селе, вдали от городов и магистралей. Можно ожидать, что первые две выборки будут близки между собой, а белорусская — только за счет дрейфа генов — будет значительно отличаться от них. Такие соотношения популяций и будут получены при изучении на этих выборках по прекрасной многотысячной панели маркёров. Однако вывод, что русские и украинцы генетически сходны, а генофонд белорусов резко своеобразен — это вывод будет неверен: он обусловлен не генетическими взаимоотношениями реальных русских, украинских и белорусских популяций, а лишь ошибками в формировании ДНК коллекций. Но при этом такой вывод будет казаться хорошо обоснованным по количеству и качеству изученных ДНК маркёров. Это показывает, насколько тщательно и продуманно должны быть собраны популяционные выборки. И чем большее число ДНК маркёров изучается по ним — тем выше требования к репрезентативности выборок.
СТЕПЕНЬ ИЗУЧЕННОСТИ РУССКОЙ ДНК
Для добротного анализа генофонда нужно располагать данными по целому ряду популяций из разных частей ареала, а многие ДНК маркёры изучены в одной-двух, в лучшем случае нескольких русских популяциях. Напомним, что в анализ классических маркёров мы включали лишь те, которые были изучены в десяти и более популяциях (см. раздел 5.1. и Приложение, раздел 6). Причина такой скудости данных по ДНК полиморфизму, как нам кажется, в том, что большинство исследователей пока интересуется сравнением разных народов. Задача же изучения разных популяций одного народа, как правило, не ставится. Но именно эта задача главная в данной книге: детальное изучение гетерогенности русского генофонда.
Оставим в стороне вопрос о том, можно ли получить достоверные результаты о сходстве народов, если характеристика каждого неточна? (Когда появятся данные по множеству популяций каждого народа, многие нынешние положения о взаимном генетическом сходстве народов, видимо, придётся пересмотреть.)
Обратимся к вопросу — сколько популяций нужно изучить, чтобы надёжно охарактеризовать русский генофонд по какому-либо маркёру?
В статьях, посвящённых изменчивости какого-либо ДНК маркёра, нередко можно встретить такую популяцию, как «русские» (обычно без каких-либо пояснений). Иногда указывается географическая локализация или иные сведения об изученной популяции. В этом смысле можно считать, что русский генофонд охарактеризован по большому числу ДНК маркёров. Однако эти данные фрагментарны и не дают никакой информации о структуре русского генофонда. Они могут дать очень приблизительную оценку отличий русского генофонда от иных народов, но не позволяют изучить гетерогенность русского генофонда — для этого нужны данные по многим популяциям из географически разных областей. Именно поэтому данные по многим локусам выше названы «фрагментарными» — они характеризуют только один фрагмент русского генофонда. Лишь в том случае, если по каждому маркёру изучена не одна, а несколько популяций, и они представляют разные части генофонда, мы получим его надёжные характеристики.
Трижды предпринимались попытки изучить одни и те же ДНК маркёры не для одной, а для целого ряда русских популяций. Первая такая попытка была предпринята коллективом под руководством С. А. Лимборской при активном участии авторов данной книги. Полученные данные — частоты аутосомных ДНК маркёров — вошли в монографию и статьи [Лимборская и др., 2002; Popova et al., 2001; Belyaeva et al., 2003]. Но анализ структуры русского генофонда не проводился. Немногим позже Б. А. Малярчук начал планомерные работы по изучению полиморфизма митохондриальной ДНК в русских популяциях. Им изучен ряд популяций, главным образом сосредоточенных в южных областях Восточной Европы [Malyarchuk, Derenko, 2001; Малярчук и др., 2001; Малярчук и др., 2002; Malyarchuk et al., 2002; Малярчук, Деренко, 2004]. Одновременно авторы этой книги продолжали проводить систематические, область за областью, экспедиционные обследования русского генофонда. Сформированные ДНК коллекции изучены по маркёрам митохондриальной ДНК, Y хромосомы и ряду диаллельных аутосомных маркёров. Полученные данные будут опубликованы в ближайшее время, но часть из них представлена уже в этой книге.
Из этого обзора видно, что наиболее интенсивно для русского генофонда изучалась митохондриальная ДНК. Именно её изменчивости посвящена основная часть данной главы. Также данные, полученные совсем недавно по Y хромосоме, позволили провести подробный анализ и этих маркёров. Но ещё раз подчеркнём, что из-за немногочисленности изученных популяций вся совокупность этих данных пока даёт лишь предварительное представление о русском генофонде — менее полное, чем рассмотренные в главе 5 данные по классическим маркёрам.
6.1. АУТОСОМНЫЕ ДНК МАРКЕРЫ
СПИД протекторная мутация — Её большое значение — Её любопытная история — Элегантность её географии — Распространение в русском ареале — Западнорусская аномалия
Выше мы говорили о том, насколько важно для изучения пространственной структуры русского генофонда охватить популяции из различных частей его ареала. К сожалению, география изученных популяций надёжна лишь для немногих аутосомных ДНК маркёров. Пожалуй, лучше всего в русском ареале изучено распределение мутации в гене CCR5. Поэтому рассмотрим географию именно этого популярного ДНК маркёра.
В последние десять лет эта мутация — делеция 32 нуклеотидов в гене рецептора хемокинов (CCR5del32) — привлекает большое внимание исследователей всего мира. Причина очевидна: гомозиготы по мутантному гену CCR5del32 почти полностью устойчивы к инфицированию ВИЧ-1.
Имеются данные для 22 русских популяций (табл. 6.1.1). Правда, для трёх из них географическая привязка или отсутствует [Stephens et al., 1998], или проблематична [Libert et al., 1998], или характеризует население за пределами «исконного» ареала (русские Новосибирска [Yudin et al., 1998]). Но остальные 19 популяций позволяют картографировать распространение мутации CCR5del32 достаточно подробно.
Таблица 6.1.1.
Частоты мутантного аллеля — делеции CCR5del32 — в русских популяциях
МЕХАНИЗМ УСТОЙЧИВОСТИ К ВИЧ-1
Молекулярные механизмы такой устойчивости хорошо изучены [Dragic et al., 1996; Dean et al., 1996; Samson et al., 1996]. Вирус использует хемокиновый рецептор для проникновения в клетку. Мутация приводит к отсутствию рецептора на поверхности клетки, а это препятствует проникновению вируса. В то время как гомозиготные носители делеции обладают почти полной устойчивостью, у гетерозиготных пациентов СПИД все-таки развивается, но медленнее, на два-три года позже, чем обычно [Zimmerman et al., 1997; Galvani, Novembre, 2005]. Кроме del32, в гене CCR5 и прочих генов семейства хемокинов (CCR2, SDF1) обнаружены и другие мутации. Некоторые из них тоже снижают темпы инфицирования и относятся к СПИД протекторным генам, но их влияние слабее CCR5del32 [O’Brien, Moore, 2000].
ГЕОГРАФИЯ И ВОЗРАСТ ДЕЛЕЦИИ
Известно, что мутация CCR5del32 встречается главным образом у европейцев (в среднем 10 %). Частота её в Европе снижается с севера на юг. За пределами Европы мутация встречается с низкими частотами в смежных регионах (Северная Африка, Ближний Восток, Средняя Азия), но отсутствует в более отдалённых от Европы регионах: в Африке южнее Сахары, в Восточной и Юго-Восточной Азии, в коренном населении Америки [Martinson at al., 1997, 2000].
Такой простой тренд необычен для распространения генов в популяциях человека. И он стал особенно интригующим, когда появились данные по возрасту мутации. Основываясь на изменчивости микросателлитных маркёров, сцепленных с геном CCR5, Либерт с коллегами [Libert at al., 1998] показали, что мутация возникла примерно 2000 лет назад. Данные другой группы [Stephens et al., 1998] оценили возраст мутации всего в 700 лет. Впрочем, 95 % доверительные интервалы в обоих случаях покрывают несколько тысячелетий. Тем не менее, нет сомнений, что мутация возникла лишь однажды и возникла в Европе. Следовательно, частота мутации в населении Европы возросла от нуля до 10 % за сравнительно короткое время. Согласно законам популяционной генетики, такое резкое изменение частоты в столь большой популяции не может быть вызвано случайным дрейфом генов [см. обзор Galvani,
Novembre, 2005]. Остается предполагать действие естественного отбора в пользу этой мутации. Это сразу возникающее впечатление — действия отбора в пользу мутации — было подтверждено и математическим моделированием [Stephens et al., 1998].
Эпидемия СПИДа началась слишком недавно, чтобы изменить частоты генов. Следовательно, нужно найти иные факторы естественного отбора, действовавшие в историческое время. Опираясь на тот факт, что хемокиновые рецепторы взаимодействуют, кроме ВИЧ-1, и с другими патогенами, было выдвинуто предположение, что мутация может определять устойчивость сразу к нескольким инфекционным заболеваниям.
ГИПОТЕЗЫ
«ГИПОТЕЗА ЧУМЫ» [Stephens et al., 1998] постулирует, что частота мутации возросла в результате эпидемий чумы. Гипотеза основана на том, что в средневековой Европе от чумы погибала заметная часть населения. Это должно было привести к заметному действию естественного отбора в пользу любого фактора, определяющего устойчивость к болезни. Эта гипотеза, хотя и получила широкое распространение, никогда не имела прямых доказательств. Более того, недавно было показано, что мутации в гене CCR5 не влияют на протекание чумы у мышей [Mecsas et al., 2004].
«ГИПОТЕЗА ОСПЫ». Но, возможно, что инфекционным заболеванием, приведшим к распространению мутации, была оспа [Galvani, Slatkin, 2003]. Эпидемии оспы, хотя были не столь драматичны, как чума, но поражали европейцев непрерывно. Причём жертвами обычно были дети, что могло ускорить изменение частоты аллеля в поколениях. Опять-таки, и эта гипотеза основывается не на клинических или молекулярно-генетических данных, а на статистическом анализе возможного действия эпидемий оспы.
«ГИПОТЕЗА КЛИМАТА». Кроме гипотез, связанных с инфекционными заболеваниями, предпринимались и другие попытки объяснить закономерности в пространственном распространении мутантного аллеля. Было изучено возможное действие климата и обнаружена сильная отрицательная корреляция между частотой мутации и рядом температурных факторов [Balanovsky et al., 2001, 2005; Limborska et al., 2002].
«ГИПОТЕЗА ВИКИНГОВ» постулирует, что мутация возникла в Скандинавии и распространилась по Европе в «век викингов», когда норманнские корабли достигали самых отдалённых побережий Европы [Lucotte, 2001].
ЕВРАЗИЙСКАЯ КАРТА РАСПРОСТРАНЕНИЯ МУТАЦИИ
В целом надо признать, что факторы, повлиявшие на распространение мутации del32, поняты не до конца [Galvani, Novembre, 2005]. Для их лучшего понимания необходимо, в первую очередь, иметь точную картину распространения мутации в населении мира.
Закономерности распространения мутации CCR5del32 в глобальном масштабе рассматривались как нами, так и многими иными авторами в целом ряде работ — по мере того, как накапливались данные о частотах мутации [Martinson et al., 1997; Libert et al., 1998; Stephens et al., 1998; Lucotte, 2001; Limborska at al., 2002; Galvani, Slatkin, 2003]. Недавно, объединив наши данные по русским и иным популяциям Восточной Европы с данными из опубликованных источников, мы составили общемировую сводку данных по частотам мутации del32. Эта база данных представлена здесь в виде карты распространения мутации в Евразии (рис. 6.1.1). Карта построена по данным о 185 популяциях, из них 35 — собственные неопубликованные данные авторов и их коллег [Balanovsky et al., 2005].
Рис. 6.1.1. Карта глобального распространения мутантного аллеля CCR5del32.
На карте (рис. 6.1.1.) видна четкая закономерность: частота максимальна на севере Европы (на побережьях Балтийского и Белого морей), и во всех направлениях от этой зоны частота плавно снижается. Модификация этой карты, вычленяющая основной паттерн изменчивости, демонстрирует концентрические круги — постепенное убывание частоты по мере удаления от зоны максимальных частот в Беломоро-Балтийском регионе [Balanovsky et al., 2005].
ИЗМЕНЧИВОСТЬ В РУССКОМ АРЕАЛЕ
Для данного маркёра в масштабе Евразии свойственна едва ли не самая элегантная, четкая и простая пространственная изменчивость, которую только приходилось видеть авторам этой книги. Тем удивительнее, что распределение мутации в русском ареале носит довольно сложный характер (рис. 6.1.1). Наибольшие частоты отмечены на Русском Севере — во всех трёх изученных популяциях Архангельской области. Именно они формируют беломорскую часть беломоро-балтийского максимума, выявившегося при анализе в глобальном масштабе. К югу и западу русского ареала частота снижается. Таким образом, распределение мутации в русском ареале согласуется с глобальным трендом в двух аспектах: высокая частота на севере (в зоне беломоро-балтийского максимума) и снижение частоты к югу.
РУССКАЯ АНОМАЛИЯ
Но есть и важное расхождение. В глобальном масштабе частота мутации падаёт не только и не столько к югу, сколько с запада на восток — по мере удаления от Балтийского побережья. Но в русском ареале частота, напротив, снижается не к востоку, а к западу! Западные русские популяции (псковские, вплотную примыкающие к зоне Балтийского максимума, и смоленская популяция) обладают существенно меньшей частотой мутации (5–9%), чем центральные и даже восточные русские популяции (10–15 %). Кроме того, Вологодская популяция, расположенная вблизи северного русского максимума частот (16–19 %), имеет частоту мутации лишь 5 %. Достоверность этой геногеографической аномалии подтверждаётся объёмами и качеством выборок.
Трудно предположить, что могло сформировать такую чересполосицу в расположении зон высоких и низких частот в русском ареале. Эта аномалия достаточно ярко видна не только в «русском масштабе», но и является одним из важнейших нарушений плавного хода изолиний и на «евразийской» карте распространения мутантного аллеля (рис. 6.1.1). Остается надеяться, что по мере дальнейшего изучения «смоленско-псковско-вологодская» аномалия — зона низких частот, столь некстати расположившаяся рядом с зоной максимальных частот, будет более чётко оконтурена, что, в свою очередь, поможет лучше уяснить причины этого феномена.
ВТОРОЙ МИРОВОЙ МАКСИМУМ
Карта распространения мутации в Евразии (рис. 6.7.7.), благодаря нашим новым (пока ещё неопубликованным) данным, выявила ещё один феномен — второй мировой максимум CCR5del32 в Западной Сибири. Пока он основан только на данных по шорцам (q=0.17). Данные по шорцам достаточно репрезентативны (154 человека) и представляют не одну, а несколько выборок с большой части этнического ареала шорцев. Аналогичные данные для шорцев были получены М. И. Воеводой с соавторами. В одной из популяций хантов [Yudin et al., 1998] выявлена высокая частота мутации (q=0.12; выборка 61 человек). Поэтому, хотя результаты требуют развертывания исследований в этом регионе, сам выявленный феномен второго мирового максимума может считаться установленным.
ИТОГ
Изменчивость CCR5del32 позволяет сделать два вывода в отношении русского генофонда.
Во-первых, по этому маркёру выявилась особость населения Архангельской области. Причём, хотя эффективный популяционный размер именно на этих территориях особенно невелик, необычно высокие частоты нельзя объяснить лишь генетическим дрейфом. Ведь все три Архангельские популяции, причём географически и генетически изолированные друг от друга, отклонились от среднерусской частоты в сторону увеличения частоты мутации и примерно на одну и ту же величину, тогда как действие дрейфа предполагает случайное по направлению и силе отклонение.
Во-вторых, изменчивость частоты этого маркёра в русских популяциях столь велика, что заметна даже в глобальном масштабе, на «евразийской» карте (рис. 6.1.1).
6.2. МИТОХОНДРИАЛЬНАЯ ДНК (материнские линии)
Самый изученный маркёр — Его особенности
§ 1. Изученные русские популяции: Кто их изучал — Почему обязательно «исконный» ареал? — Качество выборок — Семь «хороших» популяций
§ 2. География гаплогрупп: Самая частая гаплогруппа — Самые редкие гаплогруппы — Умеренные гаплогруппы — Особый профиль Русского Севера — Редкость «азиатских» гаплогрупп у русских — Пенеги — Древние пласты Севера?
§ 3. Русские популяции в генетическом пространстве мтДНК: Главный кластер популяций — Особостъ севера — Призрачное своеобразие юга — Значительная дифференциация русского генофонда — Выявляемая при корректном анализе
§ 4. Сказка об изолах и миграх: Генетическая память популяции
§ 5. Прокрустово равенство: сколько «русских» гаплотипову соседей по Европе? Ищем общие гаплотипы — Ненасытная Харибда — Коварная Сцилла — Мужественный Прокруст — Общий восточно-европейский генофонд — Русские и финно-угры — Русские и славяне
Я научила женщин говорить…
Но, Боже, как их замолчать заставить!
Анна АхматоваС девяностых годов XX века и до настоящего времени митохондриальная ДНК (мтДНК) является, пожалуй, наиболее интенсивно изучаемым ДНК маркёром. Одна из причин такого внимания к мтДНК кроется в её малости (в сравнении с ядерным геномом). Это позволило унифицировать набор маркёров мтДНК. Если выбор аутосомных маркёров огромен, и разные лаборатории изучают различные гены, то мтДНК стала общим местом популяционных исследований. Значение этого трудно переоценить — стандартизация программы популяционных исследований [Macaulay et al., 1999] позволила сосредоточить усилия многих и многих лабораторий на одной и той же системе маркёров, и накопить в общемировом масштабе внушительный объём данных о полиморфизме мтДНК (глава 9).
Благодаря концентрации усилий на одной генетической системе, её полиморфизм стал досконально изученным. Это стимулировало и разработку методологических вопросов — анализа медианных сетей, датировок времени возникновения аллелей (гаплогрупп) [Forster et al., 1996; Saillard et al., 2000], сравнения новых данных с результатами работ по классическим маркёрам. Стали обсуждаться вопросы воспроизводимости результатов популяционных исследований при повторном изучении тех же популяций [Yao et al., 2002] и, соответственно, различных стратегий формирования выборок. Многие иные проблемы, ранее едва просматривавшиеся на заднем плане ДНК исследований, встали на повестку дня, как только был накоплен определённый опыт беспрецедентно подробного (по масштабам ДНК исследований) изучения географии митохондриальной изменчивости.
Эта наработанная методология анализа нерекомбинирующих генетических систем уже перенесена на анализ Y хромосомы, и, видимо, будет широко использоваться и для гаплотипов других маркёров — X хромосомы и аутосомных.
Возможно, такой взгляд на мтДНК — просто как на самый изученный ДНК маркёр — покажется странным на фоне научной моды на использование мтДНК в решении проблем микроэволюции, филогеографии.
Однако такой взгляд позволяет сравнивать разные маркёры не только «потенциально» — по их теоретическим возможностям для изучения генофонда, но и «кинетически» — по той энергичности, с которой они изучаются в практике популяционных исследований.
Маршрут раздела таков. Сейчас мы вкратце рассмотрим особенности мтДНК — этот раздел читатель может смело пропустить и возвратиться, если последующее изложение покажется непонятным. Затем в § 1 мы рассказываем, что к настоящему времени сделано для изучения «митохондриального генофонда» русских популяций. Далее представляем попытку обобщения накопившейся информации — анализа изменчивости мтДНК в пределах русского генофонда и сравнения его с соседними группами населения на уровне гаплогрупп (§ 2-§ 3) и на уровне гаплотипов (§ 4-§ 5).
ОСОБЕННОСТИ МИТОХОНДРИАЛЬНОЙ ДНК
ДВА СВОЙСТВА. Для изучения генофонда важны две особенности митохондриальной ДНК.
Во-первых, мтДНК наследуется только по материнской линии: каждый человек получает свой гаплотип мтДНК от матери, то есть в передаче мтДНК принимают участие только женщины. Популяционному генетику это даёт возможность прослеживать популяционные процессы (миграций, динамики численности и т. д.), в различной степени затрагивающие представителей разных полов.
Во-вторых, у мтДНК нет рекомбинации, т. е. нет «перетасовывания» генов, пришедших от матери и пришедших от отца (просто потому, что от отца мтДНК не приходит). Благодаря этому вся мтДНК передаётся в поколениях единым «текстом» — гаплотипом. Это позволяет вычленять «линии» мтДНК (похожие «тексты», связанные единством происхождения), выявлять их «родословные», датировать время расхождения основных ветвей таких родословных, объективно фиксировать события возникновения новых вариантов мтДНК и пути их передвижения по Земле вместе с потоками мигрантов.
Эти свойства вызвали всеобщий интерес к мтДНК — к настоящему времени на территории Европы почти не осталось народов, для которых не имелись бы данные по мтДНК, причём многие получены по обширным выборкам.
УСТРОЙСТВО мтДНК. Митохондриальная ДНК представляет собой небольшую молекулу, расположенную в клетке особняком — не в ядре, как основная часть генома, а в митохондриях. У мтДНК есть свои особенности метаболизма. Так, например, считается, что мутации в митохондриальной ДНК происходят примерно в 100 раз чаще, чем в ядерной.
МтДНК содержит немногим более 16000 нуклеотидов («букв», которыми написан текст мтДНК). Каждому из них присвоен номер, определяющий его место — позицию — в тексте. В митохондриальной ДНК можно выделить два типа участков.
Первый — участки, кодирующие митохондриальные белки; они составляют основную часть (более 15000 нуклеотидов) мтДНК. В этих участках мутации редки — то есть случайные ошибки при передаче текста, когда какая-то «буква» вдруг заменяется другой, встречаются редко, поскольку отсеиваются отбором.
Однако известно довольно много позиций (определённых мест в пронумерованной последовательности нуклеотидов мтДНК), в которых у разных людей может находиться не строго определённый, а тот или иной нуклеотид. В основном они находятся в некодирующей части мтДНК. Считается, что большинство этих мутаций произошли за историю человечества лишь однажды, и поэтому все люди, имеющие данную мутацию, являются между собой более или менее близкими родственниками по материнской линии. Во всяком случае, они связаны более тесным родством, чем те, у кого нет данной мутации.
ГАПЛОГРУППЫ. Нужно оговориться, что повторные мутации в той же позиции изредка все-таки случаются. Поэтому отдельно взятая мутация в мтДНК может и не быть свидетельством общего происхождения, а произойти независимо. Надежное определение родства молекул мтДНК проводится по наличию не одной, а нескольких общих мутаций (как в кодирующей, так и в некодирующей частях мтДНК). Сочетание мутаций однозначно определяет гаплогруппу — т. е. совокупность («линию») митохондриальных ДНК, имеющих общую предковую форму. Однако индивидуумы, молекулы митохондриальной ДНК которых относятся к одной и той же гаплогруппе (т. е. имеющих одинаковые нуклеотиды в позициях, «диагностирующих» гаплогруппу) могут различаться по другим участкам, в частности, гипервариабель-ным сегментам.
ГАПЛОТИПЫ. Два таких участка (гипервариабельный сегмент 1 и гипервариабельный сегмент 2 — ГВС1 и ГВС2) представляют оставшуюся часть митохондриальной ДНК. Эта часть мтДНК не кодирует белки, в отличие от основной «кодирующей части». Каждый из этих сегментов состоит примерно из 400 нуклеотидов. Если при изучении кодирующей части обычно проверяются выборочно только несколько нуклеотидов[39], характерных для той или иной гаплогруппы, то при анализе ГВС1 проводится прямое «секвенирование» — определяется, какой именно нуклеотид расположен в каждой из 400 позиций этого сегмента. Иными словами, анализируются не несколько, а все 400 ДНК маркёров ГВС1. Данные по ГВС1 позволяют выделить не несколько гаплогрупп, а огромное множество вариантов мтДНК (гаплотипов). То есть каждую гаплогруппу можно подразделить на субгаплогруппы, а их — на целый ряд гаплотипов. Это многократно повышает разрешающую возможность анализа, в том числе определения возраста гаплогрупп.
Скорость накопления мутаций в некодирующих участках намного выше, чем в кодирующей части (поэтому они и называются гипервариабельными), — здесь одни и те же мутации часто возникают независимо, многократно. Поэтому точная классификация типов митохондриальной ДНК (гаплотипов) производится в два этапа: сначала для данной линии определяется принадлежность к той или иной гаплогруппе (на основании изучения кодирующей части), а затем точное систематическое положение внутри гаплогруппы (по ГВС1). Обычно кодирующую часть «смотрят» лишь на несколько ключевых мутаций, а для определения субгаплогруппы и гаплотипа привлекаются данные по ГВС1.
ФИЛОГЕОГРАФИЯ. Зная достаточное количество сочетаний мутаций в ГВС1, встреченных в популяции, можно с большой долей вероятности определить порядок возникновения этих мутаций во времени и, соответственно, составить «родословное древо» для гаплотипов митохондриальной ДНК. Это древо обычно представляется в виде так называемой медианной сети, которая отличается от обычной дендрограммы тем, что отдельные ветви могут сливаться друг с другом. Такое слияние ветвей указывает, что нам пока неизвестно, шло ли развитие по одному, другому, или обоим направлениям, но наличие какого-либо третьего пути маловероятно.
Установление такой филогенетической классификации митохондриальной ДНК имеет большое значение для популяционных работ, поскольку позволяет оценить число произошедших мутационных событий и, при ряде допущений об их скорости, вычислить время, прошедшее с момента возникновения данной гаплогруппы (ветви родословного древа мтДНК).
Подобно тому, как знание времени чеканки монеты, обнаруженной в археологическом памятнике, может помочь датировать памятник, так и знание времени возникновения гаплогруппы, обнаруженной в популяции, может способствовать лучшему пониманию истории популяции.
В обоих случаях, мы не знаем точной датировки популяции или археологического памятника (ведь монета или гаплогруппа могли бережно храниться и передаваться в долгой чреде поколений, с незапамятных времен). Но мы точно знаем, что памятник возник позднее, чем время, выбитое на монете. Поэтому, когда мы слышим, что датировки мтДНК восточных славян составляют 30 тысяч лет, не стоит гордиться, что славяне уже 30 тысяч лет существуют на свете. Это лишь означает, что славяне появились позднее, чем 30 тысяч лет назад (а когда именно — по-прежнему неизвестно). Насколько ценна такая информация, можно спорить. Но если с ней умело обращаться, то она может помочь установить, что одни древние популяции древнее других.
Изучив мтДНК, можно с высокой достоверностью определить эволюционные соотношения всех гаплотипов — как представленных в современном генофонде, так и отсутствующие «промежуточные формы». Это позволяет реконструировать процесс возникновения гаплотипов, локализовать во времени и в пространстве происхождение каждой конкретной гаплогруппы мтДНК. Эта область исследований получила название филогеографии. Сопоставление современного ареала гаплогруппы с древней зоной её возникновения открывает путь к прослеживанию миграций населения, а также иных событий демографической и этнической истории (сокращения численности и «экспансии», подразделение популяции, особенностей брачной структуры и других).
ДВА МАСШТАБА АНАЛИЗА. Изменчивость «митохондриального генофонда» можно изучать в двух «масштабах».
Первый — масштаб гаплогрупп. Обычно рассматривают распределение гаплогрупп по территории, сравнивают частоты гаплогрупп в разных популяциях, в том числе методами многомерного анализа: главных компонент, многомерного шкалирования, кластерного анализа.
Второй — масштаб гаплотипов. Он позволяет проводить более тонкий анализ. Здесь можно определить уровень гаплотипического разнообразия, сравнить спектр (набор) гаплотипов, встреченных в разных популяциях.
Своеобразный промежуточный уровень — разнообразие гаплотипов в пределах конкретной гаплогруппы. Зная величину разнообразия гаплотипов, можно рассчитать время, за которое это разнообразие могло накопиться в ходе мутационного процесса, то есть время, прошедшее с момента возникновения гаплогруппы.
В § 2 и § 3 мы проведём анализ в масштабе гаплогрупп, а затем перейдём к масштабу гаплотипов (§ 4 и § 5).
§ 1. Изученные русские популяции
Русский народ — самый многочисленный в Европе и занимает самый большой ареал. Поэтому от его митохондриального генофонда можно ожидать значительного разнообразия. Мы видели (главы 2, 4) что вклад тех ли иных антропологических пластов различен в разных регионах. Поэтому данные по генетике «одиноких» русских популяций отражают лишь один из фрагментов генофонда и не могут дать характеристику русского народа в целом. А значит, необходимо изучить полиморфизм мтДНК во многих регионах, на всей обширной территории «исконного» ареала русского народа.
ИСТОРИЯ ИЗУЧЕНИЯ
Самые первые данные о мтДНК в русских популяциях появились давно [Лемза, Соколова, 1992; Петрищев, Кутуева, 1993; Казаковцева и др., 1998], но из-за методических различий (тогда типировались лишь немногие ПДРФ маркёры) они мало приложимы к современным исследованиям.
В работе [Orekhov et al., 1999] впервые были представлены данные о полиморфизме гипервариабельного сегмента мтДНК у русских — суммарно 103 человека из Костромской, Курской и Рязанской областей. К сожалению, в статье не указано, к какой из популяций относится каждый гаплотип. Поэтому сейчас, когда имеются данные по многим региональным популяциям, эти самые первые данные, как ни грустно, приходится оставлять за бортом нашего анализа генофонда. Для нас это яркий пример того, насколько важно при начале работы уделять внимание формированию выборок, а при её завершении — возможно полной публикации исходных данных и популяционных сведений о них. Несомненно, что при своем появлении, на фоне практически полного отсутствия данных по российским популяциям, эта работа была своевременной. Но если бы для каждого из гаплотипов была дана «привязка» к географически конкретным популяциям и по каждой популяции выборка была бы достаточна, то эта статья не потеряла бы своего значения и сейчас.
К настоящему времени в работах Б. А. Малярчука опубликованы данные по шести[40] русским популяциям со средним размером выборки N=66 [Малярчук и др., 2001, 2002]. В этих статьях представлены результаты ПДРФ анализа кодирующей части мтДНК для всех шести популяций, тогда как данные по сиквенсу ГВС1 опубликованы в отдельной статье для трёх из этих популяций. Соответственно, для трёх других популяций гаплогруппы определены с тем уровнем разрешения, который легко достигается с помощью небольшого числа ПДРФ маркёров. Этот уровень заметно ниже того, который достигается при комбинации информации ПДРФ и ГВС1. Отсутствие подразделения гаплогруппы U на субгаплогруппы в этих статьях особенно затрудняет их использование. Данные по трём из этих популяций опубликованы также в [Malyarchuk et al., 2002] где проведён анализ как ПДРФ, так и ГВС1. Правда, в статье не была указана принадлежность конкретных гаплотипов к той или иной популяции. Авторы благодарны Б. А. Малярчуку, предоставившему им такую информацию. Она позволила определить гаплогруппы с общепринятым уровнем разрешения, и эти данные использованы в § 5 для графика многомерного шкалирования.
Также имеются данные по русскому населению Ростовской области [Richards et al., 2000; Генофонд и геногеография…Т.2, 2003].
Северная популяция (Каргополь, N=76) изучена в работе [Belyaeva et al., 2003] и по ГВС1, и по ПДРФ кодирующей части. Авторы руководили сбором экспедиционных образцов в этой популяции, поэтому на эту выборку мы полагаемся уверенно.
Авторы этой книги, совместно с Эстонским биоцентром, возглавляемым Р. Виллемсом, также предприняли изучение полиморфизма мтДНК в пяти русских популяциях (средний объём выборки N=130). Все экспедиции были проведены коллективом под руководством Е. В. Балановской. Обследование северо-восточной (Архангельская область) и восточной (Костромская область) популяций проведено авторами книги. При работе в западной популяции (Смоленская область) нам помогали А. С. Пшеничное и Н. Н. Аболмасов. Обследование южных популяций проведено нашими коллегами из этих регионов: кубанских казаков — Э. А. Почешховой, а в Белгородской области сотрудниками М. И. Чурносова. Все экспедиции проведены по единому плану и с соблюдением строгих требований к формированию выборки. Все генотипирование мтДНК проведено О. П. Балановским на базе Эстонского биоцентра. Изучен как полиморфизм ГВС1, так и ПДРФ анализ кодирующей части мтДНК. Эти данные будут опубликованы в ближайшее время, и анализируются в данной книге.
В литературе имеются ещё данные по русскому населению Магадана, Башкирии, Томска и Новосибирска. Однако эти популяции находятся далеко за пределами «исконного» русского ареала, и потому здесь не рассматриваются.
ДАЛЬНЕВОСТОЧНЫЕ СЛАВЯНЕ
Конечно, такой подход изучения — только коренного населения на его «исконном» ареале — хотя и служит краеугольным камнем нашей книги, но не бесспорен. Можно предположить, что популяция «дальневосточных славян» (русские и украинцы Магадана, как пишут изучавшие их авторы, «происходящие из различных регионов бывшего СССР» [Malyarchuk, Derenko, 2001]) представляет не меньший интерес, чем популяции восточных славян. Действительно, «неинтересность» дальневосточных славян объясняется лишь тем, что эта популяция сформировалась всего несколько десятков лет назад и представляет собой сборную группу людей, происходящих из самых различных частей СССР. Но ведь тысячу лет назад восточнославянское население Волго-Окского междуречья также, по всей видимости, являлось чрезвычайно молодым образованием, сотканным из переселенцев из самых различных, более западных областей Киевской Руси. Почему же тогда мы считаем генофонд восточных славян интереснейшим объектом, а дальневосточных славян оставляем за бортом исследования? Неужели дело лишь в очаровании древности?
На этот вопрос не так просто ответить — особенно потому, что перед очарованием древности, и вправду, нам устоять нелегко. Но дело все же в другом. Сейчас, тысячу лет спустя, мы знаем, что восточные славяне Волго-Окского междуречья оставили многочисленное потомство, образовали устойчивые популяции и стали ядром русского народа, существующего уже в течение многих веков и широко расселившегося — вплоть до Дальнего Востока.
А вот какова дальнейшая судьба дальневосточных славян? Сформируется ли на их основе устойчивая в поколениях популяция? Или уже через несколько лет в тех местах будут жить новые мигранты, а нынешнее население, или их дети, будут населять другие города и страны? Неизвестно. Но очень велика вероятность второго исхода! А в таком случае генетически изученная популяция уже через несколько лет после её изучения перестаёт существовать, и опубликованные данные перестают соотноситься с каким-либо генофондом. Напротив, данные по устойчивой популяции продолжают адекватно описывать её генофонд и по прошествии нескольких поколений. Именно поэтому (этот вопрос рассматривается в главе 7 и в Приложении) мы изучаем лишь «истинные» популяции, одним из критериев которых является их устойчивость в чреде поколений и заключение не менее 50 % браков внутри популяции. И именно поэтому каждый народ изучается на его «исконной» территории — там, где в течение веков формировался генетический портрет этого народа, какая бы судьба его не постигла далее (он колонизировал или его колонизировали).
ВЫБОРКИ
В популяциях, обследованных нашим коллективом, мы всегда стремились к тому, чтобы размер выборки составил около 150 человек — в два раза больше, чем принятый для анализа аутосомных маркёров. Увеличение выборки необходимо, чтобы компенсировать гаплоидность мтДНК[41] и возможно более полно охватить разнообразие гаплотипов[42]. Обследовались группы деревень или небольшие города вдали от магистралей — с целью избежать влияния недавних миграций. Письменное информированное согласие было получено от каждого из обследованных. Все четверо бабушек и дедушек обследованных были рождены в пределах ареала данной популяции. На практике это означает, что у подавляющего большинства обследованных все их предки происходили из того административного района данной области, в котором проводилось экспедиционное изучение. Остальные генеалогические линии обследованных ведут к соседним районам той же области. Таким образом, благодаря тщательному анкетированию обследованных людей, собранные выборки действительно репрезентативно представляют коренное население изученных регионов.
Аналогично собрана и выборка русских Каргополя — оба автора принимали деятельное участие в работе этой экспедиции.
Что же касается популяций, обследованных Б. А. Малярчуком, то требования при формировании выборок были менее строгими: обследование проводилось на базе областных больниц и станций переливания крови, изучалось население крупных городов, и основное внимание было уделено русской национальности и месту рождения обследованных и их матерей [Малярчук, Деренко, 2004]. То есть анкетирование проводилось до второго, а не третьего поколения, как в наших выборках. И единицей обследования выступала область, а не район (меньшая географическая точность).
Эти методические различия могут иметь важное следствие: результаты недавних (происходивших в XX веке) миграций могут намного сильнее проявляться в данных Б. А. Малярчука. Тем самым эти данные могут в большей мере представлять смешанное (а не коренное) русское население, проживающее в изученных регионах. Это необходимо иметь в виду при интерпретации практически всех результатов, поэтому при каждом виде анализа мы оговариваем, данные по каким именно выборкам были использованы. В § 3 мы ещё раз вернемся к этому вопросу.
АНАЛИЗИРУЕМЫЕ ПОПУЛЯЦИИ
В таблицах 6.2.1. и 6.2.2. указаны все выше перечисленные популяции.
Можно видеть, что изучены различные региональные группы, которые охватывают практически весь «исконный» русский ареал. Из них семь популяций (Каргополь, Пинега, Унжа, Смоленск,
Белгород, кубанские казаки, юго-восточные русские) представлены качественными выборками, тогда как данные по остальным популяциям, как только что описывалось, по тем или иным параметрам не подходят для геногеографического анализа. Поэтому основной анализ выполнен по семи перечисленным популяциям.
Это число популяций, к сожалению, недостаточно для проведения картографического анализа. Но оно позволяет набросать митохондриальный портрет русского населения, выявить особенности региональных популяций, оценить межпопуляцион-ную изменчивость в пределах русского генофонда.
Таблица 6.2.1.
Русские популяции, изученные по маркёрам митохондриальной ДНК.
Таблица 6.2.2.
Данные по митохондриальной ДНК и Y хромосоме в русских популяциях, опубликованные за время подготовки книги к печати.
§ 2. География гаплогрупп
Анализ изменчивости и антропологических, и классических генетических маркёров мы начинали с «простых» карт отдельных признаков (главы 4, 5). Но для мтДНК количество изученных популяций пока недостаточно для картографирования. Слишком схематичны и неточны были бы карты, построенные всего по семи популяциям. Поэтому мы решили попробовать пока без карт уловить тенденции в географическом распределении гаплогрупп.
И основной тенденцией вновь оказалась широтная изменчивость, которая столь ярко проявилась при анализе классических маркёров и антропологических признаков (главы 4, 5): деление русского ареала на север и юг.
ГАПЛОГРУППА Н
Частота этой «европейской» гаплогруппы варьирует в русских популяциях в широких пределах. Она резко падает с севера на юг: от почти 50 % в Архангельской области до 35–40 % у южных русских, при промежуточных частотах в центре ареала. Снижение частоты гаплогруппы Н к югу характерно и для населения Европы в целом.
ГАПЛОГРУППЫ I. UL U2. U3. X
Эти гаплогруппы встречены только в южной половине русского ареала, причём практически в каждой изученной популяции, но при этом отсутствуют в северных популяциях (Пинега, Каргополь). Конечно, это отсутствие временное — при дальнейшем увеличении выборок эти гаплогруппы скорее всего обнаружатся и на севере, но можно полагать, что их частоты будут намного ниже, чем на юге. Все эти пять гаплогрупп редкие: средняя частота у русских 1–2%.
ГАПЛОГРУППЫ К. R. Т. U5A. U5B
Эти гаплогруппы более частые и встречены повсеместно. Но и для них частоты на севере и на юге различны: гаплогруппы К, R и U5b встречаются на Русском Севере несколько чаще, а Т и U5a — реже, чем в остальных русских популяциях.
ВОСТОЧНО-ЕВРАЗИЙСКИЕ ГАПЛОГРУППЫ А. С. D. Z
Любопытно распределение восточно-евразийских гаплогрупп. Этот термин обозначает гаплогруппы, основная зона распространения которых — Восточная и Центральная Азия (раздел 9.2.). Поэтому восточноевразийские гаплогруппы могли бы маркировать монголоидный вклад в генофонд. Когда мы рассматриваем не только русские, а все популяции Восточной Европы, то география восточно-евразийских гаплогрупп очень четкая — каждая из гаплогрупп чаще встречается на востоке региона (глава 8). Что же касается русских популяций, то такого тренда мы у них не видим: восточно-евразийские гаплогруппы встречаются в них хотя и с низкой частотой, но повсеместно. Уже не первый раз в этой книге мы сталкиваемся с тем, что распределение генов в русском ареале отнюдь не следует закономерностям, которые выявлены в глобальном масштабе.
Суммарная частота всех восточно-евразийских гаплогрупп в русских популяциях (2.2 %) практически так же низка, как и в населении Западной Европы (например, в популяциях французов в среднем 0.5 %). При этом в популяциях Восточной Азии эти гаплогруппы доминируют, составляя 85-100 % от всех гаплогрупп у монголов, китайцев, эскимосов. Таким образом, данные по митохондриальной ДНК указывают на отсутствие сколько-нибудь значительного монголоидного пласта в русском генофонде.
Впрочем, хотя для отдельных восточно-евразийских гаплогрупп в русском ареале тренды не обнаруживаются, их суммарная частота может оказаться информативным показателем. Хотя она для русских и невелика (2.2 %), но прослеживается тенденция её некоторого увеличения к востоку. Так, в восточной русской популяции (Унжа) суммарная частота восточно-евразийских гаплогрупп — 3.8 %. На северо-востоке русского ареала (Пинега) суммарная частота ещё чуть выше — 6.2 %, правда, она возрастает только за счет одного очень специфичного варианта гаплогруппы D, частота которого достигает 5.6 % и который связан скорее с севером Европы, чем с Азией (см. ниже «Пенеги»). Так что высокая доля восточно-евразийских гаплогрупп в этих двух восточных русских популяциях может быть связана с особенностями самого древнего пласта генофонда на Русском Севере. К тому же выборка Унжи невелика. Так что только дополнительные детальные исследования смогут показать, есть ли хоть сколько-нибудь реальное повышение частот восточно-евразийских гаплогрупп у восточных русских.
ПЕНЕГИ
Эта пинежская популяция вообще наиболее своеобразна: здесь не обнаружены гаплогруппы V, X и U5a, тогда как U5b присутствует с частотой в два раза выше, чем в других русских популяциях. Последняя черта могла бы сближать эту популяцию с саамами (генофонд которых представлен в основном лишь двумя гаплогруппами — U5b и V), но «саамская» гаплогруппа V отсутствует в популяции пенегов.
Северно-русская популяция в верховьях р. Пинеги обследована нами в 2001 г. Экспедиция была проведена как комплексная: она включала и сбор образцов крови для анализа ДНК и классических маркёров; и сбор генетико-демографической информации; и сбор данных о квазигенетических маркёрах (фамилии); и антропологическое обследование (расовая программа и антропологическая фотография). Антропологический раздел осуществляли акад. Т. И. Алексеева и к.б.н. А. Г. Новожилов.
Освоение Русского Севера является одной из вех в этногенезе русского народа. Особое внимание привлекают те группы, где предполагается значительное влияние субстратного дославянского населения. К ним относится и данная популяция, расположенная на северо-востоке Архангельской области на самой границе с республикой Коми. Нами был обследован ряд сельсоветов Пи-нежского района — Нюхченский, Сосновский, Сурский, Ново-Лавелевский — тянущиеся лентой вдоль Пинеги.
Результаты антропологического анализа показали, что население данной популяции близко не к субстратному населению восточных финно-угров, а к старожильческому русскому населению: выявленный антропологический тип полностью соответствует размаху изменчивости северного русского типа [Алексеева и др., в печати]. Население является высокорослым, с ярко выраженными чертами европеоидного типа, выраженной горизонтальной профилировкой лица, повышенным процентом светло-голубых глаз (№ 10–11) и русых волос, сильно выступающим носом. В целом, этот тип отражает влияние не низовской (Ростово-Суздальской) колонизации Русского Севера, а влияние более ранней северо-западной (Новгородской) русской колонизации и, возможно, балтского компонента. Но не исключено и влияние западных финно-угров, расселившихся на Пинеге до прихода сюда и славян, и коми («Сура поганая» русских источников).
Итак, по антропологическим данным пинежская популяция сближается с более западными популяциями. Что же показывает мтДНК? В таблице 6.2.3. приведены генетические расстояния от пинежской популяции до тех популяций Европы, с которыми могло быть связано её происхождение.
1) Малые генетические расстояния (менее 0.05). Наиболее сходным население Пинеги оказывается с другой северной русской популяцией (Каргополь). Также пинежские русские генетически сходны с немцами (!), литовцами и поляками, то есть очерчивается круг популяций, расположенных намного западнее, чем сама Пинега.
2) Средние генетические расстояния (0.05-0.07).
Популяции, среднеудаленные от Пинеги, охватывают широкий круг славянских популяций (русские, украинцы, чехи), а также одну балтскую (латыши) и одну западную финно-угорскую популяцию (эстонцы).
3) Большие генетические расстояния (более 0.07). Популяции, генетически значительно отличающиеся от пинежских русских — в основном финно-угорские (карелы, финны, коми). Особенно удивляет отличие пинежской популяции от соседних коми. В момент обследования население по Пинеге имело столь тесные контакты с республикой Коми, что предпочитало работать вахтовым методом там, а не в собственном районном центре (Карпогорах). Этнографические, культурные заимствования от коми в этих русских популяциях велики [Жеребцов, 1982], что подтверждает реальность долговременного контакта с коми. Но при этом по частотам гаплогрупп мтДНК пинежская популяция резко отличается от коми и вообще от финно-угорских популяций, и сближается с широким кругом балто-славянских популяций.
Таким образом, данные по мтДНК свидетельствуют, что пинежская популяция в целом генетически не связана с финно-угорским субстратом.
Такой результат стал для авторов неожиданностью, поскольку вся совокупность данных, рассматриваемых в этой книге, свидетельствует как раз о значительной или даже определяющей роли финно-угорского субстрата в формировании структуры русского генофонда. Данные по пинежской популяции (где, как мы видим, этот субстрат не выявляется) свидетельствуют, что эта популяция не укладывается в общую картину. А это, в свою очередь, говорит, что наша картина является слишком упрощённой, и нужны бы специальные усилия по приведению её в большее соответствие с ходом реального, сложного процесса смешения славянских и финно-угорских популяций.
Тем любопытнее, что те же данные по мтДНК, которые (в целом) показывают различия пинежской популяции и финно-угров, показывают их сходство в одной характерной частности. Речь идет о любопытном варианте гаплогруппы D с мотивом 126–136, который представлен на Пинеге двумя гаплотипами. Именно этот мотив был обнаружен и у саамов [Tambets et al., 2004]. Вообще, этот вариант гаплогруппы D географически приурочен к северу Восточной Европы — от финнов до северо-восточных русских и коми. Вполне возможно этот вариант маркирует древнюю общность генофонда на этой обширной территории.
Таблица 6.2.3.
Генетические расстояния от пинежской популяции (северо-восточные русские) до популяций Восточной и Центральной Европы
§ 3. Русские популяции в генетическом пространстве мтДНК
Мы рассмотрели изменчивость мтДНК русских популяций в географическом пространстве. Теперь рассмотрим положение русских популяций в генетическом пространстве. Наиболее полную картину даёт график многомерного шкалирования, показывающий генетические взаимоотношения популяций (рис. 6.2.1).
МЕТОД МНОГОМЕРНОГО ШКАЛИРОВАНИЯ
По частотам всех основных гаплогрупп рассчитаны генетические расстояния между всеми изученными русскими популяциями. Эту матрицу генетических расстояний мы уже использовали при сравнении пинежской популяции с соседями. В матрице содержится информация о генетическом сходстве между всеми возможными парами популяций. Метод многомерного шкалирования позволяет изобразить это сходство на графике. Каждая популяция изображается в виде точки. И расстояния между каждой парой точек соответствуют генетическому сходству между этой парой популяций. Чем больше популяций, тем сложнее изобразить их взаимное расположение на плоском графике. Метод многомерного шкалирования как раз и позволяет создать такой график с минимальным искажением.
График основан на частотах 12 гаплогрупп и показывает взаимное генетическое сходство 12 русских популяций (перечислены в табл. 6.2.1). Три из этих популяций (Краснодарская, Белгородская и Нижегородская) изучены только по ПДРФ маркёрам [Малярчук и др., 2001], поэтому для этих популяций нельзя подразделить гаплогруппу U. Для них можно определить частоты лишь сокращенного набора из 12 гаплогрупп: Н, V (в т. ч. Vpre), HV, I, J, К, Т, U, W, X, сумма восточно-евразийских гаплогрупп и «все прочие» гаплогруппы. Для сопоставимости, и остальные 9 популяций анализируются по этому сокращенному набору. По частотам гаплогрупп рассчитаны генетические расстояния Нея между каждой парой популяций. Полученная матрица генетических расстояний обрабатывалась в программе Statistica 6.0 методом многомерного шкалирования. Величины стресса (0.10), алиенации (0.13) и плавный вид диаграммы Шепарда свидетельствуют, что геометрическое расположение популяций на графике удовлетворительно описывает генетические расстояния между ними.
Рис. 6.2.1. График многомерного шкалирования русских популяций (по частотам 12 гаплогрупп мтДНК).
Обозначения приведены в тексте и в таблице 6.2.1.
КТО И ГДЕ В ГЕНЕТИЧЕСКОМ ПРОСТРАНСТВЕ?
На графике (рис. 6.2.7.), прежде всего бросается в глаза, что северные русские популяции (Пинега, Каргополь — обозначены на графике квадратами) размещаются в отдалении от основного кластера, в котором собрались практически все остальные русские популяции (кружки). Тем неожиданнее выглядит поведение самых южных русских популяций (обозначены треугольниками). Одна из них (Кубань) входит в основной кластер, а две прочих (Ставрополь и Краснодар) разлетелись в разные углы графика. Все три популяции (Краснодарского, Ставропольского краев и кубанские казаки Адыгеи, табл. 6.2.1.) представляют русское население Предкавказья, которое обычно рассматривается как единый южнорусский тип.
ОТ ЧЕГО РАЗЛЕТЕЛИСЬ ЮЖНЫЕ ПОПУЛЯЦИИ?
Столь разительные отличия между этими популяциями по маркёрам мтДНК, конечно, в какой-то степени могли бы быть вызваны смешением с соседними народами Кавказа, которые различаются между собой по спектру гаплогрупп. Но трудно представить, чтобы генофонд, к примеру, Краснодарского края определялся смешением именно с соседними коренными народами Северного Кавказа — слишком несоизмеримы численности населения. Тем более, что наши данные по аутосомным ДНК маркёрам показывают, что даже у кубанских казаков, издавна проживающих бок о бок с адыгами, не обнаруживается поток генов между этими популяциями! И данные по структуре браков Краснодарского края свидетельствуют, что обычно один из супругов происходит из далекого региона: Краснодарский край вбирает в себя мигрантов со всей России. Можно полагать, что такой тип брачной структуры относится не только к современности, но издавна характерен для русского населения южных регионов России [Наследственные болезни в популяциях…, 2002].
Такой «межрегиональный» характер браков должен был привести к максимальному сходству, а не к различиям южных популяций. Поэтому много более вероятно, что большие генетические различия связаны не с реальной структурой популяции, а с характером формирования выборок. Если часть обследованных не являлась в строгом смысле представителями коренного населения, то в выборке могли появиться гаплогруппы, необычные для южных русских популяций, и эти «залётные» гаплогруппы могли оказаться самыми разными в каждой из обследованных групп.
Рассмотрим, как частоты гаплогрупп в этих трёх популяциях отличаются от среднерусских частот (средних частот в популяциях, вошедших в основной кластер на рис. 6.2.1).
КРАСНОДАРСКАЯ ВЫБОРКА отличается повышенной частотой гаплогруппы J (18 % в Краснодарской популяции при среднерусской частоте 9 %) и сниженной частотой гаплогруппы U (10 % в Краснодарской популяции при среднерусской частоте 19 %). При этом частота гаплогруппы J у коренных народов Северного Кавказа (в среднем 8 %) вовсе не повышена, а близка к среднерусской. А частота гаплогруппы U у народов Северного Кавказа (25 %) отнюдь не ниже, а даже выше среднерусской (19 %). То есть отличия Краснодарской выборки от остальных русских популяций нельзя объяснить смешением с народами Кавказа. Остается предполагать, что в эту выборку попали представители каких-то третьих групп, или же своеобразных, нетипичных популяций.
СТАВРОПОЛЬСКАЯ ВЫБОРКА отличается от основного кластера русских популяций сниженной частотой гаплогруппы Н (35 % вместо 42 %) и повышенной частотой гаплогруппы X (8 % вместо 1 %). В данном случае смешение с местными северокавказскими популяциями отчасти могло сформировать такие частоты (средняя частота гаплогруппы Н на Северном Кавказе — 22 %). Хотя главную особенность Ставропольской выборки — совершенно необычную частоту X — трудно объяснить смешением, поскольку и на Северном Кавказе такая высокая частота X встречается лишь в немногих популяциях, а её средняя частота на Кавказе — 5 %. Чтобы объяснить высокую частоту X в русском населении Ставрополья, придётся предположить, что этот генофонд большей частью сформирован материнскими линиями не из Центральной или Южной России, а автохтонного кавказского населения, причём каких-то специфических групп. Очевидно, что такое предположение неправдоподобно. Вернее всего, что сам генофонд Ставропольского края вполне сходен со среднерусским, но конкретная рассматриваемая выборка плохо отражает генофонд Ставрополья. Впрочем, это легко можно будет проверить, когда появятся данные ещё по одной-двум русским популяциям из этого региона.
ВЫБОРКА КУБАНСКИХ КАЗАКОВ. Что же касается третьей популяции из Предкавказья — кубанских казаков (старожильческого русского населения Адыгеи), то эта популяция оказывается вполне «среднерусской». Ни по одной из гаплогрупп отклонения от среднерусских частот не превосходят 5 %. Поэтому и на графике она разместилась вблизи основного кластера русских популяций (рис. 6.2.1). А ведь именно в этой из трёх южных популяций и можно было ожидать максимального своеобразия — и вследствие большей давности их отделения от основной части русского генофонда, и вследствие их проживания вперемешку с коренным населением Северного Кавказа. В следующей главе мы покажем, сколь своеобразна эта популяция по данным о фамилиях. Поэтому близость кубанских казаков по мтДНК к среднерусским частотам лучше всего показывает истинное положение и других южных популяций в генетическом пространстве.
Небезынтересно, что как раз эта выборка кубанских казаков (наши данные) была собрана Э. А. Почешховой наиболее тщательно — собирались сведения о местах рождения родителей и бабушек-дедушек обследованных. Если рассматривать предков только по материнской линии, то выборка главным образом (60 %) состоит из уроженцев Майкопского района республики Адыгея, на 36 % — из уроженцев других районов Адыгеи и Краснодарского края и лишь оставшиеся 4 % бабушек со стороны матери происходят из Ростовской, Воронежской областей и Ставропольского края. Мы видим, что выборка, которая более чем на*95 % и на глубину трёх поколений представляет русское казачье население Краснодарского края, близка к общерусскому кластеру! А выборки, собранные менее тщательно в том же Краснодарском и в Ставропольском краях, располагаются весьма далеко от основного массива русских популяций.
Итак, необычные частоты гаплогрупп в Краснодарской и Ставропольской выборках задаются случайностями выборки, а не своеобычностью самой популяции. Третья — корректно сформированная — южная выборка оказалась близка к большинству русских популяций.
ВСЕГДА ЛИ ПОПУЛЯЦИИ РАЗЛЕТАЮТСЯ?
На графике (рис. 6.2.1) есть и другие примеры, когда из одного региона изучено несколько популяций. Например, две выборки из Белгородской области (Белгород 1 и Белгород 2), независимо собранные разными исследователями (см. табл. 6.2.1.) оказались генетически близки. Обе северно-русские популяции (Пинега и Каргополь) отличаются от основного кластера русских популяций повышенными частотами гаплогрупп Н, K, и U5b, сниженными частотами гаплогруппы U5a, и, по всей видимости, V. Важно, что эти обе северно-русские популяции на графике близки друг к другу. В противном случае их особенности можно было бы толковать как результат хаотического действия дрейфа генов. Однако трудно предположить, что дрейф, действуя на две популяции (разнесённые на 400 км!) сместил частоты одних и тех же гаплогрупп в одну и ту же сторону. Можно надеяться, мы имеем дело с реальным генетическим портретом населения Русского Севера.
ГЕТЕРОГЕННОСТЬ РУССКОГО ГЕНОФОНДА
Рассматривая «митохондриальный генофонд» русских популяций, надо количественно ответить на вопрос: какова гетерогенность русского генофонда? Велики или малы генетические различия между русскими популяциями по данным о мтДНК?
Средние генетические расстояния между семью русскими популяциями составили d=0.033. Это и есть оценка гетерогенности русского генофонда по мтДНК: величина различий русских популяций между собой.
МЕТОДИКА РАСЧЁТА. Для оценки различий использовались генетические расстояния Нея, рассчитанные в программе DJ, написанной Ю. А. Серегиным (программа представлена на нашем сайте ). Исходные данные представлены частотами 21 гаплогруппы: Н; HV; HVpre; I; J; К; N1; R; Т; Ul; U2; U3; U4; U5a; U5b; U7; U8; V включая Vpre; W; X; а также суммой восточно-евразийских гаплогрупп А, В, С, D, G, Y. Мы рассчитали генетические расстояния между каждой парой русских популяций и величину средних генетических расстояний. Генетический смысл средних расстояний тот же, что и показателя межпопуляционной изменчивости GST — оба показателя оценивают размах различий между популяциями [Bodmer, Cavalli-Sforza, 1976].
ВЫБОРКИ РЕШАЮТ ВСЕ! (ИЛИ МНОГОЕ…)
Отметим, что если наша оценка дифференциации русских популяций по мтДНК составила d=0.033, то по данным Б. А. Малярчука она порядок ниже: d=0.002. По всей видимости, столь серьёзные расхождения возникли оттого, что в работе Б. А. Малярчука изучены популяции лишь из южной части русского ареала (Ставропольского и Краснодарского краев, Белгородской, Орловской, Саратовской и Нижегородской областей), тогда как в нашем исследовании юг и север, запад и восток представлены достаточно равномерно. По-видимому, межпопуляционные различия между южными популяциями действительно малы, что и было обнаружено Б.А. Малярчуком. Но, как мы видели (рис. 6.2.1), генетические различия между русским югом и русским севером по мтДНК очень велики и они определяют большую изменчивость русского генофонда в целом.
В работе [Малярчук, Деренко, 2004] приведён показатель дифференциации F, который по частотам 29 гаплогрупп составил FST=-0.0006, а по частотам гаплотипов ГВС1 FST=-0.0016. Авторы сделали вывод: «…Полученные результаты свидетельствуют об отсутствии генетической подразделённости по митохондриальным линиям между изученными популяциями русского населения...». Тем удивительнее полученная нами высокая оценка гетерогенности. Ведь FST с небольшой долей огрубления можно приравнять к использованному нами показателю — средним генетическим расстояниям (выше мы говорили о сходстве расстояний с третьим показателем — GST очень близким к FST).
Этот пример показывает, насколько важен охват самых различных частей ареала. Иначе легко сделать выводы, верные лишь для фрагмента ареала. Отметим, что в одной из недавних работ Б. А. Малярчук (с учетом новых полученных им данных по более широкому кругу популяций) оценил дифференциацию русского генофонда как значительную [Malyarchuk et al., 2004].
РУССКИЙ ГЕНОФОНД НА ФОНЕ НАРОДОВ ЕВРОПЫ
Имеющиеся данные показывают, что гетерогенность других европейских народов по мтДНК значительно меньше. Гетерогенность мтДНК русского генофонда по своему размаху соответствует скорее гетерогенности не отдельных европейских народов, а целых регионов Европы. Например, рассчитанные нами различия по мтДНК между всеми локальными популяциями в пределах Балканского региона составили ту же величину (d=0.033), что и различия между всеми русскими популяциями, а различия между локальными популяциями всей Западной Европы (от Испании до Скандинавии) лишь ненамного выше (d=0.041).
ИТОГИ
Итак, мы рассмотрели расположение в генетическом пространстве мтДНК всех двенадцати русских популяций, изученных к настоящему времени. Большинство популяций, независимо от своего географического положения, формируют единый кластер в генетическом пространстве. Особое положение занимают северные русские популяции, что, вероятно, отражает реальные особенности генофонда Русского Севера. Что же касается двух южных «разлетевшихся» популяций, то их поведение, по-видимому, зависит лишь от случайностей формирования этих выборок.
Средние генетические расстояния между всеми русскими популяциями (d=0.033) свидетельствуют о высокой гетерогенности русского генофонда на общеевропейском фоне.
Таковы основные итоги обобщенного анализа мтДНК на уровне гаплогрупп. Остаток «митохондриального» раздела данной главы мы посвятим анализу в другом масштабе — гаплотипов.
§ 4. Сказка об изодах и миграх
ЖИАИ-БЫАИ ИЗОАЫ И МИГРЫ…
В конце палеолита племя изолов укрылось в кольце непроходимых гор. Прошли тысячелетия, но эта популяция сохранилась в полной изоляции. На их высокогорном плато нет природных барьеров и велика подвижность населения — они охотники и скотоводы. Эти особенности образа жизни не позволили изолам разделиться на устойчивые подгруппы. В результате все изолы имеют примерно равные шансы вступить в брак друг с другом (рис. 6.2.2).
Рис. 6.2.2. Ареалы изолов (изолированная бесструктурная популяция) и мигров (подразделённая популяция)
А рядом с изолами — по ту сторону гор — в исторически недавнее время поселились мигры (рис. 6.2.2). Численность мигров и изолов одинакова. Но народ мигров составился из четырех разных племен, подобранных ими на долгом пути миграции. Так мигры и расселились — каждое племя в своей долине. Основная доля браков заключается в пределах племени. Но по большим праздникам устраиваются всеобщие ярмарки, где порой заключаются и межплеменные браки, и браки с другими народами.
Итак, народ мигров — подразделённая популяция, образовавшаяся совсем недавно.
Изолы — бесструктурная (панмиксная) и очень древняя популяция.
Изолы произошли от палеолитической популяции, имевшей лишь несколько древних гаплотипов мтДНК. С течением времени благодаря мутациям возникали все новые гаплотипы, нарастали молодые побеги родословного древа гаплотипов. Росло генетическое разнообразие внутри популяции. Так действовали мутации. Но второй, более мощный фактор — дрейф генов — это разнообразие уменьшал, случайно оставляя лишь малую часть гаплотипов, не считаясь с тем, новорожденные эти гаплотипы или очень древние. Но эти редкие случайно «выжившие» гаплотипы встречаются с высокой частотой, и вновь частота их может не зависеть от того, новорожденные эти гаплотипы или очень древние. Ведь дрейф работает «вслепую», безответственно и неотразимо, не считаясь с родословными.
Мигры же, собрав по пути множество гаплотипов, принесли их на свою новую родину. С тех пор прошло всего несколько поколений, и новые гаплотипы ещё не возникли. Зато племена мигров по-прежнему открыты внешним миграциям, пополняющим разнообразие гаплотипов.
РАЗНЫЕ ИТОГИ ДРЕЙФА У ИЗОЛОВ И МИГРОВ
Ни изолы, ни мигры не могут избежать действия дрейфа генов, истребляющего, один за другим, гаплотипы из их популяций. То, что дрейф именно так поступает с редкими генами, популяционная генетика открыла очень рано, и это стало хрестоматийным примером.
Причём тогда генетики работали с аутосомными генами, а не с мтДНК. Это важное различие: ведь мтДНК, во-первых, гаплоидна (не две, как для аутосомных генов, а только одна копия на геном человека), а во-вторых, передаётся только от половины родителей (от матерей). Перемножая эти величины, получаем, что число митохондриальных ДНК, переданных следующему поколению, в четыре раза меньше, чем для любого аутосомного гена. Поэтому дрейф действует на мтДНК примерно в четыре раза сильнее, эффективнее пропалывая гаплотипы.
Но дрейф по-разному действует на изолов и на мигров.
В панмиксной популяции изолов действие дрейфа непоправимо: исчезнувший гаплотип никогда не вернется.
А в подразделённой популяции мигров гаплотип, исчезнувший в одном из племен, может снова прийти из другого племени. Вероятность того, что этот гаплотип независимо исчезнет во всех четырех племенах, мала. Случайное уменьшение частоты в одной из частей подразделённой популяции может компенсироваться её случайным увеличением в другой, и в результате средняя частота у мигров более устойчива. Это явление стабильности подразделённой популяции описано во многих работах и подробно рассмотрено в Приложении.
МУХИ. Наиболее прямые доказательства устойчивости подразделённых популяций к дрейфу генов получены в известных работах Юрия Петровича Алтухова и Елены Юрьевны Победоносцевой, которые провели прямой эксперимент на дрозофиле. Мухи были расселены по отсекам популяционного ящика и обменивались генами точно так, как мы предположили для мигров — равная численность в отсеках, равновероятный обмен между отсеками, но основная часть скрещиваний происходит в отсеке. Исходная частота гена была 0.5 и оставалась практически неизменной: в течение 80 поколений варьировала от 0.6 до 0.4. (см. Приложение).
Другой ящик тех же мух, с той же общей численностью и в тех же условиях, но с полной свободой скрещивания, — моделирует панмиксную популяцию изолов. В ней — за то же время — частота гена упала от 0.6 до 0.1 и этот ген легко может быть потерян. Итак, подразделённая популяция устойчива и хранит генетическую память. А панмиксная — нет. Мы убедились, что они эволюционируют с разной скоростью.
ЛЮДИ. Конечно, история изолов и мигров сложнее этого эксперимента. В ней случались и засухи, и эпидемии, и войны. Порою численность увеличивалась, а потом резко падала. Это приводило к эффекту «бутылочного горлышка». Для генетической памяти мигров угроза невелика — подразделённая популяция об-ладаёт особым свойством репарации. Пусть даже одно из племен полностью исчезнет, средние частоты народа в целом изменятся незначительно. А на ареал исчезнувшего племени вернутся их отдалённые потомки — дети от межплеменных браков (земля предков всегда манит потомков). И тогда генофонд исчезнувшего племени будет отчасти восстановлен. Однако для генетической памяти панмиксной популяции изолов эффект «бутылочного горлышка» очень опасен, даже если численность потом восстановилась. При колебаниях численности дрейф генов действует ещё разрушительнее, так как средний по всем долгим поколениям эффективный размер популяции Ne близок к «диаметру бутылочного горлышка», а дрейф генов целиком и полностью зависит от эффективного размера популяции (см. Приложение).
ИЗУЧАЕМ ИЗОЛОВ И МИГРОВ… И ДЕЛАЕМ НЕВЕРНЫЕ ВЫВОДЫ!
Какие же результаты получим мы, изучив современных изолов? Дрейф генов приведёт к потере большинства гаплотипов — как древних, так и новых мутаций. То, какие именно гаплотипы мтДНК или Y хромосомы будут утеряны, — зависит от чистой случайности. Следовательно, от неё зависят и наши выводы.
Если уцелеет группа гаплотипов, несущих общую позднюю мутацию, — мы сделаем вывод о чрезвычайной молодости изолов. Если уцелеют две разные группы гаплотипов — мы сделаем вывод о смешении двух разных народов. И это когда перед нами самый древний в мире народ — прямой потомок палеолита, который за 20 тысяч лет своей истории не принял ни одного чужеродного гена!
А что же мигры? Популяция мигров, благодаря подразделённости, сохраняет феерическое разнообразие гаплотипов. Это именно та картина, которую представляла бы древнейшая популяция изолов, если бы на них не действовал дрейф. То есть мигры предстанут перед исследователем блестящей имитацией древней популяции.
Итог изучения мтДНК может быть таким: мигры — древнейшее коренное население края, а изолы — недавняя миграция неизвестно откуда. То есть прямая противоположность реальной истории.
В ЧЁМ ЖЕ ОШИБКА?
И эту злую шутку сыграло с нами игнорирование структуры популяций. Несомненно, в генофонде и изолов, и мигров записана их история. Но эти записи, переписываемые в каждом поколении, могут искажаться. У популяции есть генетическая память. Но подразделённые мигры имитируют чужую память, а панмиксные изолы свою память утратили.
В древних китайских хрониках о варварах говорилось, что они не помнят прошлого, не думают о будущем. И применительно к генофонду, его «цивилизованность» (твёрдая генетическая память) или «варварство» (её отсутствие) оказываются тесно связанными с подразделённостью популяции, её структурой.
СКАЗОЧНЫЕ УРОКИ
Эта сказка показывает, что для интерпретации результатов изучения мтДНК недостаточно представления о том, что разнообразие гаплотипов в популяции, благодаря мутациям, увеличивается с ходом времени. Для правильной интерпретации необходимо также знать: какова структура популяции? является ли популяция коренной? а если смешанной и пришлой, то где и как она формировалась? могла ли сохраниться генетическая память?
§ 5. Прокрустово равенство: сколько «русских» гаплотипов у соседей по Европе?
Миновав Элевсин и приближаясь уже к долине реки Кефиса в Аттике, Тесей пришёл к разбойнику Дамасту, которого называли обыкновенно Прокрустом… Прокруст, легендарный разбойник, имел ложе, в которое укладывал свои жертвы: если их рост был меньше длины ложа, он их растягивал, если больше — отрубал лишнее.
Мифы и легенды Древней Греции, Греческие крылатые выраженияДальше им пришлось миновать пролив, по одну сторону которого подстерегала корабли ужасная Харибда, а по другую — чудовищная Сцилла. Харибда выглядела подобно водовороту, втягивавшему в пасть воду вместе с кораблями. Сцилла же была некогда прекрасной девой, и злая Кирка, завидуя ей, превратила её в страшилище с шестью собачьими головами и двенадцатью ногами. Одиссей направил корабль мимо последней, решив пожертвовать шестью спутниками, так как понимал, что Харибда проглотит корабль целиком.
Мифы Древней ГрецииЧТО ТАКОЕ ГАПЛОТИПЫ?
Мы понимаем под гаплотипом вариант мтДНК, который можно отличить от других таких же вариантов — неважно, различаются они по ГВС1 или же по ПДРФ маркёрам кодирующей части. Среди изученных нами 650 индивидуумов из исторического ареала русского народа выявлено 283 различных гаплотипа. Если добавить к ним все опубликованные и архивные данные по русским, то общая выборка составит 1584 образцов, а число гаплотипов в ней — 628. Это одна из самых больших выборок по мтДНК среди всех народов мира.
ВОЗМОЖНОСТИ ГАПЛОТИПОВ
Огромное разнообразие гаплотипов придаёт сравнению популяций потенциально большую разрешающую способность. Ведь мы можем обнаружить как гаплотипы, общие между двумя популяциями, так и те гаплотипы, которые присутствуют только в одной из них. Можем рассмотреть, присутствует ли данный гапло-тип в смежных популяциях и в каких именно. И проведем мы такой анализ не по десятку признаков (как в случае аутосомных генов или гаплогрупп мтДНК), а по сотням разных признаков (гаплотипов мтДНК). Например, мы рассмотрим гаплотипы, встреченные у русских и у соседних народов. И те популяции, с которыми у русских выявится больше общих гаплотипов, сочтём наиболее родственными.
НЕНАСЫТНАЯ ХАРИБДА: А ВСЕ ЛИ ГАПЛОТИПЫ НАЙДЕНЫ?
Несомненно, в русском населении существует некое конечное число гаплотипов. И при достаточно большой выборке они могут быть описаны почти все. Вопрос лишь в том, насколько велика должна быть такая выборка?
Этот вопрос вызван отнюдь не праздным любопытством. Для описания митохондриального генофонда популяции хотелось бы знать, какие именно гаплотипы там существуют, иметь их перечень. Это особенно важно для сравнения популяций. Если мы не знаем полного перечня гаплотипов, существующих в двух популяциях, то любые различия могут быть вызваны тем, что в одну из выборок эти гаплотипы просто не попали, хотя в популяции они присутствуют! Иными словами, при сравнении популяций по редким признакам (например, гаплотипам мтДНК) особенно важно знать, в какой степени наша выборка описывает реальную популяцию. Этот вопрос критичен и для практических целей судебно-медицинского использования мтДНК: «если данный гаплотип в популяции не обнаружен — то какова вероятность, что он там все-таки есть?»
ЧЕМ БОЛЬШЕ ВЫБОРКА, ТЕМ БОЛЬШЕ ГАПЛОТИПОВ
Чтобы ответить на этот вопрос, мы изучили скорость накопления гаплотипов при увеличении объёма выборки. Как можно видеть на графике (рис. 6.2.3), число гаплотипов в русских популяциях возрастает с увеличением объёма выборки линейно. И мы должны констатировать, что признаков насыщения не обнаружено. Насыщение должно было бы проявиться в постепенном выходе кривой на плато или, по крайней мере, в замедлении роста числа гаплотипов при увеличении выборки.
Рис. 6.2.3. График зависимости числа встреченных гаплотипов мтДНК от объёма выборки
Такая «ненасытность» приводит к весьма важному выводу: реальное число разных линий мтДНК в больших и географически подразделённых популяциях очень велико. Даже при выборках в тысячу и более образцов, по-прежнему в популяции остается множество невыявленных гаплотипов. Эту особенность мтДНК всегда необходимо учитывать, сравнивая популяции по спектру гаплотипов. Ведь если какой-либо гаплотип встречен у русских, но не обнаружен в иной популяции, это отнюдь не означает реального различия этих популяций. В действительности гаплотип может быть в обеих популяциях, но выявим мы его только при увеличении выборки.
КАК ПОСТРОЕН ЭТОТ ГРАФИК. Из общего массива в 1600 образцов из русских популяций случайным образом выбиралось по 100 образцов, и подсчитывалось число гаплотипов. На следующем шаге добавлялось ещё 100 образцов, случайно выбранных из оставшихся 1500, и подсчитывалось число гаплотипов в этой увеличившейся выборке. Всего было сделано 16 таких шагов — пока реальные доступные данные (1600 образцов) не были исчерпаны.
Грубая аппроксимация показывает, что соотношение между общим объёмом выборки и числом различных линий (гаплотипов) составляет примерно 7:3. Иными словами, число гаплотипов составляет около 40 % от числа исследованных образцов русского народа. Мы проверили это соотношение по данным о другом хорошо изученном народе — немцам, где исследовано лишь немногим меньше образцов — 1396. Число разных гаплотипов в этой выборке немцев составило 553, то есть соотношение осталось тем же — 40 %. Конечно, это соотношение должно несколько меняться в зависимости от разрешающей способности филогенетического анализа, то есть нашей способности отличать друг от друга «похожие» гаплотипы. Это соотношение должно зависеть и от структуры популяции, от соотношения миграций и дрейфа генов. Например, для саамов (лопарей), которые служат классическим примером мощного дрейфа, доля разных гаплотипов составляет, по нашим расчётам, только 11 % от объёма выборки (63 гаплоти-па в общей выборке 559 человек, информация Банка данных World Mitochondrial, см. Приложение раздел 5.).
КАК СРАВНИТЬ ПОПУЛЯЦИИ?
Сравнивать частоты гаплотипов, по всей видимости, нецелесообразно — слишком низка частота практически любого гаплотипа. И двукратные различия в частотах (в какой-то популяции один, а где-то встретилось два человека с таким гаплотипом) будут вызваны лишь случайностями выборки. Лучше сравнивать на качественном уровне: не важно, у скольких индивидов встречен данный гаплотип — важно, что он обнаружен в популяции. Тогда зависимость от объёма выборки будет меньше.
РАСЧЁТ ИНДЕКСА СХОДСТВА. Для каждой пары сравниваемых популяций мы подсчитывали число общих филогенетических линий (гаплотипов) мтДНК. Индекс сходства оценили как соотношение (долю общих линий): в числителе — количество линий мтДНК, общих с русскими популяциями; в знаменателе — суммарное число линий мтДНК, обнаруженных в сравниваемой популяции.
Такой способ расчёта, на первый взгляд, решает проблему «нерепрезентативности» любых наших выборок (в том смысле, что в них представлены далеко не все гаплотипы, реально присутствующие в популяции). Решает за счет того, что мы подсчитываем не число, а долю гаплотипов, общих между двумя популяциями. Ведь все гаплотипы имеют одинаковую вероятность «потеряться» (присутствовать в популяции, но отсутствовать в выборке). И если для изучаемой популяции «А» общие гаплотипы обнаруживаются преимущественно с популяцией «В», и реже с популяцией «С», то это означает, что таково реальное соотношение митохондриальных генофондов этих популяций. При этом мы предполагаем, что при увеличении объёма выборок число общих гаплотипов должно увеличиться в каждой сравниваемой паре популяций, но само соотношение останется примерно тем же.
КОВАРНАЯ СЦИЛЛА: В ЧЁМ ОШИБАЕТСЯ ИНДЕКС СХОДСТВА?
К сожалению, проверка показывает, что это не' вполне так. На рис. 6.2.4. приведена зависимость доли общих гаплотипов от объёма выборки (нижняя линия). Ясно видно, что такая зависимость имеется: чем меньше объём выборки, тем больше индекс сходства, тем больше доля общих гаплотипов.
ВЕРОЯТНОЕ ОБЪЯСНЕНИЕ. Можно предположить, что это вызвано наличием в популяциях сравнительно частых гаплотипов. Например, для населения Европы такими гаплотипами окажутся: в гаплогруппе Н гаплотип CRS и гаплотип с заменами «304–311»; в гаплогруппе J — гаплотип с заменами «069–126». Эти гаплотипы очень часты в Европе в целом, и поэтому встречены почти в каждой изученной европейской популяции. Число таких гаплотипов невелико. Но именно за счет своей повсеместности они всегда окажутся общими между любыми популяциями. Тем самым они являются как бы постоянной «прибавкой» к числу общих гаплотипов. И чем меньше объём выборки, тем больше сказывается это постоянное прибавочное число, тем больше оно завышает долю общих гаплотипов и повышает индекс сходства популяций.
Рис. 6.2.4. Сходство популяций зависит от объёма выборки (при прямом подсчёте доли общих гаплотипов между популяциями Европы).
Примечание. Для десяти европейских популяций подсчитаны три показателя: общее число гаплотипов в них; число гаплотипов, общих с русскими популяциями; доля гаплотипов, общих с русскими популяциями. Все 10 рассматриваемых популяций характеризуются разными объёмами выборок. График показывает, как три перечисленных параметра (отложенных по оси ординат) зависят от объёма выборки (ось абсцисс). Общее число гаплотипов при увеличении объёма выборки возрастает. Число гаплотипов, общих с русскими, также возрастает. Доля гаплотипов, общих с русскими, снижается. Это снижение хорошо видно на аппроксимирующем графике (жирная пунктирная линия). Для совместимости на одном графике число общих гаплотипов приводится умноженное на 10, а доля — умноженная на 1000.
Справедливо ли такое объяснение или есть другие причины зависимости сходства популяций от объёма выборки, в любом случае из-за этой зависимости любые выводы повисают в воздухе. Достаточно увеличить выборку, и обнаруженное ранее сходство популяций исчезнет! Наименее похожими на русских окажется население тех стран, где генетические исследования проводятся более интенсивно, а наиболее сходными будут просто слабо изученные народы! Необходим способ расчёта, корректирующий эту зависимость.
ПРОКРУСТ СПЕШИТ НА ПОМОЩЬ
Нами использован, пожалуй, самый простой, прямой, а потому надёжный способ такой коррекции — Прокрустов. Все сравнения проведены на выборках одного и того же объёма. Чтобы выровнять объёмы выборок, из каждой случайным образом было отобрано одно и то же число образцов, и дальнейшие сравнения проводились именно с этими новыми выборками одинакового объёма. Естественно, при этом происходила потеря части данных — все выборки приходилось выравнивать по самой маленькой из них (по размеру прокрустова ложа). Тем не менее, только такой прокрустов подход («отрубать лишнее») позволяет нам быть уверенными, что полученные результаты не зависят от того, что какая-то популяция изучена по большей выборке, а отражают что-то более объективное, можно надеяться — реальное сходство популяций.
СРАВНЕНИЕ РЕГИОНОВ. А НЕ ЛОКАЛЬНЫХ ПОПУЛЯЦИЙ
Зная, какие гаплотипы встречены в каждой из русских популяций, можно было бы сравнить разные русские популяции и определить, какие из них наиболее сходны друг с другом. Похожий анализ мы проводили по данным о частотах гаплогрупп (§ 3). Но осторожность не позволяет нам сделать это по данным о гаплотипах: выборки по каждой популяции составляют 100–150 человек, что слишком мало для определения спектра гаплотипов. Поэтому мы не можем провести анализ внутри русского генофонда, сравнив между собой разные русские популяции. Но можем объединить данные по всем русским популяциям, получив многосотенную выборку. И сравнить такой общерусский спектр с аналогичными спектрами соседних групп населения (табл. 6.2.4).
НА КОГО МЫ ПОХОЖИ?
Начиная со сказки об изолах-миграх и до мифов Древней Греции, мы только делали предостережения самим себе — они ясно показывают, как легко выводы о генофонде могут оказаться несоответствующими реальности. Поэтому теперь во всеоружии и с максимальной осторожностью сравним спектр гаплотипов в русских популяциях и у их соседей по Европе.
Диаграмма (рис. 6.2.5.) показывает, что по степени сходства с русским генофондом его соседи располагаются в следующем порядке: восточные славяне, волго-финские народы, западно-финские народы, западные славяне, тюркские народы Урала, южные славяне, германоязычные народы, народы Кавказа.
То, что по спектру гаплотипов русские оказались похожи на прочих восточных славян, не удивительно. Однако западные и в особенности южные славяне заметно отличаются от русских. У финноязычных народов (как западных, так и волжских) несколько больше общих гаплотипов с русскими, чем у славянских народов! Это можно трактовать в терминах финно-угорского субстрата в русском населении. Тюркоязычные народы и население Кавказа, несмотря на тесное соседство с современной зоной расселения русских, имеют с ними меньше общих гаплотипов мтДНК.
Таблица 6.2.4.
Группы населения, сравниваемые с русскими по спектру гаплотипов
Эти результаты показывают общность митохондриального генофонда Восточной Европы. Во всех языковых группах этого региона (восточные славяне, финно-угры, тюрки Уральского региона) мы видим общий массив гаплотипов мтДНК. Все эти группы народов по спектру гаплотипов похожи на русские популяции и, соответственно, должны быть и похожи друг на друга. На Кавказе и в Западной Европе спектр гаплотипов уже несколько отличается. Западные славяне, судя по рис. 6.2.5., присоединяются к восточноевропейскому кластеру, а южные славяне отличаются от него так же, как Кавказ и Западная Европа.
Сравнительно низкая доля общих линий между русскими и южными славянами требует объяснения. Можно вспомнить, что в ходе славянской экспансии как восточные, так и южные славяне расселились на территориях со значительно отличающимся субстратным населением: финноязычным на востоке и иллирийским на юге. Смешение с этими различными субстратами могло привести к заметным различиям между двумя славянскими группами по мтДНК. Нельзя также исключать, что предковые группы южных и восточных славян были исходно генетически различными.
Рис. 6.2.5. Доля общих линий между русскими популяциями и смежными группами населения
ОСНОВНЫЕ ЧЕРТЫ «МИТОХОНДРИАЛЬНОГО ПОРТРЕТА»
В разделе 6.2. мы рассмотрели изменчивость «митохондриального генофонда» в двух масштабах.
В МАСШТАБЕ ГАПЛОГРУПП (§ 2-§ 3): гетерогенность русского генофонда по мтДНК оценивается как высокая; рассмотрена география гаплогрупп в пределах «исконного» русского ареала; методом многомерного шкалирования обнаружено деление русских популяций на основной и северно-русский кластеры; оказалось, что «дыхание Азии» в русском генофонде не чувствуется.
В МАСШТАБЕ ГАПЛОТИПОВ (§ 4-§ 5): проведен более тонкий анализ и удалось сравнить по спектру гаплотипов русские популяции с их соседями. Восточно-европейский генофонд, составленный славянскими, финно-угорскими популяциями и тюрками Урала, предстает по этим маркёрам как единый континуум. Русские популяции целиком относятся к этой общности. При этом по спектру гаплотипов они особенно похожи на финно-угорские популяции. Это указывает на большую роль финно-угорского субстрата в формировании митохондриального генофонда русских популяций.
«МИТОХОНДРИАЛЬНЫЙ ПОРТРЕТ» рисует картину русского генофонда, близкую к тем портретам, которые были получены и по данным антропологии, и по классическим генетическим маркёрам. Данные по мтДНК также показывают чётко выраженные различия между южными и северными русскими группами. Размах этих различий заметен даже в общеевропейском масштабе изменчивости, но нигде не выходит за его рамки. Прослеживаются особенности генофонда, отражающие влияние смежных групп, в особенности финно-угорских популяций.
Подробнее итоги изучения мтДНК описаны в разделе 6.4.
6.3. Y ХРОМОСОМА (отцовские линии)
§ 1. Новейший маркёр в популяционной генетике: Романтический аргумент — Дробность выделения гаплогрупп — Часовая и минутная стрелки эволюции
§ 2. Изученные русские популяции: Фрагментарные литературные данные — И подробные собственные — Надежно изученный ареал — Полунаука
§ 3. География гаплогрупп — взгляд извне и изнутри: Восемь главных гаплогрупп — «Славянская» R1a убывает к северу — «Северо-евразийская» N3 убывает к югу — «Балканская» I1b опять к северу — Сюрпризы викингов (I1а) — Странности европейцев (R1b) — Средиземноморские мозаики (E3b, J2) — Уральская печать на русском генофонде (N2)
§ 4. Гетерогенность русского генофонда по Y хромосоме: Выше, чем по мтДНК — Выше, чем по классическим маркёрам — Выше, чем у большинства народов Европы — Гетерогенность европейских народов по классическим и новейшим маркёрам
§ 5. Русские популяции в географическом и в генетическом пространстве: Главный сценарий — Широтная изменчивость — От севера к югу — Север гетерогенен внутри себя
Всем известно, как весома
Для нас Игрек-хромосома:
Хоть мала и некрасива,
С нею вся мужская сила!
М. Н. Монахова[43]В самый разгар бума митохондриальных исследований, когда на изучении мтДНК сосредоточились усилия большинства популяционных генетиков, на сцену стремительно вышла другая генетическая система — Y хромосома. Хотя ей ещё не удалось потеснить мтДНК с позиций лидера, Y хромосома уверенно заняла место рядом с ней. Образовавшийся дуэт быстро стал принятым стандартом, и самым информативным сейчас считается одновременное изучение мтДНК и Y хромосомы, прочие маркёры считаются не столь важными.
Отнюдь не умаляя значения прочих ДНК маркёров (некоторые типы которых, например аутосомные SNP гаплотипы, могут занять лидирующее положение уже в ближайшие годы) нужно признать, что сейчас львиная доля популяционных исследований приходится на мтДНК и Y хромосому. Полиморфизм Y хромосомы изучен уже в нескольких сотнях популяций по всему миру, уровень её изученности постепенно приближается к той же степени подробности, что и мтДНК. Генотипирование Y хромосомы было стандартизовано в 2002, когда вышла статья с современной классификацией гаплогрупп [YCC, 2002]. Все нынешние исследования опираются на эту классификацию и постепенно уточняют её, в том числе путем внедрения новых маркёров.
В этом разделе рассматриваются предварительные результаты, полученные авторами при изучении полиморфизма Y хромосомы в русском ареале.
§ 1. Новейший маркёр в популяционной генетике
Ты помнишь, что было в начале?
Уже ты не помнишь, а жаль…
Из двух половинок печали
Сложилась большая печаль.
Владимир КрасногорскийФормально, с методических позиций обе «половинки» — отцовская Y хромосома и материнская мтДНК — это простые системы нерекомбинирующих маркёров. Именно на явлении полного сцепления маркёров, входящих в эти системы, основаны новые методы, ставшие знаменем «новой популяционной генетики». Её своеобразными методами являются расчёт возраста гаплогруппы по разнообразию её субвариантов и возможность определять последовательность возникновения гаплогрупп, воссоздавать «родословное древо» гаплогрупп и гаплотипов. Других нерекомбинирующих систем (кроме мтДНК и Y хромосомы) в геноме человека нет; точнее, они лишь «частично нерекомбинирующие» и поэтому проблематичнее для использования.
ДВЕ ПОЛОВИНКИ ПЕЧАЛИ
Такая «методическая» аргументация в пользу внедрения Y хромосомы в арсенал генетических маркёров, несомненно, убеждаёт. Вместе с тем, в годы быстрого внедрения Y хромосомы имел хождение и «романтический» аргумент: если мтДНК, наследующаяся по женской линии, маркирует историю «женской части популяции», то Y хромосома, наследующаяся по мужской линии, есть её естественное дополнение — вторая половинка, рассказывающая об истории «мужской части популяции». И обе системы вместе опишут весь генофонд популяции. И сейчас можно встретить веру в то, что митохондриальная ДНК описывает одну половинку генофонда, Y хромосома — другую, и из двух этих половинок можно сложить целый генофонд.
Этот романтизм оставил след в неуклюжей терминологии вроде «мужского генофонда» (Y хромосома присутствует только у мужчин). Однако, с точки зрения классической популяционной генетики, гендерное подразделение генофонда («по полу») выглядит спорным и грустным. Ведь мы изучаем не отдельные гены и не отдельных людей, а популяции человека, которые не могут быть «мужскими» или «женскими».
При этом широко известно, что обе системы — мтДНК и Y хромосомы — могут не «дополнять» друг друга, а смещать оценки параметров генофонда в одну и ту же сторону. Это ясно видно хотя бы из того, что обе системы являются гаплоидными и «однородительскими». Поэтому дрейф генов действует на них в четыре раза сильнее, чем на аутосомные маркёры. Соответственно изменяются и оценки ряда генетических параметров популяции — в первую очередь столь важного, как оценка гетерогенности генофонда. Это приводит к тому, что генофонд через призму мтДНК может искажаться примерно тем же образом, что и через призму Y хромосомы. И тогда совместное использование этих маркёров может послужить не их взаимной проверке, не взаимодополнению, а взаимному подтверждению искажённых (по сравнению с основной частью генофонда) оценок. Из этого уже «сложится большая печаль».
Видимо, самая безопасная стратегия — пользоваться самыми разными маркёрами и обдуманно компенсировать недостатки одних параллельным использованием других маркёров, лишенных этих конкретных недостатков. Это вселяет надежду сохранить объективность и независимость своих выводов.
ИЗУЧЕНИЕ Y ХРОМОСОМЫ
Популяционная изученность Y хромосомы уже сейчас приближается к уровню мтДНК. Но необходимо учитывать, что объёмы выборок по Y хромосоме, как правило, существенно меньше, поскольку изучается ДНК лишь мужчин. А они, если не прилагать специальных усилий, составляют обычно менее половины выборки. К тому же результаты первых работ (примерно до 2000 года) сейчас уже малопригодны, поскольку набор используемых для ге-нотипирования маркёров был слишком невелик. Так что сейчас Y хромосоме следует отвести второе место. Но потенциально её разрешающая способность (возможность выделять все более дробные гаплогруппы) намного выше, чем мтДНК, и это привлекает к Y хромосоме все большее внимание исследователей.
Генотипирование Y хромосомы состоит в определении, к какой гаплогруппе относится каждый образец ДНК. Доказательством принадлежности к гаплогруппе служит наличие специфического для данной гаплогруппы маркёра (или маркёров). Как правило, это SNP маркёры — замена одного из нуклеотидов Y хромосомы.
Поскольку классификация гаплогрупп представляет собой иерархическое, ветвящееся дерево, то становится особо важным, с каким разрешением проведено генотипирование: определена ли принадлежность образца к гаплогруппе, или к её определенному варианту, или же с точностью до субварианта и так далее.
SNP и STR — ЧАСОВАЯ И МИНУТНАЯ СТРЕЛКИ ЭВОЛЮЦИИ
Определение гаплогрупп Y хромосомы проводят по набору диаллельных маркёров (обычно SNP) — точно так же, как гаплогруппы мтДНК определяются диаллельными ПДРФ маркёрами в её кодирующей части («часовая стрелка»). Что же касается гипервариабельного сегмента мтДНК («минутная стрелка»), то и у Y хромосомы есть его аналог — набор микросателлитных локусов (STR). Подобно тому, как ГВС1 в мтДНК состоит из быстро (по сравнению с ПДРФ-маркёрами) мутирующих сайтов, так и микросаттелиты Y хромосомы мутируют намного быстрее SNP-маркёров: они соотносятся как минутная и часовая стрелки эволюции. И если в мтДНК каждая гаплогруппа, определенная по ПДРФ-маркёрам, вмещает в себя целый веер линий, выявленных по ГВС1, то и каждую SNP-гаплогруппу Y хромосомы можно подразделить на множество гаплотипов, определяемых по панели микросаттелитов.
Но при этом для мтДНК разрыв между ГВС1 и ПДРФ-маркёрами не так велик, как аналогичный разрыв между двумя типами маркёров Y хромосомы. Для мтДНК, хотя и не со стопроцентной вероятностью, но все же возможно определить гаплогруппу по мотиву в ГВС1. Для Y хромосомы корреляция между микросателллитным гаплотипом и SNP-гаплогруппой меньше, хотя её удаётся выявить [Rootsi et al., 2004]. В большинстве работ изучаются только SNP маркёры и соответственно распределение гаплогрупп Y хромосомы. Что же до микросаттелитных маркеров, то их анализируют реже — по минутной стрелке не определишь, который час. Ими пользуются для оценки возраста в пределах отдельных гаплогрупп и некоторых других видов анализа [Roewer et al., 2005].
§ 2. Изученные русские популяции
ЛИТЕРАТУРНЫЕ ДАННЫЕ
Как и большинство генетических маркёров, Y хромосома наиболее изучена в Европе. В том числе есть данные и по русским популяциям (табл. 6.З.1.). В работе [Wells et al., 2001] представлены северные русские (N=49; русские Архангельска, проживающие там не менее трёх поколений [Евсеева, личное сообщение]), поморы (N=28; студенты Архангельска, все предки которых происходят из поморских сел [Евсеева, личное сообщение]) и русские Ташкента (N=89). В статьях [Rosser et al., 2000] и [Karafet et al., 2002] представлены данные по русским «вообще» без указаний о географической привязке популяций (объёмы выборок N=122 и N=61, соответственно). Ни в этих статьях, где русские были лишь одним из многих изученных этносов, ни в других известных нам работах не предпринимались попытки изучить русский генофонд по маркёрам Y хромосомы[44]. Надо заметить, что и самих этих данных, как по их суммарному объему (N=349), так и особенно по географической приуроченности (фактически описаны лишь «русские-неизвестно-откуда» и «северные русские») для выявления структуры генофонда явно недостаточно.
НАШИ ДАННЫЕ
Независимо от перечисленных работ, мы целенаправленно провели анализ полиморфизма Y хромосомы в русских популяциях, изучив 1228 индивидов из 14 популяций (табл. 6.3.1). Наше экспедиционное обследование было спланировано так, чтобы охватить коренное русское население из многих географически различных регионов, но не выходя за пределы «исконного» ареала русского народа. Все дальнейшее изложение опирается только на полученные нами данные.
Таблица 6.3.1.
Русские популяции, изученные по частотам гаплогрупп Y хромосомы
Проблема «исконного» русского ареала рассматривалась в главах 4 и 5. Основными участниками и/или организаторами экспедиций, проведенных под общим руководством Е. В. Балановской в 2000–2005 гг., были О. П. Балановский, И. В. Евсеева, Э. А. По-чешхова, М.И. Чурносов. Также участвовали М. Н. Болдырева,
О. Бобрецова (северные популяции), И. Н. Лепендина, М. С. Жер-лицына, И. Н. Сорокина, В. Ю. Песик, Н. А. Рудых (южные популяции), А. С. Пшеничное (западные популяции).
Генотипирование маркёров Y хромосомы выполнено О. П. Балановским при участии С. Роотси на базе Эстонского биоцентра, возглавляемого Р. Виллемсом. Определены частоты гаплогрупп Y хромосомы на основе типирования SNP-маркёров.
Информация из опубликованных источников не используется, как говорилось, из-за неясной географии популяций, а для северно-русских выборок — из-за их небольших объёмов. Надо сказать, что 14 популяций — не так мало даже в сравнении с хорошо изученными классическими маркёрами (в среднем 35 русских популяций, но карты включались в анализ, если изученных популяций было хотя бы 10) или дерматоглификой (28 популяций). Благодаря наличию этих данных, Y хромосома становится одним из наиболее изученных ДНК маркёров для русских популяций. Для сравнения — по мтДНК надёжно изучено в два раза меньше популяций (7 популяций в «исконном» ареале).
Полученные данные уникальны — ни для одного другого народа мира пока нет столь обширных данных. На примере русского народа впервые можно увидеть, каковы могут быть различия «отцовских» генов между разными популяциями одного и того же народа.
География изученных русских популяций обширна (табл. 6.3.1). Еще лучше, чем из таблицы, это видно на карте. Четырнадцать изученных популяций отмечены темными кружками на всех картах (рис. 6.3.1.-6.3.9).
Возникает вопрос, весь ли «исконный» русский ареал мы изучили, обследовав эти популяции? Ответ можно получить, воспользовавшись методом карт надёжности, подробно описанном в Приложении. Такая карта надёжности для наших 14 популяций представлена на рис. 6.3.1. Эта карта показывает, какие территории могут считаться охваченными генетическим изучением. Те территории, которые расположены далеко от изученных популяций, представлены как зоны недостоверного прогноза — по нашим данным мы не можем надёжно прогнозировать частоты гаплогрупп на этих территориях. Например, среди изученных популяций нет ни одной из Волго-Окского междуречья. Но наличие данных по окружающим регионам (Тверская, Костромская, Орловская области) делает интерполяцию на междуречье достаточно надёжной. Однако на северо-западе (Ленинградская и запад Архангельской областей), как показывает карта надёжности, данных не достаёт: для этой территории мы не можем дать надёжного прогноза.
Рис. 6.3.1. Карта надёжности картографического прогноза для русских популяций, изученных по гаплогруппам Y хромосомы [Balanovsky et al., 2008]
Обозначения популяций: 1 — Мезень; 2 — Пинега; 3 — Красноборск; 4 — Вологда; 5 — Кострома; 6 — Тверь; 7 — Псков 2; 8 — Псков 1; 9 — Смоленск; 10 — Орёл; 11 — Курск; 12 — Воронеж; 13 — Белгород; 14 — кубанские казаки.
НАДЁЖНЫЙ АРЕАЛ
Картографирование частот гаплогрупп (карты на рис. 6.3.2.-6.3.9) проведено лишь для территории, надёжно обеспеченной исходными данными (надёжная область на рис. 6.3.1). Поэтому северо-западные части «исконного» русского ареала остались в некартируе-мой области. Напротив, на юге в картируемую область вошла популяция кубанских казаков, которая, строго говоря, находится за пределами «исконного» ареала. За этими исключениями, область, в которой картографирована изменчивость Y хромосомы, примерно соответствует ареалу, в пределах которого анализировались и антропологические признаки, и классические маркёры, и фамилии (карты в главах 4, 5, 7).
ВЫДУМКИ ЖУРНАЛИСТОВ
К сожалению, эта карта ещё до выхода нашей книги появилась в журнале «КоммерсантЪ Власть», где была истолкована в прямо противоположном смысле: будто бы чисто техническая карта надёжности, просто заданная расположением наших изученных популяций, определяет ареал русского народа [КоммерсантЪ Власть, 2005; № 38]. Это было бы смешно, если бы мы могли посмеяться вместе с читателями. Нам же пришлось на это и другие столь явно ошибочные утверждения давать опровержения [см. на сайте ]. Ведь так очевидно, что границы русского ареала могут очертить только гуманитарные науки, а генетика может лишь послушно планировать свои исследования в очерченных ими географических рамках.
Но уже не смешно, а опасно, когда простому планированию полевых исследований, по произволу журналистов, придаётся сила научного свидетельства об историческом ареале народа. Это и есть «…полунаука, самый страшный бич человечества, хуже мора, голода и войны, не известный до нынешнего столетия. Полунаука — это деспот, каких ещё не приходило до сих пор никогда. Деспот, имеющий своих жрецов и рабов, деспот, пред которым все склонилось с любовью и суеверием, до сих пор немыслимым, пред которым трепещет даже сама наука и постыдно потакает ему» [Ф. М. Достоевский. «Бесы»].
Поэтому, чтобы не потакать геополитическим спекуляциям, нам пришлось «обрезать» надёжно изученный ареал русского народа по современной политической границе России (рис. 6.3.1).
§ 3. География гаплогрупп: взгляд извне и изнутри
В этом параграфе мы осмотрим генетический портрет русского народа на фоне Европы. Знание того, как гаплогруппы Y хромосомы распространены в глобальном масштабе, помогает понять, что означает их присутствие (или отсутствие) у русских. Это взгляд на русский генофонд извне. А различия в частотах гаплогрупп между самими русскими популяциями выявляют внутреннюю структуру русского генофонда — это мы назовём взглядом изнутри. Оба взгляда мы будем бросать на одни и те же карты (рис. 6.3.2.-6.3.9). Сначала на карте мы будем рассматривать общеевропейскую закономерность в распространении гаплогруппы, а потом её изменчивость внутри «надёжного» русского ареала (оконтурен серой линией на всех картах). Исходные данные для «европейского» картографирования описаны в Приложении (раздел 5).
Известно, что гаплогруппы Y хромосомы географически специфичны, причём в намного большей степени, чем аутосомные маркёры и мтДНК. Многие гаплогруппы Y хромосомы имеют конкретные, чёткие ареалы. Если гаплогруппы мтДНК называют «континент-специфичными», то гаплогруппы Y хромосомы часто приурочены к более дробным географическим регионам. Поэтому именно Y хромосома многообещающа для изучения изменчивости внутри этноса, для выявления различий между близкими популяциями, которые неотличимы по другим маркёрам.
Многие гаплогруппы, обнаруженные в коренных русских популяциях, редки и не удовлетворяют 1 % критерию полиморфизма: лишь восемь гаплогрупп встречаются со средней частотой выше 1 % (табл. 6.3.2). Но сумма частот этих восьми гаплогрупп составляет 95 %, что даёт нам право во всех видах анализа учитывать лишь эти гаплогруппы, опуская прочие редкие варианты. Рассмотрим географию этих восьми гаплогрупп.
Таблица 6.3.2.
Частоты гаплогрупп Y хромосомы в русском генофонде (в среднем по 14 популяциям, lz28 человек)
Примечание: указаны гаплогруппы, удовлетворяющие критерию полиморфизма (средняя частота q>0.01).
ГАПЛОГРУППА R1a (рис. 6.3.2.)
Для русских популяций эта гаплогруппа самая частая — она встречается почти у каждого второго (табл. 6.3.2).
ИЗВНЕ. В глобальном масштабе основной ареал этой гаплогруппы — Восточная Европа, хотя она также встречается в Западной Европе, Южной Сибири и Индостане. «Европейская» карта (рис. 6.3.2) показывает приуроченность этой гаплогруппы к ареалам западных и восточных славян, а также балтов. Можно было бы сказать, что в Европе эта гаплогруппа чётко приурочена к балто-славянской языковой общности, если бы её частота не была резко снижена у южных славян.
ИЗНУТРИ. В пределах изученного русского ареала (область, оконтуренная на карте серой линией) видны различия между большей западной и меньшей северо-восточной частями генофонда. На западе и юге частота R1a превышает 50 % и лишь местами снижается до 40 %. На северо-востоке (за Волгой и в бассейнах Вет-луги, Сухоны, Вычегды) частота R1a ниже 40 %. И лишь на самом севере (на Мезени) вновь возрастает. Вернувшись к западной зоне высоких частот, мы увидим, что с юга её ограничивает некоторое снижение частоты у украинцев. При этом в белорусских популяциях частота R1a столь же велика, как в западных русских популяциях. Пока остаётся открытым вопрос о том, является ли гаплогруппа R1a маркёром расселения восточных славян, а её сниженная частота, соответственно, свидетельством мощного финно-угорского пласта на северо-востоке русского ареала.
Рис. 6.3.2. Карта распространения гаплогруппы R1a в Европе и в русском ареале [Balanovsky et al., 2008]
Обозначения: К — число изученных популяций; N — число узлов сетки; MIN, MEAN, МАХ — соответственно, минимальная, средняя, максимальная частота.
ГАПЛОГРУППА N3 (оис. 6.3.3.)
Эта вторая по частоте гаплогруппа в русском генофонде, вбирает в себя пятую часть (19 %) фонда Y хромосом.
ИЗВНЕ. Основной ареал N3 — Сибирь (до 90 % в отдельных популяциях) и Восточная Европа. Как бы ни решился вопрос о прародине этой гаплогруппы, её заметная частота у русских показывает некую долю общности между русским генофондом и коренным населением Северной Азии. Такая общность по маркёрам Y хромосомы неожиданна, поскольку по другим системам признаков генофонды Восточной Европы и Сибири резко различны (см., например, главу 9). Любопытно, что балтоязычные популяции (латыши и литовцы), которые по R1a решительно объединялись со славянами, по гаплогруппе N3 ещё более решительно от них отмежёвываются. Карта показывает резкий перепад частот (более чем на 20 %!) примерно по границе балтов и славян: с одной стороны Латвии и Литвы, и с другой — стран с преобладанием славяноязычных популяций (России, Белоруссии и Польши).
ИЗНУТРИ. В пределах русского ареала для N3 вновь обнаруживается картина широтной изменчивости, как и для R1a. Мы опять видим на карте две области. Только их значения обратные предыдущей карте: высокие частоты на севере, низкие — на юге. Удивителен довольно резкий перепад в частотах N3 между севером и югом и строго широтная граница между зонами высоких и низких частот. Данные по смежным народам подтверждают, что N3 приурочена к северной половине Восточной Европы. Русский генофонд тем самым полностью подчиняется восточноевропейской закономерности о концентрации N3 к северу от 57 параллели. И снова, учитывая редкость N3 у белорусов и украинцев, можно обсуждать толщину финно-угорского пласта в русском генофонде и его залегание преимущественно на севере.
ГАПЛОГРУППЫ I1а и I1b (рис. 6.3.4. и 6.3.5.)
Эти две сестринские гаплогруппы можно назвать, ориентируясь на зоны их максимальных частот, Скандинавской и Балканской гаплогруппами. Их распространение в русском ареале может помочь нам обнаружить связи русского населения с этими двумя регионами.
ИЗВНЕ. Частота I1а максимальна в Скандинавии, и постепенно снижается к югу. Напротив, I1b распространена главным образом на Балканах, и её частота постепенно снижается к северу. Вся центральная полоса Европы оказывается зоной интерференции этих гаплогрупп. У русских преобладает «балканская» гаплогруппа, хотя частота «нордического» варианта также существенна. Соотношение I1а:I1b составляет 1:2. При этом у белорусов и украинцев «нордическая» гаплогруппа, по сравнению с «балканской», практически незаметна. Соотношение I1а:I1b составляет 1:5 для украинцев и 1:15 для белорусов [Пшеничное, Атраментова, Ищук, Чурносов, Тегако, Виллеме, Балановская, неопубл. данные]. Для украинцев естественна близость с географически соседним населением Балкан.
Рис. 6.3.3. Карта распространения гаплогруппы N3 в Европе и в русском ареале [Balanovsky et al., 2008].
Рис. 6.3.4. Карта распространения гаплогруппы Нb в Европе и в русском ареале [Balanovsky et al., 2008].
ИЗНУТРИ. Внутри русского ареала распространение «Балканской» гаплогруппы I1b (рис. 6.3.4.) закономерно: частота плавно падает с юга (>13 %) на север (0 %). То есть, тренд I1b снова широтный. Но только изменение частоты I1b не резкое, как для N3, а постепенное. Мы видим, что тренд, обнаруженный в русском генофонде, полностью встраивается в более общий, панъевропейский тренд распространения гаплогруппы I1b.
Но её сестринская гаплогруппа уже не подчиняется европейской закономерности. Генетический рельеф «Скандинавской» гаплогруппы I1a (рис. 6.3.5.) в русском ареале оказывается неожиданным. Казалось бы, высокие значения I1а должны быть вблизи Скандинавии, на северо-западе русского ареала. Там, а также по западной границе можно ожидать «варяжское» влияние в виде повышенных частот I1а. Однако компактный локальный максимум I1а (11–12 %) вырисовывается совсем в другой области, на северо-востоке. Это ядро ясно выделяется на фоне окружающих низких частот (менее 6 %), свойственных всему остальному русскому ареалу. Реальность этого ядра повышенных значений опирается на данные по трём русским популяциям, изученным по обширным выборкам. Конечно, по сравнению с частотами в Скандинавии (25–40 %) этот локальный максимум второстепенен. Но его удаленность от основной зоны высоких частот гаплогруппы в Скандинавии требует объяснений. Трудно предположить тесные связи Скандинавии именно с Заволжьем и бассейном Вычегды, помимо прочих русских территорий. Видимо, популяционная история гаплогруппы
I1a сложнее, чем простая экспансия из Скандинавии, и, возможно, включает древние связи между финно-угорскими племенами Восточной Европы и предками германоязычных скандинавов.
Рис. 6.3.5. Карта распространения гаплогруппы I1a в Европе и в русском ареале [Balanovsky et al., 2008]
ГАПЛОГРУППА R1b (рис. 6.3.6.)
ИЗВНЕ. R1b свойственна населению Западной Европы, что ярко выявляется на карте. Присутствие гаплогруппы у русских выражено в той же небольшой степени, что и в целом для популяций Восточной Европы (например, 6 % у украинцев и 3 % у белорусов).
ИЗНУТРИ. В русском ареале R1b встречается с частотой от нуля до 13 %, в среднем составляя 6 %. В отличие от предыдущих гаплогрупп, в её распределении по русскому ареалу чёткой географической закономерности нет. Для большинства популяций характерны средние частоты. Повышенные частоты отмечены в трёх популяциях на востоке, пониженные — в одной на северо-востоке. Учитывая, что основная зона R1b — Западная Европа, неожиданно, что её частота в русском ареале возрастает скорее к востоку, чем к западу. Впрочем, эта слабая тенденция может быть случайной. Тем не менее, она подчёркивает отсутствие заметных влияний на русский генофонд из Западной Европы, которые должны были бы выразиться на карте в клинальной изменчивости частоты «западноевропейской» гаплогруппы.
Рис. 6.3.6. Карта распространения гаплогруппы R1b в Европе и в русском ареале [Balanovsky et al., 2008]
ГАПЛОГРУППА E3b (рис. 6.3.7.)
ИЗВНЕ. E3b характерна для Северной Африки (до 80 %) и Средиземноморья в его самом широком понимании. В Европе наибольшие частоты отмечены на Балканах (10–20 %) [Semino et al., 2004]. До русского ареала доходит лишь «затуханье сахарской волны» (Н. Гумилев).
ИЗНУТРИ. Внутри русского ареала генетический ландшафт состоит в повышении частоты в центральной полосе и снижении к северу и к югу (подобные ландшафты мы уже не раз встречали среди самых разных признаков — генетики, фамилий, антропологии). Такой паттерн лишь отчасти согласуется с европейским трендом для этой гаплогруппы (снижение к северу).
Рис. 6.3.7. Карта распространения гаплогруппы ЕЗb в Европе и в русском ареале [Balanovsky et al., CQh 2008] E-OU
ГАПЛОГРУППА J2 (рис. 6.3.8.)
ИЗВНЕ. J2 преобладаёт на Ближнем Востоке и на Кавказе [Wells et al., 2001; Semino et al., 2000]. В русском генофонде она могла появиться не только со стороны Кавказа, но и Южной Европы (включая Балканы), где J2 также нередка [Semino et al., 2004]. В Европейском масштабе J2 следует тому же генетическом рельефу, что E3b: максимум в Средиземноморье и снижение к северу.
ИЗНУТРИ. Но «русский» ландшафт гаплогруппы J2 (рис. 6.3.8.) оказывается гомогенным в пятипроцентной шкале карты. Когда карта была перестроена в более дробной шкале, выявился ряд ядер повышенных частот на востоке, средние частоты на юге и отсутствие гаплогруппы на севере. Но средний объём наших выборок приближается к 100 образцам на популяцию. При таких выборках доверительный интервал для частоты 2 % приближается к наблюдаемому размаху её изменчивости. Это лишает основательности долгие рассуждения, поскольку тренды становятся неотличимы от случайных шероховатостей рельефа. Для анализа географии таких редких признаков нужно особое везение: наличие очень чёткого тренда, очень большие выборки или обилие изученных популяций.
Рис. 6.3.8. Карта распространения гаплогруппы J2 в Европе и в русском ареале [Balanovsky et al., 2008] w
ГАПЛОГРУППА N2 (рис. 6.3.9.)
ИЗНУТРИ. Гаплогруппа N2 как раз характеризуется очень чётким трендом. Хотя её средняя частота столь же невелика, как для E3b и J2, её распространение географически чётко приурочено. Гаплогруппа N2 встречена только на Русском Севере, в трёх популяциях Архангельской области.
ИЗВНЕ. Учитывая, что, основной ареал N2 — угорские народы Западной Сибири, а в Европе она встречается только среди волго-финских народов, финно-угорский отпечаток на генофонде Русского Севера виден по N2 рельефнее, чем по любому другому маркёру.
Рис. 6.3.9. Карта распространения гаплогруппы N2 в Европе и в русском ареале [Balanovsky et al., 2008]
ИТОГИ
ИЗВНЕ. Итак, по спектру гаплогрупп Y хромосомы и их средним частотам русский генофонд укладывается в более крупный регион Восточной Европы (доминирование восточноевропейских гаплогрупп R1a и N3). Видны связи практически со всеми смежными регионами: Западной Европой (наличие R1b), Скандинавией (I1а), Балканами (I1b, J2, E3b), Западной Сибирью/Уралом (N2). Лишь связь с Кавказом выявляется слабо, поскольку гаплогруппа G (наиболее частая у северокавказских народов), практически не встречается у русских и лишь чуть более часта у украинцев.
ИЗНУТРИ. Однако при таком видении русский генофонд выступает лишь точкой, которую мы сравниваем с другими точками — соседними регионами. Поэтому мы рассматривали не только средние показатели, но и карты распространения этих гаплогрупп в русском ареале. Это позволило увидеть внутреннюю гетерогенность русской «точки», занимающей большую часть Восточной Европы с десятками миллионов обитателей. По трём самым частым гаплогруппам (R1a, N3, I1b), а также для редкой N2 в русском ареале обнаружилась широтная изменчивость, согласующаяся с общеевропейскими трендами этих гаплогрупп. Распространение в русском ареале умеренно частых гаплогрупп R1b и На носит сложный характер и не согласуется с европейскими закономерностями. Наконец, редкие для русских гаплогруппы J2 и E3b распределены в русском ареале мозаично.
§ 4. Гетерогенность русского генофонда по Y хромосоме
ТРИ МЕТОДА ОБОБЩЁННОГО АНАЛИЗА
В предыдущем разделе мы воспользовались уникальным свойством Y хромосомы — высокой географической специфичностью её гаплогрупп, их приуроченностью к конкретным территориям. Это позволило выявить связи разных частей русского генофонда с соседними группами народонаселения.
Однако каждая из гаплогрупп рисует свой эскиз портрета генофонда, видит только одну из множества его проекций, отражается в одной из граней кристалла. Чтобы выявить наиболее общие черты портрета генофонда, присутствующие подспудно в каждом эскизе, надо перейти к обобщённому анализу изменчивости Y хромосомы. Для этого мы применим обычный арсенал методов, который широко использовался и в предыдущих главах. Сначала (§ 4) количественно определим гетерогенность русского генофонда — величину межпопуляционных различий. И так же, как мы это делали для классических маркёров (глава 5), оценим гетерогенность по шкале «много» — «мало». Затем в § 5 рассмотрим карты главных компонент изменчивости по маркёрам Y хромосомы точно так же, как по признакам антропологии (глава 4) и классическим маркёрам (глава 5). И в заключение, оценим взаимное расположение русских популяций на графике многомерного шкалирования — так, как мы уже рассмотрели аналогичный график для мтДНК.
ГЕТЕРОГЕННОСТЬ Y ХРОМОСОМЫ. мтДНК И АУТОСОМНЫХ МАРКЕРОВ
Чтобы оценить размах межпопуляционных различий по Y хромосоме, для неё так же, как и для мтДНК (см. 6.2. § 3), была рассчитана матрица генетических расстояний М. Нея между 14 русскими популяциями. Ни для одного другого народа мира ещё не проводилось количественное измерение внутриэтнической изменчивости Y хромосомы в сравнении с изменчивостью других народов.
Средние генетические расстояния по гаплогруппам Y хромосомы составили d=0.142. Этот показатель оценивает гетерогенность генофонда, его внутриэтни-ческую изменчивость.
Различия между русскими популяциями по частотам гаплогрупп Y хромосомы (d=0.142) оказались в четыре раза больше, чем по мтДНК (d=0.033, см .раздел 6.2.).
ПАТРИЛОКАЛЬНОСТЬ. Это ожидаемый результат, поскольку во многих работах (на уровне межэтнических сравнений) показано, что изменчивость Y хромосомы намного более выражена, чем мтДНК [Seielstad et al., 1998; Rosser et al., 2000; Semino et al., 2000]. Это явление нередко связывают с патрилокальностью браков (т. е. переездом жены на родину мужа — при этом отцовские гены остаются на родине отца), тогда как при матрилокальности изменчивость Y хромосомы (отцовские гены «мигрируют» на родину матери), напротив, становится меньше, чем по мтДНК [Oota et al., 2001; Hamilton et al., 2005; Destro-Bisol et al., 2004]. Па-трилокальность, характерная для большинства народов, приводит к тому, что гены, наследующиеся по мужской линии, из поколения в поколение остаются в том же месте, тогда как мтДНК благодаря брачным миграциям интенсивно перемещается вместе с женщинами с их родины на родину мужа.
Рассмотрим теперь гетерогенность русского народа по аутосомным маркёрам (классическим). При расчёте тем же методом средних генетических расстояний она составила d=0.013.
Используя строго одну и ту же меру гетерогенности, можно смело утверждать, что различия между русскими популяциями по Y хромосоме (d=0.142) намного выше (рис. 6.3.10.), чем по мтДНК (d=0.033) и по классическим маркёрам (d=0.013). Можно рассудить, что если различия выявляются легче, то Y хромосома — удобная система для изучения структуры генофонда.
Рис. 6.3.10. Гетерогенность русского генофонда по данным о классических маркёрах, мтДНК и Y хромосоме.
Примечание: Средние генетические расстояния между всеми русскими популяциями по трём типам маркёров.
СРАВНЕНИЕ С ДРУГИМИ НАРОДАМИ
Итак, изменчивость русских популяций по Y хромосоме на порядок выше, чем по аутосомным маркёрам. Но надо ещё ответить на вопрос: велика или мала гетерогенность русского народа по Y хромосоме в сравнении с другими народами?
Полученная оценка гетерогенности (d=0.142) характеризует межпопуляционные, но вну/ирмэтнические различия: различия между русскими популяциями (то есть между популяциями внутри этноса). Ряд исследований показал, что изменчивость по Y хромосоме действительно велика, но почти все эти работы описывают только межэтническую изменчивость — различия между народами, а не внутри их.
Поэтому мы провели анализ внутриэтнической изменчивости в Европе (табл. 6.3.3.), обобщив опубликованные данные.
Таблица 6.3.3.
Гетерогенность народов Европы по гаплогруппам Y хромосомы
В анализ включены только народы, изученные по четырём и более популяциям с объёмом выборок более 70 человек в каждой популяции. Чтобы удовлетворить этому условию, популяции с небольшими объёмами выборок объединялись с соседями. (Для русских были объединены популяции «Пинега» и «Мезень», «Псков 1» и «Псков 2», «Тверь» и «Кострома», «Курск» и «Орел».)
Гетерогенность русского генофонда занимает третье место в ряду одиннадцати изученных народов Европы (табл. 6.3.3). Конечно, «места», занимаемые генофондами по степени их гетерогенности, могут измениться по мере изучения других народов Европы (и более подробного изучения тех же самых народов). Но уже сейчас можно сделать общий вывод, что по данным об Y хромосоме русский генофонд оказывается одним из наиболее гетерогенных этнических генофондов в Европе.
ГЕТЕРОГЕННОСТЬ НАРОДОВ ЕВРОПЫ: ДВА ТИПА МАРКЕРОВ
Таблица 6.3.3., суммирующая данные о гетерогенности по Y хромосоме, аналогична таблице 5.3.1., где гетерогенность рассчитана по классическим маркёрам. Для сопоставимости этих таблиц мы рассчитали гетерогенность Y хромосомы не только как средние расстояния, но и через близкородственную статистику — более «помехоустойчивую» величину GST Сравнение этих таблиц позволяет сделать три вывода:
1. Изученность Y хромосомы на внутриэтническом уровне пока оставляет желать лучшего — накоплены данные лишь о 11 народах, изученных в среднем по шести популяциям, а по классическим маркёрам проанализированы данные о 31 народе Европы, и эти народы изучены в среднем по 14 популяциям.
2. Гетерогенность народов по Y хромосоме оказывается почти в четыре раза выше, чем по классическим маркёрам. В среднем по Европе внутриэтническая изменчивость Y хромосомы составляет 3.3 (как следует из данных таблицы 6.3.3), тогда так по классическим маркёрам она составляет 0.9 (расчёт по данным таблицы 5.3.1., для сопоставимости из этой таблицы мы учитываем только европейские народы).
3. Несмотря на разницу в абсолютных величинах внутриэтнической изменчивости, её относительная величина у разных народов похожа по обоим типам маркёров. Например, гетерогенность русских и итальянцев высока и по Y хромосоме, и по классическим маркёрам, а гетерогенность поляков занимает одно из последних мест как по Y хромосоме (GST=1.1), так и по классическим маркёрам (GST=0.3).
Отметим также, что по Y хромосоме (табл. 6.3.3) изменчивость популяций в пределах одного народа, хотя и велика, но значительно (в пять раз!) меньше, чем изменчивость среднеэтнических частот гаплогрупп между рассмотренными народами Европы. Это означает, что «дифференцирующая мощность» гаплогрупп Y хромосомы с увеличением географических дистанций только растет!
ЧТО ЛУЧШЕ — ГЕНЕТИЧЕСКИЕ РАССТОЯНИЯ ИЛИ GST? Гетерогенность каждого народа мы оценили двумя мерами: как средние генетические расстояния между каждой парой популяций и как межпопуляционная изменчивость GST Хотя по абсолютной величине генетические расстояния в среднем оказываются в три раза выше, чем GST, но относительные величины обеих мер хорошо согласуются друг с другом. Кажущееся расхождение в случае турок вызвано необычно высоким уровнем филогенетического разрешения, с которым изучен этот народ (генотипирование проводилось на 26 гаплогрупп, тогда как для остальных народов — только на 8-12 гаплогрупп). Если же привести данные по туркам к общему уровню (8 гацлогрупп), то средние генетические расстояний уменьшаются с 16.5 до 3.5, а величина GST оказывается более устойчивой к изменению уровня филогенетического разрешения, сокращаясь с 1.3. только до 0.8. Более привычные молекулярным генетикам показатели AMOVA очень близки к GST и мы их здесь не приводим.
§ 5. Русские популяции в географическом и в генетическом пространстве
Мы определили величину гетерогенности русского генофонда по маркёрам Y хромосомы. Теперь рассмотрим, как эта межпопуляционная изменчивость реализована в географическом пространстве (карты главных компонент) и в генетическом пространстве (график многомерного шкалирования).
Рис. 6.3.11. Карта первой главной компоненты изменчивости Y хромосомы в русских популяциях [Balanovsky et al., 2008].
РУССКИЕ ПОПУЛЯЦИИ в ГЕОГРАФИЧЕСКОМ ПРОСТРАНСТВЕ
Карты главных компонент изменчивости Y хромосомы рассчитаны по тем же восьми картам, которые рассматривались в предыдущих разделах, и обобщают изменчивость этих восьми гаплогрупп. Карты главных компонент построены по той же технологии, что и карты главных компонент по классическим маркёрам, дерматоглифике и фамилиям (главы 5. 4, 7). Конечно, объём данных (число популяций и число гаплогрупп) по Y хромосоме меньше, чем по этим системам признаков, но всё же достаточен для проведения компонентного анализа.
ПЕРВЫЙ СЦЕНАРИЙ. Карта первой главной компоненты (рис. 6.3.11.) выявляет ландшафт широтной изменчивости русского генофонда. Эта картина уже знакома нам по данным соматологии, дерматоглифики и классическим генным маркёрам. Значения компоненты плавно изменяются от южных русских популяций к северным. Это означает, что таково основное направление генетических различий по маркёрам Y хромосомы — компонента описывает 40 % общей изменчивости. Первая главная компонента высоко коррелирует с шестью из восьми гаплогрупп (табл. 6.3.4.). Это говорит о том, что широтная изменчивость — действительно «повсеместный» тренд для системы Y хромосомы.
Сходство этого тренда с аналогичными трендами по другим системам признаков очевидно (рис. 4.4.3., 4.4.4., 5.3.2). Полиморфизм Y хромосомы в русских популяциях подчиняется той же господствующей тенденции широтной изменчивости, что и (прочие системы маркёров. Надо отметить, что преобладание широтной изменчивости выявляется именно обобщённой картой. На картах отдельных гаплогрупп четкая широтная картина видна лишь дважды (для R1a картина не полностью широтная), а на остальных картах столь явно не проявляется. Использование компонентного анализа позволяет сделать этот завуалированный тренд очевидным.
ВТОРОЙ СЦЕНАРИЙ. Второе по значимости направление изменчивости рисует довольно сложную картину: три ядра положительных значений на юге, северо-западе и севере, и ядро отрицательных значений на востоке. Подобные «четырёх-ядерные» ландшафты характерны для третьих компонент генофонда Восточной Европы (см. главу 8). Карту мы не приводим, так как важность этой компоненты невелика. Она описывает четвертую часть (26 %) общей изменчивости всех восьми гаплогрупп, то есть её значимость лишь в два раза выше каждой из исходных карт отдельных гаплогрупп.
Таблица 6.3.4.
Гаплогруппы Y хромосомы, корреляция которых с картами 1, 2 или 3 главных компонент превышает 0.4 (г>0.4)
Примечание: коэффициенты корреляции указаны по модулю.
РУССКИЕ ПОПУЛЯЦИИ В ГЕНЕТИЧЕСКОМ ПРОСТРАНСТВЕ
График многомерного шкалирования (рис. 6.3.12.) показывает относительное сходство всех 14 популяций друг с другом по частотам гаплогрупп Y хромосомы. (Этот график построен точно так же, как и график по гаплогруппам мтДНК, рассмотренный в § 3 раздела 6.2.). В нижней части графика виден плотный кластер из восьми популяций, тогда как остальные шесть популяций разбросаны далеко друг от друга в верхней части графика. Важно то, что все популяции, образовавшие компактный кластер, происходят из южной и центральной части русского ареала. И наоборот, все северные популяции генетически удалены друг от друга, занимая разные углы верхней половины графика.
Характерно, что в нижней половине графика (рис. 6.3.12.) оказались те популяции, которые на карте первой главной компоненты (рис. 6.3.11.) входят в зону положительных значений, а популяции, которые на карте обладают отрицательными значениями компоненты, на графике отошли в его верхнюю часть. На графике своеобразен северо-запад — одна из псковских популяций примыкает к южному кластеру, тогда как вторая вошла в «северную» зону.
Рис. 6.3.12. График многомерного шкалирования русских популяций по гаплогруппам Y хромосомы [Balanovsky et al., 2008].
Основная закономерность, видимая на графике, состоит в том, что на юге сходство популяций намного больше, чем на севере ареала.
ИТОГИ
Из такого чёткого соответствия между географией популяций и генетическими расстояниями между ними можно сделать два вывода.
Во-первых, мы вновь убедились в значимости различий между севером и югом русского ареала.
Во-вторых, на севере различия между популяциями намного выше. Центральные и южные русские популяции в сравнении с Русским Севером кажутся близнецами.
6.4. ПОРТРЕТ ГЕНОФОНДА ПО ДНК МАРКЁРАМ
Портрет при нехватке пикселей — Гетерогенность — Широтность — Неповторимость — Многосоставность — Гаплотипы мтДНК — Сциллы, Харибды, Прокрусты… — Финно-угорский субстрат — Гаплогруппы Y хромосомы — Удивительная чёткость их географии — Опять финно-угры — Сходство портретов: кисти Классика и кисти Игрека — Итоги прошлого — Фундамент будущего
В этой главе мы постарались рассмотреть и обобщить все полученные к настоящему времени данные по ДНК полиморфизму в русских популяциях. Данных накопилось не то чтобы мало, скорее они бессистемны. Нам пришлось оставить за бортом всё то множество «одиноких» ДНК маркёров, которые изучены только в одной-двух русских популяциях. Ведь для выявления структуры генофонда русского народа нужны знания не о фрагментах, а о репрезентативном ряде его регионов.
ОСОБЕННОСТИ ГЛАВЫ О ДНК МАРКЁРАХ
Кроме важности самого предмета (ДНК полиморфизма) и ограниченного материала (объёма исходных данных), у этой главы есть и ещё одна особенность. Если в прочих главах мы анализируем те исходные данные, которые получены в разное время многими другими исследователями, то данные по ДНК полиморфизму в большинстве наши собственные — нашего коллектива и совместных работ с коллегами из других институтов, проведённых в рамках единого плана. Поскольку общий объём ДНК данных по русским популяциям невелик, это и позволило одному коллективу внести заметный вклад в общую копилку. Это вызывает у нас и больший интерес к ДНК данным, прочувствованным кончиками пальцев (а в экспедиционной части — и на своей шкуре), и большую уверенность в их интерпретации. Ведь экспедиция в каждую популяцию планировалась, исходя из этногенеза русского народа. Но главное — мы можем быть уверены в сопоставимости результатов, поскольку все популяции обследовались единым коллективом и по единой программе.
Повторимся, что для анализа генофонда годятся лишь маркёры, изученные во многих популяциях. Поэтому из аутосомных маркёров (первый раздел этой главы) мы рассмотрели лишь один, но наиболее подробно изученный — CCR5del32. Остальные разделы главы посвящены митохондриальной ДНК и Y хромосоме — системам, ставшим за последние 10 лет стандартом международных популяционных исследований. Но и по ним объём данных невелик. В науке накопились данные о 16 русских популяциях по мтДНК и 19 популяций по Y хромосоме[45]. Но из них только 10 популяций по мтДНК и 14 по Y хромосоме подходят для анализа структуры генофонда. Для сравнения — по антропологической программе изучена 181 популяция, дерматоглифической — 28, по классическим маркёрам в среднем 35, по фамилиям — 839 популяций. То есть ДНК маркёры, давая нам, по всей видимости, самую прямую информацию о генофонде, могут дать её лишь по немногим русским популяциям. И если по остальным маркёрам мы получаем изображение генофонда, составленное из десятков и сотен «пикселей», то для ДНК маркёров мы должны домысливать портрет генофонда по наброскам, составленным всего из десятка точек. Но поскольку во всех современных работах изучается именно ДНК полиморфизм, то в скором будущем можно ожидать значительного увеличения массива данных. Тогда станет ясно, насколько верны наши наброски генетических рельефов отдельных гаплогрупп. Утешает более высокая изменчивость мтДНК и тем более Y хромосомы (рис. 6.3.10.) — это вселяет надежду, что большая дифференцирующая способность самих маркёров отчасти компенсирует нехватку популяций.
Что же касается «обобщённого портрета» генофонда, то в его правдивости уже сейчас можно быть уверенным: главный сценарий изменчивости по ДНК маркёрам подтверждён независимыми свидетелями — главными сценариями антропологических данных и классических маркёров генетики, завершающими две предыдущие главы (4 и 5).
В том и состоит задача нашей книги, чтобы подытожить сведения о русском генофонде, собранные по антропологическим признакам и классическим маркёрам, и сравнить их с имеющимися уже сейчас данными по ДНК полиморфизму. Анализ каждого их этих столь разных типов маркёров (к тому же изученных в разных популяциях) проводится одними и теми же методами, что даёт реальную возможность их сравнения. Скорее всего, массивы данных по антропологическим и классическим маркёрам уже не будут значительно увеличиваться. Тем важнее научиться извлекать из них основную информацию о русском генофонде. Это позволит строить новые исследования ДНК полиморфизма не на песке расхожих мнений, а на каменном фундаменте, заложенном предыдущими научными исследованиями.
КАРКАС ГЕНОФОНДА
Основной вывод состоит в сходстве результатов, полученных по антропологическим признакам (и соматологии, и дерматоглифики), классическим маркёрам и ДНК маркёрам. Сходство показаний стольких (и столь разных!) очевидцев говорит о том, что для изучения основных черт генофонда, основных событий в истории популяций, основных географических закономерностей, основных взаимосвязей между демографией, географией, генетикой и историей населения можно пользоваться каждым из этих типов маркёров. Но самый верный путь — использовать все эти маркёры совместно. Взаимный контроль позволяет исключить влияние той субъективности, которую неизбежно вносит любой очевидец даже куда более простых событий, чем история русского генофонда.
Вкратце, эти основные результаты по русскому генофонду, полученные по всем системам признаков, можно свести к нескольким положениям.
1. РУССКИЙ ГЕНОФОНД ГЕТЕРОГЕНЕН: популяции из разных его частей значительно различаются между собой. Это «значительно», конечно же, относительно. Прежде всего, относительно Европы, но также и масштаба ареала. Гетерогенность русского народа выше, чем в среднем по Европе, но и сам русский ареал намного больше других этнических территорий.
2. ОСНОВНАЯ ЧЕРТА ГЕНОФОНДА — РАЗЛИЧИЯ МЕЖДУ СЕВЕРНЫМИ И ЮЖНЫМИ ПОПУЛЯЦИЯМИ. Постепенное широтное (север<=»юг) изменение значений главных компонент выявилось по всем пяти независимым системам признаков — соматологии, дерматоглифики, классических маркёров, Y хромосомы и фамилий (главы 4–7). Да и на картах отдельных признаков часто выявляется широтная изменчивость с теми или иными особенностями.
3. ГЕОГРАФИЧЕСКАЯ ИЗМЕНЧИВОСТЬ В ПРЕДЕЛАХ РУССКОГО АРЕАЛА НЕ ПРОДОЛЖАЕТ ГЛОБАЛЬНЫЕ ТРЕНДЫ МНОГИХ ПРИЗНАКОВ, а вырисовывает сложную внутреннюю структуру русского генофонда. Например, если евразийский тренд CCR5 — это ярко выраженное снижение частоты мутации с северо-запада Евразии во всех направлениях, то в русском генофонде на северо-западе не более высокие, а напротив, сниженные частоты мутации.
4. В РУССКОМ ГЕНОФОНДЕ ВИДНЫ ЧЕРТЫ СХОДСТВА С СОСЕДЯМИ, в особенности с финно-угорскими популяциями (как западными, так и восточными финно-уграми). Это говорит о той роли, которую сыграли финно-угорские племена в формировании русского генофонда.
Все эти общие закономерности русского генофонда выявились по данным и о мтДНК, и о Y хромосоме.
МИТОХОНДРИАЛЬНАЯ ДНК
ВЫСОКАЯ ГЕТЕРОГЕННОСТЬ. Различия русских популяций по частотам гаплогрупп мтДНК составили d=0.033. Этот размах различий между русскими популяциями столь же велик, как, например, различия по мтДНК между всеми популяциями Балканского региона, известного пестротой этнического состава и сложной историей популяций.
СЕВЕР — ЮГ. Частоты многих гаплогрупп мтДНК подчиняются широтной закономерности. Это выявилось и на графике многомерного шкалирования, построенного по частотам гаплогрупп: северные русские популяции заняли обособленное положение от кластера центральных и южных популяций.
ГАПЛОТИПЫ. Для мтДНК, в отличие от прочих систем признаков, можно провести и иные виды анализа, основанные не на частотах гаплогрупп, а на данных о спектре встреченных гаплотипов. Эта особенность вызвана огромным числом существующих гаплотипов мтДНК, намного большим, чем число аллелей любого другого локуса и уступающим лишь разнообразию фамилий. Тем самым мы получаем в руки не десяток, а сотни независимых маркёров, по которым можем сравнивать популяции.
ВСЁ НЕ ТАК ПРОСТО… Но в этом потоке данных есть камни, как легко заметные, так и подводные. Поэтому мы уделили много места методическим вопросам сравнения гаплотипов.
Во-первых, мы попробовали оценить общее число гаплотипов мтДНК, существующих не в выборках из популяций, а в самих реальных популяциях. Для этого изучили, как растет число гаплотипов в зависимости от объёма выборки. И оказалось, что даже при выборках в тысячу человек число невыявленных гаплотипов (в сравнении с числом выявленных) остается всё таким же огромным.
Поэтому вторым нашим шагом стала разработка метода подсчёта числа общих гаплотипов. Выяснилось, что объёмы выборок влияют самым решительным образом как на число, так и на долю общих гаплотипов между популяциями.
Чтобы избежать этого влияния объёмов выборок и получить несмещённые оценки, мы предложили «прокрустов» метод: проводить все сравнения на выборках одного и того же объёма, исключая «лишние» образцы из анализа.
ФИННО-УГОРСКИЙ СУБСТРАТ. Рассчитанные этим методом показатели выявили сходство русского генофонда как со славянскими, так и с финно-угорскими народами. Но оказалось, что доля общих гаплотипов у русских выше с финноязычными народами (как восточными, так и западными), чем с южными и западными славянами. Это наглядно демонстрирует вклад финно-угорского субстрата в русский генофонд, по крайней мере — по материнской линии.
Y ХРОМОСОМА
ФИННО-УГОРСКИЙ СУБСТРАТ. Впрочем, анализ Y хромосомы показывает, что и по отцовской линии этот вклад весьма велик. Из всех генетических систем — эта самая новая и быстро развивающаяся, и её использование для изучения русских популяций только начинается. Литературные данные немногочисленны. И мы провели специальный анализ русского генофонда, впервые обрисовавший его портрет по гаплогруппам Y хромосомы. Анализ проведён по собственным данным по частотам гаплогрупп Y хромосомы в 14 русских популяциях.
В таблице 6.4.1. приведена сводка данных по восьми гаплогруппам Y хромосомы, наиболее частым у народов Европы (подробнее данные приведены на нашем сайте ).
ВЫСОКАЯ ГЕТЕРОГЕННОСТЬ. По Y хромосоме выявились необычайно высокие различия русских популяций между собой — в среднем d=0.142. Они намного выше, чем различия по мтДНК (d=0.033) или по аутосомным маркёрам (d=0.013). Гетерогенность русского генофонда по данным об Y хромосоме — одна из самых высоких среди народов Европы.
СЕВЕР — ЮГ. График многомерного шкалирования показывает, что эти различия особенно выражены между северными русскими популяциями, тогда как все южные и центральные популяции генетически более похожи друг на друга.
ГЕОГРАФИЯ ГАПЛОГРУПП Y ХРОМОСОМЫ. Из восьми гаплогрупп, наиболее распространённых
в русском генофонде, самая частая (R1a) оказалась «местной», свойственной всей Восточной Европе. Остальные гаплогруппы показывают взаимосвязи русских популяций с населением многих регионов. Перечислим их в порядке значимости: северо-восток Европы/Сибирь (гаплогруппа N3); Северная Европа (гаплогруппа I1а); Западная Европа (гаплогруппа R1b); Балканы (гаплогруппа I1b) и возможно другие регионы Южной Европы (гаплогруппы E3b, J2); Западная Сибирь/Урал (гаплогруппа N2).
Распределение этих гаплогрупп внутри русского ареала идет по географическим градиентам: для гаплогрупп R1a, N3 и lib они являются широтными, для остальных гаплогрупп — более сложными.
СХОДСТВО ОБОБЩЕННЫХ ПОРТРЕТОВ
Карта первой главной компоненты ДНК маркёров (Y хромосомы), обобщающая географические тренды всех гаплогрупп — чётко широтная. И её высокое сходство с картами первых компонент по другим системам (классические маркёры, антропология, фамилии) указывает, с одной стороны, на то, что и маркёры Y хромосомы идут в одном строю с другими системами признаков. С другой стороны, такое сходство под-тверждаёт надёжность результатов, полученных по Y хромосоме. Действительно, согласованность данных по Y хромосоме с данными по другим системам признаков удивительна: первая главная компонента изменчивости гаплогрупп Y хромосомы высоко коррелирует и с первой главной компонентой изменчивости классических генетических маркёров, и с первой компонентой антропологических признаков, и с первой компонентой дерматоглифики. Коэффициенты корреляции составляют соответственно 0.71, 0.73, 0.50 (табл. 6.4.1), сами карты представлены в заключительных разделах каждой главы.
ИТОГИ
Итак, анализ полиморфизма аутосомных маркёров, митохондриальной ДНК и Y хромосомы в русском генофонде выявил большое разнообразие русских популяций. Географически это разнообразие выражается, в первую очередь, в различиях между северными и южными русскими популяциями, при этом размах межпопуляционного разнообразия в пределах северной половины намного больше, чем на юге. Данные и по мтДНК, и по Y хромосоме указывают на финно-угорский субстрат в русском генофонде. Такие же выводы получены в предыдущих главах при изучении антропологических признаков и классических маркёров. Особенность ДНК маркёров (в первую очередь Y хромосомы) — в удивительной чёткости географического распределения гаплогрупп. По сравнению с большинством карт распространения классических маркёров (карты в главе 5), карты гаплогрупп Y хромосомы ясны, прозрачны и наглядно показывают генетические взаимоотношения популяций.
Авторы надеются, что результаты, описанные в этой главе, окажутся лишь прологом для интенсивных исследований структуры русского генофонда на основе как маркёров мтДНК и Y хромосомы, так и других систем ДНК полиморфизма.
Таблица 6.4.1.
Частоты гаплогрупп Y хромосомы у народов Европы и Передней Азии (среднеэтнические частоты в процентах).
Таблица 6.4.1.
Коэффициенты корреляции между главными компонентами изменчивости гаплогрупп Y хромосомы и других типов признаков — соматологии, дерматоглифики, фамилий и классических маркёров.
Примечания:
1. Рассчитаны ранговые коэффициенты корреляции между картами первых трёх главных компонент пяти типов признаков: соматологии, дерматоглифики, классических маркёров, фамилий, гаплогрупп Y хромосомы.
2. Значения ниже 0.2 не показаны (обозначены как «-»).
3. Значения около 0.5 и выше выделены шрифтом и заливкой.
4. Коэффициент корреляции указан по модулю.
5. Корреляции между компонентами одного ранга (например, между всеми первыми компонентами) выделены прямоугольниками.
Глава 7. ГЕНОГЕОГРАФИЯ ФАМИЛИЙ
Нынче поутру зашел ко мне доктор; его имя Вернер, но он русский. Что тут удивительного? Я знал одного Иванова, который был немец.
М. Ю. Лермонтов. «Герой нашего времени»Изучение «фонда фамилий» может стать изучением генофонда. Передаваясь в чреде поколений, фамилии начинают вести себя подобно генам. Причём они вторят тем генам, которые генетика сейчас считает самыми информативными для изучения истории генофонда — «однородительским» маркёрам. В предыдущей главе мы уже дали описание этих маркёров: гаплогрупп Y хромосомы (NRY), передающихся по отцовской линии, и митохондриального генома (мтДНК), наследующегося по материнской линии. Теперь к ним можно добавить и фамилии — «квазигенетические» однородительские маркёры, передающиеся по отцовской линии.
Но, конечно же, фамилии, даже называясь квази-генетическими маркёрами, совсем не похожи на обычные гены. Фамилии не подчинены суровым биологическим законам, а следуют многозначным путям развития языка и культуры. Поэтому фамилии, передаваясь из поколения в поколение, ведут себя очень свободно — столь часто и прихотливо «мутируют», что прослеживать судьбу каждой из фамилий в отдельности непросто. Более того, одни и те же фамилии могут возникать независимо в разных точках пространства и времени, имитируя генетическое родство между исторически несвязанными популяциями.
Но, к счастью, изучение прихотливой истории отдельной фамилии не входит в обязанности популяционного генетика. Если мы хотим изучить генофонд в целом, то судьбы отдельных фамилий нам не столь важны — важно лишь, позволяет ли это «мелькающее отраженье» (Н. Гумилев) уловить общий образ генофонда. Если позволяет, и если мы найдём инструмент, чтобы извлечь такую общую информацию из географической изменчивости фамилий, то становится ясно: пренебречь столь ярким маркёром нельзя.
Именно одним маркёром, потому что всё множество фамилий можно приравнять к аллелям всего лишь одного локуса. И только из восхищения их многообразием мы называем фамилии обычно во множественном числе — «маркёрами». Впрочем, и здесь фамилии не одиноки. И другие «однородительские маркёры» являются по сути одним геном. Все гаплогруппы мтДНК — аллельные варианты одного локуса, и все гаплотипы Y хромосомы — аллельные варианты другого локуса.
Есть у фамилий и весьма замечательное достоинство, недоступное всём другим маркёрам. По фамилиям можно изучить всю популяцию целиком, а не только маленькую выборку из неё, как это приходится делать по любым признакам генетики и антропологии. Тем самым снимается весь клубок вопросов — а отражает ли выборка из популяции её реальный генофонд? И если отражает, то как?
Это достоинство фамилий столь велико, что мы не могли остаться равнодушными: организовали сбор и геногеографическое изучение русских фамилий. Хотя эта работа ещё в самом начале — нужны многие годы для кропотливого собирания данных по огромному русскому ареалу и их анализа — но первые итоги можно подвести и сейчас.
7.1. ПАРАДОКСАЛЬНО НАДЁЖНЫЕ МАРКЁРЫ
— Фамилию я согласен наследственную принять.
— Как? Наследственную? Именно?
— Шариков.
М. А. Булгаков. «Собачье сердце»Фамилии и гены друг другу сродни — След в след — Фамилии спешат на помощь генетике — «Осмысленные» маркёры — Слишком изменчивы? — Зато представительны! — Как изучает фамилии лингвистика — И как с ними работает генетика
Генетическая летопись народа несёт в себе знаки не столько биологической истории популяции, сколько истории сложения народа. Поэтому и изучение фонда фамилий, вторящего генофонду, может стать историческим источником об этногенезе, о древних и современных массовых миграциях населения. Какие же свойства фамилий позволяют им стать маркёрами почти генетическими («квазигенетическими»)?
ЧТО ОБЩЕГО У ФАМИЛИЙ С ГЕНАМИ?
Методика применения фамилий в качестве аналога генетических маркёров общеизвестна. Она была разработана. F. Crow и А. P. Mange [Crow, Mange, 1965], получила широкое распространение и дальнейшее развитие как за рубежом, так и в работах отечественных генетиков — Ю. Г. Рычкова, А. А. Ревазова, Е. К. Гинтера, их последователей и учеников.
Главным аргументом, позволившим фамилиям стать инструментом популяционной генетики, стало прямое сравнение двух оценок межпопуляционных различий: одна — рассчитывалась по фамилиям, а вторая — по «истинно» генетическим маркёрам. У самых разных народов были параллельно изучены и частоты фамилий, и частоты классических маркёров генетики.
Затем оценена гетерогенность этих народов по фамилиям и по генам. Это позволило напрямую сравнить полученные величины гетерогенности — различий между популяциями одного и того же народа.
Смысл сравнения такой: если оценки гетерогенности по фамилиям (fr) окажутся близки к оценке гетерогенности по генам (FST), значит, фамилии дают верный результат, и их можно использовать для изучения генофонда.
Рис. 7.1.1. Сходство оценок гетерогенности генофонда, полученных по генам и по фамилиям
Оказалось, что у каждого из народов, проверенных таким способом, оценки гетерогенности по генам и по фамилиям очень близки друг к другу (рис. 7.1.1). А фамилии этих народов ничем не были похожи друг на друга — изучены народы и Прибалтики (литовцы), и Кавказа (адыгейцы), и Сибири (алтайцы, эвенки), и Дальнего Востока (нивхи, народы Приморья).
Мы видим, что какой бы народ мы не взяли, фамилии и гены ведут себя столь похоже, что их трудно различить. Так же трудно, как близнецов-братьев. Это удивительное сходство оценок по фамилиям и по генам даёт нам полное право использовать фамилии как аналоги генов и изучать с помощью фамилий генофонды.
ФАМИЛИИ СПЕШАТ НА ПОМОЩЬ ГЕНЕТИКЕ
Мы уже говорили, что антропологами (глава 4) были изучены более 180 (!) русских популяций. Это позволило выделить ареалы антропологических типов. На таком фоне особенно заметно, сколь неполны генетические исследования. Причина в том, что генетическое изучение требует забора крови и дорогостоящих лабораторных исследований. Поэтому классические маркёры исследованы в среднем лишь в 35 русских популяциях (глава 5), а изучение ДНК маркёров только-только перешло за первый десяток популяций (глава 6).
Причина столь уважительна, что становится ясно, что генетике вряд ли удастся догнать антропологию и выявить популяционную структуру столь же детально. И вместе с тем, очевидно, что только такое же подробное, с анализом локальной изменчивости, изучение русского генофонда способно дать реальные знания об его внутренней структуре и истории формирования.
Что же делать? Неожиданный выход из этой тупиковой ситуации дают фамилии. Фамилии можно изучить не в десятках популяций, и не в ста популяциях, а в сотнях и тысячах! И при этом мы, наконец, сумеем охватить исследованием не отдельные избранные популяции, а весь ареал целиком. Если антропологи тратят до получаса на обследование одного человека, а суммарные затраты времени генетиков в пересчёте «на один образец» намного больше, то «квазигенетик», работая с похозяйственными книгами в сельской администрации, может собрать сведения о фамилиях пятисот человек всего за несколько часов, а работа с компьютерными списками населения ещё многократно ускоряет процесс сбора первичных данных. Этим достоинством, столь важным для создания портрета генофонда, обладают лишь фамилии. Поэтому данными о разнообразии фонда фамилий занялись именно генетики.
Все прочие признаки, с помощью которых мы познаём генофонд, всегда дважды связаны с выборочным процессом.
Во-первых, это выборка самих популяций. Ведь для исследования выбирается малая часть из огромного массива реально существующих популяций. И мы всегда зависим от того, насколько правдиво эти «делегаты» рассказывают о той части населения, от имени которой они выступают.
Во-вторых, это выборка из популяции. Ведь для исследования выбирается малая толика людей из всего населения. И мы всегда зависим от того, насколько достойно эти «избранники» представляют свою популяцию.
При изучении фамилий можно вообще отказаться от выборок: и от избранных популяций, и от избранных людей. Можно изучать всю тотальную популяцию — со всеми малыми популяциями, и со всеми людьми, в них входящими. Используя этот источник информации в параллель классическим и ДНК маркёрам, мы можем получить максимально полную картину генофонда.
Итак, уникальное преимущество фамилий — возможность охватить огромное число популяций, причём не выборочно, а тотально — все население региона.
Недостаток фамилий — их чрезвычайная вариабельность не только в пространстве, но и во времени.
Поэтому в географии отдельной фамилии обычно проявляются итоги частных событий, и отдельные фамилии мало пригодны для изучения общих черт генофонда. Но если сравнить популяции не по одной, а по большому числу фамилий, то появляется надежда, что мы сможем добыть достоверную информацию о генофонде: оценить его подразделённость на исторически сформировавшиеся группы населения, выявить следы массовых миграционных потоков. Поэтому для изучения русского генофонда мы использовали фамилии не как явление лингвистики, этнографии или фольклора, а как особый класс генетических маркёров.
Причём ярких и «осмысленных» маркёров, которые охватывают сотни тысяч людей из сотен популяций и позволяют с новой стороны взглянуть на географическую изменчивость русского генофонда.
РУССКИЕ ФАМИЛИИ В ЛИНГВИСТИКЕ
В антропонимике (науке об именах и фамилиях) известны определённые закономерности процесса становления фамилий: их возникновение в определённых социальных слоях, более раннее появление фамилий на экономически развитых территориях и т. д., причём процесс «офамиливания» требует времени.
Фамилия — это семейное имя, то есть имя, носимое всеми членами семьи. Сам термин «фамилия» внедрился в России поздно — после указов Петра I. «Однако фамилии как элемент именования русских людей существовали и раньше, но назывались они прозвищами, прозваниями. В этом же значения употреблялось слово назвище. В царских указах о проведении переписей населения обычно говорилось, что следует записать всех людей, проживающих в таких-то местностях, «по именам с отцы и с прозвищи», т. е. по имени, отчеству и фамилии» [Суслова, Суперанская, 1991, с. 157].
Становление русских фамилий происходило на протяжении нескольких столетий. Княжеские фамилии появляются в XIV веке из названий уделов, а впоследствии, как и у бояр, из отчеств. Фамилии дворян складываются в XVI–XVII вв., также преимущественно из отчеств; основная часть духовенства приобретает фамилии в конце XVIII века, при этом более ранние зачастую происходят от названий церквей. У «именитого купечества» фамилии регистрируются с XVI века. Однако у основной массы населения (кроме внутрисемейных имён и имён, полученных при крещении) издревле бытовали так называемые «уличные» фамилии, «назвища» (имена, данные «улицей», общиной). Уличные фамилии в русской деревне существовали очень давно. Именно они попадали в переписные листы, когда требовалось записать всех жителей «по именам с отцы и с прозвищи». Они не были строго регламентированы, поскольку не фиксировались в обязательном порядке, но, тем не менее, передавались из поколения в поколение. Нередко человек обладал сложной составной фамилией, включавшей производные от семейного имени (например, Толстой), отчества (Иванов) и уличной фамилии (Коробейников). Так, например, Григорий Лукьяныч Скуратов нам более известен под семейным именем Мал юты. В 1861 году был принят закон о введении фамилий у всего населения страны. В крестьянской среде источниками послужили уличные фамилии, фамилии из отчеств или фамилии помещиков. Тем не менее, закрепление крестьянских фамилий порой продолжалось и в начале XX века, окончательно устоявшись лишь при сплошной паспортизации. «Отсутствие у крестьян вплоть до недавнего времени… фамилий, как особых, официальных именований, которые записываются в документах и связаны с различного рода регистрациями населения… объясняется образом жизни русского крестьянства, которое в массе своей постоянно проживало в деревне. В своих родных местах паспорта никому не требовались, а потому и не возникало необходимости в особом официальном именовании» [Суслова, Суперанская, 1991, с. 157].
Целый ряд работ посвящён изучению распространения русских фамилий и их географической приуроченности. Как правило, выделение зоны накопления/возникновения той или иной фамилии интерпретировалось с позиций диалектологии. В ряде случаев показано совпадение территорий встречаемости фамилий, возникших от диалектных слов, с ареалами этих диалектов. Анализировалось распространение и «кустов» фамилий, группируемых, например, по финалям. Так, например, фамилии с окончанием «-очкин» чаще встречаются в юго-западных областях, фамилии на «-ых», «-их» распространены на северных и южных территориях, но отсутствуют в центральных и т. д. Важно подчеркнуть, что в ряде работ выделяются также ареалы фамилий и их групп, связываемые с территориями русских княжеств. По-видимому, фамилии, возникая, распространялись в рамках административно-территориальных общностей [Никонов, 1974; Никонов, 1988; Суперанская и др., 1984].
Однако существует и другой способ исследования фамилий, когда изучаются не произвольно взятые фамилии или их группы, а одновременно исследуются массовые выборки фамилий на обширной территории методом картографирования. В нашей работе осуществлён вариант именно такого «массового» анализа современных русских фамилий: использованы методы непрерывного картографирования и обобщённого картографического анализа всего фонда фамилий.
РУССКИЕ ФАМИЛИИ В ГЕНЕТИКЕ
Частоты русских фамилий широко использовались для анализа инбридинга и груза наследственной патологии в Архангельской, Костромской, Кировской, Курской, Белгородской областях. Эти работы, в течение 20 лет проводимые академиком РАМН Е. К. Гинтером и его школой, создали важнейшую основу для изучения русского генофонда [Ревазов и др., 1986; Ельчинова и др., 1988; Гинтер и др., 1993, 1994; Чурносов, 1997; Сорокина, 2005]. Однако анализ ограничивался группой районов в одной области — «гипервариабельность» русских фамилий привела к заключению об их пригодности лишь при изучении небольших групп населения [Ельчинова и др., 1991 а, б].
Первое исследование в общерусском масштабе было проведено А. П. Бужиловой для 75 распространённых фамилий [Бужило-ва, 1999]. Результаты этого анализа показали, что географическая изменчивость распространённых русских фамилий отражает не только события районного масштаба, но и этническую историю русского народа в целом: обнаружена связь между зонами накопления определённых фамилий и основными антропологическими типами русского этноса [Бужилова, 1999]. В этом исследовании распространённость фамилий определялась по «качественному» принципу «есть-нет»: наличие или отсутствие фамилии в данной популяции. Успешность этого исследования позволила нам сделать следующий шаг и перейти к количественному анализу — не по принципу «есть-нет», а по частотам встречаемости фамилий. Такой количественный анализ полностью аналогичен анализу «настоящих» генетических маркёров. Поэтому мы провели компьютерный картографический анализ изменчивости частот встречаемости фамилий в русском ареале — причём как для тех же 75 распространённых фамилий (чтобы включить в анализ и данные, собранные А. П. Бужиловой), так и для всего фонда изученных нами русских фамилий (для оценки инбридинга).
Благодаря проведению в течение последних пяти лет (при поддержке РГНФ и РФФИ) интенсивных экспедиционных исследований, созданию Банка данных «ONOMA», преобразованию и анализу огромного массива информации (см. главу 3), мы впервые можем сравнить основные группы русского народа по всему фонду фамилий. Чем полнее будет становиться Банк, тем точнее мы сможем по разнообразию фамилий (см. Приложение) познавать разнообразие русского генофонда.
7.2. КОГО МЫ ИЗУЧИЛИ?
Кто откуда? — «Исконный», сельский, коренной… — От списков фамилий к их частотам — 67 тысяч русских фамилий — Пять основных регионов и три окраинных — И ещё 50 сельсоветов
В этом разделе мы опишем наши исходные данные о русских популяциях, включённые в «фамильный» анализ — их ареал, требования к популяциям, организацию данных. Описание банка «ONOMA» и сложных процедур преобразования списочного состава фамилий в популяционные частоты дано в Приложении (раздел 5).
Информация о фамилиях с каждым годом пополняется, и постепенно новые данные включаются в разные виды анализа. Но обновление и пересчёты — процесс бесконечный. Поэтому в этой главе мы решили сосредоточить внимание на пяти «главных» регионах и для них провели все основные виды анализа. В часть расчётов мы включили и информацию о трёх «окраинных» регионах. Но неполнота имеющейся информации пусть не огорчает читателя. Мы специально так спланировали исследование фамилий,
чтобы, охватив пять основных географических групп русского населения (запад, восток, север, юг, центр), получить общее представление о структуре фонда фамилий. А затем уже, представляя новые данные на сайте, можно бесконечно пополнять и уточнять «фамильный» портрет русского народа.
ГЕОГРАФИЯ ПОПУЛЯЦИЙ
На рисунке 7.2.1. показано географическое положение и условные названия изученных нами восьми регионов — пяти «основных» регионов (Восток, Центр, Запад, Север, Юг) и трёх «окраинных» регионов (Северо-Запад, Казаки, Сибирь). Всю условность таких названий мы сознаём, но они так просты и понятны! Экспедиционная работа по сбору фамилий была спланирована так, что среднее расстояние между пятью «основными» регионами превышает 1000 км. Эти пять регионов заключены внутри треугольника «окраинных» регионов, каждый из которых представляет свой тип окраин: Северо-Запад — рубеж ареала, Казаки
— этнографическая группа, Сибирь — «запредельный» генофонд, вне «исконного» ареала. Состав регионов и информация об их изученности приведены в таблице 7.2.1.
Мы взяли на себя смелость привести на этой карте (рис. 7.2.1.) взгляд на изученные русские популяции как бы «из космоса». И сделали это не случайно. «Лицом к лицу Лица не увидать. Большое видится на расстоянии» (С. Есенин). Мы часто недооцениваем масштабы русского ареала. Порой нам кажется, что от Мадрида до Парижа — бесконечность, а от казаков до поморов — рукой подать. На этой карте видно, что даже на фоне двух континентов — Евразии и Африки — изученные нами популяции занимают значительное пространство. Это важно иметь в виду, рассматривая изменчивость русских фамилий.
Рис. 7.2.1. Расположение восьми регионов, изученных по составу русских фамилий
Условные названия для регионов, изученных по фамилиям:
КАЗАКИ — кубанские казаки; ЮГ — Южный регион, ЗАПАД — Западный регион, СЕВЕРО-ЗАПАД — Северо-Западный регион, ЦЕНТР — Центральный регион, ВОСТОК — Восточный регион, СЕВЕР — Северный регион, СИБИРЬ — Сибирский регион.
В анализ включены данные о фамилиях более миллиона человек старше 18 лет, представлены более тысячи сельских популяций (табл. 7.2.1). Рассмотрим принципы организации и отбора данных.
Таблица 7.2.1.
Характеристика регионов, изученных по частотам фамилий
АРЕАЛ
Поскольку мы хотим изучить историю сложения генофонда, то нам нельзя опираться на популяции, сформировавшиеся исторически недавно в результате переселений или смешений. Этногенез народа и структуру генофонда необходимо сначала изучить по его «этническому ядру», а уже потом можно перейти к отдельным, поздно выделившимся популяциям.
Поэтому, хотя этнический ареал русских на протяжении столетий неуклонно расширялся, включая сначала окраины Русской равнины, а потом Урал, Сибирь, Кавказ и иные отдалённые земли, мы вновь, как и в предыдущих главах, ограничиваем его «исконной» территорией. География «исконных» популяций вновь повторяет основной маршрут Русской антропологической экспедиции, доныне остающейся образцом популяционных исследований и изучившей русский народ именно в «этнической зоне формирования русского населения в XI–XIV вв.» [Происхождение…, 1965].
Наше исследование охватывает основную историческую территорию формирования русского народа, которую мы условно называем «исконной» (см. Введение, главу 1). Данные охватывают коренное сельское население, мало затронутое миграциями последнего столетия.
В основные виды анализа мы не включали русские популяции, оторванные от основного ареала. В качестве дополнительного анализа нами изучены две такие популяции: кубанские казаки и население Сибири. Эти две популяции помогут нам бегло взглянуть, как ведут себя фамилии за пределами основного исторического ареала.
СЕЛЬСКОЕ НАСЕЛЕНИЕ
В анализ включалось только сельское население, а также небольшие города, сформировавшиеся из населения окружающих деревень.
Конечно, это очень сокращает объём данных и очень увеличивает объём работы. Города изучать быстро и весело — сразу в одном пункте получаешь информацию об огромном массиве населения. Исключив данные по городам, мы, конечно же, резко сокращаем объём выборки. Однако в любой популяционно-генетической работе всегда приходится проводить раздельно анализ сельского и городского населения — слишком разные генетические процессы они отражают, и слишком быстро меняется состав городов при общественно-политических переменах [Курбатова, 1975, 2004; Курбатова, Победоносцева, 1992; Медико-генетическое описание…, 1997; Наследственные болезни…., 2002].
Нашей задачей было изучение истории сложения русского генофонда, а не его сиюминутного состояния. Поэтому фамилии, как и генетические данные, должны отражать коренное население, сосредоточенное не в городах, а на селе. Изучение городского населения — чрезвычайно любопытная, но отдельная задача, выходящая за рамки этой книги.
Лишь данные по Кемеровской области включают и сельское, и городское население, поскольку и то, и другое является некоренным.
ФАМИЛИИ
По мере изучения всё новых популяций пополнялся общий список фамилий, встреченных в коренном русском населении. До этого было неизвестно даже приблизительно общее число русских фамилий. Теперь мы точно знаем, по крайней мере, нижнюю оценку: более шестидесяти тысяч фамилий, и располагаем их списком.
Насколько список фамилий может увеличиться? Ведь изучен только 1 млн. человек, а численность русского населения России, по данным последней переписи — в 116 раз больше. Поэтому сказать, сколько всего существует русских фамилий, пока нельзя. Однако было бы ошибкой предполагать, что их станет тоже в 116 раз больше. И не только потому, что уже изучен один миллион человек (это не так много для изменчивых фамилий), а потому, что изучено сельское население основных географических групп русского народа. Поэтому выборка, не столь большая по общей численности, достаточно обширна в географическом измерении. Для создания полного списка фамилий это намного лучше, чем выборка пусть и большая по численности, но лишь из одного региона.
Однако пока «насыщение» списка фамилий не достигнуто — так же, как и для гаплотипов митохондриальной ДНК (см. раздел 6.2) новые популяции приносят новые фамилии и выход на плато пока не виден. Из таблицы 7.2.1. и без специальных расчётов видно, что количество встреченных фамилий прямо зависит от числа изученных человек.
ИСХОДНЫЕ СПИСКИ ФАМИЛИЙ
Основной источник данных о фамилиях — списки населения для каждой популяции, в которых указана фамилия каждого жителя, достигшего «официального» репродуктивного возраста (дети до 18 лет не учитываются). Эти списки «тотальные», то есть они охватывают всё население изученной популяции — населённого пункта, сельсовета, района. Эти списки населения переводятся в компьютерный вид, и на их основе рассчитывается частота каждой фамилии в каждой популяции — в каждом населённом пункте, в сельсовете, в районе, в регионе.
РАСЧЁТ ЧАСТОТ ФАМИЛИЙ
Частоты всех фамилий сначала рассчитывались для каждой группы популяций (группа тесно связанных деревень — сельская администрация, сельсовет, волость). Её средняя численность — 1 тыс. человек (старше 18 лет). Далее усреднением данных по всем группам популяций данного района (где «весом» каждой группы популяций служила её численность) рассчитывались частоты всех фамилий в районе. Средняя численность носителей фамилий в районе — 20 тыс. человек. Далее по совокупности «районных» частот были рассчитаны невзвешенные средние частоты фамилий в регионе. Средняя численность изученного населения в регионе — 190 тыс. человек. А затем уже по совокупности региональных частот рассчитаны невзвешенные средние частоты фамилий в русском генофонде в целом. При расчёте «среднерусских» частот учитывались лишь «основные» регионы.
ОСНОВНЫЕ РЕГИОНЫ
Пять регионов — Восточный, Центральный, Западный, Северный, Южный — представляют основные географические подразделения генофонда в «исконном» ареале. Они составили основу анализа русского генофонда по фамилиям и потому называются «основными».
ЮЖНЫЙ РЕГИОН. Сразу бросается в глаза непропорционально большая численность Южного региона. Дело в том, что формированию репрезентативной выборки из него пришлось уделить особое внимание. Самый первый вариант анализа включал три региона — Восточный, Западный и Южный. Мы собрали данные о фамилиях так, что каждый регион был представлен примерно равной численностью — около 100 тысяч человек. Однако оказалось, что в Южном регионе самыми частыми оказались «местные» фамилии, а не широко распространённые в русском народе. Это было неожиданно, так как на юге миграции наиболее интенсивны, что должно было принести туда много фамилий из других регионов. Поэтому мы предположили, что наша выборка неадекватна — представленные фамилии характерны лишь для конкретных изученных популяций и не отражают регион в целом. Чтобы избежать этого, мы резко (в шесть раз!) увеличили число изученных индивидов и районов на юге русского ареала (точнее — на юго-западе, который отражает наиболее древние пласты в сложении русского народа и надёжнее представляет юг Руси, чем юго-восточные популяции). Причём, в отличие от других регионов, Южный регион включил данные не по одной, а по трём областям. Однако, как мы увидим ниже, своеобразие Южного региона при этом не исчезло: оно оказалось его реальной особенностью.
ЗАПАДНЫЙ И ВОСТОЧНЫЙ РЕГИОНЫ представлены и равным числом популяций (≈160 популяций), и равной численностью (фамилии ≈100 тысяч человек).
СЕВЕРНЫЙ РЕГИОН не случайно представлен меньшей выборкой. Она соответствует резкому снижению плотности населения. Меньшая плотность населения часто сопровождается дрейфом генов. Поэтому популяции, разбросанные по бескрайним просторам Архангельской области, могли значительно отличаться друг от друга по составу и частотам фамилий. И мы приложили специальные усилия, что бы охватить все части Архангельской области. Поэтому, хотя число изученных районов невелико, но эти пять районов представляют разные части обширного Русского Севера: это Каргопольский район (юго-запад Архангельской области), Холмогорский (её север), Пинежский (самый восток, верховья Пинеги, на границе с республикой Коми), Лешуконский (северо-восток, на Мезени), Красноборский (юго-восток, вблизи границы с Вологодской областью).
ЦЕНТРАЛЬНЫЙ РЕГИОН. Все усилия были направлены на изучение четырёх географически контрастных регионов «исконного» русского ареала. Поэтому пятый, Центральный регион пока ограничен очень небольшой выборкой. Он представлен лишь одним районом (фамилии 25 тысяч человек), но этот район мы выбирали тщательно. Кашинский район связан с древней историей тверских земель и мало затронут демографическими преобразованиями последнего времени. По частотам фамилий он оказался действительно центральным, но необходимо помнить о возможном смещении характеристик из-за небольшого объёма данных.
ОКРАИННЫЕ РЕГИОНЫ
Три группы популяций, указанных в таблице 7.2.1. как «окраинные регионы», привлекались лишь в отдельных видах анализа.
СЕВЕРО-ЗАПАДНЫЙ РЕГИОН находится на границе «исконного» ареала и в дальнейшем, наряду с другими новыми данными по «исконному» ареалу, будет включён в основной анализ русского генофонда. Однако этот регион по составу фамилий оказался столь своеобразен, что мы отказались от его объединения с данными Западного региона (представленного Смоленской областью). Несмотря на малочисленность данных, Северо-Западный регион представлен населением двух исторически различных районов Псковской области: Островский район издревле относился к псковским землям, в то время как территория Порховского района входила в новгородские земли, и только после падения Великого Новгорода отошла во владения Пскова. Северо-Западный регион представляет обширный и важнейший пласт в истории русского генофонда, обладает своеобразными чертами фонда фамилий, и мы рассматриваем его как самостоятельный регион.
КУБАНСКИЕ КАЗАКИ расселены вблизи южной границы «исконного» русского ареала, и история их формирования общеизвестна. Они были поселены здесь на исходе Кавказской войны в середине XIX века и образованы частью из донских казаков, частью из русских переселенцев из южной и из центральной России. Хотя казаки по определению являются «профессиональной» группой служилых людей[46], они обычно рассматриваются как своеобразная этнографическая группа русского этноса.
Подчеркнём, в анализ включено не просто русское население тех территорий, где когда-то обитали казаки. Поскольку в их прежнем ареале проживает масса недавних мигрантов из разных регионов России, то общие списки пришлого («русского») населения здесь непригодны. Поэтому данные были собраны Э. А. Почешховой только для потомков кубанских казаков и непосредственно по похозяйственным книгам тех казачьих станиц, где они проживают компактно. Итак, в список включались фамилии только потомков кубанских казаков, а недавнее пришлое русское население не учитывалось. Причём это та самая популяция, которую мы рассматривали при анализе ДНК маркёров (глава 6). Мы старались проводить комплексный анализ — в тех же популяциях, где собирались образцы для ДНК маркёров, проводился тотальный сбор фамилий.
СИБИРЬ. Современное население Кемеровской области представляет иной пласт поздних миграций русских — в Сибирь. Мы не отбирали старожильческое население Сибири, а включили всех нынешних жителей. Освоение русскими Сибири — и особенно на поздних «индустриальных» этапах в XX веке — включило великое множество разных миграций. Население Кемеровской области сформировалось из слияний множества потоков миграций, находится за пределами времени и пространства сложения русского народа, включает городское население. Поэтому на фамилии современного населения Кемеровской области (собранные М. Б. Лавряшиной и М. А. Ульяновой) можно взглянуть как на модель современного населения, ушедшего за пределы «исконного» русского ареала. Возможно, оно может служить и некой моделью нашего будущего.
ДОПОЛНИТЕЛЬНЫЕ ПОПУЛЯЦИИ — ТОЛЬКО ДЛЯ КАРТ
И, наконец, последняя группа — данные о частотах фамилий в отдельных малых популяциях. Они использовались только при построении карт фамилий и составили половину всех картографированных популяций.
Эти данные о 50 сельсоветах, разбросанных по всему «исконному» ареалу русского народа — в 44 районах 15 областей европейской России. Это означает, что каждый район здесь представлен лишь одной, редко двумя малыми популяциями (сельсоветами). Поэтому эффект случайности (генетически говоря, дрейф) должен был сказаться на этих данных, приводя к значительным случайным колебаниям частот фамилий. Нам пришлось включить их в карты фамилий, так как они представляют 15 областей, а основной массив наших данных — только 7 областей. Именно фамилии, встреченные в 50 малых популяциях, ограничивают картографический анализ общим числом только 75 фамилий. Но они оказали неоценимую помощь, поскольку дают хотя бы примерную информацию по тем областям, по которым у нас нет полных данных. А для картографирования необходимо располагать информацией по многим областям!
Рис. 7.2.2. Расположение изученных популяций-районов (большие кружки) и популяций-сельсоветов (малые кружки)
На рис. 7.2.2. «точками» обозначены 50 популяций-сельсоветов (их суммарная численность 25 тыс. чел.). «Кружками» обозначена вторая половина — 50 популяций-районов (943 тыс. чел.). Это два разных уровня иерархии. Каждый из районов включал данные о фамилиях в 15–25 сельсоветах — каждый кружок-район можно было бы изобразить как 20 точек-сельсоветов, расположенных близко друг к другу. Поэтому частоты фамилий в популяциях-районах намного «устойчивей», чем частоты в популяциях-сельсоветах.
Поэтому мы сравнили карты фамилий, построенные по 50 популяциям-сельсоветам, и карты по объединённым 100 популяциям. Результаты оказались неожиданными: главные закономерности, выявленные картами популяций-сельсоветов, сохранились и на объединённых картах! Все основные структурообразующие элементы верно предсказывались «сельсоветными» картами. Введение огромного массива информации во многом уточнило и «досказало» угаданные ранее закономерности, но не отринуло их.
Вот уж действительно парадоксально надёжные маркёры!
БЛАГОДАРНОСТИ
Конечно же, собрать столь большие массивы данных можно только большим дружным коллективом, которому авторы хотели бы выразить свою искреннюю признательность. Мы уже указывали, что дополнительные данные по 75 распространённым русским фамилиям в 51 сельсовете были собраны д.и.н. А. П. Бужиловой (Институт археологии РАН) почти 20 лет назад. Значительная часть информации по Костромской области также собиралась ещё в «докомпьютерное» время коллективом, которым руководил д.м.н. А. А. Ревазов (МГНЦ РАМН). Эти данные были введены в компьютерную базу данных и тем самым обрели вторую жизнь благодаря усилиям нашей сотрудницы Д. С. Соловьевой (ГУ МГНЦ РАМН).
Однако весь основной массив информации собирался нами в рамках работы по грантам РФФИ и РГНФ (см. главу 3). Данные по Архангельской области помогла нам собрать проф. И. В. Евсеева (Северный медицинский университет), а в Смоленской области — к.м.н. Н. Н. Аболмасов (Смоленская медицинская академия). Во всех областях Южного региона работа велась к.б.н. И. Н. Сорокиной под руководством проф. М. И. Чурносова (Белгородский госуниверситет). Данные по западносибирской популяции были собраны к.б.н. М. Б. Лавряшиной и М. А. Ульяновой (Кемеровский госуниверситет). Данные по кубанским казакам собирались к.м.н. Э. А Почешховой и проф. В. И. Голубцовым (Кубанская медицинская академия). Данные по десяти районам из пяти областей (Архангельской, Смоленской, Псковской, Тверской, Костромской) были собраны лично авторами этой книги. В создании компьютерной базы данных и их многостороннем анализе основная работа легла на плечи С. М. Субботы (ГУП ВИГСТАР) и Д. С. Соловьевой (ГУ МГНЦ РАМН).
И это только малая часть имён — сколько сотрудников не только научных или учебных коллективов, но и администраций районов и сельских администраций помогали нам для того, чтобы фамилии жителей их регионов могли дать новые свидетельства об истории русского народа! Низкий им поклон за это.
7.3. ОБЗОР ФАМИЛИЙ
Мифы и легенды русских фамилий.
§ 1. Частые фамилии: «Топ-20» — По местам! — Сходство регионов средней полосы (Запад, Центр, Восток) — Своеобразие полярных регионов (Север и Юг) — Три модели окраинных регионов (Северо-Запад, казаки, Сибирь) — Частые фамилии отражают «лицо» региона
§ 2. Редкие фамилии: Геногеография или кунсткамера? — Редкий значит «пришелец» — Прополка фамилий — Остаётся четверть фамилий, но «коренных» — Отсеивается лишь четверть людей, но «пришельцев» — Работаем только с «коренными»
§ 3. «Всеобщие» фамилии: Есть ли повсеместные фамилии? — 257 «всеобщих» русских фамилий — Все они коренные — Но в каждом регионе со своей частотой — «Осмысленная» классификация фамилий — Календарные — «Звериные» — Профессиональные — «Приметные» — Иные
С фамилиями нелегко — их всегда сопровождает эскорт легенд, мифов и предрассудков.
ФАМИЛЬНЫЕ МИФЫ
Столкновение мифов — вполне реальное сотрясение.
Ежи Лец.
Ведь каждый из нас сталкивается с фамилиями на каждом шагу, и удержаться от того, чтобы придумать свой миф о закономерностях их распространения, очень трудно. Поэтому многие из нас чувствуют себя специалистом в области ономастики, со знанием дела трактуя встреченные на жизненном пути яркие факты из жизни и превращений тех или иных запавших в душу фамилий. Однако по ярким блёсткам трудно судить о геологической породе в целом. То же можно сказать и о человеческой породе. Яркие блёстки гениев Пушкина и Жуковского ещё не означают, что русский генофонд сформирован при существенном вкладе «арапов» и «турчанок». Основной массив русских заключал браки по поговорке «хоть за курицу, да на свою улицу», и именно этот массив определяет структуру генофонда. Однако как только речь заходит о фамилиях, за деревьями исчезает лес, и расхожие представления о географии той или иной фамилии не дают увидеть истинной картины.
Эти заблуждения полностью разделяли и авторы книги, пока не провели анализ распределения фамилий. Каждый шаг этого анализа вызывал, с одной стороны, изумление — перед стройностью картины и её полном несоответствии ожидаемой, а с другой стороны, грусть — сколько, оказывается, бытует неосознанных «фамильных» мифов и расхожих толкований.
Например, по умолчанию предполагается, что самые частые русские фамилии — календарные, т. е. произведённые от имён православного русского календаря («святцы»). Говоря: «Ивановы, Петровы, Сидоровы», мы считаем, что очертили образ «самых русских» фамилий. И сразу же готова цепь поверхностных объяснений и скорых выводов. Например: 1) поскольку фамилия образована от имени, она просто заменяет отчество (Иванов — «Иванов сын»); 2) поэтому фамилия не наследуется, заменяясь в следующих поколениях на производные от других имён; 3) Ивановых так много от того, что так много Иоаннов в святцах и Иванов на Руси (поскольку имя давалось по календарю в день крещения, то в некоторых семьях было по два и даже три сына Ивана); 4) оттого Ивановы и повсюду, что везде называли по одним и тем же святцам.
РАЗВЕНЧАНИЕ МИФОВ
Однако из этой цепочки представлений следует: 1) что календарные фамилии распространены повсеместно; 2) примерно с равной частотой во всех популяциях;
3) частота календарной фамилии во всех русских популяциях определяется частотой этого имени в святцах. Так ли это? Забегая вперёд, скажем, что всё оказалось совсем не так! Например, календарные фамилии преобладают лишь на западе русского ареала. Так в Псковской области они действительно оказались настолько часты, что, встретив некалендарную фамилию при генетическом обследовании, мы начинали въедливо доискиваться, а не было ли по отцовской линии «не псковских» предков? — и часто оказывались правы. Однако в других регионах календарные фамилии отходят на второй план. Более того, даже фамилии Иванов и Петров оказались распространены отнюдь не равномерно по русскому ареалу. Есть такие популяции, в которых они практически отсутствуют. И что ещё более удивительно — есть географические закономерности в распространении даже фамилии Иванов, не говоря о многих других фамилиях! Даже столь краткая информация говорит о том, что исходные представления зачастую неверны и не соответствуют реалиям.
Этим примером мы вовсе не надеемся убедить читателя. На опыте знаем, что переубедить в отношении фамилий просто невозможно! Те, кто имел в роду Ивановых или же бескорыстно интересовался реальным распространением этой фамилии, скажут, что изложенные факты общеизвестны. Те, кто не интересовался Ивановыми, скажут, что это, конечно же, любопытно, но вот другие фамилии… И перейдут к волнующим их фактам из жизни иной фамилии. Но в обоих случаях забывается, что Ивановы служили нам просто примером для проверки подсознательно ожидаемой картины, причём примером, показавшим, что эта картина неверна и строится на ошибочных суждениях.
ЗАБУДЕМ О МИФАХ?
Поэтому мы призываем читателя лишь на время забыть о наших субъективных представлениях и беспристрастно рассмотреть несколько более объективные цифры, которые несут некую информацию о реальном распространении фамилий. Причём важно помнить, что все эти цифры нужны нам для изучения фамилий не как таковых, а как маркёров генофонда. Даже в том случае, когда мы будем уделять внимание какой-то одной фамилии — она будет для нас важна лишь в той мере, в какой она отражает закономерности всего фонда фамилий. А потом уже, получив информацию о фонде фамилий в целом, каждому из нас будет намного увлекательнее возвращаться к конкретным фамилиям, уже представляя их соотношение с общей картиной, оживляя и расцвечивая общий фон причудливыми событиями биографии отдельных фамилий.
После этих вводных слов перейдём, наконец, к сухим цифрам частот фамилий в разных регионах — именно такие беспристрастные данные позволят отделить научные факты от мифов.
НАЗОВЕМ ФАМИЛИИ ПОИМЁННО
Добавим лишь ещё одно пояснение нашего подхода. Дело в том, что популяционная генетика, приблизив к себе фамилии и присвоив им почётное звание «квазигенетических», решительно забыла о сути фамилий как таковых. Они стали просто безличным аналогом генов. Достаточно взглянуть на любую работу по русским фамилиям — мы встретим лишь обычные генетико-статистические показатели и ни одного намёка на содержательную сторону фамилий. А ведь в них скрыта значительная глубина дополнительной информации о генофонде. Странно, что генетика, привлекая далёкие от неё данные лингвистики, этнографии, археологии, очень внимательна к их содержательной стороне, а самым близким к генетике данным о фамилиях, она отказывает в содержании.
Мы же надеялись, что если мы вглядимся в лицо фамилий, если мы сравним их «поимённо», если учтём смысловую нагрузку фамилий, которая вложена в них историей популяций и языка, то семантика фамилий создаст новый источник информации о генофонде. Не менее важный, чем стандартные показатели популяционной генетики. Их мы также рассмотрели максимально полно в заключительном разделе 7.6. Однако три раздела (7.3., 7.4., 7.5.) мы целиком посвятили попытке вернуть фамилиям, работающим в генетике, их лицо и извлечь новую, не безликую, а ёмкую и расцвеченную всей красотой русского языка информацию о пространственной структуре русского генофонда.
Мы попытались сравнить регионы по «индивидуальным» особенностям фамилий. Насколько эта попытка оказалась успешной — судить читателю. Для нас самих она словно раскрыла глаза и позволила увидеть не скупые статистические показатели, а образы генофонда, яркие черты его «фамильных» портретов. Мы надеемся, что простота красок, использованных для написания этих портретов, не смутит читателя. Они просты не оттого, что авторы не умеют или не любят считать, а оттого, что мы хотели бережно сохранить всё своеобразие этого необычного и парадоксально надёжного маркёра — фамилий.
§ 1. Частые фамилии
Обзор русских фамилий стоит начать, конечно же, с самых частых. Именно они привлекают наше внимание, когда мы говорим о различиях между русскими землями.
Частыми мы будем называть только те фамилии, которые вошли в «топ-20» — самую верхушку списка фамилий, расположенных по убыванию частот. Мы решили ответить на вопрос — а могут ли они служить визитной карточкой каждого региона? Могут ли самые частые фамилии что-то рассказать о генофондах? Попробуем пока кратко ответить на эти вопросы. А составление полных фамильных портретов регионов отложим до раздела 7.4.
АЛГОРИТМЫ АНАЛИЗА
Для каждого из восьми регионов составлен полный список фамилий, встреченных в нём.
Для каждой фамилии рассчитана её средняя частота в данном регионе.
Во всех списках фамилии расположены по убыванию их частоты.
В результате мы получили восемь таких списков частот фамилий — по числу изученных регионов.
Первые 20 фамилий этих восьми списков («топ-20»), а также первые 20 фамилий девятого — магистрального списка — приведены в таблицах 7.3.1. и 7.3.2.
Этот девятый — главный — список содержит средние частоты фамилий, рассчитанные для русского генофонда в целом. Поэтому он условно называется «магистральным списком» фамилий. Частоты фамилий в нём рассчитаны как средние только по пяти «основным» регионам. И в этом списке фамилии также расположены в порядке убывания их частоты.
«ИНДЕКС МЕСТА» (Index place — IР). Каждой фамилии присвоен её порядковый номер в «магистральном списке». Например, самой частой фамилии присвоен № 1, десятой — порядковый номер № 10, сотой — № 100 и так далее. Теперь, когда у каждой из 67 тысяч русских фамилий есть свой собственный номер, можно для каждого региона рассчитать «индекс места». Порядковый номер будет означать «балл» редкости данной фамилии (чем больше балл, тем реже эта фамилия в русском генофонде в целом), а индекс места — представляет просто сумму таких баллов, набранных частыми фамилиями региона, деленную на число суммированных фамилий. Чем меньше сумма баллов — тем ближе регион к «общему порядку» русских фамилий, тем менее своеобразен регион по частым фамилиям. Поэтому «индекс места» позволяет количественно оценить степень сходства отдельного региона со всём русским генофондом по спектру (а не по частоте) самых частых фамилий в этом регионе. Величина этого показателя будет минимальна для тех регионов, которые по частотам самых частых фамилий больше всего приближаются к «магистральному списку» русских фамилий. Поэтому такой «индекс места» является своеобразной мерой генетических расстояний региона от общерусского генофонда.
Иными словами, показатель сходства IР — сумма «магистральных» порядковых номеров фамилий в региональном списке, деленная на число суммированных частых фамилий.
IP10 — сумма баллов десяти самых частых фамилий, деленная на 10.
Мы рассчитали три показателя для каждого региона — IР20, IР10, IР5. Но поскольку они полностью вторят друг другу, здесь мы приведём лишь один показатель — IР10.
§ 1.1 РЕГИОНЫ СРЕДНЕЙ ПОЛОСЫ
Частые фамилии сразу же преподнесли нам сюрприз: оказалось, что они умеют классифицировать регионы. Для трёх регионов средней полосы — Восточного, Западного и Центрального — наиболее частыми оказались «магистральные» фамилии. А для полярных Северного и Южного регионов в перечень самых частых фамилий входят «местные», характерные для этих территорий. Читатель может и сам проверить это утверждение, сравнив списки самых частых фамилий каждого региона (табл. 7.3.1.) с магистральным списком (табл. 7.3.2).
Таблица 7.3.1.
Двадцать наиболее частых фамилий для каждого из пяти основных регионов (фамилии расположены по убыванию частоты их встречаемости в «своём» регионе)
Двадцать наиболее частых фамилий для каждого из трёх «окраинных» регионов и для «магистрального» списка русских фамилий (фамилии расположены по убыванию частоты их встречаемости)
СХОДСТВО РЕГИОНОВ средней полосы
Рис. 7.3.1. Показатель своеобразия фамилий регионов по «топ-10» (индекс места IР10)
Индекс места IР10 показывает, что все три региона средней полосы близки к спектру общерусских фамилий — к «магистральному списку». Значения IР10 незначительно варьируют около среднего для трёх регионов значения IР10=11.
Это свойство регионов средней полосы устойчиво — оно не зависит от того, рассматриваем ли мы «топ-5», «топ-10» или же «топ-20». В любом случае все три региона выступают «единым фронтом» против полярных регионов. Пока отметим лишь эту примечательную черту — а подробный анализ проведём для каждого региона отдельно при составлении его «фамильного портрета» (раздел 7.3).
ЧАСТОТЫ ЛИДЕРОВ
Каковы частоты пяти лидирующих фамилий?
ВОСТОЧНЫЙ регион: Смирнов (5.9 %), Лебедев (2.0 %), Кузнецов (1.9 %), Соколов (1.8 %), Виноградов (1.1 %).
ЦЕНТРАЛЬНЫЙ регион: Смирнов (2.3 %), Иванов (1.9 %), Соколов (1.5 %), Кузнецов (1.4 %) и Лебедев (1.3 %).
ЗАПАДНЫЙ регион: Иванов (2.8 %), Новиков (1.2 %), Козлов (1.0 %), Васильев (0.9 %), Петров (0.9 %).
§ 1.2 «ПОЛЯРНЫЕ» РЕГИОНЫ
К ним мы относим Северный и Южный регионы вовсе не потому, что они географически полярны. Нет, оказалось, что они полярны и по самым частым фамилиям: они обнаружили собственные, своеобразные спектры частых фамилий (табл. 7.3.1).
СВОЕОБРАЗИЕ ПОЛЯРНЫХ РЕГИОНОВ
Сравнение показывает, что Южный и Северный регионы обладают ярко выраженным своеобразием их спектра частых фамилий. А в каждом из трёх других регионов (средней полосы), наиболее частыми являются те фамилии, которые распространены в русском народе в целом.
Индекс места IР10 подтверждает «полярный» феномен: и Северный, и Южный регионы значительно отличаются от общерусского спектра самых частых фамилий. Спектр частых фамилий в Северном регионе (IP10=40) в 4 раза «своеобразнее», чем в регионах средней полосы (IР10=11). А спектр самых частых фамилий в Южном регионе (IР10=78) отличается ещё значительнее — в 8 раз.
Вновь подчеркнём, что своеобразие Южного региона не связано с самым большим объёмом изученного населения. Нет, Южный регион занимал своё особое место и тогда, когда в анализ были включены только 100 тысяч человек — то есть столько же, как в Восточном и Западном регионах
Примечательно, что в обоих «своеобразных» регионах на первое место вышла одна и та же фамилия — Поповы (см. карту её распространения в § 2 раздела 7.5).
«МЕСТНЫЕ» ФАМИЛИИ
Главной чертой обоих регионов являются собственные «местные» фамилии, характерные только для этого региона.
СЕВЕРНЫЙ регион — Хромцов (1.6 %), Булыгин (1.3 %), Поташев (0.8 %), Рябов (0.8 %), Черноусое (0.7 %), Бобрецов (0.8 %).
ЮЖНЫЙ регион — Гончаров (0.5 %), Шевченко (0.4 %), Колесников (0.4 %), Бондаренко (0.3 %), Ткаченко (0.3 %).
Причём встречаются эти «местные» фамилии со столь высокой частотой, что часть из них вошла даже в пятерку лидеров.
ЧАСТОТЫ ЛИДЕРОВ
СЕВЕРНЫЙ регион: Попов (1.8 %), Хромцов (1.6 %), Булыгин (1.3 %), Богданов (0.9 %), Кузнецов (0.9 %).
ЮЖНЫЙ регион: Попов (0.8 %), Гончаров (0.5 %), Шевченко (0.4 %), Ковалёв (0.4 %), Иванов (0.4 %).
§ 1.3 ОКРАИННЫЕ РЕГИОНЫ
Какие фамилии наиболее часты на периферии ареала? На этот вопрос нам поможет ответить табл. 7.3.2. Напомним, что каждый из трёх окраинных регионов демонстрирует особый вариант «окраинности». Северо-Западный регион — просто пограничный, находится на самом западном рубеже. Казачество — это «профессиональная» группа, ставшая с ходом истории особой этнографической группой русского народа. Сибирский региона — это уже даже не окраинный, а «запредельный» регион, ушедший далеко за рубежи исторического ареала формирования русского народа.
СЕВЕРО-ЗАПАДНЫЙ РЕГИОН
На северо-западе русского ареала резко преобладают календарные фамилии. Все двадцать наиболее частых фамилий — календарные. Более того, даже из 50 самых частых фамилий Северо-Западного региона 42 фамилии календарные (то есть произведённые от имён православного календаря). Таким обилием календарных фамилий Северо-Запад резко выделяется из всех остальных регионов.
И всё же надо решить, к какому из соседних регионов тяготеет Северо-Западный регион — к Северному или же к Западному (к которому он географически наиболее близок)? Индекс места IР10 однозначно показывает: Северо-Западный регион по степени отличий от «магистрального списка» фамилий оказывается очень близок к Северному, а вовсе не к Западному региону (рис. 7.3.1).
Это означает, что по степени своеобразия частых фамилий Северо-Западный регион никак нельзя отнести к регионам среднерусской полосы. Это действительно «окраинный» регион.
ЧАСТОТЫ ЛИДЕРОВ: Иванов (1.2 %), Васильев (0.9 %), Петров (0.5 %), Фёдоров (0.4 %), Михайлов (0.4.%).
КУБАНСКИЕ КАЗАКИ
На противоположной, южной оконечности русского ареала частые фамилии также своеобразны. Как и в Южном регионе, у казаков много фамилий с необычными для русских фамилий финалями.
ФИНАЛЬ «-ЕНКО». Среди двадцати частых фамилий Южного региона оказалось четыре фамилии, оканчивающихся на «енко»: Шевченко, Бондаренко, Ткаченко, Кравченко. У казаков из двадцати частых три таких фамилии: Остапенко и те же Кравченко и Бондаренко. Но в Южном регионе они более частые — «Шевченко» занимает третье место, а в среднем фамилии на «енко» среди двадцати самых частых занимают девятое место. Это попадание в первую десятку может указывать на мощный пласт в Южном регионе фамилий, общих с украинскими. Среди кубанских казаков фамилии на «енко» встречаются реже и среди двадцати самых частых занимают в среднем четырнадцатое место. В целом в обоих регионах из двадцати самых частых фамилий почти треть необычны для большинства русских регионов. Это говорит об особом «южном» паттерне, общем и для кубанских казаков, и для Южного региона (Белгородская, Курская, Воронежская области).
Однако казаков нельзя рассматривать только как «филиал» соседнего Южного региона. По спектру фамилий сходство кубанских казаков с Западным и Центральным регионами практически такое же, как и с Южным регионом. Это сходство с центральными регионами обнаруживается не по особым фамилиям, отличающим эти две южные группы от остальных, а по «всеобщим» русским фамилиям, широко распространённым во всех регионах (табл. 7.3.1. и 7.3.2).
СВОЕОБРАЗИЕ СПЕКТРА ФАМИЛИЙ. Но всё же самая важная черта фамильного портрета кубанских казаков — это их своеобразие. Оно отражено индексами места, которые зашкаливают, достигая максимальных значений — 170 (табл. 7.3.2)! Количественные оценки (рис. 7.3.1) показывают особость фамилий кубанских казаков (IР10=170), которые на порядок своеобразнее, чем в среднем для основных русских регионов (IР10=30), и даже в два раза выше, чем в самом своеобразном из них Южном регионе (IР10=78).
Конечно, численность изученных популяций казаков невелика — 18 тыс. человек. Но не так велика и общая численность всех кубанских казаков — во всяком случае, соотношение «изученные популяции/весь регион» явно в пользу кубанских казаков. Тем более, что численность изученных популяций в Центральном регионе также невысока — 25 тыс. человек, однако это не помешало ему оказаться в самом центре русского генофонда, а не на его периферии, как кубанские казаки. Это сравнение вселяет уверенность, что данный нами набросок портрета кубанских казаков отражает их реальное яркое своеобразие в масштабе русского генофонда.
ЧАСТОТЫ ЛИДЕРОВ: Перминов (0.7 %), Петров (0.7 %), Попов (0.7 %), Пономарёв (0.7 %), Новиков (0.7 %).
Не правда ли, все лидеры идут одним строем, отличаясь лишь в сотых долях частот. И это тоже характерная черта фамилий казаков.
СИБИРЬ
Тут видим картину прямо противоположную — нет и следа казачьего своеобразия. Если кубанские казаки удалены на 1400 км от центра «исконного» русского ареала, то Сибирская популяция ещё в два раза дальше — 3000 км от Москвы. Но важнее иное — она оторвана от «исконного» ареала не столько географически, сколько исторически. Это зона переселенческая, промежуточная, текучая, которой бесконечные потоки новых миграций не дают сформировать своё собственное лицо — этнографическое, антропологическое, генетическое. И «фамильный» портрет этого Сибирского региона, несмотря на удалённость от «исконного» ареала, полностью вторит среднерусской полосе. Мы видим знакомый перечень самых частых фамилий (табл. 7.3.2).
ЧАСТОТЫ ЛИДЕРОВ: Иванов (1.1 %), Попов (0.7 %), Кузнецов (0.4 %), Петров (0.4 %), Смирнов (0.4 %).
По индексу места (рис. 7.3.1.) сибирские фамилии (IР10=15) оказались почти так же близки к «магистральным» фамилиям, как и регионы средней полосы (IР10=11). Сибирские фамилии намного ближе к «магистральному» набору фамилий, чем фамилии «полярных» регионов — Южного и Северного — представляющих «исконный» ареал (IР10=59).
Это говорит о том, что перед нами совершенно особое явление.
Рассмотренный нами Сибирский генофонд географически находится далеко за пределами «исконной» территории и как бы за пределами истории формирования русского народа: он образовался уже после того, как сложился облик русского генофонда. Но именно по этим причинам Сибирский генофонд, в отличие от казаков, и воспроизводит в себе некий обобщённый образ генофонда. Отсутствие собственной истории генофонда, равная удалённость от всех частей «исконного» ареала (при взгляде из Сибири как бы стираются расстояния между разными областями «исконного» ареала) и мощный миграционный поток «отовсюду» создают некий обобщённый образ русских фамилий. Географически и исторически «запредельный» генофонд в таких условиях оказывается более общерусским, чем многие «исконные» территории, у которых была своя собственная история, сформировавшая их отличия, их своеобычность.
Итак, группы населения, находящиеся на периферии «исконного» ареала, позволили увидеть две разных модели формирования спектра частых фамилий. Казаки и северо-запад, находясь на ближней периферии «исконного» ареала, тесно связаны с его историей и потому резко своеобразны. Сибирский же регион, находясь далеко за пределами исторического ареала, усреднён мятущимися ветрами миграций: он максимально близок к общерусскому спектру фамилий.
ИТОГИ
В заключение параграфа можно сформулировать методический вывод: даже рассмотрение только 20 самых частых фамилий позволяет классифицировать генофонды (правда, чтобы «вычислить» какие фамилии самые частые, надо знать их все!). Все выводы, сделанные только по частым фамилиям — и близость трёх регионов средней русской полосы, и своеобразие «полярных» регионов, и характеристики окраинных регионов — далее подтверждены самыми различными видами анализа (разделы 7.4.J.5.J.6).
Этот методический вывод — о возможности адекватной характеристики генофонда только по самым частым фамилиям — оказался неожиданным, так он прост. Но он позволяет делать первые выразительные наброски «фамильных» портретов регионов, не дожидаясь завершения сложных видов анализа по полным фамильным спискам регионов.
§ 2. Редкие фамилии
К сожалению, геногеография — не кунсткамера. Мы не можем собирать редкости. Напротив, чтобы включить фамилии в изучение истории генофонда, нам необходимо избавиться от «информационных шумов» — то есть редких для данной популяции фамилий, которые в ней исторически случайны, эфемерны и потому мало информативны для изучения истории её генофонда. А для этого надо определить — что же такое «редкие» фамилии?
«ДЕМОГРАФИЧЕСКИЙ» КРИТЕРИЙ
Единственная информация, которой мы располагаем в нашей базе данных о каждом человеке, это его фамилия и его населенный пункт. Но мы также знаем, сколько его однофамильцев встречено во всех прочих изученных пунктах. Как же, пользуясь только этой информацией, отсеять «пришлое» население? Есть три способа, и все они основываются на том, что пришельцев не может быть слишком много — пришлые фамилии в среднем более редкие, чем коренные. Первый способ — исключить фамилии с частотой ниже заданной (частотный критерий). Второй способ — исключить фамилии, встречающиеся только в одном-двух пунктах (территориальный критерий). Третий способ — исключить фамилии, численность которых во всём районе меньше заданной (демографический критерий).
Мы предложили «демографический» критерий для исключения «залётных» фамилий: фамилия включается в анализ, если число носителей данной фамилии, достигших репродуктивного возраста, превышает четыре человека в районе.
Подчеркнём, что именно в районе, а не в локальной популяции (селе, сельсовете). Это означает, что даже в том случае, если пять носителей фамилии разбросаны по разным весям одного района и в каждой из пяти отдалённых деревень есть лишь по одному носителю фамилии, то фамилия всё равно будет включена в анализ. Средняя численность сельских жителей, достигших репродуктивного возраста, в административных районах, изученных нами, составила около 25 000 человек (от 4000 до 60000). Достаточно пяти «однофамильцев» из многих тысяч сельских жителей района — и их фамилия уже включается в анализ. Таков «демографический» критерий.
Мы назвали его «демографическим», так как он соответствует генетико-демографическим представлениям о расширенном воспроизводстве семьи: двое родителей и более 2 детей, достигших репродуктивного возраста. Именно эти его свойства позволяют предположить, что этот критерий обеспечит отбор тех исторически «неслучайных» фамилий, у которых есть шанс закрепиться в данном генофонде.
Подчеркнём, что предложенный «демографический» критерий не является чрезмерно строгим. Достаточно всего пяти человек с данной фамилией из десятков тысяч жителей района для того, чтобы фамилия была включена в разряд «распространённых», т. е. предположительно «коренных» фамилий. Но при этом «демографический» критерий всё же позволяет отсеять те редкие фамилии, которые занесены миграционными потоками, но ещё не успели укорениться в данной популяции. Конечно же, вместе с пришлыми, «залётными» фамилиями могут быть отсеяны и исчезающие коренные фамилии. Все мы знаем случаи, когда из-за стечения обстоятельств не осталось мужского потомства, и потому старые «родовитые» фамилии затухают и исчезают. Но обычно редкие коренные фамилии составляют едва приметную часть среди множества редких пришлых фамилий.
ИСКЛЮЧЕНИЕ «ПРИШЛЫХ» ФАМИЛИЙ
Но к нашему удивлению, несмотря на свою мягкость, «демографический» критерий позволил нам исключить огромный массив редких фамилий. Они составили три четверти от всех встреченных фамилий (табл. 7.3.3).
Так, в Западном регионе после применения этого критерия из 13 тысяч фамилий осталось 3 тысячи: они причислены к «коренным», а 10 тысяч редких фамилий могут рассматриваться как «залётные» (ни в одном из 8 районов ни одна из этих фамилий не соответствует демографическому критерию). В Южном регионе — из 40 тысяч фамилий в основной анализ включаются 10 тысяч (30 тысяч отсеянных редких фамилий ни в одном из 24 районов не встречаются чаще, чем у четырёх жителей района). В Центральном — из 4 тысяч фамилий к коренным отнесена 1 тысяча фамилий. А в Северном регионе после отсева редких фамилий из 6 тысяч фамилий осталось менее 2 тысяч. Большинство расчётов мы проводили по оставшейся четверти — «коренным» фамилиям (то есть по фамилиям, уже «пустившим корни» в данной популяции, уже оставившим в ней генетический след). Благодаря этому, мы можем быть уверены, что мы изучаем историю формирования народа, а не мимолётные потоки последних миграций.
Важно подчеркнуть, что такая прополка фамилий почти не сокращает численность выборки! После применения демографического критерия (табл. 7.3.3.) отсеивается три четверти фамилий (число фамилий сокращается в среднем на 75 %), но число анализируемых индивидов сокращается только на одну пятую часть: в Северном и Восточном регионах отсеивается 22 % индивидов, в Западном
— 29 %, в Южном — 20 %, в Центральном — 21 %. Иными словами, число редких «пришлых» фамилий составляет три четверти всех фамилий, а число «пришлых» индивидов (их носителей) — лишь одну пятую часть всего населения. Это и понятно — ведь эти фамилии редки, и потому, несмотря на столь значительный массив редких фамилий, число их носителей невелико. И потому, исключив редкие «залётные» фамилии, мы исключаем из анализа небольшую часть популяции.
В дальнейший анализ мы включили ту информацию, которая осталась после отсева редких фамилий — данные о распространении 14428 условно «коренных» фамилий, охватывающую более 725 тыс. человек. Избавляясь от значительного «информационного шума» редких фамилий, мы переходим к анализу основной массы «коренного» населения данного региона — и при этом без существенных потерь в численности: носители «коренных» фамилий составляют в среднем 77 % от всего населения (табл. 7.3.3).
Таблица. 7.3.3.
Число фамилий и число индивидуумов до и после исключения редких фамилий
§ 3. «Всеобщие» фамилии
Итак, мы дали характеристику как самых частых фамилий (§ 1) так и самых редких фамилий (§ 2) сумев разделить фамилии в каждом районе на условно «залётные» (крайне редкие) и «коренные» (достаточно распространённые). Но всё же намного любопытнее иной вопрос — вопрос о наличии «всеобщих» фамилий на всём протяжении русского ареала.
Есть ли такие «всеобщие» фамилии, которые встречаются во всех географически разобщённых регионах? Сколько таких «общерусских» фамилий? Достаточно ли их для сравнения регионов друг с другом? Не окажется ли, что в каждом регионе свой собственный спектр фамилий, совершенно отличный от других регионов? Не распадается ли русский генофонд на части, не сравнимые друг с другом по составу фамилий? Эти опасения возникли не на пустом месте.
Дело в том, что в работах других исследователей фамилий русского народа [Ельчинова и др., 1991] отмечалось, что из-за малого числа «всеобщих» фамилий использование фамилий даёт адекватные результаты только при изучении соседних районов, в самом крайнем случае — соседних областей. Это означает, что изучать весь огромный русский генофонд по фамилиям вообще нельзя. Так ли это на самом деле? Теперь, когда собраны фамилии всех основных регионов русского ареала, можно попробовать ответить на этот вопрос с цифрами в руках.
МНОГО ЛИ ВСЕОБЩИХ ФАМИЛИЙ?
Уже в § 1 можно было заметить, что некоторые частые фамилии встречаются во всех регионах — они являются всеобщими. Но частые фамилии — это даже не вершина айсберга, а лишь горстка льдинок на его вершине. Поэтому надо выяснить: а сколько же всего всеобщих фамилий? Забегая вперёд, скажем, что их оказалось на удивление много! Это даёт нам полное право анализировать не только соседние, но и географически отдалённые территории.
Всеобщие фамилии нельзя выявлять напрямую, «в лоб». Мы уже видели на примере Сибирского региона, что мигранты создают некий общий фон фамилий, которые — благодаря только поздним «индустриальным» миграциям — могут встречаться повсеместно. Мигранты, пришельцы, «перекати поле» есть повсюду, и они разносят свои фамилии, делая их общими для всех регионов. Носителей каждой такой фамилии в регионе будет совсем немного, но много будет самих фамилий, и встретить мы можем эти «пришлые» фамилии повсюду, в любых регионах. Такая амальгама, покрывающая генофонд, ничего не расскажет нам о его истории. Напротив, она лишь скроет общность истории регионов под тонкой вуалью вездесущих «залётных» фамилий. Поэтому, если мы будем выявлять всеобщие фамилии для всего изученного населения, то «пришельцы» дадут нам массу «залётных» общих фамилий и заслонят те фамилии, которые действительно исторически связывают регионы.
Поэтому количество всеобщих фамилий мы оценили после того, как отсеяли редкие «пришлые» фамилии — иначе всеобщих фамилий было бы очень много.
Выше (§ 2) рассказывалось, как мы подошли к такой непростой «прополке» фамилий. В её результате (по «демографическому» критерию) отсеялось очень много — в среднем 75 % от всех встреченных в районе фамилий. То есть три четверти фамилий оказались редкими и с большой вероятностью были «залётными», «пришлыми». Только после того, как у нас осталась только четверть фамилий, которые можно было увереннее относить к «коренным», мы стали среди этого остатка выявлять всеобщие фамилии для регионов.
Даже при столь жёстких условиях, когда за бортом оставлена значительная масса «залётных» фамилий, число всеобщих для всех регионов фамилий оказалось неожиданно велико — 257 фамилий.
Это означает, что примерно десятая часть (13 %) «коренных» фамилий каждого региона встречается не только у него, и не только ещё в некоторых соседних регионах, но одновременно во всех пяти географически отдалённых регионах.
Но самое удивительное, что добавление в анализ самого отдалённого — Сибирского — региона убавило число «всеобщих» фамилий на ничтожную величину! Из списка исчезло всего 7 фамилий, не встреченных в Сибирском регионе. Это снова означает, что Сибирский регион не привнёс новых сведений в перечень всеобщих фамилий, и что изученные нами пять регионов в «исконном» русском ареале дают достаточно устойчивое представление обо всех «общерусских» фамилиях. Возможно, это говорит о том, что мы выявили главные черты портрета «общерусских» фамилий, список которых приведён в таблице 7.3.4.
Поскольку публикация этого списка «всеобщих» русских фамилий [КоммерсантЪ Власть, 2005] вызвала большой резонанс и большие недоразумения, просим читателя обратить внимание, что всеобщие фамилии — это вовсе не «топ-250», то есть вовсе не 250 самых частых русских фамилий! Это не вершина айсберга русских фамилий. Нет, перед Вами (табл. 7.3.4.) список, который намного важнее, чем «топ-250» — перед Вами полный список «всеобщих» русских фамилий. Он включает все фамилии, которые встречаются одновременно во всех пяти основных регионах «исконного» русского ареала, то есть исторического ареала формирования русского народа. Причём этот список содержит только «коренные» фамилии каждого из регионов — он получен после того, как в каждом из 50 изученных районов с помощью демографического критерия были отсеяны три четверти фамилий, отнесённых к редким, «залётным». А из оставшейся четверти «коренных» фамилий были отобраны только те фамилии, которые встречаются во всех пяти основных регионах. И потому полученный список «всеобщих» фамилий наиболее объективен — он включает фамилии, распространённые во всех основных русских регионах и отражающие наиболее общие черты «фамильного портрета» русского народа.
ГДЕ СКОЛЬКО?
Мы теперь знаем, что в среднем 13 % фамилий региона встречаются повсеместно в «исконном» русском ареале. Это действительно очень много! Но расскажут ли всеобщие фамилии об истории регионов? Не окажется ли так, что всеобщие фамилии отражают не общность происхождения населения, а просто общие для всех святцы (по которым даются имена, а от них календарные фамилии), общие для всех профессии (везде были и кузнецы, и священный сан), распространение одних и тех же зверей и птиц? Если это так, то всеобщие фамилии нам попросту неинтересны для восстановления истории народа. Ведь в таком случае они возникли в разных регионах независимо и ничего не говорят о родстве популяций. Более того, в таком случае они являются информационным шумом, мешающим разглядеть историю русского генофонда.
Но так ли это? Проверить гипотезу просто. Для этого надо лишь узнать, с какой частотой встречаются всеобщие фамилии в разных регионах. Нулевая гипотеза предполагает, что все фамилии возникали независимо в разных местах и определялись лишь частотой того или иного имени, профессии или зверя. Например, Ивановы-Петровы-Сидоровы везде возникали с той частотой, с какой они присутствуют в церковном календаре (святцах). А поскольку святцы всюду те же, то, согласно нулевой гипотезе, и всеобщие фамилии Ивановы-Петровы-Сидоровы должны встречаться в любом регионе с равной частотой. Но если же нулевая гипотеза неверна, то в разных регионах мы обнаружим разную частоту Ивановых-Петровых-Сидоровых.
Проверим, действительно ли всеобщие календарные фамилии имеют примерно одинаковую частоту во всех регионах? Охватить взглядом всё множество 250 «всеобщих» фамилий нелегко. Поэтому выберем из них первые пятьдесят (самые частые из всеобщих фамилий) и сравним по ним регионы (рис. 7.3.2.).
На рис. 7.3.2. представлена гистограмма всеобщих для пяти регионов фамилий.
График показывает ярче, чем любая таблица, что частоты фамилий быстро выходят на плато — лишь 10–20 из всеобщих фамилий можно отнести к самым частым. А остальные фамилии уже мало отличаются друг от друга по частоте. Это подтверждает справедливость сравнения регионов по «топ-5», «топ-10» и «топ-20» фамилий, проведенном в начале этого раздела (§ 1).
Укажем и на другую важнейшую черту гистограммы: общерусские фамилии не покрывают регионы неким аморфным равномерным покровом. Напротив, в каждом регионе общерусские фамилии встречаются со своей собственной, характерной частотой.
Например, обратим внимание на календарные фамилии. Именно для них мы могли ожидать равномерного распределения по всем регионам, поскольку везде имена давались по одним и тем же святцам. Набор таких фамилий на графике достаточно велик — 22 календарные фамилии. Но и для них мы не обнаруживаем единообразного распределения по регионам, не видим равномерного растекания по поверхности русского ареала.
Рис. 7.3.2. Частота встречаемости «топ-50» всеобщих фамилий в пяти регионах (Восточном, Центральном, Западном, Северном, Южном).
Примечания: Высота столбца отражает сумму частот данной фамилии в пяти регионах. Части столбца, выполненные той или иной штриховкой, соответствуют «вкладу» каждого из регионов в «общерусскую» частоту фамилии: белый цвет — Центр, косая штриховка — Восток, черный цвет — Юг, серый цвет — Запад, горизонтальная штриховка — Север.
Таблица 7.3.4.
Полный список и частоты 250 «всеобщих» фамилий, встречающихся во пяти регионах исторического ареала русского народа и в Сибири (расположены по убыванию средней русской частоты)
Итак, нулевая гипотеза не подтвердилась: оказалось, что всеобщие фамилии распространены в каждом регионе со своей собственной частотой. Это даёт твердое основание считать, что сравнение регионов по всеобщим фамилиям будет информативно для изучения истории генофонда.
КАКИЕ ФАМИЛИИ?
Чтобы ответить на этот вопрос, фамилии надо классифицировать.
В науке об именах указываются классы фамилий — и календарные, и «птичьи», и профессиональные. Но отнесение фамилии к тому или иному классу по плечу только специалисту в области науки об именах — ономастике. Во всех остальных областях (антропологии, дерматоглифики, археологии) мы работали рука об руку с известными специалистами. Но среди лингвистов мы так и не нашли таких, которые подключились бы к работе с нашим уникальным банком данных о фамилиях. Для обычного геногеографического анализа, когда фамилии используются как аналог генов, знания семантики, т. е. смыслового содержания фамилий, не нужны. Но чтобы обрисовать «фамильный портрет» генофонда, без такого знания уже не обойтись. Поэтому нам оставалось самим, чисто дилетантски набросать классификацию и разнести фамилии по классам.
Мы сознаём, что могли совершить при этом немало ошибок. Фамилия — непростое слово. Возможна, например, различная «звуковая запись», когда чужую речь укладываешь в слова, близкие родному языку. Примеров такой «народной этимологии» превеликое множество.
Так, остров Сахалин в русском быту прозывался «Соколиным» (В. Короленко. Соколинец). Ведь и вправду так ближе и понятнее? А сложная по звучанию коренная адыгейская фамилия (ведь в адыгейском языке в два раза больше звуков, чем букв в русском языке!) записывалась в паспорта как «Нехай», подражая украинскому языку. И вообще дилетант может придумать сколько угодно своих «переводов» фамилий. Авторы тоже имеют свою гипотезу из области «народной этимологии» — что самая частая восточная фамилия «Смирнов» происходит не от смирного характера, а от названия реки Унжа, переводимой с местного дославянско-го языка как «Смирная». Популяции по реке Унжа, где обнаружен максимум «Смирновых», были восточным рубежом славянского расселения. На запад от него, где и расселялись славяне, жили «смирные» славянизированные племена мери. А на восток от рубежа — воинственные племена мари. Примеры такой «народной этимологии» можно множить до бесконечности.
Сознавая неизбежность ошибок, мы всё же решились от безвыходности сами классифицировать фамилии, в уверенности, что статистический подход нивелирует случайные ошибки, и в надежде, что со временем найдётся профессионал, который нас исправит.
КАЛЕНДАРНЫЕ ФАМИЛИИ
Это фамилии, произведённые от имени из «святцев» — православного календаря.
Вопреки распространенному мнению, что самыми русскими фамилиями являются «Ивановы-Петровы-Сидоровы», в действительности оказалось, что в первой десятке («топ-10») общих фамилий есть лишь одна календарная (Иванов)! Календарные фамилии оттеснены в конец списка: если каждой дать балл, равный её порядковому номеру (фамилии расставлены по убыванию частоты), то средняя позиция календарных фамилий среди «топ-50» всеобщих фамилий окажется равной 31 — то есть они сосредоточены в «нижней» половине списка.
Но хотя и располагаясь в конце списка, календарные фамилии довольно многочисленны — 22 фамилии (44 % из «топ-50» всеобщих фамилий).
«ЗВЕРИНЫЕ» ФАМИЛИИ
К ним мы отнесли все фамилии, имеющие связь с живым на Земле — не только зверей, но и птиц, и рыб, и насекомых, и растения, и даже части растений (например, Листьев, Цветков). Велик соблазн объяснить их наличие «тотемной» памятью, но такие смелые интерпретации непозволительны дилетантам — здесь должны сказать своё слово профессионалы в области ономастики.
Больше всех — девять в списке «топ-50» общерусских фамилий — оказалось «птичьих» фамилий (по порядку убывания частоты: Соколов, Лебедев, Соловьёв, Голубев, Воробьёв, Орлов, Гусев, Куликов, Сорокин). Причём Лебедевы встречаются намного чаще в Восточном регионе (с частотой 1.94 %), а в Южных краях Лебедевых совсем мало (0.09 %). За ними следуют «истинно звериные» фамилии. Их в «топ-50» общерусских фамилий всего четыре: это Козлов, Волков, Зайцев, Баранов. А ещё есть Виноградовы, которые чаще всего встречаются в Восточном регионе (1.13 %), а вовсе не в Южном, где их частота минимальна (0.02 %). А также Комаровы, которых в Северном краю (0.24 %) в два раза меньше, чем в Восточном (0.59 %). И ещё Ершовы, обитающие в Восточном (0.49 %) и Северном (0.38 %) регионах.
Всего «звериных» фамилий несколько меньше, чем календарных — их 16 в «топ-50» общерусских фамилий (32 %). Но ранг их выше — средний балл, средняя позиция их равна 22, а не 31, как для календарных. Это означает, что «звериные» фамилии в среднем более частые, чем календарные, они сосредоточены в «верхней» половине списка. И действительно, как мы видим в первой десятке «топ-50» оказалось целых четыре «звериных» фамилии — Соколов, Лебедев, Козлов, Соловьёв.
ПРОФЕССИОНАЛЬНЫЕ ФАМИЛИИ
Профессиональных фамилий оказалось четыре в «топ-50» общерусских фамилий (8 %): это Кузнецов, Попов, Ковалёв и Пономарёв[47]. Две из них входят в первую десятку, и в целом они занимают «высокое» положение — их средняя позиция равна 21 (в списке из «топ-50» всеобщих фамилий). Наибольшая частота Кузнецовых, как мы видим из таблицы 7.3.4., в Восточном и Центральном регионах, Ковалёвых — в Западном и Южном. Эти два названия одной «кузнечной» профессии обычно связывают с диалектными различиями (см. сравнение карт их распространения в разделе 7.5. § 2). Но, например, и у казаков, и в Южном, и в Западном регионах распространены обе эти фамилии (входят в «топ-20» этих регионов). Наибольшая частота Поповых и Пономарёвых — в Северном регионе.
«ПРИМЕТНЫЕ» ФАМИЛИИ
Среди остальных фамилий можно выделить «приметные» — они как бы отмечают особенности внешнего или социального облика человека, его «приметы». «Приметных» фамилий оказалось лишь пять из 50 (10 %): Смирнов, Новиков, Беляев, Белов и Кудрявцев. Зато занимают «приметные» фамилии самое высокое место из всех классов фамилий — их средняя позиция равна 17 (в списке из 50 фамилий).
Конечно же, самая необычная из «приметных» фамилий — Смирновы. Фамилия «Смирнов» вообще лидирует в списке общерусских фамилий (средняя частота в пяти регионах 1.9 %), значительно опережая Ивановых (1.3 %). Необычайно высока частота Смирновых в Восточном регионе (5.9 %!), но и в Центральном они также являются самой распространённой фамилией (2.3 %). Причём не только по нашим (пока ещё ограниченным) данным, но и по тотальным спискам русского населения (устное сообщение) Смирновы являются самой частой русской фамилией. Более того, средняя частота Смирновых в русских популяциях выше, чем Ивановых, Петровых и Сидоровых вместе взятых!
Примечательно, что у казаков Смирновых очень мало — они занимают отдалённое 128 место. Видимо, не прижились
ИНЫЕ ФАМИЛИИ
Это те фамилии, которые нельзя однозначно отнести к одной из четырёх выделенных групп фамилий. Несомненно, что дальше «иные» фамилии могут быть подразделены, но пока лучше их объединить в своеобразный класс «неклассифицируемых» фамилий. Так будет осторожнее.
Они включают три (6 %) из «топ-50» общерусских фамилий: Морозовы, Киселёвы и Королёвы.
ПОДВЕДЁМ ИТОГИ
1. Итак, среди основных регионов «исконного» ареала мы обнаружили большой массив (257) фамилий, которые одновременно встречаются во всех пяти регионах. Всеобщие фамилии составляют в среднем 13 % от всех «коренных» фамилий региона.
2. Этот массив «общерусских» фамилий включает только «коренные» фамилии. Мы предварительно отсеяли «пришлые», «залётные» и поэтому очень редкие фамилии.
3. Общерусские фамилии не распределены однообразным слоем по всем регионам — нет, каждая фамилия имеет свою географию. Это ярко иллюстрируют и карты раздела 7.5, где представлено географическое распространение ряда общерусских фамилий.
4. Полученные нами результаты позволяют считать, что всеобщие фамилии отражают не только географию, но и историю сложения русского генофонда.
5. Подразделив всеобщие фамилии на пять семантических классов, мы определили их долю в списке из «топ-50» — пятидесяти самых частых всеобщих фамилий.
Больше всего оказалось КАЛЕНДАРНЫХ (44 %) и «ЗВЕРИНЫХ» фамилий (32 %). В три-четыре раза меньше ПРОФЕССИОНАЛЬНЫХ (8 %) и «ПРИМЕТНЫХ» фамилий (10 %). Замыкают ряд ИНЫЕ фамилии (6 %) — те фамилии, которые нельзя однозначно отнести к остальным четырем классам.
6. Однако если оценить, какое место эти классы фамилий занимают по их средней частоте в русском генофонде (а не по числу фамилий в «топ-50»), то картина оказывается совсем иной.
По частоте на первые места выходят «приметные», профессиональные и вновь «звериные» фамилии, а календарные фамилии отодвигаются на последнее место. Это вновь указывает, что хотя календарных фамилий и много в фонде фамилий, но не они создают его лицо.
Эти пять классов фамилий в следующем разделе использованы для описания особенностей каждого региона (раздел 7.4). Мы увидим, что этих пяти ярких красок достаточно, чтобы набросать выразительные и неповторимые «фамильные портреты» каждого региона.
7.4. «ФАМИЛЬНЫЕ ПОРТРЕТЫ» РЕГИОНОВ
§ 1. Основные регионы; ЮГ: необычайное обилие «профессиональных» фамилий — Яркое своеобразие — Но нет «лидеров»; СЕВЕР: самый оригинальный — Засилье «иных» фамилий — диалектных; ВОСТОК: Смирный русский лидер — Обилие «приметных» фамилий; ЗАПАД: типичен — Но календарных фамилий больше половины; ЦЕНТР: и по фамилиям центральный — Но половина фамилий «звериные»
§ 2. Что на окраинах? СЕВЕРО-ЗАПАД: Ивановы, Петровы, Сидоровы — Почти все фамилии календарные; КАЗАКИ: тяготеют к Югу — Но не Южный «филиал» — Особые приметы — Хорошие связи с центром; СИБИРЬ: усреднённый портрет русского генофонда — Ближе всего к самому дальнему Западу
§ 3. Яркие краски «фамильных портретов»: Пять красок — Пять классов фамилий — Личный портрет региона — Вызываем фамилии поимённо
Есть ли примечательные особенности в фамильном составе каждого из регионов? Какие черты «фамильного портрета» делают регион отличным от других? Или же напротив, выявляют его сходство с другими регионами? На эти вопросы мы попробуем ответить в этом разделе. Мы начнём изучение пространственной структуры русского генофонда с того, что рассмотрим «фамильные портреты» каждой из пяти основных его частей, особенности каждого из его регионов. А затем рассмотрим, как они выглядят на фоне «фамильных портретов» окраинных регионов.
§ 1. Основные регионы: Юг, Север, Восток, Запад и Центр
Чтобы не терялось обаяние отдельных фамилий, чтобы региональные портреты были обозримы и сравнимы друг с другом, мы рассмотрим их не по всему множеству их фамилий, а пока только по спектру 50 наиболее частых — «топ-50» каждого региона. Этого достаточно, чтобы разглядеть основные черты региональных генофондов.
«ТОП-50» РЕГИОНА — ЭТО НЕ «ТОП-50» ВСЕОБЩИХ ФАМИЛИИ!
Ещё раз напоминаем во избежание недоразумений: в предыдущем разделе (7.3. § 3) рассматривался «топ-50» всеобщих, общерусских фамилий, то есть 50 самых частых фамилий из 257 фамилий, встреченных одновременно во всех пяти регионах.
Теперь мы рассматриваем совсем иные списки. Сначала анализируем весь список фамилий, встреченных в конкретном регионе. Расставляем их по убыванию частоты. А затем отбираем 50 наиболее распространённых фамилий в этом регионе. Они и составляют «топ-50» для данного региона. Для каждого региона такая процедура проводится отдельно, поэтому для каждого региона этот список свой — 50 фамилий, самых распространённых в данном регионе.
АЛГОРИТМЫ АНАЛИЗА
«ТОП-50» РЕГИОНА. Для каждого региона составлен полный список фамилий, встреченных в нём. Для каждой фамилии рассчитана её средняя частота в данном регионе. Фамилии расположены по убыванию их частоты. Отобраны 50 самых частых фамилий, для которых и проводится анализ — «топ-50» региона. Такая процедура проведена с каждым регионом отдельно. Отобранные фамилии мы условно называем «распространёнными», чтобы отличить от двадцати «частых» («топ-20»), рассмотренных в разделе 7.1. Итак, у нас получилось восемь списков «топ-50» — для восьми изученных регионов: пяти основных (Восточный, Центральный, Западный, Северный, Южный) и трёх окраинных (Северо-Запад, казаки, Сибирь).
«ТОП-50» ВСЕОБЩИХ ФАМИЛИЙ. Это список «коренных» фамилий, которые встречены одновременно во всех пяти основных регионах. Всего в этом списке 257 фамилий, и из него также ранее были отобраны 50 самых частых — именно этот список мы детально анализировали в предыдущем разделе (7.3. § 3). Эти «топ-50» всеобщих фамилий в данном разделе мы называем просто «общерусскими» или «всеобщими». Их мы используем для оценки своеобразия регионов — проверяем, какие из «топ-50» всеобщих фамилий вошли в списки «топ-50» региональных фамилий.
ОЦЕНКА НАЛИЧИЯ «ОБЩЕРУССКИХ» ФАМИЛИЙ В «ТОП-50» РЕГИОНА. Сравнение «топ-50» региона с «топ-50» всеобщих фамилий проведено с помощью обычного показателя связи — коэффициента контингенции к. Он оценивает сходство регионов не по частоте фамилии, а поимённо — есть ли такая «общерусская» фамилия в данном регионе или её нет.
ДИАПАЗОН РАЗЛИЧИЙ Δ50 количественно оценивает разницу между частотами первой фамилии и последней фамилии в «топ-50» региона. Оказывается, что регионы могут значительно различаться по этому показателю скорости падения частот. Порой для полноты описания приводятся и диапазоны различий между другими блоками фамилий в регионе, например между 49 фамилиями (Δ49) или же двадцатью (Δ20). Между какими именно фамилиями рассчитана разница частот, указано в тексте.
КЛАССЫ ФАМИЛИЙ. Рассмотрено, какая доля фамилий из «топ-50» фамилий приходится на каждый из пяти выделенных нами классов фамилий: календарные, «звериные», профессиональные, «приметные», иные.
§ 1.1. ЮЖНЫЙ РЕГИОН
Не умея вместить в график все 40 тысяч фамилий, встреченных в Южном регионе, мы привели реестр наиболее распространённых 50 фамилий «топ-50», расположив их по убыванию частоты (табл. 7.4.1). Здесь же для остальных регионов приведены значения в них частот этих «южных» фамилий. Это позволяет, взяв за точку отсчёта только «южные» фамилии, увидеть, где они также распространены, а где отсутствуют. Иными словами, мы смотрим на весь мир русских фамилий глазами Южного региона.
СПЕКТР «ЮЖНЫХ» ФАМИЛИЙ
Список 50 распространённых фамилий в Южном регионе отличается ярким своеобразием. На первый план в «топ-50» Юга вышли «свои» фамилии, не характерные для других регионов: Шевченко, Колесников, Бондаренко, Ткаченко, Шаповалов, Литвинов, Черных, Капустин, Коваленко, Калашников, Шевцов, Ткачёв…
При этом в «топ-50» южных фамилий нет многих общерусских фамилий: отсутствуют Смирнов, Васильев, Павлов, Голубев, Воробьёв, Соловьёв и даже столь «южные» фамилии как Виноградов, Лебедев, Орлов (можно сравнить таблицы 7.4.1. и 7.3.4). Зато Медведевых в Южном регионе оказалось в три раза больше, чем в Северном. Поэтому расхожее мнение, что где больше водится каких «зверей», там и больше производных от них «звериных» фамилий, не подтверждается. Хотя специальный количественный анализ ещё впереди — для этого надо искать сведения о флоре и фауне не современности, а ушедших веков. Надо заглянуть в «звериный» мир тех поколений, когда формировался фонд «звериных» фамилий.
ЧАСТОТЫ «ЮЖНЫХ» ФАМИЛИЙ
Спектр «топ-50» сразу указывает на своеобразие «фамильного портрета» Южного региона. Например, в списке общерусских фамилий (табл. 7.3.4) первое место занимают Смирновы. Они являются лидерами в Восточном (5.9 %) и Центральном (2.3 %) регионах. Однако в Южном регионе Смирновы встречаются с частотой лишь 0.08 %! Самая распространённая фамилия Западного региона — Иванов (2.8 %) — в Южном регионе встречается с частотой в семь раз меньшей! А самая распространённая фамилия Северного региона — Попов (1.8 %) — в Южном регионе также является лидером, однако её частота в два раза ниже — лишь 0.8 %. Причём даже такая невысокая частота (0.82 %) для «южных» фамилий является уже огромной: следующие за Поповыми фамилии встречаются уже в два раза реже: Гончаровы (0.45 %), Шевченко (0.44 %) и Ковалёвы (0.41 %), Ивановы (0.40 %).
ДИАПАЗОН РАЗЛИЧИЙ Δ50
Кривая частот «южных» фамилий практически сразу — за исключением первой точки с лидирующей фамилией Попов — выходит на плато. Поэтому диапазон (Δ50) между наиболее частой фамилией и пятидесятой по счёту составил очень низкую величину Δ50=0.7 %, резко отличающую Южный регион от всех других регионов. Если мы не будем учитывать лидера (Поповых), то диапазон различий снизится до вообще неощутимой величины Δ49=0.3 %. В других регионах диапазон различий Δ50 на порядок выше. В среднем он составляет Δ50=2.5 %, варьируя в других регионах в пределах 1.5 %<Δ50<5.6 %.
Особо отметим, что столь низкая величина Δ50=0.7 % в Южном регионе не связана с большим объёмом информации (655 тыс. чел.) в Южном регионе. В первоначальном варианте анализа, когда Южный регион был представлен такой же выборкой, как и остальные регионы (≈100 тыс. чел.), показатель Юга был всё тем же: Δ50=0.62 %. Такая устойчивость Δ50 (0.66 % и 0.62 % при шестикратном увеличении выборки) указывает на важность этого показателя для выявления специфических черт «фамильного портрета». Независимость Δ50 от набора и объёма изученных популяций говорит нам о том, что невысокие частоты даже самых распространённых фамилий — исторически сложившаяся особенность фамилий Юга.
Примечание: фамилии расположены по убыванию средней частоты в Южном регионе.
ФАМИЛИИ НА «-ЕНКО»
Напомним, что когда мы рассматривали «топ-20» (раздел 7.3), то среди 20 самых частых фамилий обнаружили четыре с финалем «-енко» (Шевченко, Бондаренко, Ткаченко, Кравченко). Не случайность ли это? Проверим их градиент. В «топ-10» — 30 % фамилий на «-енко».» В «топ-20» — 20 %. В «топ-50» — 16 %. Среди 10 тысяч «коренных южных» фамилий — их 13 %. Среди всех 40 тысяч фамилий, встреченных в Южном регионе, — их 8 %. Такой градиент падения частоты (от 30 % до 8 %) по мере увеличения списка фамилий (то есть включения все более редких фамилий) может означать, что хотя доля фамилий, оканчивающихся на «-енко», невелика, но она далеко не случайна. Эти фамилии не занесены случайными потоками миграций, а присутствуют с высокой частотой и являются устойчивой, яркой и своеобразной чертой «фамильного портрета» Южного региона.
КЛАССЫ ЮЖНЫХ ФАМИЛИЙ
Таблица 7.4.1.
Взгляд с юга: сравнение регионов по фамилиям «топ-50» Южного региона
ПРОФЕССИОНАЛЬНЫЕ. Очень ярко выражено своеобразие Южного региона и по смысловой нагрузке фамилий — в «топ-50» огромное число профессиональных фамилий: 34 %.
Они охватывают широчайший круг профессий — это и ткачи, и кузнецы, и гончары, и бондари, и портные, и шапошники (Шаповалов), и пекари (Калашников), и колесных дел мастера. Причём один и тот же род деятельности представлен несколькими частыми фамилиями, отражая не только диалектные различия, но зачастую и разделение труда в данной профессии. Бондари — Бондарев и Бондаренко. Ткачи — Ткачёв и Ткаченко. Кузнецы — Кузнецов, Ковалёв и Коваленко. Портные — Кравцов и Кравченко, Шевцов и Шевченко.
В «топ-50» остальных регионов (и основных, и окраинных) профессиональных фамилий совсем мало: их доля колеблется в узких пределах от 2 % до 8 %. Исключением, подтверждающим правило, служат кубанские казаки — у них процент профессиональных фамилий подскакивает до 22 %, отражая интенсивность связей с Южным регионом. Такие резкие различия (2 %-8% для большинства регионов, и 34 % для Южного) трудно посчитать случайными. Можно предположить, что они указывают на устоявшуюся традицию образования фамилий, характерную именно для Южного региона. Эта традиция — образование фамилии от профессии её носителя.
КАЛЕНДАРНЫЕ. На втором месте стоят календарные фамилии — их 32 % среди 50 «южных» фамилий. Именно календарные фамилии во многом связывают Южный регион с Западным, который лидирует по числу календарных фамилий среди основных регионов — 60 %. А в окраинном Северо-Западном регионе — почти сплошь календарные фамилии: 82 %. В Северном регионе их тоже много, даже больше, чем на юге, но спектр их иной, своеобразный.
«ЗВЕРИНЫЕ». Зато «звериных» фамилий в Южном регионе совсем немного — лишь 12 % (Козлов, Капустин и Волков идут на юге единым блоком с одинаковой частотой 0.2 %). Это один из самых низких показателей — ни в одном из регионов доля «звериных» фамилий не опускается ниже 10 %. В то время как максимальная доля «зверйных» фамилий достигает 50 %.
«ПРИМЕТНЫЕ». «Приметных» фамилий тоже мало — 14 %, но они очень выразительно говорят о наличии миграции и, возможно, об облике пришельцев: Новиков, Литвинов («Литвинами» русские называли и белорусов, которые до воссоединения с Россией жили в составе Литовского, а затем Польско-Литовского государства), Черкашин («черкашами» называли население правобережной Украины и казаков Поднепровья), Черных, Лысенко, Головин (большеголовый, умный).
ИНЫЕ. Оставшиеся неклассифицированными нами 8 % фамилий включены в класс «иные» (мы не сомневаемся, что специалисту-филологу удастся подразделить этот класс с большим успехом).
Но в целом оказывается, что даже такая простая и дилетантская классификация, подразделяющая всего лишь пятьдесят распространённых фамилий на пять классов (календарные, профессиональные, «звериные», «приметные», иные), помогает составить образ региона и сформулировать некоторые гипотезы. Эти гипотезы, конечно же, требуют проверки на других, более обширных данных.
ИТОГ
Самая яркая черта «фамильного портрета» Юга — это необычайное обилие «профессиональных» фамилий. В целом «фамильный портрет» Южного региона запечатлевает его ярко выраженное своеобразие: и в спектре фамилий, и в отсутствии ярко выраженных «лидеров» — все распространённые фамилии представлены примерно равными невысокими частотами.
§ 1.2. СЕВЕРНЫЙ РЕГИОН
СРАВНЕНИЕ РЕГИОНОВ ПО «СЕВЕРНЫМ» ФАМИЛИЯМ
В табл. 7.4.2. приведён реестр 50 наиболее распространённых фамилий Северного региона, расположенных по убыванию их частоты. Там же приведены частоты этих «северных» фамилий в остальных четырёх регионах «исконного» русского ареала.
ДИАПАЗОН РАЗЛИЧИЙ Δ50
Размах различий между самой частой «северной» фамилией и пятидесятой по частоте (Δ50=1.5) в два раза больше, чем в Южном регионе (Δ50=0.7). Однако при этом «северный» Δ50=1.5 меньше как средней величины (Δ50=2.5), так и Δ50 регионов средней полосы (2.0<Δ50<5.6). Падение частот продолжается до середины «топ-50», и лишь с двадцать четвертой фамилии график выходит на плато.
СПЕКТР «СЕВЕРНЫХ» ФАМИЛИЙ
Так же как и в Южном, в Северном регионе преобладают «свои» фамилии, которые нигде более не встречаются со сколько-нибудь заметной частотой. Они рисуют своеобразный «фамильный портрет» Русского Севера: Хромцов, Булыгин, Рябов, Бобрецов, Черноусое, Мёрзлый, Лешуков, Кувалдин, Филин… При этом в «топ-50» Северного региона (табл. 7.4.2) нет почти половины (23) из «топ-50» «общерусских» фамилий (табл. 7.3.4), что также указывает на своеобразие «фамильного портрета» Русского Севера.
КЛАССЫ ФАМИЛИЙ
Какие же там фамилии есть?
В отличие от юга на севере почти нет ПРОФЕССИОНАЛЬНЫХ фамилий — только 6 % из «топ-50» (это Попов, Кузнецов и Пономарёв).
Но и «ЗВЕРИНЫХ» фамилий тоже очень мало — ещё меньше, чем на юге: всего лишь 10 % из 50 фамилий (Бобрецов, Ершов, Листов, Соколов, Филин).
«ПРИМЕТНЫХ» фамилий также немного -12 %, и они довольно своеобразны: Хромцов, Рябов, Черноусое, Суханов, Ширяев (широкоплечий), а также вездесущий Новиков.
КАЛЕНДАРНЫХ довольно много — 38 % от списка, но их состав необычен. Например, Ивановы на Русском Севере оказались на 21 месте по частоте, уступив первенство таким редким в других регионах фамилиям, как Дорофеев (8 место) и Лазарев (11 место).
Таблица 7.4.2.
Взгляд с севера: сравнение регионов по фамилиям «топ-50» Северного региона
ИНЫЕ ФАМИЛИИ
Но главное отличие «северных» фамилий — огромное количество «иных» фамилий — 34 %!
Во всех остальных регионах, включая окраинные, доля «иных» фамилий колеблется от 0 до 14 %. И вновь такие резкие различия (0 %-14 % с одной стороны, и 34 % с другой стороны) трудно посчитать случайными. Можно думать, что они прямо указывают на особость северных диалектов или же на устоявшуюся традицию образования фамилий, характерную именно для Северного региона.
Таблица. 7.4.3.
Взгляд с востока: сравнение регионов по фамилиям «топ-50» Восточного региона
Среди них две очень северные фамилии — Мёрзлый и Морозов (обычно Морозом называли детей, родившихся в морозные дни). Но основная часть — это диалектные фамилии: Лешуков (считается, что так называли детей в качестве их «оберега» от леших), Порохин (что связывается с зимней порошей), Ошуков (диалектное производное от православного имени Осип, т. е. Иосиф), Сауков (диалектное производное от православного имени Савва), Галашев (диалектное имя от «Галактион»), Фофанов (диалектное имя от Феофан, но также и прозвищное имя, «простофиля»), Чурсанов («Чур» — славянское языческое божество домашнего очага), а также Третьяков и Шестаков (третий и шестой ребенок в семье), Булыгин, Кувалдин, Когин, Дверин и Карманов. Но мы не стали распределять эти «иные» фамилии по соответствующим классам: Ошукова, Саукова, Галашева и Галактионова не причислили к календарным, а оставили в «иных», точно так же не причислили к «приметным» Третьякова и Шестакова. Мы решили проявить осторожность — ведь мы не можем гарантировать справедливость такой этимологии. Мы предпочли оставить эти фамилии в классе «иных», пока не найдётся специалист, способный классифицировать их более грамотно, чем мы.
Столько «иных» фамилий нет даже среди казаков — у них лишь 14 % «иных» фамилий. В общем, фамилии Русского Севера — поле работы сперва для профессиональных лингвистов, а лишь потом — для генетиков.
ИТОГ
«Фамильный портрет» Северного региона демонстрирует максимальное своеобразие, которое выражено ещё ярче, чем в Южном регионе. Это своеобразие наиболее выпукло отражено в огромном числе «иных» фамилий, главным образом, диалектных.
§ 1.3. ВОСТОЧНЫЙ РЕГИОН
Впрочем, у Восточного региона тоже необычный характер (табл. 7.4.3).
СМИРНОВЫ
Главная русская фамилия — Смирнов, как мы уже видели. И потому, прежде всего, бросается в глаза необычайно высокая частота Смирновых в Восточном регионе — 5.9 %!
Эта частота в 2–7 раз выше, чем частоты лидеров в других регионах. Например, в Западном регионе самая частая фамилия — Иванов, но её частота только 2.8 %. В остальных регионах частоты фамилий, занявших первое место, ещё ниже. Лидером в Центральном регионе оказались те же Смирновы, но их частота — 2.3 %. Лидирующие частоты Поповых мы уже приводили — 1.8 % на Русском Севере и 0.8 % в Южном регионе. При таких частотах лидеров в других регионах видно, сколь удивительно высока частота Смирновых в Восточном регионе — она достигает почти 6 %! Этот феномен не имеет аналогов среди почти 70 тысяч изученных нами русских фамилий.
Мы уже говорили о том, что Смирновы выходят на первое место среди русских фамилий. Но мы видим, что они выходят не ровным шагом (во всех регионах поровну), а резким рывком в Восточном и Центральном регионах. Особость Смирновых ждёт своих исследователей. Тем более, что Тихомировы распространены в Восточном регионе тоже с высокой частотой (0.8 %).
Примечание: фамилии расположены по убыванию средней частоты в Восточном регионе
КЛАССЫ ФАМИЛИЙ
Вторая особенность — среди «топ-50» Восточного региона встречено намного меньше, чем в других регионах, КАЛЕНДАРНЫХ фамилий — всего лишь 14 %! В остальных регионах, за исключением Центрального, они варьируют в диапазоне от 32 % до 82 %.
В-третьих, почти нет (лишь 8 %) ПРОФЕССИОНАЛЬНЫХ фамилий — это Попов, Кузнецов, Дудин (как изготавливающий дудки, так и играющий на них)
и… Дворецкий!
В-четвертых, восточные фамилии изобилуют «ЗВЕРИНЫМИ» — их 36 %. Среди них лидируют Лебедевы, которые занимают второе место в списке фамилий, а на четвёртом и пятом местах находятся Соколовы и Виноградовы. Во второй половине списка есть и Орловы, и Гусевы. Таков неожиданно южный колорит фамильного портрета Восточного региона. Там есть, конечно, и Бобровы, и Соболевы, но они замыкают список 50 самых распространённых «восточных» фамилий. Сразу укажем: по числу «звериных» фамилий Восточный регион намного отстает от Центрального, где их доля достигает 50 %!
В-пятых, и это главная особенность Восточного региона — это необычайно высокая частота «ПРИМЕТНЫХ» фамилий — 36 %.
Столько нет ни в одном регионе — там их от 6 % до 16 %. И вновь отметим, что такие резкие различия (6 %-16 % с одной стороны, и 36 % с другой стороны) нельзя счесть случайными. Они указывают на устоявшуюся традицию образования фамилий для Восточного региона. Эта традиция — образование фамилий по «приметам», характерным чертам носителя фамилии.
И фамилии какие славные — Смирнов и Тихомиров, Беляев и Белов, Серов и Рыжов, Сизов и Румянцев, Шорохов (со следами оспинок) и Крутиков, Большаков и Громов (сильный голос, часто певчие), Чистяков и Скрябин (т. е. «чистюля», от «скрябать»), Кудрявцев и Кудряшов, Разумов и Веселов… Все вместе они рисуют очень радостный портрет Восточного региона. Всё же удивительно, насколько различается палитра красок фамильных портретов! Вспомним, что в Северном регионе «приметными» фамилиями были Хромцов, Рябов, Черноусое, Лешуков, Суханов. А в Южном — Новиков, Литвинов, Черных, Головин, Лысенко. Налицо три совершенно разных портрета!
ДИАПАЗОН РАЗЛИЧИЙ
Разрыв Δ50 между наиболее частой «восточной» фамилией и пятидесятой по частоте (Δ50=5.6) оказался самым большим из всех регионов. Но достигается он за счёт экстремально высокой частоты Смирновых — без них диапазон различий Δ49=1.7 снижается до «среднерусской» величины. Хотя на плато график выходит только к двадцатой фамилии, в целом он, в отличие от предыдущих, характеризуется отсутствием резких всплесков.
СРАВНЕНИЕ РЕГИОНОВ ПО «ВОСТОЧНЫМ» ФАМИЛИЯМ
Это отражается и в очень высоких коэффициентах корреляции: по «восточным» фамилиям мы наблюдаем согласованное изменение между Северным и Западным (r=0.76), Северным и Центральным (r=0.75) и даже Северным и Южным (r=0.81) регионами.
ИТОГ
Самая яркая черта «фамильного портрета» Востока — необычайное обилие «приметных» фамилий.
В целом, «фамильный портрет» Восточного региона сочетает в себе как черты выраженного своеобразия (экстремальная частота Смирновых, редкость календарных фамилий, преобладание «звериных» и «приметных» фамилий), так и близость то к одним, то к другим регионам, а в целом — к чертам общерусского генофонда.
§ 1.4. ЗАПАДНЫЙ РЕГИОН
СРАВНЕНИЕ РЕГИОНОВ ПО «ЗАПАДНЫМ» ФАМИЛИЯМ
Частоты 50 наиболее распространённых фамилий в Западном регионе (табл. 7.4.4) показывают хорошую согласованность «западных» фамилий со значениями частот в других регионах. Они свидетельствуют о ещё большем приближении к неким общерусским характеристикам, чем в Восточном регионе. Что отражает в необычайно высоких коэффициентах корреляции. По «западным» фамилиям мы наблюдаем полностью согласованное изменение между Северным и Восточным (r=0.97), Восточным и Южным (r=0.92) регионами.
ДИАПАЗОН РАЗЛИЧИЙ
Диапазон частот Δ50 между наиболее частой и пятидесятой «западной» фамилией точно соответствует среднему значению по пяти русским регионам (Δ50=2.5). Однако это достигается за счёт резкого повышения частоты Ивановых — без них Δ49=1.0, приближаясь к показателям Южного региона.
СПЕКТР «ЗАПАДНЫХ» ФАМИЛИЙ
«Фамильный портрет» Запада очень беден «своими» неповторимыми фамилиями (Поляков, Журавлев, Зуев). В целом Западный регион можно считать довольно типичным русским регионом. Это единственный регион, все 50 распространённых фамилий которого встречаются и во всех остальных четырёх регионах, причём в Восточном и Центральном регионах их частота сравнима с Западным.
КЛАССЫ ФАМИЛИЙ
КАЛЕНДАРНЫЕ. У Западного региона есть одно, но очень яркое отличие — преобладание календарных фамилий — 60 %. Если в других основных регионах календарные фамилии колеблются от 14 % до 38 %, то в Западном регионе их в два-четыре раза больше!
Мы уже упоминали о том, что в Северо-Западном регионе эта черта выражена ещё ярче (82 % календарных фамилий). Вновь подчеркнём: такие резкие различия между регионами (14 %-38 % в одних регионах, и 60 %-82 % — в других) нельзя счесть случайными.
Они указывают на устоявшуюся традицию образования фамилий, характерную именно для Западного региона. Эта традиция — образование фамилий от имён православного календаря — отличает западные и северо-западные русские популяции от всех остальных.
Похоже, общественное мнение, что русские фамилии — это календарные фамилии, сформировано резким смещением акцентов на западные регионы. Видимо, это мнение сформировано нашими западными соседями по тем областям русского ареала, которые им были географически близки и исторически знакомы.
«ЗВЕРИНЫХ» фамилий тоже немало — 26 %. Это, конечно, не так много, как в других регионах средней полосы — в Восточном (где их 36 %) и в Центральном (где их 50 %). Но зато в два-три раза больше, чем в «полярных» регионах — на юге (12 %) и на севере (10 %). Кроме «звериных» фамилий, вошедших в фамильные портреты и других регионов (Козлов, Зайцев, Волков, Медведев, Соколов, Соловьёв, Лебедев, Орлов, Воробьёв, Сорокин, Комаров), в Западном регионе появляются и две новые «птичьи» фамилии — Журавлёв и Зуев.
Таблица 7.4.4.
Взгляд с запада: соавнение регионов по фамилиям «топ-50» Западного региона
ПРОФЕССИОНАЛЬНЫХ фамилий на западе почти нет (4 %) — только Кузнецовы и Поповы вошли в «топ-50» Западного региона.
«ПРИМЕТНЫХ» фамилий также мало (6 %), и
они свидетельствуют о связях с другими регионами: Поляковы говорят о географической близости Польши; Новиковы сближают Запад с другими регионами (они занимают 2 место на западе, 6 место — на юге, 13 место — на севере, 19 место — в центре); Смирновы (занимая 6 место в списке региона) объединяют Запад с другими регионами средней полосы (Центральным и Восточным), в которых Смирновы занимают первое место.
ИНЫЕ фамилии (4 %) представлены лишь Морозовыми и Киселевыми.
ИТОГ
Таким образом, главная черта «фамильного портрета» Западного региона — его типичность, сходство со всеми другими регионами.
Однако при этом он отличается от всех иных регионов необычайно яркой особенностью: резким преобладанием календарных фамилий.
§ 1.5. ЦЕНТРАЛЬНЫЙ РЕГИОН
Перейдём к последнему изученному нами региону «исконного» ареала — Центральному (табл. 7.4.5). Напомним, что центр русского ареала пока представлен самой маленькой популяцией — всего одним районом численностью в 25 тыс. человек. И, тем не менее, этот регион можно назвать действительно центральным, среднестатистическим регионом.
СРАВНЕНИЕ РЕГИОНОВ ПО «ЦЕНТРАЛЬНЫМ» ФАМИЛИЯМ
Наиболее частая фамилия в Центральном регионе та же, что и для всех русских фамилий в целом — Смирнов. Но встречается она в центре реже (2.3 %), чем в Восточном регионе (5.9 %), демонстрируя умеренность.
ДИАПАЗОН РАЗЛИЧИЙ
Диапазон частот Δ50 между наиболее частой «центральной» фамилией и пятидесятой (Δ50!=2.0) также близок к среднему русскому значению (Δ50!=2.5).
КЛАССЫ ФАМИЛИЙ
Из общерусских фамилий в «центральные» не попали такие профессиональные фамилии, как Поповы, Пономарёвы, Ковалёвы, а также ряд календарных фамилий.
КАЛЕНДАРНЫХ фамилий среди «центральных» вообще немного — всего 18 %, и встречаются они не так часто.
«ЗВЕРИНЫХ» фамилий необычайно много -50 %! Обилие «звериных» фамилий — отличительная черта Центрального региона.
Столько не было даже в Восточном регионе (где их 36 %). А в остальных регионах их в два-пять раз меньше, чем в Центральном — в диапазоне от 10 % до 26 %. Причём «звериные» фамилии лидируют среди «центральных» не только по числу, но и по положению — среди первых семнадцати фамилий «звериных» оказалось одиннадцать. Из двадцати пяти «центральных» «звериных» фамилий пятнадцать (Баранов, Виноградов, Волков, Воробьёв, Голубев, Гусев, Зайцев, Козлов, Комаров, Куликов, Лебедев, Орлов, Соколов, Соловьёв, Сорокин) вошли в общерусский перечень благодаря регионам средней полосы (на севере и юге их мало). Однако среди «центральных» «звериных» фамилий есть ещё и «свои», особые, которые рисуют особый облик Центрального региона — Бобров, Воронин, Жуков, Журавлев, Калинин, Корольков, Крылов, Скворцов, Соболев, Цветков.
Примечание: фамилии расположены по убыванию средней частоты в Центральном регионе.
ПРОФЕССИОНАЛЬНЫХ фамилий почти нет
(4 %) — это Кузнецов, Рыбаков (эта фамилия появляется впервые). А Королёвых в этот класс мы включить не можем — за неимением королей на Руси, филологи относят Королёвых к прозвищным фамилиям, а не к профессиональным.
«ПРИМЕТНЫХ» фамилий много — 16 %, но они во многом вторят Восточному региону — Смирнов, Белов, Беляев, Белоусов, Румянцев, Кудрявцев, Чистяков, Новиков.
ИНЫХ фамилий — 12 %. Среди них ярко выделяются свои собственные, «хозяйственные» — Блинов, Горшков, и примкнувший к ним общерусский Киселёв. В этот класс вошли не только вездесущие Новиков и Морозов, но и неожиданный Королёв.
Таблица 7.4.5.
Взгляд из центра: сравнение регионов по фамилиям «топ-50» Центрального региона
ИТОГ
Это означает, что Центральный регион оказался действительно центральным в пространстве русских фамилий практически по всем показателям. Однако, несмотря на «усреднённость» Центрального региона, связанного с его географически срединным положением, у него есть и свои яркие собственные черты.
Это, прежде всего, необычайно большой и пестрый массив «звериных» фамилий — они составляют половину «топ-50» Центрального региона.
§ 2. Что на окраинах? Северо-запад, казаки, Сибирь
Окраинные регионы привлекаются нами лишь как фон при изучении русского генофонда. С их помощью мы хотим разглядеть, как выглядит фамильный фонд при выходе на периферию «исконного» ареала. Продолжаются ли выявленные закономерности? Можно ли их уточнить? Не ошиблись ли мы, ограничив себя только «исконным» ареалом? Мы уже дали набросок «окраинных фамильных портретов» по спектру частых фамилий (раздел 7.3). Здесь же мы рассмотрим окраинные регионы с помощью иного инструмента — семантических классов, смысловой нагрузки фамилий. Не проводя целиком все виды анализа, взглянем лишь повнимательнее, как распределяются фамилии «топ-50» по пяти семантическим классам (табл. 7.4.6).
СЕВЕРО-ЗАПАДНЫЙ РЕГИОН
КАЛЕНДАРНЫЕ. Этот удивительный регион представлен почти исключительно календарными фамилиями — их 82 %. Это, пожалуй, самый необычный феномен среди всех рассмотренных нами «фамильных портретов». Обилие календарных фамилий, конечно же, сближает Северо-Западный регион с Западным (где их 60 %). Однако и на Русском Севере календарных фамилий немало. Если учесть диалектные производные от православных имён, их число может возрасти до 46–50 %. Можно предположить, что традиция образования фамилий от имён православного календаря происходит именно от Северо-Западного региона, но эта гипотеза нуждается в проверке совсем иными методами ономастики.
Календарных фамилий в псковских землях вообще настолько много, что когда встречаешь не календарную фамилию, она выглядит «чужой». При экспедиционном сборе образцов для анализа ДНК полиморфизма, мы составляли родословные для каждого обследуемого. И действительно, когда в Псковской области нам попадалась не календарная фамилия, очень часто оказывалось, что её носитель нам не подходит — его предки уводили нас за пределы Северо-Западного региона.
«ЗВЕРИНЫЕ» фамилии занимают второе место (10 %) — Волков, Жуков, Орлов, Козлов, Лебедев, но их так мало, и отодвинуты они календарными фамилиями в конец списка 50 «северо-западных» фамилий. По спектру «звериных» фамилий Северо-Западный регион тяготеет к средней русской полосе в целом: по обилию «звериных» фамилий все три региона средней русской полосы (26–50 %) ярко выделяются среди остальных регионов (10–18 %).
ПРОФЕССИОНАЛЬНАЯ фамилия в «топ-50» лишь одна (2 %) — Кузнецовы.
«ПРИМЕТНЫХ» фамилий лишь три (6 %) — общерусские Смирновы, Богдановы (от нецерковного имени Богдан, «Богом данный» — так называли внебрачных детей, приёмных или долгожданных) и собственные Быстровы.
ИНЫМ фамилиям вообще не осталось места (0 %).
На все фамилии, кроме календарных, остаётся так мало мест в «топ-50», что нам в порядке исключения приходится рассмотреть не только 50, но и 100 наиболее распространённых фамилий. В «топ-100» Северо-Запада характерными фамилиями оказались: Быстров, Бойков, Веселов, Малышев, Большаков, Белов, Вихров, Кудрявцев, Казаков, Громов. Эти фамилии создают эмоционально окрашенный портрет русского Северо-Запада — светлый и радостный.
КУБАНСКИЕ КАЗАКИ
Мы уже говорили о ярко выраженном своеобразии фамилий кубанских казаков по частым фамилиям. Эти закономерности сохранились и при переходе к «фамильному портрету» казаков по семантическим классам «топ-50».
ПРОФЕССИОНАЛЬНЫЕ. Самой яркой чертой «фамильного портрета» кубанских казаков является резкое возрастание числа профессиональных фамилий (22 %). В этом кубанские казаки вторят Южному региону, где мы видим традицию образования фамилий от профессии (34 %). У кубанских казаков профессиональных фамилий, правда, меньше, чем среди «южных» фамилий, но зато в пять раз больше, чем в остальных регионах! Среди «кубанских» профессиональных фамилий есть и те, которые вошли в список 50 общерусских фамилий (Пономарёв и Попов, Кузнецов и Ковалёв). Есть и т е, которые были только в Южном регионе, насыщенном «профессиональными» фамилиями (Гончаров и Гончаренко, Бондаренко, Шевченко, Кравченко, Ткаченко). Но есть и одна новая, «своя» фамилия — Рыбалко.
КАЛЕНДАРНЫЕ. И по числу календарных фамилий кубанские казаки (34 %) также вторят Южному региону (32 %). Из них больше половины присутствует в списке 50 общерусских фамилий (Петров, Иванов, Яковлев, Романов, Борисов, Семенов, Андреев, Захаров). Но зато остальные фамилии — свои собственные, неповторимые: Самойлов (от имени Самуил), Остапенко (от имени Евстафий), Федошов (от Феодора), Онищенко (от уменьшительного Оня, производимого от многих имён — Семён, Онисий, Иона, Леонтий и другие), Пешков (от имени Петр), Кононов (от имён Конон, Кондратий, Никон), Василевич, Фоминов и Фоменко.
ИНЫЕ фамилии (14 %) включили много диалектных производных, которые без участия специалистов мы не можем ни разбить на уже выделенные классы, ни выделить новые классы фамилий.
«ЗВЕРИНЫХ» фамилий (16 %) несколько больше, чем на юге (12 %). Большая часть их также присутствует в списке 50 общерусских фамилий (вездесущие Воробьёв, Волков, Зайцев, Козлов, Соколов и Лебедев), но две кубанских фамилии в этот список не вошли — Медведев и Клещенко.
«ПРИМЕТНЫХ» фамилий (14 %) столько же, как и на юге (14 %). Они во многом вторят «южным приметным» фамилиям — Новиков, Литвинов, Лысенко, а вместо «южного» Черных среди кубанских есть сразу два аналога — и Черновы, и Чернышовы. Косян и Белоусов дополняют этот портрет.
В целом, «фамильный портрет» кубанских казаков по 50 распространённым фамилиям тяготеет более всего к географически близкому Южному региону. Но фамильный фонд кубанских казаков никак нельзя рассматривать как «филиал» Южного региона. У него богатый спектр неповторимых черт и устойчивые связи с общерусским ядром фамилий.
СИБИРСКИЙ РЕГИОН
Сибирский регион также уже подробно рассматривался по спектру самых частых фамилий (раздел 7.3. § 1). Мы видели, что Сибирь не отличается своеобразием и воспроизводит как бы «усреднённый» фамильный портрет русского народа. На этом общем фоне он оказался несколько ближе к регионам средней русской полосы и непохож на «полярные» регионы. Меняет ли эту картину увеличение числа рассматриваемых фамилий и проведение иного вида анализа — семантических классов фамилий? Нельзя ли обнаружить, к каким именно регионам фамилии Сибири обнаруживают большее тяготение?
Множество потоков миграций в разные времена поставляли население из «исконного» русского ареала в Сибирь. Поход Ермака был из первых, открывших эти миграции. Но ныне население Сибири столь велико, что старожильческий пласт перекрыт куда более мощными миграциями. Миграционный поток «отовсюду» создал некий обобщённый облик русских фамилий. Смешение привело к тому, что «запредельный» сибирский генофонд стал более общерусским, чем «исконные» территории. Но не позволит ли наш новый инструмент обнаружить, откуда шли главные потоки миграций?
СРАВНЕНИЕ РЕГИОНОВ ПО «СИБИРСКИМ» ФАМИЛИЯМ
Распределив «топ-50» сибирских фамилий по семантическим классам, мы обнаруживаем их неожиданное сходство с Западным регионом.
КАЛЕНДАРНЫЕ. Прежде всего, конечно, бросается в глаза сходство Сибирского и Западного регионов по преобладанию календарных фамилий (58 %). Среди «сибирских» фамилий их необычайно много — и точно такая же доля календарных фамилий характерна для Западного региона (60 %). В остальных регионах «исконного» ареала число календарных фамилий в среднем в два раза меньше! Причём близкими Запад и Сибирь оказались не только по количеству, но и по спектру календарных фамилий: две трети «сибирских» фамилий присутствуют среди «западных» календарных фамилий. Совпадение по 19 фамилиям из 30 календарных трудно счесть случайностью. Тем более что из них четырёх фамилий (Григорьев, Дмитриев, Егоров, Фролов) в общерусском списке нет, однако они есть и в Сибирском, и в Западном регионах.
ПРОФЕССИОНАЛЬНЫХ фамилий мало (6 %), что также свойственно обоим регионам. В Сибирском регионе среди 50 распространённых фамилий есть только Поповы, Кузнецовы и Овчинниковы (скорняки — возможно, здесь проявляется сибирский колорит), а в Западном — есть только Кузнецовы и Ковалёвы.
«ЗВЕРИНЫХ» фамилий среди сибирских несколько меньше (18 %), чем среди западных (26 %).
Все «сибирские звериные» фамилии (кроме одной) вошли в список распространённых фамилий и Западного региона. Казалось бы, это может указывать на их сходство. Но дело в том, что в «сибирском» списке присутствуют самые распространённые «звериные» фамилии. По убыванию частоты это: Зайцев, Козлов, Волков, Орлов, Лебедев, Баранов, Воробьёв, Медведев, Соловьёв. В «западном» списке есть все, кроме Баранова. В «восточном» и «центральном» — есть все, кроме Медведева. С «южным» списком «сибирский» роднят уже не восемь фамилий, а только четыре — Зайцев, Козлов, Волков и Медведев. С «северным» вообще нет общих «звериных» фамилий. Итак, сравнение спектра фамилий вновь обнаруживает очень большое сходство Сибирского региона со средней русской полосой (во всех трёх регионах — по восемь совпадающих фамилий из девяти «сибирских») и отличия «сибирского» от «полярных» регионов.
«ПРИМЕТНЫЕ» фамилии отличают Сибирский регион (12 %) от Западного (6 %). В Сибирском портрете, кроме общерусских «красок» (Смирнов, Белов, Беляев, Чернов), есть и особые черты — Казаков, Горбунов.
Таким образом, анализ семантических классов «топ-50» фамилий подтвердил выводы, полученные по общему спектру частых фамилий («топ-5», «топ-10», «топ-20»). Вновь Сибирский регион проявил себя как некий обобщённый портрет русского генофонда. При этом он ближе всего к регионам средней русской полосы, а не к «полярным» — Северному и Южному. Но анализ с помощью нового инструмента — классов фамилий — позволяет предположить, что из всех регионов средней полосы Сибирский регион более всего тяготеет к Западному, который географически наиболее от него удалён.
Можно выдвинуть гипотезу, что в бесчисленных потоках миграций была наиболее мощная волна мигрантов из Западного региона. Могут быть и более любопытные гипотезы — о происхождении фонда фамилий самого Западного региона. Но выдвижение и проверка гипотез происхождения — задача отдельная. Сейчас важно лишь подчеркнуть, что новый инструмент — семантические классы фамилий — позволяет формулировать и проверять гипотезы о путях формирования генофонда.
§ 3. Яркие краски фамильных портретов
Теперь у нас есть «фамильный портрет» для каждого региона «исконного» русского ареала. В чём особенность этих портретов?
ОТ БЕЗЛИКИХ ЦИФР — К КРАСКАМ
Прежде всего — в нашем подходе к самим фамилиям. Мы позволили им говорить — и они рассказали нам нечто совсем новое о русском генофонде, его структуре. Они поведали о столь ярких чертах каждого портрета, что мы теперь можем легко различать регионы. Мы получили новый инструмент для анализа сходства и различий разных регионов.
Напомним, что в популяционной генетике фамилии давно стали безликим аналогом генов. Взгляните на любую работу. Там от феерического многообразия фамилий обычно остаётся одна цифра — показатель инбридинга. В разделе 7.6. мы тоже приводим созданную нами по данным о русских фамилиях карту инбридинга. Такая карта полезна для многих задач — например, для прогноза груза наследственной патологии в русском населении. Но на этой карте сведения о 14 тысячах русских фамилий свернулись в один безликий показатель инбридинга.
Популяционная генетика, следуя законам своей науки, решала проблемы генофонда в рамках и в терминах привычных моделей — подразделенные популяции, инбридинг, генетическое разнообразие, структура генофонда… И среди этих моделей и высоких целей как-то забыла о сути фамилий. Забыла о том, что фамилии не безликий маркёр, а яркий феномен языка. За века фамилии накопили сгусток информации о традиции словообразования. И эти традиции различны в разных регионах. Поэтому сама семантика фамилий несет новую информацию о пространственной структуре генофонда.
ПЯТЬ КРАСОК — ПЯТЬ КЛАССОВ ФАМИЛИЙ
Поэтому мы решили вглядеться «в лицо фамилий», сравнить их «поимённо», учесть их семантику, то есть смысловую нагрузку фамилий. Мы попытались извлечь не безликую информацию, а расцвеченные всей красотой русского языка сведения о генофонде.
По пяти семантическим классам — профессиональные, календарные, «звериные», «приметные», иные фамилии — мы разнесли 50 самых распространённых фамилий каждого региона. Вроде бы немудрёное занятие, но результат получился удивительный: мы обнаружили личный фамильный портрет каждого региона. Мы видим, что у каждого региона есть свой неповторимый профиль фамилий, который не перепутаешь с другим. Эти результаты сведены в таблице 7.4.6.
Такая таблица, ни в коем в случае не претендуя на точность и научную строгость, всё же позволяет качественно оценить, в каком из географических регионов каких фамилий больше. Мы обнаруживаем, что каждый регион имеет своё лицо, свой особый, «индивидуальный» фамильный портрет, созданный с помощью лишь пяти красок — пяти классов фамилий.
Западный регион: лидирует с огромным отрывом по КАЛЕНДАРНЫМ фамилиям.
Южный регион: его принадлежность — это
ПРОФЕССИОНАЛЬНЫЕ фамилии.
Центральный регион: лидирует по «ЗВЕРИНЫМ» фамилиям.
Восточный регион: резко отличается большим массивом «ПРИМЕТНЫХ» фамилий.
Русский Север: главная черта — это ИНЫЕ, не сводимые к остальным классам, фамилии.
Итак, даже такая простая классификация фамилий позволяет увидеть своеобразные черты каждого географического региона в пределах «исконного» русского ареала. Видимо, мы обнаружили своеобразную традицию образования фамилий в каждом регионе.
СЕМАНТИКА ФАМИЛИЙ — НОВЫЙ ОБРАЗ ГЕНОФОНДА
Таблица 7.4.6.
Доля разных классов фамилий (в %) среди «ТОП-50» каждого региона
Самое главное, что фамильные портреты могут стать новым инструментом анализа генофонда. Этот инструмент основан на семантике фамилий, их смысловой нагрузке: он извлекает новый пласт информации, позволяя сравнить регионы друг с другом. Он отслеживает потоки миграций, их след в фамилиях региона. Используя «фамильные портреты» основных регионов как эталоны, можно изучать с помощью этого инструмента другие генофонды.
Как работает этот инструмент? Мы сравнили фамильные портреты окраин (Северо-Запад, казаки, Сибирь) с эталонами, то есть с фамильными портретами «исконного» ареала. Проверка нового инструмента показала, что он хорошо работает даже в окраинных регионах, как мы видели в предыдущем параграфе.
ЧТО ПОКАЗАЛ ЭКСПЕРИМЕНТ?
Подведём краткий итог проверки нового инструмента. Мы видим, что, называя фамилии «поимённо», вернув им лицо, обратившись к семантике фамилий, мы обрели новую информацию. Это позволяет нам утверждать, что «фамильные портреты» оказались новым инструментом познания генофонда — его структуры и истории. Применение этого инструмента даёт новые сведения о генофонде, об источниках миграций.
Конечно, это пока лишь хорошие рабочие гипотезы. Основываясь на анализе только «топ-50» говорить о сходстве и различиях регионов ещё рано. Необходимо провести сравнительный анализ всего многотысячного фонда фамилий. Эта большая работа ещё впереди — она станет отдельной темой книги о русских фамилиях (а пока кратко приведена в разделе 7.6).
И всё же наш опыт работы свидетельствует, что наиболее яркие и своеобразные, наиболее «свои» черты генофонда проявляются в его наиболее частых фамилиях. Это вселяет в нас надежду, что выявленные нами закономерности «фамильных портретов» не просто реальны, но и отражают самые главные особенности изученных генофондов.
7.5. ГЕОГРАФИЯ ОТДЕЛЬНЫХ ФАМИЛИЙ
§ 1. Карты русских фамилий: От Абрамова до Яковлева — Карты 75 фамилий — Невероятная устойчивость
§ 2. Кто где? Восточные Смирновы и западные Ивановы — Ты Кузнец или Коваль? — Два полюса Поповых — Недружные Дружинины — Неразлучные Козловы и Волковы — «Лоскутное одеяло» для Морозовых — Соловьёвы средней полосы — Близнецы Петровы и Васильевы — Путешествующие Никитины и прозападные Григорьевы — Центральный хребет и полярные пустыни Беловых сами по себе
§ 3. Что показали карты? Характер карты независим… от частоты фамилии — Каждой фамилии по ареалу — В запредельных землях различия стираются — 75 граней одного кристалла — Южные оазисы Черновых — Котовы, которые гуляютИтак, мы рассмотрели, как соотносятся друг с другом регионы по распространённым фамилиям. «Лица» отдельных фамилий порой исчезали в толпе, но все вместе они помогли каждому региону занять его истинное место в русском генофонде.
Теперь мы рассмотрим эту картину как бы наоборот: не как выглядит отдельный регион по совокупности фамилий, а как выглядят сразу все регионы только по одной фамилии. В этом нам помогут «простые» карты — карты встречаемости отдельной фамилии, но во всех русских популяциях. Объём книги допускает привести карты лишь нескольких фамилий. Но и они позволяют охватить взглядом сразу весь генофонд, увидев его так, как он виден глазами одной из многих тысяч фамилий. И увидеть с помощью не сухих цифр, а картографических образов.
Всё же, как ни важен статистический анализ, главным инструментом геногеографии остаётся карта. Она
даёт наиболее живой и объективный образ пространственной изменчивости, позволяет одним взглядом охватить огромное количество цифр, мелькающих в таблицах.
§ 1. Карты русских фамилий
КАК ЧИТАТЬ КАРТЫ
Карта каждой фамилии построена по данным о частотах этой фамилии в 100 русских популяциях (50 районов, 50 сельсоветов). Напомним, что частоты в районах рассчитаны по данным обо всём населении района старше 18 лет. И вновь повторим (для читателя, не заглядывавшего в другие главы книги), что высокие частоты встречаемости фамилии окрашены в тёмные тона, низкие частоты — в светлые тона. Все карты даны в единой шкале частот, поэтому их легко сравнить: на всех картах фамилий один и тот же оттенок шкалы означает одну и ту же частоту. Исключение составляет лишь последний «открытый» интервал — он включает любые частоты больше 2 %. Шкала частот приведена в верхнем окне легенды карты, а высота столбца и число над ним указывают долю картографируемой территории, занятую данным интервалом частоты фамилии. В статистическом окне легенды указаны: число изученных популяций, число узлов картографической сети, минимальная, максимальная и средняя частоты фамилии в популяциях. Все эти показатели рассчитаны по карте. Все данные приведены только для ареала с высокой надёжностью картографического прогноза.
Таблица 7.5.1.
75 распространённых русских фамилий, включённых в картографический анализ (с указанием их места в «магистральном» списке русских фамилий)
ФАМИЛИИ
Основой Атласа русских фамилий являются карты 75 распространённых русских фамилий. К сожалению, введение данных о сельсоветах не только нарушает правило проведения картографирования на едином уровне популяционной организации, но и ограничивает картографирование лишь 75 фамилиями. Дело в том, что для отбора фамилий А. П. Бужиловой был применен «качественный» критерий: из всей совокупности выявленных ею фамилий выбраны те, которые встретились более чем в двух популяциях. Именно эти фамилии, числом семьдесят пять, в этом разделе мы будем называть «распространёнными» русскими фамилиями. Их перечень приведён в таблице 7.5.1.
ВЕРНЫ ЛИ КАРТЫ?
Мы не ставим перед собой задачу изучить географию каждой фамилии. Конечно же, каждая из многих тысяч фамилий уникальна и заслуживает специального историко-географического и филологического исследования. Но для популяционного генетика любая фамилия — как и любой признак генетики или антропологии — лишь одно из отражений генофонда. Поэтому для нас важен ответ на общий вопрос: информативны ли карты отдельных фамилий в отношении структуры генофонда? Сумеет ли карта фамилии выявить закономерности в её изменчивости? Или же карты отдельных фамилий столь мозаичны и хаотичны, что только обобщённый анализ (то есть анализ всех фамилий вместе) сможет различить сквозь пелену этого хаоса архитектонику, каркас русского генофонда?
Эти опасения не случайны. Они вызваны «гипервариабельностью» фамилий. В терминах генетики фамилии предстают как один ген с чрезвычайно большим числом аллелей (сколько фамилий — столько и «аллелей» в этом «гене») и высокой скоростью их мутаций. Средняя частота каждого фамильного «аллеля» редко достигает даже 1 % уровня полиморфизма. Например, в выборке 200 тысяч жителей Санкт-Петербурга (на 1910 год) даже самая распространённая фамилия Иванов наблюдалась с частотой р=0.0095; а список из ста наиболее распространённых в Питере фамилий замыкал Наумов с частотой р=0.0006 [Суперанская и др., 1984].
При такой вариабельности фамилий для их достоверной оценки необходимо изучать большие популяции численностью в несколько тысяч, а не в несколько сотен человек. Половина популяций — 50 районов — соответствуют этим требованиям. Но когда мы используем в качестве опорных популяций 50 сельсоветов, то мы ожидаем встретить резкие флуктуации в частотах фамилий: даже соседние сельсоветы могут резко различаться по частоте одной и той же фамилии. Дрейф генов («дрейф фамилий») вызывает случайные изменения частот фамилий в малых популяциях. Например, в одном сельсовете будет множество Смирновых, а в соседнем — множество Поповых, в то время как в исходной для них «прапопуляции» Смирновых и Поповых было поровну. Поэтому надо охватить много таких малых популяций в районе, чтобы правильно оценить среднюю частоту встречаемости и той, и другой фамилии в изучаемой части русского ареала.
Первый вариант анализа мы провели по данным только о сельсоветах [Балановский и др., 2001]. Честно говоря, мы собирались анализировать по ним лишь обобщённые карты. Мы были уверены, что на картах отдельных фамилий увидим лишь «лоскутное одеяло» — слишком малые размеры сельсоветов дадут слишком хаотичную картину изменчивости отдельной фамилии. Это не препятствовало бы эффективности обобщённого анализа. Так, для генов наследственной патологии характерна чрезвычайно низкая частота (и «простые» карты строить для нет смысла), но их обобщённый картографический анализ оказался высоко эффективным [Наследственные болезни в популяциях человека, 2002; Зинченко и др., 2000].
Каково же было наше изумление, когда не только на обобщённых картах, но и на большинстве карт отдельных фамилий вместо «лоскутного одеяла» мы увидели ярко выраженные тренды (см. карты в [Балановский и др., 2001]). Насколько эти тренды должны быть сильны, что они сумели пробиться сквозь все случайности «дрейфа фамилий»! Видимо, благодаря тому, что ареал русского народа велик, мы можем охватить взглядом эти тренды вопреки случайным биениям (случайным всплескам или падениям) частоты отдельной фамилии. Такие тренды можно увидеть с высоты птичьего полёта, а не из мышиной норки (JT. Н. Гумилев). Такую высоту и даёт нам охват всего «исконного» русского ареала. Так, вопреки эффектам «дрейфа фамилий», карты отдельных фамилий оказались способными выявлять пространственные закономерности в масштабе «исконного» русского ареала. Это прямо свидетельствует в пользу пригодности русских фамилий для анализа генофонда.
Поэтому в том виде анализа, который мы приводим здесь, мы включили оба типа популяций — сельсоветы и районы. И получили редкую возможность сравнить их с картами, построенными нами ранее — только по данным о сельсоветах. Это даёт возможность ответить на вопрос — насколько верны закономерности, выявленные на «сельсоветных» картах? Не исчезнут ли они, если мы введём ещё столько же популяций, полученных по много более надёжным популяциям — районам? Эти новые карты охватывают в два раза больше популяций и в тридцать раз больше обследованных (почти 1 млн. человек). И вновь — вопреки нашим опасениям — оказалось, что новые карты нигде не нарушают обнаруженные ранее на «сельсоветном» уровне [Балановский и др., 2001] основные закономерности, но уточняют и детализируют их.
Этот вывод — один из важнейших методических выводов проведённой работы. Он свидетельствует о парадоксальной надёжности фамилий в качестве квазигенетического маркёра.
КАРТЫ РАЗНЫХ ФАМИЛИЙ
В таблице 7.5.2. указаны: 17 фамилий, карты которых приводятся в этом разделе; порядковый номер их места в «магистральном» списке всех встреченных русских фамилий (67 000 фамилий); их среднерусская частота (по данным о почти 1 миллионе изученных индивидов); число встреченных индивидов в каждом из регионов (перейти к региональной частоте фамилии можно с помощью общей численности обследованных в регионе, которая приведена внизу столбцов).
Мы дадим очень сжатое и краткое описание карт отдельных фамилий. Этому три причины. Во-первых, интерпретация таких карт — дело специалистов в области ономастики и лингвистической географии. Во-вторых, читатель сам с таким же правом, как и мы, может рассмотреть и описать эти карты. А в-третьих, и в основном, эта книга посвящена вовсе не фамилиям. И наша задача — отметить в картах лишь то, что имеет отношение к главной задаче книги: к выявлению архитектоники русского генофонда в целом.
Таблица 7.5.2.
Семнадцать фамилий, представленные на картах в разделе 7.5., и их положение в общем фонде русских фамилий
§ 2. Кто где?
Смирновы и Ивановы,
Кузнецовы и Ковалёвы,
Поповы и Дружинины,
Козловы и Волковы,
Морозовы и Соловьёвы,
Петровы и Васильевы,
Никитины и Григорьевы,
Беловы, Черновы и Котов
ФАМИЛИЯ «СМИРНОВ» (рис. 7.5.7.) по нашим данным лидирует среди всех русских фамилий (средняя частота — 1.9 %). Есть у нас и косвенные сведения из иных источников о том, что Смирновы выходят на первое место среди фамилий не только сельского, но и в целом современного русского населения. Но даже для самой распространённой фамилии мы вовсе не видим равномерного распределения по русскому ареалу!
Напротив, распределение её чётко очерчено склонностью к востоку. Напомним, что в Восточном регионе частота Смирновых достигает уникальной отметки — 5.9 % (табл. 7.3.4). Причём в некоторых восточных районах частота Смирновых доходит до 13 %! Также Смирновы занимают первое место в Центральном регионе (в среднем 2.3 %). В Западном регионе (0.8 %) они опускаются на 6 место (и также в Сибирском регионе занимают 5 место). А в Северном регионе (0.2 %) и в Южном (0.08 %) их частоты столь малы, что Смирновы не попали даже в «топ-50» (см. раздел 7.4). Это табличные данные.
Те же особенности ярко видны на карте — максимум на востоке и постепенное снижение вплоть до самых западных границ. Конечно, мы видим где-то всплески, где-то падения частоты за счёт «дрейфа фамилий» в сельсоветах. Но то, что Смирновы — фамилия среднерусской полосы, даже столь несовершенная карта показывает удивительно ясно.
Рис. 7.5.1. Карта распространённости фамилии «СМИРНОВ».
Рис. 7.5.2. Карта распространённости фамилии «ИВАНОВ».
Рис. 7.5.3. Карта распространённости фамилии «КУЗНЕЦОВ».
Рис. 7.5.4. Карта распространённости фамилии «КОВАЛЁВ».
Очень чётко очерчены и оба «полярных» региона. На Русском Севере Смирновы встречаются с невысокой частотой, но повсюду. На юге Смирновых нет. Три широтных зоны — северная, среднерусская, южная — столь явно очертились на карте «главной» русской фамилии! Напомним, что эти зоны мы выявляли по табличным данным, но наши пять регионов в них были представлены лишь семью областями. Теперь, охватив данные по 22 областям, эти зоны на картах обретают свои истинные ареалы.
ФАМИЛИЯ «ИВАНОВ» (рис. 7.5.2.), занимает следующее, второе место в списке русских фамилий (средняя частота — 1.3 %). Она имеет особое значение из-за своей высокой распространённости — она обычно считается «лицом» русского этноса (русские Иваны). Имя «Иоанн» встречается в церковном календаре 79 раз и является самым распространённым мужским именем. В середине XX века оно встречалось с частотой около 15 %, а с XVII до середины XX века — в два раза чаще, чем следующее за ним по частотности имя «Василий» (расчёты проведены нами по данным [Суслова, Супе-ранская, 1991]).
Для столь распространённой и, надо полагать, поли-филетичной фамилии (т. е. многократно возникавшей по всему ареалу от самого распространённого имени святцев) естественно было ожидать отсутствие каких-либо географических закономерностей. Тем удивительнее, что карта демонстрирует территории, на которых Ивановы практически отсутствуют. Зона повышенных частот расположена на западе и северо-западе, и тянется она почти сплошным «горным» массивом до северо-востока.
На севере и на юге, за исключением отдельных «островков», Ивановы очень редки.
ФАМИЛИЯ «КУЗНЕЦОВ» (рис. 7.5.3.) занимает почётное третье место в «магистральном» списке русских фамилий (средняя частота — 1.0 %) (табл. 7.5.2.). Мы видели, что почти во всех регионах она вошла в число наиболее распространённых. Однако в распределении Кузнецовых не удаётся выявить столь же чёткую географическую закономерность, как для предыдущих фамилий: острова накопления этой
фамилии чередуются с зонами её отсутствия. В целом массив Кузнецовых занимает почти весь русский ареал — земли и северные, и восточные, и центральные, снижая частоты лишь на западной и южной границе ареала и исчезая на юго-востоке.
Сопоставление карт распространения Кузнецовых (рис. 7.5.3.) и Ковалёвых (рис. 7.5.4.) может быть интересным с точки зрения происхождения русских фамилий. Предполагается, что если уж обе кузнечные фамилии («Ковалёв» и «Кузнецов») происходят из разных диалектов, то и ареалы должны быть альтернативны. Однако картографирование показало, что ареалы этих фамилий частично перекрываются. Поэтому корреляция между картами не отрицательна — она просто близка к нулю. Возможно, это связано с тем, что в зоне контакта двух диалектов ковали и кузнецы могли дружно сосуществовать, занимая разное профессиональные ниши.
Рис. 7.5.5. Карта распространённости фамилии «ПОПОВ».
ФАМИЛИЯ «КОВАЛЁВ» (рис. 7.5.4.) занимает 32 место по частоте в списке русских фамилий (средняя частота — 0,3 %) и третье место среди «профессиональных» фамилий (после Кузнецовых и Поповых). Территория распространения Ковалёвых удивительно компактна — это самый запад и юго-запад России, вдоль по границе с Белоруссией и Украиной, что наводит на мысль о возникновении фамилии «Ковалёв» (именно с финалем «-ев») на этой территории. Это, конечно, поле работы для лингвистов, но отметим, что эта компактность территории встречаемости выявилась только благодаря компьютерному картографированию.
ФАМИЛИЯ «ПОПОВ» (рис. 7.5.5.) занимает пятое место в списке русских фамилий (средняя частота — 0.8 %), а среди «профессиональных» (связанных с деятельностью на благо людей) занимает второе место. Но, как мы не раз говорили выше, она является самой распространённой в обоих «полярных» регионах. При этом в Северном регионе средняя частота фамилии Попов 1.8 %, а в Южном регионе составляет 0.8 %. В Восточном регионе Поповы занимают седьмое место, составляя в среднем 1.0 %, в отдельных районах Костромской области повышаясь до 3–4%. В Центральном и Западном регионах частота Поповых мала.
На карте такая «полярная» ориентация проявилась ещё ярче, подтверждая выявленные ранее закономерности. Мы видим, как весь север (за исключением одной точки) демонстрирует единое «нагорье» частот Поповых. Его восточные отроги спускаются до Костромской области, а в целом «горный» массив северного ареала
Поповых тянется от реки Унжи на востоке до Чудского озера на западе. На южной границе ареала возвышается второй полюс — второе «нагорье» частот Поповых, отроги которого тянутся на запад до Смоленской области. Причём южное «нагорье» с его западными отрогами является почти зеркальным отражением северного «нагорья» с его восточными отрогами. Эти два «нагорья» разделяет пустыня с отсутствием Поповых, которая тянется обширной полосой с северо-запада на юго-восток — от Псковских земель до Саратовских.
Рис. 7.5.6. Карта распространённости фамилии «ДРУЖИНИН».
Рис. 7.5.7. Карта распространённости фамилии «КОЗЛОВ».
Такой необычный ландшафт одной из самых распространённых фамилий вновь убедительно говорит в пользу исторической неслучайности географического распределения фамилий.
ФАМИЛИЯ «ДРУЖИНИН» (рис. 7.5.6.) — последняя из четырёх «профессиональных» фамилий, включённых в Атлас. Однако к профессиональным фамилиям она относится довольно условно. Эта фамилия могла происходить не только от воинской «дружины», то есть не только от профессии дружинника, но и от другого значения слова «дружина» — друг, спутник, в том числе и спутник жизни. Это самая редкая из 75 картографированных фамилий (табл. 7.5.2), а в общем списке русских фамилий она занимает 337 место (средняя частота 0.05 %).
Из популяций районного уровня она с заметной частотой встречена в двух северных районах Архангельской области (по 16–26 человек в районе) и в четырёх восточных популяциях Костромской области. С невысокой частотой она также распространена в трёх южных популяциях Белгородской области (но присутствует ещё в восьми южных районах) и в одной западной — Смоленской (но обнаруживается ещё в четырёх западных районах). Районные популяции репрезентативны. Наличие фамилии пусть с невысокой частотой, но в нескольких географически близких популяциях районного уровня позволяет уверенно говорить о накоплении фамилии в этих регионах. Повышение же частоты Дружининых в одном из сельсоветов Пензенской области (всего несколько носителей этой фамилии дали всплеск частоты до 1.4 %) можно рассматривать на этом фоне как случайное событие.
Поэтому мы можем уверенно говорить, что основные ареалы Дружининых расположены в северных и восточных регионах, а в остальных регионах они встречаются редко, но повсюду. Для нас важно, что карты позволяют проследить распространение даже столь редкой фамилии. Но, конечно же, при выделении ареала редких фамилий надо опираться на выборки большого объёма.
ФАМИЛИЯ «КОЗЛОВ» (7.5.7.) и ФАМИЛИЯ «ВОЛКОВ» (рис. 7.5.8.) не только расположены рядом, занимая седьмое (средняя частота — 0,6 %) и одиннадцатое (средняя частота — 0,5 %) места в списке русских фамилий, а в списке «звериных» фамилий — третье и пятое места.
Они и на карте неразрывно следуют друг за другом, образуя обширное «нагорье» высоких частот на западе и юго-западе русского ареала, а затем двигаясь сплошной полосой в северо-восточном направлении и далее на север. Этот коридор Козловых-Волковых следует от смоленских земель через Волго-Окское междуречье в земли тверские и костромские. А затем, ослабевая по частоте, но возрастая по обширности ареала, уходит в земли вологодские и архангельские. Причём, как и положено в пищевой цепи, почти везде Козловых больше, чем Волковых. Конечно, на этом пути встречаются и исключения — где-то есть Волковы, но Козловых нет. Но такие исключения связаны, в основном, с «дрейфом фамилий» в малых популяциях сельсоветов. Когда данных будет намного больше, можно будет проверить эти закономерности.
Рис. 7.5.8. Карта распространённости фамилии «ВОЛКОВ».
Рис. 7.5.9. Карта распространённости фамилии «МОРОЗОВ».
Даже несовершенные карты демонстрируют не только чётко выраженную закономерность, но и высокую корреляцию друг с другом фамильных ландшафтов Козловых и Волковых. Причём, если в предыдущей паре фамилий Кузнецовы-Ковалёвы ожидалась корреляция отрицательная (там, где много одних, мало других), то в паре Козловы-Волковы корреляция положительная (они идут след в след).
ФАМИЛИЯ «МОРОЗОВ» (рис. 7.5.9.) особая по семантике. Рассмотрев все профессиональные фамилии подряд, мы нарушили порядок следования фамилий по частоте. Вслед за Козловыми по убыванию частоты в таблице 7.5.2. идут Морозовы, занимающие девятое место в общерусском списке фамилий (средняя частота — 0.6 %). Это единственная рассматриваемая нами карта «иных» фамилий, то есть не отнесённых ни к одному из четырёх главных классов фамилий.
Но, несмотря на её достаточно высокое положение в списке русских фамилий (в первой десятке), в её пространственной изменчивости трудно разглядеть явные закономерности. Несколько чаще Морозовы встречаются в широкой центральной зоне русского ареала. Но полоса повышенных значений частоты Морозовых следует вдоль западных и юго-западных границ, а также на севере русского ареала. Как тенденцию можно отметить снижение частоты Морозовых на юго-востоке ареала. Однако в целом карта приближается к мозаичному типу («лоскутное одеяло»).
ФАМИЛИЯ «СОЛОВЬЁВ» (рис. 7.5.10.) занимает следующее — десятое — место в списке фамилий и четвертое место среди «звериных» фамилий (средняя частота — 0,5 %). Впереди неё идут две других «птичьих» фамилии — Соколовы (4 место) и Лебедевы (6 место). «Птичья» фамилия Соловьёв имеет своеобразное распространение. Она отсутствует на севере и на юго-востоке, однако встречается по окраинам русского ареала от юга до севера (Онежское озеро). Максимальные частоты Соловьёвых обнаруживаются в средней полосе России — в Тверской и Костромской областях.
ФАМИЛИЯ «ПЕТРОВ» 7.5.11.) и ФАМИЛИЯ «ВАСИЛЬЕВ» (рис. 7.5.12.) занимают в списке русских фамилий соседние двенадцатое (средняя частота — 0.5 %) и тринадцатое места (средняя частота — 0.4 %), а в списке календарных фамилий — почетные второе и третье места. Их фамильные ландшафты так похожи, что карты легко перепутать.
Обширная зона распространения Петровых и Васильевых локализована на северо-западе России. Локальные максимумы обеих фамилий обнаруживаются в новгородских землях, смоленских и верховьях Онеги. Далее на восток (захватывая часть костромских популяций) и на север (охватывая его почти целиком) простирается зона, где Петровы и Васильевы встречаются реже, но повсеместно. Такая же зона простирается и на юго-западе. Очень редки обе фамилии на юго-востоке центральных земель, включая восточную часть Волго-Окского междуречья. В целом, в фамильных ландшафтах Петровых и Васильевых намечается единая обширная зона, простирающаяся по западной половине русского ареала от севера до юга.
Рис. 7.5.10. Карта распространённости фамилии «СОЛОВЬЁВ».
Рис. 7.5.11. Карта распространённости фамилии «ПЕТРОВ».
ФАМИЛИЯ «НИКИТИН» (рис. 7.5.13) и ФАМИЛИЯ «ГРИГОРЬЕВ» (рис. 7.5.14.) также относятся к календарным, но встречаются в два раза реже предыдущих (0.2 %): они занимают по частоте, соответственно, 62 и 70 места, а среди календарных фамилий — 25 и 29 места. В целом, они укладываются в тот же ареал, который очерчен предыдущими двумя календарными фамилиями. Но из-за более низкой частоты фамилии «Никитины» и «Григорьевы» чаще под действием «дрейфа фамилий» исчезают, образуя большие, но случайно разбросанные зоны с отсутствием этих фамилий.
Но всё же Никитины и Григорьевы не близнецы — есть и различия в их распространении.
НИКИТИНЫ образуют компактное ядро на западе в новгородско-смоленских землях. Обширная область менее высоких частот Никитиных находится на севере, охватывая Онегу, Сухону и часть Костромской области.
ГРИГОРЬЕВЫ занимают ареал, охватывающий западные российские области. Он практически непрерывен, лишь часть Тверской области характеризуется низкой частотой этой фамилии. Локальные максимумы находятся в новгородских, тверских, московских землях, а также у Белоозера, образуя основную северо-западную, а также меньшую нижегородскую зоны.
Несмотря на случайные колебания частот фамилий, и Никитины, и Григорьевы входят в ту единую обширную зону, охватывающую западную половину русского ареала, которая была очерчена предыдущими двумя календарными фамилиями. На картах фамилий вновь видим, что календарные фамилии — принадлежность лишь западного «полушария» русского ареала, а вовсе не неотъемлемое свойство любых русских популяций.
ФАМИЛИЯ «БЕЛОВ» 7.5.15.) занимает 27 место в списке фамилий (встречаясь со средней частотой 0.3 %) и шестое место среди «приметных» фамилий — после Смирновых, Новиковых, Румянцевых, Хромцовых и Беляевых. Отметим, что и Беловы, и Беляевы чаще всего встречаются в Центральном и Восточном регионах.
Карта распространения Беловых, несмотря на их невысокую частоту, выявляет на удивление чёткий «фамильный ландшафт». Весь русский ареал пересечен непрерывным хребтом относительно высокой частоты Беловых — от Смоленска на западе до Костромы и Нижнего Новгорода на востоке. К северу и к югу от такого среднерусского хребта простираются пустыни с редкими оазисами Беловых.
Беловы и Черновы наряду со Смирновыми отнесены к своеобразному классу «приметных» фамилий, закрепляющих в фамилии приметные черты внешнего или психологического облика.
ФАМИЛИЯ «ЧЕРНОВ» (рис. 7.5.16.) оказалась намного более редкой — она занимает 211 место в списке фамилий, а средняя частота (0.07 %) в четыре раза ниже, чем у Беловых. Распространение Черновых не является альтернативой Беловым — есть зоны, где встречаются и те, и другие, но есть и локальные максимумы, где представлена лишь одна из этой пары фамилий. Карту Черновых можно отнести к разряду мозаичных.
Рис. 7.5.12. Карта распространённости фамилии «ВАСИЛЬЕВ».
Рис. 7.5.13. Карта распространённости фамилии «НИКИТИН».
Рис. 7.5.14. Карта распространённости фамилии «ГРИГОРЬЕВ».
Рис. 7.5.15. Карта распространённости фамилии «БЕЛОВ».
Рис. 7.5.16. Карта распространённости фамилии «ЧЕРНОВ».
Рис. 7.5.17. Карта распространённости фамилии «КОТОВ».
Впрочем, проглядывает и некая закономерность. Среди всего множества популяций севернее линии, соединяющей Смоленск, Москву и Нижний Новгород, встречен лишь один сельсовет в Вологодской области с носителями фамилии Чернов. Южнее этого меридиана мы видим целый ряд популяций с заметной частотой Черновых. Поскольку часть этих популяций районного уровня, дающего надёжные оценки встречаемости, то на эту закономерность можно положиться. Тогда «фамильный ландшафт» Черновых можно описать как пустынный в северной половине ареала русского народа, и насыщенный оазисами Черновых в южной его половине.
ФАМИЛИЯ «КОТОВ» (рис. 7.5.17.) замыкает демонстрацию карт. Она занимает 129 место в списке русских фамилий, встречаясь со средней частотой 0.1 %. Хотя их частота выше, чем Черновых и Дружининых (табл. 7.5.2), однако увидеть какую-либо закономерность на карте нельзя. Все — и северные, и южные, и западные, и центральные, и восточные всплески встречаемости Котовых опираются на достоверные данные «районного» уровня. Карта представляет яркий пример мозаичного типа карт, довольно редкого для изученных 75 фамилий. Котовы гуляют сами по себе и встречаются разбросанными «островами» среди моря популяций, в которых Котовых нет.
Однако такие мозаичные карты пока не позволяют сделать заключение о «самозарождении» Котовых в нескольких разных частях ареала. Именно для таких признаков — с мозаичным распределением и низкими частотами — необходимо дальнейшее значительное расширение объёма выборок из всех частей ареала. Только тогда можно будет сделать обоснованный выбор между гипотезами миграций, случайного дрейфа и «мутационных» событий (полифилетического происхождения — независимого зарождения фамилии в разных частях ареала).
§ 3. Что показали карты?
Мы рассмотрели семнадцать карт распространения фамилий (их, как и прочие карты Атласа фамилий можно увидеть на нашем сайте ). Не так много, но некоторые черты моря проявляются и в его каплях. Вглядимся в эти черты.
ЧАСТОТА ФАМИЛИИ НЕ ОПРЕДЕЛЯЕТ ТИП «ФАМИЛЬНОГО ЛАНДШАФТА» Например, сопоставляя «фамильные ландшафты» (рис. 7.5.1.-7.5.17.) и средние частоты этих фамилий (табл. 7.5.2.), можно прийти к выводу, что компактность, мозаичность или же площадь ареала распространения фамилии вовсе не определяются её частотой, как можно было предполагать. Мозаичный тип карты можно встретить не только среди редких, но и среди самых частых фамилий, точно так же и чёткие географические закономерности встречаются среди фамилий, резко различных по частоте.
Это положение требует специальной проверки кар-тографо-статистическими методами, которое мы не имеем возможности привести здесь. Нет спора, 17 карт фамилий из многих тысяч фамилий не составляют сколь нибудь значимую выборку. Но они создают некое общее представление о свойствах их распространения.
КАЖДАЯ ФАМИЛИЯ ИМЕЕТ СВОЙ АРЕАЛ
Основной вывод, который можно сделать по рассмотрении карт случайно выбранных фамилий — это вывод о географической приуроченности русских фамилий. Причём эта приуроченность в ряде случаев проявилась очень ярко и чётко. Она являет собой правило. Тогда как «повсеместные» фамилии, мозаично или же равномерно распределённые по всему ареалу, являются исключением.
Чтобы точно очертить истинные ареалы распространения каждой из русских фамилий, надо существенно расширить источниковую базу: полноценно представить не избранные, а все географические районы русского ареала. Но то, что географические закономерности в распределении отдельных фамилий проявились вопреки несовершенству наших сведений, указывает на много большую, чем ранее считалось, пригодность русских фамилий для исследования русского генофонда. Подчеркнём принципиальный момент: именно картографирование частот фамилий позволяет объективно выявлять их пространственную изменчивость. Для фамилий карта является незаменимым и главным инструментом в арсенале исследователя.
«ЗАПРЕДЕЛЬНЫЕ» ЗЕМЛИ
Рассматривая классические маркёры (глава 5), мы уже видели, что, как только мы выходим за пределы «исконного» ареала, сразу же встречаем нарушения основных черт генетического ландшафта, и, как правило, его сглаживание, усреднение. Так при старении гор исчезают снежные вершины и глубокие ущелья — стираются крайности и различия, всё превращается в некий выровненный «средний» ландшафт местности. Так и наши — генетические или же фамильные — ландшафты за пределами своего «месторождения» приобретают выровненный, усреднённый облик.
Например, на карте Поповых (рис. 7.5.5.) примечателен «обрыв» северного «нагорья» — к востоку от него, за пределами «исконного» ареала, тянется длинный язык «пустынных» значений частоты фамилии. Он представлен популяциями Кировской и Пермской областей, не входящими уже в «исконный» русский ареал. Их значения не продолжают ландшафт «исконного» ареала, а нарушают его: «запредельные» популяции точно воспроизводят среднерусские частоты, а вовсе не частоты соседних с ними северо-восточных популяций «исконного» ареала. Эту же закономерность мы видели и на картах Смирновых, Ивановых, Кузнецовых, Козловых, Волковых. Это означает, что на всех картах, где «исконные» восточные земли отличаются от среднерусских значений, мы обнаруживаем в «запредельных» землях (Кировской и Пермской областей, ещё дальше на восток) не продолжение оригинальных восточных ландшафтов, а некие усреднённые значения.
Именно этот эффект мы отмечали и для карт «классических» маркёров (глава 5, раздел 5.2). Территории, находящиеся за пределами «исконного» ареала и заселённые после того, как сформировался облик русского народа, усредняют в себе потоки многоликих миграций. Если этих потоков было много, и шли они из разных регионов, то велика вероятность того, что за пределами «исконного» ареала мы будем встречать «усреднённые» русские популяции. Конечно же, если миграция шла из одного из регионов — то «запредельные» территории будут воспроизводить черты конкретного источника миграций.
Отсюда следует два вывода.
Во-первых, изучив географию фамилий в «исконном» ареале и имея демографические сведения об источниках и силе миграционных потоков, мы можем прогнозировать фамильный портрет данного окраинного региона. Это неплохо уже и само по себе. Но если у нас есть возможность сравнить прогнозируемый фамильный портрет с реальным, то можно сделать и следующий важный шаг. Если фамильные портреты совпали, значит, мы на верном пути, и источники миграций установлены. И теперь можно, используя банки данных о классических и ДНК маркёрах определить уже не фамильный, а генетический портрет окраинного региона (прогнозировать частоты генов). Для этого не потребуется экспедиций, забора венозной крови, дорогостоящих лабораторных анализов — достаточно лишь достоверного знания о фамильных ландшафтах и о демографии региона.
Во-вторых, это означает, что в пределах «исконного» ареала по-прежнему сохраняется «исконная» структура русского генофонда. Если бы поздние миграции выровняли ландшафт — то мы и на «исконных» территориях видели бы то же, что и на «запредельных» землях. Мы бы увидели всюду некие усреднённые русские характеристики, а не индивидуальные особенности отдельных регионов. Наличие пространственной структуры русского генофонда — важное свидетельство его сохранения, а не его «гибели». Но эту тему мы оставим для последней главы книги, а сейчас вернёмся к русским фамилиям.
ОБЩИЕ ЧЕРТЫ ГЕНОФОНДА
Итак, карты отдельных фамилий выявляют географические закономерности в их изменчивости. Это позволяет задаться вопросом: если даже карты отдельных фамилий позволяют проводить районирование ареала, нельзя ли выделить основные черты генофонда по совокупности всех фамилий?
Мы видели «хребты» высоких значений, пересекающие весь «исконный» русский ареал и делящие его на три широтные зоны — северную, южную и среднерусскую. Видели разделение ареала на две половины — в одних случаях на северную и южную, в других — на восточную и западную. Видели и более сложные «фамильные ландшафты». Каждый из них — одна грань единого целого. В каждой фамилии преломляется единая история русского народа и его генофонда. Конечно же, у нас в руках слишком мало карт — пока лишь карты 75 фамилий — чтобы восстановить «фамильный портрет» русского народа во всей его полноте. Но мы видели, что даже десяток самых частых фамилий давал представление о соотношениях между регионами (раздел 7.3). Поэтому всё же можно попробовать увидеть структуру генофонда через призму обобщённого анализа имеющейся у нас панели 75 фамилий.
7.6. «ФАМИЛЬНЫЙ ПОРТРЕТ» РУССКОГО НАРОДА
§ 1. Различия и сходство регионов: В анализе 14 000 коренных фамилий — Сходство фамилий средней полосы — Своеобразие «полярных» регионов — Подтвердился анализ «топ-20» и «осмысленных» классов «топ-50»!
§ 2. Фамилии и маркёры Y хромосомы: Индивиды: похожи ли Y хромосомы у однофамильцев? — Популяции: фамилии и генофонд — На Русской равнине география фамилий и Y хромосомы сходна — Высокая корреляция между матрицами расстояний для «настоящих» генов и для фамилий
§ 3. «Главные сценарии» изменчивости: Среднерусская полоса — Постепенное изменение фамилий к югу — Своеобразие Русского Севера — Корреляции «главных сценариев» фамилий, антропологии и генетики
§ 4. География инбридинга: Как узнать инбридинг по фамилиям? — Прогноз груза наследственных болезней — Русский генофонд — Неуклонный рост инбридинга с юго-запада на восток
§ 5. Основные черты «фамильного портрета»: «Осмысленная» классификация фамилий и регионов — Парадоксально надёжные маркёры — Фамилии не ради фамилий — Лицо генофонда — Разведка боем
Как и в предыдущих главах второй части книги, заключительный раздел вбирает те виды анализа, которые абстрагируются от отдельных признаков и выявляют общие черты генофонда. Это позволяет нам забыть на время о том, какими именно признаками мы пользовались, и вглядеться, наконец, в тот общий план строения русского генофонда, который проявляется в рассматриваемом типе признаков.
В. этой главе есть и уже привычные карты главных компонент — «главных сценариев» изменчивости генофонда (£?). Однако для фамилий этот параграф не центральный. Дело в том, что карты «главных сценариев» пока предварительные — они опираются на небольшой набор фамилий (75) и лишь половина популяций надёжна («районного масштаба»).
Поэтому основной акцент мы сделаем на другом виде анализа — на выявлении соотношений между основными частями генофонда по всем 14 тысячам коренных фамилий сразу. Такую оценку различия и сходства регионов (§ 1) мы получим с помощью обобщённых расстояний между регионами и диаграмм многомерного шкалирования — то есть так же, как в предыдущей главе для маркёров митохондриальной ДНК и Y хромосомы.
Это позволит нам сравнить обобщённые расстояния, рассчитанные по фамилиям, с генетическими расстояниями между теми же регионами, рассчитанными по маркёрам Y хромосомы (§ 2). Такое сравнение, во-первых, интригующе интересно — ведь оба типа признаков передаются по отцовской линии. А во-вторых, мы имеем редкую возможность сравнить их без карт — и фамилии, и Y хромосома изучены нами в одних и тех же русских популяциях.
А вот последний вид анализа можно провести только по фамилиям. Это — прогноз инбридинга и связанного с ним груза наследственной патологии (§ 4).
Все виды анализа вместе помогут составить обобщённый «фамильный портрет» русского генофонда.
§ 1. Различия и сходство регионов
ВЕСЬ ФОНД ФАМИЛИЙ
Каков портрет русского генофонда, рисуемый не оттенками двух-пяти десятков самых частых фамилий, а разноцветьем всего многотысячного спектра русских фамилий? Как по всему спектру фамилий русский генофонд подразделяется на региональные части? Каковы соотношения между региональными «фамильными фондами»? Отвечая на эти вопросы, мы можем располагать данными лишь о пяти регионах «исконного» ареала, поэтому структура генофонда выявится лишь в общих чертах. Но именно эти общие черты для нас сейчас и важны. В последующих разделах (§ 2 и § 3) картографирование по данным о 100 популяциях поможет взглянуть на детали структуры генофонда.
Чтобы оценить истинные «взаимоотношения» регионов, мы включили в анализ весь фонд «коренных» фамилий. Использованы данные по всем фамилиям — и всеобщим, и уникальным. Единственное условие — анализируемые фамилии должны быть «коренными», чтобы мятущиеся ветры миграций не создавали эфемерную видимость близости или удалённости популяций.
АЛГОРИТМЫ АНАЛИЗА
МЕРА СХОДСТВА. Напомним, что в предыдущих разделах этой главы для выявления сходства и различий регионов по частым фамилиям («топ-10» или «топ-50»,) мы использовали самые разные показатели, чтобы максимально сохранить «лицо» фамилий, сравнить их «поимённо». Но теперь, при обобщённом анализе всего фонда фамилий, мы воспользуемся общепринятой в популяционной генетике мерой сравнения популяций — генетических расстояний М. Nei (1975).
АЛГОРИТМ РАСЧЕТА. Напомним, что в анализ включена информация о распространении 14 тысяч «коренных» фамилий. Носители этих фамилий — 725 тысяч человек из пяти основных регионов «исконного» ареала. «Пришлые», случайные и потому редкие для данного района фамилии отсеяны согласно «демографическому» критерию (раздел 7.3., § 2).
Частоты фамилий (см. разделы 3.2. и 7.2.) были сначала рассчитаны для каждого района. По совокупности «районных» частот рассчитаны невзвешенные частоты фамилий в регионе. По региональным частотам рассчитаны генетические расстояния между регионами. По этой матрице расстояний построен график многомерного шкалирования.
КТО НА КОГО ПОХОЖ?
Степень сходства пяти основных регионов друг с другом показана на рис. 7.6.1.
Рис. 7.6.1. Сходство и различия пяти основных регионов по всем «коренным» фамилиям (14 428 фамилий).
Диаграмма многомерного шкалирования построена по обобщённым генетическим расстояниям [Nei, 1975].
СЕВЕРНЫЙ РЕГИОН (среднее расстояние от остальных регионов dN=1.1)[48] оказался наиболее своеобразным. Примечательно, что он удалён от всех регионов без исключения (1.0<dN<1.4). Более всего Северный регион по частотам фамилий отличается от географически близкого ему Восточного региона: генетическое расстояние между ними (dN-E=1.4) достигает вообще максимальной величины из расстояний между всеми парами регионов. Такое явное рассогласование географических и генетических расстояний подчеркивает, что распределение фамилий вовсе не является простой функцией от географического расстояния между популяциями. Такое рассогласование между географическими и генетическими расстояниями обычно свидетельствует о вмешательстве истории.
ЮЖНЫЙ РЕГИОН (ds=1.0) занимает второе место по своеобразию фамилий. Он также расположен на периферии «фамильного пространства» (рис. 7.6.7.). «Южные» фамилии ближе всех к «западным», но расстояние и между ними немалое (dS-W=0.7).
ВОСТОЧНЫЙ РЕГИОН (dE=0.9) оказывается на третьем месте по своеобразию фамилий. Он максимально удалён от обоих «полярных регионов» (в среднем dE-POLE=1.3). Но при этом близок к другим двум регионам среднерусской полосы (в среднем dE-MIDDLE ZONE=0.5). Из этих двух регионов он особенно близок к соседнему Центральному региону (dE-C=0.3). Так что в пределах среднерусской полосы Восточный регион не обнаруживает рассогласования с географическими расстояниями, а напротив, строго следует им. Видимо, здесь география и история были согласны друг с другом.
ЗАПАДНЫЙ РЕГИОН (dw=0.7) регион оказывается равноудален от Южного (dW-C=0.7) и Восточного (dW-E=0.8) регионов, и близок к Центральному (dW-C=0.3).
ЦЕНТРАЛЬНЫЙ РЕГИОН (dc=0.7) занял действительно центральное место в русском генофонде. Он почти в равной степени удалён от «полярных регионов» (dC-N=1.1; (dC-S=0.9) и одинаково близок к регионам средней полосы (dC-W=0.3; dC-W=0.3). Однако, хотя кажется, что здесь географические и генетические расстояния полностью ладят друг с другом, но история вмешивается и здесь. Генетические расстояния до регионов средней полосы оказались в три-четыре раза меньше, чем до «полярных». А разница в географических расстояниях невелика — лишь в полтора раза (Центр/3апад=400 км, Центр/Востоk=450 км, Центр/ Юr=600 км, Центр/Север=700 км). Таким образом, по частотам фамилий Центральный регион куда более удалён от полярных регионов, чем ожидалось из географии.
ПОДВЕДЁМ ИТОГИ
Итак, генетические расстояния, рассчитанные по всему фонду фамилий (14 тыс. фамилий), выделя-ют среднюю полосу европейской России (Западный,
Центральный, Восточный регионы) как наиболее полно воспроизводящую средние характеристики русского генофонда. «Полярные» Южный и Северный регионы демонстрируют выраженное своеобразие состава фамилий. При этом Восточный регион резко отличен от «полярных» регионов; Южный тяготеет к Западному; а Северный регион занимает совершенно особое место. График на рис. 7.6.1. иллюстрирует эти взаимоотношения регионов.
Не правда ли, знакомая картина? Мы её видели и тогда, когда рассматривали самые частые фамилии — «топ-20» (раздел 7.J.); и тогда, когда создавали «фамильные портреты» регионов по «топ-50» (раздел 7.4.). Такое взаимное подтверждение трёх независимых видов анализа — по частым фамилиям «топ-20», по «осмысленным» классам «топ-50» и по частотам всего массива «коренных» фамилий — радует, а уверенность в том, что мы на верном пути, растёт.
Из этого следуют и методические выводы.
Во-первых, это значит, что наше выделение классов фамилий (календарные, профессиональные, «звериные», «приметные») работает неплохо.
Во-вторых, если даже анализ «топ-50», то есть только полусотни самых частых фамилий (и отсев всех остальных фамилий), сохраняет основные тенденции, то значит и наш отсев лишь самых редких «пришлых» фамилий вряд ли эти тенденции исказил.
Но тогда возникает здравый вопрос. Может быть, и нет необходимости анализировать всю громаду всех фамилий, а заниматься только частыми? К сожалению, это не так. Прежде всего, не изучив все фамилии, не определишь, какие из них частые. Но главное, мы никогда не знаем, где та граница, после которой начинаются искажения тенденций. Ведь для разных регионов число «репрезентативных фамилий» может оказаться различным в зависимости от структурированности генофонда. Кроме того, разные группы фамилий — общие, частые, уникальные — могут описывать особые закономерности, не свойственные генофонду в целом, и сообщить много любопытных сведений об истории сложения генофонда.
§ 2. Фамилии и маркёры Y хромосомы
Итак, мы определили взаимное положение пяти основных регионов по данным о фамилиях. Но можно ли утверждать, что таково взаимное положение не только «фамильных портретов» регионов, а самих генофондов? Можно ли считать, что, изучая фамилии, мы видим генофонд? Чтобы ответить на этот вопрос, надо привлечь свидетельства ещё одного очевидца — данные самой генетики. Те же самые популяции, которые мы изучили по фамилиям, уже генотипированы нами по одной системе генетических маркёров — по маркёрам Y хромосомы. Причём именно эти маркёры наиболее интересны для сравнения с фамилиями: и те, и другие передаются по мужской линии. Так что совместное изучение русских фамилий и Y хромосомы полезно им обоим.
Как известно, Y хромосома передаётся от отца к сыну, так же как и фамилия у народов с патронимической традицией. Однако связь между фамилией и гаплотипом Y хромосомы далека от абсолютной — она нарушается как «мутацией» фамилии (изменения в написании, возникновения у потомков новой фамилии), так и в случаях внебрачных детей и усыновлений, или же при передаче фамилии от матери [Sykes, Irven, 2000; Jobling, 2001]. Кроме того, в отличие от гаплотипов, фамилии возникли исторически совсем «недавно» — считается, что самые древние фамилии возникли в Китае около 5000 лет назад [Jobling, 2001]. Однако основная масса современных фамилий народов мира возникла в пределах последней тысячи лет. В результате одинаковые гаплотипы встречаются у людей с разными фамилиями, и наоборот — у людей с одинаковой фамилией встречаются разные неродственные гаплотипы.
Можно выделить два основных направления, в которых ведутся работы в данной области.
РАЗНООБРАЗИЕ Y ХРОМОСОМЫ У ОДНОФАМИЛЬЦЕВ
Это направление рассматривает связь конкретной фамилии и конкретной Y хромосомы. В рамках этого направления в настоящий момент проводится большая часть работ по изучению связи фамилии и генотипа: фамилия выступает как квазигенетический маркёр конкретной Y хромосомы.
В 2000 году Sykes и Irven исследовали гаплотипы Y хромосомы носителей фамилии первого из авторов [Sykes, Irven, 2000]. Авторы ожидали, что фамилия Sykes возникала многократно, поскольку происходит от диалектного Йоркширского «ручей», «канава». К своему удивлению, они обнаружили, что у 43,8 % исследованных однофамильцев — один и тот же гаплотип Y хромосомы, причём следующий по частоте гаплотип встречается в 4 раза реже. Это позволило авторам оценить время жизни основателя гаплотипа и, что важнее для других исследователей — долю «не-отцовства» (от англ. non-paternity — частоты получения фамилии не от биологического отца, а точнее — Y хромосомы не от формального отца). Доля «не-отцовства» составила 1,3 % за поколение. Оценки этой же величины у других авторов колеблются в основном от 2 до 5 % [MacIntyre, Sooman, 1991].
Довольно смелые выводы делает другой автор [King et al., 2006]. С большим количеством оговорок и в предположении создания в будущем (но пока лишь «умозрительной») базы данных о соответствующих друг другу гаплотипах Y хромосомы и фамилиях, он предлагает ДНК тестирование для определения возможной фамилии преступника, «оставившего ДНК» на месте преступления. Автор предлагает использовать такой подход в качестве дополнительных (хотя и не веских самих по себе) улик и сужения круга подозреваемых. Для того чтобы предлагать такой метод, автор исследует корреляцию гаплотипов в парах однофамильцев в Англии и показывает, что эта корреляция наличествует, хотя и не очень высока. Он показывает на конкретных данных, что лица с редкими фамилиями чаще оказываются родственниками по отцовской линии, чем лица с частыми фамилиями.
Иногда мотивом для исследования однофамильцев является «проверка мифа» — попытка найти следы древнего героического предка у потомков фамилий, по легендам происходящих из его колена. Такова, например, работа Мооге с соавторами [Moore et al., 2006], в которой исследуются ирландцы — народ, видимо, начавший использовать фамилии раньше других современных европейских народов. Хотя работа в целом носит популяционный характер (сперва исследуются случайные выборки из разных частей Ирландии), в ней исследуются представители фамилий, по легендам происходящих от династии Uí Néill (буквально потомки Найала). Оказалось, что 52.5 % изученной выборки принадлежат одному гаплотипу, который произошёл около 1730 (±670) лет назад. Неизвестно, как звали человека, основавшего эту линию, но он имеет непосредственное отношение к происхождению потомков Найала. Потомки этого колена, видимо, обладали социально определяемой повышенной приспособленностью (способностью оставлять большее количество потомков), а именно — родовитостью (которая определяется фамилией), и их прирост в каждом поколении с 500 года н. э. составил -21 % за поколение.
В аналогичной по задачам работе, «когда мы понимаем мифы о населении буквально» [Jobling, 2001], авторы проверяли легенду о происхождении всего корейского народа от одного относительно недавнего легендарного предка по имени Tangoon и, как можно было ожидать, получили отрицательный результат.
К этому же разделу «пофамильных исследований» относятся и другие работы — например, McEvoy и Bradley [2006]. Авторы исследуют различия разнообразия гаплотипов у однофамильцев в зависимости от того, как часто фамилии «мутировали» — возникали новые фамилии из старых. В Ирландии одной из причин параллельного возникновения фамилий была англицизация ирландских фамилий. Например, фамилии Mac Fhíodhbhuidhe и Mac an Bheatha, которые не перепутал бы ни один ирландец, англичане записали одинаково — McEvoy, и у носителей этой фамилии чётко выделяется два основателя, время жизни которых отличается более чем на 500 лет.
Подводя итог этого направления исследований, можно сказать, что они показали, каков приток «в фамилию» генов из других фамилий (первая работа такого рода осуществлена в 1973 году [Genest, 1973], но основной ряд работ выполнен только в последние пять лет) и какова непосредственная связь между фамилией и гаплотипом Y хромосомы.
«Пофамильное» направление представляет большой интерес и для частных лиц, интересующихся своей родословной. Можно только порадоваться за знаменитого профессора Bryan Sykes и за Brian McEvoy, которые смогли совместить интереснейшую для науки работу с удовлетворением собственного любопытства по поводу происхождения своей фамилии.
ПОПУЛЯЦИОННАЯ СВЯЗЬ ФАМИЛИИ И ГЕНОТИПА
Это второе направление исследований, изучающих сопряженность фамилии и Y хромосомы. Оно нацелено на анализ генетических различий между популяциями, различающихся по происхождению фамилий.
Здесь фамилия выступает не как квазигенетический маркёр конкретной Y хромосомы, а как квазигенетический маркёр популяции. В этом случае оказывается не важно, насколько велика связь конкретной фамилии с конкретной Y хромосомой: фамилия как признак культуры становится в один ряд с другими квазигенетическими маркёрами или характеристиками популяции — лингвистическими, этнографическими и прочими. Также как, например, наличие определённого узора на традиционной одежде или же наличие сходных мотивов в мифах, так и сходство популяций по большому числу фамилий может указывать на возможную близость популяций. При популяционном подходе отдельные случаи «не-отцовства» не отражаются на популяционных частотах фамилий, поскольку эти случаи редки и в целом компенсируют друг друга.
Во всех работах подчёркивается, что огромным преимуществом фамилий по сравнению с другими квазигенетическими маркёрами является возможность тотального исследования населения.
В работе Zei и соавторов [Zei et al., 2003] исследуется население Сардинии. Выборка подразделяется по месту происхождения коренных сардинских фамилий, которое определяется по области Сардинии с максимальными частотами данной фамилии, а также по историческим источникам. Фамилии отнесены к трём историко-географическим зонам Сардинии. Показаны генетические различия между популяциями, фамилии которых принадлежат разным регионам.
В работе Immel и соавторов [Immel et al., 2006] две сравниваемые группы формируются из одной выборки — жителей г. Галле (Германия). Выборка разделена по происхождению фамилий обследуемых: у 195 мужчин фамилии немецкого (группа G); у 185 — фамилии славянского происхождения (группа S); у 39 человек фамилии смешанного происхождения (группа М). В качестве сравниваемых групп использовались данные о 29 сорбах (коренное славянское этническое меньшинство, проживающее на границе с Польшей) и о 1313 поляках из [Roewer et al., 2005]. Была показана генетическая близость группы (S) с поляками и сорбами и значительно большее генетическое расстояние от этих трёх групп до смешанной группы, включающей генетически не различающиеся выборки (G) и (М).
Наиболее любопытной нам кажется работа Bedoya с соавторами [Bedoya et al., 2006], поскольку она сочетает в себе подходы популяционных и «пофамильных» исследований. В работе привлекаются данные о динамике частот фамилий за несколько последних веков, чтобы определить характер изменения популяционной структуры в этот период. Работа посвящена горному изо-ляту в Колумбии, основным фактором популяционной динамики которого была иммиграция испанцев, действовавшая с той или иной интенсивностью после их первого появления на территории Колумбии. Сходство распределений фамилий в конце XVIII века и в наше время при возрастании с тех пор численности населения в 107 раз позволяет авторам утверждать, что, по крайней мере, с конца XVIII века основным фактором динамики популяций был её рост, а не иммиграция из Европы. Этот вывод чрезвычайно важен для интерпретации результатов молекулярно-генетического анализа, проводимого авторами, и уточнения времени формирования наблюдаемых особенностей популяционного генофонда.
Аналогичная работа была проведена ранее нами [Почешхова, 1998; Балановская и др., 1999; Балановская и др., 2000] по изучению фамилий древнейшего коренного населения Западного Кавказа — адыгейцев и шапсугов. В работе, охватывающей тотально всех шапсугов, прослежена динамика их фамилий (населявших ранее побережье Черного моря от Туапсе до Сочи) на протяжении шести поколений. Такое глубокое знание генеалогии позволило сделать шесть «временных срезов» фамильного состава популяций, то есть реконструировать генофонд населения на одно, два, три, четыре, пять и шесть поколений назад. В результате такой реконструкции показана высочайшая устойчивость популяции: благодаря сохранению брачных традиций, она сохранила популяционную структуру вопреки переселениям и катастрофическому сокращению численности популяции в результате Кавказской войны (середина XIX века). Удивительное сходство всех шести карт главных компонент фамилий, построенных по данным о шести поколениях, и даёт нам право говорить о преемственности генофонда во времени, о сохранении его структуры даже после такой демографической катастрофы, которую претерпели шапсуги. Это означает, что с помощью фамилий мы можем проникать вглубь поколений, реконструировать генофонды прошедших времен.
КОРРЕЛЯЦИЯ РУССКИХ ФАМИЛИЙ И ГАПЛОГРУПП Y ХРОМОСОМЫ
Рассмотрев вкратце, каковы мировые данные о связи фамилий и Y хромосомы, обратимся к изучению этой связи в русском генофонде.
Конечно, мы понимаем, что даже если мы проведём (как в случае наших русских регионов) полностью параллельный анализ одних и тех же популяций и по фамилиям, и по Y хромосоме, то всё равно полного совпадения результатов быть не может. Маркёры Y хромосомы — это «настоящие» гены, но у них есть свой изъян: по ним изучено много меньшее число популяций и человек. По Y хромосоме 1257 человек представляют 14 районов. По фамилиям изучен миллион человек из 50 районов. Разница существенная. Но у фамилий, к сожалению, есть свой и куда более важный недостаток — они только «квазигены», столь переменчивые и столь юные по сравнению с настоящими генами.
Поэтому нельзя ожидать полного сходства. Но есть ли оно вообще?
Те, кто заглядывал в 6 главу, уже знают, что сходство налицо. Напомним, что на карте главного сценария всех гаплогрупп Y хромосомы, мы видели чётко выраженный широтный градиент (рис. 6.3.11.). Это означает, что, двигаясь с севера на юг, мы обнаруживаем намного большие различия между русскими популяциями, чем двигаясь с запада на восток. Мы видим на этой «главной» карте Y хромосомы и резкие различия Северного и Южного регионов, и сходство регионов средней полосы. Это значит, что по маркёрам Y хромосомы в главе 6 мы видели ту же картину структуры русского генофонда, которую только что прогнозировали по фамилиям. Гены и фамилии в этой общей картине русского генофонда согласны друг с другом.
Но можно возразить, что это сходство отражает лишь самые общие черты генофонда, и получено оно с помощью качественных, а не количественных сравнений. Хотя мы считаем, что совпадение общих черт генофонда намного важнее количественного анализа, но проведём и его. Причём максимально строго. Выше мы рассчитали матрицу неевских генетических расстояний между пятью русскими регионами по данным о фамилиях. Проведём полностью аналогичный расчёт расстояний и для маркёров Y хромосомы. И построим матрицу тех же неевских генетических расстояний между теми же пятью основными регионами, но теперь уже по данным об изменчивости Y хромосомы.
Чтобы анализ был полностью количественным, мы будем сравнивать друг с другом не диаграммы многомерного шкалирования, являющиеся «картинками», иллюстрациями этих расстояний, а сами матрицы расстояний.
Коэффициент связи оценивает, насколько фамилии и гены дают похожие оценки близости между регионами, то есть оценки структуры русского генофонда. Если сходство велико, то коэффициент корреляции будет большим (при полной идентичности равен 1). Если сходства нет, то коэффициент корреляции будет равен 0.
Оказалось, что коэффициент корреляции между матрицей расстояний по фамилиям и матрицей расстояний по генам очень высок и достигает 0.6.
Напомним, что при введении фамилий в популяционно-генетические исследования, был проведён аналогичный анализ связи между распределением фамилий и классических маркёров. Этот анализ был проведён А. А. Ревазовым для северных русских популяций. Коэффициент корреляции оказался равным r=0.32 [Ревазов и др., 1986]. Этого уровня связи оказалось достаточным, чтобы фамилиям присвоить почетное звание «квазигенетических маркёров» и рекомендовать использовать фамилии, как аналоги генов при изучении генофондов [Ревазов и др., 1986].
Итак, корреляция между настоящими генами и фамилиями оказалась очень велика — 0.6. Это означает сходство между структурой русского генофонда, выявляемой через фамилии и через «настоящие» гены. Оба очевидца — фамилии и генетика — дают сходные показания. Такое прямое сравнение фамилий с генетикой ещё раз показывает, какими парадоксально надежными маркёрами являются фамилии.
§ 3. «Главные сценарии» изменчивости
Рассмотренные нами «простые» карты отдельных фамилий отмечают отдельные события. Чтобы увидеть цепь этих событий, сплетающихся в единую историю русского генофонда, надо «сплавить» воедино изменчивость множества популяций и фамилий. Такое обобщение могут дать синтетические карты, созданные на основе множества карт отдельных фамилий. Для этой цели, как и по всем другим признакам — антропологии и генетики (главы 4, 5, 6) — мы провели анализ главных компонент. Геногеографические карты главных компонент являются картами новых обобщённых признаков. Они описывают основную часть разнообразия всех фамилий и выявляют основные «сценарии» их изменчивости.
Однако специально проведённые разные виды анализа показали, что в составе 75 фамилий Атласа в большей степени представлены фамилии Западного и Центрального регионов и в целом — регионов среднерусской полосы, а Южный и Северный регионы отодвинуты на задний план. Это, конечно же, снижает возможности картографического Атласа фамилий в реконструкции структуры всего русского генофонда — его ландшафт мы видим с точки зрения Запада и Центра.
Поэтому из-за ограниченности объёма книги мы не приводим карты главных компонент (они будут приведены на сайте). Когда же мы соберём данные, настолько полно покрывающие «исконный» ареал русского народа, что мы сможем отказаться от заданного нам списка 75 фамилий и перейти к анализу сотен и тысяч фамилий, тогда будет проведён картографический анализ «фамильного генофонда», где смещение в сторону любого из регионов будет исключено.
Здесь укажем лишь, что в целом оба главных сценария фамильного ландшафта выделяют, прежде всего, среднерусскую полосу — она служит основным структурообразующим элементом обеих карт. Обе карты главных компонент имеют ещё две общие черты: постепенное изменение значений к югу ареала, и выраженное своеобразие северных русских популяций.
Таблица 7.6.1.
Коэффициенты корреляции между главными компонентами изменчивости фамилий и других признаков — соматологии, дерматоглифики, классических и ДНК маркёров
Подчеркнём, что этот результат, полученный при картографическом анализе 100 популяций (по 75 фамилиям), подтверждает результат, полученный статистическими методами при анализе 5 регионов (но по всему фонду фамилий — более 14 тыс.).
Сравним также показания фамилий и других очевидцев структуры генофонда. Такой «мультиокулярный» подход позволяет оценить, насколько карты «главных сценариев» по фамилиям сходны с теми, что обнаружила антропология и генетика.
КОРРЕЛЯЦИИ МЕЖДУ «ГЛАВНЫМИ СЦЕНАРИЯМИ» ВСЕХ ПРИЗНАКОВ
В нашем случае мы имеем редкую возможность сравнить показания фамилий с показаниями ещё четырёх свидетелей — соматологии, дерматоглифики, классических и ДНК маркёров. Корреляции между картами всех трёх главных компонент фамилий и остальных четырёх очевидцев приведены в таблице 7.6.1.
Мы видим, что карта первой главной компоненты изменчивости фамилий (1PCF) обнаруживает хорошее сходство с картой первой компоненты по признакам антропологии — коэффициент корреляции выше 0.6 (р=0.66). Несколько слабее связь с классическими маркёрами (р=0.44). Невысокая связь наблюдается с главным сценарием Y хромосомы (р=0.29). Однако с ландшафтом третьей компоненты Y хромосомы связь выражена чётко (р=0.49).
Зато вторая компонента по фамилиям (2PCF) высоко коррелирует с обеими вторыми компонентами маркёров генетики: и по ДНК маркёрам Y хромосомы (р=0.63), и по классическим маркёрам (р=0.65) коэффициенты связи выше отметки 0.6. Также явно выражена (р=0.47) и связь карты второй компоненты изменчивости фамилий (2РСр) со второй компонентой признаков антропологии (2РСд). Важно подчеркнуть, что фамильный ландшафт второй компоненты (2PCF) обнаруживает ровный ряд корреляций с первыми компонентами всех четырёх типов признаков (связь с 2РСА, 1PCD, 1PCG, 1PCY лежит в интервале 0.23<р<0.40), указывая на связь с широтно бегущими волнами русского генофонда.
В целом мы видим, что фамильный ландшафт обнаруживает связь то с одним, то с другим из иных типов признаков. Можно надеяться, что когда у нас появится возможность включить в Атлас фамилий карты не 75, а сотен и тысяч русских фамилий, то эти распавшиеся куски единой картины воссоединятся.
СРАВНЕНИЕ КАРТ «ГЛАВНЫХ СЦЕНАРИЕВ» ВСЕХ ПРИЗНАКОВ
Напомним читателю, что корреляции, которые мы только что рассмотрели, рассчитывались вовсе не по всему «исконному» русскому ареалу, представленному на картах «главных сценариев» фамилий. К сожалению, для расчёта корреляций по всем пяти типам признаков надо использовать средний по всем признакам «надёжный» ареал, а его размер и контуры задаются теми признаками, которые наименее подробно изучены. Поэтому и «надёжный» ареал карты, по которому рассчитывались корреляции, сократился, как шагреневая кожа, до ареала наименее изученных классических маркёров (глава 5).
По этой причине, может быть, важнее сравнить сами образы карт, которые позволяют составить более полное представление о сходстве и различиях «главных сценариев», чем скупые цифры корреляций. Такое сравнение обобщённых карт показывает, что первые компоненты всех четырёх типов признаков антропологии и генетики характеризуются одним и тем же — широтным — направлением изменчивости. Все четыре ландшафта различаются лишь двумя элементами: 1) положением южных «возвышенностей»; 2) степенью выраженности северного «поморского» ядра, которое фамилии выявляют особенно ярко.
К этой серии карт в определённой степени близки оба фамильных ландшафта — первой и второй главных компонент изменчивости фамилий. Они как бы поделили единый ландшафт на две карты: карта первой компоненты «прозападная», а второй компоненты — «провосточная». Но обе компоненты изменчивости фамилий вместе образуют «нагорье» в области среднерусских регионов и широкие «долины» на юге и на севере. Такое деление ландшафта на две части может быть связано с несовершенством набора 75 фамилий. Возможно, что фамилии, кроме общих трендов, могут выявлять и иные закономерности, к которым менее чувствительны признаки антропологии и генетики (подобное явление для признаков дерматоглифики в Восточной Европе будет рассмотрено в следующей главе).
§ 4. География инбридинга
Итак, мы рассмотрели основные ландшафты в географии русских фамилий — карты главных компонент. Однако в геногеографии есть и другие типы обобщённых карт, которые позволяют выявить особые аспекты структуры генофонда. И среди них — карты случайного инбридинга (подразделённости популяций, степень изолированности — и, следовательно, инбредности локальных подразделений). Эти карты показывают нам структуру генофонда с новой стороны. Мы можем увидеть, какова степень подразделённости популяций в разных частях «исконного» русского ареала. Одновременно эта карта позволяет оценить вероятный груз наследственной патологии. Актуальность карт прогноза распространённости наследственных заболеваний, как и социальное значение такого прогноза, не требуют доказательств.
ЧТО ТАКОЕ СЛУЧАЙНЫЙ ИНБРИДИНГ?
Карта случайного инбридинга является частным случаем карт разнообразия. Она показывает, как в разных частях ареала меняется уровень случайного инбридинга. Инбридинг, и в особенности его случайная составляющая — это одно из центральных понятий в популяционной генетике, у него много разных сторон (см. Приложение). Сейчас для нас важно, что этот показатель измеряет степень подразделённости популяции. Он как бы показывает степень изолированности популяций на тех или иных территориях. Одновременно он показывает уровень изогаметации — вероятность увеличения доли гомозиготности (и, соответственно, уменьшения гетерозиготности) за счёт эффекта подразделённости популяции. Эта вероятность означает переход рецессивных генов в гомозиготное состояние и потому имеет решающее значение в формировании груза наследственной патологии — только встречаясь в гомозиготе, эти гены проявляют себя в виде тяжелейших наследственных болезней. Поэтому именно от уровня случайного инбридинга и зависит, много ли в популяции будет больных наследственной патологией. Случайный инбридинг можно рассчитать разными методами. Расчёт по данным о частотах фамилий является одним из наиболее распространённых и надёжных методов.
Мы не будем подробно здесь излагать анализ инбридинга по фамилиям — он описан во множестве специальных публикаций в генетической литературе, и мы также посвятили разработке его методологии специальную работу [Балановская и др., 2000]. Инбридинг рассчитывается при анализе всей совокупности частот фамилий методом изонимии — через вероятность заключения браков между носителями одинаковых фамилий. Для одной фамилии (i), встреченной с частотой р4, коэффициент изонимии составит fr=(рi2)/4. Но для популяции инбридинг оценивается по всем фамилиям сразу fr=∑(рi2)/4. Если популяция подразделенная и насчитывает несколько уровней иерархии, то для оценки fr на каждом более высоком уровне (например, региона) из её оценки надо вычесть инбридинг нижестоящих уровней (например, области, района, локальной популяции).
Укажем лишь, что использование фамилий — наряду с прогнозом по классическим и молекулярным генным маркёрам — является в медицинской генетике испытанным методом прогнозирования инбридинга и связанного с ним груза наследственных болезней. Целым рядом работ двух школ — акад. РАМН Е. К. Гинтера и проф. Ю. Г. Рычкова — показано, что этот широко используемый в мировой практике метод и в населении России даёт хорошее согласие с оценками инбридинга, полученными прямым путем (см. Приложение). В частности, была составлена уникальная сводка данных по распространению наследственной патологии в населении Архангельской, Костромской, Кировской, Ростовской, Тверской областей, Краснодарского края и ряда других регионов Урала, Кавказа и Средней Азии. Анализ этих данных, собранных в ходе многолетних исследований отечественной школы медицинской генетики (возглавляемой акад. РАМН Е. К. Гинтером), сопровождался сбором демографической информации о миграциях и данных о распространении фамилий. Результаты сравнительного анализа таких данных (подробно изложенные, например, в монографии «Наследственные болезни в популяциях человека», 2002), убедительно свидетельствуют о хорошем согласии между прогнозом инбридинга по данным о фамилиях и реально наблюдаемым грузом наследственной патологии.
ОЦЕНКИ ИНБРИДИНГА ДЛЯ РУССКОГО ГЕНОФОНДА
Для оценок инбридинга мы использовали только информацию о популяциях пяти основных регионов «исконного» русского ареала (Восточный, Центральный, Западный, Северный, Южный). Коэффициент случайного инбридинга был рассчитан нами для каждой популяции на каждом уровне популяционной иерархии: 1) для 883 локальных популяций (fPOP); 2) для 50 районов (fDIS); 3) для 5 регионов (fREG); 4) для русского народа в целом (fETN). Коэффициент инбридинга fr·102, полученный по данным обо всех встреченных фамилиях в пределах русского народа, составил fPOP-ETN=0.71. Выявлено, что уровень инбридинга fr значительно варьирует среди популяций каждого уровня. Различия в уровне инбридинга отдельных районов достигают размаха двух порядков величины: 0.01<fPOP- DIS<0.69. Но даже на самом высоком уровне — уровне регионов — различия в уровне инбридинга очень велики (на порядок величины): в Западном регионе fDIS-REG=0.04; в Южном регионе fDIS-REG=0.06; в Северном регионе fDIS-REG=0.18; в Восточном регионе fDIS-REG=0.25.
Карты инбридинга построены для каждого уровня популяционной системы русского генофонда — локальных популяций, районов, регионов. Их анализ, как и анализ большой совокупности статистических показателей, являются предметом специального анализа прогнозируемого груза наследственной патологии русского генофонда, что выходит далеко за пределы данной книги. Поэтому приведём лишь одну, но наиболее надёжную карту (рис. 7.6.2.) — инбридинга на уровне районов fDIS.
Карта выявляет очень ярко и чётко выраженную закономерность — неуклонное возрастание с юго-запада на восток прогнозируемого уровня случайного инбридинга и, соответственно, груза наследственной патологии. Эта карта (в совокупности с картами других показателей инбридинга fPOP, fPOP-DIS, fDIS-REG, fPOP-REG) позволяет прогнозировать в пределах «исконного» русского ареала отягощённость русского генофонда наследственной патологией. Таким образом, данные о парадоксально надёжном маркёре — русских фамилиях — служат не только изучению истории русского генофонда, но и прогнозу груза наследственных болезней.
Рис. 7.6.2. Карта прогноза груза наследственной патологии русского генофонда.
По данным об изменчивости фамилий в 50 районах «исконного» русского ареала дана оценка случайного инбридинга (fDIS·100).
§ 5. Основные черты «фамильного портрета»
Главой о русских фамилиях мы завершаем наше описание русского генофонда. В трёх предыдущих главах этой части книги мы анализировали данные антропологии, классические генетические и ДНК маркёры, и, наконец, в этой главе рассмотрели фамилии. Этот тип данных самый своеобразный, и его применение к изучению генофонда меньше всего разработано. Поэтому «фамильная» глава ещё больше, чем все предшествующие главы, похожа на самостоятельную книгу: в ней описываются общие принципы и подходы такого исследования, его методология, методы, история аналогичных исследований, большое внимание уделено материалам. И, разумеется, подробно описаны результаты — а их много. И получены эти результаты разными методами, несколько из которых разработаны впервые. Не удивительно, что глава о фамилиях получилась столь объемной, что её нелегко прочесть за один присест.
Авторы особенно беспокоятся за ясность для читателя самой структуры исследования. Ведь применены разные методы, которые нередко давали одинаковые результаты. Не вызовет ли это путаницы, не покажутся ли разные методы повтором одного и того же из-за сходства результатов? И наоборот, не будут ли одни и те же положения выглядеть разными оттого, что к ним мы возвращаемся в разных местах главы? Структуру исследования мы постарались чётко прописать в названиях разделов — обоснование подходов и методов (7.7.), описание материалов (7.2.), общий обзор фамилий (7.3.), сравнение регионов по спектру фамилий (7.4.), карты отдельных фамилий (7.5.), обобщённый анализ по всем фамилиям (7.6.). Но достаточно ли этого, чтобы поделиться с читателем той чёткостью и логикой исследования, а вместе и важнейшими результатами, которые сами авторы видят столь ясно?
Чтобы приблизиться к этому, повторим некоторые положения и итоги этой главы. Это не заключение в строгом смысле — читатель не найдет здесь таких обобщений или новых мыслей, которые отсутствовали бы в предшествующих разделах. Это скорее очень краткое повторение отдельных фрагментов, которые выделяют главные линии исследования.
Итак, что мы изучили и что это даёт?
ФАМИЛИИ — ГЕНЫ
Фамилии — привычный инструмент для популяционной генетики. Как зарубежные, так и отечественные генетики охотно использовали их для изучения структуры генофонда, в том числе для прогноза инбридинга. Недавно интерес к фамилиям усилился — благодаря сопряженности фамилий и Y хромосомы, которые должны наследоваться параллельно по отцовской линии и, действительно, нередко ведут себя согласованно. Фамилии широко изучались и у нас в стране. Научная школа Ю. Г. Рычкова преимущественно сравнивала дифференциацию генофонда, рассчитанную по фамилиям и по генам, и всегда обнаруживала совпадения. А научная школа Е. К. Гинтера применяла фамилии чаще всего для оценки инбридинга, и в том числе А. А. Ревазову мы обязаны термином «квазигенетические» маркёры — фамилии как «почти гены». Если считать, что фамилия наследуется от отца к сыну и далее в поколениях (что в большинстве случаев совершенно справедливо!), и если знать частоты фамилий в популяциях (а собрать такие сведения вполне реально), то частоты фамилий можно рассматривать как частоты аллелей, и применить к фамилиям все обычные методы популяционной генетики.
МАТЕРИАЛЫ
Именно таким образом было изучено много народов, в том числе и русские популяции. Наше исследование продолжает ту же традицию, но — если позволено так сказать — на огромном материале, организованном по-новому и проанализированном целым арсеналом новых методов. Мы теперь знаем о русских фамилиях столько, сколько раньше и не надеялись узнать. Материал представляет собой частоты фамилий, которые основываются на тотально изученном населении (практически каждый житель!) пяти основных регионов.
Для хранения и обработки этого огромного массива данных разработана специальная база данных о русских фамилиях, программа «ONOMA» и ряд других программ. А в сборе информации о фамилиях авторам по их просьбе помогали их коллеги Н. Н. Аболмасов, И. В. Евсеева, М. Б. Лавряшина, Э. А. Почешхо-ва, И. Н. Сорокина, М. И. Чурносов и многие другие.
Преувеличивая, можно было бы сказать, что учтена фамилия каждого русского человека — если бы не два ограничения. Во-первых, мы изучаем коренное население — это общий принцип изучения генофонда. Применительно к фамилиям это значит, что изучаем только сельское население и только в пределах «исконного» русского ареала. Центральная Россия и Русский Север изучаются, а Урал, Сибирь, Аляска и прочие «не исконные» русские территории — нет. Второе ограничение в том, что даже «исконный» ареал мы пока не изучили полностью, а выбрали семь областей из двух десятков областей исторического ареала. Эти семь областей группируются в пять регионов: Северный (Архангельская область), Восточный (Костромская область), Центральный (Кашинский район Тверской области), Западный (Смоленская область) и Южный (Белгородская, Курская и Воронежская области). В областях, как правило, изучено по несколько районов, а эти районы уже изучены тотально — собраны данные обо всём сельском населении этих районов. В дополнение к этим пяти основным регионам мы изучили три «окраинных» региона — Северо-Западный (Псковская область), кубанские казаки (Адыгея) и «Сибирь», представленную Кемеровской областью.
Эти два ограничения делают наше исследование не «тотальным» (чтобы так сказать, нужно изучить фамилии каждого из 116 миллионов русских), а субтоталь-ным — изучен «всего лишь» один миллион человек. Но этот миллион дорогого стоит — он представляет сельское население географически отдалённых друг от друга в среднем на 1000 км важнейших регионов «исконного» исторического ареала русского народа. Поэтому мы считаем, что эти данные весьма хорошо представляют русский генофонд.
Для выявления основных, базовых закономерностей русских фамилий этих данных оказалось достаточно. Но по мере углубления в специальные вопросы, особенно в географию фамилий и в подробное изучение географической структуры генофонда, растёт нужда в пополнении исходной информации — необходимо собрать данные о частотах фамилий в остальных областях «исконного» русского ареала, а возможно, и за его пределами. Авторы надеются, что эти данные будут со временем собраны, а пока предлагают ознакомиться с общими, базовыми результатами, извлечёнными из уже собранного огромного массива материалов.
БАЗОВЫЕ РЕЗУЛЬТАТЫ
1) Составлен список всех встретившихся фамилий, которых оказалось 67 тысяч. По мере сбора новых данных этот список будет расти, но уже сейчас, изучив восемь контрастных регионов, мы знаем основное разнообразие русских фамилий.
2) Бросается в глаза, насколько эти фамилии различаются по частоте. Одни настолько часты, что в среднем каждый сотый житель русского ареала — Кузнецов, каждый семьдесят пятый — Иванов, а почти каждый пятидесятый — Смирнов. Другие фамилии столь редки, что в том районе, где обнаружена фамилия, а порой и во всём русском ареале есть лишь считанные её носители.
3) Для многих фамилий мы построили карты их распространения. На картах видно, что почти каждой русской фамилии свойственно иметь свою географическую зону распространения, а не покрывать причудливой мозаикой русский ареал. Например, Петровы чаще всего встречаются на севере и западе, а для прочих территорий эта фамилия редкая. Такие зоны распространения могут быть удивительно компактны, а могут занимать обширные области. Для многих фамилий зоны очерчены чётко. Но для некоторых зоны прерывистые, неясные, и встречены даже фамилии распространённые то здесь, то там без всякой видимой закономерности. Правда, как раз они являются исключением, подтверждающим общее обнаруженное правило: русским фамилиям свойственно иметь определённые зоны распространения.
4) И спектр встреченных фамилий, и их частоты различаются от региона к региону. Оказалось, что все регионы средней полосы (Западный, Центральный и Восточный) похожи друг на друга. Южный регион заметно от них отличается. Но особенно своеобразен Северный регион. А вот Сибирский регион, хотя географически он самый отдалённый, по частотам фамилий очень близок к регионам средней полосы. Более того, Сибирский регион ближе всех к усреднённым русским показателям. Этот парадокс объясняется просто — Сибирь не является частью «исконного» ареала, её население — это переселенцы из «исконного» ареала, причём из самых разных его частей. Именно «плавильный котел», в котором смешались выходцы из самых разных частей «исконного» ареала, и произвёл «среднерусский» сплав: присутствие в Сибири самых разных фамилий с частотами, близкими к среднерусским частотам этих фамилий.
5) «Осмысленные классы» создают «осмысленный» портрет региона. Результаты сравнения регионов по частотам фамилий совпали с независимым сравнением регионов по семантическим классам фамилий.
«ОСМЫСЛЕННАЯ» КЛАССИФИКАЦИЯ ФАМИЛИЙ
Классифицирование фамилий — совсем новый подход в генетике. Обычно популяционно-генетические работы рассматривают все фамилии как равноправные признаки, неразличимые, одинаковые, безликие. И мы, сравнивая регионы по частотам фамилий, поступили точно так же. Такой статистический подход позволяет рассчитать все показатели, которые мы рассчитываем по генам. Но мы предложили дополнить его иным, новым подходом, который назвали семантическим.
Его суть очень проста: надо вглядеться в лицо каждой фамилии, и отнести её к одному из классов. Например, при статистическом подходе фамилии Иванов, Петров, Никитин, Волков, Зайцев и Курочкин для нас совершенно равноправны. А при семантическом подходе Ивановых, Петровых и Никитиных мы отнесем к фамилиям, производным от имён, а Волковых, Зайцевых и Курочкиных — к фамилиям, образованным от зверей. И будем анализировать их раздельно.
Важным показателем тогда станет соотношение разных классов в спектре фамилий. В нашем примере оказалось три фамилии от имён и три «от зверей». Но в другой популяции это соотношение может быть инное. Например, на северо-западе почти все фамилии окажутся производными от имён. Это означает, что мы получаем в руки совершенно новую характеристику популяций, обогащаем свои знания и открываем новый метод. Такой семантический подход не имеет аналогий в анализе генов. Это характерная черта, особое богатство, свойственное анализу фамилий, благодаря тому, что они расцвечены красками языка и несут смысловую нагрузку.
СЕМАНТИЧЕСКИЕ КЛАССЫ
Фамилию можно отнести к одному из пяти классов.
1. «Календарные» — образованные от имён церковного календаря (например, Иванов, Феофанов).
2. «Профессиональные» — от названий профессий (Кузнецов, Колесников).
3. «Звериные» — от слов, описывающих животный и растительный мир (Волков, Жуков, Дубов, Листьев).
4. «Приметные» — от примет внешнего или психологического облика (Румянцев, Быстров).
5. Фамилии, которые нельзя отнести ни к одному из этих классов (Морозов, Булыгин) выделяются в пятый класс «иные».
Распределить фамилии даже по таким примитивным классам непросто. Не зная устаревших, диалектных или просто редких слов («бондарь» — делающий бочки, «саук» — Савва, «третьяк» — третий ребенок в семье) можно неправильно классифицировать Бондаренко, Саукова, Третьякова. А для многих фамилий этимология неоднозначна, запутанна и спорна. Так что классифицировать фамилии должен бы специалист по русской ономастике, но из-за неудач в поисках такового авторы решились классифицировать пока сами.
Результаты, как часто бывает с анализом фамилий, превзошли ожидания.
ФАМИЛЬНЫЕ ПРОФИЛИ РЕГИОНОВ
Рассмотрев пятьдесят фамилий, самых частых в Центральном регионе «топ-50», мы обнаружили, что из них 25 — «звериные». То есть 50 % фамилий приходится именно на один этот класс. В Западном регионе на один класс приходится ещё больше — 60 % фамилий, но этот лидирующий класс включил вовсе не «звериные», а календарные фамилии. На Северо-Западе календарные фамилии совсем вытесняют остальные — там их 82 %. А в Восточном регионе календарных только 14 %, но зато как нигде часты приметные фамилии, которые делят первое место со «звериными» фамилиями. Так получилось, что каждый из остальных двух классов фамилий тоже имеет «свой» регион: профессиональные фамилии лидируют на юге (там их 34 %), а «иные» — на севере (тоже 34 %).
Так что мнение о том, что самые русские фамилии — это Иванов, Петров и Сидоров (то есть календарные), справедливо только в западной части «исконного» ареала, и совсем неверно для востока и центра. Создаётся впечатление, что регионы различаются по способам образования фамилий — на юге чаще всего от профессий, в центре — «от зверей» и так далее. И каждый регион имеет свой характерный «фамильный профиль» — сколько фамилий приходится на долю каждого класса.
Это не просто любопытное открытие, но и инструмент изучения генофонда. Посмотрим, например, на кубанских казаков. Их предки пришли из России и Украины, но откуда именно из России? Это вопрос о генофонде, и семантические классы фамилий могут дать предварительный ответ. Профиль фамилий кубанских казаков таков:
Календарные — 34%
Профессиональные — 22%
Звериные — 16%
Приметные — 14%
Иные — 14 %.
Этот профиль больше всего похож на профиль соседнего с казаками Южного региона. Но фамилии показывают, что предки казаков переселялись не только оттуда. Отличия «казачьего» профиля от «южного» свидетельствуют, во-первых, о значительном потоке фамилий из среднерусских регионов, и, во-вторых, о последующей самостоятельной жизни казачьей популяции и о возникновении собственных неповторимых фамилий. Конечно, не стоит думать, что беглый анализ всего лишь по пяти классам фамилий явится откровением о происхождении кубанских казаков. Но это иллюстрация тех реальных возможностей, которые даёт семантический анализ фамилий.
Ещё пример: как мы помним, статистический анализ показал, что фамильный фонд Сибири близок к среднерусскому — вероятно, по причине миграций из разных русских регионов. Семантический анализ добавляет, что особенно мощными могли быть миграции из самого географически отдалённого региона — с Запада: именно с «западным» профилем особенно схож «сибирский».
ПЕРЕЧИСЛИМ МЕТОДЫ
Для анализа фамилий мы применили не один-два, а веер практически независимых методов. Упорядочим их.
1) «ТОПЫ»: АНАЛИЗ САМЫХ ЧАСТЫХ ФАМИЛИЙ. В самых разных видах анализа нужно «перебрать» все фамилии — то сравнить их, то классифицировать, а сделать это вручную для многотысячных списков невозможно. Поэтому мы часто брали в анализ лишь несколько самых частых фамилий. Например, только что описанный анализ семантических классов выполнен по «топ-50»: в каждом регионе взяты 50 фамилий, самых частых в этом регионе, и только они классифицированы по семантике. Кроме «топ-50», использованы «топ-20», и даже «топ-10» и «топ-5» (только 5 самых частых фамилий). Несколько проверок показали что результаты, полученные по топ-50 и топ-20, обычно хорошо согласуются с анализом всего массива фамилий. Это значит, что использование только «топов» для многих видов анализа правомочно… Хотя, конечно, никогда заранее неизвестно, насколько большим должен быть «топ» чтобы дать правильный результат.
2) ПОИСК «ВСЕОБЩИХ» ФАМИЛИЙ. Раз мы имеем полные списки фамилий, встреченных в каждом регионе, мы можем посмотреть, насколько они перекрываются. Точнее: есть ли такие фамилии, которые встречаются в каждом регионе, существуют ли общерусские, повсеместные, «всеобщие» фамилии? При сравнении пяти регионов нашлось 257 таких фамилий. И есть основания думать, что после изучения других регионов этот список не сильно изменится — к нашему изумлению, при включении в анализ Сибирского региона этот список сократился только на 7 фамилий — а 250 фамилий (мы их привели в табл. 7.3.4.) оказались общими для всех шести регионов! В среднем, 13 % из «коренных» фамилий, встреченных в каком-либо регионе, оказываются всеобщими, присутствуют и в других регионах. Это очень большая величина — раньше считалось, что таких фамилий почти нет, и поэтому сравнение удалённых регионов не имеет смысла, но к счастью, это оказалось не так.
3) ИНДЕКС МЕСТА. В общерусском списке все 67 тысяч фамилий мы расставили по убыванию их средней частоты. Значит, у каждой фамилии есть свой номер, её «ранг», её место среди всех русских фамилий. У группы фамилий тоже есть её «ранг» — среднее место входящих в неё фамилий. Именно эту величину мы и называем индексом места. Пользуемся мы ей часто — это просто и эффективно.
Например, у нас есть список всех фамилий Западного региона, расположенных по их частоте в Западном регионе. Насколько этот список вторит «всеобщему»? Насколько «западные» фамилии совпадают со списком «всеобщих» фамилий? Чтобы ответить, нужно рассчитать индекс места для «западных» фамилий. Чтобы не считать индексы для тысяч фамилий, мы ограничиваемся расчётом для десяти самых частых фамилий. И эти показатели работают очень эффективно.
4) СРАВНЕНИЕ ПО ЧАСТОТАМ ФАМИЛИЙ. Здесь фамилии неотличимы от обычных генетических маркёров, и мы пользуемся обычными методами: рассчитываем генетические расстояния по частотам всех фамилий как бы по частотам аллелей, строим график многомерного шкалирования и так далее. Это позволило напрямую сравнить расстояния между регионами по частотам фамилий с расстояниями между популяциями из тех же регионов по частотам гаплогрупп Y хромосомы. Обнаружилась высокая корреляция (равная 0.6), доказывающая, что частоты фамилий достоверно свидетельствуют о «настоящем» сходстве популяций подобно «настоящим» генам.
5) СРАВНЕНИЕ ПО СЕМАНТИКЕ ФАМИЛИЙ. Мы уже говорили — такой анализ возможен только для фамилий. Каждая фамилия, встреченная в популяции, относится к тому или иному классу, и подсчитывается, какой процент фамилий приходится на каждый класс. Затем популяции сравниваются (на глазок или количественно) по полученным профилям классов фамилий. В этой книге мы классифицировали и сравнивали не все фамилии, а только «топ-50» каждого региона.
6) КАРТОГРАФИРОВАНИЕ ОТДЕЛЬНЫХ ФАМИЛИЙ. Здесь и статистический, и семантический подходы отходят в тень, и на сцене появляется карта — наш главный инструмент во всей книге. Картографирование фамилий ничем не отличается от картографирования распространения генов или любых других признаков.
Неожиданно и приятно для исследователя, любящего фамилии, что даже в географии отдельных фамилий явно видны пространственные закономерности. Даже такая, казалось бы, вездесущая фамилия, как Иванов, оказывается отнюдь не вездесущей. Её зона обитания — запад и север «исконного» русского ареала, а, например, на юге она редка. Тем самым мы попутно опровергаем миф о случайном, повсеместном, недавнем и неинтересном возникновении русских фамилий от имён — ведь если бы миф был верен, Ивановы встречались бы с одной и той же частотой повсюду, где крестили по православному календарю.
Раз фамилии картографируются так же, как и все остальное в геногеографии, значит с картами фамилий можно проводить дальнейший анализ — комбинировать их и в обобщённые карты главных компонент, и в карты инбридинга.
7) РАСЧЁТ СЛУЧАЙНОГО ИНБРИДИНГА. Это показатель весьма важный — он измеряет степень подразделённости популяций, и, кроме того, степень «огомозигочивания» (снижения гетерозиготности), что даёт прогноз груза рецессивных наследственных болезней. Этот традиционный для «фамильной генетики» расчёт мы провели для всех русских популяций. Результирующая карта показывает невысокие значения инбридинга на юге, и его возрастание к северо-востоку «исконного» русского ареала.
ОТСЕВ РЕДКИХ ФАМИЛИЙ
Наш обзор мы начали с числа 67 000 — именно столько обнаружилось русских фамилий. Но отражают ли они «только коренное» население, как требуется в геногеографии, обращенной к истории генофонда? При сборе генетических и антропологических данных мы спрашиваем каждого человека, где родились его родители и предки. Тех, кто происходит из данной местности («коренное население») мы включаем в выборку. А тех, у кого есть предки издалека — отсеиваем («пришлое население»). Так мы делим на коренное и на пришлое население при анализе генов. Но при анализе фамилий мы не можем опросить каждого из миллиона человек!
Вместо прямого опроса, все исходные данные о фамилиях мы пропустили через сито демографического критерия. В результате из примерно миллиона человек осталось около 700 тысяч человек — остальные триста тысяч оказались носителями фамилий, которые нигде, ни в одном районе не достигают численности даже в пять человек. Эти фамилии мы расцениваем как вероятно «пришлые» в изученных популяциях, а потому неинформативные для анализа коренного населения. Таких фамилий оказалось очень много: из 67 тысяч отсеялось пятьдесят три тысячи! Осталось лишь 14 тысяч фамилий, которые мы расцениваем как коренные — и только эти фамилии используются в большинстве видов анализа.
Стоит задуматься, не слишком ли много мы потеряли при таком отсеве? Скорее всего, нет. Ведь хотя мы отсеяли 75 % фамилий, но общее число человек снизилось только на 25 %. Именно потому, что эти фамилии очень редкие, их носителей не так много. Не включая их в анализ, мы скорее избавляемся от случайных помех, чем теряем ценную информацию о генофонде. Ведь наша цель — изучение фамилий не ради них самих, а ради изучения генофонда.
ФАМИЛИИ НЕ РАДИ ФАМИЛИЙ
Начиная наше изучение русских фамилий, мы стремились получить новые знания о структуре русского генофонда. Однако в процессе изучения обнаруживалось столько любопытных и удивительных свойств фамилий, что наше исследование стало во многом методическим: мы освоились с таким типом маркёров как фамилии, придумали и опробовали новые методы их анализа. Теперь пора оглянуться и посмотреть, какие же конкретные знания о русском генофонде это нам дало.
Главным является, пожалуй, информация о степени сходства разных регионов: сходство популяций среднерусской полосы, особость юга и севера. Важны и данные о Сибири: отсутствие своеобразия генофонда современного русского населения Сибири, его приближённость к усреднённому русскому генофонду, и в особенности к регионам средней полосы, и из них в первую очередь к Западному.
Карта инбридинга — второй важный результат — показывает его возрастание к северу и востоку. Значит, именно в этом направлении растёт подразделённость русского генофонда — восточные и северные популяции более изолированы друг от друга, и вероятно, меньше по численности и занимаемому ареалу, чем популяции того же ранга на западе и юге.
Наконец, третьим важнейшим результатом стали карты главных компонент. Для прочих типов признаков (классических маркёров, антропологии, Y хромосомы) карты главных компонент были главным обобщающим результатом. Теперь и фамилии встают в строй, становясь ещё одним очевидцем в «мультиокулярном» подходе, ещё одним свидетелем структуры генофонда. И карты главных компонент фамилий тоже показывают нам изменчивость, близкую к широтной, не противореча остальным свидетелям. Но в отличие от главных компонент по остальным системам, главные компоненты фамилий куда более своеобразны.
Это вызвано, прежде всего, тем, что анализ главных компонент мы смогли провести лишь по 75 фамилиям, а среди этих фамилий непропорционально много «календарных» и слишком мало фамилий, характерных для северного и южного регионов. Скорее всего, именно поэтому широтная изменчивость на картах фамилий оказалась затушёвана. Это окончательно прояснится в будущем, когда мы изучим недостающие регионы и сможем построить главные компоненты не по 75, а по всему множеству фамилий. Пока же первая главная компонента изменчивости фамилий выявляет распространение именно календарных фамилий. Именно они вносят основной вклад в первую компоненту, которая, как и календарные фамилии, сильно смещена к западу.
ЧТО ДАЮТ ФАМИЛИИ?
Что же нам дало изучение русских фамилий? Мы не будем повторять все те результаты, которые касаются фамилий как таковых. Мы посмотрим, что это дало для изучения русского генофонда.
Во-первых, фамилии оказались ещё одним — и парадоксально надёжным! — источником сведений о структуре генофонда. Они подтвердили различия между южными и северными русскими популяциями при меньших различиях между западными и восточными. При анализе других систем этот вывод следовал из главных компонент. При анализе фамилий он угадывается в компонентах и ясно виден на графиках сходства регионов. Фамилии дали дополнительную информацию и по многим более частным вопросам, уточняя и проясняя структуру русского генофонда.
Но, во-вторых, и в главных, «показания» фамилий оказались удивительно сходными с показаниями генов. Чего стоит, например, одна лишь высокая корреляция (r=0.6) между матрицами расстояний по фамилиям и по гаплогруппам Y хромосомы! Это неизменное сходство результатов, полученных по фамилиям и по генам, подводит к новому подходу, новому плану использования фамилий: сначала разведка структуры генофонда с помощью фамилий — и лишь затем планирование собственно генетических исследований. Ведь фамилии можно изучить тотально — для всех популяций, а в популяции для каждого человека. То есть сделать именно то, что невозможно сделать по генам.
Поэтому можно сперва провести разведку боем: изучить структуру генофонда по данным о фамилиях, выявить основные закономерности, основные «кластеры» популяций — и уже по этим данным планировать изучение генофонда по генетическим маркёрам.
Например, разумно было бы изучать по одной популяции из каждого кластера, выявленного фамилиями, чтобы охватить основное разнообразие генофонда. Тем самым фамилии не дадут упустить при генетическом обследовании ни одну из своеобразных, отличающихся групп. А именно эта опасность — постоянная головная боль полевого исследователя генофонда.
Можно предложить и ещё одно яркое применение фамилий — для изучения переселенческих генофондов. Предположим, какая-то группа населения сформировалась за счёт миграций из нескольких источников, нескольких «материнских» групп. И, зная частоты генов в материнских группах и располагая данными по фамилиям, мы можем узнать частоты генов в переселенческой группе, не изучая её! Для этого нужно по данным о фамилиях установить, какие группы являлись материнскими и в каком соотношении они смешались в переселенческой группе. А дальше остаётся усреднить частоты генов в материнских популяциях, взвесив их на полученные по фамилиям «коэффициенты миграции» в переселенческую группу.
Конечно же, польза от фамилий не исчерпывается помощью в планировании исследований для генетики или в изучении «переселенческих» генофондов. Главным результатом своей работы с фамилиями авторы хотели бы видеть широкое распространение этого типа маркёров и в теории, и в практике исследований разных генофондов.
Часть 3. РУССКИЙ ГЕНОФОНД В КРУГУ СОСЕДЕЙ: МНЕНИЯ РАЗНЫХ НАУК
Лицом к лицу
Лица не увидать,
Большое видится на расстоянии.
Сергей ЕсенинТретья часть книги о русском генофонде — особенная. В ней русский генофонд рассматривается не сам по себе — этому посвящена центральная, вторая часть книги. Третью же, заключительную часть мы посвятим тому огромному генофонду, малой частью которого является русский генофонд. Мы вглядимся в генофонд всей Евразии, займемся поиском глобальных закономерностей. При этом мы будем рассматривать именно Евразию, а отнюдь не русский генофонд, всячески избегая «русско-центризма».
На первый взгляд, такой глобальный подход не имеет отношения к русским популяциям. Но он совершенно необходим для понимания выявленной структуры русского генофонда — по трем причинам. Первая состоит в том, что без знания глобальных закономерностей генофонда человечества невозможно правильно понять ни одну из частностей, ни один из этнических генофондов. Вторая причина — необходимо понять, какое место русский генофонд занимает в системе евразийских генофондов. И третье — нельзя дать целостное описание русского генофонда, не увидев, как он взаимодействует с соседями.
Поэтому в восьмой главе мы и рассмотрим взаимодействие русского генофонда с соседними народами Восточной Европы. Для этого нам нужно будет выявить основные черты генофонда Восточной Европы. Ведь русский народ — лишь один из восточноевропейских народов, и русский генофонд, как матрёшка, вложен в генофонд большего масштаба — восточноевропейский. Поэтому мы должны внимательно вглядеться в его генетический ландшафт.
А в девятой главе мы поднимемся ещё на один уровень, перейдя к большей «матрёшке» — генофонду Северной Евразии и генофонду Евразии в целом. Это позволит взглянуть на русский генофонд не «лицом к лицу», а с большого расстояния, почти «из космоса». И такой взгляд даст нам не «европоцентристскую» и «русскоцентристскую» оценки, которые неизбежно страдают «местничеством», искажением общей картины. Глобальный подход позволит хотя бы примерно определить, какое же место в действительности занимает русский генофонд в системе генофондов Евразии, к каким регионам он тяготеет, каков размах его изменчивости не только в этническом или региональном масштабе, но и в масштабе континента. Надеемся, такой «взгляд из космоса» расширит кругозор нашей книги, избавит от рассматривания в лупу местных деталей, и придаст ей больший уровень объективности.
Тем более, что максимальной объективности и в этой части вновь мы стараемся достичь не только сменой масштаба, но и широким использованием «мультиокулярного» подхода, очной ставкой многих очевидцев структуры генофонда. Особенно это справедливо для анализа восточноевропейского генофонда — его мы изучим не по одному и не по двум, а по пяти различным типам признаков. И лишь сведя воедино свидетельства этих пяти очевидцев, получим объективный портрет восточноевропейского генофонда — и объективную характеристику того места, которое занимают в нём русские популяции.
Глава 8. ЕВРОПЕЙСКИЙ МАСШТАБ: ГЕНОФОНД ВОСТОЧНОЙ ЕВРОПЫ
История России есть история страны, которая колонизируется.
В. О. КлючевскийНевозможно понять происхождение и «устройство» генофонда, рассматривая его изолированно. Это особенно справедливо для русского генофонда, вобравшего в себя множество различных групп населения. Цитата, взятая эпиграфом этой главы, убеждает, что включение в состав государства новых подданных было лейтмотивом его истории, и как свидетельствует множество источников, многие из новых подданных Российского государства вливались и в состав русского народа. Нередко интересуются, каков генетический вклад победителей (например, генетические последствия татаро-монгольского нашествия на русские княжества[49]). Но никак не менее значим и вклад побеждённых (продолжая этот пример — генетические последствия для русского генофонда покорения Иваном Грозным татарских ханств). Ещё существеннее генетические результаты мирных процессов колонизации (например, славянской колонизации Восточно-Европейской равнины, которая стала называться Русской равниной). Несомненно, что знания о генофондах соседних народах необходимы для правильного понимания данных о русском генофонде. Поэтому в главе главе рассматривается геногеография Восточно-Европейского региона, срединную часть которого занимает «исконный» ареал русского народа.
Генетическое разнообразие населения Восточной Европы связано с его формированием на основе не только европеоидного, но и уралоидного пластов населения, а также менее значительным — по сравнению с Западной Европой — уровнем миграции и смешения этнических генофондов.
Для создания обширной панорамы в данной главе понятие «Восточная Европа» мы используем в широком смысле, что также увеличивает её разнообразие: в восточноевропейский регион мы включаем и Приуралье, и Северный Кавказ (в главах 4 и 5 эти регионы рассматривались отдельно как «Урал» и «Кавказ»).
Большое разнообразие Восточной Европы известно и по лингвистическим данным: её народы относятся к четырём языковым семьям (индоевропейской, уральской, северокавказской, алтайской), в то время, как Западную Европу населяют народы одной лишь индоевропейской семьи (за редкими исключениями, такими как баски и саамы).
В численном отношении большинство населения Восточной Европы говорит на славянских языках индоевропейской семьи. В России восточнославянские народы составляют около 86.2 %. Доля восточных славян превышает половину населения даже в ряде национальных республик Европейской части России (Карелии, Мордовии, Коми, Удмуртии). Восточные славяне представляют большинство населения Украины и Белоруссии [Брук, 1986]. Среди восточных славян наибольшей численностью и территорией расселения обладает русский народ, далеко опережая по этим параметрам остальные народы Восточной Европы. Славянская колонизация представляет собой важный этап формирования современного населения Восточной Европы, а демографические изменения последних веков в основном связаны с экспансией русского населения и его смешением с соседними этносами. Тем самым сравнение восточноевропейского генофонда («целого») и русского генофонда (его существенной «части») представляет особый интерес.
В этой главе мы рассмотрим строение восточноевропейского генофонда. Причём проведём его изучение по всем имеющимся данным (табл. 8.1.1.) — по пяти типам признаков антропологии (соматология и дерматоглифика) и генетики (классические маркёры, аутосомные ДНК маркёры и митохондриальной ДНК). Фамилии, которые хорошо сработали при изучении русского генофонда, здесь мы уже не можем использовать, поскольку вышли на надэтнический уровень, а фамилии годятся только для анализа в пределах этноса. Для изучения генофонда Восточной Европы вновь воспользуемся теми же тремя технологиями геногеографии: статистическим анализом межпопуляционной изменчивости (ему посвящён раздел 8.1. этой главы), картографическим анализом главных компонент (раздел 8.2.) и картографическим анализом генетических расстояний (раздел 8.3.).
Итак, анализ восточноевропейского генофонда мы проведём так же, как в предыдущих главах проводили анализ русского генофонда — теми же методами и по пяти типам признаков (только место фамилий займут аутосомные ДНК маркёры).
Такое параллельное рассмотрение позволит яснее увидеть оба генофонда — восточноевропейский и русский — и их соотношение друг с другом.
Анализ восточноевропейского генофонда начнём с выявления размаха его изменчивости. Мы оценим обе составляющие разнообразия генофонда: и генетические различия между всеми популяциями Восточной Европы (GST), и различия индивидов внутри этих популяций (гетерозиготность HS). Такие оценки можно получить только по данным генетики. Надёжность и устойчивость этих оценок мы выясним, сопоставив показания двух равноправных свидетелей. Для этого мы получим оценки разнообразия и по ДНК, и по классическим маркёрам, а потом сравним, насколько они совпадут. Наконец, чтобы понять, велико ли это разнообразие, надо сопоставить размах различий между популяциями Восточной Европы (G) с аналогичными оценками для соседних регионов, круг этих вопросов и обсуждается в данном разделе.
Таблица 8.1.1.
Признаки антропологии, классические и ДНК маркёры, использованные при анализе народов Восточной Европы
8.1. РАЗНООБРАЗИЕ ВОСТОЧНОЕВРОПЕЙСКОГО ГЕНОФОНДА
§ 1. Оценки по классическим и по ДНК маркёрам: Надежная панель генов — Идентичная панель популяций — Две стороны медали — HS внутри популяций, a GST между ними — География HS по классическим и по ДНК маркёрам похожа — Хотя сами HS отличаются в два раза! — По ДНК маркёрам и генам, кодирующим белки, GST между популяциями одинаковы! — И не зависят от различий внутри популяций
§ 2. Сравнение с регионами Евразии: Велика ли дифференциация Восточной Европы? — «Супер» регионы и просто регионы Евразии — С запада на восток Евразии дифференциация популяций нарастает — Между Западной Европой и Сибирью — Русский генофонд вбирает большую часть изменчивости Восточной Европы — Генетика послушна географии
Восточноевропейские народы хорошо изучены в отношении полиморфизма целого ряда белковых и ДНК маркёров [Генофонд и геногеография 2000; Лимборская и др., 2002]. Но мы уже не раз говорили о том, что по отдельному гену сложно судить о закономерностях генофонда в целом. Картины изменчивости отдельных маркёров могут резко различаться по каким-либо случайным причинам, из-за различий в их функции, из-за различий в эволюционной траектории маркёров разных типов. Словом, разные факторы микроэволюции могут быть в разной степени отражены в пространственной изменчивости разных генов. Поэтому надо от анализа отдельных генов перейти к анализу их совокупности.
Чтобы в изменчивости генов обнаружить общую архитектонику генофонда, следует изучить большую панель генов. Она должна, во-первых, включить значительное число маркёров, изученных во многих популяциях; а, во-вторых, эти маркёры должны различаться в биохимическом и физиологическом отношении (детально все эти вопросы рассмотрены в Приложении). Когда такие данные — о многих разнообразных генах во многих популяциях — собраны, они анализируются методами многомерной статистики, вычленяя общие для всех генов закономерности наиболее эффективным, объективным и математически корректным способом.
Итак, преимущество обобщённого анализа (одновременно, совместно по всем генам) состоит в выявлении наиболее общих, объективных закономерностей генофонда. Значимость анализа отдельных генов заключается в ином — в создании объёмной картины конкретных результатов: большого количества показателей, величин, частных закономерностей. В предыдущей части книги эти два вида анализа дополняли друг друга, позволяя видеть и «лес», и «деревья». Но для цели сравнения русского генофонда и восточноевропейского нам достаточно сравнить их «обобщённые» портреты. Поэтому мы ограничимся анализом общего уровня разнообразия, в среднем по всем генам, и лишь для ДНК маркёров вскользь затронем «индивидуальные» уровни разнообразия каждого из локусов.
§ 1. Оценки по классическим и по ДНК маркёрам
В этом параграфе мы рассмотрим две стороны одной медали: различия индивидов внутри популяции (гетерозиготность) и различия между популяциями Восточной Европы. И оценим эти различия как по классическим, так и по ДНК маркёрам. Едва ли не самым важным для нас будет сравнение показаний этих двух «очевидцев»: оно позволит отделить устойчивые закономерности от эфемерных. Чтобы провести это сравнение корректно и получить достоверные оценки изменчивости генофонда, нам придётся часто совершать краткие экскурсы в методические вопросы — особенно расчёта межпопуляционной изменчивости. До конца этого раздела мы постараемся бегло показать читателю некоторые важнейшие уголки статистической кухни геногеографа. Тем же, кто интересуется больше результатами, чем методами, мы рекомендуем пропустить пояснения, данные мелким шрифтом.
ЧТО ТАКОЕ ДИФФЕРЕНЦИАЦИЯ GST?
Величина генетических различий между популяциями (то есть дифференциация генофонда, уровень межпопуляционных различий по частотам генов) обычно оценивается через величину GST Эта степень дифференциации зависит от соотношения двух факторов микроэволюции — дрейфа генов и миграций: дрейф генов увеличивает различия популяций друг от друга, а миграции, очевидно, сближают генофонды популяций региона (см. Приложение). Поэтому уровень GST свидетельствует о балансе миграций и дрейфа генов, об интенсивности миграционных и стохастических процессов в генофонде. Малые величины GST (популяции региона генетически похожи друг на друга) обычно говорят о мощном давлении миграций и слабом дрейфе генов, а большие величины G (популяции региона резко различаются) свидетельствуют о преобладании дрейфа генов над последствиями незначительного генного потока между популяциями.
Средняя по всем изученным генам величина GST оценивает селективно-нейтральную изменчивость, избавляясь от последствий отбора, смещающих оценки GST(i) по отдельным i-тым генам (см. Приложение). Поэтому именно средняя по всем генам GST-статистика (наряду с аналогичной РST-статистикой) служит для измерения генетических различий между популяциями [Nei, 1975; Алтухов и др., 1997, Bosch et al., 2000].
Второй показатель — уровень внутрипопуляционного разнообразия (HS) — оценивает среднюю ожидаемую гетерозиготность популяций [Nei, 1975; Алтухов, 1989].
РЕПРЕЗЕНТАТИВНЫЙ НАБОР ГЕНОВ
Сравнение изменчивости ДНК и классических маркёров — важнейшая задача! Постараемся решить её вдумчиво и строго.
Первое требование — анализ репрезентативной панели генов, которая покажет нам истинное лицо генофонда. Оно в нашем случае выполняется, поскольку в панелях представлены самые разные типы классических и ДНК маркёров.
Почему мы так считаем? Дело в том, что теоретически величина различий между популяциями не должна зависеть от панели генов, по которой анализируется генофонд. Но для этого панель генов должна быть репрезентативной — отражать свойства основной части генома, а не его своеобразных частей. Поэтому здесь мы не будем касаться однородительских маркёров — у них свой путь микроэволюции, зависящий и от много более мощного дрейфа генов, и от различий между паттерном «мужских» или «женских» миграций. А включим в анализ только аутосомные маркёры.
Панель ДНК маркёров сформирована так, что включает три разных класса маркёров — инсерционно-делеционного, минисателлитного и микросателлитного полиморфизма. Это позволяет надеяться, что мы сможем избежать смещений оценок изменчивости, связанных с особенностями микроэволюции тех или иных классов маркёров (см. Приложение). Анализ ДНК маркёров проведён по 114 аллелям шести наиболее подробно изученных аутосомных локусов (табл. 8.1.1).
Рис. 8.1.1. Карта гетерозиготности народов Восточной Европы по данным о ДНК маркёрах.
По классическим маркёрам число аллелей примерно такое же — 100 аллелей. А число локусов классических маркёров велико — тридцать три — и среди них также есть представители трёх классов: биохимические, иммунологические и физиологические маркёры.
Поэтому мы можем надеяться, что обе панели маркёров — классических и ДНК — репрезентативны.
ИДЕНТИЧНЫЙ НАБОР ПОПУЛЯЦИИ
Второе требование — анализ одних и тех же популяций. Его мы также выполнили, сведя массив данных о классических маркёрах к тем же народам, которые изучены по ДНК.
Если, например, по ДНК маркёрам будут изучены саамы и ненцы Восточной Европы, а по классическим маркёрам — народы Дагестана, то ясно, что ни о каких сравнениях не может быть и речи. Хотя и те, и другие народы относятся к населению Восточной Европы, но они не могут дать представление обо всём генофонде региона. Если мы хотим сравнить изменчивость по ДНК и по классическим маркёрам, это сравнение надо провести строго по одному и тому же кругу популяций.
По ДНК маркёрам изучен меньший набор популяций, поэтому будем ориентироваться на него.
Каждый ДНК маркёр немного отличается от другого по набору популяций, но в среднем изучены 28 популяций 15 народов Восточной Европы: белорусы, молдаване, русские, украинцы, коми, мари, мордва, удмурты, адыги, аварцы, башкиры, ногайцы, татары, чуваши, калмыки. Эти народы охватывают популяции от Белого моря до Чёрного и относятся к четырём лингвистическим семьям (индоевропейской, уральской, алтайской, северокавказской). Так что можно надеяться, что они дадут представление о генофонде Восточной Европы в целом.
По классическим маркёрам изучен, конечно же, намного более широкий круг народов Восточной Европы. Но чтобы максимально корректно сравнить их с ДНК маркёрами, при расчётах статистических показателей (HS и GST) сузим этот круг до тех же 15 народов, что и по ДНК полиморфизму (данные по прочим народам мы не будем учитывать в анализе).
Но, исключив некоторые народы, не занизим ли мы при этом уровень изменчивости? Мы проверили показатели до и после сокращения выборки народов — они оказались очень близки. Это означает, что вряд ли мы исказили общие закономерности в изменчивости генофонда Восточной Европы, ограничив рассмотрение именно этими 15 народами[50].
ГЕТЕРОЗИГОТНОСТЬ (HS)
Убедившись в ожидаемой репрезентативности наборов маркёров и в полной сопоставимости наборов популяций, рассмотрим гетерозиготность и межпопу-ляционную изменчивость, рассчитанную по этим данным. Начнём с гетерозиготности.
КАРТЫ HS. Генетический ландшафт гетерозиготности ДНК маркёров в ареале Восточной Европы показан на рис. 8.1.1. Он варьирует незначительно (0.66<HS<0.72), но закономерно. Карта демонстрирует некоторое снижение гетерозиготности к востоку (у башкир) и к югу (у адыгов), тогда как более высокие значения гетерозиготности обнаруживаются в Поволжье, а также (HS>0.69) у части русских популяций, украинцев, белорусов. Видна закономерность снижения гетерозиготности к востоку и к северу от Поволжья.
Такая картина — максимум гетерозиготности у восточных славян, снижение гетерозиготности при движении на восток к Уралу и дальнейшее снижение в Сибири — хорошо известна, она показана при анализе гетерозиготности классических маркёров в Северной Евразии [Балановская, Рычков, 1997].
Построенный нами новый вариант карты гетерозиготности классических маркёров в Восточной Европе приведен на рис. 8.1.2. Можно видеть, что уровень гетерозиготности максимален на Украине, и снижается к северу и востоку. Постепенность тренда лишь отчасти нарушается в Заволжье (в районе Ветлуги и Вычегды), где гетерозиготность ниже, чем должно бы быть при идеально ровном тренде. Второе локальное нарушение заметно на Западном Кавказе. Но общий тренд гетерозиготности классических маркёров удивительно закономерен и плавен — снижение от юго-западного угла карты к северо-востоку.
Рис. 8.1.2. Карта гетерозиготности народов Европы по данным о классических маркёрах.
Карты гетерозиготности ДНК и классических маркёров не слишком похожи, хотя обе показывают снижение гетерозиготности к востоку и к северу. Глядя на плавный тренд «классической» гетерозиготности, основанный на тридцати трёх локусах, и путаные извивы карты ДНК полиморфизма (всего по шести локусам), можно предположить, что именно недостаток ДНК данных приводит к различиям между картами. Это будет легко проверить, когда накопятся новые данные по аутосомному ДНК полиморфизму.
Таблица 8.1.2.
Гетерозиготность HS и межпопуляционная изменчивость GST народов Восточной Европы по каждому из аутосомных ДНК маркёров
Примечания: межпопуляционная изменчивость приведена как значения GSTx102
Попутно отметим, что в отличие от гетерозиготности, оценки межпопуляционной изменчивости GST отдельных ДНК маркёров никак не связаны с типом полиморфизма. Так, и локус с наибольшей величиной GST, и локус с наименьшей GST относятся к ми-кросателлитным.
СРЕДНИЕ ВЕЛИЧИНЫ HS. Но что удивительно — при общем сходстве в географии, сам уровень гетерозиготности по ДНК и по классическим маркёрам различается в два раза! По ДНК маркёрам он очень велик: HS=0.69. По классическим маркёрам оценки в два раза ниже: HS=0.34 — если считать по всем изученным народам Восточной Европы; и HS=0.37 — по тем 15 народам, которые изучены по ДНК.
Конечно же, высокая гетерозиготность ДНК маркёров вызвана мультиаллельностью большинства использованных локусов (микро- и минисателлитных): из таблицы 8.1.1. видно, что классические маркёры в среднем изучены по 3 аллелям локуса, а ДНК маркёры — каждый локус в среднем по 19 аллелям. Таблица 8.1.2. показывает связь гетерозиготности с типом маркёра и с числом аллелей — у мультиаллельных локусов (микро- и минисателлитных) гетерозиготность намного выше, чем у диаллельных (их гетерозиготность не может превышать HS=0.5).
Итак, при сравнении классических и ДНК маркёров нами обнаружена независимость географии (паттерна) гетерозиготности от её величины, от размаха разнообразия: величина гетерозиготности ДНК и классических маркёров различается в два раза, а изменчивость этой величины в пространстве следует сходным закономерностям.
В современной геногеографии это уже не удивляет исследователя. Столь же большое сходство было выявлено нами между картами изменчивости генофонда мари по генетическим маркёрам и по генам наследственной патологии [Балановский и др., 1999; Наследственные болезни в популяциях человека, 2002], в то время как уровень изменчивости этих систем генов различался не в два раза, а на два порядка!
РАЗЛИЧИЯ МЕЖДУ ПОПУЛЯЦИЯМИ GST
Впрочем, гетерозиготность HS служит лишь вспомогательным параметром, оценивающим изменчивость индивидов внутри популяций. Главным же инструментом популяционно-генетического анализа выступают различия между популяциями (GST). GST отвечает на вопрос: насколько разные популяции Восточной Европы отличаются друг от друга?
Чтобы рассчитать GST максимально корректно, мы учли основные популяционные «матрёшки» (см. главу 5): популяция — этнос — языковая семья — регион.
Это означает, что мы учли иерархию популяций в регионе и избежали смещения оценок в сторону подробно изученных народов и целых лингвистических семей (см. Приложение). Ведь народов, говорящих на языках индоевропейской семьи, намного больше, чем остальных, и изучены они зачастую подробнее. Поэтому — без иерархического анализа, без учёта «матрёшек» мы сместили бы все значения средних частот и GST в «индоевропейскую» сторону. А это свело бы всю историю Европы к истории одних лишь индоевропейцев!
КАК ПРАВИЛЬНО РАССЧИТАТЬ GST
Хотя иерархический вариант расчёта GST является основным и наиболее строгим [Nei, 1975], из-за его сложности он применяется относительно редко. Поэтому приведём его краткое описание [Рычков, Ящук (Балановская), 1980]. Весь анализ проведён с использованием оригинального программного пакета «MEGERA 2.0» по следующему алгоритму.
ПЕРВАЯ «МАТРЁШКА»: ЭТНИЧЕСКИЙ УРОВЕНЬ — ПОПУЛЯЦИИ В ПРЕДЕЛАХ ЭТНОСА. Это самая маленькая «матрёшка». На этом первом этапе для каждого этноса оценивалась средняя по всем аллелям величина различий между всеми популяциями данного народа, т. е. гетерогенность каждого этноса: GST(popul-ethnic). После того как такие величины были получены для каждого народа, эти величины усреднялись, и таким образом рассчитывалась средняя гетерогенность этноса Восточной Европы. Это значение GST(popul-ethnic) присваивалось нижнему, этническому уровню иерархической популяционной структуры. С помощью этой величины GST(popul-ethnic) мы оцениваем средние различия между популяциями в «среднем» этносе.
ВТОРАЯ «МАТРЁШКА»: УРОВЕНЬ ЯЗЫКОВЫХ СЕМЕЙ — ЭТНОСЫ В ПРЕДЕЛАХ ЛИНВИСТИЧЕСКОЙ СЕМЬИ. На втором этапе вычислялись средние частоты аллелей, характерные для каждого народа (как невзвешенная средняя частот аллеля в популяциях данного народа). В результате мы получали «этнические» частоты аллелей — «среднерусские» для русских, «среднеукраинские» для украинцев, «среднемарийские» для мари, и так для каждого народа. На основании таких «этнических» частот оценивались различия между народами, принадлежащими к данной лингвистической семье: GST(ethnic-lingvo). Например, по различиям между средними русскими, украинскими, белорусскими и молдавскими частотами оценивалась величина GST(lingvo) для восточноевропейских народов индоевропейской семьи. После того как такие величины были получены для каждой лингвистической семьи (индоевропейской, уральской, алтайской и северокавказской), усреднением этих четырех величин рассчитывалась средняя гетерогенность лингвистической семьи в Восточной Европе. Это среднее значение GST(ethnic-lingvo) присваивалось второму уровню иерархической популяционной структуры: уровню лингвистических семей. С помощью этой величины GST(ethnic-lingvo) мы оцениваем средние генетические различия между этносами в «средней» лингвистической семье. В случаях, когда данные для какого-либо народа по данному локусу отсутствовали, то изменчивость в пределах лингвистической семьи рассчитывалась по всем остальным народам, относящимся к данной лингвистической семье.
ТРЕТЬЯ «МАТРЁШКА»: РЕГИОНАЛЬНЫЙ УРОВЕНЬ — ЯЗЫКОВЫЕ СЕМЬИ В ПРЕДЕЛАХ РЕГИОНА. На третьем этапе вычислялись частоты аллелей для каждой лингвистической семьи (как невзвешенная средняя частот аллеля у народов данной лингвистической семьи). В результате мы получали «семейные» частоты аллелей — «индоевропейские» для индоевропейской лингвистической семьи, «уральские» для уральской языковой семьи, «алтайские» для алтайской семьи, «северокавказские» для северокавказской семьи. Например, усреднением «среднерусских», «среднеукраинских», «среднебелорусских» и «среднемолдаванских» частот (полученных на прошлом этапе расчёта) получена «среднеиндоевропейская» частота. На основании таких «семейных» частот рассчитывалась GST(lingvo-region) среди всех лингвистических семей. Это значение присваивалось высшему уровню иерархической популяционной структуры. С помощью GST(lingvo-region) величины мы оцениваем различия между лингвистическими семьями в восточноевропейском регионе.
ВСЕ ТРИ МАТРЁШКИ ВМЕСТЕ: ИЗМЕНЧИВОСТЬ ПОПУЛЯЦИЙ В ПРЕДЕЛАХ РЕГИОНА. Эта «матрёшка» вмещает в себя все предыдущие. На заключительном этапе три величины GST — низшего уровня GST(popul-ethnic), среднего уровня GST(ethmc-lingvo). высшего уровня GST(lingvo-region) — суммировались благодаря аддитивным свойствам GST. Полученное значение GST(popul-region) и является искомой величиной GST, рассчитанной иерархическим методом. G помощью величины GST(popul-region) мы максимально корректно оцениваем средние различия популяций в восточноевропейском регионе. Например, благодаря иерархической процедуре множество изученных русских популяций не заслоняет малые этносы — все народы и лингвистические семьи представлены равноправно.
РАСЧЕТ ДЛЯ КЛАССИЧЕСКИХ МАРКЕРОВ. С помощью точно такой же иерархической процедуры была рассчитана величина GST по классическим маркёрам. Ещё раз напомним, что в расчёт включены не все изученные по классическим маркёрам популяции Восточной Европы, а только те 15 народов, которые были изучены по ДНК маркёрам. Таким образом, расчеты GST для ДНК и классических маркёров выполнены идентично и полностью сопоставимы.
Средняя межпопуляционная изменчивость ДНК маркёров составила GST=2.58. По классическим маркёрам мы получили величины GST=2.69. Эти две близкие величины выражают различия между всеми восточноевропейскими популяциями. То есть, несмотря на резкие отличия в уровне гетерозиготности, оценки различий между популяциями по ДНК и классическим маркёрам практически совпали (табл. 8.1.3. и рис. 8.1.3).
СОВПАДЕНИЕ GST ПО ДНК И КЛАССИЧЕСКИМ МАРКЕРАМ
Совпадение корректно полученных оценок GST позволяет утверждать, что средняя межпопуляционная изменчивость ДНК маркёров и генов, кодирующих белки, одинакова.
Такое совпадение было предсказано в работах Ю. Г. Рычкова и Е. В. Балановской [Рычков, Балановская, 19906] и нашло полное подтверждение в многочисленных последующих исследованиях (см. например [Bowcock, Cavalli-Sforza, 1991; Bowcock et al., 1991 и др.]). Однако подобное равенство оценок может быть выявлено лишь при использовании представительной выборки обоих типов маркёров [Рычков, Балановская, 19906; Балановская, Нурбаев, 1997]. Напомним, что ещё до начала анализа мы проанализировали наши наборы маркёров и выяснили, что они отвечают требованиям репрезентативности. Начиная с классических популяционногенетических работ, считается, что для получения устойчивой оценки различий между популяциями достаточно 50 аллелей 30 локусов. Наши же панели шире — 100 аллелей 33 локусов разных классических маркёров и 114 аллелей шести наиболее изученных в Восточной Европе ДНК маркёров, относящиеся к трём классам ДНК полиморфизма.
Совпадение оценок межпопуляционной изменчивости GST по ДНК и классическим маркёрам является чрезвычайно важным результатом.
В главе 6 говорилось, что имеющихся данных по аутосомному ДНК полиморфизму, к сожалению, не хватает для изучения структуры русского генофонда. Однако при работе в масштабе более крупного региона Восточной Европы, по которому имеется больше данных, их оказывается достаточно для корректного анализа. И лучшее доказательство этому — совпадение величины межпопуляционной изменчивости по ДНК данным с аналогичной величиной по классическим маркёрам.
Дело в том, что классические маркёры, изучавшиеся с середины XX века, исследованы весьма подробно и поэтому дают объективную оценку GST при оценке дифференциации генофонда Восточной Европы [Рычков, Балановская, 1990а, б; Балановская, Нурбаев, 1997; Генофонд и геногеография народонаселения, 2000]. Изученность ДНК маркёров много меньшая, отчего достоверность оценок GST по ДНК маркёрам требует специального обоснования.
Таблица 8.1.3.
Гетерозиготность (HS) и межпопудяционное разнообразие (GST) ДНК маркёров и классических маркёров в населении Восточной Европы
Полученное совпадение оценок GST как раз и пред ставляет весомое доказательство, что анализируемый объем информации по ДНК маркёрам достаточен для корректной оценки дифференциации генофонда Восточной Европы. Оно указывает, что совокупность использованных ДНК маркёров даёт вполне объективную информацию о наиболее общих параметрах структуры генофонда народов Восточной Европы.
И второй немаловажный вывод: классические маркёры дают надежный прогноз того, какую величину GST мы получим для аутосомных ДНК маркёров.
Этот вывод мы используем уже в следующем параграфе.
Выше говорилось, что сравнения межпопуляционной изменчивости ДНК и классических маркёров проводились во многих работах. В разделе 8.2. приведены результаты не только статистического, но и картографического сравнения, выполненного впервые, и вновь показавшего сходство изменчивости ДНК и классических маркёров.
Рис. 8.1.3. Сравнение ДНК и классических маркёров: внутрипопуляционная (HS) и межпопуляционная (GST) изменчивость
§ 2. Сравнение с регионами Евразии
Велики или малы генетические различия между популяциями Восточной Европы? Полученная величина GST, равная 2.6 или 2.7 — много это или мало? Чтобы ответить на этот вопрос, сравним её с другими регионами.
«СУПЕР» РЕГИОНЫ И ПРОСТО РЕГИОНЫ ЕВРАЗИИ
В таблице 8.1.4. приведены рассчитанные нами оценки межпопуляционной изменчивости GST в крупных регионах мира и субрегионах Северной Евразии (см. главу 5 и Приложение). На этом фоне удобно оценить относительный масштаб разнообразия Восточной Европы.
Эти оценки межпопуляционной изменчивости регионов рассчитаны по классическим маркёрам. Благодаря совпадению оценок GST (§ 1) их можно использовать как прогноз для ДНК маркёров.
Сначала рассмотрим самые большие «матрёшки». В таблице 8.1.4. приведены различия между народами для четырех таких «супер» регионов Евразии, масштаб которых можно оценить как субконтинентальный. Мы видим, что межэтнические оценки GST варьируют от 2.4 («супер» регион Европы и Юго-Западной Азии) до 6.8 («супер» регион Северной Евразии).
Таблица 8.1.4.
Межпопуляционная изменчивость GST в ряде генофондов Евразии
Но сейчас для нас важнее уровень пониже — «простых» регионов. Ведь эти на ранг меньшие «матрёшки» уже сопоставимы по размеру с Восточной Европой. Здесь мы учли и изменчивость популяций внутри народов (к различиям этносов внутри регионов добавились различия между популяциями внутри этносов).
Сравнивая регионы Евразии, мы видим любопытную закономерность: наименьшая изменчивость характерна для населения Западной Европы (1.7), далее следуют близкие по значениям генофонды Восточной Европы, Кавказа, Средней Азии и Урала (2.2<GST<3.5); и, наибольшая изменчивость характерна для коренных народов Сибири (8.0). То есть по мере движения с крайнего запада Евразии к её крайнему востоку межпопуляционные различия нарастают.
Из этого может следовать, что промежуточное положение Восточной Европы в величине изменчивости просто соответствует её промежуточному географическому положению — между Западной Европой и Сибирью.
Известно, что население Европы (обычно подразумевается Западная Европа, генетически более изученная) в генетическом отношении однородно. Это положение, известное по классическим маркёрам, получило яркие подтверждения при анализе разнообразия митохондриальной ДНК. Напротив, коренное население большинства крупных регионов Азии — Южной, Восточной и особенно Северной Азии (Сибирь и Дальний Восток), характеризуются большим генетическим разнообразием популяций.
ИТОГИ
Для этой книги важны четыре момента, характеризующие разнообразие генофонда Восточной Европы.
Во-первых, мы получили корректно сопоставимые оценки межпопуляционной изменчивости для Восточной Европы по двум типам маркёров: по классическим GST=2.7, по ДНК GST=2.6.
Во-вторых, большое теоретическое значение имеет совпадение межпопуляционной изменчивости GST по ДНК и по классическим маркёрам, несмотря на их резкие различия по гетерозиготности HS. Это подтверждает возможность прогноза изменчивости ДНК маркёров по классическим маркёрам (см. Приложение).
В-третьих, мы теперь знаем о промежуточном положении уровня межпопуляционной изменчивости GST Восточной Европы между уровнем Западной Европы и уровнем Сибири. Если разные популяции западной Европы генетически похожи друг на друга, то популяции Восточной Европы в полтора раза разнообразнее, а в Сибири разные популяции ещё в три раза больше отличаются друг от друга.
В-четвёртых, сравнивая разнообразие восточноевропейского генофонда (GST=2.7) и русского генофонда (GST=2.0, см. раздел 5.3.) мы видим, что русский генофонд вбирает в себя значительную часть общего разнообразия всей Восточной Европы. Другие восточноевропейские народы вбирают несколько меньшую часть общего разнообразия (в среднем GST=1.2). Можно отметить, что заметная величина разнообразия русских популяций, лишь немногим уступающая разнообразию всех популяций Восточной Европы, хорошо согласуется с величиной «исконного» русского ареала, занимающего большую часть Восточной Европы.
8.2. «ГЛАВНЫЕ СЦЕНАРИИ»
§ 1. Классические маркёры: Зримый образ генофонда — Главный сценарий — Долготная изменчивость — Широкое поле встречи запада и востока — Европеоиды и уралоиды — Второй сценарий — Широтная изменчивость — Дыхание степей Евразии — Связь с климатом
§ 2. Аутосомные ДНК маркёры: Главный сценарий — Вновь долготная изменчивость — Узкая полоса встречи запада и востока — Второй сценарий — Вновь широтная изменчивость — Финно-угорский след на северном экстремуме — Третий сценарий — Вновь сложная седловидная структура — Впервые показано сходство карт трёх главных сценариев обоих типов аутосомных маркёров — Важный теоретический вывод — Глубокое сходство картин мира по ДНК и по классическим маркёрам
§ 3. Антропология — соматология и дерматоглифика: Большой и единый набор популяций — Признаки видимые и осязаемые — Соматология — Вновь долготная изменчивость на первом сценарии — Вновь седловидный рельеф на второстепенном сценарии — Дерматоглифика — Снова долготная изменчивость на первом сценарии — Второй сценарий необычен — Балтийский след
§ 4. Митохондриальная ДНК: Тренды отдельных гаплогрупп — «Азиатские» гаплогруппы часты в Восточной Азии, убывают на запад к Уралу и почти не достигают восточных славян — Разнообразие гаплотипов снижается к северу — Первый сценарий — Опять долготная изменчивость — Славяне в кольце финно-угров — Кто в Европе самый разный?
В предыдущем разделе мы провели статистический анализ генофонда народов Восточной Европы (с помощью GST и HS). Теперь можно перейти к изучению пространственной изменчивости того же генофонда с помощью обобщённых компьютерных карт.
Картографический анализ генофонда Восточной Европы проведём, опираясь на пять разных типов признаков. Вновь, как и в статистическом анализе, это будут классические и аутосомные ДНК маркёры, и ещё к ним добавятся данные соматологии, дерматоглифики и гаплогруппы митохондриальной ДНК. Такой «мультиокулярный» подход, использующий свидетельства пяти столь разных очевидцев, позволяет впервые создать наиболее полную, а потому максимально объективную, картину изменчивости восточноевропейского генофонда.
§ 1. Классические маркёры
Для картографического анализа классических маркёров взяты те же локусы и аллели, что и для статистического анализа (табл. 8.1.1).
Рис. 8.2.1. Карта первой главной компоненты изменчивости генофонда Восточной Европы (классические маркёры).
Но на этот раз мы не отбирали этносы, сопоставимые с изученностью ДНК маркёров, а проанализировали всю имеющуюся информацию по классическим маркёрам (.Приложение, разделы 5 и б). Карты главных компонент изменчивости построены по наиболее изученным классическим маркёрам: 100 аллелей 33 локусов. Первая компонента описывает 19.7 % общей дисперсии всех генов, вторая вбирает в себя 10.1 %, третья — 7.6 % общей дисперсии. Мы видим резкое падение дисперсии, указывающее на высокую эффективность метода главных компонент. Первая компонента выявляет пятую часть всей информации, содержащейся в исходном массиве данных — при неэффективности метода она составила бы лишь полтора процента[51]. Поэтому карта первой главной компо-ненты отражает основную закономерность в изменчивости классических маркёров в ареале Восточной Европы главный сценарий.
ПЕРВЫЙ СЦЕНАРИЙ
Первая компонента генофонда изменчивости классических маркёров (рис. 8.2.1) характеризуется той плавностью и простотой, которая позволяет картографическому образу становиться зримым образом генофонда. Значения компоненты постепенно изменяются от юго-запада к востоку. Основное направление изменчивости — долготное: изолинии вторят меридианам, и корреляция с долготой составляет r=0.81.[52] Карта выявляет две зоны, западную и восточную, плавно перетекающие друг в друга.
Следуя интерпретации нашего предыдущего варианта этой карты, построенной по меньшему объему данных [Рычков, Балановская, 2005], можно думать, что здесь отражено взаимодействие двух пластов расового состава. Основанием служит совпадение западной зоны с ареалом европеоидных народов Восточной Европы, а восточной зоны — с ареалами народов с той или иной степенью монголоидной примеси [Рогинский, Левин, 1978]. Кроме того, долготное направление изменчивости также соответствует основному направлению смешений европеоидных и монголоидных пластов населения [Алексеева, 1999]. Но монголоидная составляющая в населении Восточной Европы представлена не классическими монголоидами [Хрисанфова, Перевозчиков, 1999], а народами уральской расы. Уральская же раса представляет собой своеобразное сочетание европеоидных и монголоидных особенностей, которое нельзя свести к механическому смешению двух больших — европеоидной и монголоидной — рас [Бунак, 1980; Рогинский Левин, 1978; Хрисанфова, Перевозчиков, 1999; Моисеев, 1999; Перевозчиков, 2005]. Учитывая это, следует трактовать карту первой главной компоненты как выявляющую уральскую, а не непосредственно монголоидную расовую составляющую. Корректнее здесь использовать классификацию В. В. Бунака на западный и восточный расовые стволы [Бунак, 1980].
Впрочем, эти интерпретации достаточно близки, поскольку все они утверждают взаимодействие европеоидного и «не европеоидного» пластов в составе восточноевропейского генофонда.
Большая часть Восточной Европы занята промежуточными значениями главной компоненты. Такой плавный переход значений естествен для восточноевропейского региона, на территории которого смешение европеоидных и монголоидных (возможно, точнее говорить «уралоидных») народов происходило со времени формирования этих рас [Бунак, 1980; Алексеев, 1974].
ВТОРОЙ СЦЕНАРИЙ
Вторая и третья главные компоненты всегда описывают меньшую часть информации, содержащейся в исходном массиве данных, и потому менее важны для изучения генофонда, чем первая компонента. Однако они необходимы для полноты картины: если первая компонента отражает основную закономерность генофонда, то вторая и третья компоненты — следующие по значимости, но тоже объективно существующие закономерности.
На рис. 8.2.2. представлена карта второй главной компоненты по классическим маркёрам. Она выявляет изменчивость, близкую к клинальной: значения компоненты плавно меняются от юго-востока к северным и западным популяциям.
Таким образом, вторая компонента классических маркёров (рис. 8.2.2) определяется юго-восточным, прикаспийским экстремумом, занимающим предгорья и степи между Кавказом и Южным Уралом.
Рис. 8.2.2. Карта второй главной комноненты изменчивости генофонда Восточной Европы (классические маркёры).
Вся остальная (много большая) территория Восточной Европы противопоставляется этому юго-восточному полюсу.
Такая изменчивость может отражать влияние генофонда степных народов (преимущественно алтайской языковой семьи).
Многие миграции из внутренних районов Азии на территорию Восточной Европы шли по степной полосе и связаны именно с юго-востоком Европы (от Южного Урала до Северного Причерноморья).
Представляется вполне вероятным, что эти миграции различных степных народов, направлявшихся примерно по одному маршруту — по степной зоне Евразии — в течение многих столетий (от гуннов в IV веке до калмыков в XVII) оказали значительное влияние на восточноевропейский генофонд.
Можно предположить, что именно влияние степных народов (главным образом алтайской семьи) и сформировало тренд изменчивости генофонда с юга и юго-востока, который выявляет вторая главная компонента.
Вместе с тем, возможна и иная трактовка карты второй главной компоненты: поскольку выявляемая тенденция достаточно близка к широтной изменчивости (коэффициент корреляции с широтой r=0.72), нельзя исключать возможность её связи с климатическими параметрами.
Широтная изменчивость второй главной компоненты в значительной мере сходна с картиной широтной зональности в Восточной Европе, и в таком случае вторая главная компонента, возможно, отражает адаптацию генофонда к различным условиям среды. В настоящее время нет достаточных оснований, чтобы сделать выбор между двумя интерпретациями второй главной компоненты: экологической (связь с климатом) и исторической (влияние генофонда степных народов). Да и вряд ли возможно разделить историю и широтную зональность природы — ведь с экологическими зонами были связаны потоки исторических миграций, почему мы и говорим о взаимодействии населения «леса» и «степи».
ТРЕТИЙ СЦЕНАРИЙ
Карта третьей главной компоненты демонстрирует довольно сложную картину с четырьмя ядрами экстремумов. Её сходство с третьим сценарием аутосомных ДНК маркёров столь велико, что мы перенесём её описание в следующий параграф.
§ 2. Аутосомные ДНК маркёры
Анализ главных компонент изменчивости ДНК маркёров в ареале Восточной Европы проведён для тех же шести локусов, что и статистический анализ (табл. 8.1.1). Были построены 114 карт распространения каждого из 114 аллелей этих ДНК локусов. Однако, большая часть аллелей микро- и минисателлитов в Восточной Европе очень редка — лишь для 51 аллеля средняя частота превысила планку 1 %. Поэтому обобщённые карты построены максимально строго — на основе только тех 51 карт аллелей, которые удовлетворяют 1 % критерию полиморфизма.
ПЕРВЫЙ СЦЕНАРИЙ
На карте первой главной компоненты (21 % общей дисперсии, рис. 8.2.3.) изменение значений географически чётко очерчено как долготное: изолинии в целом следуют меридианам, и основное направление изменчивости «запад<=>восток». Корреляция с долготой составляет r=0.79. Карта делит генофонд на две зоны: западную и восточную.
Эта карта чрезвычайно сходна с картой первой главной компоненты классических маркёров (рис. 8.2.1). Не только основные направления изменчивости, но размещение экстремумов компонент обоих типов признаков практически совпадает. Коэффициент корреляции между главными сценариями аутосомных маркёров — ДНК и классических — достигает r=0.81, подтверждая их удивительное сходство.
Итак, первая компонента по ДНК данным выявляет ту же закономерность, что и по классическим маркёрам, поэтому естественно сохранить и ту же интерпретацию: паттерн ДНК полиморфизма в Восточной Европе сформировался главным образом в результате европеоидно-монголоидных взаимодействий.
Основная черта обеих карт — выявление долготной изменчивости в восточноевропейском генофонде, подразделение его на западную и восточную зоны с постепенным переходом между ними.
Различия карт касаются только особенностей этого перехода: если по ДНК данным значения компоненты изменяются довольно быстро, то по данным о классических маркёрах зона перехода занимает значительную территорию. Эти различия, думается, связаны с относительно небольшим числом популяций, изученных по ДНК маркёрам — в среднем 28 популяций, тогда как по классическим маркёрам — в среднем 103 популяции (табл.8.1.1). Можно ожидать, что при увеличении числа популяций, изученных по ДНК маркёрам, зона перехода станет такой же плавной и широкой, как и по классическим маркёрам.
Рис. 8.2.3. Карта первой главной компоненты изменчивости генофонда Восточной Европы (ДНК маркёры).
ВТОРОЙ СЦЕНАРИЙ
Вторая главная компонента ДНК полиморфизма (рис. 8.2.4) описывает 14.2 % общей дисперсии и демонстрирует основное направление изменчивости «север<=>юг». Карта выявляет подразделение восточноевропейского генофонда на северную и южную зоны с плавным переходом между ними. Корреляция этой карты с географической широтой составляет r=0.70.
Возможно, неслучайно это геногеографическое разделение соответствует физико-географическому разделению Восточной Европы на лесную и степную полосы. При этом в лесной зоне экстремум значений компоненты расположен на северо-востоке, в зоне расселения финно-угорских народов и северных русских популяций. Поскольку предполагается, что в формировании этих северных групп русских существенную роль сыграли финно-угорские племена (меря, чудь) [Алексеева, 1965, 1999], то можно предположить, что этот экстремум значений второй главной компоненты связан с зоной древнего расселения финно-угорских народов.
Сравнивая эту карту второй компоненты по ДНК маркёрам с картой второй компоненты по классическим маркёрам (рис. 8.2.2), легко заметить их совпадение в основном направлении изменчивости. Коэффициент корреляции между вторыми сценариями аутосомных маркёров — ДНК и классических — достигает r=0.65, подтверждая их хорошее сходство.
ТРЕТИЙ СЦЕНАРИЙ
Карта третьей главной компоненты по ДНК маркёрам демонстрирует сложное распределение: четыре четких ядра (экстремумы значений третьей компоненты) легли по периферии, а в центре региона (в Волго-Окском междуречье, верхнем течении Дона и Днепра) взаимодействие этих ядер даёт промежуточные значения. Каждый из двух экстремумов компоненты занимает две разобщённые зоны, что и приводит к выявлению на карте четырех ядер.
Таким образом, третьи сценарии и ДНК, и классических маркёров отражают сложность внутренней структуры восточноевропейского генофонда, что немаловажно после простых закономерностей первой и второй главных компонент. Итак, не только первые компоненты (коэффициент корреляции между ними r=0.81) и вторые компоненты (r=0.65) по ДНК и по классическим маркёрам, но и третьи компоненты оказываются сходными, выявляя одни и те же закономерности в генофонде: коэффициент корреляции между третьими компонентами составил r=0.73.
Такая последовательность может вызывать только восхищение и уважение: оба типа маркёров генетики — вопреки всем капризам совершенно разной и неравномерной изученности — вторят друг другу даже во второстепенных и третьестепенных изгибах генетического ландшафта! Это важный аргумент в пользу необычайного сходства изменчивости ДНК и классических маркёров.
СХОДСТВО СЦЕНАРИЕВ КЛАССИЧЕСКИХ И ДНК МАРКЕРОВ
Подводя итог геногеографическому сравнению ДНК и классических маркёров, подчеркнём, что их сходство выявилось как статистическим анализом (совпадение уровней межпопуляционной изменчивости, раздел 8.1), так и картографическим анализом (высокие корреляции между картами главных компонент).
Статистические сравнения этих двух типов маркёров проводятся во многих работах. А вот совпадение закономерностей в географической изменчивости ДНК и классических маркёров выявлено впервые. И обнаружено оно для всех трёх наиболее значимых главных компонент. Этот результат имеет и теоретическое значение. Он является новым важным подтверждением сходства межпопуляционной изменчивости ДНК и классических маркёров (см. Приложение).
Сходство картин мира по ДНК и по классическим маркёрам удивительно!
Причём совпадение карт главных сценариев служит более значимым аргументом, чем простой статистический расчёт Ведь карты — намного более чуткий инструмент: они трехмерны (в отличие от одномерности статанализа), отражают более тонкие элементы структуры генофонда и пронизывают его на большую глубину.
Рис. 8.2.4. Карта второй главной компоненты изменчивости генофонда Восточной Европы (ДНК маркёры).
Одинаковость закономерностей по ДНК и по классическим маркёрам свидетельствует об объективности этих тенденций изменчивости восточноевропейского генофонда. Это также свидетельствует о целесообразности параллельного использования как ДНК данных, так и данных по классическим маркёрам.
§ 3. Антропология: соматология и дерматоглифика
ПОЧЕМУ АНТРОПОЛОГИЯ
Рассмотрев свидетельства двух очевидцев от генетики, мы можем перейти к свидетельствам антропологии. Её также представляют два очевидца — соматология и дерматоглифика (табл. 8.1.1).
Какие же черты антропологии важны для геногеографа?
1) БОЛЬШОЙ НАБОР ПОПУЛЯЦИЙ. Антропологические признаки изучены по очень большому набору популяций. Если по ДНК маркёрам в Восточной Европе изучено в среднем около 30 популяций, по иммуно-биохимическим — примерно 100 популяций, то по данным соматологии — 253 популяции. По дерматоглифике изучено хотя и несколько меньше (72 популяции), но всё равно в два раза больше, чем по ДНК маркёрам.
2) ЕДИНЫЙ НАБОР ПРИЗНАКОВ. В отличие от генетики, все популяции изучены по одному и тому же набору антропологических признаков. А это очень важно! Это значительно повышает надёжность результирующих обобщённых карт. К тому же значения обобщённых признаков (главных компонент для дерматоглифики и их аналогов — канонических переменных для соматологии) рассчитывались по исходным, а не по интерполированным значениям: сначала стандартными статистическими методами были рассчитаны значения главных компонент, которые уже затем картографировались. Это исключает вопрос о ложных корреляциях (см. Приложение), который ставил под сомнение объективность расчёта главных компонент по картам, т. е. по интерполированным значениям [Sokal et al., 1999a,b; Rendine et al., 1999]. Забегая вперед, укажем, что сходство главных сценариев изменчивости генетики и антропологии вновь отвергает опасность ложных корреляций.
3) ЗРИМЫЙ ОБРАЗ ПОПУЛЯЦИЙ. За антропологическими признаками стоят не гены-невидимки, а зримый физический облик населения, детально разработанная антропологическая (расовая) классификация, наконец, все сообщения древних авторов и современные мнения о том, как выглядят представители тех или иных народов.
Антропология всегда привлекается в исследованиях генофонда человека для объяснения обнаруженных фактов и закономерностей. Историческая антропология и в особенности дерматоглифика опираются на признаки с высокой наследуемостью. Это позволяет использовать эти признаки и в генетических исследованиях популяций. Поэтому, выявив направления изменчивости антропологических признаков, мы расширим знания о восточноевропейском генофонде. Более того, мы сможем более объективно интерпретировать изменчивость собственно генетических маркёров в терминах европеоидно-монголоидных пластов.
АНАЛИЗ КАНОНИЧЕСКИХ ПЕРЕМЕННЫХ близок к методу главных компонент, оба они входят в одну группу статистических методов снижения размерности [Айвазян и др., 1989]. Основное различие между этими двумя методами состоит в том, что в каноническом анализе учитываются внутригрупповые корреляции признаков. Этот учёт внутригрупповых корреляций требуется только при использовании признаков соматологии, поскольку для дерматоглифики, как и для признаков генетики, внутригрупповые корреляции отсутствуют [Хить, 1983; Хить, Долинова, 1990]. Поэтому для анализа генетических и дерматоглифических признаков используют метод главных компонент [Cavalli-Sforza et al., 1994], тогда как для соматологических признаков обычно применяют канонические переменные [Дерябин, 2001], что и сделано в данной работе. Составление сводки по антропологическим признакам у народов Восточной Европы и канонический анализ проведены профессором кафедры антропологии МГУ В. Е. Дерябиным. Нами проведён картографический анализ этих результатов и прямое сопоставление закономерностей изменчивости антропологических и генетических маркёров. В отличие от других типов признаков, по данным соматологии сначала был проведён расчёт канонических переменных (аналогов главных компонент), а затем уже по этим данным создавались карты.
ПЕРВЫЙ СЦЕНАРИЙ СОМАТОЛОГИИ
На рис. 8.2.5. представлена география первой канонической переменной изменчивости признаков соматологии в коренном населении Восточной Европы. Карта первого сценария выявляет долготную изменчивость: один экстремум расположен на западе Русской равнины, другой — у народов Среднего и Южного Урала. Итак, по данным антропологии мы вновь видим тот же сценарий долготной изменчивости, что и по классическим, и по ДНК маркёрам.
Рис. 8.2.5. Карта первой канонической переменной изменчивости фенофонда Восточной Европы (соматология).
Для понимания смысла этой долготной изменчивости очень важно, что антропологические признаки, по данным о которых построена эта карта, лежат в основе расовой классификации. Поэтому теперь мы вполне уверенно и обоснованно можем интерпретировать долготную изменчивость в Восточной Европе в терминах взаимодействия европеоидной и монголоидной (уралоидной) рас.
Мы только что рассматривали аналогичные карты долготной изменчивости по генетическим маркёрам, где мы также предложили «европеоидно-монголоидную» трактовку. Но доказательств, что дело именно в расовом составе населения, а не в другом факторе, изменяющемся с запада на восток, у нас не было. В случае же с антропологией «расовая» интерпретация изменчивости антропологических признаков естественно вытекает из того, что сама расовая классификация основана на этих признаках. И поскольку тот же долготный тренд выявлен по генетическим маркёрам, их изменчивость также следует объяснять тем же фактором. Привлечение данных антропологии позволило подтвердить правильность главного вывода, сделанного из анализа генетических данных.
Коэффициент корреляции карт первой канонической переменной соматологии с картой первой главной компоненты по ДНК маркёрам высок (r=0.61), указывая на их сходство. Это сходство относится к совпадению долготного направления изменчивости. А размещение экстремумов, т. е. зон наибольшей «европеоидности» или «монголоидности», различно по антропологическим и генетическим данным. Но здесь уж лучше, видимо, положиться на антропологию — её карты достовернее, ибо они опираются на огромное число популяций, изученных каждая по всем признакам.
ВТОРОЙ СЦЕНАРИЙ СОМАТОЛОГИИ
Карта второй по значимости переменной (рис. 8.2.6.) выявляет четыре четких ядра с центральной областью их интенсивного взаимодействия. Подобную структуру мы уже встречали на карте третьей компоненты ДНК полиморфизма. Важным элементом рельефа таких карт является географическое положение «седловины» (промежуточных значений) — здесь эта центральная область расположилась на верхней Волге.
Рис. 8.2.6. Карта второй канонической переменной изменчивости фенофонда Восточной Европы (соматология).
ДЕРМАТОГЛИФИКА
Мы видели, во-первых, принципиальное сходство в изменчивости различных типов признаков и, во-вторых, второстепенные, но весьма интересные различия между ними. Привлечение дополнительных данных — по иным типам признаков — не изменяя картину принципиально, позволяет уточнять многие факты, и, возможно, обнаруживать новые. В качестве такого дополнительного типа признаков использованы данные дерматоглифики.
Дерматоглифические маркёры, в целом примыкая к другим антропологическим признакам, зачастую выявляют свои, особые закономерности в истории формирования народов [Хрисанфова, Перевозчиков, 1999]. Поэтому они широко используются во многих исследованиях популяций человека. Интерес генетиков к ним связан и с их высокой наследуемостью (её коэффициент варьирует от 0.6 до 0.8) — более высокой, чем для признаков соматологии [Хить, Долинова, 1990].
ПЕРВЫЙ СЦЕНАРИЙ ДЕРМАТОГЛИФИКИ
Однако первая компонента даже столь специфических признаков (рис. 8.2.7) демонстрирует ставшую уже привычной картину — долготный тренд, трактуемый как встреча европеоидного и монголоидного миров.
А вот карта второй компоненты дерматоглифических признаков своеобразна (рис. 8.2.8.). Рельеф этой карты выявляет различия между северо-западной областью — и всей остальной территорией Восточной Европы. Выявленное ядро, окружая Ладожское и Онежское озера, доходит до верхней Волги, Западной и Северной Двины.
Подобная картина противопоставления одной области всем соседним обычно наблюдается на обобщённых картах другого типа — картах генетических расстояний, тогда как для карт главных компонент подобный тренд нетипичен. Действительно, среди многих опубликованных карт главных компонент [Cavalli-Sforza et al., 1994; Рычков, Балановская, 1990; Рычков и др., 1999; главы 4–9 данной книги] почти отсутствуют карты с таким типом изменчивости. Единственная несколько похожая карта главных компонент получена по данным о русских фамилиях [Балановский и др., 20006].
География рассматриваемой второй главной компоненты (рис 8.2.8.) позволяет выдвинуть гипотезу — данные дерматоглифики обнаруживают своеобразие беломоро-балтийской расы, т. е. восточного варианта северо-европеоидной расы.
Таким образом, включение в анализ ещё одного типа признаков (дерматоглифики) позволило не только подтвердить приоритет долготного тренда, но и выявить новую черту восточноевропейского генофонда — особость северо-запада, — которая не выявлялась в изменчивости иных признаков.
Рис. 8.2.7. Карта первой главной компоненты изменчивости фенофонда Восточной Европы (дерматоглифика).
Рис. 8.2.8. Карта второй главной компоненты изменчивости фенофонда Восточной Европы (дерматоглифика).
Рис. 8.2.9. Карта распространения гаплогруппы W в народонаселении Восточной Европы.
Рис. 8.2.10. Карта распространения гаплогруппы HV в народонаселении Восточной Европы.
§ 4. Митохондриальная ДНК
ИЗУЧЕННЫЕ ПОПУЛЯЦИИ. Основную часть сведений по митохондриальной ДНК в Восточной Европе составили наши данные об одиннадцати восточнославянских популяциях. Геногеографическая экспедиция ГУ МГНЦ РАМН под руководством Е. В. Балановской объединила усилия российских, украинских и белорусских генетиков. В каждом изучаемом регионе были собраны репрезентативные выборки: коренное, неметисированное население. Обследовались небольшие провинциальные города или сельское население в зонах, наименее затронутых интенсивными миграциями в XX веке, вдали от железных дорог и промышленных центров. Для каждого обследованного составлялась родословная (пробанд, родители, бабушки и дедушки), свидетельствующая, что все его предки на глубину не менее трёх поколений относились к данному этносу и происходили только из данного изучаемого региона.
Данные по народам Волго-Уральского региона (башкиры, татары, чуваши, коми-зыряне, коми-пермяки, марийцы, мордва, удмурты) получены коллективом Уфимского научного центра [Бермишева и др., 2002]. Также использованы данные по северным русским популяциям [Belyaeva et al., 2003], карелам [Sajantila et al., 1995]; эстонцам [Sajantila et al., 1995, 1996; данные Эстонского биоцентра] и ненцам [Saillard et al., 2000].
Полученные результаты впервые дают подробную характеристику изменчивости мтДНК в Восточной Европе. Как и при рассмотрении мтДНК в русском генофонде (раздел 6.2) мы чуть расширим спектр видов анализа: изменчивость мтДНК охарактеризуем не только картами главных сценариев, величинами межпопуляционного и внутрипопуляционного разнообразия, но рассмотрим и распространение некоторых наиболее любопытных «аллелей» (гаплогрупп мтДНК).
КАРТЫ ОТДЕЛЬНЫХ ГАПЛОГРУПП
Чтобы проиллюстрировать паттерны изменчивости митохондриальной ДНК в Восточной Европе, приведём карты распространения пары гаплогрупп (рис. 8.2.9. и 8.2.10).
Карты показывают, что гаплогруппа W распространена у славян, но не встречается у восточно-финских народов. Гаплогруппа HV распространена в южных областях Восточной Европы и отсутствует на севере. Столь же чёткие тренды характерны и для других гаплогрупп: U3 (снижение частоты к северу подобно HV); гаплогруппа I представлена с частотами 2–6 процентов в южных частях Восточной Европы, но практически отсутствует на севере. Тренд изменчивости гаплогруппы U4 долготен (подобно гаплогруппе W, но в обратном направлении — частота падает с востока на запад). Несколько гаплогрупп распределены по Восточно-Европейской равнине практически равномерно (Т, J), для некоторых характерен мозаичный тип пространственной изменчивости (Н, К, R, U2, U5a, U5b, V).
ВОСТОЧНО-ЕВРАЗИЙСКИЕ ГАПЛОГРУППЫ
Эти гаплогруппы интересны тем, что их основной ареал — Восточная Азия, и степень их представленности в Европе может маркировать влияние монголоидных групп населения. На рис. 8.2.11. приведена карта суммарной частоты восточно-евразийских гаплогрупп (А, В, C, D, G, F, Y, Z).
Можно видеть, что граница распространения этих «азиатских» гаплогрупп проходит по Восточно-Европейской равнине. Восточные славяне полностью принадлежат европейской генетической провинции с крайне низкими частотами — почти отсутствием — восточно-евразийских гаплогрупп, тогда как народы Волго-Уральского региона существенно различаются между собой по частотам этих маркёров. Именно между Волгой и Уральским хребтом частоты постепенно увеличиваются до значимых величин (10–30 %), и продолжают возрастать далее к востоку, на территории Западной Сибири. Бросается в глаза сходство рассмотренных выше карт главных компонент других маркёров (рис. 8.2.1., 8.2.3., 8.2.5., 8.2.7.) и этой (своего рода тоже обобщённой, суммарной) карты для митохондриальной ДНК. Зная глобальное распространение восточно-евразийских гаплогрупп (оно подробно рассматривается в следующей главе 9) можно утверждать, что тренд, наблюдаемый в Восточной Европе, является частью общеевразийского долготного тренда, т. е. одной из основных закономерностей в глобальной вариабельности мтДНК.
Рис. 8.2.11. Карта распространения восточноевразийских гаплогрупп в Восточной Европе (суммарная частота).
Рис. 8.2.12. Карта уровня гаплотипического разнообразия мтДНК в Восточной Европе.
ГАПЛОТИПИЧЕСКОЕ РАЗНООБРАЗИЕ
Не только частоты гаплогрупп, но и разнообразие гаплотипов различается в разных частях восточноевропейского региона (рис. 8.2.12). Этот показатель измеряет вероятность двух случайно выбранных из популяции мтДНК оказаться идентичными и является аналогом гетерозиготности. Иными словами, это внутрипопуляционное разнообразие.
Разнообразие гаплотипов митохондриальной ДНК велико практически во всех популяциях мира, и в Европе, как правило, достигает величин 0.98-0.99. В Восточной Европе гаплотипическое разнообразие варьирует от сравнительно низкой величины 0.95 до «евростандарта» 0.99. Картографирование выявило чёткую географическую изменчивость: разнообразие снижается от южных к северным популяциям (рис. 8.2.12.)
Снижение разнообразия мтДНК от южных к северным популяциям ранее не было известно, и обнаружено нами благодаря последовательному картографированию всего комплекса показателей изменчивости мтДНК.
Хотя в отношении мтДНК этот результат является новым, аналогичное снижение внутрипопуляционной изменчивости (гетерозиготности) к северо-востоку мы видели для классических и ДНК маркёров (рис. 8.1.1., 8.1.2). Можно думать, что снижение внутри-популяционного разнообразия вызвано дрейфом генов, интенсивность которого, в свою очередь, в значительно степени задаётся плотностью населения. А плотность населения в Восточной Европе постепенно снижается в том же самом направлении: от южных к северным районам. Таким образом, сниженная плотность населения (и соответственно его большая дисперсность, изолированность и как следствие сильный генетический дрейф) могут являться фактором, который снижает внутрипопуляционное разнообразие к северу.
ПЕРВЫЙ СЦЕНАРИЙ мтДНК
Для митохондриальной ДНК, так же как и для прочих типов признаков, мы провели анализ главных компонент изменчивости. Но от митохондриальной ДНК можно ожидать своеобразия: это наиболее необычный маркёр, как по типу наследования (только по материнской линии), так и, что важнее, по вчетверо более сильной подверженности дрейфу генов. (МтДНК — гаплоидная система с однородительским типом наследования, каждое из этих свойств вдвое снижает эффективный размер популяции в отношении этого маркёра). Но поскольку для другой «однородительской» системы — Y хромосомы — мы получили хорошее согласие с тенденциями основной части генома (раздел 6.3), то, может быть, и мтДНК покажет нам не прихотливые собственные паттерны, а ту же основную структуру генофонда, что и прочие типы признаков?
Первая главная компонента по мтДНК (31 % общей изменчивости) представлена на рис. 8.2.13. И вновь, как и на картах первых компонент предыдущих систем, мы обнаруживаем долготную изменчивость. Одни значения компоненты характерны для населения Урала, противоположные — для большей, западной части Восточной Европы. Переходная зона почти отсутствует — при движении с запада на восток низкие значения компоненты продолжаются вплоть до 50 меридиана, а затем очень быстро достигают высоких величин.
Вторая компонента по мтДНК вбирает 17 % общей изменчивости и демонстрирует более сложный рельеф. Значения задаются прикаспийским экстремумом, которому противопоставлен «североуральский» экстремум, и, в меньшей мере, причерноморский.
МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ
Рисунок 8.2.14. показывает относительное сходство восточноевропейских популяций друг с другом. Он дополняет аналогичный график, рассмотренный в разделе 6.2.: там рассматривались взаимоотношения одних лишь русских популяций, теперь же мы видим всю Восточную Европу — генетические взаимоотношения и русских, и окружающих их иноэтничных популяций.
На графике славянские популяции образуют внутренний кластер. Он окружён кольцом финно-угорских популяций, расположенных по периферии графика. Кроме финноязычных групп, это внешнее кольцо включает также чувашей и северных русских; и именно в этих популяциях антропологи предполагают значительный финно-угорский субстрат.
Расположение славян в центре финно-угорского кольца может отражать славянскую колонизацию нынешней Центральной России, сопровождавшейся ассимиляцией дославянского (финно-угорского) населения.
МЕЖПОПУЛЯЦИОННАЯ ИЗМЕНЧИВОСТЬ
Похожий результат получен и при анализе межпопуляционной изменчивости. В таблице 8.2.1. приведены средние генетические расстояния между популяциями, говорящими на языках основных лингвистических групп Европы. Для этого проанализированы данные по 67 европейским популяциям (информация нашего банка данных World Mitochondrial).
Таблица 8.2.1.
Средние генетические расстояния между популяциями, относящимися к основным языковым группам Европы.
Среди всех лингвистических групп Европы наиболее генетически разнообразны оказались финно-угры. За ними следуют романские и славянские народы. Германские народы — единообразны по митохондриальной ДНК.
Рис. 8.2.13. Карта первой главной компоненты изменчивости генофонда Восточной Европы (мтДНК).
То есть вновь мы видим значительную изменчивость в пределах финно-угорской общности, которая и на графике многомерного шкалирования образовала внешний кластер с большими расстояниям между популяциями.
ИТОГИ
Отметим основные черты восточноевропейского генофонда по данным о мтДНК:
1. Анализ изученных нами И восточнославянских популяций вместе с уже имеющимися в литературе данными по народам Волго-Уральского региона обнаружил географическую структурированность митохондриального генофонда в восточной половине Европы. Вновь, как и по другим типам признаков, основной закономерностью является долготная изменчивость.
2. В славянских популяциях встречены почти исключительно западно-евразийские гаплогруппы. Восточная граница зоны расселения славян является крайним западным рубежом для распространения «азиатских» гаплогрупп.
3. Среди популяций, представляющих основные языковые группы Европы (славянскую, романскую, германскую и финно-угорскую), наиболее дифференцированы финно-угры.
4. Данные по митохондриальной ДНК указывают на ассимиляцию восточными славянами митохондриального генофонда дославянского финно-угорского населения Восточной Европы, и особенно близкими к современным финно-угорским народам оказываются северные русские популяции.
Рис. 8.2.14. График многомерного шкалирования популяций Восточной Европы по гаплогруппам мтДНК.
Обозначения. Популяции восточных славян обозначены штрихами и пронумерованы:
РУССКИЕ: 1 — Кострома; 2 — Смоленск; 3 — Белгород; 4 — кубанские казаки; 5 — юго-восточные русские.
УКРАИНЦЫ: 6 — Хмельницкая; 7 — Львовская; 8 — Белгородская области.
БЕЛОРУСЫ: 9 — северные, 10 — южные.
8.3. КАРТЫ ГЕНЕТИЧЕСКИХ РАССТОЯНИИ ОТ РАЗНЫХ НАРОДОВ
Есть ли у языков гены? — Зачем генофондам имена? — О чём говорят карты расстояний? — Не одна карта, а целый веер!
§ 1. Расстояния от трёх языковых семей: ОТ ИНДОЕВРОПЕЙСКОЙ: отличия нарастают к востоку — Но большая часть популяций генетически близка; — ОТ УРАЛЬСКОЙ: расстояния растут с востока на запад — Но многие популяции близки — Финно-угорский субстрат у славян и тюрок; — ОТ АЛТАЙСКОЙ: близки только к самим себе — Нет влияния на соседей по Европе
§ 2. Расстояния от русских, белорусов, украинцев: Классические маркёры — Северные русские дальше от средних русских, чем украинцы, мордва и чуваши — Аутосомные ДНК маркёры — Прежняя картина — К русским близки почти все — Кроме Кавказа и Урала — Y хромосома — Та же картина при большей контрастности — Расстояния от белорусов — Похожи только на славян — Та же картина для украинцев — Значит, именно к русским близки восточноевропейские популяции, а не к славянам вообще!
ЕСТЬ ЛИ У ЯЗЫКОВ ГЕНЫ?
Хотим сразу ответить, что авторы, как и читатель, знают, что у языков генов нет. Это понятно даже на бытовом уровне — сколько русских, разбросанных по миру волнами первой, второй и других эмиграций, говорят на самых разных языках! А гены у них все те же, унаследованные от их предков.
Тогда почему же мы говорим о генах славянской или германской языковой семьи? Научно ли это? Вполне. Ведь мы занимаемся популяционной генетикой и говорим лишь о той популяции людей, которые говорят на языках славянской или же германской ветви языков. И ничего другого за «лингвистическими именами» не стоит.
Мы уже не раз говорили о том, что популяции многослойны и могут быть самого разного ранга — от элементарных популяций (несколько соседних деревень) до популяции всего человечества. Все это популяции, и вложены они друг в друга как матрёшки: множество популяций нижестоящих рангов вмещаются в популяцию очередного вышестоящего ранга, и так далее. Одну из таких промежуточных матрёшек-популяций мы примерно определяем по этническому признаку. Лишь поэтому мы и можем говорить о русском генофонде — то есть о той популяции, которая маркируется принадлежностью людей к русскому народу. Причём, эта принадлежность определяется самим людьми, а ни в коем случае не генетикой! И лишь после того, как люди определили себя как русских или как норвежцев (или сообщили, что об этом думали их бабушки-дедушки), генетики начинают беспристрастно смотреть: отличаются ли и насколько популяции русских и норвежцев друг от друга? Такие популяции мы условно называем «русскими» или «норвежскими», при этом полностью отдавая себе отчет, что генофонды и популяции — это биологические единицы, которые мы даём «гуманитарные» имена.
Но подчеркнём, оттого, что мы генофондам дали имена «русский» или «норвежский», не означает, что на сцене вдруг появились «русские гены» или «норвежские гены»! Нет генов «русских» или «украинских», так же, как и нет генов славянских или романских. Нет, хотя бы потому, что гены намного старше народа и разбрелись чуть ли не по всему миру. Впрочем, эти вопросы мы обсуждаем в заключении книги (глава 10). А сейчас нам важно лишь ответить на вопрос — если нет генов русских или славянских, отчего же мы генофонды называем такими именами?
ЗАЧЕМ ГЕНОФОНДАМ ИМЕНА?
Лишь оттого, что популяциям (и их генофондам) надо дать понятные имена. Можно, конечно, оставить генофонд безымянным и все время повторять «основное сельское старожильческое население районов Восточно-Европейской равнины и более северных областей, примерно соотносимое с границами Русского государства до Ивана Грозного». Но даже из такой фразы останется неясным, кого мы всё же анализируем (например, включаем ли карел, ижору, татар или мордву). А если сказать (как мы подробно рассказали в начале книги), что под русским генофондом мы будем иметь в виду коренных сельских русских в их «исконном» (историческом) ареале, а затем использовать термин «русский генофонд» во всей книге, то читателю легче будет понять, о чём говорят авторы. Поэтому генофондам мы и даём условные имена — для простоты взаимопонимания.
Однако, чтобы матрёшкам более высокого ранга дать имена, надо использовать какую-то классификацию популяций. В главе 2, например, мы проверяли, насколько генетически эффективны расовая и лингвистическая классификации. А у народов Сибири проверили генетическую эффективность классификации народов по типу орнамента и по типам шаманских бубнов. И оказалось, что орнамент выявляет популяции плохо, а вот шаманские бубны не менее эффективны для выделения популяций, чем языки. Но всё же лингвистическая классификация разработана наиболее подробно. Именно поэтому имена популяциям часто даются по именам языков. Так принято сейчас в биологических науках. И когда мы говорим, например, о «финно-угорском» пласте генофонда, нас понимают и антропологи, и археологи. Понимают, что речь идет об определённой популяции людей, достаточно протяжённой во времени и в пространстве. И не важно, что сейчас чуваши сменили прежний язык на тюркский, и не важно, что мы не знаем, на каком языке говорили древние популяции, если они не оставили письменных свидетельств. Огромной массив данных разных наук (включая, например, топонимику — названия рек или озер) свидетельствует, что здесь существовала общность людей, которой мы теперь даём условное название «финно-угорский» мир.
Поэтому и в этом, и в следующем разделе, сравнивая генетические расстояния от популяций с «лингвистическими» именами, мы не изменяем науке, а следуем её строгим правилам. Берём языковую классификацию народов; затем даём в соответствии с ней каждой группе популяций условное «лингвистическое» имя; и, наконец, рассчитываем средние частоты генов для тех популяций из этой группы, которые проживают на анализируемой территории. А затем смотрим, насколько каждая популяция Восточной Европы отличается от этих средних частот «индоевропейских» или «алтайских» массивов популяций. При этом авторы, как и читатель, сознают, что на алтайских языках в Европе говорят народы с совершенно разным физическим обликом — от гагаузов до калмыков. Но мы не имеем права на этом основании исключать кого бы то ни было из тех групп, которые выделила лингвистика — мы честно перечисляем, какие народы включены в популяцию с данным «лингвистическим» именем.
О ЧЁМ РАССКАЗЫВАЮТ КАРТЫ РАССТОЯНИИ?
Карты генетических расстояний едва ли не важнее карт главных компонент. Эти два основных инструмента геногеографии, используемые совместно, дают взаимодополняющее описание генофонда. Карты главных компонент позволяют нам выдвинуть гипотезы о факторах, сформировавших наблюдаемые закономерности, а карты генетических расстояний — эти гипотезы проверить.
Каждая приведённая в данном разделе карта генетических расстояний является средней по всем изученным локусам (табл. 8.1.1). Она наглядно показывает, насколько генетически близка каждая популяции ареала к одной группе населения, заданной исследователем. Такая группа популяций называется «реперной».
Генофонду можно задавать вопросы: какие популяции генетически близки к интересующей нас группе населения? Какие относительно удалены? А какие принципиально отличны от реперной группы, причём по всей совокупности частот генов? И карта генетических расстояний даст ответ: насколько каждая точка на карте генетически близка или же далека от реперной группы. Мы увидим это своими глазами.
Карты расстояний отличаются от обычного использования генетических расстояний только одной, но важнейшей особенностью: при картографировании в анализ включается ареал популяции, т. е. географический, пространственный аспект.
Карта генетических расстояний часто обнаруживает связь генетических и географических дистанций. Карта демонстрирует, как по мере удаления от реперной популяции (заданной исследователем) население смежных и более удалённых территорий становится генетически всё более отличным от реперной популяции. Однако это нарастание генетических расстояний зависит не только от географической удалённости. Иначе любая карта генетических расстояний состояла бы из концентрических кругов, подобных кругам, расходящимся на воде от брошенного камня.
В действительности же расстояния в одних направлениях могут нарастать быстро, указывая на барьеры для генного потока; в других направлениях расстояния могут почти не увеличиваться, демонстрируя генетическую близость этих смежных групп. В ряде случаев плавный ход изолиний может нарушаться, и среди генетически близких групп выявляется популяция генетически отдалённая, что может свидетельствовать, например, о её миграции на эту территорию. Таким образом, нанесение генетических расстояний на карту способно дать ценную информацию о взаимоотношениях изучаемой группы с остальными популяциями региона, наличии генетических потоков, генетических барьеров, родственных групп. Более того, мы получаем информацию и о самой реперной группе (например, русских или белорусах): о генетическом разнообразии в её пределах, об отклонениях от средних значений внутри её собственного ареала.
НЕ ОДНА КАРТА. А ЦЕЛЫЙ ВЕЕР!
Картографирование генетических расстояний проясняет многие черты генофонда — особенно если рассмотреть не одну карту расстояний (от одного народа), а серию карт — от разных народов, от основных групп населения. Каждая новая карта расскажет о генетическом положении нового народа или группы народов в общем генофонде региона. Сопоставление всего веера карт покажет, сколь велик вклад каждой из этих групп в восточноевропейский генофонд и где проходят зоны их смешений.
Мы не будем здесь рассматривать карты генетических расстояний от каждого народа Восточной Европы — так бы мы вышли слишком далеко за рамки книги о русском генофонде. Более информативны карты расстояний от групп народов, родственных между собой. Они обнаруживают закономерности не этногенеза отдельных народов, а общие события формирования населения Восточной Европы. Как мы уже рассказывали в главе 2, геногеография опирается на принцип «масштабирования»: при увеличении масштабности изучаемых групп выявляются следы всё более древних и масштабных событий.
Поэтому внимание уделено картам расстояний от групп народов. В § 1 построены карты от средних частот генов у населяющих Восточную Европу народов индоевропейской, уральской и алтайской языковых семей. Затем (§ 2) мы рассматриваем карты расстояний от русского народа, показывающие его положение в общем генофонде Восточной Европы. И в заключение взглянем на карты двух других народов Восточной Европы — белорусов и украинцев, которые исторически близки к русским популяциям и могут обладать близким генофондом.
Рис. 8.3.1. Карта генетических расстояний от народов индоевропейской языковой семьи (ДНК маркёры).
КАК ЧИТАТЬ КАРТЫ РАССТОЯНИЙ?
Все карты читаются одинаково. Чем больше данная точка карты генетически удалена от реперной популяции, чем больше расстояния, тем более интенсивна окраска этой точки. Поэтому самые светлые области — это области наименьших расстояний. Это те популяции, которые больше всего похожи на реперную. Самые тёмные — это области наибольших расстояний. Это популяции, генетически не похожие на реперную. Конечно же, как только мы возьмём иную реперную популяцию, те же точки карты сообщат, что у них уже другие расстояния до нового репера. Для удобства чтения все карты расстояний построены в единой шкале, поэтому можно по интенсивности окраски смело сравнивать не только разные части одной карты, но и разные карты между собой.
§ 1. Расстояния от трёх языковых семей
Рассмотрим карты генетических расстояний всех популяций Восточной Европы от населяющих её народов индоевропейской, уральской и алтайской языковых семей. Для краткости приведём карты одного «очевидца» — аутосомных ДНК маркёров, поскольку карты генетических расстояний по классическим маркёрам, как мы увидим в следующем параграфе, довольно похожи.
ОТ НАРОДОВ ИНДОЕВРОПЕЙСКОЙ ЯЗЫКОВОЙ СЕМЬИ (ДНК МАРКЕРЫ!
Карта генетических расстояний от индоевропейской языковой семьи представлена на рис. 8.3.1.
Карта строилась так. Сначала были рассчитаны средние частоты ДНК маркёров для представителей индоевропейской семьи в Восточной Европе: популяций русских, украинцев, белорусов, молдаван. Затем на их основе получены средние «индоевропейские» частоты генов. Далее вычислены генетические расстояния от этих средних «индоевропейских» частот до частот в каждой точке карты, а полученные значения расстояний помещены в эти же узлы карты.
Поэтому, если, например, на большей части Белоруссии, в районах Киева и Львова значения генетических расстояний попадают в интервал от 0.01 до 0.02 (рис. 8.3.1), это означает, что таковы (в среднем по всем генам) отличия этих популяций от средних частот народов индоевропейской семьи. Напротив, отличия калмыков, коми, башкир много больше — значения генетических расстояний на территориях их расселения более 0.05 и 0.06. Аналогично читаются и остальные карты генетических расстояний.
Карта демонстрирует, что к средним частотам индоевропейских народов Восточной Европы, как и можно было ожидать, близки популяции русских Центральной России, украинцев, белорусов, молдаван (то есть сами индоевропейские популяции). Однако не все предсказуемо — северные русские популяции (хотя и они индоевропейцы) заметно отличаются от «средних индоевропейцев» — в той же степени что и неиндоевропейские народы средней Волги (мари, мордва, чуваши) и Западного Кавказа. Наконец, наиболее отличным оказывается население Урала (в особенности коми), а также степные народы (башкиры, калмыки).
Обратим внимание на популяции русского народа. Они представляют в Восточной Европе индоевропейскую языковую семью, их частоты были использованы для расчёта средних «индоевропейских» частот. И, тем не менее, мы видим яркие различия русских популяций по степени близости к собственной реперной популяции. Это вновь указывает, что уровень гетерогенности генофонда русского народа столь велик, что ярко проявляется даже в восточноевропейском масштабе.
В целом обнаруживается чёткая географическая закономерность: при движении на восток значения расстояний постепенно нарастают, популяции всё более отличаются от средних характеристик индоевропейских народов, и наиболее генетически несходными с ними оказываются народы восточных окраин Европы. Однако в целом, большинство народов Восточной Европы (включая уральские и кавказские популяции) оказываются близки к индоевропейским народам: средняя по карте величина генетических расстояний невелика d=0.028.
ОТ НАРОДОВ УРАЛЬСКОЙ ЯЗЫКОВОЙ СЕМЬИ (ДНК МАРКЁРЫ)
Следующая карта генетических расстояний построена от средних частот генов уральской языковой семьи и демонстрирует иную картину (рис. 8.3.2).
Рис. 8.3.2. Карта генетических расстояний от народов уральской языковой семьи (ДНК маркёры).
Из уральской семьи по ДНК маркёрам изучены лишь восточные финноязычные народы (коми, удмурты, мари, мордва). Минимальные расстояния обнаруживаются на территории расселения этих народов, в в основном в Приуралье. Напротив, население запада Русской равнины и Предкавказья генетически удалено от средних уральских частот. Срединные же районы Восточной Европы, географически соседние с Приуральем, ближе к уральским народам и генетически.
Нтак, наименьшие значения расстояний локализуются на Урале и далее к западу постепенно нарастают. Вероятно, территории, занятые промежуточными значениями, отражают ареал древних, ассимилированных славянами финно-угорских племён [Алексеева, 1965]. Любопытно, что ареалы и тюркоязычных народов Урала приближены к характеристикам уральской семьи, что объясняется значительной долей уральского субстрата в генофонде чувашей, татар, некоторых групп башкир [Рогинский, Левин, 1978].
Средняя по карте величина расстояний, хотя и выше, чем от «индоевропейских», но невелика (d=0.039). Это подтверждает значительную представленность уралоязычного генофонда в общем восточноевропейском генофонде, который во многом состоит из уральского субстрата.
ОТ НАРОДОВ АЛТАЙСКОЙ ЯЗЫКОВОЙ СЕМЬИ (ДНК МАРКЁРЫ)
Следующая карта (рис. 8.3.3.) демонстрирует отличия каждой восточноевропейской популяции от народов алтайской языковой семьи. Эта семья в Восточной Европе представлена, главным образом, тюркоязычными народами — лишь калмыки говорят на языке, относящемся к монгольской группе этой семьи.
Рис. 8.3.3. Карта генетических расстояний от народов алтайской языковой семьи (ДНК маркёры).
Две предыдущие карты генетических расстояний (от индоевропейской и от уральской семей) характеризовались небольшими средними значениями расстояний. На картах (рис. 8.З.1., 8.3.2.) это было заметно по преобладанию светлых тонов. Напротив, на карте расстояний от алтайской семьи (рис. 8.3.3.) преобладает тёмный цвет, соответствующий значительной генетической удалённости большинства восточноевропейских популяций от генофонда алтайской лингвистической семьи. Лишь сами ареалы народов алтайской языковой семьи естественным образом близки к своим средним значениям. А сразу же за пределами зоны их расселения остальные восточноевропейские популяции оказываются резко отличающимися от генетических характеристик алтаеязычных народов.
Это отражено и в большем, чем для предыдущих карт, значении генетических расстояний. В среднем по карте они составили d=0.064, что почти в три раза выше аналогичной величины для индоевропейских народов.
Таким образом, влияние народов алтайской семьи на восточноевропейский генофонд ограничивается лишь зоной их расселения и по рассматриваемым данным практически не прослеживается даже на смежных территориях. Этот факт можно объяснить сравнительно поздним появлением в Восточной Европе многих племён, говорящих на языках алтайской семьи [Народы и религии мира, 1999], тогда как и индоевропейская, и уральская семьи являются языками более древнего населения Восточной Европы [Чебоксаров, Чебоксарова, 1971; Бунак, 1980].
§ 2. Расстояния от русских, белорусов, украинцев
Итак, мы узнали основной «состав» восточноевропейского генофонда — какие основные субгенофонды в нём представлены, в каких «долях» они «смешены», и как эти доли различаются в разных частях Восточной Европы. Теперь можно вернуться к основной теме нашей книги и рассмотреть, каково положение всех восточноевропейских популяций относительно русских? Поскольку эта тема ведущая, генетические расстояния от русских популяций мы приведём для трёх типов маркёров — классических маркёров, аутосомных ДНК маркёров и маркёров Y хромосомы. А чтобы нам не перепутать «чисто русские» черты со «славянскими», мы рассмотрим и карты расстояний от исторически близких восточнославянских народов — белорусов и украинцев.
Рис. 8.3.4. Карта генетических расстояний от русских популяций (классические маркёры).
ОТ РУССКИХ ПОПУЛЯЦИЙ (КЛАССИЧЕСКИЕ МАРКЕРЫ)
Карта генетических расстояний от средних русских частот по классическим маркёрам показывает степень сходства каждой популяции в Восточной Европе с русским генофондом. Светлая область наибольшей близости к среднерусским частотам генов занимает среднюю полосу Восточной Европы — от Белоруссии до средней Волги (рис. 8.3.4). Тёмные тона — области, генетически удалённые от русских. Их сравнительно немного — в порядке степени удаления от среднерусских — это Крым и Причерноморье, Нижняя Волга, Прибалтика, Русский Север, Фенноскандия и генетически далёкий Урал.
Ареалы белорусов и украинцев демонстрируют сходство с русским генофондом. Удивительными оказываются резкие генетические отличия Русского Севера и вообще северо-востока Европы, в том числе и Вятки — древней новгородской колонии.
Разумеется, коренное русское население, проживающие сейчас на этих территориях, в наибольшей мере несёт черты ассимилированного населения. Однако невероятно, чтобы вклад финно-угорского населения здесь был выше, чем в популяциях мордвы и чувашей, которые на карте полностью вошли в «среднерусскую генетическую область». Возможны три источника таких отличий. Во-первых, сам финно-угорский субстрат может тяготеть к западным финноязычным народам, а не к восточным.
Во-вторых, как указывают данные археологии [Седов, 1999], новгородская колонизация имела другой исток самих славянских племён. Это значит, что не только субстрат, но и славянский суперстрат мог быть своеобразным на Русском Севере. В-третьих, в малочисленных северных популяциях мощнее фактор дрейфа генов, который так же мог «отнести» их от основного русского материка. Скорее всего, все три фактора действовали параллельно, но задача будущих исследований — выяснить их реальное соотношение. Здесь большую помощь могут оказать однородительские маркёры, помогающие дифференцировать потоки миграций в пространстве и во времени.
Близость к «среднерусским» частотам проявляют самые разные части русского ареала, в том числе и те, на которых располагаются противоположные экстремумы главных компонент восточноевропейского генофонда (раздел 8.2). Подобную картину можно объяснить, исходя из гипотезы, что сами «среднерусские» частоты являются по сути «среднеевропейскими», а русский генофонд сформирован смешениями самых различных восточноевропейских компонентов (финно-угорских, славянских, балтских и т. д.). Эта гипотеза находит подтверждение и в каргах генетических расстояний от украинцев, белорусов и русских по самому информативному ДНК маркёру — гаплогруппам Y хромосомы.
ОТ РУССКИХ ПОПУЛЯЦИЙ (АУТОСОМНЫЕ ДНК МАРКЁРЫ)
Как и по данным о классических маркёрах (рис. 8.3.4.), к среднерусским частотам генов опять близко в первую очередь население Центральной России (рис. 8.3.5). Белорусы, которые по частотам классических маркёров практически неотличимы от среднерусских характеристик, и по ДНК данным демонстрируют небольшие отличия. Население Урала, Кавказа, Поволжья и в меньшей степени Русский Север весьма отличаются от средних русских частот. Таким образом, во всех главных моментах использование ДНК и классических маркёров приводит к сходным результатам. Различия между двумя картами, по нашему мнению, вызваны главным образом степенью изученности маркёров разных типов, и можно ожидать, что по мере накопления данных по ДНК полиморфизму картина их изменчивости будет всё более приближаться к результатам, полученным по классическим маркёрам.
Рис. 8.3.5. Карта генетических расстояний от русских популяций (ДНК маркёры).
Средняя генетическая удаленность восточноевропейских популяций от русских частот невелика (d=0.28), что может быть результатом длительного взаимодействия русского генофонда с окружением. Напомним, что расстояния от индоевропейских народов в целом характеризуется такой же средней величиной (d=0.28). При сравнении этих карт (рис. 8.3.1. и 8.3.5.) становится очевидным их значительное сходство. Это и понятно, поскольку русские тоже индоевропейцы и частоты в русских популяциях входили в расчёт для индоевропейских народов. Любопытно, что отличия русских популяций между Волгой и Вяткой, отмеченные на карте расстояний от средних частот у индоевропейских народов, сохраняются и на карте расстояний от средних русских частот.
Итак, русский генофонд оказывается тесно связанным с генофондами многих восточно-европейских народов — по частотам генов к русским чрезвычайно близки белорусские, украинские, мордовские и многие другие восточноевропейские популяции. Лишь по мере приближения к Кавказу и Уралу генофонд населения становится явно отличным от средних характеристик русского генофонда. Этот результат не является неожиданным, поскольку русское расселение на обширных территориях и интенсивный обмен генами за пределами «исконного» ареала с окружающими народами очевидны. Скорее представляется интересным факт, что на геногеографических картах проявилось наличие двух горных преград (Кавказа и Урала), в какой-то степени ограничивающих это пространственное расширение генофонда.
ОТ РУССКИХ ПОПУЛЯЦИЙ (МАРКЕРЫ Y ХРОМОСОМЫ)
Эта карта отличается двумя чертами. Во-первых, на ней мы видим всю Европу, а не только её восточную половину (карта построена на основе тех восьми карт отдельных гаплогрупп, которые рассматривались в разделе 6.3). Во-вторых, дифференцирующая способность маркёров Y хромосомы намного выше, поэтому отличия русских популяций от соседей проявляются более ярко. Несмотря даже на более «широкую» шкалу интервалов, интервал максимальных расстояний доминирует на карте — по маркёрам Y хромосомы почти вся Европа оказывается значительно отличающейся от русского генофонда (рис. 8.3.6). К средним русским частотам наиболее близки лишь сами русские популяции и белорусы, среднюю степень близости показывают украинцы, западнославянские народы (поляки, чехи, словаки) и народы Поволжья. Как и на предыдущих картах, северные русские популяции демонстрируют ярко выраженное своеобразие, резко отличаясь от среднего русского генофонда.
Рис. 8.3.6. Карта генетических расстояний от русских популяций (Y хромосома).
Мы видим, что маркёры Y хромосомы подтверждают выявленные ранее закономерности сходства «среднерусского» генофонда с другими восточно-славянскими народами и народами Поволжья и отличий Русского Севера. Высокая информативность Y хромосомы делает эти закономерности более выпуклыми, чем по другим типам маркёров, а рассмотрение в масштабе всей Европы добавляет к списку похожих на русский генофонд народов ещё и поляков.
ОТ БЕЛОРУСОВ (КЛАССИЧЕСКИЕ МАРКЁРЫ)
На предыдущих картах (рис. 8.3.4., 8.3.5., 8.3.6.) мы видели, что многие популяции Восточной Европы сходны с русским генофондом.
Важно понять: близки ли все эти популяции именно к русскому генофонду или же к широкому кругу восточнославянских популяций? Иными словами: кроется ли секрет этого сходства в этнической истории русского народа или же в экспансии восточных славян в целом, а возможно и в «исходном», до экспансии, сходстве славянского и финно-угорского генофондов?
Для ответа на этот вопрос мы провели анализ близости восточноевропейского генофонда к белорусам — другому восточнославянскому этносу, очень близкому по географии, этногенезу и антропологическому типу к русскому народу.
На рис. 8.3.7. приведена карта генетических расстояний популяций Восточной Европы от средних белорусских частот генов по большому набору классических генных маркёров — 57 аллелей 21 локуса. Мы видим ясную картину, принципиально отличную от характера изменчивости русского генофонда. Практически все области, население которых демонстрирует наибольшую близость к белорусскому генофонду, расположены на самой территории Белоруссии. За пределами же белорусского ареала генетические расстояния быстро возрастают до значительных величин, указывая на чёткие генетические отличия генофонда белорусов от восточноевропейского генофонда в целом.
Рис. 8.3.7. Карта генетических расстояний от белорусов (классические маркёры).
Карта фиксирует генетическое своеобразие генофонда белорусов, что свидетельствует о высокой чувствительности метода генетических расстояний. Отметим, что чёткие отличия белорусского генофонда от генофонда соседних территорий являются важным неожиданным результатом, поскольку по антропологическим данным обычно не удаётся выявить выраженных отличий белорусов от соседних групп [Алексеева, 1973; Дерябин, 1999]. Конечно же, это генетическое своеобразие белорусов очень относительно: оно проявляется только в белорусском масштабе, как бы в микроскоп, благодаря огромной разрешающей способности карт видеть даже тонкие детали. Напомним, что в ином масштабе — на картах генетических расстояний от русских — белорусы практически неотличимы от русских Центральной России. Во всяком случае, белорусы куда больше похоже на них, чем сами русские популяции Русского Севера.
Таким образом, в отличие от русского, белорусский генофонд не является приближенным к восточноевропейскому генофонду в целом. Следовательно, высокое генетическое сходство русских популяций с населением большинства восточноевропейских территорий является не чертой, общей всем восточнославянским народам, а собственной характеристикой русского генофонда.
ОТ БЕЛОРУСОВ (МАРКЁРЫ Y ХРОМОСОМЫ)
Этот вывод подтверждается и данными по Y хромосоме. Карта расстояний от белорусов (рис. 8.3.8.) построена в той же шкале интервалов, что и от русских (рис. 8.3.6.). Но зона, генетически сходная с белорусским генофондом, заметно меньше: она включает лишь славянские народы (как восточных славян, кроме Западной Украины, так и западнославянские популяции), но не включает народы Поволжья и Приуралья. Таким образом, генетическая общность с неславяноязычными популяциями Восточной Европы является «прерогативой» русского генофонда, в отличие от генофонда белорусов, который резко отличается от этих народов Поволжья и Урала.
Рис. 8.3.8. Карта генетических расстояний от белорусов (Y хромосома).
ОТ УКРАИНЦЕВ (МАРКЕРЫ Y ХРОМОСОМЫ)
Для полноты рассмотрения восточнославянских народов приведём и карту расстояний от украинцев (рис. 8.3.9.). Она весьма напоминает только что рассмотренную карту от белорусов, только зона максимальной близости смещена на ареал самих украинцев, и также эта зона включает южные русские и белорусские популяции. А не-славянские народы Восточной Европы, которые относительно близки к русским популяциям, от украинского генофонда так же далеки, как и от генофонда белорусов. Это подтверждает правильность нашей интерпретации, что славянская колонизация Восточно-Европейской равнины, сопровождавшаяся ассимиляцией финно-угорского населения, вовлекала из всего славянского массива преимущественно предков современного русского населения.
Рис. 8.3.9. Карта генетических расстояний от украинцев (Y хромосома).
8.4. ПОРТРЕТ ВОСТОЧНОЕВРОПЕЙСКОГО ГЕНОФОНДА
Оценка дифференциации Восточной Европы GST=2.6 объективна! — Первый сценарий долготный: «западовосток» — Второй сценарий широтный: «североюг» — Третий сценарий «четырех ядер» с седловиной в Волго-Окском междуречье — Ложных корреляций нет, а карты сценариев правдивы — Карты расстояний: генофонд Восточной Европы составлен из взаимопроникающих генофондов индоевропейской (на западе) и уральской (на востоке) языковых семей — Сходство показаний — Плавность переходов — Русский генофонд сформирован восточными славянами, вобравшими в себя другие пласты и ставшими центральной составляющей генофонда Восточной Европы
Для понимания русского генофонда важно уяснить его положение среди окружающих народов, степень родства или же приобретённого сходства с его соседями по Восточной Европе. Поэтому в данной главе рассмотрен генофонд восточной половины Европы, включающий, наряду с русским, и многие другие народы. Границы Восточной Европы можно очертить по-разному. В данной главе под Восточной Европой понимается ареал от бывшей границы СССР на западе до Уральского хребта на востоке и Большого Кавказского хребта на юге. Здесь проживают многие народы восточнославянской подгруппы, балтской, финской, тюркской языковых групп, по одному народу романской, самодийской и монгольской групп и многие народы северокавказской семьи.
Результаты, изложенные в этой главе, позволяют набросать общий портрет восточноевропейского генофонда. Его изучение проведено по пяти типам признаков: классические генные маркёры, аутосомные ДНК маркёры, митохондриальная ДНК, соматология и дерматоглифика, также привлекались данные по изменчивости Y хромосомы. По каждому типу признаков мы постарались включить все доступные данные, и материал оказался столь обширен, что позволил нам проводить самые разные виды анализа и в каждом случае иметь твёрдую почву под ногами. Даже по аутосомным ДНК маркёрам, изученным менее подробно, чем остальные типы признаков, материал оказался достаточен для корректного анализа.
Для комплексного описания восточноевропейского генофонда проведено три вида анализа: а) измерено межпопуляционное разнообразие и внутрипопуляционное разнообразие (гетерозиготность, гаплотипическое разнообразие); б) по каждому типу признаков созданы карты главных компонент изменчивости генофонда, а для мтДНК проведены и иные виды анализа; в) построены карты генетических расстояний от основных групп восточноевропейского населения, и в том числе от русского народа. Обобщим свидетельства пяти разных очевидцев о структуре генофонда народов Восточной Европы.
МЕЖПОПУЛЯЦИОННАЯ ИЗМЕНЧИВОСТЬ
Величина межпопуляционной изменчивости в Восточной Европе составила GST=2.58/10-2 по ДНК маркёрам и практически столько же GST=2.69–10-2 по классическим маркёрам. Хотя использованные панели ДНК и классических маркёров различаются по гетерозиготности в два раза, их свидетельства о межпопуляционной изменчивости региона совпали. Это подтверждает, во-первых, объективность полученной величины GST и, во-вторых, то, что используемый набор ДНК маркёров достаточно точно характеризует генофонд.
Этот размах межпопуляционных различий превышает аналогичную величину для Западной Европы — Восточная Европа генетически более разнообразна. Её промежуточное географическое положение между Западной Европой и Сибирью (где межпопуляционные различия максимальны) соответствует и промежуточным значениям разнообразия GST.
КАРТЫ ГЛАВНЫХ КОМПОНЕНТ
Главные черты генофонда, основные сценарии его пространственной изменчивости выявляются картами главных компонент. Этот метод позволяет вычленить ведущее направление изменчивости генофонда (показываемое первой компонентой), второе по значимости (вторая компонента) и остальные закономерности (третья и последующие компоненты).
ПЕРВЫЙ СЦЕНАРИЙ. Первая главная компонента по классическим маркёрам демонстрирует тренд изменений генофонда в направлении «запад<=>восток». В Восточной Европе выделяются западная и восточная группы популяций, генетические различия между которыми и вызывают долготную изменчивость. Первая главная компонента по ДНК маркёрам также показывает различия между западной и восточной половинами региона. Первая каноническая переменная признаков антропологии (соматологии) выявляет постепенные изменения физического облика населения с запада на восток. На этих же антропологических признаках основана расовая классификация (европеоиды, монголоиды, более дробные и переходные расы). И изменчивость с запада на восток легко понять, поскольку чисто европеоидное население распространено в западной части региона, а восточная часть населена популяциями с той или иной степенью монголоидной примеси. Первая главная компонента по дерматоглифике также выявляет долготную изменчивость. И та же долготная изменчивость показана первой главной компонентой изменчивости частот гаплогрупп митохондриальной ДНК.
Итак, основной закономерностью генофонда народов Восточной Европы является долготная изменчивость (по оси «запад<=>восток»). Этот тренд интерпретируется как результат длительных смешений европеоидного и более монголоидного пластов населения, взаимодействия европеоидного и монголоидного (или уралоидного) миров. Напомним, что для русского генофонда выявлено прямо противоположное направление главного сценария — по оси «север<=>юг». Причём оно также подтверждено пятью очевидцами.
ВТОРОЙ СЦЕНАРИЙ. Вторая по значимости компонента изменчивости выявляет иной тренд в восточноевропейском генофонде: в широтном направлении «юг<=>север» по ДНК маркёрам и «юго-восток<=>север» по классическим маркёрам. Опять-таки вторые компоненты и по классическим, и по ДНК маркёрам показывают сходную картину (вторые сценарии по антропологии и дерматоглифике показывают те ландшафты, которые по данным «обеих генетик» отошли на третье место, в третьи сценарии). Итак, крайние значения второй компоненты располагаются в южных, степных районах, и постепенно изменяются по направлению к северной, лесной полосе. Это можно понять как отражение влияния кочевых степных народов.
ТРЕТИЙ СЦЕНАРИЙ. Карты третьих главных компонент по классическим и ДНК маркёрам (и вторая компонента соматологии) более сложно устроены. Они выявляют четыре ядра экстремумов по периферии, а в центральной области промежуточные значения. Таким образом, трёхмерное представление этих карт имеет форму седла. При этом седловина (центральная область смешений групп населения, относящихся к этим ядрам) расположена в Волго-Окском междуречье.
Сходство сценариев по разным типам признаков имеет важное методическое значение.
НЕТ ЭФФЕКТА ЛОЖНЫХ КОРРЕЛЯЦИЙ!
Отметим ещё один важный методический результат. Антропологические данные помогли ответить на вопрос: не внёс ли эффект ложных корреляций искажения (см. Приложение) в карты главных компонент генетики? Полученные результаты убедительно свидетельствуют, что для генофонда Восточной Европы (как и для русского генофонда) такого искажения нет!
Напомним, что карты главных компонент антропологических признаков (соматологии и дерматоглифики) построены «прямым» путём: по уже заранее статистически рассчитанным значениям главных компонент. Поэтому они объективны и в принципе не могут содержать ложных корреляций. Карты генетики (аутосомные ДНК маркёры и классические) из-за того, что разные популяции изучены по разным генам, построены иначе — главные компоненты рассчитаны «косвенным» путём — по картам отдельных генов. В этом случае эффект ложных корреляций может исказить пространственные закономерности. Если же «прямые» карты антропологии и «косвенные» карты генетики совпадают, то тогда и карты по генным маркёрам также должны быть признаны полностью объективными.
Полученный результат является сильным аргументом в пользу принципиальной правильности метода расчёта главных компонент по интерполированным значениям. Возможно, интерполяция может приводить к ложным корреляциям и тем самым вносить некоторую погрешность в карты главных компонент, однако величина этой погрешности в нашем эксперименте оказалась неощутимо малой, в отличие от того, что предполагалось в критических работах [Sokal et al., 1999а, Ь]. Этот результат важен методически: с помощью мультиокулярного подхода при изучении любых регионов можно проводить аналогичную проверку — сравнение карт главных компонент, рассчитанных «прямым» и «косвенным» путями.
Аналогичное совпадение карт главных компонент, рассчитанных «прямым» и «интерполяционным» методами, мы получили и для русского генофонда (по гаплогруппам Y хромосомы и по фамилиям). В обоих массивах данных каждая популяция изучена по всем маркёрам, и это позволяет провести анализ как «прямым» так и «косвенным» методом. Карты главных компонент по Y хромосоме, рассчитанные двумя методами, практически идентичны — коэффициент корреляции составил 0.997 [Balanovsky et al., in print]. Аналогично, корреляция между картами главных компонент русских фамилий, рассчитанных по исходным и по интерполированным данным, составила 0.963 [Балановский и др., 2001]. Таким образом, в каждом случае, когда можно провести прямую проверку, мы убеждаемся в корректности расчёта главных компонент по интерполяционным картам отдельных признаков.
КАРТЫ ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ
Ещё одна группа результатов получена с помощью карт генетических расстояний. Каждая карта сравнивает все восточноевропейские популяции с одним из субгенофондов Восточной Европы: индоевропейской, уральской и алтайской языковых семей. Карты расстояний дополняют и уточняют закономерности, обнаруженные картами главных сценариев. Например, второй сценарий позволил выдвинуть гипотезу о влиянии степных народов на восточноевропейский генофонд. Эти народы относятся к алтайской языковой семье. Поэтому карта генетических расстояний от алтайской семьи проверяет эту гипотезу. Она подтвердила влияние «степного мира» и выявила, что это влияние сравнительно ограничено и восточноевропейский генофонд сформировался главным образом на основе народов двух других лингвистических семей — индоевропейской и уральской. Вероятно, это объясняется более поздним приходом на территорию Восточной Европы большинства племён, говоривших на тюркских и монгольских языках, а поэтому их меньшим участием в формировании восточноевропейского генофонда.
Главное, что показали карты генетических расстояний: восточноевропейский генофонд составлен из взаимопроникающих генофондов индоевропейской (на западе) и уральской (на востоке) языковых семей. Обширные срединные территории Восточной Европы демонстрируют примерно одинаковую близость к этим генофондам, являясь итогом их длительного взаимодействия.
МУЛЬТИОКУЛЯРНЫЙ ПОДХОД: СРАВНЕНИЕ СВИДЕТЕЛЬСТВ ОЧЕВИДЦЕВ
Если все главные закономерности (первая и вторая главные компоненты) выявлены как по ДНК, так и по классическим маркёрам, такое совпадение результатов позволяет быть более уверенными в реальности этих закономерностей. Это и есть «мультиокулярный» подход — независимый, параллельный анализ по разным типам признаков и потом сравнение полученных результатов. Каждый тип признаков выступает в роли свидетеля, каждый неидеален, с теми или иными недостатками своего видения структуры генофонда. Но если показания разных свидетелей сходятся, это доказывает истинность восстановленной картины событий.
Рассмотрев первые компоненты по всем типам признаков, необходимо отметить, наконец, их удивительное сходство. Пять типов признаков — соматология, кожные узоры, белковый, аутосомный и митохондриальный ДНК полиморфизм относятся к разным проявлениям биологии человека, изучены в разные годы XX века в разных популяциях, но обнаружили одну и ту же ось, общую для народонаселения Восточной Европы. Карты всех пяти типов признаков можно уподобить вариациям на одну тему, заданную древними ареалами двух крупнейших рас.
Любопытно, что эту закономерность во всех случаях выявляют первые, наиболее значимые компоненты. Заслуживает внимания не только сам факт долготной изменчивости, но и постоянность его выявления, и неизменно первое место, занимаемое им среди прочих трендов. В нашем случае, все типы маркёров оказались равноуспешны в выявлении этого основополагающего тренда. В других же, менее значимых трендах (выявляемых вторыми и третьими компонентами) можно говорить о чувствительности различных типов маркёров к «своим» событиям этнической истории.
Результаты этой главы показывают сходство разных типов признаков в главных направлениях изменчивости и различия во многих существенных деталях, при этом различия вряд ли могут быть объяснены случайными статистическими ошибками. Такой вывод заставляет размышлять о неравноценности признаков и их типов в популяционных исследованиях, причём оборотной стороной неравноценности является незаменимость каждого типа признаков. Разнообразие признаков и обобщённость подхода кажутся нам залогом успеха и основным свойством «мультиокулярных» исследований.
ПОСТЕПЕННОСТЬ
У всех рассмотренных карт есть общая черта — их плавность, постепенность перехода от минимальных к максимальным значениям. Огромные пространства заняты промежуточными значениями. Противоположный случай чёткой зональности выявлен, например, в генографическом исследовании Кавказа [Балановская и др., 1999], где средние значения занимают не огромные пространства, а идут узкой, как лезвие ножа, полосой вдоль главного Кавказского хребта. Возвращаясь к Восточной Европе, констатируем причину плавных трендов — интенсивное взаимодействие, перемешивание, метисация, миграции различных групп, характерные для этого региона с древнейших врёмен.
ДОЛГОТНЫЙ ТРЕНД
Анализ межпопуляционного разнообразия выявил гетерогенность восточноевропейского генофонда, наличие важных различий между популяциями. «Главные сценарии» выявляют, что эти различия идут по оси «запад<=>восток», и сформировались благодаря взаимодействию двух составляющих генофонда, которые интерпретируются как европеоидный и монголоидный пласты населения. Это антропологическая классификация. Карты генетических расстояний также демонстрируют сложение восточноевропейского генофонда на основе расселённой на западе индоевропейской и на востоке уральской языковых семей. Это уже лингвистическая классификация.
Учитывая значительный параллелизм (в ряде случаев приводящий к перекрываниям) между антропологической и лингвистической классификациями, можно утверждать, что и главные компоненты, и генетические расстояния выявили для восточноевропейского генофонда одну и ту же закономерность долготной изменчивости. Эта закономерность (изменчивость «запад<=>восток») является отражением в генофонде одних и тех же событий в истории его формирования, в этнической истории населяющих Восточную Европу народов. И в таком случае встаёт вопрос о природе этих событий этнической истории, о том, какие именно процессы вызвали к жизни эту основную для восточноевропейского генофонда закономерность.
Необходимо оговориться, что, конечно, долготная изменчивость не является единственной закономерностью восточноевропейского генофонда. Результаты данного исследования свидетельствуют о наличии также иных трендов. Примером может служить изменчивость вторых главных компонент, отражающих влияние степных народов. Это же влияние отражено и на карте генетических расстояний от алтайской семьи. Также существуют и частные закономерности в изменчивости отдельных генов, нередко ярко отражающих более частные события формирования восточноевропейского генофонда. Важной характеристикой восточноевропейского генофонда является и полученная нами общая оценка его дифференциации и другие выявленные закономерности.
Однако именно долготная изменчивость, взаимодействие западных и восточных групп населения является наиболее яркой чертой портрета генофонда народов Восточной Европы, основной закономерностью его изменчивости. История восточноевропейского населения богата событиями миграций, смешений разнородных групп, происходивших на протяжении длительного времени формирования восточноевропейского генофонда. Многие из этих переселений проходили по оси «запад<=>восток» и оказывали при этом довольно значительное влияние на общую структуру населения — поэтому, в принципе, любое из этих событий (или все они вместе) могут оказаться искомым фактором, сформировавшим долготную изменчивость.
Так, в неолите таким событием являлось, например, проникновение с востока монголоидного (или урало-идного) населения по лесной полосе Европы, в начале нашей эры — нашествие гуннов, давшее толчок Великому переселению народов, а почти тысячелетием позже славянская экспансия коренным образом повлияла на этнический состав восточноевропейского населения. Наконец, в последние три-четыре столетия демографические и этнические сдвиги в структуре восточноевропейского населения вызваны, главным образом, экспансией русского народа, включавшего в свой состав многие «инородческие» группы населения, что, на фоне резкого демографического роста, не могло не сказаться самым существенным образом на общей структуре восточноевропейского генофонда.
Этот перечень не является, разумеется, перечислением всех событий, которые могли бы вызвать долготную изменчивость, — он лишь служит иллюстрацией того, как много исторически документированных миграций могут претендовать на роль этого структурообразующего фактора. При этом представляется наиболее вероятным, что долготная изменчивость в восточноевропейском генофонде не является результатом какого-то одного из этих событий, но общим итогом их совместного действия.
О РУССКОМ ГЕНОФОНДЕ
Карты генетических расстояний показывают положение русского генофонда в этом, ставшим теперь нам понятным, генофонде восточноевропейского региона. К русскому генофонду генетически близкими оказалось большинство популяций восточной Европы. Но на восток (к Уралу), на юг (к Кавказу) и на север (к побережью полярных морей) популяции всё менее сходны с русским генофондом. А наиболее сходно население средней полосы Восточной Европы — от Белоруссии на западе до средней Волги на востоке. То есть русский генофонд оказывается центральным в восточноевропейском генофонде, близким к самым разным группам восточноевропейского населения — и к западным, и к восточным. Но больше всего русский генофонд похож на остальные восточнославянские генофонды, что указывает на его происхождение от восточнославянских элементов, а также и от других субстратных групп.
Иными словами, русский генофонд сформирован той частью восточных славян, которая вобрала в себя другие группы восточноевропейского населения и стала центральной составляющей генофонда Восточной Европы.
Глава 9. РУССКИЙ ГЕНОФОНД В МАСШТАБЕ ЕВРАЗИИ
В предыдущей главе рассмотрено положение русского генофонда в генофонде Восточной Европы. Тем самым определено «относительное» положение русского генофонда — относительно его соседей. Привязкой же к «абсолютной» системе координат было бы решение вопроса о месте русского генофонда в системе народонаселения всей ойкумены. Это могло бы показаться необоснованной претензией на общемировую значимость генофонда лишь одного народа — если бы не обширность (в мировом масштабе) тех территорий, население которых оказалось связанным с этнической историей русского народа.
Поэтому логическим продолжением является выход нашего исследования — вслед за потоками русской колонизации — за Урал, за пределы Европы. Важно понять, что могла изменить масштабная экспансия русского народа в генофондах столь крупных частей ойкумены, как Сибирь, Средняя Азия, Кавказ, Дальний Восток. Ведь хорошо известны аналогичные изменения населения всего остального мира в результате экспансии западноевропейских народов. Генетические итоги экспансии восточноевропейских народов ещё ждут своих биографов. Нас же, прежде всего, интересует место русского генофонда в общей картине народов ойкумены. При этом важно по-прежнему брать характеристики русского генофонда в пределах его «исконного» ареала — только тогда мы сможем увидеть исходный облик русского народа (ибо расселение на новых территориях меняло и его, а не только коренные народы нового ареала) и понять, какое генетическое положение он занимал до начала широкой экспансии. Геногеографический анализ населения Северной Евразии — и всей Евразии в целом — может помочь в решении этой задачи.
9.1. ПРОСТРАНСТВО И ВРЕМЯ СЕВЕРНОЙ ЕВРАЗИИ
Северо-евразийская «ойкумена» — Два полюса: западный и восточный — Два ствола человечества
§ 1. Время верхнего палеолита: Как заглянуть в прошлое? — Необычный банк данных — Двадцать тысяч лет спустя — Единый взгляд на Евразию — Две эпохи палеолита — Где и сколько съедали мамонтов? — Начало конца палеолита — Было два мира — Конец палеолита — Третий мир смешений — Время сближаться Европе и Сибири — Истоки генофонда
§ 2. Пространство современного населения: Северная Евразия — Главный сценарий — Вновь встреча запада и востока — Живое наследство палеолита — Разнообразнее всех в мире! — Карта разнообразия внутри популяций — Карта разнообразия между популяциями — Русские в Евразии
Есть два прошлых: прошлое, которое было и которое исчезло, и прошлое, которое и сейчас для нас есть как составная часть нашего настоящего.
Н. А. БердяевВ этом разделе мы рассмотрим некоторые итоги прежних работ — те достаточно надёжные выводы, которые были сделаны о генофонде народонаселения Северной Евразии. Геногеографическое изучение этого региона проводится уже немало лет, и именно изучение генофонда во «всесоюзном масштабе» было одной из черт отечественной геногеографической школы. Зарубежные генетики не имели легкого доступа к данным по популяциям Советского Союза; разработка этих данных велась научной школой профессора Ю. Г. Рычкова независимо, последовательно и творчески.
Для советских генетиков Северная Евразия вынужденно становилась всей ойкуменой. Влияния государственной идеологии на науку было невозможно избежать. Например, в компьютерные картографические программы граница СССР была «зашита» так же прочно, как очертания континентов. И невозможно вычеркнуть этот период из истории отечественной науки. «Железный занавес» — государственная граница СССР — действительно тогда воспринимались как граница осязаемого мира, граница «местной» ойкумены.
Тем большее внимание уделялось геногеографическому описанию этой ойкумены: различиям между её отдельными частями, с одной стороны, и поиску всеобщих для неё закономерностей, с другой. К счастью, «северо-евразийская ойкумена» действительно огромна — и по бескрайности ареала, и по несметному числу народов, в ней обитающих, и по драматическому столкновению-слиянию двух крупнейших рас — западного и восточного стволов человечества — на протяжении его долгой истории.
Наиболее ярким результатом, полученным нами ранее, явилась карта первой главной компоненты генофонда Северной Евразии, которая выявляла одновременно и два «полюса» в народонаселении, и единую закономерность их перетекания друг в друга. Но этот главный тренд современного генофонда — далёко не единственный результат многолетнего геногеографического изучения. К тому же параллельно главные тренды для иных регионов мира были получены и ведущей мировой геногеографической школой Луиджи Луки Кавалли-Сфорца. Но в чём отечественная геногеографическая школа, несомненно, добилась удивительного и до сих пор никем не повторённого успеха — это в изучении закономерностей не современного, а древнего, верхнепалеолитического генофонда [Грехова и др., 1996; Балановская и др., 2003]. Благодаря этим исследованиям, для северо-евразийского генофонда мы имеем данные не только о его современном состоянии, но и о его далёком прошлом. Поэтому этот «североевразийский раздел» мы построим хронологически: от палеолитического генофонда (раздел 9.1.1) к современному (раздел 9.1.2).
§ 1. Время верхнего палеолита
От жизни той, что бушевала здесь,
От крови той, что здесь рекой лилась,
Что уцелело, что дошло до нас?
Ф.И. ТютчевОткуда можно получить данные о генофонде прошедших эпох? Прямой метод — изучение дошедших до нас биологических образцов — развивается в последние годы в виде анализа ДНК наших предков (палеоДНК). Это направление начинает преодолевать стоящие на его пути огромные методические сложности. Уже сейчас оно пытается преодолеть и главное ограничение — доступность для анализа не массовых выборок, а единичных образцов. Но для изучения прошлого генофонда есть и иной путь. Это анализ всего массива археологических данных, то есть находок культуры человека, а не его самого. Преимущество этого пути в том, что археологически данные неизмеримо обширнее и лучше разработаны, чем любые данные по палеоДНК. Недостаток этого пути — такие данные свидетельствуют о материальной культуре древнего населения, а не о его генофонде. Хотя, бесспорно, что связь между археологическими культурами и генофондами носителей этих культур велика и несомненна [Долуханов, 2000].
Однако главная сложность, стоящая на этом пути — полная неясность того, какими же методами надо анализировать археологические данные, чтобы извлечь из них информацию о генофонде?
КАК ПРОНИКНУТЬ В ПРОШЛОЕ ГЕНОФОНДА?
Один из способов — как заглянуть в прошлое генофонда с помощью археологии — был предложен одним из авторов этой книги. Каково снаряжение и пути этой непростой «экспедиции» в прошлое?
1. Исследование строится на анализе не «археологических культур», а элементарных признаков материальной культуры. Не говоря о том, что само понятие «археологической культуры» неоднозначно и подвергается критике, выделение той или иной археологической культуры и её ареала является результатом индивидуального обобщения археолога. Такое обобщение субъективно и не обязательно для всех членов археологического научного сообщества. Выделение же элементарных признаков материальной культуры — будь то характер обработки камня, кости или типа жилища — унифицировано и одинаково для всех археологов. Поэтому по таким элементарным признакам можно объективно «просканировать» все археологические памятники[53].
2. Анализируется тотальный массив археологических данных. В анализ включаются не отдельные (самые яркие) черты тех или иных археологических памятников, а вся совокупность элементарных археологических признаков. Это означает, что по единому перечню таких признаков описывается каждый памятник верхнего палеолита Северной Евразии.
3. Анализ «фонда археологических данных» проводится теми же методами, что и анализ генофонда. Так же, как и во всех предыдущих главах, сначала строятся «простые» карты распространения каждого отдельного археологического признака, и затем уже на основе простых карт строятся обобщённые карты. Это означает, что одни и те же подходы применяются и к археологии, и генетике на всех этапах анализа: сначала мы выделяем элементарные признаки археологии и генетики; затем по каждому признаку тестируем все возможные памятники или популяции; потом строим «простую» карту распространения каждого признака археологии или генетики; и, наконец, по совокупности этих карт создаём обобщённые карты и для археологии, и для генофонда. Тренды обобщённых карт рассматриваются как ведущие закономерности всего массива археологических данных — так же, как и для генофонда (признаков антропологии, фамилий, классических и ДНК маркёров) тренды обобщённых карт рассматриваются как ведущие закономерности генофонда. Только такое полное сходство картографической технологии и позволяет «перебросить мостик» не только между науками, но и между древностью и современностью.
4. Предполагается, что эти выявленные закономерности в географической изменчивости материальной культуры отражают и изменчивость генофонда населения, оставившего эту культуру. Неизбежные расхождения между археологической культурой населения и самим населением считаются частными случаями и выносятся за скобки. Мы можем себе это позволить, изучая бескрайнюю «североевразийскую ойкумену»: исключения из этого правила начнут проявляться лишь при переходе к намного более частным регионам. Главный постулат — наличие в общем случае связи между материальной культурой и генофондом: если материальная культура на двух территориях различна, то мы вправе предполагать, что и генофонд населения различается, если материальная культура сходна — будем считать сходными и генофонды.
Таков предложенный подход. Посмотрим, как конкретно он был реализован, и каковы оказались результаты.
НЕОБЫЧНЫЙ БАНК ДАННЫХ: «ПАЛЕОЛИТ РОССИИ»
Прежде всего, надо было создать такой банк археологических данных, который бы позволил реализовать наш способ «заглядывания» в прошлое. Необычность банка в том, что археологи не склонны к сканированию все своих памятников по всем признакам — требования формализации, унификации и прозрачности скорее свойственны естественным наукам и их подходам. Поэтому надо было начинать с самого начала: формализовать признаки (аналогично формализации в генетике), разработать оптимальный «реестр» признаков, провести по нему унифицированное описание и т. д. Эта работа состояла их трёх этапов.
ШАГ ПЕРВЫЙ
На первом этапе создания банка был разработан универсальный для палеолита Северной Евразии реестр ведущих признаков, создающий достаточно полный портрет памятника материальной культуры [Балановская и др., 2003]. Этот реестр (см. анкету на рис. 9.1.1) был создан в результате самого тесного сотрудничества археолога (Л. В. Греховой) и генетика (Е. В. Балановской). Его главные черты, перечисленные ниже, обеспечивали возможность «перекинуть мост» между археологией и геногеографией.
Рис. 9.1.1. Анкета, использованная для создания банка данных «Палеолит России».
Каждый памятник культуры верхнего палеолита в Северной Евразии был описан с помощью этой стандартной анкеты.
1. УНИВЕРСАЛЬНОСТЬ. По каждому пункту анкеты тестируются памятники всего региона.
2. ЗАДАННЫЙ МАСШТАБ ПРИЗНАКОВ. Масштаб признаков должен соответствовать масштабу и специфике региона. Это означает, что реестр признаков, используемых при картографировании палеолита всей Северной Евразии, должен отражать лишь его наиболее «всеобщие» черты. При изучении локальных регионов (например, Волго-Окского или Кавказского) набор признаков стал бы менее универсальным и отражал бы специфику культуры данного региона.
3. РАЗДЕЛЕНИЕ ОБЩЕГО И ЧАСТНОГО. При заданном масштабе признаков необходимо выявить их иерархию — общее, частное и единичное в культуре региона. Общие признаки рассматриваются как ведущие и помещаются в основную часть анкеты; частные признаки размещаются в разделе комментария и картографируются при необходимости дополнительного исследования; единичные признаки, характерные для отдельного памятника, анкетированию и картографированию не подлежат.
4. ФОРМАЛИЗОВАННОЕ ПРЕДСТАВЛЕНИЕ ВСЕХ ДАННЫХ. Для картографируемых признаков допустимы лишь два вида представления информации: качественное (есть, нет) или количественное (сколько).
5. ОБЪЕКТИВНОСТЬ ДАННЫХ, т. е. независимость от научной позиции и предпочтений анкетирующего. Такие важнейшие параметры, как, например, распространение комплексов орудий или учёт таксономической неравноценности признаков, преднамеренно в анкету не включаются, так как зависят от рабочей гипотезы эксперта.
ШАГ ВТОРОЙ
На втором этапе создания банка данных по каждому пункту анкеты известным археологом (занимающимся именно палеолитом России) Людмилой Вадимовной Греховой был проведён скрининг каждого верхнепалеолитического памятника, изученного на территории Северной Евразии. Эта работа огромна и по масштабу, и по тщательности подхода. Разработанная нами анкета была разослана всем ведущим археологам России, и все их предложения были учтены. Невероятные трудности были связаны с тем, что подход «каждый памятник — по всем признакам» не принят в археологии. Зачастую в публикациях указываются только самые яркие и уникальные черты памятника. Чтобы получить сведения о многих других «всеобщих» признаках, Л. В. Греховой приходилось отыскивать в архивах указания на наличие или отсутствие этих признаков в каждом памятнике. Если всё же не удавалось найти такие данные, то археологический памятник не включался в банк данных.
Для того, чтобы перейти от описания памятников палеолита к созданию Атласа палеолита, надо было специально разработать компьютерный Банк данных, способный не просто «вместить» эту информацию, но и оперативно работать с ней, выбирая и комбинируя любые параметры — от положения в пространстве и времени до комплексов признаков.
Банк состоит из шести разделов:
10) ПРОСТРАНСТВО: географические координаты, формализованные административные координаты, привязки к горной или речной системе.
11) ВРЕМЯ: абсолютные и относительные датировки, минимальная, максимальная, средняя и средневзвешенная радиокарбо-новые датировки с учётом и без учёта надёжности датирования.
12) ПРИЗНАКИ: ведущие признаки каменной и костяной индустрии, искусства, жилища, фауны.
13) КОММЕНТАРИИ: дополнительные и частные признаки.
14) ИСТОЧНИКИ ИНФОРМАЦИИ: исследователи, библиография, архивы и т. д.
15) КОМПЛЕКСЫ ПРИЗНАКОВ: формирование на основе информации других разделов БД.
С помощью первых двух разделов можно оперативно отбирать для картографирования информацию заданного пространственного и временного среза при заданной надёжности данных. Карты построены для ведущих признаков: по частотам их встречаемости или же по параметру «есть-нет».
Итак, этот банк данных является пионерским в том плане, что впервые археологическая информация представлена в формализованном виде по всему огромному региону: каждый памятник палеолита охарактеризован значениями единого набора показателей.
ФОРМАЛИЗАЦИЯ ГУМАНИТАРНЫХ ДАННЫХ
Преимущества и недостатки формализации сведений, накопленных гуманитарными науками, обсуждались неоднократно многими исследователями. И уже давно очевидно, что этот шаг вполне закономерен (достаточно взглянуть на коллективный труд Института этнологии и антропологии РАН «Народы и религии мира», чтобы убедиться, что важным достоинством этого справочника является описание всех народов по единому, формализованному плану). Но при аналогичном описании всех археологических памятников по универсальному плану пришлось преодолевать немалые трудности. Они были связаны с тем, что, описывая памятник палеолита, исследователи подчеркивали его особенности, те или иные черты, представляющие для них наибольший интерес, а многие общие характеристики памятника ускользали от внимания и выпадали из описаний.
Тем не менее, эту работу по формализованному описанию всех верхнепалеолитических памятников Северной Евразии удалось выполнить [Грехова и др., 1996; Балановская и др., 2003] и поместить в Банк данных. Банк содержит информацию по орудиям из камня и из кости, произведениям искусства, животным — объектам охоты. И теперь, наконец, мы можем проследить, как меняются этих важнейшие черты материальной культуры на огромном пространстве (Северной Евразии) и в огромном диапазоне времени (двух эпох верхнего палеолита, 15 тысяч лет).
КАРТЫ ДВУХ ЭПОХ
Для каждого признака построены по две карты его распространения: одна для основного этапа верхнего палеолита (26–16 тысяч лет назад), вторая — для финального этапа верхнего палеолита (15–12 тысяч лет назад).
Конечно, хотелось бы разделить верхний палеолит на большее число этапов и построить карты для каждого периода наступания и отступания ледников. Но здесь мы ограничены самим объёмом исходных археологических данных. Например, весь основной этап палеолита представлен 65 памятниками бескрайней Северной Евразии — их датировки различны, но все укладываются в этот диапазон (26–16 тысяч лет назад). Если же выделять более дробные периоды, то каждый из периодов будет представлен лишь немногими памятниками, и из-за недостатка исходных сведений карты утратили бы достоверность. Но чем ближе к современности, тем больше объём данных. Так, три последних тысячелетия палеолита (15–12 тысяч лет назад) в банке представлены уже 93 памятниками, и этого достаточно для построения отдельных карт для этого финального этапа верхнего палеолита.
КАРТА МАМОНТА
Однако наша задача — увидеть главные культурные провинции прошлого, а не грани отдельных признаков. Поэтому для примера приведём лишь одну из множества «простых» карт (рис. 9.1.2).
Рис. 9.1.2. Карта частоты встречаемости костей мамонта на стоянках верхнего палеолита (26–16 тысяч лет назад).
Она показывает частоту встречаемости костей мамонта на стоянках наших предков, разбросанных по всему пространству Северной Евразии (исключая крайний север Европы — как показано на карте, он входил в верхнем палеолите в зону покровного оледенения). Очевидно, что эта карта в косвенном виде показывает нам ареал распространения мамонта. Но лишь в косвенном: если на каких-то территориях охота на мамонта не была обычным делом, то, хотя бы он там и водился, его кости вряд ли бы часто встречались на стоянках. И наоборот, даже на территориях, где мамонт был относительно редок, интенсивная охота на него (или — вообразим и такое — разведение одомашненного мамонта) привели бы к большому накоплению костей на стоянках. Впрочем, анализ этой и иных карт отдельных признаков лучше оставить специалистам — археологам и палеогеографам. Мы же перейдём к анализу всей совокупности карт.
КАРТЫ ОСНОВНЫХ ЗАКОНОМЕРНОСТЕЙ
Традиционные методы археологии обычно рассказывают о памятниках какой-то одной части Евразии. Компьютерные карты ведущих археологических признаков позволили математически строго обобщить унифицированные данные по всему простору Северной Евразии. Такие карты — новый источник информации о палеолите. Если бы нам удалось создать подобные археологические карты, двигаясь от древних ко всё более поздним эпохам вплоть до современности, мы сумели бы проследить динамику материальной культуры и, возможно, увидеть динамику генофонда в пространстве и времени.
Напомним, что карты строились для тщательно отобранных важнейших, универсальных «маркёров» верхнего палеолита. Следовательно, в совокупности эти карты описывают основные черты в изменчивости материальной культуры верхнего палеолита по всей территории Северной Евразии. И так же, как и для всех признаков — генетики, антропологии, фамилий — мы и для археологии палеолита рассмотрим его главные сценарии.
ГЛАВНЫЙ СЦЕНАРИЙ: 26–16 ТЫСЯЧ ЛЕТ НАЗАД
Карта первой главной компоненты изменчивости материальной культуры верхнего палеолита Северной Евразии на основном — и самом долгом — этапе верхнего палеолита (26–16 тыс. лет назад) приведена на рис. 9.1.3. Главный сценарий выявляет две резко различные культурные провинции: Европы и Сибири. Европейская провинция объединяет все памятники Восточной Европы, Приуралья и Кавказа. Большинство памятников Сибири также сходны между собой, но значения компоненты в Сибири совершенно иные, чем в Европе. Примерно по 70-му меридиану (посредине Западной Сибири) проходит узкая, как лезвие бритвы, граница. Эта граница разделяет Европейскую и Сибирскую верхнепалеолитические провинции. Такая чёткая закономерность (две резко различные археологические провинции, занимающие две чётко разграниченные области) нарушается лишь в одном месте карты: материальная культура населения Прибайкалья резко отлична от окружающей её культуры Сибирской провинции, и сближается по значениям компоненты с географически далёкой от неё Европой.
Рис. 9.1.3. Первая главная компонента изменчивости материальной культу ры на основном этапе верхнего палеолита (26–16 тысяч лет назад).
ГЛАВНЫЙ СЦЕНАРИЙ: 15–12 ТЫСЯЧ ЛЕТ НАЗАД
Такова была главная закономерность изменчивости материальной культуры на основном этапе верхнего палеолита (26–16 тыс. лет). Но времена меняются. Позже, на излете верхнего палеолита (15–12 тыс. лет) эта закономерность стала расплываться и терять свои резкие контуры (рис. 9.1.4). Конечно, в главном картина осталось прежней: одни экстремумы компоненты сосредоточены в Европейской части, противоположные значения — в Сибири. Но исчезла чёткая граница между двумя провинциями! Вместо неё обнаруживается широкая переходная область. Эта область настолько широка, что можно сделать вывод: если на основном этапе верхнего палеолита культурный мир Северной Евразии был двухчленным (Европа — Сибирь), то к концу верхнего палеолита культурный мир уже стал трёхчленным (Европа — безымянная переходная область — Сибирь).
Рис. 9.1.4. Первая главная компонента изменчивости материальной культуры на финальном этапе верхнего палеолита (15–12 тысяч лет назад).
Мы воздерживаемся здесь от каких-либо гипотез и объяснений полученного результата, оставляя их специалистам археологам. Мы вправе дать только генетическую интерпретацию. Подчеркнём два момента. Во-первых, эта переходная область сформировалось за счёт обеих провинций — огромная часть Сибири стала «переходной», но и заметная часть Европы приблизилась к «сибирским» показателям. Во-вторых, переходная зона является мозаичной, географически неупорядоченной, пёстрой, представляет собой калейдоскоп «сибирских», «европейских» и «промежуточных» оттенков.
ГЕНОФОНД ПАЛЕОЛИТА
Что же эти данные по материальной культуре палеолита могут сказать о генофонде древнего населения? Мы считаем, что эти данные однозначно свидетельствуют, что на основном этапе верхнего палеолита генофонд населения Европейской и Сибирской частей Северной Евразии резко различался. Это были два соседних, но изолированных генофонда. У археологии пока не хватает детальных данных, позволяющих генетикам оценить, насколько каждый из этих генофондов различался внутри себя. Но мы можем сказать, что такие генетические различия друг от друга «европейских» популяций, как и различия между «сибирскими» популяциями были существенно меньше, чем генетические отличия двух провинций — генофондов Европы и Сибири.
Позже, на финальном этапе верхнего палеолита (а в абсолютных датировках — 15–12 тысяч лет назад) произошли интенсивные миграции населения, которые привели к смешению этих двух генофондов и формированию промежуточного, смешанного генофонда. Это генетически промежуточное население заняло обширную зону, потеснив как сибирский, так и (в меньшей мере) европейский генофонд. Зона смешений была хотя и обширной, но ограниченной в пространстве: как на западе, в Европе, так и на самом востоке Сибири сохранились зоны, по-прежнему занятые «исходными», несмешанными генофондами.
НЕ СЛИШКОМ ЛИ СМЕЛО?
Иными словами, мы интерпретируем карты главной компоненты материальной культуры двух эпох (рис. 9.1.З., 9.1.4) так, как если бы они были картами генофонда! На чём основана такая уверенность? Мы можем предложить следующий ход рассуждений.
1. Материальная культура верхнего палеолита чётко делится на две зоны, Европейскую и Сибирскую, с резкой границей между ними. Следовательно, между этими зонами отсутствовали интенсивные миграции населения. Если бы миграции происходили, эти две зоны неизбежно обменивались бы элементами культуры и показатели культуры становились бы промежуточными, особенно в пограничной зоне — но мы этого не наблюдаем. Можно представить себе миграцию культуры без миграции населения. Но как представить себе миграции больших масс населения, не несущих элементов своей культуры? Итак, мы вправе предполагать, что массовых миграций населения — из Европы в Азию и обратно — не было.
2. Если между двумя зонами отсутствовали миграции населения, то эти зоны должны генетически ярко различаться. Конечно, теоретически можно представить, что генетически однородная масса населения расселилась по всей Северной Евразии, а уже после создала два различных типа материальной культуры. Против этого предположения говорит то, что предковые формы европейской и сибирской культуры считаются различными. А отсутствие «генетических» взаимосвязей между культурами, скорее всего, означает и отсутствие генетических (уже в биологическом смысле) связей между населением. Но даже если генофонды населения европейской и сибирской частей были бы у своих истоков генетически сходными, как две сестрёнки, то за долгое время самостоятельной жизни — при отсутствии общения — между ними с ходом времени сформировались бы различия за счёт дрейфа генов (эффекта основателя, популяционных волн). В условиях малых популяций охотников (для присваивающего хозяйства нехарактерны большие коллективы) и тесной зависимости от природы эти факторы были особенно велики, и они быстро сформировали бы различия между генофондами.
3. На финальном этапе верхнего палеолита на месте резкой границы между Европейской и Сибирской провинциями сформировалась обширная переходная область. Это вероятнее всего объясняется начавшимися интенсивными миграциями населения, которые привели к смешению типов материальной культуры и формированию промежуточного генофонда. Невозможно представить, что столь резкие изменения в ареалах культурных провинций не сопровождались бы миграциями населения. А миграции и формирование промежуточных культур почти однозначно свидетельствуют и о генетическом смешении между европейским и сибирским пластами населения. Разумеется, реальная картина должна была быть более сложной (сложная мозаика переходной области видна и на карте).
4. Наследство палеолита в современном генофонде. В § 2 мы покажем, что эта трёхчленная структура генофонда, сформировавшаяся на финальном этапе палеолита, без принципиальных изменений сохранилась вплоть до современности. А в разделе 9.2., рассматривая митохондриальный генофонд Евразии, мы вновь увидим пограничную зону между западноевразийским и восточно-евразийским генофондами. И один из сегментов этой пограничной зоны расположен в Западной Сибири — то есть там же, где некогда пролегала граница между двумя палеолитическими культурными провинциями и где на исходе верхнего палеолита стала возникать зона контактов населения. Это позволяет считать, что, благодаря созданию археологического Банка данных и геногеографическому анализу этой информации, удалось проследить — вплоть до палеолита — истоки главной закономерности в генофонде Евразии.
§ 2. Пространство современного населения
В идее бесконечного бытия заложено представление и о его бесконечной длительности, не ограниченной никакими пределами, поэтому оно неделимо, постоянно и единовременно целостно, и лишь в силу несовершенства нашего интеллекта в нём могут различаться прошедшее и будущее время…
Декарт.В предыдущем параграфе, анализируя данные археологии, мы получили представление о генофонде Северной Евразии в период верхнего палеолита. Мы увидели его протяжённым во времени. Каков же он сейчас, в его протяжённости в пространстве? Какова структура современного генофонда Северной Евразии? По сравнению с вопросом о древнем генофонде — это легкая задача. Для ответа мы воспользуемся картами главных компонент генофонда Северной Евразии. Карты главных сценариев верно служили нам во всей книге при анализе и русского генофонда, и генофонда Европы. Подобные карты для многих регионов мира созданы школой L. L. Cavalli-Sforza [Cavalli-Sforza et al., 1994]. Особенность карты генофонда Северной Евразии, приведенной на рис. 9.1.5., только в одном — она опирается на очень большой массив исходных данных.
Рис. 9.1.5. Первая главная компонента изменчивости современного генофонда (по 100 классическим генным маркёрам).
ИСХОДНЫЕ ДАННЫЕ
Карты современного генофонда Северной Евразии, неоднократно в разных вариантах публиковавшиеся нами [Рычков, Балановская, 1990, 1992; Балановская, Рычков, 1997; Балановская, 1998; Балановская, Нурбаев, 1999] основаны на данных о частотах ста аллелей тридцати классических генных локусов во многих популяциях Северной Евразии — на эти же маркёры мы опирались и при анализе восточноевропейского генофонда.
Использована информация банка данных GENE POOL, разработанного под руководством одного из авторов этой книги[54]. Банк включает почти все данные, полученные советскими исследователями народонаселения СССР. Такие исследования проводились в течение нескольких десятилетий не менее, а порой и более интенсивно, чем для других регионов мира. Но эти данные оказались рассеяны в большом количестве изданий, вышедших почти исключительно в пределах бывшего СССР, и поэтому труднодоступных для зарубежных исследователей. Например, в обобщающем геногеографическом исследовании народонаселения мира [Cavalli-Sforza et al., 1994] Северная Евразия представляет почти белое пятно — интерполяция на эту территорию проводится, но картографированные значения основываются на очень ограниченных исходных данных. Отечественный Банк данных, напротив, включает почти всю накопленную информацию: каждый из ста аллелей в среднем изучен в 162 популяциях (от 28 популяций по аллелю HLA*CW5 до 1200 популяций по системе АВ0).
ГЛАВНЫЙ СЦЕНАРИЙ СОВРЕМЕННОГО ГЕНОФОНДА
Карта первой главной компоненты (рис. 9.1.5.) выявляет основную закономерность в этом огромном массиве данных. И мы видим постепенное изменение генофонда в направлении с запада на восток.
Такая долготная изменчивость не первый раз встречается в нашей книге. Похожая картина была выявлена для генофонда Восточной Европы (части Северной Евразии), а теперь проявилась при увеличении масштаба исследования на уровне всей Северной Евразии. Более того, эту же закономерность мы обнаружили для генофонда Северной Евразии эпохи палеолита. Причём современный генофонд больше похож не на самый древний (рис. 9.1.3.), а на более близкий к современности финальный этап палеолита (рис. 9.1.4). Даже граница (точнее, широкая переходная зона) между западным и восточным современными субгенофондами проходит там же, где она проходила в верхнем палеолите — в Западной Сибири.
Эта карта генофонда получена по классическим генным маркёрам. В следующем разделе мы увидим, что и данные по изменчивости митохондриальной ДНК рисуют ту же картину генофонда Северной Евразии. Даже Западная Сибирь сохраняет свою роль зоны смешений — с примерно равными долями западно-евразииских и восточноевразийских гаплогрупп.
Строго говоря, корреляция между картами не может служить доказательством их преемственности. Но в данном случае наша гипотеза — отражения на этих трёх картах (рис. 9.1.3.-9.1.5.) реальной эволюции генофонда — имеет под собой солидное основание.
С методической точки зрения важен не столько полученный результат, сколько сама возможность сравнения карт разных эпох и разных признаков. Главным нам кажется то, что генетики, антропологи, этнографы, лингвисты, археологи могут найти общий язык — язык карты. И совмещая три отражения — в биологии человека, в его материальной и в его духовной культуре — мы, быть может, сумеем получить объёмное изображение единого процесса: истории Человека.
Эту изменчивость можно увидеть не только в виде отвлечённого числа, но и в реальном географическом пространстве — в виде долготного тренда. Причём древность этого тренда насчитывает не менее 20 тысяч лет. Таким образом, генофонд Северной Евразии с самых древних эпох своего существования состоит из двух взаимодействующих и взаимопроникающих субгенофондов.
Думается, мы не погрешим против истины, если — на правах правдоподобной гипотезы — соотнесём эти субгенофонды с европеоидной и монголоидной расами: эта гипотеза уже нашла подтверждение в анализе антропологических данных о населении и Восточной Европы (глава 8), и предварительных данных о Северной Евразии [Шереметьева и др., 2001]). Обширность «переходной зоны», расположенной в районе Урала и Зауралья, заставляет вспомнить гипотезу В. В. Бунака о существовании здесь третьей промежуточной, но при этом древней и таксономически самостоятельной уралоидной расы [Бунак, 1980; Перевозчиков, 2003]. У нас сейчас нет генетических данных, позволяющих привести надёжные аргументы за или против этой гипотезы, но исследования в этом направлении — одна из самых заманчивых перспектив геногеографии.
РАЗНООБРАЗНЕЕ ВСЕХ В МИРЕ!
Итак, в генетической изменчивости популяций Северной Евразии выявляется чёткая закономерность: изменения в генофонде следуют главным образом по оси восток<=>запад. При этом сам размах генетического разнообразия огромен: Северная Евразия занимает первое место среди регионов мира по общему разнообразию Нт и третье место — по уровню межпопуляционной изменчивости GST (табл. 9.1.1., см. подробно Приложение).
Таблица 9.1.1.
Генетические различия между этносами в регионе GST и общее генетическое разнообразие регионов мира Нт.
КАРТА ГЕТЕРОЗИГОТНОСТИ
И в заключение этого раздела заметим, что деление генофонда Северной Евразии на две части — далёко не единственное, что можно сказать о нём. Говоря лишь о долготном тренде, мы как бы сводим генофонд к важнейшей, но единственной оси. А в реальности генофонд никак не одномерный объект. И чтобы создать более объёмное представление о генофонде, приведём карту гетерозиготности (внутрипопуляционной изменчивости), построенную по тем же данным о классических маркёрах (рис. 9.1.6). Карта показывает постепенное уменьшение средней гетерозиготности с юго-запада к востоку и северу. По-видимому, это вызвано более интенсивным дрейфом генов в Сибири и на севере Европейской части. А дрейф в свою очередь объясняется меньшим эффективным размером популяций, что естественно для северных и восточных, сравнительно менее населённых территорий.
Рис. 9.1.6. Карта гетерозиготности современного генофонда (по 100 классическим генным маркёрам).
КАРТА РАЗЛИЧИЙ МЕЖДУ ПОПУЛЯЦИЯМИ
Продолжает «объёмный» образ генофонда карта межпопуляционного разнообразия (рис. 9.1.7). Если предыдущая карта рассказывала о разнообразии внутри каждой популяции (в каждой точке карты), то здесь мы видим средние различия между популяциями в данной области карты. В каждую точку карты занесены её генетические отличия от соседних точек, то есть межпопуляционная изменчивость в её окрестностях.
Рис. 9.1.7. Карта межпопуляционного разнообразия современного генофонда (по 100 классическим генным маркёрам).
Чтобы эти значения были достоверны, рассматривается довольно большая «окрестность». Кроме того, применена технология «меняющегося окна» (см. Приложение): размер «окна» (то есть окрестности, для которой проводится расчёт) автоматически растёт до тех пор, пока в него не попадёт заданное число изученных популяций. Если этого не сделать, а пользоваться окном постоянного размера, то межпопуляционная изменчивость зачастую будет рассчитываться лишь по интерполированным данным, что занизит её величину. В других регионах в «окрестности» точки могут оказаться популяции различных, хотя и соседних народов. Автоматический подбор окна важен и потому, что ареалы популяций (расстояние от одной популяции до другой) резко различны, например, на Кавказе и в Сибири. Если бы окно само не менялось, то в него в Сибири попали ли бы лишь малая часть популяций «малого» народа Сибири, а на Кавказе — сразу несколько народов. Ясно, что так мы бы получали несопоставимые величины для разных частей Евразии.
Итак, наша карта межпопуляционного разнообразия дает наиболее корректное представление о том, каков в разных частях Северной Евразии уровень различий между соседними популяциями. Мы видим, что в Восточной Европе, и в особенности на Украине, различия между популяциями очень малы. Средние различия между популяциями заметно выше в Казахстане и особенно высоко в горах и долинах
Средней Азии. Но главная зона больших различий между популяциями — это Сибирь и северный Урал. Мы не раз уже в этой книге упоминали о чрезвычайно высоком межпопуляционном разнообразии Сибири, а теперь видим его на карте.
Но карта показывает нам и нечто новое, что мы не знали при чисто статистическом анализе. Например, некоторое снижение разнообразия в восточных частях Сибири. Таким образом, карта межпопуляционного разнообразия расширяет наши знания о генофонде Северной Евразии, показывая, как меняется по территории этот важнейший показатель структуры генофонда.
РУССКИЙ ГЕНОФОНД В ЕВРАЗИИ
Нам осталось ответить ещё на один вопрос: где расположился русский генофонд относительно Евразии?
В двухчленной структуре генофонда Северной Евразии он целиком относится к его западной половине. Даже если рассматривать структуру североевразийского генофонда как трёхчленную (выделяя переходную зону), «исконный» русский ареал всё равно остаётся на территории западного, европейского субгенофонда, не заходя не только в восточную, но и в переходную зону. Значит, между русским населением и многими из тех народов, которые были вовлечены в орбиту растущей русской государственности, существовали действительно большие (в евразийском масштабе) генетические различия. Хотя при взгляде на карту главной компоненты нельзя не заметить, что нарастание этих различий, при движении на восток, идёт очень постепенно.
Русская экспансия не могла не изменить генофонд народонаселения Сибири и иных регионов Северной Евразии. Но вектор этих изменений был не нов — он полностью лежит на главной оси, вдоль которой, со времени палеолита, наблюдается основная изменчивость генофонда. Эти результаты важно учитывать при изучении современного населения Урала, Сибири, Средней Азии и Дальнего Востока. Широкое расселение русских на этих землях должно было сдвинуть «европейско-сибирское» равновесие в генофонде в европейскую сторону. Но (за исключением лишь силы этого сдвига) оно не могло внести кардинальные изменения в саму макроструктуру генофонда Северной Евразии.
9.2. ГЕОГРАФИЯ МИТОХОНДРИАЛЬНОМ ДНК В ЕВРАЗИИ
Филогеография и геногеография — Сёстры или соперницы? — Их совместный Атлас Евразии
§ 1. Евразийские карты мтДНК: Азиатская делеция В — Сибирские сёстры С и Z — Лев Востока D — Компас Рима Н — Ближневосточный полумесяц над Европой J — Пятнистый западник T — F родом из Индокитая — А это Азия и Америка — U4 это Uрал — Евразия в Африке M1 — Конструктор М7 «собери Азию» — М3: за 3 Моря в Индию — Космополит X — Морская К — От Индии до Урала U2 — Склонная к Европе U5a — Атлантида и USb — Восточноевропейская V — Извивы индийской змеи W
§ 2. Встреча запада и востока Евразии: Азиатские гаплогруппы — Не заходят в Европу — Европейские гаплогруппы — Вторгаются в Монголию, Сибирь и Индокитай — Стены и ворота Евразии
§ 3. Главные сценарии: А что мы теряем? — Полюса Винни-Пуха — Западный и Восточный — Все очевидцы согласны, что полюса притягиваются друг к другу — Но где же место их свиданий?
§ 4. Карты прародины гаплогрупп: Где искать прародину гаплогруппы? — Там где её много? Нет! — Там где она разная? Нет! — Там где много, где разная и где живут её предки!
О, я вас знаю, древний род
Лукавых дочек хитрой Евы!
БайронВ этом разделе мы рассмотрим евразийские ландшафты митохондриальной ДНК. Эта генетическая система уже несколько лет является основным инструментом популяционно-генетических исследований. Накоплен большой объём данных по изменчивости митохондриальной ДНК во многих популяциях на всех континентах, по этим данным сделано немало обобщений.
ФИЛОГЕОГРАФИЯ мтДНК
Дальнейшее интенсивное изучение мтДНК идёт по пути детального филогенетического анализа, основанного на полногеномных сиквенсах мтДНК[55] [Finnila et al., 2001; Herrnstadt et al., 2002; Behar et al., 2006; Palanichamy et al., 2004; Tanaka et al., 2004]. Эти данные позволяют очень подробно реконструировать «родословное древо» мтДНК, выделять множество гаплогрупп, разных по происхождению, и определять степень их «родства». Последующий анализ того, в каких популяциях встречаются те или иные гаплогруппы, каково их разнообразие и, следовательно, древность, позволяет выдвигать гипотезы о путях и времени миграций, которые сформировали эту наблюдаемую картину. Такую логику исследования обычно называют филогеографическим подходом к анализу мтДНК.
ГЕНОГЕОГРАФИЯ мтДНК
Первое, что тут бросается в глаза — такой путь чужд для классической геногеографии, в русле которой написана эта книга. Мы и не будем пытаться проводить здесь филогеографический анализ — таких работ немало, и их проводят лучшие специалисты в этой новой области науки. Этот путь уведёт нас далёко за рамки нашей книги. Мы попробуем сделать нечто иное — по-дойти к данным по митохондриальной ДНК с позиций геногеографии точно так же, как мы подходили в остальных главах к данным по классическим генетическим маркёрам, антропологии, фамилиям, археологическим признакам.
Да и данные по мтДНК и Y хромосоме мы уже анализировали для русских популяций и для Восточной Европы в «обычном» геногеографическом ключе. Теперь мы попробуем дать обычный геногеографический анализ изменчивости митохондриальной ДНК в масштабе почти всей ойкумены — для генофонда Евразии. Этот анализ преследует две цели.
Во-первых, внести в изучение мтДНК тот вклад, который геногеография, очевидно, может внести — создать картографический Атлас распространения гаплогрупп мтДНК в Евразии. Геногеографу сделать это намного легче, чем любому другому специалисту, поскольку он привык создавать базы данных, обобщая большие массивы накопленной информации, и поскольку он обладает технологиями и опытом картографирования генетических данных. Авторы надеются, что созданный Атлас, приводимый на этих страницах и доступный в более полном объёме в Интернете (), будет полезен как для специалистов, так и для всех интересующихся географией мтДНК.
Во-вторых, мы хотели выяснить соотношение между привычной для нас геногеографией и столь стремительно развивающейся «новой популяционной генетикой», получившей очень близкое название филогеографии. Ведь данные по мтДНК собраны в русле филогеографии, а их анализ мы проводим методами геногеографии — может ли быть удобнейший способ на деле понять сильные и слабые места обоих научных направлений, увидеть сходство и различия, а главное — найти возможности для их взаимного обогащения и сотрудничества? Авторы благодарят «филогеографов» Рихарда Виллемса и Томаса Кивисилда, познакомивших их с этой областью исследований.
ЭТАПЫ ГЕНОГЕОГРАФИЧЕСКОГО АНАЛИЗА
Как же именно провести геногеографический анализ для мтДНК? Мы прошли несколько этапов:
1) БАЗА ДАННЫХ. Все доступные опубликованные данные по популяциям Евразии были собраны в единую базу данных (описание см. Приложение, раздел 5).
Работа по сведению воедино всех опубликованных данных об изменчивости митохондриальной ДНК потребовала не одного года и продолжается по сей день под общим руководством Е. В. Балановской. Первые варианты базы данных составлялись О. П. Балановским и затем А. С. Пшеничновым в 2003–2005 годах, программную реализацию основных функций осуществил Ю. В. Пустовой. Современный вариант базы появился благодаря усилиям В. В. Запорожченко, взявшего на себя труд не только собрать практически все опубликованные данные, но и провести определение гаплогрупп для каждого образца с помощью разработанного им оригинального программного обеспечения. Эта задача унификации данных разных авторов и определения гаплогрупп — едва ли не самая трудная при создании базы данных, поскольку для большинства опубликованных данных имеется информация только о некодирующей части мтДНК (ГВС1), тогда как надёжное определение гаплогрупп возможно лишь при наличии достаточного набора данных по ПДРФ сайтам (SNP маркёрам) кодирующей части мтДНК. База данных, используемая в этой главе, содержит сведения по 67 000 образцов мтДНК, классифицированных в более чем 700 гаплогрупп, и включает также детальную характеристику тысячи изученных популяций.
2) «ПРОСТЫЕ» КАРТЫ. Созданы «простые» карты распространения основных гаплогрупп мтДНК.
Для выделения гаплогрупп мы воспользовались их современной филогенетической классификацией. По возможности картографировались не только основные гаплогруппы, но и их много более дробные подразделения. К сожалению (см. раздел 6.2.1.), отнесение данных по мтДНК к таким дробным гаплогруппам можно сделать далёко не всегда: для этого нужны детальный анализ ПДРФ маркёров кодирующей части мтДНК или даже полное сек-венирование мтДНК. А большинство имеющихся популяционных данных, увы, имеют «низкое разрешение»: включают лишь анализ ГВС1 и очень небольшое число ПДРФ маркёров. Поэтому и мы ограничены подробностью изученности мтДНК в основном массиве работ: большинство представленных здесь карт показывают распространение крупных гаплогрупп, а более дробное картографирование можно будет провести в дальнейшем, по мере роста числа таких данных «с хорошим разрешением». Карты отдельных гаплогрупп рассматриваются в § 1.
3) ОБОБЩЁННЫЕ КАРТЫ. Кроме карт отдельных гаплогрупп, проведен и обобщенный картографический анализ мтДНК. Построены обычные для геногеографии карты главных компонент. Кроме этого, картографирован и ряд других показателей, навеянных филогеографическим подходом.
Сюда относятся: карты, показывающие суммарную частоту для восточно-евразийских и для западно-евразийских гаплогрупп; карты разнообразия отдельных гаплогрупп, которые могут стать ценным инструментом при поиске зоны происхождения гаплогруппы. Этот последний тип карт, очевидно, является симбиотическим между геногеографией и филогеографией. Этим результатам посвящены § 2-§ 4.
4) АТЛАС мтДНК ЕВРАЗИИ. В результате картографирования создан Атлас географии мтДНК в Евразии. Мы называем его именно атласом, а не простым набором карт (см. главу 3), поскольку, во-первых, все карты сопоставимы, построены одними методами. Во-вторых, совместно они описывают все разнообразие мтДНК, все её основные гаплогруппы, характерные для Евразии. В-третьих, созданы также и обобщающие карты, являющиеся «лицом» атласа.
5) РУССКИЙ ГЕНОФОНД НА ПРОСТОРАХ ЕВРАЗИИ. Наконец, совокупность полученных результатов использована для анализа русского генофонда: показано его место в общем генофонде Евразии и построена карта генетических расстояний, показывающая, какие из евразийских популяций наиболее близки к русскому генофонду.
Итак, созданный Атлас изменчивости мтДНК в Евразии включает ряд разделов: 1) карты распределения в Евразии частоты каждой гаплогруппы; 2) карты разнообразия каждой гаплогруппы; 3) карты генофонда в целом — главных компонент, разнообразия, генетических расстояний. В этой книге приводятся многие, но не все, карты Атласа. Атлас будет доступен на нашем сайте , где в будущем будут появляться и обновленные версии Атласа, включающие — по мере появления данных — как новые изученные популяции Евразии, так и более дробные гаплогруппы мтДНК.
§ 1. Евразийские карты мтДНК
— Наверное, ты сделаешь и стрелку, которая всегда показывала бы на Рим?
— Нет, только на север, Цезарь.
У. Голдинг. «Чрезвычайный посол».Геногеографический анализ митохондриальной ДНК в Евразии мы начнём с географии отдельных гаплогрупп. Это самый простой и понятный подход, а построенные карты лежат в основе всех последующих видов анализа. Кроме самих карт, мы будем пользоваться таблицей частот гаплогрупп в регионах Евразии (табл. 9.2.1.) и схемой классификации гаплогрупп — их «родословным древом» (рис. 9.2.1).
УПРОЩЕННАЯ КЛАССИФИКАЦИЯ. Приводимая классификация упрощена и схематизирована по сравнению с современными знаниями о тонкой структуре глобального древа мтДНК. Рис. 9.2.1. — это именно схема, наглядно показывающая соотношения основных гаплогрупп и субгаплогрупп Евразии. Мы надеемся, она будет полезна тем читателям, которые не являются специалистами в анализе мтДНК, но нуждаются в общем представлении о гаплогруппах, встречающихся в Евразии.
Рис. 9.2.1. Упрощенная схема классификации (древо) гаплогрупп мтДНК.
РЕГИОНЫ. При описании карты каждой гаплогруппы мы будем называть те регионы, в которых гаплогруппа встречается чаще всего, и регионы, где её нет. Средние частоты гаплогрупп в регионах приведены в таблице 9.2.1.
Таблица 9.2.1.
Частоты гаплогрупп мтДНК в регионах Евразии
ТРИ ШКАЛЫ. Гаплогруппы очень разнятся по своей частоте: одни распространены с частотой выше 30 % по огромной территории, а иные встречаются с частотой всего в несколько процентов и на небольшом ареале. Поэтому мы будем пользоваться тремя разными шкалами:
Десятипроцентная шкала (для самых частых гаплогрупп): каждый интервал карты соответствует изменению частоты на 10 %. То есть самым светлым цветом показаны территории, где частота менее процента, следующим — частоты от одного до десяти процентов, а максимальный интервал — 50 % и выше.
Трёхпроцентная шкала: шаг шкалы намного меньше — только три процента. Первый (самый светлый) интервал опять показывает частоты ниже одного процента, второй интервал — от одного до трёх процентов, и максимальный интервал частоты выше 16 %.
Однопроцентная шкала: Наконец, для редких гаплогрупп мы будем пользоваться однопроцентной шкалой: первый интервал, как всегда, отмечает частоту ниже одного процента, второй интервал — от одного до двух процентов, а максимальный интервал — частоты выше шести процентов.
Итак, один и тот же цвет на разных картах может соответствовать совсем разной частоте. Но для всех карт, построенных в одинаковой шкале (например, однопроцентной), один цвет означает одну и ту же частоту. И чтобы облегчить сравнение карт, мы будем указывать, в какой из трёх шкал построена каждая карта. Сначала мы рассмотрим самые частые гаплогруппы (карты будут в десятипроцентной шкале) потом перейдём к тем, для которых оптимальна трёхпроцентная шала, и закончим уже не столь частыми гаплогруппами (их карты будут даны в однопроцентной шкале).
Наш обзор евразийских гаплогрупп неизбежно будет кратким и неполным: подробное рассмотрение семисот гаплогрупп потребовало бы отдельной и очень толстой книги. Но и здесь мы можем поговорить обо всех самых частых гаплогруппах Евразии, и — помня о русском генофонде — рассмотреть каждую из гаплогрупп, встречающуюся в русских популяциях со средней частотой выше одного процента.
Условившись об этом, начнём наш пробег по Евразии.
ГАПЛОГРУППА В (рис. 9.2.2.)
Гаплогруппа В изучается уже более двадцати лет, тогда как другие варианты мтДНК были описаны намного позже. Дело в том, что эта гаплогруппа имеет своеобразную особенность — делецию девяти нуклеотидов, в то время как обычно гаплогруппы отличаются одна от другой по мутациям только в отдельных нуклеотидах. Поэтому гаплогруппу В было легко отличать ещё до появления развитых методов ДНК анализа. И распространение так называемой «азиатской делеции» было хорошо изучено задолго до начала масштабных исследований изменчивости мтДНК.
Рис. 9.2.2. Карта распространения гаплогруппы В мтДНК в коренном населении Евразии.
Сейчас известно, что эта делеция происходила не однажды в истории человека и потому обнаруживается не в одной, а в разных гаплогруппах. Однако подавляющее большинство современных мтДНК, несущих эту делецию, являются потомками только одной «предко-вой» мтДНК. Все эти потомки совместно и образуют гаплогруппу, которая обозначается как В — ветвь ма-крогаплогруппы N.
Гаплогруппа В широко распространена в Восточной Азии (в среднем 22 %, табл. 9.2.1). Карту столь частой гаплогруппы мы приводим в десятипроцентной шкале (рис. 9.2.2). Мы видим, что максимальных частот — выше 30 % — гаплогруппа В достигает на юге Китая. Обширная зона чуть меньших, но всё ещё довольно высоких частот В (от 10 до 20 %) прилегает к побережью Тихого океана — от Вьетнама до Японии. К западу от побережья частота В постепенно снижается, так что в Сибири, Центральной Азии и Индостане составляет 2–3%. Ещё западнее — в Юго-Западной Азии и Европе — гаплогруппа В очень редка. Зато она является одной из пяти гаплогрупп, свойственных коренному населению Америки.
Общепринято мнение, что гаплогруппа В возникла на территории южного Китая 55–65 тысяч лет назад и широко распространилась по всей Азии. Примерно 20–25 000 лет назад она была принесена из Сибири в Америку и намного позже (в ходе заселения человеком Полинезии) на тихоокеанские острова.
ГАПЛОГРУППЫ С и Z (рис. 9.2.3. и 9.2.4.)
С и Z — две сестринские гаплогруппы. У них одно и то же происхождение (из общей ветви макрогапло-группы М) и они распространены на одной и той же территории. Поэтому их часто рассматривают вместе, называя такую сдвоенную гаплогруппу CZ. Эти варианты митохондриальной ДНК можно встретить в коренном населении Северной Азии, поэтому мы называем CZ «сибирской» гаплогруппой. Возраст гаплогруппы CZ оценивается в 60±19 тысяч лет [Yao et al., 2002].
Рис. 9.2.3. Карта распространения гаплогруппы С мтДНК в коренном населении Евразии.
Рис. 9.2.4. Карта распространения гаплогруппы Z мтДНК в коренном населении Евразии.
Гаплогруппа С — самая частая гаплогруппа в Сибири (около 32 % общего генофонда, табл. 9.2.1). Предполагается, что она также принесена в Америку первыми поселенцами около 20 000 лет назад. Её карту мы приводим в десятипроцентной шкале. Но даже в такой «мировой» шкале мы видим, что максимальный интервал не остаётся пустым — частоты С в некоторых сибирских популяциях превышают 50 %. Карта показывает максимальные частоты гаплогруппы С в Средней и Южной Сибири, но и в других районах Сибири и Центральной Азии её частота превышает 10 %, а с небольшой частотой гаплогруппа С встречается по всей Восточной, Центральной Азии, на Урале и Кавказе, отдельными анклавами в Индостане и Передней Азии. Легче сказать, где она пока ещё НЕ встречена — это западная Европа и Африка — а в любой другой части Старого Света гаплогруппа С не чувствует себя чужаком.
Гаплогруппа Z следует тем же закономерностям, но она встречается куда реже. Поэтому её карту мы приведём уже не в десятипроцентной, а всего лишь в однопроцентной шкале (рис. 9.2.4). То есть распространение гаплогруппы Z нам придется рассмотреть как бы с десятикратным увеличением по сравнению с её сестренкой С. В Сибири частота Z около 2 % и, вероятно именно из-за низкой частоты, её не взяли в Америку. В Восточной Азии частота гаплогруппы Z около 1 %. Также её можно встретить на севере и северо-востоке Европы, но в других регионах гаплогруппа Z практически полностью отсутствует (табл.
9.2.1). Карта показывает, что гаплогруппа Z распространена в Центральной и Восточной Азии, то есть несколько южнее своей сёстры. На общем фоне частот в один-два процента выделяются несколько пятен повышенной частоты — в южной половине Китая, на Камчатке, а также в Южной Сибири/Казахстане, откуда любопытный «рукав» тянется через всю восточную Европу к лопарям Скандинавии.
В другие места Европы, а также в Южную и Юго-Западную Азию гаплогруппа Z не заходит — за исключением яркого пятна (частота почти 5 %) в одной из популяций Пакистана, куда эту центрально-азиатскую гаплогруппу могли принести монгольские завоеватели, потомки которых — например, хазарейцы — до сих пор населяют часть Пакистана.
ГАПЛОГРУППА D (рис. 9.2.5.)
К этой гаплогруппе относится львиная доля митохондриального генофонда восточной половины Евразии. В Восточной Азии гаплогруппа D (16 %, см. табл. 9.2.1) входит в тройку самых распространённых. Она также типична для Северной Азии (23 %), занимая второе место по частоте после гаплогруппы С. Широко распространена она и в Центральной Азии. В других частях Азии и в Европе гаплогруппа D редка — частота не превышает 1–2%. Впрочем, в Европе, в регионе между Балтийским и Баренцевым морями находят специфический вариант гаплогруппы D (достигающий 5 % в некоторых популяциях).
Рис. 9.2.5. Карта распространения гаплогруппы D мтДНК в коренном населении Евразии.
Гаплогруппа D произошла, вероятно, 47±9 тысяч лет назад [Yao et al., 2002] и распалась на несколько подгрупп. Несомненно, что очертить изменчивость столь частой и древней гаплогруппы можно лишь в самой широкой, десятипроцентной шкале (рис. 9.2.5). Если обратиться к карте, то мы увидим, что частота гаплогруппы D плавно снижается с востока на запад: этот тренд тянется через всю Евразию — от Тихого океана до Атлантического. Также отмечается градиент второго порядка — частота D убывает к югу Евразии, по направлению к Индийскому океану.
У гаплогруппы D есть сестра — гаплогруппа G, живущая главным образом в Северной и Центральной Азии (5-10 % в среднем). За пределами этого региона G можно встретить в Китае — чаще на севере, чем на юге страны. Это тоже древняя гаплогруппа — возраст одной из её ветвей (G2) оценивается в 40–80 тысяч лет [Yao et al., 2002].
ГАПЛОГРУППА Н (рис. 9.2.6.)
Гаплогруппа Н — самая частая гаплогруппа во всей Евразии. Для её картографирования пригодна лишь десятипроцентная шкала. На карте мы видим, что её частота максимальна в Европе (40 %) и постепенно, неспешно убывает при движении через всю Евразию на восток.
Рис. 9.2.6. Карта распространения гаплогруппы Н мтДНК в коренном населении Евразии.
Но филогенетическое положение этой гаплогруппы на общем дереве митохондриальной ДНК очень скромное (рис. 9.2.1). Гаплогруппа Н — это веточка, растущая от сучка HV, расположенного на ветви R, происходящей от ствола (макрогаплогруппы) N. Как могла эта специфическая веточка общего митохондриального дерева разрастись настолько, чтобы включить в себя половину митохондриального фонда Европы? Возможный ответ состоит в том, что гаплогруппа Н принесена в Европу её первыми жителями, и она умножилась вместе с быстро растущим населением.
Возраст гаплогруппы Н в Европе/Ближнем Востоке — около 23–28 тысяч лет. Но если рассматривать отдельные субгаплогруппы в пределах Н, обнаруживается интересная картина [Loogvali et al., 2004]: те субгаплогруппы, которые часты в Европе, оказываются заметно моложе (10–15 тысяч лет), тогда как субгаплогруппы, распространённые в Азии, намного старше (30–50 тысяч лет). Если обобщить все эти данные, то получается, что гаплогруппа Н возникла, вероятно, на самой заре верхнего палеолита и претерпела несколько периодов экспансии вместе с ростом населения.
Гаплогруппы Н1 и НЗ, например, могут маркировать рост населения в ходе повторной колонизации Европы после окончания последнего оледенения (около 11 000 лет назад). Эти две субгаплогруппы более часты в Западной, чем в Восточной Европе, и достигают максимальных частот на Иберийском полуострове. Гаплогруппа Н1 (возраст которой оценивается в 9-12 тысяч лет) встречается также на Ближнем Востоке и Цен-, тральной Азии, тогда как НЗ (возрастом 10–13 тысяч лет) за пределами Европы редка.
Гаплогруппы Н1Ь и Н2а, напротив, более часты в Восточной, чем в Западной Европе, и обе встречаются также в Центральной Азии.
«КОМПАС РИМСКОГО ИМПЕРАТОРА»
Рассматривая географическое распространение гаплогруппы Н в целом, мы обнаруживаем чёткую закономерность (рис. 9.2.6). Карта показывает максимальные частоты в Европе, тогда как в остальных регионах, по мере удаления от Европы, частота постепенно снижается.
В населении Рима — выберем этот город, как столицу первой европейской империи — частота гаплогруппы Н достигает 40 % (взяты данные по популяциям центральной Италии). Рим расположен примерно на 42 градусе северной широты и 13 градусе восточной долготы. И если мы двинемся на восток, придерживаясь этой широты (в коридоре между 35 и 45 градусами), то обнаружим поразительно чёткую закономерность (используется информация нашего банка данных World Mitochondrial).
Если в Греции (20 градусов долготы) частота гаплогруппы Н будет ещё столь же высока, то уже на 30 градусах долготы (в Турции) частота Н становится ниже — 26 %. Дальше на восток, около 40 градусов долготы (Кавказ) частота Н ещё поменьше — примерно 20 %. Около 50 градусов (Иран) — 17 % гаплогруппы Н. Около 60 градусов (Узбекистан) — Н убывает до 15 %. Около 70 градусов (Пакистан) — 11 % Н. В области 80 градусов долготы нет надёжных генетических данных. Около 90 градусов — частота гаплогруппы Н колеблется от нуля до 10 % (запад Китая). Около 100 градусов частота Н нулевая. Около 110 градусов — частота Н чуть возрастает (Монголия). Но ещё далее на восток гаплогруппа Н уже полностью отсутствует: около 120 градусов долготы, в Китае — 0 %; около 130 градусов, в Корее — 0 %; около 140 градусов, в Японии — 0 %. То есть от Рима далее к востоку, вплоть до Китая, частота Н неуклонно снижается, рисуя нам чёткую, нигде не нарушенную зависимость.
В эпиграфе к этому разделу мы привели просьбу римского императора. Он просил своего изобретателя создать такой компас, который всегда указывал бы на Рим. «- Наверное, ты сделаешь и стрелку, которая всегда показывала бы на Рим? — Нет, только на север, Цезарь» [William Golding, Envoy Extraordinary]. Сейчас мы можем сказать, что спустя две тысячи лет генетики, наконец, изобрели «компас римского императора». Им оказалась гаплогруппа Н. Действительно, как мы видели, увеличение частоты гаплогруппы Н между двумя популяциями всегда показывает «на Рим». Хотя, конечно же, локальные генетические аномалии могут порой и нарушать работу генетического компаса — точно так же, как магнитные аномалии нарушают работу обычного компаса.
Итак, гаплогруппа Н представляет собой типичную европейскую гаплогруппу (40 % в Европе). Также она распространена почти повсюду в Евразии: в Юго-Западной Азии (19 %), Южной Азии (2 %), Северной Азии (3 %), встречается также в Северной Африке (15 %) и редка только в Восточной Азии (табл. 9.2.1.).
Только эти четыре гаплогруппы — В, С, D и Н — столь необычайно часты, что их географию мы рисовали широкими мазками десятипроцентных карт. Теперь мы перейдём к рассмотрению обычных частых гаплогрупп — и к трёхпроцентным картам.
ГАПЛОГРУППА I (рис. 9.2.7.)
Эта гаплогруппа похожа на гаплогруппу Н тем, что она тоже типично западная и тоже довольно частая. Но всё же она не столь часта, чтобы оправдать десятипроцентную шкалу — в трёхпроцентной лучше видна закономерность её распространения. Мы видим на карте, что её распределение во многом подобно Н, только встречается J всюду с меньшей частотой.
Рис. 9.2.7. Карта распространения гаплогруппы J мтДНК в коренном населении Евразии.
Гаплогруппа J часта в Европе и Передней Азии и постепенно убывает к востоку: в отдельных местах Сибири, Центральной Азии и на северо-западе Индии она ещё встречается с частотой до 5 %, но далее к востоку — в основной части Индии, Восточной Азии, на Дальнем Востоке — J практически отсутствует. Если вернуться к её основному ареалу на западе Евразии, мы увидим, что, в отличие от Н, гаплогруппа J достигает максимальных частот (13 % и выше) не в Европе, а в Передней Азии. Впрочем, Восточная Европа тут отстаёт ненамного. Карта очерчивает полумесяц высоких частот от Ближнего Востока через Восточную Европу к Уралу, огибая Среднюю Азию и степи Прикаспия.
ГАПЛОГРУППА Т (рис. 9.2.8.)
Её распространение похоже на только что рассмотренное. Это тоже частая западно-евразийская гаплогруппа, она тоже часта в Передней Азии и Европе, и детали её географии мы тоже рассмотрим на карте в трёхпроцентной шкале.
Рис. 9.2.8. Карта распространения гаплогруппы Т мтДНК в коренном населении Евразии.
Восточные рубежи похожи на предыдущую карту: как и J, гаплогруппа Т встречается по всей Сибири, но едва составляет там один процент; как и J, она лишь слегка заходит в Южную Азию, встречаясь с той же однопроцентной частотой в некоторых популяциях Индии, и практически Т отсутствует в Восточной Азии. Зато в пределах Европы и Передней Азии Т встречается почти в каждой популяции — иными словами, она ведёт себя так, как и положено западно-евразийской гаплогруппе.
Но на этом сходство Т с J заканчивается. Внутри Западной Евразии зоны повышенных частот Т расположены совершенно иначе: разбросаны отдельными пятнами на восточном Средиземноморье, горах Кавказа, Карпат и Альп и на обширной территории Европейской части России. В пределах последней интригует арктическая полоса высоких частот гаплогруппы Т, протянувшаяся от Архангельска до устья Оби. Любопытно, что это повышение на северо-востоке Европы/Урале вызвано одним специфичным вариантом гаплогруппы Т, обозначаемым как Т1.
ГАПЛОГРУППА F (рис. 9.2.9.)
Гаплогруппа F, происходящая от макрогаплогруппы N, чаще всего встречается в Восточной Азии (в среднем 18 %, табл. 9.2.1). Вместе с гаплогруппой В она вбирает в себя почти половину митохондриального генофонда этого региона. Частота гаплогруппы F выше всего в популяциях Таиланда, Вьетнама и юга Китая.
Рис. 9.2.9. Карта распространения гаплогруппы F мтДНК в коренном населении Евразии.
Хотя эта гаплогруппа из самых частых, её мы картографируем в трёхпроцентной шкале, чтобы лучше показать её несколько необычный рельеф. На карте хорошо видно, что от зоны максимальных частот в Южном Китае и Индокитае (где частота превышает 20 %) гаплогруппа F убывает как к северу (в Центральной Азии) так и к югу (на архипелагах Юго-Восточной Азии). Необычность карты состоит в нарушении этой постепенности убывания в нескольких популяциях Сибири, где гаплогруппа F внезапно повышается до 10–20 %.
В целом, ареал гаплогруппы F включает Юго-Восточную, Восточную, Центральную и Северную Азию. Но если в Юго-Восточной Азии F является лидирующей основной гаплогруппой (около четверти общего генофонда), то в других регионах она встречается с частотой от 1 % до 10 %. Гаплогруппа F редка в Южной Азии (Индии) и Юго-Западной Азии. В Европе она была неожиданно обнаружена в Адриатическом море — на островах Хорватии (недалеко от Венеции), куда, как считается, она могла прийти из Китая Великим шёлковым путем.
И частота, и разнообразие этой гаплогруппы максимальны в Юго-Восточной Азии. Оценка возраста для гаплогруппы F составляет 58±17 тысяч лет [Yao et al., 2002]. Ряд специалистов полагает, что гаплогруппа возникла где-либо поблизости от этого региона и затем распространилась — возможно, в ходе экспансии сино-тибетских языков (6–8 тысяч лет назад).
ГАПЛОГРУППА А (рис. 9.2.10.)
Гаплогруппа А первоначально была обнаружена в коренных популяциях Америки. По данным других наук предполагается, что люди заселили Америку 10–30 тысяч лет назад из Северной Азии, и гаплогруппа А помогла датировать этот процесс с генетических позиций. Эта гаплогруппа — единственный вариант мтДНК, встречающийся в популяциях эскимосов, других гаплогрупп у них нет. За время своей истории эскимосские популяции накопили некоторое число специфических мутаций в мтДНК. И поскольку по радиоуглеродным датировкам было известно, что эскимосы начали заселять Сибирь, Аляску и Канаду около 11 тысяч лет назад, это позволило оценить, как часто происходят мутации в мтДНК человека [Forster et al., 1996]. Полученная оценка скорости мутаций сделала возможным последующие вычисления. Была получена оценка, что мтДНК человека — а, следовательно, и её носители — впервые появились в Америке 20–25 тысяч лет назад.
Рис. 9.2.10. Карта распространения гаплогруппы А мтДНК в коренном населении Евразии.
Но не вся гаплогруппа А, а только одна её специфическая ветвь попала в Америку, тогда как прочие ветви остались на востоке Азии. Гаплогруппа А распространена по всей Восточной Азии (средняя частота 4 %, табл. 9.2.1.) и Сибири (10 %), но её отдельные субварианты жёстко «привязаны» к сравнительно небольшим ареалам. Например, гаплогруппа А5 (возникла 5-10 тысяч лет назад [Kivisild et al., 2002]) специфична для корейцев и японцев (рис. 9.2.10.А) и более почти нигде не встречена. Гаплогруппа А4 (рис 9.2.10.Б) живёт по соседству — на северо-востоке Китая, и тоже почти не выходит за свой основной ареал.
Другие варианты гаплогруппы А, хотя в целом приурочены к восточной половине Евразии, но эпизодически их можно встретить и в Европе, особенно в Европейской России. Основываясь на данных по населению Китая, возраст гаплогруппы А определен в 29 000 ± 14 000 лет [Yao et al., 2002].
Карту гаплогруппы А «целиком» (основная карта на рис. 9.2.10) мы приводим в трёхпроцентной шкале, а карты двух её редких субвариантов (рис. 9.2.10.А и Б) — в однопроцентной шкале.
Рис. 9.2.10.(А) Карта гаплогруппы А5.
Рис. 9.2.10.(Б) Карта гаплогруппы А4.
ГАПЛОГРУППА U4 (рис. 9.2.11.)
Эту западно-евразийскую гаплогруппу можно было бы назвать «срединно-евразийской». Её мы также рассмотрим в трёхпроцентной шкале. Самые высокие частоты этой гаплогруппы сосредоточены не на западе и не на востоке, а посредине Евразии: полоса повышенных частот U4 тянется с севера на юг от Оби до Инда, рассекая Евразию пополам. Частота максимальна в районе Урала (народы Приуралья, Урала и Западной Сибири несут от 10 до 30 процентов U4). Пятна повышенных частот видны также в Южной Азии (в Пакистане), и в Восточной Европе (видимо, благодаря близости Урала). В других частях Западной Евразии гаплогруппа U4 редка, но повсеместна (частота около 1 %, лишь местами поднимаясь до 5 %). Она покрывает тонким слоем и Западную Европу, и Северную Африку, и Переднюю Азию, и Среднюю Азию, и Индостан. Но вот в Восточной Евразии её нет — ни в Индокитае, ни в Китае её ещё никто не встречал. В Сибири, (кроме Западной) встречены лишь единичные U4 — это говорит об особости Западной Сибири, которая по этой гаплогруппе тяготеет не к прочей Сибири и не к Восточной Евразии в целом, а скорее к «Центральной Евразии», в свою очередь, склоняющейся больше в западу.
Рис. 9.2.11. Карта распространения гаплогруппы U4 мтДНК в коренном населении Евразии.
ГАПЛОГРУППА M1 (рис. 9.2.12.)
Гаплогруппа M1 представляет интересный вариант евразийской макрогаплогруппы М, который чаще всего встречается не в Евразии, а в Восточной Африке, достигая 17 % в Эфиопии. Гаплогруппа M1 также распространена на Ближнем Востоке и Кавказе. В Европе Ml встречена только в единичных случаях, в основном на Иберийском полуострове, юге России и на Украине.
Рис. 9.2.12. Карта распространения гаплогруппы M1 мтДНК в коренном населении Евразии.
Учитывая её не такую уж и малую частоту, карту M1 мы построили в трёхпроцентной шкале. Карта показывает, что хотя по своему ареалу эта гаплогруппа и «африканская», но даже внутри Африки она льнёт к Евразии — своей настоящей родине: ареал высоких частот M1 тянется по самой северо-восточной границе Африканского материка.
На этом иссякает список частых гаплогрупп Евразии. Все последующие гаплогруппы уже не столь часты и поэтому все последующие карты представлены в однопроцентной шкале.
Как и для самых частых гаплогрупп, начнём наш обзор с восточно-евразийских гаплогрупп, и лишь потом перейдём к западным — может быть, такая очерёдность поможет нам избежать европоцентризма в рассмотрении генофонда Евразии.
ГАПЛОГРУППА М7 (рис. 9.2.13.)
Как следует из её названия, эта гаплогруппа представляет собой ветвь макрогаплогруппы М. Она очень часта в Китае, Таиланде, Корее и Японии. Иными словами, её ареал — это Восточная Азия. И подобно гаплогруппе В, гаплогруппа М7 особенно часта (выше 7 %) вдоль Тихоокеанского побережья — от Сахалина до Вьетнама. Вглубь континента частота М7 снижается — в Центральной Азии (Монголии, северо-западном Китае, Казахстане) гаплогруппа М7 встречается с частотами от 1 до 4 %. А в других регионах — даже в соседней Сибири, не говоря уже про Индостан, Переднюю Азию и Европу, — гаплогруппа отсутствует.
Рис. 9.2.13. Карта распространения гаплогруппы М7 мтДНК в коренном населении Евразии.
Гаплогруппа М7 произошла 61±17 тысяч лет назад [Kivisild et al., 2002] (близкая оценка 56±20 приведена в [Yao et al., 2002]), и разделилась на М7а, М7b и М7с. Самую частую из них, М7b, в свою очередь можно подразделить на три основных варианта М7b1, М7b2, М7bЗ и прочие (трудно классифицируемые) варианты, обозначаемые звездочкой — М7b*.
Карты показывают, что каждая из этих веточек М7 имеет свой собственный удел в пределах их общего владения — Восточной Азии.
Гаплогруппа М7а, карта которой приведена на рис. 9.2.13.А, — типичная гаплогруппа для населения Японии, Приморского края России и Кореи. Её основная ветвь, обозначаемая М7а1, датирована 18±6 тысяч лет назад.
Рис. 9.2.13.А. Карта М7а.
Гаплогруппа М7b. Эта наиболее толстая и древняя ветвь М7 датируется 56±24 тысяч лет [Kivisild et al., 2002]. Она распространена по всей Восточной Азии и делится на ряд более молодых ветвей. Из них М7b1 часта в равнинной части Китая, вплоть до границ Монголии и Тибета, и заходит в Юго-Восточную Азию (Рис. 9.2.13.Б). Ареал другой веточки, М7b2, практически совпадает с только что описанной японско-корейской зоной М7а, разве что частота М7b2 чуть поменьше (рис. 9.2.13.В). Третья веточка, М7bЗ, ещё строже следует предписанным ей границам: она часта на Тайване, но практически отсутствует на континенте (рис. 9.2.13.Г). Наконец, все прочие веточки М7b* (рис 9.2.13.Д) распространены на юге Китая — то есть в основной зоне всей гаплогруппы М7.
Рис. 9.2.13.Б. Карта М7b1.
Рис. 9.2.13.В. Карта М7b2.
Рис. 9.2.13.Г. Карта М7b3.
Рис. 9.2.13.Д. Карта М7b*.
Последняя из ветвей М7 — гаплогруппа М7с распространена шире — в равнинной части Китая (но не в Тибете), на островах Юго-Восточной Азии, в Корее, и изредка встречается в других местах Восточной Азии — например, рис. 9.2.13.Е показывает пятна этой гаплогруппы на границе Китая с Казахстаном, а также на севере Вьетнама.
Рис. 9.2.13.E. Карта М7c.
Получается, что отдельные веточки М7 покрывают каждая свой кусочек Восточной Азии, и, состыковав их все вместе, как в детском конструкторе, можно собрать почти весь регион!
ГАПЛОГРУППА М3 (рис. 9.2.14.)
Гаплогруппы М и N — две основные макрогаплогруппы Евразии. Обе они происходят от африканской гаплогруппы L3, что рассматривается как подтверждение гипотезы африканских корней населения Евразии и всего человечества (рис. 9.2.1). Гаплогруппа М — старше 60 тысяч лет. Её географическое распространение рисует сложную картину, в которой переплелись результаты многих миграций, случившихся за последние шестьдесят тысячелетий.
Рис. 9.2.14. Карта распространения гаплогруппы М3 мтДНК в коренном населении Евразии.
Согласно наиболее обоснованной гипотезе, она распространилась из Восточной Африки в Индию в ходе «береговой миграции», которая происходила 50–60 тысяч лет назад вдоль западного побережья Индийского океана [Kivisild et al., 2000; 2003]. Этот путь пролегал по побережьям трёх морей — Аденского залива, Аравийского моря и Оманского залива. Легко запомнить, что М3 — это гаплогруппа «хождения за 3 Моря». Индия стала для гаплогруппы новой родиной, и здесь возникло множество новых субвариантов М. До сих пор в Южной Азии находят наибольшее разнообразие митохондриальных ДНК, относящихся к гаплогруппе М.
Например, каждый десятый в населении Индии и Пакистана несёт в своем митохондриальном геноме гаплогруппу М3, которая за пределами Индостана практически не встречается (табл. 9.2.1). Эта приуроченность гаплогруппы М3 к Индостану ясно видна на карте, в однопроцентной шкале (рис. 9.2.14).
ГАПЛОГРУППА X (оис. 9.2.15.)
Гаплогруппу X обычно считают типичной (хотя и редкой) европейской гаплогруппой. В действительности, она распространена ещё и на Ближнем Востоке, в Африке, Азии и Америке. Скорее всего, гаплогруппа X возникла на Ближнем Востоке очень давно (30 тысяч лет назад или даже раньше) и затем уже распространилась по многим континентам, став космополитом.
Рис. 9.2.15. Карта распространения гаплогруппы X мтДНК в коренном населении Евразии.
Гаплогруппа X делится на две ветви — старшую XI и младшую Х2.
Гаплогруппа XI возникла раньше и распространилась на Ближнем Востоке, в Северной и Восточной Африке.
Гаплогруппа Х2 младше (18±3 тыс. лет) и широко распространилась во время последнего оледенения или сразу после него (11 тыс. лет назад) [Reidla et al., 2003]. Её можно встретить в Европе, Сибири, Юго-Западной Азии и Северной Африке. Специфичный вариант Х2, обозначаемый как Х2а, достиг Америки, где его можно встретить (хотя и с очень низкими частотами) в коренных популяциях по всему континенту.
Но всё-таки гаплогруппа X чаще всего (3–5%) обнаруживается в Восточном Средиземноморье и на Кавказе. Частота снижается как к западу (в среднем по Европе 1 %, и полпроцента в северной Африке), так и к востоку (в Передней Азии в среднем 2 %).
Географическое распространение гаплогруппы X, несмотря на низкие частоты, довольно чёткое, что нам показывает карта (рис. 9.2.15). Частоты X выше 1 % приурочены к Передней Азии и Европе. Если смотреть, где внутри этого ареала частоты повышены, то сразу бросается в глаза Кавказ (в среднем порядка 5 %) и отдельные зоны накопления X разбросаны также по всему Средиземноморью.
ГАПЛОГРУППА К (рис. 9.2.16.)
По контрасту с предыдущей картой редкого Икса, хорошо видно, что К — довольно частая гаплогруппа. Она приурочена к Европе и Передней Азии, затекает в прибрежные районы Северной Африки, но в другие регионы практически не заходит (за исключением двух случайных популяций, одной в Забайкалье и другой на северо-западе Китая).
Рис. 9.2.16. Карта распространения гаплогруппы К мтДНК в коренном населении Евразии.
Любопытно, впрочем, что хотя Сибирь в целом лишена гаплогруппы К, Западная Сибирь присоединяется к Европе. Хотя частота за Уралом только-только переползает однопроцентный рубеж, а по европейскую сторону Урала частота превышает 5 %, примечателен сам факт проходимости Уральского хребта для носительниц гаплогруппы К. То есть мы снова, как и для гаплогруппы U4, видим, что Западная Сибирь отличается от основного массива сибирских популяций и образует вместе с Уральским регионом особую зону, которую нельзя однозначно отнести ни к Западу, ни к Востоку.
Но довольно о редких островках этой гаплогруппы на Востоке. Повторимся, что её удел — Запад, где её частота составляет 5 % и в Европе, и в Передней Азии (табл. 9.2.1). Многочисленные западные моря для неё не преграда — гаплогруппа одинаково часта на обоих берегах Ла-Манша, европейской и африканской сторонах Средиземного моря, вокруг всего Черного моря, и доходит до Каспия и Персидского залива. Карта показывает нам три анклава, где частота К превышает 6%: это Ближний Восток (особенно Иран, Ирак, Турция), Западная Европа (особенно Франция) и неожиданно самый северо-восток Европы (народы Приуралья и присоединившиеся к ним северные русские популяции).
ГАПЛОГРУППА U2 (рис. 9.2.17.)
Это — необычная западно-евразийская гаплогруппа. Необычность её в том, что хотя она и распространена по всей Западной Евразии, её максимальные частоты сосредоточены в той части континента, который нельзя решительно отнести ни к Западу, ни к Востоку — она часта в Индии.
Рис. 9.2.17. Карта распространения гаплогруппы U2 мтДНК в коренном населении Евразии.
Пожалуй, её бы можно назвать «срединноевразийской» гаплогруппой. Так, кроме Индостана, она встречается в Центральной Азии, Восточной Европе, Передней Азии, несколько ярких пятен видны на Урале — то есть как раз в регионах, пограничных между «настоящей Европой» и Восточной Азией. А в настоящей Западной Европе гаплогруппа U2 лишь случайная гостья — в отдельных популяциях она бывает, но есть и целые страны (Великобритания, Португалия, Греция, Австрия, Швеция и другие) куда она не заходит.
Гаплогруппа U2 делится на несколько веточек, и, рассмотрев их по отдельности, мы видим удивительную картину (врезки на карте — рисунки 9.2.17.А,Б,В,Г). Почти все веточки (U2a, U2b, U2c и прочие варианты, обозначаемые как U2*) встречаются почти исключительно в Индостане, а последняя веточка U2e, напротив, встречается по всей Западной Евразии, кроме Индостана. Иными словами, те U2, которые встречаются в Европе и Передней Азии — это только одна веточка U2e, а все прочие веточки U2 так и сидят в своей Индии.
Рис. 9.2.17.А. Карта U2a.
Рис. 9.2.17.Б. Карта U2b.
Рис. 9.2.17.В. Карта U2c.
Рис. 9.2.17.Г. Карта U2e.
ГАПЛОГРУППА U5a (рис. 9.2.18)
При первом взгляде на карту становится ясно, что перед нами ещё одна западно-евразийская гаплогруппа. В Европе и Передней Азии она есть, а в Восточной Азии и в Сибири (опять-таки, кроме Западной) — её нет. Что же касается Индостана, то гаплогруппа U5a встречается лишь на северо-западе этого субконтинента — широкой полосой вдоль Инда.
Рис. 9.2.18. Карта распространения гаплогруппы U5a мтДНК в коренном населении Евразии.
Из двух основных частей Западной Евразии — Европы и Передней Азии — гаплогруппа U5a определённо склоняется к Европе, особенно к её восточной половине. Практически непрерывная зона заметных (выше 6 %) частот гаплогруппы U5a занимает всю Восточную Европу — от Финляндии на севере до Украины на юге, от Белоруссии на западе до Урала на востоке. Лишь в северо-восточных областях (Архангельская, Пермская, Коми) частота U5a снижается примерно до 3 %.
Впрочем, и Западная Европа не обойдена вездесущей U5a — во многих популяциях её частота превышает 5 %, а уж хотя бы с однопроцентной частотой U5a присутствует в генофонде почти каждого европейского народа.
Не то в Передней Азии: там у многих народов U5a нет, у других она едва составляет один процент, и лишь в двух популяциях на нашей карте частота U5a составила 3 и 5 процентов. Если теперь поднять глаза к северу, мы увидим, что на западе Сибири U5a достигает тех же 3–5% не в двух, а практически в каждой из изученных популяций, но далее к востоку теряется на пространствах Сибири.
Итак, U5a — западно-евразийская гаплогруппа со склонностью к Восточной Европе.
ГАПЛОГРУППА U5b (рис. 9.2.19.)
Её сестринская гаплогруппа U5b ведёт себя сходным образом: она тоже западно-евразийская, так же, как и её сестра, склоняется в пользу Европы, а не Передней Азии, и лишь в пределах Европы выбирает себе другой удел — впрочем, по соседству с сестринским. Эта зона максимальных частот U5b — вся Фенноскан-дия, от Норвегии на западе до Карелии на востоке, и чуть сниженная частота U5b тянется ещё дальше на восток до ареала коми. Карта показывает нам, что в этих областях частота U5b превышает 6 %, а на самом севере у лопарей (саамов) достигает и вовсе небывалых частот — 63 %!
Рис. 9.2.19. Карта распространения гаплогруппы U5b мтДНК в коренном населении Евразии.
Не забывает U5b и другие области Европы — на всём Балканском полуострове её частота превышает 2 %, и в частности на Карпатах достигает 4–6%. На Атлантическом побережье Европы — в Англии, Франции, Испании — U5b также составляет 4 % почти в каждой популяции. Предполагается, что U5b впервые достигла значимых частот именно на западе Европы, в районе Пиренеев, откуда распространилась по всей Европе после схода последнего оледенения.
В пользу этого предположения говорит и наша карта. Действительно, все другие популяции, где U5b достигает высоких частот (саамы, финны, сардинцы, коми, острова Хорватии) хорошо известны генетикам как популяции с особенно сильным дрейфом генов. Так что высокие частоты U5b в этих популяциях следует объяснять закономерной случайностью, тогда как обширнейшую зону устойчиво повышенных частот на западе Европы случайностью объяснить нельзя. Пожалуй, лишь локальный максимум на Карпатах тоже трудно объяснить дрейфом генов — можно надеяться, более детальные исследования подыщут другое объяснение.
Мы так подробно рассмотрели географию U5b в Европе, потому что в других регионах она практически не встречается. То есть она, конечно, встречается — но чрезвычайно редко: на весь Евразийский континент карта показывает нам лишь четыре пятнышка вне Европы, где U5b достигает частоты хотя бы в один процент. Даже в Передней Азии, этой верной напарнице Европы, таких пятнышек всего лишь два.
Тем удивительнее, что U5b встречается в Африке, причём как в Северной, так и даже южнее Сахары. Атлантическое (опять атлантическое!) побережье Африки от Марокко до Гвинейского залива представляет собой сплошную полосу U5b, правда, с частотой всего в один процент. Думается, читатель и без наших подсказок вспомнит об Атлантиде, и — как и мы — не воспримет всерьёз гипотезу о том, что U5b — гаплогруппа атлантов, которую их уцелевшие потомки принесли на атлантические берега Европы и Африки. Кстати, на атлантических побережьях обеих Америк этой гаплогруппы почему-то нет.
ГАПЛОГРУППА V (рис. 9.2.20.)
Эта гаплогруппа ещё более европейская. Ни в Передней Азии, ни в Индостане, ни в Восточной Азии, ни в Сибири, ни в Африке её нет. Она есть только в Европе, и то по большей части в её восточной половине.
Рис. 9.2.20. Карта распространения гаплогруппы V мтДНК в коренном населении Евразии.
Её распространение в Восточной Европе во многом повторяет U5a, только с меньшей частотой. Гаплогруппа V так же занимает обширную полосу от Балтийских побережий до Черного моря. Так же тянется на восток к Уралу, чуть-чуть заходя даже в Сибирь. Так же избегает северо-восточных областей Европы. Коль скоро мы обнаружили «восточно-европейскую» (почти «русскую») гаплогруппу, то именно её мы выберем для демонстрации возможностей геногеографии, и рассмотрим гаплогруппу V подробнее в параграфе 4.
ГАПЛОГРУППА W (рис. 9.2.21.)
Взглянув на эту карту, хочется воскликнуть: «Вот это уже не европейская, а настоящая западноевразийская гаплогруппа!» А присмотревшись, можно добавить — даже транс-евразийская. И правда — полоса повышенных частот гаплогруппы W начинается от устья Ганга, затем, перепрыгнув Индию, тянется на север вдоль Инда, в его верховьях резко поворачивает на запад, и по горным хребтам, обогнув с юга Каспийское море, доходит до Кавказа. Оттуда через Украину она прорывается к Карпатам и, оставив горы, через равнины Польши и Прибалтики приходит к финнам. На всём этом пути видны отростки сниженных частот. Отростки направо — к уйгурам, казахам и русским, и налево — в Иран, Левант и Западную Европу. Десанты W были высажены и в таких отдалённых районах как Восточная Сибирь и Восточная Африка. Будем надеяться, что, разделив со временем гаплогруппу W на отдельные веточки, мы сможем лучше понять, какие миграции наложили столь причудливый отпечаток на эту гаплогруппу, распространив её по всей Западной Евразии с частотой, едва превышающей один процент, и сформировав извилистую, как след змеи, полосу чуть повышенных частот по всей длине ареала.
Рис. 9.2.21. Карта распространения гаплогруппы W мтДНК в коренном населении Евразии.
§ 2. Встреча запада и востока Евразии
Запад есть Запад, Восток есть Восток, Им не сойтись никогда.
Редьярд КиплингИзучение изменчивости мтДНК привело к представлению о западно-евразийских и восточноевразийских гаплогруппах. Наши карты наглядно показывают справедливость такого выделения — почти каждая гаплогруппа приурочена только к одной половине Евразии. Правда, разнообразие карт далёко не сводится к этим двум типам. Например, восточноевразийские гаплогруппы легко подразделяются дальше на северные и южные ([Yao et al., 2002 a,b], см. также табл. 9.2.1). А некоторые гаплогруппы (например, W) тянутся грядой из Индии в Европу. Но всё же восточно-западная дихотомия — самая яркая черта в распределении вариантов мтДНК. Попробуем проследить общие закономерности распределения западных гаплогрупп (всех вместе) и восточных (также взятых суммарно).
ГАПЛОГРУППЫ ВОСТОЧНОЙ ЕВРАЗИИ
Карта на рис. 9.2.22. показывает суммарную частоту восточно-евразийских гаплогрупп. Аналогично, ниже рис. 9.2.23. покажет суммарное распространение всех западно-евразийских гаплогрупп (к ним мы отнесли и индийские гаплогруппы, поскольку они часто заходят в западную Евразию и почти никогда — в восточную).
Рис. 9.2.22. Карта распространения восточно-евразийских гаплогрупп мтДНК (суммарно).
Рассмотрим сначала восточно-евразийские гаплогруппы. Конечно же, мы видим максимум на востоке и снижение частоты по направлению к западу. Но важно иное. Карта обнаруживает границу между востоком и западом. Двигаясь с востока, мы сначала находимся в зоне преобладания (более 85 %) азиатских гаплогрупп. Потом частота довольно быстро опускается ниже 55 % и начинается широкая переходная зона. А примерно на шестидесятом меридиане две последние изолинии (25 % и 10 %) плотно жмутся друг к другу, обозначая окончательное падение азиатских гаплогрупп. Мы видим, что по данным о мтДНК «Азия» заканчивается внезапно, не заходя в «Европу»[56].
В предыдущей главе (рис. 8.2.11.) рассмотрен «фрагмент» этой карты — суммарная частота восточноевразийских гаплогрупп в Восточной Европе. На обеих этих картах, выполненных в разных географических и генетических масштабах, мы видим резкий обрыв в распространении азиатских гаплогрупп.
НЕСЛЫШНОЕ ДЫХАНИЕ АЗИИ
Нередко можно встретить мнение о промежуточности Восточной Европы, и в особенности русских, между «Европой» и «Азией». Этот взгляд укрепился благодаря работам, выполненным в русле течения евразийства, и в некоторых кругах стал само собой разумеющимся. Даже на научных дискуссиях авторам не раз приходилось слышать, что если русские популяции по каким-то показателям вдруг оказываются чем-то средним между французскими и китайскими, то это совершенно естественно и ничего иного от русских нельзя было ожидать.
Не берёмся судить о справедливости такой промежуточности в культурном смысле, но генетически она себя никак не проявляет (и не только по мтДНК). На рассматриваемой карте мы видим упоминавшийся резкий обрыв в распространении восточно-евразийских гаплогрупп. Генетические влияния «Азии» почти не затрагивают русский генофонд, они ослабевают, ещё задолго не доходя до него, ещё перед Уралом («перед» — если смотреть из Азии). А за Урал в Европу переходит уже слабое дыхание Азии, которое быстро угасает на пространстве между Уральским хребтом и Волгой.
По объективным данным мы не видим сколько-нибудь существенного присутствия «азиатского» генофонда в Восточной Европе — хотя нам часто чудится влияние Азии в этом регионе.
Быть может, это европоцентризм влияет на наши научные выводы — мы ощущаем даже легкое дыхание Востока, помним о тех затухающих азиатских волнах, которые докатывались до Европы в последние два тысячелетия. Но легко забываем о тех древних связях и интенсивных миграционных потоках, которые проникали из Европы в Азию — в обратном направлении.
ГАПЛОГРУППЫ ЗАПАДНОЙ ЕВРАЗИИ
Поэтому рассмотрим географию западных гаплогрупп. На карте (рис. 9.2.23.) видно, что западные гаплогруппы покрывают не только «свою», западную часть Евразии, не только заходят в соседнюю Северную Африку, но их экспансия захватывает и восточную половину Евразии. Частоты западно-евразийских гаплогрупп, естественно, максимальны на западе и постепенно снижаются к востоку. Но в этой постепенности не заметно такого резкого обрыва, который есть на карте восточно-евразийских гаплогрупп — частоты западно-евразийских гаплогрупп убывают неспешно, и этот тренд занимает всю Евразию — от Атлантического океана то Тихого. На карте видно, что зона с частотами европейских гаплогрупп выше 10% формирует центральный наступательный клин на восток, который не только захватывает всю Монголию, но заходит и в Китай, и лишь немного не достигает границ Кореи. На северном и южном флангах успехи Европы тоже впечатляют: на севере часть Восточной Сибири несёт более 10% европейских гаплогрупп и на юге врывается вдоль побережья в Индокитай. Итак, западные гаплогруппы проникают сквозь всю Евразию, и даже на восточной окраине континента мы видим всплески западно-евразийской волны.
Рис. 9.2.23. Карта распространения западно-евразийских гаплогрупп мтДНК (суммарно).
Вспомним, что и карты палеолита (раздел 9.1.2) выявили продвижение на восток — культурный мир становился трёхчленным за счёт переходной области «западных влияний» (рис. 9.1.3. и 9.1.4). Теперь, благодаря митохондриальному ландшафту, эта экспансия западно-евразийского генофонда становится почти осязаемой.
Вывод о том, что «Запад есть Запад, Восток есть Восток» несколько утратил прелесть новизны… Нетривиально иное — где и как западный и восточный миры встречаются друг с другом. Особенность митохондриального ландшафта в том, что граница между западным и восточным генофондами не похожа на прямую линию, проведённую по меридиану с севера до юга — очертания переходной области куда любопытнее. Лучше всего её видно на карте восточно-евразийских гаплогрупп (рис. 9.2.22.): Гималаи встают стеной, и, заглядывая за неё, мы видим уже совсем другой генофонд. Но это скорее исключение, потому что в Евразии стен меньше чем ворот: в Центральной Азии и Сибири мы видим не узкую, как на северо-востоке Индии, а широчайшую переходную область между «Европой» и «Азией». И эта переходная область волнистая, отклоняется то к западу, то к востоку: если Европа издревле была соединена с Азией через южные врата, органично включая в себя Индостан, то Азия проникает в Европу северными вратами, добираясь до Скандинавии[57].
§ 3. Главные сценарии
Винни-Пух спросил:
— Нет ли где ещё Полюсов?
— Есть ещё Южный Полюс, и, по-моему, где-то есть Восточный Полюс и Западный Полюс, хотя люди почему-то не любят говорить о них.
Александр МилнВ нашей книге мы стремимся использовать все системы признаков наравне друг с другом, и для этого анализируем их одними и теми же методами. Сквозной метод, который проходит по всем признакам и регионам — это создание карт главных компонент изменчивости генофонда.
А ЧТО МЫ ТЕРЯЕМ?
Конечно же, каждая система признаков утрачивает при этом свои специфические достоинства и возможности. Так и гаплогруппы мтДНК, дающие уникальную возможность прослеживать филогеографические закономерности — динамику генофонда в пространстве и времени, — теряют эти преимущества при анализе главных компонент. Более того, такой анализ некорректен в той степени, в какой неодинаков филогенетический «ранг» гаплогрупп и субгаплогрупп, включённых в анализ. По названиям гаплогрупп нельзя судить об их месте в филогенетической иерархии — гаплогруппа Н может быть моложе и представлять «тонкую веточку» на древе мтДНК, в то время как субгаплогруппа U5a может быть старше и потому более «толстой ветвью» на филогенетическом древе гаплогрупп мтДНК. Поэтому выбор гаплогрупп для включения в анализ главных компонент в какой-то мере произволен относительно их «ранга». Однако справедливости ради стоит добавить, что этим недостатком страдают почти системы признаков. При анализе классических маркёров наряду с основными аллелями в анализ обычно включают и их варианты — например, для групп крови АВ0 аллели А1 и А2; варианты гена группоспецифического компонента GC*1F и GC*1S; подтипы трансферрина TF*C1, TF*C2, TF*C3 и многие другие варианты аллелей разных локусов. Также и для признаков антропологии неизвестна их иерархия, но заранее можно утверждать, что их «ранг» неодинаков. Так что это общий неустранимый недостаток, которым страдают все системы признаков и который создаёт для всех некий общий фон помех. Поэтому гаплогруппы мтДНК здесь не одиноки, и анализ главных компонент их изменчивости соответствует анализу других систем признаков.
РАСЧЁТ
Главные компоненты позволяют обобщить изменчивость всех карт отдельных гаплогрупп и выявить основные закономерности в изменчивости митохондриального генофонда. Расчёт главных компонент выполнен по картам 20 основных гаплогрупп: А, В, С, D, F, Н, J, К, Ml, М3, М7, Т, U2, U4, U5a, U5b, V, W, X, Z. Первая главная компонента описывает 30 % общей изменчивости, вторая — 11 %, третья и последующие менее 10 %. Мы рассмотрим карту первого наиболее значимого сценария изменчивости генофонда.
ПОЛЮСА ВИННИ-ПУХА: ЗАПАДНЫЙ и восточный
Карта первой главной компоненты (рис. 9.2.24.) показывает постепенное изменение значений от запада к востоку. То есть для Евразии характерен долготный тренд изменчивости мтДНК. Можно сказать, что запад и восток евразийского континента — это два полюса, и весь митохондриальный генофонд постепенно заменяется при движении от одного полюса к другому. География ведёт отсчёт от северного и южного полюсов, но геногеография нашла собственные. Согласно карте первой главной компоненты Западный полюс расположен в Европе, а Восточный полюс — в Китае, с экстремальными значениями «восточности» на Тайване.
Рис. 9.2.24. Карта главного сценария митохондриального генофонда Евразии (первая компонента изменчивости гаплогрупп мтДНК).
Каждый полюс окружён своим полушарием — карта явно показывает членение на западную Евразию и восточную Евразию. Граница между ними («экваториальная область» среднего интервала) проходит примерно посредине между двумя полюсами. Эта граница начинается в Средней Сибири, и, пройдя Тянь-Шань и Гималаи, заканчивается у Индийского океана.
СОГЛАСНЫЕ ОПИСАНИЯ ОЧЕВИДЦЕВ
Напомним, что такой же тренд изменений с запада на восток получен и для генофонда Северной Евразии (раздел 9.1.) по данным о классических маркёрах. И такая же долготная изменчивость показана для всей Азии [Cavalli-Sforza et al., 1994], также по данным о классических маркёрах (отсутствие на этих картах Европы не так существенно, поскольку при рассмотрении в евразийском масштабе её вполне заменяет генетически сходная Юго-Западная Азия). Тот же тренд показан по классическим маркёрам и в масштабе всей Евразии [Генофонд и геногеография…, т.2, 2003]. Для нас особенно важна объективность митохондриального ландшафта: география митохондриальной ДНК полностью согласна с остальными данными о генофонде Евразии.
Во втором томе «Генофонда» [Генофонд и геногеография…, т.2, 2003] приведены и карты изменчивости мтДНК, но они, к сожалению, неинтересны и даже неверны: не говоря уже о крайне малом объёме исходных данных, картографированы не гаплогруппы, а распространённость отдельных мутаций. Однако первая же из картографированных мутаций (в позиции 16249) встречается в гаплогруппах Ml, L2, LI, Н, Ul, U5a, F, Z, U4, А, С, К, В, Т. Список можно было бы продолжать и дальше, но уже ясно, что при таком подходе картографируются отдельные ниточки, выдернутые из самых разных гаплогрупп — африканских, европейских, восточноазиатских. И суммарная карта распространённости отдельно взятой мутации вряд ли может показать что-то иное, чем случайности мутационного процесса. Конечно, если какая-то мутация часто встречается в одной гаплогруппе и лишь изредка в других, то закономерность распространения мажорной гаплогруппы будет, пожалуй, пробиваться сквозь хаотические пятна множества прочих гаплогрупп. Но вряд ли оправданно отвергать основной результат многолетних исследований мтДНК — надежную классификацию гаплогрупп по их происхождению — и анализировать парагруппы, классифицируя их по сходству (наличию общей мутации).
Отметив сходство главного тренда, выявленного разными авторами по разным данным, рассмотрим и некоторые различия между их результатами. Это касается хода «пограничной линии» между Западом и Востоком.
Приводимая нами карта (рис. 9.2.24.) показывает пограничную полосу примерно от 70° до 90° меридиана. Карта евразийского генофонда, созданная по классическим генным маркёрам и приведённая во II томе «Геногеографии населения России и сопредельных стран….» [Генофонд и геногеография…, т.2, 2003], рисует несколько иную границу между западом и востоком. Она представляет почти идеально прямую линию, рассекающую Евразию, и проходит строго от Новой Земли на севере до Цейлона на юге. Основное отличие от нашей «митохондриальной» карты состоит именно в южном участке — если по мтДНК Индостан относится к Западной Евразии и лишь отчасти к среднему интервалу, то эта карта по классическим маркёрам рассекает его надвое — на западно-евразийскую и восточно-евразийскую половины, с узким средним интервалом посредине.
Обычно при сравнении аутосомных и «однородительских» маркёров преимущество всегда остаётся за первыми, поскольку однородительские маркёры (мтДНК и Y хромосомы) сильнее подвержены дрейфу генов и потому более «забывчивы». Однако в данном случае лучше пока воздержаться от сравнений. Дело в том, что наши карты по мтДНК построены на основе всей имеющейся информации по Евразии, а карты надёжности отсеяли те области, где такой информации недостаточно. Карты же по классическим маркёрам созданы по небольшому числу популяций за пределами Северной Евразии и без учёта надёжности прогноза. Интерполяция проводилась порой по всего лишь единичным популяциям Южной и Юго-Восточной Азии (карты опорных точек, приведённые в [Генофонд и геногеография…, т. 2, 2003]). Если бы использовались карты надёжности, то на евразийских картах главных компонент эти регионы были бы исключены из-за очень низкой надёжности прогноза на этих территориях. Поэтому карты главных компонент изменчивости классических маркёров в Евразии [Генофонд и геногеография…, т. 2, 2003] требуют проверки с включением обширного массива данных по населению всей (а не только Северной) Евразии и обязательным созданием карт надёжности. Только после этого можно будет сравнить, где проходит «демаркационная линия» между западом и востоком по аутосомным маркёрам и гаплогруппам митохондриальной ДНК.
Аналогичная карта первой главной компоненты по классическим маркёрам для Азии, полученная группой Л. Л. Кавалли-Сфорца [Cavalli-Sforza et al., 1994] рисует картину, похожую на митохондриальную — постепенные изменения от Ближнего Востока (один экстремум) к Восточной Азии (противоположный экстремум). Ход изолиний этой карты в северной половине Евразии для нас не так важен, поскольку в исходных данных Л. Л. Кавалли-Сфорца и коллег Северная Евразия представлена слабо. К тому же генофонд Северной Евразии мы уже хорошо знаем по разделу 9.1. А вот ход изолиний этой карты в Южной Азии — в Индостане — нам крайне важен. Коллективом Л. Л. Кавалли-Сфорца собрана, пожалуй, наиболее полная сводка данных по генофонду зарубежной (вне СССР) Азии, поэтому ход изолиний в Индостане основан на обширных и представительных данных. И карта может прояснить, как всё-таки ведёт себя генофонд Индостана в западно-восточной дихотомии — присоединяется ли он больше к Западу (как по нашим данным о мтДНК) или делится на две части — «резко прозападную» и «резко провосточную» — как по данным [Генофонд и геногеография…, т.2, 2003]. Карта, приведенная в [Cavalli-Sforza et al., 1994, с. 250] показывает, что Индостан представляет собой широкую зону перехода: из девяти интервалов карты все три средних интервала приходятся на территорию Индостана. Можно предполагать, что хотя Индостан и не рассечён резко на западную и восточную половины, он весь целиком, по данным о классических маркёрах, представляет собой переходную зону, не склоняясь явно к Западу, как это происходит с ним по данным о митохондриальной ДНК. Однако если в будущем мы сумеем включить в полноценный анализ классических маркёров всю Евразию, можно ожидать приближения к той картине, которую мы видим на картах митохондриальной ДНК.
КАК ГАПЛОГРУППЫ СВЯЗАНЫ СО СЦЕНАРИЯМИ?
Очевидно, что карта первой главной компоненты выявляет взаимодействие западного и восточного стволов евразийского генофонда. Это те самые варианты генофонда, для которых характерны, соответственно, западно-евразийские и восточноевразийские гаплогруппы. Два метода картографического анализа: с долей субъективности (разделение гаплогрупп на западные и восточные, рис. 9.2.22., 9.2.23.) и полностью объективный (картографирование главных компонент, рис. 9.2.24.), выявляют одну и ту же закономерность.
Это подтверждается и количественно — западно-евразийские гаплогруппы связаны высокой корреляцией с первой компонентой. Оно и понятно — ведь их частота убывает к востоку, и в том же направлении возрастают значения первой компоненты, поэтому корреляция по абсолютной величине высока, а по знаку — отрицательна. Восточно-евразийские гаплогруппы также связаны с первой компонентой высокой корреляцией — но положительной (их частоты к востоку возрастают). Таблица 9.2.2. показывает замечательное совпадение между тем, как гаплогруппа коррелирует с первой компонентой, и тем, куда эта гаплогруппа относится по общепринятой западно-восточной дихотомии.
Так, «самой западной» — (максимальная отрицательная корреляция с первой компонентой) — оказывается основная западноевразийская гаплогруппа Н, а «самой восточной» (максимальная положительная корреляция) — самая частая восточно-евразийская гаплогруппа D. Характерно, что гаплогруппы, которые мы затруднялись отнести однозначно к западным или к восточным (уралоидная U4, африканская Ml, индийские М3 и U2) демонстрируют коэффициент корреляции близкий к нулю (табл. 9.2.2). Впрочем, знак корреляции этих гаплогрупп всё-таки отрицательный — и мы также относили эти гаплогруппы к западно-евразийским.
Таблица 9.2.2.
Коэффициенты корреляции гаплогрупп мтДНК с картой первой главной компоненты
§ 4. Карты прародины гаплогрупп
Кроме анализа распространения гаплогрупп (ветвей митохондриального дерева) митохондриальная ДНК предоставляет возможность анализа на уровне гаплотипов — листьев того же дерева. В разделе 6.2. мы пользовались данными по гаплотипам, выясняя долю общих гаплотипов между популяциями. В разделе 8.2. мы оценивали разнообразие гаплотипов в популяции.
Теперь же мы рассмотрим ещё одно применение этих данных — разнообразие не всех гаплотипов, имеющихся в популяции, а только гаплотипов, относящихся к одной гаплогруппе.
В первом случае мы получали характеристику популяции — разнообразие всех гаплотипов мтДНК указывало, насколько интенсивно в данной популяции действовал дрейф генов и насколько интенсивны были миграции. Во втором случае мы получим характеристику гаплогруппы — насколько велико в ней разнообразие гаплотипов. И этот показатель поможет нам в поисках прародины гаплогрупп — тех мест, где гаплогруппа если не возникла физически (это вряд ли возможно установить, да это и не несёт для нас особо важной информации), то где она возникла «популя-ционно» — на какой территории гаплогруппа впервые достигла значимой частоты и откуда начала распространяться по ойкумене. И тогда, зная место и время происхождения многих гаплогрупп, мы можем использовать эти сведения для изучения истории популяций человека.
Что же может дать геногеографическая технология для поиска прародины гаплогруппы? Как её искать?
ЧАСТОТА ГАПЛОГРУППЫ? НЕТ!
Одним из показателей «прародины» гаплогруппы служит её частота. Предполагается, что в какую-то эпоху сложились такие условия в регионе, что частота гаплогруппы достигла высоких значений. Далее миграционные потоки разносят варианты этой гаплогруппы по соседним популяциям, но везде они встречаются реже, чем у себя на родине. Поэтому максимальная частота могла бы служить показателем места рождения гаплогруппы.
Однако этот показатель работает не всегда. Например, частота гаплогруппы может резко возрасти в изолированных популяциях из-за дрейфа генов. Классическим примером этой ситуации служат саамы Скандинавии: окраина ойкумены, малая численность, дрейф генов — как результат: преобладание двух гаплогрупп с высокой частотой. Частота гаплогруппы V- 40 %. Это мировой максимум, резко проявляющийся на карте распространения гаплогруппы V, которую мы уже приводили в числе прочих карт гаплогрупп (рис. 9.2.20). На рис. 9.2.25.А приведён фрагмент этой карты — частота гаплогруппы V в Европе (в других регионах она редка). Но трудно предположить, что гаплогруппа V возникла в Скандинавии — вероятнее, она возникла в ином месте, а уже потом на севере Скандинавии, за счёт дрейфа генов достигла высокой частоты [Torroni et al., 2001].
Рис. 9.2.25. Поиск прародины гаплогруппы V мтДНК.
А — карта распространения гаплогруппы V в Европе; Б — карта разнообразия гаплогруппы V.В — карта интегрального показателя для гаплогруппы V; Г — карта распространенности гаплогруппы preV.
РАЗНООБРАЗИЕ ГАПЛОГРУППЫ? НЕТ!
Итак, по карте частоты мы не можем сделать надёжных выводов о месте её прародины.
Но нам может помочь другой показатель, и это как раз разнообразие. В филогеографии зону с наибольшим разнообразием какой-либо родственной группы гаплотипов принято рассматривать как вероятную зону их общего происхождения. Это и понятно, ведь ещё Н. И. Вавилов считал зонами происхождения культурных растений те территории, где сейчас обнаруживается наибольшее разнообразие форм.
Ведь в том регионе, где гаплогруппа впервые достигла значимой частоты и откуда её затем разнесли миграционные потоки, должны были накопиться многочисленные мутации, то есть множество «родственных» гаплотипов. На прародине мы можем ожидать обнаружить веер разных дочерних гаплотипов и их высокое разнообразие — это как бы «донор» гаплотипов. До отдалённых популяций с прародины дойдут лишь разрозненные варианты, лишь случайная часть всего спектра гаплотипов прародины, и потому, хотя их частота может случайно возрасти, разнообразие будет мало.
Разнообразие гаплогруппы V приведено на рис. 9.2.25.Б. Мы видим, что у саамов — минимум разнообразия. Хотя оно и высоко у их соседей — финнов и карел. Это означает, что, несмотря на высокую частоту, саамов можно исключить из списка кандидатов на прародину.
Однако и этот показатель неидеален. Дело в том, что высокое разнообразие — не обязательно древнее разнообразие. В метисной популяции, на перекрестке миграционных путей (как мы видели в сказке об изо-лах и миграх, глава 6), разнообразие может быть ещё выше — каждый из миграционных потоков привносит свои гаплотипы. А древняя предковая, но изолированная, популяция может из-за дрейфа генов потерять своё разнообразие в течение долгой чреды поколений (см. главу 6).
ТРИ КИТА ПРАРОДИНЫ: ЧАСТОТА. РАЗНООБРАЗИЕ И ФИЛОГЕНИЯ!
Поэтому надо учесть оба критерия — и частоту, и разнообразие. Если в каком-либо регионе оба показателя высоки, то и его вероятность считаться прародиной должна быть выше.
Мы предлагаем использовать простейший комбинированный показатель, учитывающий оба исходных показателя — их произведение (как вероятность одновременности двух событий). На рис. 9.2.25.В представлена карта такого комбинированного инструмента.
Именно в этом комбинированном показателе наиболее ярко проявляется применение геногеографического подхода. Мы видим, что в число претендентов на «прародину» гаплогруппы теперь вошли только три зоны.
Первая в Фенноскандии — мы помним, что частота V была высока не только у саамов, но и у соседних финнов и карел, у которых дрейф генов был не столь интенсивным. И нельзя исключать, что там действительно давно множатся все новые субварианты этой гаплогруппы.
Но есть и два южных максимума — один во Франции, другой на Украине.
И теперь пора воспользоваться третьим источников информации — знанием филогении этой гаплогруппы. Предковой по отношению к V является редкая гаплогруппа preV [Torroni et al., 2000], распространение которой показано на рис. 9.2.25.Г. Карта показывает, что гаплогруппа preV приурочена главным образом к территории Франции и Украины (в Причерноморье, хотя и несколько южнее, чем максимум самих preV). Можно думать, что совпадение трёх параметров — высокой частоты, высокого разнообразия и наличия предшественников гаплогруппы — не является случайным совпадением, и эти два региона могли быть зонами, из которых гаплогруппа V распространялась по Европе.
Итак, объединяя данные геногеографии и филогеографии, мы получаем в руки новый картографический инструмент. И можем создавать новые типы карт для гаплогрупп — карты их разнообразия и «карты прародины».
9.3. РУССКИЕ ПОПУЛЯЦИИ НА ФОНЕ ЕВРАЗИИ
§ 1. Русский генофонд в евразийском ландшафте: Вид Евразии из русского окошка — Родная Европа и чуждая Азия — Европейцы больше русские, чем сами русские! — Англичане в Австралии — Русские в Сибири
§ 2. Некоторые итоги: Четкость клин — Трансевразийский тренд — Третья раса? — Русский генофонд — Европеец, а не евразиец
Россия… — не страна, а часть света
Даниил Андреев§ 1. Русский генофонд в евразийском ландшафте
ВИД ИЗ РОССИИ НА ЕВРАЗИЮ
Рассмотрев общие — объективные — тенденции евразийского генетического ландшафта, пора сменить точку зрения и взглянуть «субъективно» — из русского ареала оглядеть генетическое пространство Евразии. Это позволит ответить на вопрос о месте, которое занимает в нём русский генофонд. Тяготеет ли он к западному или восточному стволам митохондриального древа? Или же является смешанным? Или же разные русские популяции ведут себя по-разному? С какими популяциями русский генофонд сходен, а от каких резко отличен? Наиболее корректные ответы на эти вопросы даёт ещё один геногеографический метод — картографирования генетических расстояний, который широко использовался и в предыдущих главах.
На рис. 9.3.1. представлена карта генетических расстояний от «среднерусской популяции», т. е. от средних частот гаплогрупп в коренных русских популяциях. Значения частот «среднерусской популяции» рассчитаны по наиболее надёжным данным о мтДНК, охватывающим основной ареал русского генофонда: по популяциям Архангельской, Белгородской, Костромской, Смоленской областей и кубанских казаков.
Рис. 9.3.1. Карта генетических расстояний по мтДНК: от русского генофонда до популяций Евразии.
КАК ЧИТАТЬ КАРТЫ РАССТОЯНИЙ. Светлые тона обозначают малые значения генетических расстояний, то есть большое сходство популяций на данной территории и «среднерусской популяции». Напротив, тёмные тона обозначают большие генетические расстояния, то есть резкие генетические различия между популяциями этой территории и «средней русской популяцией». Поэтому если две территории окрашены в светлые тона, это говорит об их сходстве друг с другом и со «среднерусской популяцией». Если же две территории окрашены в чёрные тона, это говорит об их отличии от «среднерусской популяции», но не говорит об их сходстве между собой, так как они могут отличаться от «среднерусской популяции» в разные стороны.
РОДНАЯ ЕВРОПА И ЧУЖДАЯ АЗИЯ
Бросается в глаза (рис. 9.3.1.) близость практически всей Европы к нашей «среднерусской популяции». Широкая область светлых тонов фиксирует популяции, наиболее близкие к «среднерусским». Оказывается, что практически все популяции центральной Европы чрезвычайно близки к «среднерусским» значениям: величины генетических расстояний варьируют от 0 до 0.01. Во всей Центральной и Западной Европе от «среднерусских» значений резко отличается только северная часть Скандинавии, одна румынская и одна из множества итальянских популяций. Умеренные отличия показывают Франция, Англия, Испания и Италия — но, например, Германия, Австрия, Польша на карте неотличимы от среднерусской популяции. Однако даже генетические отличия испанцев заметны лишь в общеевропейском масштабе и исчезают, когда мы охватываем взглядом всю Евразию — повторимся, что на фоне Евразии вся Европа удивительно похожа на средний русский генофонд.
Главное, что обнаруживает карта генетических расстояний — это удивительную близость «среднерусских» значений к вариациям европейского генофонда. Это сходство — весьма нетривиальный результат, особенно на фоне радикальных отличий генофонда всего остального евразийского населения. Резкий градиент проходит в районе Урала, пересекает Кавказ и далее на юге немного размывается, показывая «слегка русские» Анатолию и Левант. Все популяции к югу и востоку от этой линии обладают иным митохондриальным генофондом, непохожим на средний русский. Территории, расположенные западнее этой линии, за рядом исключений, достаточно близки к «усредненной русской популяции».
ЕВРОПЕЙЦЫ БОЛЬШЕ РУССКИЕ. ЧЕМ САМИ РУССКИЕ!
Однако самое удивительное, что одним из таких исключений является часть русских популяций, белорусы и украинцы Поднепровья: они значительнее отличаются от «среднерусской популяции», чем многие иные популяции Европы. Это — неожиданный результат. Он показывает, сколь велик размах генетических различий в пределах русского генофонда, насколько значительно некоторые русские популяции могут отличаться от усреднённых общерусских величин. Одна зона слегка повышенных отличий от среднерусского генофонда расположилась прямо… в Центральной России! Другая — на северо-западе, хотя эти данные не слишком надёжны, так как основываются всего на одной псковской популяции. Третья — северная зона — особенно обращает на себя внимание. Она отмечает то — пока ещё умеренное — отличие северно-русского генофонда от генофонда усредненно-русского, которое далее переходит уже в резкие отличия финских, саамских и зауральских популяций.
Итак, русский этнос имеет сложную внутреннюю структуру. Карта генетических расстояний по частотам гаплогрупп мтДНК показывает порой большее сходство европейских групп с усреднённой русской популяцией, чем сами русские популяции: между русскими группами выявлены значительные различия.
Коренное население остальных регионов Евразии (вне Европы) резко отличается от русских популяций.
ГЕНЕТИЧЕСКИ ЭФФЕКТИВНАЯ КОЛОНИЗАЦИЯ
Последний вывод особенно важен. Он означает, что огромный современный ареал русского народа включил территории, коренное население которых генетически было совершенно иным: Урал, Сибирь и Дальний Восток, Северный Кавказ и Закавказье, Среднюю Азию. Тем самым колонизационные потоки русского населения были генетически эффективными миграциями. В популяционной генетике так называется показатель, оценивающий те изменения, которые произошли в генофонде в результате притока мигрантов из другой популяции, при этом учитывается степень различий между двумя популяциями (см. Приложение), Русское расселение на обширных территориях должно было привести к изменениям как в генофондах коренных народов (которые смешивались с русскими), так и в генофонде русских популяций на новых местах обитания (которые смешивались с коренным населением). Даже если бы смешения были невелики, их генетический результат был бы существенен — слишком сильно различались два контактирующих генофонда. Но исторические источники однозначно свидетельствуют о большой интенсивности смешений.
По-видимому, есть все основания считать, что русская колонизация Сибири, Кавказа и Средней Азии так же изменила генофонд этих регионов, как английская колонизация изменила генофонды Северной Америки или Австралии, а испанская — Южной Америки. Конечно, генофонды коренного населения Южной и Северной Америки трансформировались в разной степени. Но и изменения, затронувшие, скажем, Западную Сибирь и Закавказье, тоже различны по интенсивности. С точки зрения популяционной генетики, европейская экспансия/колонизация, последовавшая за эпохой Великих географических открытий, была по сути одним и тем же процессом, независимо от того, проходила она по морю (в случае Западной Европы) или по суше (в случае России). Для нас такой взгляд важен потому, что говорит о правильности изучения русского генофонда именно на его «исконной» территории. Ведь генофонд русского населения Сибири будет соотноситься с «собственно русским» генофондом примерно так же, как современное население Австралии — с английским генофондом, а Мексики — с испанским. Разумеется, важно изучить генофонд русского населения не только «исконного», но и «современного» ареалов. Важно лишь различать, где русское население — коренное, а где появилось в ходе колонизации.
§ 2. Некоторые итоги
Основным итогом является созданный Атлас митохондриальных ландшафтов. Только приведённые карты атласа (в действительности их число намного больше) показывают распространение 32 гаплогрупп митохондриальной ДНК в населении Евразии. Создание атласа стало возможным благодаря наличию как геногеографических технологий, так и банка данных, включающего данные по 70 000 тысячам изученных образцов мтДНК, представляющих порядка тысячи популяций. Наряду с картами распространения гаплогрупп, атлас включает и карты разнообразия гаплогрупп, карту гаплотипического разнообразия, карты главных компонент и генетических расстояний. В целом, атлас является обобщением накопленных данных по мтДНК, выполненным методами геногеографии.
ЧЁТКОСТЬ КАИН ГАПЛОГРУПП: СИСТЕМА В ДЕЙСТВИИ
Удивительной чертой митохондриального ландшафта оказалась чёткость клинальной изменчивости, свойственной распространению многих гаплогрупп. От мтДНК её ожидать было трудно, поскольку и дрейф генов в случае однородительских маркёров мощнее во много раз, и велики случайные смещения частот из-за ошибок выборки (для одинаковой надёжности результатов для однородительских маркёров размер выборки нужен в два раза больше, чем для аутосомных маркёров). Эти случайные факторы могли превратить распределение гаплогрупп в калейдоскоп всплесков и провалов, выливающийся на карте в мозаику темных и светлых тонов. Но вопреки случайностям дрейфа генов и ошибок выборок на картах чётко видны клины — «родины» гаплогрупп и пути их миграций по Евразии.
Объяснить эту удивительную устойчивость можно только тем, что популяции представляют собой систему, в которой степень родства популяций регулирует обмен генов и стабилизирует частоту гена. Это явление описано в ряде работ Ю. Г. Рычкова, Е.В. Балановской и Ю. П. Алтухова (см. Приложение).
ТРАНСЕВРАЗИЙСКИЙ ТРЕНД ГЕНОФОНДА
Анализ синтетических карт, демонстрирующих закономерности изменчивости всей совокупности мтДНК маркёров, показал, что ведущей закономерностью генетического ландшафта Евразии является долготный трансевразийский тренд «запад-восток», выявляемый первой главной компонентой (30 % общей изменчивости). Этот тренд, выявленный по совокупности карт гаплогрупп мтДНК, согласуется с основными направлениями изменчивости классических генных маркёров [Cavalli-Sforza et al., 1994; Балановская, 2003].
ТРЕТЬЯ РАСА?
Можно увидеть ещё одну особенность митохондриального ландшафта. Речь идёт о «третьей расе» Евразии, выделенной Виктором Валерьяновичем Бунаком — об «уралоидах» (рис. 9.3.2). Зададимся вопросом: если эта раса всё же есть, то как она должна выглядеть?
Рис. 9.3.2. Расовые стволы человечества (по В. В. Бунаку) и промежуточное место уральской ветви.
Раса недифференцированная. Она образовалась, когда монголоиды и европеоиды ещё не сформировались окончательно. Просто в силу своей древности «третья раса» была промежуточной, своеобразно сочетающей признаки западного и восточного стволов (рис. 9.3.2). Во-вторых, география её такова, что эта раса всегда, как губка, впитывала в себя многовековые потоки генов с обеих сторон — из Европы и из Азии. Это означает, что и по происхождению, и по своей истории она не может не быть промежуточной… Как же её обнаружить? Только благодаря популяционным свойствам. Популяция, как клетка, обладает иной проницаемостью внутри себя и вне. Она взаимодействует с внешним миром как единое целое. Принимая чуждые гены, распределяет их в своих пределах иначе, чем обычная область смешения. Третья раса должна проявиться как буферная зона, в которой гены распространяются с иной скоростью, чем в изотропной среде.
Поэтому одним из самых любопытных направлений современных популяционных работ представляется поиск «третьей расы» Евразии. И особые надежды здесь можно возлагать на однородительские маркёры, которые могут отделить поздние миграции от исходно промежуточного генофонда.
ЛАНДШАФТ — МИТОХОНДРИАЛЬНЫЙ ИЛИ УНИВЕРСАЛЬНЫМ?
Заключая обзор митохондриального ландшафта Евразии, покажем, что даже столь своеобразные маркёры недалеко уклоняются от магистральных закономерностей генофонда. На рисунке 9.3.3. приведён важнейший параметр — дифференциация трёх регионов Евразии — рассчитанный и по митохондриальным маркёрам, и по аутосомным классическим маркёрам. Мы видим уже известную нам картину: дифференциация Западной Европы мала (популяции этого региона генетически похожи друг на друга), дифференциация Восточной Европы выше, а дифференциация Сибири огромна. Такую картину рисуют и классические маркёры (серые столбики), и точно такую же картину мы видим по данным о мтДНК (полосатые столбики). Поразительно, насколько согласованно изменяются величины дифференциации, рассчитанные по двум совершенно разным типам маркёров и по разным наборам популяций. Это говорит нам, что изменчивость митохондриальной ДНК в своих важнейших чертах следует общим закономерностям генофонда, и анализируя мтДНК, мы изучаем не столько отдельный ген, сколько закономерности генофонда.
Рис. 9.3.3. Дифференциация регионов Евразии по мтДНК и по классическим маркёрам.
РУССКИЙ ГЕНОФОНД — ЕВРОПЕЕЦ. А НЕ ЕВРАЗИЕЦ!
Наконец, данные по изменчивости митохондриальной ДНК позволили не только рельефно выделить основные закономерности генофонда Евразии, но и показать то место, которое занимает в нём русский генофонд. Карта генетических расстояний показала, что к русскому генофонду близко население практически всей Европы, при этом смежное с русскими население Урала и Кавказа, не говоря уже о более отдалённых регионах, генетически резко отлично. Иными словами, русская колонизация шла на территориях с населением, которое генетически отличалось от русских поселенцев почти так же, как коренное население Северной Америки отличалось от английских поселенцев. Учитывая масштабность русской колонизации, для изучения русского генофонда особую важность приобретают понятия «исконного ареала» и «коренного населения».
Глава 10. ВМЕСТО ЗАКЛЮЧЕНИЯ
Мы стоим у края необъятного моря. Тысячи различных драгоценных или вредных вещёств — генов — растворены в этом море… И это море волнуется. Неслышными взрывами ежеминутно взрываются в них мутации, создавая новые ценности или отравляя это море новыми ядами. Медленно расползаются диффузионными процессами эти гены, захватывая всё новые и новые зоны. Сложными потоками переливаются, смешиваясь и крутясь, разноцветные струи, рождая новые комбинации генов, часто не ведомые человеку… Имя этому морю — генофонд. Познать, понять и овладеть его взволнованной многосложной жизнью — наша благородная задача!
А. С. СеребровскийНад морем, диким полуночным морем
Муж-юноша стоит —
В груди тоска, в уме сомненья —
И, сумрачный, он вопрошает волны:
«О, разрешите мне загадку жизни,
Мучительно — старинную загадку,
Над коей сотни, тысячи голов —
В египетских, халдейских шапках,
Гиероглифами ушитых,
В чалмах, и митрах, и скуфьях,
И с париками и обритых —
Тьмы бедных человеческих голов
Кружилися, и сохли, и потели, —
Скажите мне, что значит человек?
Откуда он, куда идет,
И кто живет над звёздным сводом?»
По-прежнему шумят и ропщут волны,
И дует ветр, и гонит тучи,
И звезды светят холодно и ясно, —
Глупец стоит — и ждет ответа!
Ф. И. Тютчев— Понимаешь, — пояснил Муми-папа. — Я хочу найти тайные правила, которым подчиняется море…
— Но тогда море — живое, — рассуждал Муми-папа. — Оно может мыслить. Оно поступает, как ему вздумается… Это невозможно понять… Потом внезапно его мордочка прояснилась, и он сказал с облегчением: — Стало быть мне не надо понимать! Море — это просто существо с плохим характером, на которое нельзя полагаться.
Туве Янсон. «Папа и море»В этой книге мы собрали все данные, накопленные о русском генофонде самыми разными науками, и провели анализ этих данных методами геногеографии. Казалось бы, что ещё нужно, чтобы разрешить, наконец, загадку русского генофонда? Объём данных огромен, их объективность и разносторонность не вызывают сомнения, а методы позволяют не только проанализировать данные каждой науки, но ещё и сопоставить и объединить их. Похоже, что сейчас, в заключительной главе, мы сможем подвести итоги и, наконец, сказать самое главное о структуре русского генофонда. Ах, если бы…
Главный результат мы получили давно — в конце 1999 года, когда у нас в руках оказались четыре массива данных о русском генофонде. Это были: антропологическая сводка (предоставленная В. Е. Дерябиным), данные по дерматоглифике (Н. А. Долинова), по русским фамилиям (А. П. Бужилова), по классическим генетическим маркёрам (наш Банк данных, пополненный информацией проф. В. А. Спицына, который и убедил нас картографировать классические маркёры для русских). Для каждого из этих массивов данных ещё тогда мы провели анализ главных компонент — обычный для геногеографии способ выявить самую главную информацию. Мы не раз уже выявляли главные сценарии самых разных генофондов — от отдельных народов до субконтинентов. Но здесь мы впервые обнаружили поразительный факт — карты первых главных компонент русского генофонда по каждому из четырёх массивов информации были удивительно похожи. Главный сценарий каждого очевидца показывал широтную изменчивость: постепенные изменения в русском генофонде с севера на юг. Мы смотрели на эти широтно бегущие волны генофонда с изумлением, восхищением и недоверием — почему изменчивость русского генофонда широтна? Ведь в Восточной Европе, на значительной части которой раскинулся ареал русского народа, эти волны бегут в совершенно ином — долготном направлении. И почему эта закономерность так хорошо проявилась во всех, самых разных массивах данных? Мы тогда же доложили этот поразительный результат на съезде Вавиловского общества [Балановская и др., 2000], и решили, что русский генофонд стоит того, чтобы его изучать — объёмы накопленной информации уже позволяют делать достоверные выводы.
Прошедшие с тех пор годы мы его и изучали. В ходе собственных экспедиций создали ещё два новых массива данных по ДНК полиморфизму в русском населении (гаплогрупп мтДНК, Y хромосомы). Увеличили объём других массивов данных (по фамилиям — практически создали его заново). Провели много разных видов анализа и узнали много, как мы надеемся, интересного о русском генофонде — всё это подробнейшим образом изложено во второй части книги. И при этом главный результат остался неизменным — широтная изменчивость как ведущая закономерность в русском генофонде. Подобно основоположнику нашей науки Александру Сергеевичу Серебровскому, мы стояли у края моря — генофонда (см. цитату в эпиграфе) и, подобно тютчевскому герою, видели широтно бегущие волны генофонда и просили у них ответа. Чтобы осмыслить эти результаты и найти ответ, мы и задумали написать эту книгу. Книга написана, но ответа по-прежнему нет. Если, конечно, не принимать во внимание ответ Му ми-папы…
Несомненно, мы можем дать ту или иную интерпретацию широтной изменчивости. Например, сопоставить её с северным и южным потоками славянской колонизации [Седов, 1999]. Или с северным и южным русскими наречиями [Диалектологический атлас русского языка, 1986, 1989, 1996, 2002]. Можно и не считать широтную изменчивость главным результатом, а переключиться на другие закономерности — распространения русских фамилий, или же гаплогрупп Y хромосомы, или на «ядерные структуры», обнаруженные по антропологическим данным.
Чуть ниже (раздел 10.1) мы попытаемся перечислить основные полученные результаты. Но главное, что мы хотели бы сказать читателю — это что мы сами, имея в руках всё множество этих результатов, не решаемся выбрать, который из них основной. Нам неизвестны те слова, в которых можно было бы сформулировать «главное о русском генофонде». Мы можем сказать о нём довольно много, но неизвестного — ещё больше. И что является важнейшим, самым существенным — этого мы по-прежнему не знаем. Стоим и ждем ответа. Потому-то мы всегда и описывали больше сами результаты, чем наши выводы — теперь читатель, держа в руках те же результаты, находится с нами в равных условиях и, может быть, сумеет увидеть новые, нераспознанные нами, закономерности, лежащие в самой основе генофонда.
В этом и была главная цель нашей книги. Мы решили на всём её протяжении оставаться в строгих рамках научного мышления. И не навязывать читателю готовые решения, а предложить те итоги многих наук, которые позволят ему самому размышлять над тем, что же такое русский генофонд. Тех, кто привык получать готовые ответы, это отпугнет. Эта книга больше для тех, кто хочет искать ответы. Нашей задачей было дать пищу для научных размышлений — сделать научные сведения доступными не только специалистам и обобщить их так, чтобы читателю не требовались специальные познания в той или иной области науки. Надеемся, что эту главную задачу мы выполнили. И в этой заключительной главе мы не хотели бы изменять своему правилу, — даже отвечая на непрофессионально заданные вопросы, мы будем рассматривать научные факты в рамках научной логики.
Но если «самое главное о генофонде», возможно, осталось не понятым до конца, мы всё-таки знаем достаточно, чтобы сказать, чем генофонд не является. Какие воззрения на генофонд являются ошибочными, неверными, необоснованными, ненаучными — это мы сказать теперь можем. Этот принцип — «не то» и «не это» — используется при описании очень сложных объектов (например, в духовной литературе). Он помогает очертить границы, в пределах которых реально находится объект.
Поэтому нашу заключительную главу мы построим следующим образом. Сначала кратко перечислим «положительное» знание о генофонде, то есть основные итоги нашего исследования (раздел 10.1). А затем перейдем к «отрицательному» знанию. Рассмотрим широко распространённое мнение, что главное в русском генофонде — это результат татаро-монгольского нашествия (раздел 10.2). Забегая вперед, скажем, что это оказалось не так. Поговорим о типичных ошибках, которые порой совершают при интерпретации геногеографических карт (раздел 10.3). Потом рассмотрим мнение, что русский генофонд «деградирует», разрушается, исчезает (раздел 10.4). Поскольку в популяционной генетике практически нет критериев «деградации», нам придётся, вместе с читателем, создать некую теоретическую базу на примере иных генофондов, и затем применить её к русскому генофонду. Мы обнаружим, что рассуждения о «гибели русского генофонда» не находят обоснования в научных данных. Но поскольку эти рассуждения очень распространены в околонаучных кругах, а опасения основаны на современной демографической картине, мы решились предложить свои рецепты помощи генофонду. Не то чтобы мы считали, что без этого генофонд погибнет, отнюдь. Но уж если в современном российском обществе есть благородный интерес к своей истории и желание бережного отношения к генофонду (русскому, мордовскому, татарскому, нивхскому…), то лучше предложить ему рассмотреть научно обоснованные способы содействия сохранению генофонда. Наконец, в двух словах поясним, почему не существует «русских генов» (как не существует генов английских, татарских, индоиранских…). И почему, тем не менее, правомочно говорить о русском (или английском, или сибирском, или индоиранском, или ином) генофонде (раздел 10.5).
10.1. РУССКИЙ ГЕНОФОНД: СВИДЕТЕЛЬСТВА ОЧЕВИДЦЕВ
Шесть очевидцев — Широтные волны русского генофонда — Высокая гетерогенность — Своеобразие Русского Севера — Финно-угорский субстрат в русском генофонде — Единодушие шести очевидцев — Согласие лингвистики и археологии — Не так, как в Европе — Долготные волны Восточной Европы — Долготные волны Евразии — Гетерогенность в масштабе Евразии — На трёх китах
Как предмет моей к Вам речи указать приёмы для установления порядка последования евангельских событий… (…) Коль скоро Вы согласитесь признать их законность, то не откажетесь уже признать, что и порядок евангельских событий, в котором предлагает их настоящая Евангельская история, стоит на прочном основании.
Правила сии не многосложны, — и даже оно одно, с некоторыми необходимыми дополнениями к нему, — именно: должно держаться того порядка евангельских событий которого держатся два евангелиста. Ибо коль скоро два согласны, то на другой стороне остаётся только один, который должен уступить двоим, по слову Господа, что при двоих свидетелях станет всяк глагол.
(…) Скажет кто: выходит, течение событий определяют глаза, и следовательно, сочетание их воедино есть труд механический. И это самый надёжный путь. — Не совсем механический, однако ж преимущественно такой.
Святитель Феофан, затворник Вышенский. «Евангельская история о Боге Сыне, воплотившемся нашего ради спасения, в последовательном порядке изложенная словами святых евангелистов».В третьей части книги мы вышли далеко за пределы русского генофонда — в просторы Европы и Евразии. Это позволило нам не просто увидеть положение русского генофонда среди соседей по континенту, но и, сменив окуляры нашего инструмента, забыть о деталях и увидеть самые общие черты. Теперь, вернувшись из путешествия по Евразии вновь к масштабу одного народа, мы легко можем охватить взглядом основные итоги нашего исследования.
В этом нам поможет не только вид на Русь «из космоса», но и главный мультиокулярный подход всей книги — сопоставление мнений разных очевидцев и поиск совпадений: только самое очевидное, явное и несомненное разные свидетели могут увидеть одинаково. Коль скоро подобное правило учёными богословами признаётся достаточным в таком важнейшем вопросе, как хронология Евангельских событий, то уж тем более его будет достаточно для учёных-генетиков, желающих решить частную естественнонаучную проблему — найти устойчивые черты в портрете генофонда. И если мы будем держаться того описания русского генофонда, которого держатся два или более из наших «очевидцев», то читатель, надеемся, не откажется признать, что предлагаемое в настоящей книге описание русского генофонда стоит на прочном основании.
Итак, мы расспросили шестерых очевидцев, исследовали шесть массивов данных — два антропологических (соматология и дерматоглифика), два массива ДНК полиморфизма (мтДНК и У хромосомы), классические генетические маркёры и географию русских фамилий. Целью исследования было выяснить структуру русского генофонда. Средством стали методы геногеографии. Поскольку методы были по большей части одни и те же для всех массивов, мы легко увидим, согласуются ли данные этих наук или противоречат друг другу, рисуют ли они единый, целостный портрет русского генофонда. Наш подход близок к критерию, вынесенному в эпиграф: лишь те черты генофонда, которые одинаково описаны хотя бы двумя свидетелями (получены по двум разным типам признаков), мы включаем в окончательный портрет генофонда.
АНТРОПОЛОГИЯ: СОМАТОЛОГИЯ
Антропологические данные описывают физический облик русского населения. Мы впервые проанализировали весь комплекс данных по антропологии коренного русского населения в пределах «исконного» ареала: и данные Русской антропологической экспедиции (проведённой под руководством В. В. Бунака и Т. И. Алексеевой), и данные М. В. Витова. Суммарно изучено 180 популяций по 18 признакам соматологии: длина тела, цвет глаз и волос, форма спинки носа и уплощенности лица, рост бороды и другие.
Некоренное население и русские популяции за пределами «исконного», исторического ареала (например, Урала, Сибири, Поволжья) в этих основополагающих работах (и соответственно нами) не учитывалось. Этому принципу — изучение только «исконного» ареала — мы следовали далее не только для антропологических признаков, но и во всём нашем исследовании.
«ПРОСТЫЕ» КАРТЫ. Рассматривая карты отдельных признаков, видишь, что география большинства из них довольно запутана. Однозначные тренды обнаружены лишь для немногих признаков. Изменчивость всех 18 признаков мы обобщили в картах главных сценариев (канонических переменных) и картах генетических расстояний.
ГЛАВНЫЙ СЦЕНАРИЙ. Карта первой канонической переменной выявляет широтную изменчивость. Этот статистический метод позволяет выявить то основное, что присутствует на картах всех отдельных признаков. Значит, антропологический облик русских популяций меняется главным образом при движении с севера на юг (или, то же самое, с юга на север). Такую же закономерность хорошо знают и лингвисты — они выделяют северные, южные и смешанные среднерусские говоры. Итак, различия между русским севером и русским югом — это первостепенное различие внутри русского населения. Но ни о какой границе между севером и югом не может быть и речи — изменения происходят очень постепенно. Они скорее задают главную ось, вдоль которой мы видим наибольшую изменчивость.
ГЕНЕТИЧЕСКИЕ РАССТОЯНИЯ. Иную, но не менее важную информацию несёт обобщённая карта второго типа — карта генетических расстояний. На ней показано, насколько каждая из русских популяций отличается от среднестатистической русской популяции. Популяции, похожие на эту «среднюю русскую», встречаются повсюду, но в основном сосредоточены в центре русского ареала. Из предыдущей карты можно было бы ожидать что «самые отличающиеся» расположатся одни на юге, другие на севере. Но реальная картина иная. Популяции, значительно отличающиеся от средних русских характеристик, образуют на карте скопления, ядра. Одна группа этих ядер расположена на западе, другая — в восточной части «исконного» русского ареала.
Для объяснения этой картины вспомним, что современное русское население образовалось при смешении пришлого славянского и автохтонного финно-угорского населения. Славянские племена в течение нескольких веков продвигались с запада на восток, колонизируя Восточно-Европейскую равнину и ассимилируя местные финно-угорские племена. В середине этого процесса, когда славяне достигли территорий, которые являются сейчас серединой русского ареала, смешение было особенно интенсивным. В результате образовался «среднерусский» генофонд, составленный из славянского и финно-угорского компонентов. И на нашей карте как раз в середине ареала мы видим «среднестатистический» русский тип. В конце процесса славянской колонизации, в восточных областях, местное финно-угорское население численно преобладало над пришлым славянским. И на нашей карте на востоке мы видим отличия от «среднестатистического» типа — за счёт преобладания финно-угорского компонента (см. главу 2). А в начале того же процесса, в западных областях, численно преобладало славянское население. И на нашей карте на западе мы видим отличия от «среднестатистического» типа — но теперь за счёт преобладания славянского компонента (см. главу 2). Итак, наша гипотеза: в современном русском генофонде разных территорий видны три фазы славянской колонизации: преобладание на западе славянского, в центре смешанного и на востоке дославянского (в основном финно-угорского) населения.
Эта гипотеза подтверждается тем, что зона «среднестатистического» русского населения соответствует продвижению границ Русского государства (при расширении его пространства) на восток в IX–XI веках — то есть соответствует той зоне, куда передвигались наибольшие массы славянского населения и где можно ожидать наибольшего смешения с финно-угорскими популяциями. Второе подтверждение: западные «ядра» на антропологической карте совпадают с ареалами летописных славянских племён на археологической карте: каждое из западных ядер мы можем сопоставить с конкретным славянским племенем (как подробно описано в главе 2).
Однако это направление «запад«=>восток» так и не стало главным сценарием русского генофонда, не сумело превозмочь различия между севером и югом. Дело, видимо, в том, что при расчёте генетических расстояний мы используем для точки отсчёта «среднестатистические» русские частоты, нивелируя главные различия — между севером и югом. В поле нашего зрения при этом оказывается только среднерусская полоса и юг. На севере же, как мы видели в главе 2, остаются крупные «залежи» дославянского генофонда. В других главах (например, в главе 6) мы видели, что генофонд Русского Севера нельзя рассматривать только как наследство от финно-угров: он часто тяготеет к западным территориям, и скорее всего, к самому древнему палеоевропейскому пласту генофонда Европы. Когда мы сумеем с помощью генетики проследить цепь поколений вплоть до первых основателей европейского генофонда, то, скорее всего, окажется, что этот пласт удалось сохранить не только современным финно-уграм, но и балтам, и славянам.
АНТРОПОЛОГИЯ: КОЖНЫЕ УЗОРЫ
Мы картографировали и другой класс антропологических признаков — дерматоглифические. Они охватывают меньшее число популяций «исконного» русского ареала — 28. И самих признаков меньше — всего 7, но зато это избранники. Эти семь признаков носят звание ведущих: они не коррелируют друг с другом и несут основную информацию о кожных узорах.
«ПРОСТЫЕ» КАРТЫ. Карты отдельных признаков опять оказались разнообразны. Особенно любопытно распространение европеоидно-монголоидного комплекса — это такое сочетание признаков кожных узоров, которое хорошо дифференцирует европеоидные и монголоидные популяции. Мы ожидали, что в русском населении монголоидность будет возрастать с запада на восток. Но нет, на карте вообще не видно никаких закономерностей — то есть в пределах «исконного» русского ареала распределение дер-матоглифического европеоидно-монголоидного комплекса хаотично. Вспомним это, когда в следующем параграфе будем обсуждать, насколько сказалось татарско-монгольское иго на русском генофонде. Мы видим, что признаки кожных узоров голосуют за то, что никак не сказалось.
ГЛАВНЫЙ СЦЕНАРИЙ. Зато обобщённая карта (по всем дерматоглифическим признакам) выявляет чёткую закономерность. Обобщение мы провели методом главных компонент, широко распространённым в геногеографии. Этот метод аналогичен методу канонических переменных, который мы применили к антропологическим данным и обнаружили у них широтную изменчивость. И теперь, уже по данным дерматоглифики, первая главная компонента также выявила постепенную широтную изменчивость в русском населении.
Итак, два независимых очевидца от антропологии единодушно засвидетельствовали, что главный компас антропологии указывает с юга на север: в этом направлении катятся волны русского фено-фонда, то есть совокупности внешних признаков — фенов. А что же гены, что же собственно генофонд, что скажет генетика?
ГЕНЕТИКА: КЛАССИЧЕСКИЕ ГЕННЫЕ МАРКЁРЫ
Классические маркёры генетики — это все те гены, которые популяционная генетика использовала до «ДНК эры» — например, группы крови и гены ферментов. Классические маркёры изучались на протяжении десятилетий. Созданный нами банк данных «Русский генофонд» включает почти всё, что было опубликовано по русскому населению. Были построены 66 карт аллелей 24 локусов, но в анализ главных компонент были включены только наиболее изученные (35 аллелей 13 локусов). Каждый из генов изучен в разном числе популяций, в среднем — по 35 популяциям. Напомним, что антропологические признаки были изучены в пять раз подробнее — по 180 популяциям.
«ПРОСТЫЕ» КАРТЫ. Карты отдельных генов выявили сложные картины — как это было и для отдельных признаков антропологии и дерматоглифики. Хотя опять, для части генов видны чёткие закономерности. Например, частота аллеля НР*1 постепенно убывает с юго-запада к северу, АСР1*А убывает с юго-востока к северо-западу, а частота GLO1*1 максимальна в центре русского ареала и снижается к периферии. Частота аллеля А системы групп крови АВ0 высока на западе и снижается к востоку. А вот ген группы крови резус как и большинство прочих генов, не обнаруживает простой закономерности в русском ареале: области высоких и низких частот чередуются на карте либо беспорядочно, либо образуют сложную, неоднозначную мозаику.
ГЛАВНЫЙ СЦЕНАРИЙ. Для обобщения всего этого разнообразия отдельных карт были построены карты главных компонент. И первая главная компонента выявила широтную изменчивость. Вновь — теперь в изменчивости классических маркёров — эта закономерность оказалась главной для русского генофонда.
ГЕТЕРОГЕННОСТЬ. По классическим маркёрам проведён и другой вид анализа — межпопуляционной изменчивости. Эта мера гетерогенности русского генофонда показывает, насколько разные русские популяции отличаются друг от друга. Такие показатели гетерогенности мы рассчитали и для многих других народов. Оказалось, что все западноевропейские народы в целом гомогенны (разные популяции, например, французов генетически очень похожи друг на друга), а сибирские народы, напротив, гетерогенны (разные популяции, например, якутов очень различаются между собой). Народы Восточной Европы, Кавказа, Урала, заняли промежуточное положение (умеренная гетерогенность). Учитывая большие различия между региональными «стандартами» гетерогенности, мы стали сравнивать русский народ с народами того же самого региона — Восточной Европы. На восточноевропейском фоне (где средняя гетерогенность этноса составила лишь GST=0.7[58]) гетерогенность русского народа велика (GST=2.0). На большом «исконном» ареале русского генофонда было неудивительно обнаружить большое генетическое разнообразие русских популяций.
ГЕНЕТИКА: МИТОХОНДРИАЛЬНАЯ ДНК
Этот особый тип генетических маркёров (однородительских ДНК маркёров, то есть передаваемых из поколения в поколение только по одной линии — материнской) сейчас наиболее популярен во всём мире. Но изучение русских популяций началось лишь несколько лет назад, и мы располагаем надёжными данными только по семи русским популяциям.
ГЕНЕТИЧЕСКИЕ РАССТОЯНИЯ. Такое небольшое число популяций не позволяет провести надёжный анализ картографическими методами. Статистическими методами выявляется один компактный кластер, включающий большинство русских популяций, и в отдалении находится другой кластер самых северных популяций.
ГЕТЕРОГЕННОСТЬ. Величина межпопуляционных различий составила 3.3. Гетерогенность других народов Западной и Восточной Европы обычно заметно меньше (например, гетерогенность украинцев по мтДНК в пять раз меньше), то есть по митохондриальной ДНК, как и по классическим маркёрам, разные русские популяции генетически весьма различны.
СПЕКТР. Митохондриальная ДНК позволяет провести ещё один вид анализа — по спектру гаплотипов. Если гаплогруппы мтДНК можно уподобить отдельным антропологическим или классическим маркёрам, то гаплотипы мтДНК являются очень дробными и многочисленными вариантами в пределах каждой гаплогруппы. Этим мтДНК похожа на фамилии, где мы также имеем множество вариантов одного «локуса». Можно надеяться, что многочисленность анализируемых признаков увеличивает надёжность анализа. Мы определили, какие гаплотипы мтДНК встречены в русских популяциях, и сравнили со спектром гаплотипов в смежных группах населения. Оказалось, что русские более всего похожи на остальные восточнославянские популяции (30 % гаплотипов, обнаруженных у русских, встречены также у белорусов и украинцев). На втором месте по сходству с русскими стоят восточные финно-угорские народы, на третьем — западные финно-угорские народы, и лишь затем идут западные и южные славяне. Итак, по спектру гаплотипов мтДНК русский генофонд приближен скорее к финно-угорскому, чем к «праславянскому» генофонду, что вновь показывает роль финно-угорского субстрата в русском генофонде.
ГЕНЕТИКА: Y ХРОМОСОМА
Из всего множества генетических маркёров гаплогруппы Y хромосомы — самый новый инструмент и, по мнению многих исследователей, самый перспективный. Они тоже однородительские ДНК маркёры: передаются из поколения в поколение только по одной линии — отцовской (как мтДНК — по материнской). Литературные данные фрагментарны, и мы предприняли собственное исследование, определив частоты гаплогрупп Y хромосомы для 14 русских популяций, выборки из которых были собраны нашим коллективом по единой схеме и по строгим правилам популяционной генетики.
«ПРОСТЫЕ» КАРТЫ. Мы видели, что для антропологии и классических маркёров карты отдельных признаков сложны, и чёткие закономерности выявляются лишь обобщёнными картами. А на картах отдельных гаплогрупп Y хромосомы видны простые, чёткие картины: из восьми изученных гаплогрупп для четырёх выявлена клинальная изменчивость (постепенные изменения в одном направлении).
ГЛАВНЫЙ СЦЕНАРИЙ. Первая главная компонента, обобщающая изменчивость отдельных гаплогрупп, демонстрирует широтную изменчивость.
Статистический анализ, как и в случае с мтДНК, выявляет плотный кластер центрально-южных популяций, тогда как северные русские популяции занимают каждая особое место. Степень различий между русскими популяциями (гетерогенность русского генофонда) по Y хромосоме особенно велика — 13.6. (Например, гетерогенность по Y хромосоме соседних украинских популяций оказалась на порядок меньше — около 1). Вспомним, что по классическим маркёрам гетерогенность русского народа была 2.0, а по мтДНК — 3.3. По этим результатам столь хорошо выявляемых различий между популяциями нам остаётся лишь присоединиться к мнению о перспективности Y хромосомы для изучения русского генофонда.
ОНОМАСТИКА: ФАМИЛИИ
Если антропологические маркёры — самые изученные, иммуно-биохимические маркёры — самые классические, маркёры митохондриальной ДНК — самые популярные, Y хромосомы — самые перспективные, то фамилии — это самые необычные маркёры. При этом они изучены подробнее, чем антропологические, имеют научный стаж лишь немногим менее чем классические, и являются, по нашему убеждению, весьма перспективными. Их пока нельзя назвать лишь самыми популярными, но наша книга, надеемся, поможет им и в этом.
Фамилии наследуются, и поэтому могут использоваться как аналоги генов. Читателей, несогласных с этим утверждением, мы отсылаем к главе 7, где подробно рассмотрены и недостатки, и достоинства фамилий как геногеографических маркёров, а также показана их информативность при геногеографическом анализе генофонда. Напомним, что когда мы говорим о любом признаке — мы всегда говорим о популяциях, а не об индивидах. Ведь книга посвящена популяционной генетике. Поэтому и фамилии рассказывают нам о закономерностях популяций, а не об отдельных людях, которые могут сменить фамилию по своему собственному усмотрению. (Ведь если Петрова станет Ивановой, а Иванова — Петровой, то в фамильном фонде популяции ничего не изменится).
Фамилии можно изучить чрезвычайно подробно. Поэтому по фамилиям можно прогнозировать генофонд там, где недостаточно времени и средств, чтобы изучать его напрямую — то есть практически везде! За несколько лет мы изучили население пяти областей — фамилии миллиона человек, представляющих сельское население в пределах «исконного» русского ареала. Пять регионов — Северный, Южный, Западный, Восточный, Центральный — стали каркасом нашего исследования. К сожалению, мы пока плохо знаем фамилии в промежуточных частях ареала между этими регионами. Поэтому картографирование мы смогли провести только для 75 фамилий — по ним имелись данные для всего ареала. А закономерности всех десятков тысяч фамилий изучены статистическими методами по пяти «опорным» регионам.
«ПРОСТЫЕ» КАРТЫ. Что же дало картографирование семидесяти пяти фамилий? Оказалось, что почти каждая фамилия имеет свой географический ареал, за пределами которого она отсутствует или крайне редка. Даже такие, казалось бы, повсеместные фамилии, как Иванов, Васильев, Смирнов, оказались отнюдь не повсеместными: Ивановых очень мало на юге, Васильевы сосредоточены в северо-западных областях, а Смирновы — в восточных и центральных.
ГЛАВНЫЙ СЦЕНАРИЙ. Эти 75 карт обобщены на картах первой и второй главной компонент. Первая компонента рисует постепенные изменения от северо-запада к востоку и к югу. Эта компонента сформирована в основном «календарными» фамилиями, которые (как, например, «Васильев») сконцентрированы на западе «исконного» русского ареала. Вторая компонента показывает широтную изменчивость: различия между южными и среднерусскими популяциями, но на севере эта закономерность нарушается — северные популяции резко своеобразны. Итак, по фамилиям мы тоже выявили широтную изменчивость, но она осложнена, запутана, затушёвана. Возможно, эти 75 фамилий просто недостаточно представляют весь фамильный фонд.
СПЕКТР. Поэтому статистический анализ мы провели по всему спектру фамилий, а их мы обнаружили 67 тысяч. Чтобы изучить коренное население, мы учли лишь деревни и небольшие города. Чтобы отсеять пришлые, «залётные» фамилии, мы для каждой популяции исключили те фамилии, которые встречены в районной популяции менее чем у 5 человек. Оставшиеся 14 тысяч фамилий мы сочли условно коренными, и работали дальше только с ними.
Оказалось, что из этих четырнадцати тысяч фамилий 250 повсеместны — встречены в каждом из пяти регионов. Остальное множество фамилий закономерным образом распределено по регионам. В Западном регионе преобладают календарные фамилии — происходящие от имён православного календаря (Иванов, Васильев, Петров). В Центральном регионе — «звериные», включая и «птичьи», и фамилии от названий растений (Волков, Воробьев, Калинин). Для Восточного характерны как звериные, так и «приметные» фамилии (Смирнов, Румянцев, Белов). В Южном регионе чаще всего встречаются профессиональные фамилии (Попов, Гончаров, Ткачёв), а в Северном — календарные и иные (Булыгин, Лешуков, Чурсанов). И по самым частым фамилиям, и по частотам всех 14000 фамилий регионы средней полосы (Западный, Восточный, Центральный) оказались похожи. А Северный и Южный регионы отличаются и от средней полосы, и друг от друга.
СРАВНЕНИЕ РЕЗУЛЬТАТОВ
Мы рассмотрели основные результаты по шести типам признаков, характеризующих русский генофонд: соматологическим, дерматоглифическим, классическим генетическим маркёрам, митохондриальной ДНК, гаплогруппам Y хромосомы, фамилиям. Это как бы шесть очевидцев, рассказывающие нам о структуре русского генофонда. Сравним, похожи ли их рассказы. Главные закономерности по каждому типу признаков выявлены картами главных сценариев. В тексте мы описывали лишь первые компоненты, но в таблице 10.1.1. учитывались три наиболее значимые компоненты. Итак, в этой таблице сопоставлены 15 свидетельств: по три компоненты для каждого из пяти типов признаков (для мтДНК пока слишком мало изучено русских популяций, чтобы строить надёжные карты). И показана корреляция, сходство каждого свидетельства с каждым.
Мы видим, что почти все первые главные компоненты высоко коррелируют друг с другом (левый верхний прямоугольник таблицы). Особенно дружны оказались классические генетические маркёры и антропологические признаки, к ним присоединяется Y хромосома и, с некоторым отрывом, дерматоглифика и фамилии. Конечно, между свидетельствами есть и различия, особенно на уровне менее значимых вторых и третьих компонент. Но в целом, пять разных типов признаков (несмотря на различную изученность, различный набор популяций, различные размеры выборок, разную информативность самих признаков и т. д.) обнаруживают единый строй генофонда. Поэтому мы можем утверждать, что выявили реальную структуру русского генофонда, которая пробилась сквозь все несовершенства наших исследований.
Таблица 10.1.1. только показывает степень сходства основных закономерностей. Сами же эти закономерности показаны на рисунке 10.1.1. Мы видим, что все карты выявляют одно и то же — широтное направление изменчивости. Одни экстремумы расположены в северных областях, экстремумы противоположного знака занимают южные русские территории. В промежуточной зоне значения плавно изменяются.
Таблица 10.1.1.
Сходство главных компонент изменчивости пяти типов признаков: антропологии, дерматоглифики, фамилий, классических генных маркёров, гаплогрупп Y хромосомы
Четыре карты незначительно различаются лишь двумя элементами: 1) относительным положением южного ядра (на разных картах оно смещается западнее или восточнее, или же выявляются сразу оба — юго-западное и юго-восточное ядра); 2) степенью выраженности северного “поморского” ядра.
Вернёмся к корреляциям. Общее сходство первых главных компонент по всем типам признаков можно измерить коэффициентом множественной корреляции. Его величина составила 0.9. Тогда коэффициент детерминации достигает 0.8. Это означает, что обобщённые карты самых различных признаков на 80 % детерминированы некой единой темой структуры русского генофонда, и лишь на 20 % допускают вариации на заданную тему. Эта единая тема — широтная изменчивость русского генофонда. Очень высокая гетерогенность русского генофонда как бы растянута по оси «север<=>юг», и, двигаясь в этом направлении, мы увидим наибольшие отличия между русскими популяциями.
Рис. 10.1.1. Свидетельства четырёх очевидцев: карты первых главных компонент изменчивости
A. Главный сценарий антропологии (соматология).
Б. Главный сценарий дерматоглифики (кожные узоры).
B. Главный сценарий классических маркёров генетики.
Г. Главный сценарий антропологии маркёров Y хромосомы.
Примечание: все карты приведены в «надёжном» ареале, обеспеченном исходной информацией по данному типу маркёров.
СВИДЕТЕЛЬСТВА АРХЕОЛОГИИ
Ось Север — Юг сформировала геополитическую основу древнерусского государства
Н. А. Макаров
Мы выслушали шесть очевидцев, свидетельства которых проанализировали одной и той же картографической технологией. Но есть и другие важные свидетели, подтверждающие выявленные нами закономерности. Мы уже не раз говорили о том, что широтное деление Русской равнины (север, юг и серединка) согласуются с данными лингвистики о подразделении русского языка на северные, южные и переходные среднерусские говоры.
Археология ранее придерживалась иного мнения о Древней Руси — «киево-центристской» концепции, где северу отводилась роль второстепенной провинции. Однако накопление данных заставило пересмотреть это мнение: большинство археологов сейчас рассматривает становление Древней Руси как результат объединения двух равноправных государственных образований — Киева и Новгорода [Седов, 1999; Носов, 2002; Янин, 2004; Макаров, 2005]. Более того, Новгородские земли и Киевщина рассматриваются лишь как части двух обширных историко-культурных ареалов с различными направлениями внешних связей: Юг ориентировался на Причерноморье, а Север — на Балтику. Причём влияние Балтики простиралось на внутренние континентальные области Восточной Европы вплоть до Волго-Клязьменского междуречья, Белозерья и Северной Двины. Различия между Севером и Югом охватывали широчайшие пласты культуры: различия в керамике, градостроительстве, жилых постройках, сельскохозяйственных культурах, денежно-весовых системах, характере расселения. Причём мнение о бедности Севера по сравнению с цветущим Югом оказалось неверным — торговля пушниной позволяла большой части населения Севера жить в большем достатке и довольстве, чем на Юге, где богатство скапливалось у элиты. Своеобразной была и средняя полоса Русской равнины, в которой встречались культурные традиции Севера и Юга.
Но для генетики, конечно же, важно, насколько движение культуры было связано с миграцией самого населения, миграциями генов. И здесь тоже есть примечательные перемены в археологии. Прежние представления о массовых передвижениях восточных славян с юга на север в XI–XIII веках оказались преувеличенными. «Археологические материалы раскрывают многочисленные факты подвижек населения на север внутри регионов или через границы сопредельных областей, но не подтверждают картины массового отлива населения из южнорусских земель» [Макаров, 2005, с.8].
Итак, новые данные археологии — ещё один и очень важный свидетель. Пусть мы пока не можем проанализировать их теми же методами геногеографии, что и прочие массивы данных. И потому не можем включить археологию Русской равнины как равноправного свидетеля в наше основанное на картах исследование — этот свидетель пока не говорит на универсальном языке карт. Но свидетельство археологии мы должны заслушать хотя бы на её собственном языке. И это свидетельство не только вновь подтверждает два полюса русского генофонда и стрелку, указывающую на север (или на юг). Этот новый свидетель сообщает нам, что своеобразие Севера связано со своеобразием именно славянского мира. Важность этой информации трудно переоценить! Мы уже не раз встречались с тем, что своеобразие генофонда Русского Севера нельзя объяснить только мощным финно-угорским пластом. На него накладывался второй фактор — своеобразие северного славянского пласта генофонда. А особость культуры помогала сплавить все эти составные части в яркий и многоликий генофонд Русского Севера.
РУССКИЙ ГЕНОФОНД В КРУГУ СОСЕДЕЙ
Выявление широтной изменчивости в русском генофонде (ось «север<=>юг») тем удивительнее, что ожидать можно было лишь «противоположной» — долготной изменчивости (ось «запад<=>восток»). Ведь для генофонда Восточной Европы, который включает русский генофонд как составную часть, убедительно показана долготная изменчивость. А «исконный» ареал русского народа занимает основную часть Восточной Европы. Он сложился на основе восточнославянских, балтских и финно-угорских племён, а возможно также тюркоязычных и ираноязычных — едва ли не всех групп, населяющих восточную половину Европы. Поэтому основная закономерность генофонда Восточной Европы (долготная изменчивость и должна была отразиться в русском генофонде, если он действительно складывался, как и Русское государство, «прирас-танием», механическим включением в себя всё новых и новых групп населения. То, что выявлена иная, широтная изменчивость, указывает на принципиальный факт своеобразия русского генофонда. Это своеобразие состоит в том, что основное направление изменчивости русского генофонда не сводимо к исходной изменчивости тех субстратов, племён и народов, на основе которых он формировался. По-видимому, широтная изменчивость возникла или же усилилась в ходе собственной истории русского генофонда.
ВОСТОЧНАЯ ЕВРОПА
Напомним, почему для генофонда Восточной Европы мы так уверенно говорим о долготной изменчивости. В главе 8 рассмотрены пять обширных массивов данных: антропология (соматология), дерматоглифика, классические генетические маркёры, аутосомные ДНК маркёры, митохондриальная ДНК. По сути, для «большой матрёшки» (Восточной Европы) проведён столь же разносторонний анализ, как и для меньшей, вложенной матрёшки (русского генофонда). Можно выделить семь основных результатов изучения генофонда народов Восточной Европы.
1) Значительная межпопуляционная изменчивость. В Восточной Европе она намного больше, чем различия между популяциями в Западной Европе: этот результат подтвержден двумя свидетелями: и классическими маркёрами, и мтДНК.
2) Восточноевропейский генофонд сформирован главным образом народами индоевропейской и уральской языковых семей. Причём основная часть Восточной Европы похожа на результат длительного смешения этих двух генофондов. Что же касается народов третьей языковой семьи — алтайской, то их влияние меньше и ограничивается юго-восточными степными районами (этот результат также подтверждён двумя свидетелями: и аутосомными ДНК маркёрами, и классическими).
3) Средняя частота «азиатских» генов в Восточной Европе мала, и их распределение строго упорядочено — частота постепенно возрастает с запада на восток. Так что восточные славяне ещё полностью принадлежат европейской генетической провинции; на территории Волго-Уральского региона происходит постепенное увеличение частоты «азиатских» генов до значимых величин (10–30 %), но не до 50 %, то есть и этот регион преимущественно ещё «европейский»; лишь Западная Сибирь оказывается пограничной областью между западно-евразийским и восточноевразийским генофондами (это данные по мтДНК, но и второй свидетель — Y хромосома — также не выявляет высоких частот «азиатских» гаплогрупп в Восточной Европе).
4) В Европе межпопуляционные различия особенно велики между финно-угорскими популяциями.
Восточнославянские группы сравнительно менее дифференцированы и выглядят мигрантами, расположившимися в центре «финно-угорского мира» и отчасти смешавшимися с ним (предварительные результаты по мтДНК).
5) Карты генетических расстояний сравнивают каждую популяцию Восточной Европы со «среднестатистической» русской популяцией. Оказывается, что почти вся Восточная Европа близка к «среднерусскому» генофонду. Лишь на востоке, к Уральским горам, и на юге, к Кавказским горам, популяции начинают отличаться от среднерусских величин. Несколько областей, непохожих на среднерусские, есть и на Восточно-Европейской равнине — например, северные русские популяции (данные по классическим и ДНК маркёрам).
6) Вторые главные компоненты, выявляющие вторую по значимости закономерность, показывают различия между южной (степной) и северной (лесной) частями Восточной Европы (классические маркёры, аутосомные ДНК маркёры, антропология, дерматоглифика).
7) Первые главные компоненты (важнейшая закономерность) показывают долготную изменчивость Восточной Европы (классические маркёры, аутосомные ДНК маркёры, антропология, дерматоглифика, мтДНК).
Итак, важнейшая черта восточноевропейского генофонда — наличие в нём «западной» и «восточной» групп популяций. Генетические различия между ними и создают постепенный, плавный переход — долготную изменчивость.
История народов Восточной Европы богата переселениями, смешениями разнородных групп — от прихода с востока гуннов до экспансии на восток славян, многими другими миграциями, хуже известными нам из-за своей древности. Многие из них проходили по оси «запад<=>восток». Поэтому любое из этих событий (или все они вместе) могли сформировать долготную изменчивость.
ЕВРАЗИЯ
Надо сказать, что долготный тренд не ограничивается Восточной Европой. Он уходит далеко на восток и продолжается также на запад. Долготный тренд — основная закономерность генофонда всей Евразии. А долготный тренд Восточной Европы — лишь фрагмент, часть этого постепенного изменения, протянувшегося от Иберийского полуострова до Корейского. Эту глобальную закономерность евразийского генофонда особенно наглядно показывают карты, построенные нами для гаплогрупп митохондриальной ДНК. И мы опять видим постепенность этого тренда — огромные пространства заняты «промежуточными» генофондами. Напрашивается сопоставление между западно-евразийским генофондом и европеоидной расой, с одной стороны, и зоной преобладания восточноевразийских гаплогрупп и монголоидной расой, с другой.
В геногеографии есть правило — чем тренд масштабнее, тем он древнее. И для глобального долготного тренда есть прямые доказательства его древности: проведённый нами картографический анализ археологических культур верхнего палеолита показал, что 26–16 тысяч лет назад уже существовали резкие различия между населением западных областей (Европа) и восточных областей (Сибирь).
НА ФОНЕ ЕВРАЗИИ
Итак, долготный тренд — базовая, древняя закономерность Евразии, фрагмент этого тренда хорошо виден в Восточной Европе. Но в русском ареале, занимающем обширнейшую срединную часть Восточной Европы, на первый план вышла це эта фоновая, «подстилающая» долготная изменчивость, а иная, широтная закономерность, которая является собственной, характерной чертой русского генофонда.
Гетерогенность русского генофонда велика и заметна даже на картах «евразийского масштаба». Эта гетерогенность во многом описывается широтной изменчивостью, частично — множеством иных закономерностей. Многие из них мы перечислили в этом разделе, многие — в главах этой книги, но, вероятно, ещё больше остались нам неизвестны. Однако достоверно известно: в масштабе Евразии, разделяемой в первом приближении на западные, восточные и промежуточные области, русский генофонд однозначно относится к западному стволу. В следующем разделе мы специально рассмотрим этот вопрос.
А пока ещё раз напомним, что всё наше исследование стоит на трёх китах: геногеографической технологии, банках данных и многоочем (мультиокулярном) подходе.
ТРИ КИТА
КИТ ПЕРВЫЙ: ГЕНОГЕОГРАФИЯ. Развиваемая нами геногеографическая технология выявляет пространственную структуру генофонда с помощью карт. Создаются компьютерные (цифровые) географические карты распространения каждого гена или каждого признака. Эти точные цифровые матрицы интерполированных значений признака позволяют дальше проводить любой статистический анализ, открывают путь к картографическому обобщению. Они дают возможность и «вычислить» генофонд, и воочию увидеть его на карте.
КИТ ВТОРОЙ: БАНКИ ДАННЫХ. Созданные нами банки данных собрали воедино и помогли легко оперировать огромными массивами данных. Без банков данных, опираясь лишь на немногочисленную информацию, было бы невозможно разностороннее и надёжное изучение структуры генофонда.
КИТ ТРЕТИЙ: ОЧЕВИДЦЫ. Самые разнородные данные несут информацию о структуре генофонда — мы использовали признаки физической антропологии, классические гены, ДНК полиморфизм и фамилии. И среди всех этих свидетелей нет ни одного абсолютно надёжного. Один и тот же генофонд каждый свидетель описывает по-своему, преломляя через себя. И нам не остаётся ничего другого, как рассмотреть генофонд через каждую призму. Это и есть мультиокулярный подход, многоочевидческий, многоочий. Только сравнив все портреты генофонда, только увидев его глазами каждого очевидца, мы можем приблизиться к пониманию реальной структуры генофонда.
10.2. АЗИАТЫ ЛИ МЫ?
Татары и монголы: есть ли что общее? — Сколько у нас генов из Центральной Азии? — Нет их! — Не азиаты мы, увы! — Ни по бабушкам — Ни по дедушкам — Ни по облику — Русский генофонд: типичный европеец — А вовсе не евразиец — «Эффект ига»: изменение потоков русских миграций — «Поскреби татарина и увидишь финно-угра» — «Поскреби восточного русского и вновь увидишь финно-угра»
Мильоны — вас.
Нас — тьмы, и тьмы, и тьмы.
Попробуйте, сразитесь с нами!
Да, скифы — мы! Да, азиаты — мы,
С раскосыми и жадными очами!
Для вас — века, для нас — единый час.
Мы, как послушные холопы,
Держали щит меж двух враждебных рас
Монголов и Европы!
О старый мир! Пока ты не погиб,
Пока томишься мукой сладкой,
Остановись, премудрый, как Эдип,
Пред Сфинксом с древнею загадкой!
Россия — Сфинкс! Ликуя и скорбя,
И обливаясь черной кровью,
Она глядит, глядит, глядит в тебя
И с ненавистью, и с любовью!..
Да, так любить, как любит наша кровь,
Никто из вас давно не любит!
Забыли вы, что в мире есть любовь,
Которая и жжёт, и губит!
Мы любим всё — и жар холодных числ,
И дар божественных видений,
Нам внятно всё — и острый галльский смысл,
И сумрачный германский гений…
Мы любим плоть — и вкус её, и цвет,
И душный, смертный плоти запах…
Виновны ль мы, коль хрустнет ваш скелет
В тяжёлых, нежных наших лапах?
Привыкли мы, хватая под уздцы
Играющих коней ретивых,
Ломать коням тяжёлые крестцы
И усмирять рабынь строптивых…
Придите к нам! От ужасов войны
Придите в мирные объятья!
Пока не поздно — старый меч в ножны,
Товарищи! Мы станем — братья!
А если нет — нам нечего терять,
И нам доступно вероломство!
Века, века — вас будет проклинать
Больное позднее потомство!
Мы широко по дебрям и лесам
Перед Европою пригожей
Расступимся! Мы обернёмся к вам
Своею азиатской рожей!
Идите все, идите на Урал!
Мы очищаем место бою
Стальных машин, где дышит интеграл,
С монгольской дикою ордою!
Но сами мы — отныне вам не щит,
Отныне в бой не вступим сами,
Мы поглядим, как смертный бой кипит,
Своими узкими глазами.
Не.сдвинемся, когда свирепый гунн
В карманах трупов будет шарить,
Жечь города, и в церковь гнать табун,
И мясо белых братьев жарить!..
В последний раз — опомнись, старый мир!
На братский пир труда и мира,
В последний раз на светлый братский пир
Сзывает варварская лира!
Александр Блок. «Скифы»Где ж ты видел монголоидного гунна?
Из научной дискуссии[59]Нелегко спорить с поэтом. Но ведь нам и не придётся спорить с тем, что действительно важно в этом стихотворении Блока. Нам вообще не придётся спорить — мы лишь посмотрим, каковы научные данные о «нас — азиатах», и откуда взялся миф, что мы — это они.
Стоит в любой аудитории упомянуть, что мы изучаем русский генофонд, как за этим всегда следует вопрос: насколько сильно его изменили татары? Иногда тот же вопрос звучит в иной формулировке: «сильно ли его изменили монголы?» И в обоих случаях имеют в виду одно и то же: не сходство с генофондом современных нам европеоидных татар-земледельцев, живущих в Приуралье, а генетическое сходство с теми ордами номадов, которые в XIII–XV веках шли из Центральной Азии и несли её чуждые гены в Европу. Этот вопрос нам задавали в самых разных аудиториях, не только в России, но даже в США. Похоже, самое распространённое представление о русском генофонде выражается фразой «поскреби русского и увидишь татарина». Сейчас мы попробуем честно ответить на этот многократно заданный вопрос.
Однако, каков вопрос, таков и ответ. Мы будем пользоваться (да простят нас профессионалы!) той же терминологией, что и задающие эти вопросы непрофессионалы. Иначе этот раздел превратился бы в лекцию о том «что иметь в виду под термином…», и заинтересованным лицам, не склонным к долгим научным уточнениям, это представилось бы способом уйти
от прямого ответа. Нет, мы хотим дать максимально прямой и корректный ответ на непрофессионально заданный, но всех волнующий вопрос. Но при этом просим читателя на время оставить уже готовые ответы — хотя бы до конца этого раздела.
ПОСТАНОВКА ПРОБЛЕМЫ
Чтобы не запутаться в словах, начнём с того, что современные татары и монголы — два разных народа, между генофондами которых очень мало общего. Поэтому мы будем говорить конкретно лишь о том, какие последствия для русского генофонда имело «татаро-монгольское иго», то есть завоевание Руси в XIII веке и последовавшая зависимость русских княжеств от Золотой орды и её наследников. Конкретнее: каков вклад в русский генофонд степных завоевателей XIII века и нескольких последующих веков? Или ещё ближе к совопросникам века сего: стал ли (и если — да, то насколько) русский генофонд в результате этих завоеваний монголоидным — «с раскосыми и жадными очами»? Естественно предполагать, что завоеватели оставляли своих потомков в местном населении, что завоевание сопровождалось и смешанными браками, и переселениями отдельных групп — наверное, ни у кого не вызывает сомнения, что при политическом подчинении одного народа другому происходит смешение их генофондов. Вопрос лишь, в какой степени.
«Завоеватели» происходили из степей Центральной Азии. Поэтому нам остаётся лишь определить, насколько русский генофонд стал похож на центрально-азиатский (а не на генофонд современных нам татар!).
Отделить генетический след «татаро-монгольского» ига от следа более древних и много более длительных взаимодействий генофондов запада и востока (см. 9 главу) нам поможет сравнительная геногеография. Если, скажем, генофонд поляков (другого славянского народа, который монгольские завоевания затронули лишь отчасти, а трёхсотлетнее иго не затронуло вовсе) или же народов Севера Европы (куда никогда не доходили волны номадов) окажутся не похожими на центрально-азиатский генофонд, а русский генофонд, напротив, приближен к нему — то эту близость к центрально-азиатскому генофонду можно отчасти связывать с татаро-монгольским игом. Почему лишь отчасти? Потому что наличие такого сходства русского генофонда и Центральной Азии может быть результатом и более древних миграций, а вот если сходства не будет — это однозначно укажет на отсутствие «татарского следа». Всё это — правдоподобная модель, а реальность, конечно, сложнее. Но популяционная генетика всегда пользуется относительно простыми моделями, чтобы получить чёткий количественный ответ, а потом уже двигаться дальше — с помощью уточнённых моделей.
Итак, вопрос о «генетическом наследии татаро-монгольского ига» мы формулируем так: насколько русский генофонд похож на генофонд Центральной Азии на фоне отсутствия такого сходства у народов, не бывших «под игом».
ДАННЫЕ ПО МИТОХОНДРИАЛЬНОЙ ДНК
По этому типу маркёров народы Центральной Азии и Европы различаются замечательно чётко: в Центральной Азии почти всё население — более 90 % — обладает восточно-евразийскими гаплогруппами, тогда как в Европе почти всё население — более 95 % — обладает иными, западно-евразийскими гаплогруппами (см. карты в разделе 9.2). Поэтому доля восточно-евразийских гаплогрупп в русском генофонде прямо покажет: есть ли заметный вклад центрально-азиатского населения в русский генофонд или его нет?
Сразу же договоримся, что считать эффектами смешения и «заметным вкладом» — 0.5 %, 5 % или 50 % восточно-евразийских гаплогрупп в русском генофонде? Учтём, что подразделение на за-падно — и восточно-евразийские гаплогруппы не абсолютно. Итак, если в Европе (включающей всё население до восточных склонов Урала) примерно 5 % генофонда «не западные», а в Центральной Азии примерно 10 % генофонда «не восточные», то наличие 15–20 % восточно-евразийских гаплогрупп могло бы чётко маркировать присутствие «монголоидного» центрально-азиатского пласта в русском генофонде. 20 % восточно-евразийских гаплогрупп означало бы приток 18 % «монголоидных» генов в русский генофонд, а 15 % восточно-евразийских гаплогрупп — приток 13 % центрально-азиатских генов. Если кто-то желает увидеть ещё менее значительные и почти неощутимые влияния, то чтобы распознать их, ему надо провести анализ очень объёмных выборок — иначе результаты будут недостоверными.
НЕ АЗИАТЫ МЫ… УВЫ…
Однако доля восточно-евразийских гаплогрупп в русском населении составила лишь 2% (ом. раздел 6.2.). То есть очень малую величину. Почти столь же малую, что и в генофонде поляков (1.5 %) или севера Европы, где уж точно никаких «татаро-монгольских вкладов» не было (у норвежцев 0.6 %, у исландцев 0.7 %, у карел 4.8 % и т. д.). Средняя «фоновая» частота восточноевразийских гаплогрупп в Европе равна 3.6 %. То есть в русском генофонде (2.0%) она даже меньше, чем «средняя по Европе», поэтому монголоидный компонент у русских оказывается не просто нулевым, но даже с отрицательным знаком1. Итак, мы не видим последствий монгольского нашествия в русском генофонде — или тогда должны видеть эти последствия и в польском, и в норвежском, и в карельском, и в других генофондах Европы.
Не ошиблись ли мы? Давайте проверим. Все использованные данные, то есть частоты гаплогрупп мтДНК, получены по большим выборкам, самыми разными исследователями, и поэтому вполне достоверны. Но может быть, армии Чингисхана и Батыя состояли не столько из населения Центральной Азии, сколько из степных народов Южной Сибири? Но и в Южной Сибири восточно-евразийские гаплогруппы составляют пусть не полные 90 %, а только 60–80 %, но это всё равно несопоставимо больше, чем 2 %! Пожалуй, иной читатель — не желающий расставаться с романтической картинкой «монгольского следа» — предпочтёт предположить, что монгольские армии состояли из европеоидных воинов! Но мы-то проверяем мнение о «нас — азиатах», а такой читатель в пылу полемики начинает защищать уже совсем иной миф — что «татаро-монголы» ничем от населения Европы генетически не отличались. Но такой читатель забывает, что тогда снимается и сама проблема — если генетически Золотая Орда и её наследники были, по его мнению, европейцами, то это уже становится внутренним делом Европы: перемещения народов в её пределах. А ведь мы решаем проблему влияния Азии на генофонд Европы.
Чтобы составить своё мнение об «азиатском вкладе», достаточно взглянуть на карту распространения восточно-евразийских гаплогрупп (глава 9). На карте хорошо видно, как суммарная частота этих гаплогрупп постепенно снижается к западу: в Китае частота максимальна, в Южной Сибири меньше, ещё ниже она на Урале, на европейских склонах Урала эти гаплогруппы уже редки, а зоны расселения восточных славян они едва касаются.
Может быть ещё одно возражение: мтДНК наследуется по материнской линии, а «генетический вклад завоевателей» ожидается скорее по отцовской. Ну, лично нам «генетический вклад» представляется обычно не в дыму пожаров, а скорее в виде браков с соседними, пусть и не всегда дружелюбно настроенными, народами. А значит, смешение популяций происходит и по мужской, и по женской линиям. Но всё-таки это возражение отметать нельзя, поэтому рассмотрим данные по Y хромосоме («мужская», отцовская линия наследования).
ДАННЫЕ ПО Y ХРОМОСОМЕ
Результаты изучения гаплогрупп Y хромосомы (раздел 6.3) также не показывают значительной доли «степных монголоидных» генов в русском генофонде. Среди восьми гаплогрупп, преобладающих в русском генофонде, есть «восточноевропейская» R1a, «скандинавская» I1а, «балканская» I1b, «западноевропейская» R1b, «ближневосточная» J2, «африканосредиземноморская» E3b, «западносибирская» N2, «восточноевропейско-сибирская» N3 — но нет «степных», «центральноазиатских» гаплогрупп. Правда, R1a встречается и в степях Сибири — но реже, чем у русских. Гаплогруппа N3, частота которой в Сибири выше, чем у русских, остаётся единственным кандидатом на «степное» происхождение (хотя эта гаплогруппа скорее «таёжная») — но, увы, она встречена лишь в северных русских популяциях, а генетическое влияние степного населения должно было бы проявиться в южных районах исторического русского ареала. В любом случае — N3 распространена по всему северу Восточной Европы, и у эстонцев, финнов, латышей встречается куда чаще, чем у русских, так что монгольские армии тут явно ни при чём.
Любопытны данные по эпикантусу — типичнейшему признаку монголоидной расы, особенно характерному как раз для степного населения Центральной Азии. Антропологическое исследование, проведённое на огромной выборке русских (несколько десятков тысяч человек) практически не выявило случаев выраженного эпикантуса [Хрисанфова, Перевозчиков, 1999].
ПРОФЕССИОНАЛЬНОЕ ЗАКЛЮЧЕНИЕ
Итак, какой бы признак мы ни взяли, мы видим, что русские — типичные европейцы, а азиатское завоевание оставило след в русской истории, но не в русском генофонде.
Да и могло ли оно оставить след в генофонде? Наш эпиграф начинается словами Блока: мильоны вас (европейцев), нас (азиатов-степняков) — тьмы, и тьмы, и тьмы. Слово «тьма», наряду с переносным значением «множество» имело и прямое значение «десятй тысяч» [; Герберштейн, 1987]. Итак, на «мильоны» европейцев приходятся «десятки тысяч» степняков. Демографически эта оценка вполне реалистична. То есть прямой смысл блоковского стихотворения противоположен его поэтическому смыслу: завоеватели отнюдь не были многочисленны в сравнении с численностью населения на завоёванных территориях. И значимому генетическому вкладу просто неоткуда было взяться![60]
Так откуда же взялось столь распространённое мнение, что генетически «мы — азиаты», или, по крайней мере, промежуточное звено между Европой и Азией? Увы, это мнение распространено и в научной среде. Мы уже упоминали про один — но характерный! — случай, когда по какому-то показателю русские оказались промежуточны между французами и китайцами, и Учёный совет, состоящий из прекрасных учёных, счел это совершенно естественным. Мнение о промежуточности русского генофонда столь широко распространено — но ему нет серьёзных научных подтверждений. Одни лишь серьёзные научные опровержения.
Не берёмся говорить о России и русских в культурном, историческом, гуманитарном смысле. Но биологически (генетически) — нет, нет и нет. Русский генофонд не является промежуточным между типичным европейским и типичным азиатским генофондом[61]. Русский генофонд является типичным европейским генофондом.
Надо сказать, что нас самих такой вывод огорчил. Миф о нашей «промежуточности» пустил глубокие корни… Героическая роль «генетического щита» между Азией и Европой грела душу и будила мысль… И с эстетической точки зрения тоже — так хотелось верить, что и монголоидный пласт встроен в русский генофонд: за время экспедиций мы научились видеть тонкую красоту и гармонию монголоидных лиц. Но, увы! Не русскому генофонду выпала роль «буферной зоны» между западом и востоком, не он стал местом их встречи — эта роль досталась иным народам, живущим на восток от Урала. А русский генофонд остался в строю народов европеоидных, западно-евразийских.
Только когда мы усвоим — твёрдо усвоим! — это основное свойство, только тогда можно начать уточнять: русский генофонд является самым восточным из типично европейских; отдельные азиатские влияния прослеживаются в русском генофонде несколько больше, чем у его западных соседей; уровень гетерогенности европейских генофондов мал, сибирских — велик, а восточноевропейские генофонды, в том числе русский, промежуточны (но не по генетическому составу, а по уровню гетерогенности!) между западноевропейскими и сибирскими; структура современного татарского генофонда и его взаимодействие с русским куда сложнее, чем может показаться на первый взгляд, и заслуживает отдельной монографии; и так далее.
Но базовый, главный вывод, который следует из проведённого изучения русского генофонда — это практически полное отсутствие в нём монголоидного вклада. Даже исследуя исключения, никогда нельзя забывать это правило.
ДИЛЕТАНТСКОЕ МНЕНИЕ
Выполнив профессиональный долг, не можем удержаться, чтобы не высказать своё собственное, теперь уже дилетантское мнение. Как нам кажется, последствия «татаро-монгольского ига» для русского генофонда есть, но заключаются совсем не в том, как это представляется обычно. Не во вкладе «центрально-азиатских генов», а в изменении миграций собственно русского населения. То есть в изменении направления и интенсивности потоков генов, которые, в свою очередь, сказались на русском генофонде, в какой-то степени перестроив его структуру. Возможно, лишь в небольшой степени и только для восточной части русского ареала.
Известно, что монгольское завоевание застало Киевскую Русь в период феодальной раздробленности.
Узнали то татары, Ну, думают, не трусь. Надели шаровары, Приехали на Русь. Алексей Константинович ТолстойЧасть древнерусских княжеств попала в зависимость от Золотой Орды, и на этой территории впоследствии сформировался русский народ. Другая часть древнерусских княжеств вошла в состав Литовского (позже — польско-литовского) государства, и образовала украинский и белорусский народы. Разделение древнерусской народности на разные народы — это ли не значимые последствия монгольского завоевания! Впрочем, те же процессы могли идти и до, и после «татаро-монгольского ига», а возможно, и независимо от него.
Подумаем ещё и о том, что восточные славяне — в течение тысячелетия, с беспримерной энергией — колонизировали огромные пространства, от Днепра и до Волги, до Енисея, до Юкона. Единственная пауза в этом многовековом процессе — период ига, когда восточное направление было закрыто Золотой Ордой и её наследниками. В эти столетия проходила так называемая внутренняя колонизация русских земель, и не на эти ли века вынужденного сидения в своих границах пришлось само формирование русского народа?
Мы пишем эти строки в Макарьеве, городке в Костромской области, который возник вокруг монастыря, основанного преподобным Макарием Желтоводским и Унженским. В его житии читаем, что основанный им на Волге Желтоводский монастырь был разрушен татарами, а он сам и «около четырёхсот человек, не считая женщин, детей и стариков» взяты в плен, но затем отпущены. Новое место для поселения было выбрано на Унже в Галичских землях, и вблизи города Унженска в 1439 году был основан Макарьево-Унженский монастырь:
И он плывет над Унжей, словно щит От окаянного номада.«В 1522 году в княжение великого князя Василия Ивановича было страшное нашествие татар на Унженск. Врагов было свыше двадцати тысяч, а городок был мал и жители в военном деле неискусны…. Главным у них был некий воевода Федор. При виде нападавших, он впал было в растерянность, но, узнав от жителей, что святой старец Макарий Желтоводский всегда защищал их от татар, Федор пошёл в церковь, упал на колени перед иконой преподобного и стал молиться со слезами, прося отвести беду от Унженска и избавить людей от смерти и плена. Тем временем татары снова пошли на приступ и со всех сторон подожгли город…. Вдруг пошёл дождь, скоро он перешёл в ливень, и сделался потоп. Вода затопила улицы и дома, казалось, весь город поплыл, и пожар утих. Теперь татары пришли в смятение… Взятые в плен рассказали, что они видели монаха, стоявшего в воздухе над городом и стрелявшего по ним; потом он на большом белом коне врезался в их войско и они, обезумев от страха, начали рубить друг друга мечами, думая, что бьются с русскими».
«В 1535 году молитвами Макария Желтоводского спасся от татар город Солигалич».
«Когда казанские татары осадили Унженск, одна молодая женщина по имени Мария попала в плен…. Когда сделали очередной привал, Мария рухнула на землю и, связанная, заснула крепким сном. Было это в степи. Стояла глухая ночь. Ближе к утру спящей явился преподобный Макарий…. Мария проснулась и, видя преподобного уже не во сне, а наяву, узнала его по виденной ей иконе и пошла следом…. Когда совсем рассвело, Мария увидела, что стоит на дороге, ведущей в Унженск, а невдалеке виднеется и сам город».
«Однажды был тяжело ранен воевода Иван Выродков. Между тем князь приказал ему снова идти против татар. Несмотря на болезнь и уговоры близких, воевода собирался исполнить повеление, а так как ходить он не мог, то приказал везти себя в повозке. По дороге завезли его в Макариеву обитель».
Мы почти и не выбирали эти несколько фрагментов — почти все, перечисленные в житии, чудеса преподобного связаны с защитой от татар. Этот агиографический источник, вероятно написанный современниками, рисует картину постоянных войн с татарами в приволжских землях. (Мы имеем в виду среднее течение Волги примерно от Костромы до Казани, и соответствующие притоки Волги — Унжу, Оку, Ветлугу, Суру). Мы читаем о вызванных войнами переселениях, истреблениях селений, пленениях… Не приходится сомневаться, что все эти события влияли на миграции и демографическую структуру русского населения. Но был ли при этом генетический вклад «татарского компонента»?
Русское население по реке Унже изучено нами по митохондриальной ДНК (раздел 6.2). Суммарная частота восточно-евразийских гаплогрупп составила 4 %, при среднем уровне в русских популяциях 1–2%. У современных татар частота восточно-евразийских гаплогрупп составляет около 10 %. Такие невысокие частоты и недостаточные объёмы обеих выборок не допускают точных вычислений. Но даже если считать двухпроцентное повышение частоты реальностью, всё равно оно слишком мало. А главное, повышение частоты восточно-евразийских гаплогрупп к востоку это, как говорилось, общий евразийский тренд, древность которого измеряется тысячелетиями. И чуть повышенная частота у русских Унжи, скорее всего, вызвана смешением не с татарами, а с финно-угорским племенем меря (родственным современным мари), жившем на Унже до прихода славян.
Ещё раз подчеркнём: влияние татарских государств — это совсем не тот вклад «центрально-азиатского генофонда», возможность которого мы обсуждали чуть выше. Совсем не тот хотя бы потому, что генофонд как современных, так и средневековых татар составлен из многих компонентов, и «азиатский» степной компонент, возможно, не главный в нём, как мы видим и из невысокой частоты восточно-евразийских гаплогрупп у татар. Вся сложность задачи реконструкции истории на основе современного татарского генофонда как раз в том, что «поскреби татарина и увидишь финно-угра» — тот же самый финно-угорский пласт, лежащий в основе и русского генофонда на востоке его ареала. В главе 2 мы видели, что «поскреби восточного русского и увидишь финно-угра». И попробуй теперь их всех как-то различить!
Итак, наше мини-исследование Унженского края не обнаружило особого вклада «татарского компонента». Нам кажется, что влияние татарских государств заключалось скорее в вызванном ими оттоке населения, изменении структуры, закономерности миграций — то есть в демографических, а не генетических изменениях. Это совершенно разные процессы, и их нельзя путать: одно дело — миграция «местных русских генов» в пределах русского же ареала (реально имевшая место в связи с русско-татарскими войнами), а другое дело — прямой генетический вклад «пришлых татарских генов» (небольшой или вообще отсутствующий).
Напомним, что тем более важно чётко отличать генетические влияния степных номадов Азии (о котором мы только и можем говорить как генетики) от культурных влияний[62].
Тем более что спустя время, как известно, военное счастье повернулось лицом к Москве.
И в московской неволе Томились татарские ханы, Посланцы Золотой, Переметчики Черной Орды. Дмитрий КедринИ русское завоевание осколков Золотой Орды, не столь широко известное, было не менее драматичным и важным для истории региона, чем монгольское завоевание Руси тремя с половиной веками ранее. Но оставим историкам и поэтам оценивать эти события. Для генетиков важнее, что после покорения Казани Москвой опять продолжались миграции, как русского, так и татарского населения. Возможно, переселение многих групп татар в приказном порядке на «более русские» земли, практиковавшееся после падения Казани, могло куда значительнее сказаться на притоке татарских генов в восточный русский генофонд, чем все составляющие татаро-монгольского ига вместе взятые! Поэтому было бы важно изучить генофонд современных татар и собрать больше данных о русском населении приволжских районов. Это специальное исследование могло бы прояснить многие страницы истории русского и татарского генофондов. Возможно, обнаружится не только перекомпоновка генофондов в результате переселений, но и отдельные случаи реального смешения русского и татарского населения. Важно лишь постоянно помнить, что всё это события местного масштаба и не придавать им значения основополагающего фактора формирования русского генофонда в целом.
Итак, анализ русского генофонда однозначно показал практически полное отсутствие вклада монголоидного населения (азиатских степей). Ограниченное взаимодействие с татарским генофондом (европейских степей) возможно, имело место. Но не заметно, чтобы интенсивность смешений русского населения с татарским превышала обычный уровень смешений в зоне контакта двух народов. Нелишне напомнить, что русский генофонд контактирует со многими народами — Северного Кавказа, с украинцами, белорусами, латышами, эстонцами, финнами, карелами, коми, удмуртами, марийцами, мордвой и — в этом общем ряду — и с татарами.
10.3. КАК НЕЛЬЗЯ ЧИТАТЬ КАРТЫ
Правдивость карт и лукавство интерпретаторов — Как нельзя манипулировать шкалами — Как нельзя интерпретировать карты — Разрешающая способность карт не беспредельна — А что сказали другие очевидцы? — Каковы интервалы, таковы и карты — Генофонд познаётся в сравнении — Пределы надёжности — Что нельзя увидеть на карте — Генофонду нужны обобщения — Сериал обобщённых карт
Существует достаточно света для тех, кто хочет видеть, и достаточно мрака для тех, кто не хочет.
ПаскальИнтерес к истории народов никогда не был чисто академическим. Эти вопросы волнуют многих, самых разных людей. И свидетельства генетики, хотя и отнюдь не непогрешимые, очень важны как особый, обширный, объективный источник сведений о популяциях человека. Авторитет генетики в этих вопросах велик и среди специалистов. А для широкой аудитории утверждение «генетики показали» выглядит особенно убедительно. Сейчас и в прессе, и в повседневных разговорах, и в Интернете часто обсуждаются вопросы родства народов, их различий, их истории, а в качестве аргументов приводятся генетические данные, нередко поминается и «генофонд».
ПРАВДИВОСТЬ КАРТ И ЛУКАВСТВО ИНТЕРПРЕТАТОРОВ
И всё бы хорошо, но прекрасный, доброкачественный интерес к истории своего народа иногда, к несчастью, как хорошо известно, злокачественно перерождается в пренебрежение к другим народам. И очень опасно дать возможность интерпретировать генетические данные в политическом ключе. Из-за этих опасений мы думали даже отказаться от публикации нашей книги. Но отсутствие чётких научных данных не мешает антинаучным спекуляциям, а только даёт им больше простора. Научное же, объективное рассмотрение при отсутствии объективных научных данных вообще невозможно — честному исследователю тогда просто нечего противопоставить буйству странных высказываний. Поэтому мы решили, что лучше всё-таки опубликовать объективные данные, пусть даже они могут быть превратно истолкованы.
И, увы, наши опасения стремительно оправдались. Ещё до выхода книги информация о ней появилась в нескольких журналах настолько искажённой, что нам пришлось даже давать опровержение[63]. Причём эти искажения не задевали нас самих — нас, увы, хвалили! — искажения носили подчёркнуто шовинистический[64] характер превратного толкования данных о генофонде.
Как ни тяжела мысль, что любая страница этой книги может быть в искажённом виде перепечатана в антинаучной пропаганде разных толков, использующей данные биологии для утверждения социального неравенства между людьми или для обоснования геополитических претензий, но мы не можем ничего с этим поделать. Генетические данные сами по себе никак не подтверждают идеи древности какого-либо народа, его превосходства, его территориальных претензий — скорее они их опровергают. Но те же данные — если их нужным образом подтасовать, сместить акценты, исказить — легко могут быть использованы для такой пропаганды[65]. И единственное, что мы можем сделать — это перечислить несколько приёмов, которыми часто пользуются для такой подтасовки. Это не призыв к совести использующих эти приёмы — бесполезно. Это призыв к здравому смыслу читателей: видеть, что данные о генофондах — научны, а их шовинистическая, расистская, евгеническая, националистическая, геополитическая и подобные интерпретации почти всегда антинаучны.
В этой книге мы не можем осветить эту тему подробно. Поэтому из множества видов ненаучного толкования генетических данных мы коснёмся лишь тех, которые связаны с геногеографическими картами. За то, как будут интерпретированы наши карты, мы чувствуем свою персональную ответственность. Тем более что уже были случаи их антинаучного толкования.
КАК НЕЛЬЗЯ ИНТЕРПРЕТИРОВАТЬ ГЕНОГЕОГРАФИЧЕСКИЕ КАРТЫ
Мы наблюдаем интереснейшее явление: бессмыслица как средство общения между людьми.
Станислав Ежи Лец.
Недавний пример такой ненаучной интерпретации — обсуждение недавно вышедшей книги А. И. Микулича о генофонде белорусов [Беларусы у генетычнай прасторы]. Мы очень надеемся, что в этом вина не А. И. Микулича, но его результаты были превратно истолкованы.
Процитируем рассказ о презентации этой книги, появившийся на сайте : «Тенденция изменения белорусского имеет направление с запада на восток[66]… Все карты совпали. Они показывают, что происходила миграция с белорусских земель на юго-восток, и расселение славянского этноса началось с наших земель… Карта генетических изменений от среднерусских частот генов у населения восточной Европы на основании этих материалов была напечатана в 1 томе Генофонда населения России и сопредельных стран. На ней видны особенности генофонда белорусов, к которым присоединяется Виленский край, Псковщина, Смоленщина, Брянщина, Новгородчина и часть украинского Полесья… Во втором томе этого издания была дана интерпретация этой карты, где наш этнос был назван западно-русским. Микулич сказал, что он с этим не согласился и его это встревожило, о чем он и написал московским коллегам».
Прежде всего подчеркнём, что генетические границы не имеют никакого отношения ни к политическим границам (которые определяются политической ситуацией), ни к этническим границам (которые определяются этнической самоидентификацией группы населения).
Приведённые ссылки на «Генофонд и геногеографию» неточны, но, по-видимому, речь идет о карте, построенной нами много лет назад, и с тех пор неоднократно представленной на конференциях — карте генетических расстояний от генофонда русского народа. Хотя в данном случае было бы логичнее апеллировать к нашей карте генетических расстояний от белорусов, и возможно, она тоже имелась в виду (её очень часто публикует А. И. Микулич). Обе карты мы привели и в этой книге (рис. 8.3.4. и 8.3.7). Ранее также публиковались разные варианты этих карт. Взглянув на карту генетических расстояний от белорусов (рис. 8.3.7.), мы действительно увидим минимальные значения, то есть близость к белорусскому генофонду, как на территории самой Белоруссии, так и в соседних русских областях — Псковской, Смоленской, Брянской. Нужно учесть всего лишь несколько «но», каждое из которых сводит на нет одностороннюю интерпретацию этой карты, превратно толкующую данные науки в терминах притязаний на территории, на особую древность или же «чистоту» генофонда.
Расскажем о нескольких правилах. Их надо помнить, чтобы правильно интерпретировать карту.
1. У КАРТ РАЗРЕШАЮЩАЯ СПОСОБНОСТЬ (ТОЧНОСТЬ) — НЕ БЕСПРЕДЕЛЬНА
Например, она зависит от точности и подробности исходных данных. Разрешающей способности упомянутой «белорусской» геногеографической карты совершенно недостаточно для интерпретации с такой географической точностью. Недостаток или отсутствие данных, например, по Смоленской области легко приведёт к интерполяции на эту территорию «белорусских» значений — то есть к чисто техническому артефакту, не имеющему отношения к реальным популяциям. И даже при наличии данных по конкретной области их немногочисленность или статистическая ошибка выборки всегда могут несколько сместить ход изолиний на карте.
В рассмотренном нами случае (анализа белорусского генофонда по классическим маркёрам) как раз было изучено очень большое число белорусских популяций на фоне редких русских и украинских популяций. Чисто технически это «смещает» характерные для белорусов частоты генов на территории, населённые русскими и украинскими популяциями. Но иные интерпретаторы толкуют эти неизбежные технические особенности как «…особенности генофонда белорусов, к которым присоединяется Виленский край, Псковщина, Смоленщина, Брянщина, Новгородчина и часть украинского Полесья». Особенно нужна бдительность при выявлении тонких различий между такими близкородственными, генетически сходными популяциями, как русские и белорусы, — для выявления различий между близкими генофондами нужны большие и очень хорошо собранные выборки для всех соседних генофондов!
В целом, эта карта позволяет сделать обоснованный вывод (который мы и делали неоднократно) что белорусский генофонд обладает определённым генетическим своеобразием, причём границы этой зоны примерно соответствуют территории Белоруссии. Примерно! Большей точности с имеющимися данными не достичь.
2. А ЧТО СКАЗАЛИ ДРУГИЕ ОЧЕВИДЦЫ?
Тем более важно сравнение с другими картами, другими очевидцами. Например, если те же самые карты классических маркёров рассмотреть с точки зрения карты расстояний от русских, то мы увидим, что белорусы куда более похожи на русских, чем многие русские! То есть генетическое своеобразие белорусского генофонда выявляется только тогда, когда мы «ручку шкалы» перекручиваем на очень детальный масштаб.
Но разрешающая способность «масштабирования» не безгранична. Самый тонко дифференцирующий генетический маркёр — гаплогруппы Y хромосомы — показал (рис. 8.3.8.) удивительное сходство генофондов белорусов, поляков и западных русских. По этому сверхчувствительному маркёру своеобразие белорусского генофонда не обнаруживается! Такие разночтения во мнениях очевидцев говорят об отсутствии надёжных генетических свидетельств своеобразия белорусского генофонда — вероятно, это своеобразие существует, но находится где-то на грани чувствительности генетических методов.
3. КАКОВЫ ИНТЕРВАЛЫ — ТАКОВА И КАРТА
Нельзя верить каждому завитку карты — слишком много зависит от техники её построения. Например, от выбранной шкалы интервалов. Пусть сейчас изолиния проходит восточнее государственной границы Белоруссии и, как может показаться, «обосновывает» территориальные претензии — если не на государственном уровне, то для общественного мнения[67]. Но стоит ту же самую карту просто привести в другой шкале, как изолиния пройдет иначе, уже западнее границы Белоруссии. Так что же, та же самая карта теперь «обосновывает» уже обратные претензии? Любопытно, что именно такова оказалась судьба этой карты. С одной стороны, её интерпретируют, как «расселение славянского этноса началось с наших земель» (имеется в виду — с белорусских). С другой стороны, тот же автор приводит и оспаривает мнение, что белорусы (на основании той же карты!) являются не отдельным народом[68], а западным вариантом русского этноса. Как видим, достаточно поменять шкалу, чтобы оправдать ту или иную трактовку. А выбор шкалы всегда оставляется на усмотрение исследователя и является в большой мере произвольным.
Но довольно о белорусах — использование данных генетики для обоснования «превосходства» любого другого народа или его геополитических претензий столь же антинаучно. Поэтому мы взяли карту расстояний от русского генофонда до всех популяций Евразии (рис. 9.3.1.) и перестроили её в двух разных шкалах (рис. 10.3.1.А,Б). Но если в девятой главе, мы, как обычно, использовали наиболее объективную равномерную шкалу (рис. 9.3.1), то здесь мы специально взяли своеобразные шкалы: одна «минималистская», подробно рассматривающая «в микроскоп» изменчивость самых малых величин, а другая «максималистская», интервалы которой покрывают большие значения расстояний и потому видящая всё «в телескоп». Цифровые модели всех трёх карт совершенно одинаковы. Но вот видимый нами образ карты зависит от того, где мы проведём линии, разграничивающие интервалы шкалы.
И что же мы видим? На первой карте (рис. 10.3.1.А) генетически сходными с русскими оказались популяции западных побережий Балтийского моря, а сами русские и вся остальная Европа на русский генофонд мало похожи. Каким подарком могла бы быть такая карта — будь она верна! — для любителей подчёркивать норманнское или германское влияние на русский генофонд! А ошибка-то простая — недостаточность исходных данных не позволяет достоверно различать крайне малые расстояния — сейчас зона ультра-малых расстояний случайно расположилась на Балтике, а могла бы — и в русском ареале, и в Турции, и в Испании.
Авторы просят читателя взглянуть ещё и на ту «стену» резкого нарастания отличий, которая отграничивает русский генофонд от Азии (рис. 10.3.1.А). Кажется, карта показывает: Западная Евразия на русский генофонд ещё хоть как-то похожа, а вот Азия — нет, и различия нарастают очень быстро — как раз примерно там, где проходит географическая граница Европы и Азии. Красивый вывод? Но ложный. Западная Евразия действительно больше похожа на русский генофонд, чем Азия, но вот стремительного нарастания генетических различий в районе географической границы на самом деле нет. Просто шкала специально сделана неравномерной, и изолинии, которые попадают на район «географической границы» пущены погуще, что и создаёт визуальное впечатление быстрого нарастания генетических различий. В действительности же — при использовании равномерной шкалы интервалов — это нарастание не такое уж и быстрое, и картина, приуроченности к границам Европы-Азии сложнее.
Поэтому мы всегда используем равномерные шкалы — они ограничивают свободу интерпретаций в пользу большей объективности. Если же в особых случаях приходится применять неравномерные шкалы, к их выбору следует относиться крайне внимательно, и обязательно оговаривать неравномерность шкалы в пояснениях к карте. Так что мы советуем читателям любых геногеографических карт почаще смотреть, какая шкала у данной карты (как составители карты выбрали граничные значения интервалов). Это очень помогает более объективному и критическому восприятию картографического образа.
Если теперь взглянуть на «максималистскую» карту (рис. 10.3.1.Б), мы увидим совершенно иную картину. Трудно поверить, что это та же самая карта! Но это она. Просто шкала теперь подобрана так, что показывает читателю не малые и не средние расстояния (они все попали в один, самый первый — белый — интервал), а рисует лишь распределение больших и сверхбольших значений. Эта карта правильная — но её интерпретация будет правильной, лишь если учесть эту особенность шкалы. Если же вовсе не смотреть на шкалу (как многие и делают, читая карту!), то легко сделать вывод, что генофонд всей Европы, Ближнего Востока и даже Африки — ну совершенно как русский, а зато Восточная Евразия совершенно на русских непохожа.
Рис. 10.3.1. В зависимости от выбранной шкалы можно получить раз ные картографические образы на одних и тех же данных.
А. Карта расстояний от русских в «минималистской» и неравномерной шкале.
Б. Карта расстояний от русских в «максималистской» и неравномерной шкале.
Та же карта в равномерной шкале приведена на рис. 9.3.1.
Напомним, что при «минималистской» шкале этой же самой карты (рис. 10.3.1.А) не то что Ближний Восток — сами русские были на себя не похожи, то есть картина выглядела совершенно иной. И такие шутки может сыграть с нами любая карта — если мы не будем требовать от её шкалы равномерности, обоснованности, и сопоставимости с аналогичными картами.
Поясним про сопоставимость: если рассматривается серия однотипных карт, то все они должны быть по возможности построены в одной и той же шкале. Например, в разделе 8.3. авторам было бы очень легко создать впечатление близости всей Европы к генофонду белорусов и удаленности от генофонда украинцев (или же наоборот) — для этого достаточно было дать расстояния от одного народа в шкале через 4 %, а от другого через 1 %. Но мы специально во всей книге строго выдерживали правило сопоставимости шкал — и карты расстояний от русских, украинцев и белорусов по данным об Y хромосоме (рис. 8.3.6., 8.3.8., 8.3.9.) построены в единой шкале с равномерным шагом 2 %[69]. Именно поэтому, приводя карты генофонда Евразии (глава 9), авторы каждый раз докучливо напоминали читателю — в какой именно равномерной шкале построена карта: с десятипроцентным интервалом, трёхпроцентным или же однопроцентным. Сами авторы строили карты во всех шкалах, и описывали их, держа перед глазами не один, а несколько вариантов одной и той же карты.
Подбор шкалы интервалов — это лишь самый простой из способов манипулирования взглядами читателя с помощью карты. Чтобы избежать такого манипулирования, мы можем посоветовать доверять лишь тем явлениям на карте, которые очерчиваются не одной, а двумя изолиниями — такие явления уже слабо зависят от выбранной шкалы (для равномерных шкал).
Мы сами часто пользуемся «критерием двух изолиний» чтобы отделить устойчивые структуры на карте от эфемерных. К сожалению, мы не можем приводить в книге каждую карту в разных шкалах — но для себя мы всегда строим целую серию карт, чтобы не зависеть от случайности извивов изолиний (см. Приложение).
Другое требование — шкала обязательно должна быть равномерной (см. Приложение). Неравномерная шкала обычно означает, что она была специально подобрана так, чтобы подчеркнуть какую-то одну особенность карты. Поэтому карта в неравномерной шкале может быть более наглядной, но всегда менее объективна.
4. ГЕНОФОНД ПОЗНАЕТСЯ В СРАВНЕНИИ! НО КОРРЕКТНОМ…
Ещё один приём некорректной интерпретации — приводить цифры, не указывая «фон», на котором они получены. Например, всех обычно волнует вопрос о степени генетической гетерогенности русского народа, то есть размахе различий между русскими популяциями «исконного» ареала. Наиболее достоверную величину (GST=2.0) мы интерпретировали как «умеренно высокую», потому что эта гетерогенность русского народа выше, чем средняя гетерогенность других народов Восточной Европы. Но при ненаучной интерпретации ничто не помешало бы назвать русский народ исключительно гетерогенным (сравнив его, например, с англичанами или датчанами, гетерогенность которых на порядок меньше GST=0.2). Ничто не помешало бы дать и противоположную интерпретацию: назвать русский народ генетически гомогенным, единообразным, сравнив его, например, с эвенками или тофала-рами, гетерогенность которых намного выше (GST=7.7). Забыв при этом, что сравнивать можно только со «стандартами» генофонда каждого региона — у каждого они свои, ибо у каждого своя история.
Подобную игру можно вести как на табличных данных, так и считывая значения с карт. Например, дискуссия об особости белорусского генофонда или его неотличимости от русского сводится к вопросу: достоверны ли те малые генетические различия, которые мы видим между двумя генофондами? И как ни решать этот вопрос, нельзя забывать, что эти различия (реальные или мнимые, достоверные или нет) в количественном отношении крайне малы.
Поэтому всегда надо сравнивать не с тенденциозно подобранными популяциями, а с общим фоном собственного региона и его соседей. Такие «стандарты региона» уже дают бесстрастную меру и не позволят в качестве критерия использовать нестандартные для региона величины.
5. ПРЕДЕЛЫ НАДЁЖНОСТИ КАРТЫ
Современная геногеографическая технология обладает замечательным инструментом — оценкой достоверности не только каждой карты, но и каждой точки на карте. Специальные карты надёжности (см. Приложение) показывают, какова вероятность, что в данном месте карта показывает правильное значение, и какова вероятность ошибки. При этом учитывается важнейший показатель: чем больше популяций было непосредственно изучено в данной области карты — тем выше надёжность данной области. Оценку надёжности, как и любой статистический показатель, конечно, не стоит абсолютизировать. Но, тем не менее, карты надёжности — верный проводник для забирающихся глубоко в дебри геногеографических карт. Они помогут понять, что на карте заслуживает доверия, а что показано лишь приблизительно, гипотетично.
6. ЧЕГО НЕЛЬЗЯ УВИДЕТЬ НА КАРТЕ
Важно чётко осознавать, что именно картографировано на данной карте — что она может показать, а что нет. Например, ни одна геногеографическая карта не показывает направление и пути миграций. Карта показывает только изменения в генофонде, а видеть в них результат миграции или других факторов — дело интерпретатора. Даже когда интерпретация в терминах миграций обоснована, карта сама по себе никогда не показывает направление, в котором шла миграция. Например, карту первой главной компоненты восточноевропейского генофонда можно интерпретировать как миграции с запада на восток, или (равновероятно) с востока на запад, или же как итог совместного действия миграций и с запада, и с востока.
Случается, что карте приписывается совершенно иное содержание, чем она имеет в действительности. Так, в упоминавшейся публикации в «Коммерсант Власти» перепечатана наша карта, якобы показывающая «границы «исконного» русского ареала по данным генетики». В действительности же эта карта просто показывает нам, какую территорию мы изучили достаточно подробно. Стоит нам изучить ещё одну популяцию (или изменить критерий «достаточной подробности»), как ареал, очерчиваемый картой, изменится. Какие перспективы для политических спекуляций открывает простая подмена понятий «полунаукой»!
7. ГЕНОФОНДУ НУЖНЫ ОБОБЩЕНИЯ!
Нужно остерегаться и чрезмерного доверия к картам отдельных признаков. Им лучше вообще не доверять! Карта отдельного признака показывает лишь географию этого признака, и ничего более. А географию генофонда показывают обобщённые карты. Правда, иногда отдельный признак может хорошо маркировать какой-либо популяционный процесс, но такие случаи редки, обычно в изменчивости одного признака слишком много капризов индивидуального, специфического, случайного. Поэтому чтобы увидеть географию генофонда, нужно обратиться к обобщённым картам — главных компонент, генетических расстояний, картам разнообразия… Да и то нужно всегда помнить, какой объём исходных данных обобщает карта. Если число признаков велико, если изученных популяций много и они распределены по всей изучаемой территории, если применены корректные методы картографирования — только тогда обобщённая карта является надёжным свидетелем о генофонде. Но даже в этом случае, как мы говорили, не стоит доверять каждому изгибу изолиний — достоверна только общая тенденция изменчивости, а детали могут быть непостоянны, и зависеть от случайных причин.
8. СЕРИАЛ ОБОБЩЁННЫХ КАРТ
Самый верный, самый безопасный, самый объективный путь — рассмотреть несколько обобщённых карт, с разных сторон описывающих генофонд. Это могут быть обобщённые карты, построенные по разным типам признаков. Именно так мы и поступили в этой книге, изучив русский генофонд по классическим маркёрам, по ДНК маркёрам, по антропологическим признакам, по фамилиям. И именно совпадение результатов уверяет нас в их объективности.
Серия карт может быть организована и по другому принципу — не по разным признакам, а по разным генофондам. Например, сравнение иерархически соподчинённых генофондов (вложенных друг в друга, как матрёшки). Или сравнение карт генетических расстояний от разных популяций. Мы уже сравнивали карты генетических расстояний от русского, украинского и белорусского генофондов (рис. 8.3.6., 8.3.8., 8.3.9). При сравнении этих трёх карт видно, что многие области Восточной Европы одинаково близки ко всем трём генофондам. Если бы мы рассматривали только одну из этих карт (например, от русских), то могли бы рассуждать так: многие области генетически близки к русским, а значит, русский генофонд — основной из восточнославянских. Но, имея все три карты, мы видим, что это же можно сказать и о генофонде белорусов, и о генофонде украинцев. И тем самым использование не одной карты, а сериала карт помогает сохранить объективность и непредвзятость выводов.
Технология геногеографических карт — мощный, объективный, универсальный инструмент, дающий чёткое представление о генофонде. Тем важнее правильно пользоваться этим инструментом и не ждать от него ответов на вопросы, лежащие за пределами компетенции научного знания. энтропия, гибель.
10.4. ДЕГРАДАЦИЯ ИЛИ СОХРАННОСТЬ ГЕНОФОНДА?[70]
Генофонд в королевстве кривых зеркал — В чём «благополучие» генофонда? — Три лика структуры генофонда — Подразделённостъ — Портрет — География — Три опасности, грозящие генофонду — Смешение — Болезни — Депопуляция — Лекарство — Кому его назначить — Сёла и малые города — «Исконный» ареал — Всем, не взирая на лица, нации и прописки — Каждому генофонду по дотации
Географы не только любуются различиями и сокрушаются, что по мере всеобщей унификации и стандартизации исчезает предмет их науки; они полагают, что само по себе пространственное разнообразие земного мира — важный ресурс, а уменьшение разнообразия — это регресс, деградация, энтропия, гибель.
Б. Б. РодоманВопросы динамики, деградации и стабильности генофонда даже специалисты признают не вполне ясными. Но интересуют они многих. Стоит ли удивляться, что при их обсуждении в широком кругу часто смешиваются разные понятия? Или молчаливо предполагаются причинно-следственные связи между вещами несопоставимыми. Или реально существующие связи упрощаются настолько, что они становятся уже нереальными. Генетика — уважаемая наука, и многие в спорах об истории, политике, общественных проблемах прибегают к генетической аргументации. К сожалению, эта аргументация часто недостаточно обоснованна, а бывает, что и просто неверна. В этом разделе мы попытались обрисовать то, как с точки зрения самой генетики можно увидеть эти проблемы.
На протяжении всей книги мы обращаемся только к научному мышлению читателя. Мы предлагаем факты и ищем чисто научные пути их анализа. Это не модно. Это не соответствует стилю быстрого потребления — но полуфабрикаты вредны для здоровья. Мы ограничивали себя строгими рамками научного мышления. И здесь мы не изменим этому правилу.
Поэтому сразу разочаруем читателя, надеющегося, что хоть в конце книги мы заговорим человеческим языком и в двух словах объясним, наконец, что за беда случилась с русским генофондом. Напротив, именно здесь мы особенно последовательно попытаемся отсеять блёстки непродуманных мнений и попробуем, следуя строгому духу науки, нащупать те пути, на которых можно найти научные ответы даже на «популярные» темы.
ГЕНОФОНД В КОРОЛЕВСТВЕ КРИВЫХ ЗЕРКАЛ
Популярность генофонда растёт с каждым годом. Но любой научный термин, пустившийся в свободное плавание, обрастает, как днище старого корабля, бесчисленными чужеродными телами, примкнувшими к нему за время плавания в чужих водах. И представления о генофонде порой оказываются неузнаваемыми в отражениях королевства кривых зеркал. Не беря на себя смелость оценить их, мы всё же дадим некоторый обзор этих отражений науки во мнении общественности. Это поможет каждому из нас увидеть, какие именно мифы незаметно пристали к днищу его собственного корабля. Следуя учёной традиции, составим табличку (табл. 10.4.1), где в одной графе приведём мнения о генофонде (найденные в Интернете по запросу «генофонд»), в другой графе — положение этого типа мнений в классификации, и в последней — наши комментарии.
Поразительно, не правда ли? Даже из этой небольшой таблички хорошо видно, что когда слово «генофонд» произносят не ученые, они имеют в виду не генофонд, а нечто совсем иное. Чаще всего имеется в виду культура народа, его традиции, особенности «национального характера», то есть понятия чисто гуманитарные, этнографические, а вовсе не биологические. Или же могут иметься в виду демографические понятия: численность населения, его возрастная или сословная структура. Например, сколь часто мы слышим: «лучшая часть русского генофонда исчезла с эмиграцией русского дворянства». Но наука не делит генофонд на «лучшую» часть и часть «похуже». Такое деление придумывает антинаука — расизм и евгеника.
Генофонд — понятие не культуры и не демографии, генофонд — это абсолютно реальный биологический объект, который хотя и меняется под воздействием сдвигов в социуме, но со своей стороны не меняет социум. То есть генофонд или находится в страдательном залоге, или (чаще всего) вовсе ни при чём.
Например, если бабушка твёрдо следовала устоям и лучшим образцам русской культуры, удачно сочетая моральную строгость Домостроя с шедеврами русской словесности и балета, а её внучка предпочитает безвкусицу в одежде, сленг в речи и беспорядок в жизни (да не подумает читатель, что для авторов этот образ что-то иное, чем генетический пример!), то здесь можно огорчаться или радоваться — в зависимости от личных взглядов, можно призывать к сохранению традиций, или же призывать порвать с нелепым консерватизмом… Единственное, чего делать никак нельзя — нельзя упоминать при этом «генофонд». Нельзя забывать, что генофонд при этом не изменился ни на йоту — ведь у этой внучки из «поколения пепси-колы» митохондриальная ДНК точно та же, один в один, что и у её бабушки из «поколения Лебединого озера». То есть все эти культурные изменения не коснулись генофонда!
Таблица 10.4.1.
Разные взгляды на генофонд
ЦИТАТА
Государственная концепция безопасности Монголии.
IX. Монголия должна:1) осуществлять… политику, нацеленную на обеспечение генофонда, здоровья и устойчивого роста монгольского населения…3)… предотвращение узкородственного размножения, алкоголизма и наркомании, которые негативно воздействуют на монгольский генофонд…
ИСТОЧНИК ЦИТАТЫ
of_security/conception_11.htm
ПОДХОД К ГЕНОФОНДУ
МЕДИКО-ГЕНЕТИЧЕСКИЙ ПОДХОД
КРАТКИЕ КОММЕНТАРИИ
1. Кровнородственные браки увеличивают частоту рождения детей с рецессивными наследственными болезнями, но надо учитывать, что избегание кровнородственных браков не уменьшает числа генов наследственных болезней, циркулирующих в популяции.
2. «Узкородственное размножение» действительно может влиять на степень подразделенности генофонда, однако влияние на генофонд алкоголизма научно не доказано.
ЦИТАТА
Интервью с председателем комитета Государственной Думы
Что такое демографическая безопасность? Это потенциальная способность общества сохранять свой национальный генофонд и наращивать его в соответствии с теми нормами, которые характеризуют средний мировой уровень.
ИСТОЧНИК ЦИТАТЫ
ПОДХОД К ГЕНОФОНДУ
ДЕМОГРАФИЧЕСКИЙ ПОДХОД
КРАТКИЕ КОММЕНТАРИИ
1. «Общество» является сейчас понятием гражданским, а не этническим, поэтому у общества не может быть «национального» генофонда. Российское общество включает всех граждан России — и представителей русского народа (формирующих «русский национальный генофонд»), и представителей якутского, татарского, чеченского, удмуртского и многих других народов, формирующих свои — якутский, татарский или другие национальные генофонды. Если в США слово «nationality» используется в значении «гражданство», то в нашей стране все будут понимать слово «национальность» как «народ».
2. Слова «Наращивать генофонд» некорректны с позиций популяционной генетики — в ней нет количественной меры генофонда: много его или мало.
3. «Средний мировой уровень» для генофонда — не существует. Мы видели, что в каждом регионе своя «норма» для генофонда. Одна и та же величина гетерогенности народа в Европе окажется большой, а в Сибири — маленькой. Цитата становится понятной, если убрать из нее слово «генофонд». Тогда мы увидим, что имеется в виду «сохранение и наращивание численности коренного населения населения».
ЦИТАТА
ВЕСТНИК ВОГиС, 1999, N 10.
Поскольку генетические нарушения, значимые для последующих поколений, появляются при облучении дозами, близкими к полу летальным, некоторые авторы делают вывод, что бомбардировка в Японии привела к трагедии, но генофонд японской нации не пострадал.
ИСТОЧНИК ЦИТАТЫ
ПОДХОД К ГЕНОФОНДУ
ЭПИДЕМИОЛОГИЧЕСКИЙ ПОДХОД
КРАТКИЕ КОММЕНТАРИИ
Выше, в «монгольском» примере говорилось об одной составляющей груза наследственных болезней — частоте их проявления. В этой же цитате делается акцент на другой составляющей — возникновении новых вредных мутаций. Но опять-таки, авторы цитаты воспринимают генетические изменения с точки зрения медицинских последствий, а не с точки зрения последствий для структуры генофонда.
ЦИТАТА
Вручение литературно-театральной премии «Хрустальная роза…»Знаменательно, что большинство награжденных из провинции… — там сильнее и чище генофонд нашей нации… Мы сильны тем, что в трудные моменты открываем в себе вот эту генетическую память и возрождаемся.
ИСТОЧНИК ЦИТАТЫ
ПОДХОД К ГЕНОФОНДУ
ЛИТЕРАТУРНЫЙ ПОДХОД
КРАТКИЕ КОММЕНТАРИИ
О генофонде, оказывается, иногда говорят и в терминах литературной одаренности. Но с точки зрения науки невероятно, чтобы особенности генофонда населения были связаны с литературной деятельностью этого населения. Эта цитата хороша тем, что показывает, насколько далеко употребление слова «генофонд» отошло от своего исходного научного смысла.
ЦИТАТА
Этрусское радио LIFO 36,6 FM
Мне иногда кажется, что это сборище просто неудачников…:(За генофонд обидно
ИСТОЧНИК ЦИТАТЫ
ПОДХОД К ГЕНОФОНДУ
СВОЕОБРАЗНЫЙ ПОДХОД
КРАТКИЕ КОММЕНТАРИИ
Ещё один пример, что в не научных дискуссиях «генофондом» называют то, что к собственно генофонду (как его понимают специалисты) не имеет ни малейшего отношения.
ЦИТАТА
Школа-семинар: «Проблемы генетической безопасности».
1) Выявление структуры генофонда.
2) Деградация генофонда — это разрушение или резкое изменение его структуры.
2) Опасности нарушения структуры генофонда…
ИСТОЧНИК ЦИТАТЫ
ПОДХОД К ГЕНОФОНДУ
ПОПУЛЯЦИОННО-ГЕНЕТИЧЕСКИЙ ПОДХОД
КРАТКИЕ КОММЕНТАРИИ
Таковы проблемы сохранения генофонда с позиций популяционной генетики. Это как раз то, как генофонд выглядит в глазах специалиста. Генофонд — это не культура народа, не его болезни, и не его численность. Генофонд — совокупность генов народа и закономерности, упорядочивающие эту совокупность. Безопасность генофонда — это сохранение его структуры, ненарушенность основных закономерностей.
Может возникнуть вопрос — а раз генофонд не хранит в себе культуру и традиции народа, то стоит ли такой генофонд сохранять? Авторы будут считать свою задачу выполненной, если читатели заинтересуются этим вопросом. Понимание того, что сохранение генофонда и сохранение культуры — понятия, слабо связанные между собой, осознание того, что решать эти проблемы следует раздельно — уже половина пути к ответу на поставленный вопрос. Нам остаётся повторить, что не науке, а обществу решать, что заслуживает сохранения. А наша наука может лишь указать, какие действия способствуют, а какие — бесполезны в деле сохранения биологического, генетического (а не культурного!) фонда народа.
В ЧЕМ ОТРАЖЕНО «БЛАГОПОЛУЧИЕ» ГЕНОФОНДА?
Итак, генофонд — это вовсе не то, что о нём говорят. Генофонд — это совокупность генов популяции (а один из уровней популяции человека — это народ). Эта совокупность генов, необходимая для существования популяции, изменчива и динамична, и эти изменения сказываются на самых разных сторонах жизни популяции. Поэтому зададимся вопросом: а какие опасности могут грозить генофонду? Что можно считать полезным, а что вредным для генофонда, что важным, а что несущественным?
Когда об этом заходит речь, то чаще всего называют наследственные заболевания и сокращение численности населения. Оба симптома неблагополучия объективны и интуитивно понятны. Гены наследственных болезней — это, несомненно, часть генофонда, и если их становится всё больше и больше, то это, с позиции здравого смысла, может сигнализировать о неблагополучии генофонда. Численность населения — если она снижается, то генофонд начинает непредсказуемо меняться под действием дрейфа генов (с точки зрения здравого смысла это скорее плохо, чем хорошо), а если численность становится ниже критической, то популяция исчезает, а значит и её генофонд тоже. Итак, у нас есть два свойства популяции, тесно связанные с сохранением её генофонда: численность популяции и частота в ней наследственных болезней. Но в чём состоит и как проявляется эта тесная связь? Можно ли в терминах численности и наследственных болезней говорить о деградации, или же, напротив, о сохранности генофонда? Давайте попробуем найти научный ответ на эти вопросы.
С точки зрения науки о генофондах — популяционной генетики — «индивидуальность», «суть» каждого генофонда заключена в его структуре. Как в сказке о Кощее Бессмертном — в глаза бросаются и дуб, и сундук, цепями к нему прикованный. Бросается в глаза то, что очевидно и что лежит на поверхности. Но всё же заветная «суть» бессмертия таилась в хрупком яйце и почти невидимом конце крошечной иглы. Именно здесь — в сохранении или разрушении этой тонкой структуры генофонда и таятся, на наш взгляд, гарантии его сохранения и опасности его разрушения. Но как эта структура генофонда связана с нашими интуитивными критериями — численностью населения и его наследственными болезнями? Попробуем разобраться.
Сначала договоримся о терминах. Главным популяционно-генетическим критерием состояния генофонда мы будем считать стабильность его структуры. Сохранение структуры генофонда — будет означать его собственную сохранность, а её разрушение — деградацию генофонда.
Мы не будем давать определения структуре генофонда — все определения сухи и самодовольны. Но ведь недаром в этой книге мы только тем и занимались, что выявляли структуру разных генофондов. Поэтому читатель знает, что о структуре генофонда нам рассказывают, во-первых, характер его подраз-делённости на субпопуляции и степень их изоляции (см. например сказку об изолах и миграх). Во-вторых, «генетический портрет» популяции: спектр аллелей и их частоты. В-третьих, пространственная изменчивость генофонда.
Это и есть три «лика» структуры генофонда. Для простоты рассмотрим их на примерах, прежде чем перейти к оценке благополучия генофонда.
ТРИ ЛИКА СТРУКТУРЫ ГЕНОФОНДА
ПОДРАЗДЕЛЁННОСТЬ. Первый показатель структуры генофонда — подразделённость на субпопуляции. Мы в каждой главе рассматривали этот показатель различий между популяциями и на картах, и в обычных статистических сравнениях. Ярче всего он отражён в оценках гетерогенности генофонда. Например, мы только что смотрели — кто «гетерогенней»: русские, англичане или эвенки? И оказалось, что генофонды англичан и датчан подразделены слабо, а у эвенков и тофаларов величина различий между популяциями огромна (глава 5). Однако подразделённость сказывается не только на популяционном, но и на «индивидуальном» уровне — генетических различий между индивидами внутри популяции, её гетерозиготности. Например, Ю. П. Алтуховым с коллегами [Алтухов и др., 1997] убедительно показана связь подразделенности популяции и поддержания баланса гомо — и гетерозигот на оптимальном уровне. Поэтому и гетерогенность генофонда, и его гетерозиготность могут многое поведать о состоянии структуры генофонда.
«ГЕНЕТИЧЕСКИЙ ПОРТРЕТ». Примером второго, более привычного взгляда на структуру генофонда может служить «генетический портрет» саамов по полиморфизму митохондриальной ДНК (рис. 10.4.1) [Tambets et al., 2004]. Этот народ, говорящий на языке уральской лингвистической семьи, населяет север Фенноскандии и вызывает неослабный интерес исследователей своеобразием антропологического облика и резкими генетическими отличиями от остального населения Европы. Митохондриальный портрет саамов очень беден красками — более 80 % всех мтДНК относятся лишь к двум гаплогруппам (рис. 10.4.1). Причём эти гаплогруппы являются не «уральскими», а «западноевропейскими». Что может рассказать о структуре генофонда такой его портрет? Ответ недавно получен: эти гаплогруппы были принесены первыми поселенцами из Западной и Центральной Европы [Tambets et al., 2004]. Окраинное положение и малая численность предковой популяции привели к интенсивному дрейфу генов: большинство гаплогрупп были утрачены, а две оставшихся встречаются со столь высокой частотой, как нигде более. Иными словами, даже столь необычный портрет генофонда можно изучать в терминах обычных популяционных механизмов и получать ответы о структуре генофонда.
Рис. 10.4.1. Структура и происхождение митохондриального генофонда саамов: пример дрейфа генов (по [Tambets et al., 2004]).
А. Митохондриальный портрет саамов (медианная сеть гаплотипов мтДНК, показывающая пути их происхождения друг от друга). Всего лишь две гаплогруппы U5 и V (затемнённые области) резко преобладают, частоты прочих гаплогрупп очень невелики. Размер кружка соответствует числу обнаруженных индивидов с данным гаплотипом.
Б. Обе эти гаплогруппы «прибыли» в нынешний ареал саамов на севере Скандинавии из отдалённых областей Западной и Центральной Европы, где они не были столь частыми, как теперь у саамов.
ГЕОГРАФИЯ ГЕНОФОНДА. Третий — пространственный, географический — лик структуры генофонда можно видеть на примере Кавказа [Балановская и др., 1999]. Серия карт распространения отдельных генов обобщена итоговой картой первой главной компоненты изменчивости генофонда Кавказа (рис. 10.4.2). Оказалось, что практически все северокавказские популяции характеризуются сходными значениями компоненты (тёмные тона — первый экстремум компоненты). Популяции за Большим Кавказским хребтом также сходны друг с другом, но значения у них совершенно иные (светлые тона — второй экстремум компоненты). Карта показывает, что промежуточные (нулевые) значения компоненты тянутся узкой лентой, следуя изгибам Большого Кавказского хребта. Причём в самих генетических картах географические преграды никак не заложены — пространство предполагается совершенно ровным, и гены могут растекаться по нему равномерно во все стороны. Но вопреки этому на карте генофонда Кавказа географические преграды проявились! Это означает, что карта обнаружила структуру генофонда. И мы можем сделать заключение о ней: структура генофонда Кавказа определяется горным хребтом, генетический рельеф генофонда — рельефом земной поверхности.
Рис. 10.4.2. Карта первой главной компоненты изменчивости гено фонда населения Кавказа (по классическим генным маркёрам).
СТРУКТУРА ИЗВЕСТНА. НО СТАБИЛЕН ЛИ ГЕНОФОНД?
Эти три примера иллюстрируют обычную ситуацию, когда в результате популяционных исследований структура генофонда объективно и детально изучена. Однако полученные ответы лежат в иной плоскости, нежели вопросы безопасности, стабильности, сохранности, благополучия или же разрушения генофонда. Мы знаем структуру генофонда, но как нам её интерпретировать, как решить, «благополучен» генофонд или же нет?
Положим, уровень подразделённости ещё кое-как можно считать показателем стабильности, хотя для этого надо его сравнить со «стандартами» данного региона. Но следует ли рассматривать обеднённость структуры генофонда саамов как негативное явление или же в нём можно видеть результат успешной адаптации? Зная, казалось бы, весь «генетический портрет» — как решить, хорош он или плох для генофонда? А в случае генофонда Кавказа главная закономерность, очевидно, и вовсе нейтральна, как бы ни оценивать «благополучие» генофонда — в демографических или же в медицинских терминах. То есть география генофонда вообще не имеет ни положительной, ни отрицательной окраски.
Как же отыскать связь между структурой генофонда и тремя угрозами стабильности генофонда — разрушением этой структуры, генетическим грузом и численностью населения? Для этого стоит взглянуть на те популяции, где изучены все три параметра: структура генофонда, наследственные болезни и динамика численности.
ТРИ ОПАСНОСТИ. ПОДСТЕРЕГАЮЩИЕ ГЕНОФОНДЫ
Итак, теперь у нас есть все три симптома, которые могут сигнализировать о неблагополучии генофонда. Первый симптом — разрушение структуры генофонда. Это ведомство геногеографии. Второй симптом — наследственные заболевания. Их изучает медицинская генетика. Третий симптом — сокращение численности. Это уже область демографии. Присмотримся же к тому, связаны ли эти три симптома и действительно ли они говорят о неблагополучии генофонда?
Для простоты мы рассмотрим три примера — три генофонда. И для каждого попробуем оценить все три симптома. Зададим всем трём генофондам одни и те же вопросы. Каково «состояние здоровья» структуры генофонда — устойчива она или разрушается? Каков груз наследственных болезней? Какова демографическая ситуация? Наша задача — выяснить, какие причинно-следственные связи существуют между всеми тремя факторами: структурой генофонда, грузом наследственных болезней и демографией. Это и будет научный ответ на вопрос о том, что считать деградацией генофонда, разрушается ли генофонд или устойчив к потрясениям.
В качестве нити в лабиринтах поиска научных ответов, сразу забежим в конец и скажем читателю основной вывод. Связь между генофондом, наследственной патологией и демографией реально существует. Но эта связь неоднозначна, и для разных генофондов различна. Упрощать эту связь, подменять общее частным, придавать одному из аспектов этой связи силу всеобщего закона — очень опасно.
ГЕНОФОНД ШАПСУГОВ;
Демография — «плохо»,
Заболеваемость — «плохо»,
Генофонд — «отлично».
Уникальным примером такой всесторонне изученной популяции являются шапсуги, одно из подразделений адыгейцев Северного Кавказа [Балановская и др., 1999, 2000; Почешхова, 2004].
Рис. 10.4.3. Динамика генофонда шапсугов во времени (карты главных компонент по данным о фамилиях в 6 поколениях)
A. Первое поколение (современность).
Б. Третье поколение.
B. Пятое поколение.
Г. Шестое поколение (около 150 лет назад).
ДЕМОГРАФИЯ. Демографические изменения, произошедшие с этим народом, можно назвать драматическими. До присоединения к России Северо-Западный Кавказ населяли главным образом адыги (черкесы), которых насчитывалось более двадцати племён общей численностью 1–4 млн. человек [Берже, 1858 (1992); Щербина, 1910; Хотко, 2001].
Присоединение к России — Кавказская война — продолжалось более ста лет. Это было покорение региона, все мужчины которого носили оружие.
Гражданского населения не было, и поэтому сокращение численности в результате военных действий было драматическим.
Когда Кавказ был окончательно покорёен, всё его оставшееся население рассматривалось как «неблагонадёжное». Поскольку оно номинально было мусульманским, им было предложено эмигрировать в Турцию. Тех же, кто не захотел уезжать, переселили на равнину.
Мы рассмотрим генофонд одного племени — шапсугов, которое ранее было самым многочисленным — более трёхсот тысяч человек. Они населяли горы от побережья Черного моря до Кубани. После войны шапсуги были переселены на равнину, в низовья Кубани. Но потом им было разрешено возвращаться, и часть вернулась на побережье. С тех пор шапсуги разделены на две группы — причерноморские и прикубанские. Эти две группы, разделённые Кавказским хребтом, занимают два небольших «оазиса» на окраинах прежнего ареала. Их общая численность — лишь десять тысяч человек, и они не смешиваются с окружающим населением.
Итак, на эту популяцию обрушились почти все мыслимые демографические потрясения: сокращение численности, массовая эмиграция, и вдобавок насильственное переселение. Что же можно сказать о реальных изменениях, которые произошли в генофонде?
ГЕНОФОНД. Благодаря небольшой численности шапсугов удалось провести тотальное изучение всего народа, причём собраны генеалогические данные на глубину шести поколений [Почешхова, 2004; Балановская и др., неопубликованные данные]. Это позволяет ретроспективно рассмотреть динамику генофонда (рис. 10.4.3.). Структура современного генофонда шапсугов, выявляемая картой первой главной компоненты, обнаруживает резкие отличия между прикубанскими и причерноморскими шапсугами. Карты генофонда, существовавшего два, три, четыре и пять поколений назад, оказались практически идентичны современному. Карта генофонда, существовавшего шесть поколений назад, наиболее интересна: она показывает, каким был генофонд до демографических потрясений. Отличия этой карты от современности оказались столь невелики, что можно констатировать: структура генофонда шапсугов сохранилась.
Таким образом, даже мощные демографические потрясения не привели к деградации структуры генофонда.
ЗАБОЛЕВАЕМОСТЬ. Однако кроме демографического аспекта у нас есть и второе понимание негативных процессов в генофонде. Как же обстоят дела с наследственной патологией у адыгейцев?
Таблица 10.4.2. показывает, что груз наследственной патологии у адыгейцев в два раза выше, чем у русских популяций, проживающих в том же регионе. Но свидетельствует ли это о неблагополучии генофонда адыгейцев?
Нет, поскольку несколько больший фон наследственных болезней (несколько — потому что у северных русских он практически такой же) — это свойство подразделённых популяций. Но та же подразделённость популяции обеспечила устойчивость структуры генофонда и позволила народу сохранить свой генофонд.
Обратная сторона подразделённости — повышение случайного инбридинга. Но чем выше инбридинг, тем выше груз наследственных болезней (табл. 10.4.2). Небольшая численность популяций и изоляция формируют такую структуру генофонда, которая повышает вероятность «встречи» вредных рецессивных аллелей, образуя гомозиготы, и тем самым повышая частоту наследственных болезней. В неподразделённых популяциях эти мутации находятся в скрытом виде. (Но, не проявляясь, вредные мутации в таких популяциях накапливаются.) А в подразделённых популяциях они проявляются в виде болезней (хотя постепенно популяция «очищается» от вредных мутаций). Такая «подразделённая» структура является для человека нормой — по крайней мере, она была характерна для популяций человека практически на всём протяжении их истории.
Таблица 10.4.2.
Показатели уровня случайного инбридинга (FST) и груза наследственных болезней(число человек)
Итог обследования генофонда адыгейцев: БЛАГОПОЛУЧЕН! Даже мощные демографические потрясения и несколько повышенный (в сравнении с окружающими русскими популяциями) груз наследственных болезней не привели к деградации структуры генофонда.
РУССКИЙ СЕВЕР;
Демография — «хорошо»,
Заболеваемость — «плохо»,
Генофонд — «отлично».
В таблице 10.4.2. мы видели, что южная русская популяция характеризуется очень низким инбридингом (и грузом наследственных болезней). Однако в другой, северо-восточной русской популяции и груз, и инбридинг выше.
Карта случайного инбридинга для русского генофонда (раздел 7.6) может служить прогнозом груза рецессивной патологии. Карта показывает, что уровень инбридинга возрастает к востоку и северу, т. е. к территориям с более редким и изолированным населением. Рассмотрим генофонд этих северных территорий, неблагополучных с точки зрения наследственной патологии.
Формирование населения Русского Севера связывают с новгородской и ростово-суздальской (низовой) колонизацией. Впоследствии, именно Русский Север оказался своеобразным этнографическим «заповедником» — например, практически все былины были записаны на Русском Севере. Как ни странно, но нигде ни на Украине, ни в южных или центральных русских губерниях не сохранились былины ни о богатырях, ни о князе Владимире Красное Солнышко. Даже былины «киевского цикла» были записаны на севере. Предполагается, что некогда былины сказывались повсеместно, но во времена татаро-монгольского ига были забыты. Только на Севере сохранилась былинная традиция. Подобно тому, как на Русском Севере произошла консервация культурной традиции, одновременно, как мы увидим, произошла и консервация генофонда. А «консервация» — это же и есть «сохранение».
На рис. 10.4.4. приведены данные по митохондриальному генофонду северных русских в сравнении с населением центральной России. Можно видеть, что на севере исчезает целый ряд гаплогрупп. На нашем графике мы видим общерусскую «гребенку» гаплогрупп (какой она была изначально во всех русских популяциях), и современную северную «гребенку с выломанными зубьями» — из-за дрейфа северные русские потеряли «зубчики» многих гаплогрупп. По всей вероятности, с северными русскими происходили те же процессы, что и с саамами — небольшие группы колонистов приходили, и вследствие случайного дрейфа генов, теряли часть разнообразия.
Рис. 10.4.4. Митохондриальный генофонд Русского Севера в сравнении с населением Центральной России
Штриховкой выделены гаплогруппы, нетипичные для большинства русских популяций. Их присутствие на Русском Севере маркирует смешение северных русских популяций с автохтонным финно-угорским населением.
Однако если предки саамов пришли на пустые земли, только что освободившиеся из-под ледника, то новгородцы пришли на земли, где уже жили финно-угорские племена. И на «гребенке» северных русских мы видим два новых зубчика, нетипичных для остальных русских популяций. Зато именно эти гаплогруппы А и D встречаются у финно-угорских народов. Наличие этих гаплогрупп у северных русских вызвано генетическим вкладом дославянского населения.
По современному генофонду Русского Севера мы только что смогли прочитать его историю. Это, во-первых, переселение русских популяций из более южных территорий (поскольку в общих чертах северный генофонд воспроизводит общерусский). Во-вторых, немногочисленность населения (поскольку мы видим следы сильного дрейфа генов). И, в-третьих, смешение с автохтонным населением (наличие «финно-угорских» гаплогрупп). А раз в структуре генофонда до сих пор записана его история, значит, эта структура генофонда достаточно стабильна.
Итак, генофонд Русского Севера определяется русской колонизацией, то есть событиями семисотлетней давности. Где же последующие влияния? Мы не видим их следов. Если бы они были значительны, то на севере появились бы все те гены, которые часты в Центральной России. Следовательно, генофонд Русского Севера можно рассматривать как пример стабильного генофонда, доныне сохранившего свою структуру.
Итак, по показателю «стабильность структуры генофонда» Русский Север вполне благополучен. Но этот пример вновь вскрывает противоречие с интуитивными «критериями благополучия», поскольку сохранение структуры генофонда сосуществует с высоким уровнем инбридинга и, следовательно, груза наследственной патологии.
Итог обследования Русского Севера: благополучен! Высокий (в сравнении с другими русскими популяциями) груз наследственных болезней не привёл к деградации структуры генофонда.
ГЕНОФОНД НАСЕЛЕНИЯ КАЗАХСТАНА:
демография — «хорошо»,
заболеваемость — «хорошо»,
генофонд — «заменён».
Пример с адыгами-шапсугами показал, что структура генофонда может сохраниться даже при демографической катастрофе. А пример Русского Севера свидетельствует, что и высокий инбридинг не означает деградации генофонда. Может показаться, что генофонд выживает всегда. К сожалению, это не так.
Возможна и обратная ситуация: не сохранение, а напротив, полное разрушение или же «замена» генофонда, которые не сопровождаются ни депопуляцией, ни ростом патологии. Рис. 10.4.5. показывает, как на протяжении веков возрастала доля монголоидного компонента у древнего населения Казахстана [Исмагулов, 1982], и генофонд, который был изначально полностью европеоидным, на три четверти заменился монголоидным: исходный генофонд практически исчез без каких-либо демографических и медицинских симптомов неблагополучия. Конечно, эта история давняя (ей около двух тысяч лет), и — особо подчеркнём — мы говорим не о генофонде современного Казахстана, не о казахах, а о древнем населении региона, лишь в какой-то мере соотносящегося с границами современного Казахстана.
Рис. 10.4.5. Возрастание доли монголоидного компонента у населения Казахстана (По [Исмагулов, 1982]).
Соотношение европеоидного и монголоидного компонентов на разные периоды времени от 1500 лет до н. э. до 2000 н. э.: доля европеоидного компонента показана белым цветом, доля монголоидного компонента показана темным цветом
Итог обследования генофонда древнего населения Казахстана: исчез — заменён другим! Демография — в норме. Заболеваемость — в норме.
Конечно же, можно возразить, а что плохого в том, что он заменился на другой генофонд? Чем новый генофонд хуже старого? Сразу отвечаем: ничем не хуже. Генофонды и нельзя сравнивать в понятиях «хуже-лучше». Но наука обязана зафиксировать: генофонда не стало. Он заменён другим.
А давать этому «качественную» оценку — это уже дело общества. Дело науки бесстрастно констатировать — жив прежний генофонд или разрушен, или подменён новым. «Сменив свой лик на лик чужой, Язык на говор не родной, Мы неприметно исчезаем…» (С. Бехтееев). Можно, конечно, не соглашаться с поэтом. Во-первых, у него «мы» — это мы прежние, мы — уходящего прошлого. Если же при этом не меняется наше этническое самосознание, и мы называем свой народ прежним именем, но отождествляем своё «мы» уже с новым обликом и с новым генофондом, то, конечно же, как согласиться с тем, что «мы» исчезаем? Просто поэт (и мы с ним) не хотим, чтобы эта подмена осуществлялась молча — надо знать, чем мы платим за наше «новое».
Этот пример показывает, что структура генофонда — самостоятельный и наиболее важный критерий сохранности генофонда. Он связан с демографической ситуацией и с отягощённостью наследственными заболеваниями. Но эта связь весьма сложна и неоднозначна.
Следовательно, неоднозначна интерпретация изменений в генофонде: как «отрицательных» или «положительных»; «полезных» для здоровья генофонда или же «вредных», угрожающих его существованию. Нельзя по этим двум внешним симптомам — демографии и наследственным болезням — определить состояние здоровья и устойчивость генофонда.
ИТОГИ
Самые разные аспекты изменений в генофонде можно рассматривать как позитивные или же негативные в зависимости от авторских позиций и предпочтений. Поэтому и существует множество взглядов на проблему сохранности генофонда.
Научный, популяционно-генетический взгляд состоит в том, чтобы объективно оценить структуру генофонда и такие важнейшие свойства, как её устойчивость, степень её зависимости от демографических изменений, степень её влияния на груз наследственной патологии.
Но следующий шаг — толкование полученных данных в плане «благополучия/деградации» генофонда — уже попадает в зависимость от ценностных установок и системы взглядов толкователя.
А КАКОВО СОСТОЯНИЕ РУССКОГО ГЕНОФОНДА?
Наша книга о русском генофонде обращена в прошлое. Мы стремились выяснить структуру русского генофонда и прочесть записанную в этой структуре летопись его истории. То есть изучать настоящее и смотреть в прошлое. Но обеспокоенность дальнейшей судьбой русского генофонда встречается столь часто, причём в самых разных кругах российского общества, что, вероятно, многие читатели интересуются больше всего именно этой проблемой. Чтобы не обманывать их ожиданий, в этом разделе единственный раз заглянем в будущее. Более того, хотя и с опаской, мы решились с научной точки зрения рассмотреть возможные угрозы благополучию генофондов и возможные меры содействия сохранению генофонда. У нас нет данных о неблагополучии русского генофонда, да и меры эти наверняка несовершенны. Но лучшего наша наука пока предложить не может, и лишь поэтому мы решаемся обрисовать своё видение проблемы.
Дело общества решать — есть ли необходимость беречь генофонды народов, его составляющих. Если общество решит, что генофонды надо оберегать (что не очевидно), то наука здесь может помочь в оценке степени опасности для генофонда и в поиске способов, как этих опасностей избежать.
Мы только что рассматривали три опасности, которые могут грозить любому генофонду: разрушение его структуры (например, в результате смешения популяций), рост груза наследственных болезней и демографическая убыль населения (депопуляция). Посмотрим, в какой мере эти три опасности угрожают русскому генофонду.
ОПАСНОСТЬ ПЕРВАЯ: СМЕШЕНИЯ ПОПУЛЯЦИЙ
Для структуры генофонда самая близкая опасность — это исчезнуть, стереться, нивелироваться в результате смешений с соседними народами или смешений региональных групп внутри народа. Напомним, по самому определению популяции — больше половины браков заключается внутри неё. Если доля «брачных» мигрантов (для генофонда важны только те браки, дети и внуки которых остаются в этой популяции) переваливает за эту интуитивно понятную критическую величину, то популяция просто исчезает, вливаясь в другую популяцию. Приближение к этой границе (половина детей рождается от браков внутри популяции, половина — от браков с другими популяциями) сигнализирует об опасности разрушения популяции. Современная интенсивность миграций может сделать эту опасность вполне реальной для ряда регионов — включая как миграции иных народов в пределы русского ареала, так и русского народа вовне, но в большей степени — миграции русского населения в пределах ареала, из области в область, из сёла в город.
Не стоит, конечно же, опасаться смешений — ни один генофонд не может жить без них. Межэтнические и межпопуляционные контакты, браки, смешения — это необходимое, извечное свойство человечества. Но всё-таки, если, к примеру, всё русское население съедется в Москву и образует единую гомогенную популяцию — структура русского генофонда исчезнет. Ведь структура генофонда — это как раз воспроизводящиеся в поколениях генетические особенности каждой популяции. Каждая популяция занимает свой кусочек общего ареала народа, и именно различия между популяциями образуют географическую мозаику — структуру генофонда, обеспечивающую его стойкость, его устойчивость к мятущимся ветрам истории. Если каждое стёклышко прекрасной мозаики вынуть со своего места и сложить стопкой — мы разрушим ту картину, которую они образовывали, и уже не сможем её восстановить. Обычно обеспокоенность общества вызывают смешения с соседними народами — боязнь «раствориться» в них. Но интенсивное смешение разных популяций одного народа, как видим, не столь заметно, но куда более успешно может разрушить структуру генофонда.
Мы изложили основные черты этой первой опасности для генофонда, чтобы больше к ней не возвращаться. Интенсивные миграции — современная черта всего человечества, и опасность, которые они несут для русского генофонда, ничуть не больше, чем для множества иных народов по всему миру. И мы не будем сейчас пытаться решать мировую проблему.
Впрочем, слово «опасность» — пожалуй, слишком резкое. Лучше говорить об «изменениях, происходящих в генофонде». И если ученые будут отслеживать направление и силу этих изменений (то есть проводить мониторинг генофонда), а общество будет решать, что его генофонды заслуживают сохранения, то всегда можно будет вовремя заметить опасность исчезновения той или иной черты генофонда и принять меры по её сохранению. Простая аналогия: этнографы описывают памятники древней деревянной архитектуры, отслеживают происходящие с ними изменения; общество солидарно в том, что памятники архитектуры нужно сохранять, и тогда принятие конкретных мер в случае необходимости — дело скорее техники, чем науки. Но и науки тоже — реставрация и консервация памятников проводится с учетом консультаций специалистов — аналогичные консультации необходимы и в деле сохранения генофонда. Важное отличие — популяции, в отличие от памятников архитектуры, состоят из живых людей, и потому в основе любых действий с ними должны лежать этические принципы. Они и лежат — у многих стран, включая СССР, есть положительный опыт программ сохранения малых коренных народов. Хотя задачи сохранения генофонда специально не ставились, весь комплекс мер фактически способствовал сохранению численности популяции, и (хотя и не всегда) структуры её генофонда.
ОПАСНОСТЬ ВТОРАЯ: ГРУЗ НАСЛЕДСТВЕННОЙ ПАТОЛОГИИ
Эта тема очень близка авторам хотя бы потому, что наше исследование русского генофонда выполнено в стенах Медико-генетического научного центра. И здесь мы возлагаем большие надежды на начатую нами работу по геногеографии русских фамилий («глава 7). Один из её результатов — как раз прогноз груза наследственных болезней для различных русских популяций. Но мы должны признать, что и эта опасность для русского генофонда не так велика. Разумеется, нужно делать всё возможное, чтобы облегчить участь тех детей и тех семей, которые столкнулись с проблемой наследственных болезней. Но, рассуждая о русском генофонде в целом, нужно помнить, что уровень наследственной патологии в среднем невысок для русских популяций, особенно в сравнении с генофондами многих других народов. Поэтому и на этой второй опасности мы не будем подробно останавливаться. Потому что третья опасность, которая грозит не всем генофондам, для русского генофонда может стать реальностью. О ней мы и поговорим, тем более что для её предотвращения можно принять простые и эффективные предупредительные меры.
ОПАСНОСТЬ ТРЕТЬЯ: ДЕПОПУЛЯЦИЯ
Эта третья опасность очень проста. Речь идет об удручающей демографической ситуации в русском населении — столь низком уровне рождаемости, что численность русских (носителей русского генофонда) может начать резко сокращаться.
Лекарство, которое может помочь генофонду, очевидно — надо повысить уровень рождаемости до демографической нормы. Чтобы прописать это лекарство, не надо изучать русский генофонд — оно само напрашивается. Но чем тут может помочь геногеография — это посоветовать, кому именно его прописать и как принимать.
СПОСОБ ПОМОГАТЬ ГЕНОФОНДУ
Предположим, что обеспокоенное общество решило выделить дополнительную «дотацию на генофонд». Куда её направить?
Для целей сохранения русского генофонда желательно не допускать резкого сокращения той части населения, которая воспроизводит его структуру. Для этого достаточно повысить уровень рождаемости сельского населения в пределах «исконного» русского ареала (Центральная Россия и Русский Север).
Как конкретно повысить рождаемость? Способ известен, и ограниченно он уже применяется в России — это дотации семье на рождение ребенка и его первые годы жизни. Поскольку целевая «дотация на генофонд» пойдёт только в области Центральной России и мимо крупных городов (где сосредоточено большинство населения), то число адресатов невелико, и соответственно, общая сумма будет небольшой. Второй способ — это развитие инфраструктуры небольших городов, которые сейчас лишились даже элементарного общественного транспорта. Многие семьи опасаются заводить детей в таких условиях, и либо не заводят, либо переезжают в крупные города, а для сохранения генофонда и то, и другое — одинаковая потеря.
Отличие такого плана помощи генофонду от других демографических программ — в её ограниченности. Она ограничена той малой частью населения, которая наиболее важна для сохранения генофонда. Это сёла и маленькие города Центральной России и Русского Севера.
Дело в том, что для цели сохранения генофонда — мы ведь говорим именно об этой цели — не важен уровень рождаемости среди русских Сибири (Сибирь находится за пределами «исконного» ареала), или русских Москвы (население Москвы — не сельское). Все эти популяции находятся как бы за пределами исторически сложившейся структуры русского генофонда на его «исконном» ареале. Генетическую информацию о русском генофонде хранят лишь коренные сельские популяции «исконного» ареала. Поэтому для сохранения русского генофонда критичен уровень рождаемости в населении именно провинциальной Центральной России — в её деревнях, сёлах и небольших городках.15
Такова наша несложная «программа помощи генофонду». Попробуем её теперь обосновать и этически оправдать.
ЧТО ВХОДИТ В «ИСКОННЫЙ» АРЕАЛ?
Очертить территорию, на которой сформировался русский народ, могут лишь историки, и то не вполне однозначно. Всё же мы попробуем привести, пусть предварительный и неточный, список 22 областей и численность сельского населения в них (табл. 10.4.3). Именно сельское население этих областей хранит в себе и воспроизводит русский генофонд, и демографическая ситуация в их деревнях напрямую связана с будущим русского генофонда. Им-то и следует помогать «дотациями на генофонд». Например, мы намеренно не включили в этот список Московскую область: хотя на её окраинах ещё сохраняется коренное население, но в целом население области является смешанным, подверженным частым миграциям и поэтому уже не хранит генетическую память.
Таблица 10.4.3.
Сельское население 22 областей, примерно соответствующих «исконному» русскому ареалу (по переписи 2002 года).
Суммарная численность населения «исконных» областей — 30 253 864. Если исключить города, то общая численность русского генофонда на «исконном» ареале составит 8 790 679 человек. По сравнению со 116 млн. общего русского населения России это немного. Но к рождению детей имеет отношение ещё меньшая часть — среди сельского населения женщин в возрасте до 35 лет оказывается всего лишь 717 тысяч человек. Именно эта — столь малая — часть русского населения в основном и воспроизводит русский генофонд! Если «дотации на генофонд» направить именно в эти русские деревни и городки, то это, можно надеяться, реально будет способствовать сохранению русского генофонда.
Подчеркнём, что речь идет только об «исконном историческом» ареале, но вовсе не об «исконном историческом» генофонде — такового ни понятия, ни генофонда нет! И если Вы встретите рассуждения о нём
— то можете быть уверены, что к науке автор никакого отношения не имеет, и Вы встретились с той самой «полунаукой», которая, как писал в «Бесах» Федор Михайлович Достоевский «самый страшный бич человечества, хуже мора, голода и войны, не известный до нынешнего столетия».
ПОЧЕМУ ТОЛЬКО СЕЛЬСКОЕ НАСЕЛЕНИЕ?
Почему для сохранения генофонда важно сельское, а не городское население? Основная причина проста — городам всегда свойственно суженное воспроизводство, и никакие дотации не смогут изменить это свойство. Ведь для стабильного воспроизводства в семьях должно быть по двое и более детей, что обычно встречается на селе, но реже в городе. И если с каждым годом города не пустеют, а становятся все многолюднее, то не столько за счёт родившихся в городе, сколько за счёт переселенцев из сёла.
Демографическая картина проста: уровня рождаемости в городе недостаточно даже для поддержания его численности на постоянном уровне. Зато рождаемость на селе позволяет сохранять и само сельское население, и «подпитывать» города. В популяционной генетике принято сравнивать города с «черными дырами», куда втягивается генофонд из окружающих деревень, но где он не воспроизводится и откуда не возвращается.
А КАК БЫТЬ С «ПРИШЕЛЬЦАМИ»?
Сразу возникает и другой вопрос: но ведь в сёлах «исконного» русского ареала живут не только коренные русские и не только русские? Сразу и отвечаем: ВСЁ СЕЛЬСКОЕ НАСЕЛЕНИЕ «исконного» русского ареала непременно должно быть включено в программу «дотации на генофонд»!
Ведь русский генофонд (как и все другие генофонды!) всегда вбирал в себя многие потоки генов отовсюду. Мы так же, как и многие из читателей, знаем, что сейчас в русские сёла возрос приток населения из далеких окраин бывшего Союза. Останутся ли эти «пришлые» гены в русском генофонде или же вернутся в иные города и страны, решать не учёным, не политикам и не администраторам, а самому русскому генофонду — у него, право, больший опыт таких решений.
Поэтому мы и считаем, что для получения дотации «на генофонд» должно быть достаточно лишь того, чтобы мать и её ребенок проживали в селе или малых городах «исконного» ареала русского генофонда.
А ЭТИЧНА ЛИ ЭТА ПРОГРАММА?
Мы постарались отнестись к этой программе критически, но не нашли в ней ничего, ущемляющего чьи-либо права или противоречащего этике. Плохо, когда заявляют «Россия для русских» и на этом основании изгоняют коренные народы с их родных земель[71], некогда завоёванных Россией. Но что плохого может быть в поддержке рождаемости с целью сохранить генофонд народа? Да, такая поддержка должна быть дифференцированной (только сельское население, только определённых областей), чтобы быть наиболее эффективной, чтобы достичь своей цели, но ведь это общепринятая, одобряемая практика. Например, Китай, жёстко ограничивающий рождаемость на своей территории, отменяет все ограничения для малочисленных народов. Почему же и России не поддержать рождаемость, в том числе и у русского народа, который, несмотря на многочисленность (кажущуюся — см. табл. 10.4.3.), в этом также нуждается?
А КАК ЖЕ ГЕНОФОНДЫ ДРУГИХ НАРОДОВ?
Действительно, почему мы говорим только о сохранении русского генофонда, а не «российского»? А как же более ста других народов России, и тысячи народов мира, разве их генофонды не нужно сохранять? Отчего такое внимание к генофонду только одного народа? Единственная причина — наша книга посвящена именно русскому генофонду. Русский генофонд не обладает никаким «приоритетом» — но раз вся книга посвящена ему, то лишь его сохранение мы и вправе здесь обсуждать.
Мы надеемся, что «дотация на генофонд» может быть сразу же распространена на генофонды всех тех народов России, для которых реальна угроза депопуляции. Ведь предложенная программа является практически универсальной. Для поддержки любого генофонда важно обратить внимание на его «исконный» ареал и в первую очередь на сельское, мало подверженное миграциям, коренное население.
А ЭФФЕКТИВНА ЛИ ЭТА ПРОГРАММА?
Не так легко понять, что в действительности происходит с генофондом. В ходе наших экспедиций мы побывали во многих малых русских городах и весях, и стало яснее многое, неожиданное, что нельзя увидеть из столицы. Экспедиционные будни хорошо помогают вжиться, прочувствовать ту популяцию, в которой работаешь. Живя в Москве, трудно представить, что есть города вообще без всякого общественного транспорта! А в этих городах улицы с одноэтажными домиками тянутся на многие километры. И по этим бесконечным улицам в дождь, в снегопад и в морозы везут молодые мамы на себе детей в поликлинику или в детский сад. А те, кто живут в деревнях за городом, в тридцатиградусные морозы могут часами стоять на дороге, голосуя проходящим автобусам. На наших глазах в недавнюю лютую зиму, старушка, стоя на трассе, в пояс кланялась каждой машине, повторяя: «Подвези, Христа ради, миленький!». Но они пролетали мимо. Нам объяснили, что те, которые из Москвы и областного города, не подбирают почти никогда, а вот свой, местный, иногда может и подвезти. Из Москвы трудно увидеть, как юная женщина идет сдавать кровь на вдруг приехавшую станцию переливания крови, чтобы получить несколько десятков рублей — ей было просто нечем кормить новорожденного ребенка. В Москве трудно представить, что можно «сократить» единственную медсестру в роддоме, ухаживающую за новорожденными. А оставшаяся одна на всех акушерка должна выбирать — или ей принимать роды, оставляя новорожденных надолго вообще без всякого присмотра, или же бросать роженицу и бежать к детям. Многого не увидишь из Москвы. А ведь совсем не в столицах вершатся судьбы генофондов.
Именно из работы непосредственно «в популяции» мы и вынесли мысль о необходимости поддержки генофонда. Поддержки, направленной именно на повышение рождаемости и на улучшение жизни в деревнях и небольших городах. Причём, сравнительно с московским размахом, эта поддержка может быть довольно скромной, но принести очень большую пользу генофонду. Конечно, нынешние выплаты на ребенка, совершенно недостаточны. Но увеличение их хотя бы до уровня прожиточного минимума может быстро и благотворно сказаться на жизни русской «глубинки». А ведь именно там существует и воспроизводится в поколениях русский генофонд, и именно там, в глубине, зреет его будущее. Мы обсуждали проблемы рождаемости с профессионалами, проработавшими годы в местных ЗАГСах и роддомах. Эти обсуждения помогли определить то главное, что может помочь сохранить русский генофонд. Если «дотации на генофонд» будут поступать адресно именно тем матерям, которые постоянно живут в провинции, которые там растят своих детей, если в этих же районных городах будут курсировать хотя бы две-три маршрутки, то ситуация должна быстро измениться к лучшему. Если молодые матери в провинции будут уверены, что им помогут вырастить детей, то «демографическая» проблема сохранения русского генофонда будет решена.
10.5. ЕСТЬ ЛИ «РУССКИЕ ГЕНЫ»? ЕСТЬ ЛИ РУССКИЙ ГЕНОФОНД?
«Русских генов» нет — Возвращение бумеранга — Русский генофонд есть! — Феникс
Научный ответ на эти вопросы мы дали всей своей книгой. Но для тех, кому некогда её читать, мы ответим очень кратко в этом разделе. Для этого нам, к сожалению, придётся отчасти пожертвовать точностью научной терминологии — каков вопрос…
«РУССКИХ ГЕНОВ» — НЕТ!
«Русских генов» нет, как нет генов украинских, татарских или французских! «Привязать» ген к любому народу вообще невозможно по многим причинам.
ГЕНЫ. Во-первых, время и место возникновения гена скрыто в глубине времён. Ген (то есть его новый вариант — аллель, гаплотип) может «родиться» в одном месте, а случайно «размножиться» до заметных величин совсем в другом месте или даже в нескольких неродственных популяциях, куда его занесло случайными ветрами миграций.
Например, нам доподлинно известно, что один из капитанов некогда привёз на свою родину — в Архангельск — полинезийскую принцессу. Кто знает, быть может волею судьбы через ряд поколений какой-то из прибывших с принцессой генов станет частым на Русском Севере? И Вам придётся называть его «русским» — ведь Вы не можете отличить его от остальных. От рождения гена до того, как он станет «знаменитым» (или хотя бы известным) проходит не только много времени, но и случается много непредвиденных событий. Но самое главное помнить: практически все гены родились тогда, когда нынешних народов ещё не было на свете.
ЛЮДИ. Во-вторых, не только гены, но и люди непредсказуемы. Они не только заключают браки на небесах, но и своих детей «записывают в народы» произвольно. Нам не менее доподлинно известна семья, которая в советские времена записала своих трёх сыновей: одного — русским, второго — армянином, третьего — евреем. Кому-нибудь в жизни да повезёт! В любом случае, потомки метисных браков если не сразу, то постепенно принимают чью-то одну сторону и считают себя русским или французом безотносительно к тому, сколько чьих генов они несут. Но ведь от того, кем мы себя считаем, наши гены не меняются — они остаются все теми же, безымянными — не русскими и не французскими, а просто генами.
ПОПУЛЯЦИИ. В-третьих, сами популяции не могут существовать, не обмениваясь генами друг с другом. Генетически «чистых» популяций не бывает (исключение одно — популяция вида, всё человечество).[72] А если так, то какие же гены считать «русскими»? Ведь чем на большее число поколений мы спустимся в любую родословную, тем больше мы насчитаем «пришлых» генов. Более того, чем глубже мы будем погружаться в прошлое популяции, тем больше мы будем отходить от современного народа (русского, украинского, татарского или французского) и переходить к тем «пранародам», из которых он вырос. Например, погружаясь в генетическое прошлое русского народа, мы уже вскоре окажемся среди генофонда иного народа, который дал начало и русским, и украинцам, и белорусам. А ещё глубже — и среди ещё иного генофонда: народа, который дал начало русским, марийцам, удмуртам, коми… И среди ещё нескольких генофондов, частью влившихся в состав русского. Но при этом не заметим никаких качественных различий в наблюдаемом нами генофонде: одних генов стало чуть больше, других чуть меньше, но нигде нет той границы, где бы вдруг неизвестно откуда дружно появились на свет «русские» (или «украинские», или «татарские») гены. Нет их! И нет оттого, что народ и его генофонд не являются некой неизменной замкнутой единицей — напротив, это динамичный, живой, подверженный постоянным изменениям «суперорганизм», умеющий, как и все живые организмы, сохранять своё единство и перерастать в своих потомков.
А КАК ЖЕ «ФИНСКИЕ» БОЛЕЗНИ? Этот вопрос всегда задаётся после того, как скажешь, что «русских» генов нет. Ведь есть же гены наследственной патологии, встречающиеся только у финнов? Считается, что есть. Может быть, когда-нибудь найдутся и гены наследственных болезней, встречающиеся только у русских (речь идет о столь редких генах, что их очень трудно обнаружить). Но можно ли будет считать эти гены «русскими»? Вряд ли какой народ согласится с тем, что его лицо отражают редчайшие гены тяжёлых наследственных болезней. Просто условный рабочий язык медицинских генетиков, говорящих между собой о финских, марийских или чувашских генах наследственных болезней, неверно отразился в общественном мнении. Если для того, чтобы найти одного такого больного, надо просмотреть десятки тысяч людей, то такие гены уже просто не имеют отношения к той задаче, которую обычно хотят решить любители «русских генов» — определить по гену, к какому народу человек относится.
«ВОЗВРАЩЕНИЕ БУМЕРАНГА»
Заодно прямо ответим на вопрос, который обычно «держится в уме» при обсуждении этого круга проблем.
Можно ли по гену определить, к какому народу относится человек? Ответ однозначен: НЕЛЬЗЯ.
В ПРИНЦИПЕ НЕЛЬЗЯ потому, что только сам человек может определить, к какому народу он себя относит. Это дело его выбора, не имеющего никакого отношения к биологии и к генетике.
ПО ГЕНУ НЕЛЬЗЯ потому, что таких генов («русских», «украинских», «французских») нет.
ПО ГЕНОФОНДУ НЕЛЬЗЯ оттого, что каждый генофонд многослоен, непостоянен и состоит в той или иной степени родства со всеми другими генофондами человечества.
Каждый генофонд каждого народа связан бесчисленными незримыми узами друг с другом. Это и приводит к «возвращению бумеранга». Если бы нашёлся изобретатель биологического маркёра, специфичного для любой общности людей (русских, восточных славян, эфиопов, индейцев, европейцев) он скоро обнаружил бы, что этот маркёр вовсе не специфичен — он присутствует и у кого-либо из круга его самых близких людей. Бумеранг вернулся бы к нему самому. Все народы от века друг другу сродни. Поэтому и писал Джон Донн (1572–1631), настоятель собора св. Павла в Лондоне: «Не спрашивай никогда, по ком звонит колокол: он звонит по тебе».
РУССКИЙ ГЕНОФОНД ЕСТЬ!
Итак, «русских генов» нет.
Но есть ли тогда русский генофонд?
Да, есть, как и бескрайний ряд иных генофондов. Ведь (если упростить до предела все формулировки) генофонд — этот совокупность всех генов, принадлежащих популяции. А популяции — это элементы устройства биологических видов, в том числе и человека. И популяции человека не только занимают пространство всей ойкумены, они ещё и вкладываются друг в друга, как матрёшки. А вместе с ними — и генофонды этих популяций.
Самая большая популяция — человечество. Самая маленькая популяция — группа соседних сел или деревень (такие популяции и называют «элементарными» — из них, как из кирпичиков, складываются все прочие популяции). А основной критерий везде один: чтобы в пределах популяции заключалось больше половины браков. Здесь мы немного упрощаем (подробнее см. главу 1 и Приложение). Но упрощаем для того, чтобы стало очевидно, что популяции бывают самых разных рангов. И между самым высоким рангом (человечество) и самым нижним рангом (элементарные популяции) есть ещё великое множество промежуточных уровней. Популяции нижнего ранга как матрёшка в матрёшку вмещаются в популяции более высокого ранга. Одной из таких промежуточных «матрёшек» и является популяция того или иного народа. Если, конечно, в нём заключается больше браков, чем с другими народами.
Итак, коль скоро заключаются браки, то существуют популяции, причём каждая группа людей, заключающая хотя бы половину браков в пределах группы, может называться популяцией. А коль скоро существуют популяции, существуют и их генофонды. Коль скоро куда как больше половины браков заключается с представителями своего народа, то народы — это тоже популяции. И коль скоро существуют эти этнические популяции, то существуют и этнические генофонды — в том числе существует и русский генофонд.
Даже такого простого экскурса в популяционную генетику достаточно, чтобы стали ясны два очень важных положения.
Во-первых, многослойность генофондов (по ученому — стратификация). Генофонд каждого народа и сам состоит из множества других «нижестоящих» генофондов, и является частью многих других «вышестоящих» генофондов. Мы в книге рассматривали, как русский генофонд является частью генофонда восточнославянских народов, и частью генофонда народов Восточной Европы, и всей Европы, и Евразии. А могли выделить и другие промежуточные «матрёшки» — и посмотреть, как в них размещён русский генофонд. Это помогало нам выявить, какие другие генофонды для русского родные братья, какие — двоюродные, а с какими генофондами он связан более отдалённым родством.
Во-вторых, не может быть и речи о чистоте генофонда. Ведь достаточно того, чтобы в пределах генофонда заключалась наибольшая часть браков. Это значит, что генофонду любого народа «дозволено» чуть ли не половину браков заключать с другими народами. И это не вредит ему — напротив, только это и помогает ему оставаться генофондом. С ближними родственниками-народами обычно заключается больше браков, с народами более отдалённого родства — браков меньше, и так поддерживается система родства генофондов. Если кто-то, заботясь о «чистоте» своего генофонда, сумел бы порвать эти связи — он просто отсек бы его от человечества, гордясь «свободой ветви от ствола и корня, свободой плеч от тяжкой головы» (3. А. Миркина)
Возвращаясь к русскому генофонду, мы можем сказать, что он так же, как и все другие — татарский, мордовский, украинский или французский — реально существует как один из множества генофондов маленьких и больших популяций (от сёла — до человечества), и при этом он связан тысячами живых исторически сложившихся связей с другими генофондами. И не нам их менять. Забота о «чистоте» русского генофонда обрекла бы его на вымирание. Но и забота о его слиянии со всеми генофондами — обрекла бы его на исчезновение.
ФЕНИКС-ГЕНОФОНД
Составляя родословные в русских популяциях, мы видели, что хотя круг брачных связей с каждым поколением становится всё шире, каркас популяции всё равно сохраняется. Причём порой даже в таких условиях, когда сама «видимая» популяция исчезла.
Мы наблюдали удивительное явление в Тверской области, зажатой между Москвой и Петербургом. Некогда браки в русских деревнях заключались по поговорке — «хоть за курицу, да на свою улицу»[73]. Невеста, взятая за 10 километров, даже теперь, став прабабушкой, в деревне считается «чужой, взятой Бог весть откуда».
Сейчас многие деревни замирают зимой и лишь летом наполняются дачниками, ставшими уже жителями двух столиц. Однако браки в этих «виртуальных деревенских популяциях» тем не менее, заключаются, и заключаются в соответствии с прежней традицией. Дети и внуки тех, кто издавна жил в этих деревнях, считающие себя жителями столиц или небольших городов Тверской области, возвращаясь на лето в родные места, нередко заключают здесь браки между собой. Проходит время, и они привозят сюда из городов уже своих детей. Круг повторяется, и продолжает существовать «виртуальная популяция» — при отсутствии постоянных жителей она возрождается в поколениях. И эта «виртуальная популяция» сохраняет возможность вернуться к жизни и вновь стать популяцией реальной, сохранив полную генетическую преемственность с исчезнувшей деревней — мы видели, как возвращаются и оседают на родной земле семьи нынешних москвичей, всеми корнями происходящих из узкого круга тверских деревень.
Как не вспомнить здесь «Записки о московит-ских делах», написанные в XVI веке Сигизмундом Герберштейном: «С людьми же Лукоморья, как говорят, случается нечто удивительное, невероятное и весьма похожее на басню; именно говорят, будто каждый год… они умирают, а на следующую весну… оживают снова».
Список литературы
1. Айала Ф., Кайгер Дж. Современная генетика. Т. 3. М.: Мир, 1988. 336 с. (Ayala F. J., Kiger J. A. Modem Genetics. Second Edition. Univ. of California, Davis).
2. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Классификация и снижение размерности. М.: Финансы и статистика, 1989. 607 с.
3. Алексеев В. П. Происхождение народов Кавказа // Краниологическое исследование. М.: Наука, 1974. 318 с.
4. Алексеев В. П. Историческая антропология. М.: Высшая школа, 1979. 216 с.
5. Алексеев В. П. Становление человечества // М., 1994. 387 с.
6. Алексеев В. П. Экологические аспекты антропогенеза // Эволюционная и историческая антропоэкология: Сб. науч. трудов. М., 1994. С. 11–27.
7. Алексеева Т. И. Сравнительная характеристика русских и других этнических групп Восточной Европы // Происхождение и этническая история русского народа. Тр. Ин-та этнографии АН СССР. 1965. Т. 88. С. 191–247.
8. Алексеева Т. И. Биологические аспекты изучения адаптации у человека // Симпозиум «Антропология 70-х годов». М.: 1972.
9. Алексеева Т. И. Этногенез восточных славян по данным антропологии. М.: Наука, 1973. 329 с.
10. Алексеева Т. И. Биологическая адаптация населения Арктики к экстремальным условиям Крайнего Севера (антропологический аспект) // Географические аспекты экологии человека. М.: 1975.
11. Алексеева Т. И. Географическая среда и биология человека. М.: Мысль, 1977. 302 с.
12. Алексеева Т. И. Адаптивные процессы в популяциях человека. М.: МГУ, 1986. 216 с.
13. Алексеева Т. И. Антропологический облик русского народа // Вопросы антропологии, диалектологии и этнографии русского народа. М.: Координационно-методический центр «Народы и культуры» Института этнологии и антропологии РАН. 1998. С. 3–27.
14. Алексеева Т. И., Балановская Е. В., Бахолдина В. Ю., Година Е. 3*, Дубова Н. А., Зубов А. А., Перевозчиков И. В., Яблонский Л. Т. Проблема расы в российской физической антропологии. М.: Институт этнологии и антропологии РАН, 2002. 96 с.
15. Алексееу В. П. Bimay М. Y., Цягяка Л. I. Расавая гeaгpaфiя беларусау i праблемы этнагенезу. MiHCK: 1994. 128 с. (Алексеев В. П., Битов М. В., Тегако Л. И. Расовая география белорусов и проблемы этногенеза. Минск: 1994. 128 с.)
16. Алтухов Ю. П. Генетические процессы в популяциях. 1-е изд. М.: Наука, 1983. 279 с. (2-е изд. М.: Наука, 1989. 328 с.; 3 изд-е. М: ИКЦ Академкнига. 2003. 432 с.).
17. Алтухов Ю. П. Концепция адаптивной нормы популяций и проблема аутбридинга // Вестник АМН СССР. 1984. N 7. С. 16–21.
18. Алтухов Ю. П. Внутривидовое генетическое разнообразие: мониторинг и принципы сохранения // Генетика. 1995. Т. 31. N 10. С. 1333–1357.
19. Алтухов Ю. П. Гетерозиготность генома, скорость полового созревания и продолжительность жизни // Доклады РАН. 1996. Т. 348. N 6. С. 842–845.
20. Алтухов Ю. П. Гетерозиготность генома, интенсивность метаболизма и продолжительность жизни // Доклады РАН. 1999. Т. 369. N 5. С. 704–707.
21. Алтухов Ю. П., Курбатова О. Л. Наследственность человека и окружающая среда // Наследственность человека и окружающая среда. М.: Наука, 1984. С. 7–34.
22. Алтухов Ю. П., Курбатова О. Л. Проблема адаптивной нормы в популяциях человека // Генетика. 1990. Т. 26. С. 583–598.
23. Алтухов Ю. П., Рычков Ю. Г. Популяционные системы и их структурные компоненты. Генетическая стабильность и изменчивость // Журн. общ. биол. 1970. Т. 31. N 5. С. 507–526.
24. Алтухов Ю. П., Салменкова Е. А., Омельченко В. Т. Популяционная генетика лососевых рыб. М.: Наука, 1997. 288 с.
25. Анучин Д. Н. О географическом распределении роста мужского населения России сравнительно с распределением роста в других странах // Зап. Императ. геогр. общества по отд. статистики. СПб.: 1889. Т. VII. Вып. 1.
26. Балановская Е. В. Возможности компьютерной геногеографии в изучении генофонда // Генетика. 1995. Т. 31. С. 12.
27. Балановская Е. В. Новые технологии изучения пространственной структуры генофонда. Автореф. докт. диссерт. М., 1998. 48 с.
28. Балановская Е. В. Стратегия комплексного изучения генофонда (по данным антропологии, дерматоглифики, археологии, антропонимики, классической и молекулярной генетики) // Вопросы антропологии. 2003. Вып. 91. С. 185–187.
29. Балановская Е. В. Генофонд народов Северной Евразии: внутренняя структура и положение в мировом генофонде // Антропология на пороге III тысячелетия / Под ред. Т. И. Алексеевой. М.: Старый сад, 2004. Т. 1. С. 358–390.
30. Балановская Е. В., Балановский О. П. Роль этноса в истории популяций: геногеографический аспект // III Конгресс этнографов и
антропологов России. Тез. докл. Москва, 1999. С. 103.
31. Балановская Е. В., Балановский О. П., Нурбаев С. Д., Дерябин В. Е., Долинова Н. А., Бужилова А. П., Спицын В. А. Генофондика русского народа: данные разных наук // II Съезд ВОГиС. Тез. докл. Т.2. С-Петербург. 2000. С. 311–312.
32. Балановская Е. В., Балановский О. П., Спицын В. А., Бычковская Л. С., Макаров С. В., Пай Г. В., Русаков А. Е., Суббота Д. С. Русский генофонд. Геногеография сывороточных генных маркеров (HP, GC, PI, TF) // Генетика. 2001. Т.37. N 8. С. 1125–1137.
33. Балановская Е. В., Балановский О. П., Спицын В. А., Бычковская Л. С., Макаров С.В., Пай Г. В., Суббота Д. С. Русский генофонд. Геногеография эритроцитарных генных маркеров (ACP1, PGM1, ESD, GLO1, 6-PGD) // Генетика. 2001. Т.37. N 8. С. 1138–1151.
34. Балановская Е. В., Батсуурь Ж., Белковский А. Н., Рычков А. В., Рычков Ю. Г. Геногеография народонаселения: создание регионального геногеографического атласа с помощью ЭВМ // Генетика. 1990. Т. 26. N 5. С. 925–935.
35. Балановская Е. В., Грехова Л. В., Рычков Ю. Г. Компьютерная геногеография и археология: методы картографического моделирования распространения материальной культуры // Горизонты антропологии. Труды Междунар. научн. конф. памяти акад. В. П. Алексеева, 1994. М.: Наука, 2003. С. 66–72.
36. Балановская Е. В., Иноземцева В. С., Нурбаев С. Д., Перепелов А.1В., Петрин А. Н., Руденская Г. Е., Ситников В. Ф. Региональные особенности наследственных заболеваний нервной системы // Регионология. 1996. N 2(15). С. 153–161.
37. Балановская Е. В., Нурбаев С. Д. Компьютерная технология геногеографического изучения генофонда. III. Вычленение трендовых поверхностей // Генетика. 1995. Т. 31. N 4. С. 536–559.
38. Балановская Е. В., Нурбаев С. Д. Селективная структура генофонда. I. Возможности изучения // Генетика. 1997а. Т. 33. N 11.
С. 1572–1588.
39. Балановская Е. В., Нурбаев С. Д. Геногеография и генофонд. Пространство главных компонент // Новые методы — новые подходы в современной антропологии. Москва: Старый сад, 19976. С. 99–115.
40. Балановская Е. В., Нурбаев С. Д. Компьютерная технология геногеографического изучения генофонда. IV. Популяции в пространстве главных компонент // Генетика. 1997 в. Т. 33. N 12. С. 1693–1710.
41. Балановская Е. В., Нурбаев С. Д. Селективная структура генофонда. II. Стандартная технология определения через Р§т-статистики // Генетика. 1998а. Т. 34. N 9. С. 1307–1321.
42. Балановская Е. В., Нурбаев С. Д. Селективная структура генофонда. III. Технология определения через Е§т-статистики с помощью численного ресэмплинга // Генетика. 19986. Т. 34. N 10. С. 1434–1446.
43. Балановская Е. В., Нурбаев С. Д. Селективная структура генофонда. IV. Технология определения через показатель интенсивности отбора RS//Генетика. 1998 в. Т. 34. N 11. С. 1559–1573.
44. Балановская Е. В., Нурбаев С. Д. Пространственная изменчивость генофонда человека: геногеография и отбор // Исследования по генетике / Под ред. С.Г. Инге-Вечтомова. Вып. 12. СПб.:Изд-во С.-Петерб. Ун-та, 1999. С. 104–116.
45. Балановская Е. В., Нурбаев С. Д., Балановский О. П., Почешхова Э. А., Боровинских А. А., Гинтер Е. К. Геногеографический анализ подразделенной популяции. I. Генофонд адыгов в системе кавказских генофондов // Генетика. 1999. Т. 35. N 6. С. 818–830.
46. Балановская Е. В., Нурбаев С. Д., Почешхова Э. А. Генофонд Кавказа в контексте расы // Раса: миф или реальность? Тр. 1 Междунар. конф. РО Европ. антропол. ассоциации. М.: Старый сад, 1998. С. 21–22.
47. Балановская Е. В., Нурбаев С. Д., Рычков Ю. Г. Компьютерная технология геногеографического изучения генофонда. I. Статистическая информация карт // Генетика. 1994а. Т. 30. N 7. С. 951–965.
48. Балановская Е. В., Нурбаев С. Д., Рычков Ю. Г. Компьютерная технология геногеографического изучения генофонда. II. Статистическая трансформация карт//Генетика. 19946. Т.30. N 11. С. 1538–1555.
49. Балановская Е. В., Нурбаев С. Д., Спицына Н. X. Геногеографическое положение башкир в системе Уральских генофондов // Второй междунар. Конгресс этнографов и антропологов. Резюме докл. и сообщ… Часть 1. Уфа: Восточный унив., 1997. 64 с.
50. Балановская Е. В., Почешхова Э. А., Балановский О. П., Нурбаев С. Д., Гинтер Е. К. Геногеографический анализ подразделенной популяции. II. География случайного инбридинга (по частотам фамилий адыгов) // Генетика. 2000. Т. 36. N 8. С. 1126–1139.
51. Балановская Е. В., Рычков Ю. Г. Геногеография: Гены человека на карте СССР. М.: Знание, 1990а. 64 с.
52. Балановская Е. В., Рычков Ю. Г. Этническая генетика: Этногеографическое разнообразие народов мира // Генетика. 19906. Т. 26. N 1. С. 114–121.
53. Балановская Е. В., Рычков Ю. Г. Генофонд человека на этапах освоения ойкумены: адаптивная эволюция и геногеография // Человек заселяет планету Земля. Тр. междунар. симпозиума «Первичное расселение человечества» / Отв. ред. А.А. Величко, О.А. Соффер. М., 1997. С. 288–297.
54. Балановский О. П., Бужилова А. П., Балановская Е. В. Геногеографический анализ русских фамилий // Второй (четвертый) российский съезд медицинских генетиков. Тез. докл. Курск, 2000. С. 153–154.
55. Балановский О. П., Бужилова А. П., Балановская Е. В. Русский генофонд. Геногеография фамилий // Генетика. 2001. Т. 37. N 7. С. 974–990.
56. Балановский О. П., Нурбаев С. Д., Кравчук О. И., Макаров С. В., Спицын В. А., Гинтер Е. К. «Синтетические» карты генофонда мари (по данным об иммуно-биохимическом полиморфизме) // Генетика. 1999. Т. 35. N 1. С. 74–82.
57. Балановский О. П., Шадрина М. И., Сломинский П. А., Спицын В. А., Лившиц Л. А., Лимборская С. А… Полиморфизм гена CCR5, связанного с ВИЧ-1 инфекцией, в народонаселении Старого Света: экологический и этногенетический аспекты // III Конгресс этнографов и антропологов России. Тез. докл. Москва, 1999. С. 149–150.
58. Беляева О. В., Балановский О. П., Спицын В. А., Гусева И. А., Эрдэс Ш., Хуснутдинова Э. К., Микулич А. И., Нурбаев С. Д., Лимборская С.А. Новый ДНК-маркер как расово-диагностический признак // Раса: миф или реальность? Тр. 1 Междунар. конф. РО Европ. антропол. ассоциации. М.: Старый сад, 1998. С. 25–26.
59. Берже А. Краткий обзор горских племен на Кавказе (репринт по изданию 1858 г.). Нальчик, 1992. 48 с.
60. Берлянт А. М. Карты фоновых и остаточных поверхностей и их применение в географических исследованиях // Вестн. МГУ. 1969. N 4. С. 80–89.
61. Берлянт А. М. Образ пространства: карта и информация. М.: Мысль, 1986. 240 с.
62. Берлянт А. М., Кошель С. М., Мусин О. Р., Суетова И. А. Использование геоинформационных систем в геоморфологическом анализе и картографировании // Всесоюзное совещание «Новые методы и технологии в геоморфологии для решения геоэкологических задач». 1991а. С. 20–21.
63. Берлянт А.М., Кошель С. М., Мусин О. Р., Суетова И. А. Опыт создания глобальной цифровой базы данных по гипсометрической карте мира в масштабе 1:15000000 // Геоморфология. 19916. N 2. С. 25–31.
64. Бермишева М. А., Тамбетс К., Виллеме Р., Хуснутдинова Э. К. Разнообразие гаплогрупп митохондриальной ДНК у народов Волго-Уральского региона // Молекулярная биология. 2002. N 6. С. 990–1001.
65. Богданов А. П. Материалы для антропологии курганного периода Московской губернии // Труды ИОЛЕАЭ. М.: 1867. Т. 1. 176 с.
66. Брук С. И. Население мира. Этнодемографический справочник. 1-е изд. М.: Наука, 1981. 880 с. (2-е изд. М.: Наука, 1986. 830 с.).
67. Брусинцева О. В., Ельчинова Г. И., Кадошникова М. Ю., Мамедова Р. А. Сравнение популяции Краснодарского края с другими русскими популяциями по генетико-демографическим параметрам // Генетика. 1993. Т. 29. N 12. С. 2074–2079.
68. Бужилова А. П. География русских фамилий // Восточные славяне. Антропология и этническая история. М.: Научный мир. 1999. С. 135–152.
69. Бунак В. В. Об агтлютининовой реакции у человеческих рас // Рус. антропол. журн. 1923. Т. 13. Вып. 1–2. С. 115.
70. Бунак В. В. Изучение малых популяций в антропологии // Вопр. антропологии. 1965. Вып. 26. С. 5–17.
71. Бунак В. В. Геногеографические зоны Восточной Европы, выделяемые по факторам крови АВ0 // Вопросы антропологии. 1969. Вып. 32. С. 6.
72. Бунак В. В. Род Homo, его возникновение и последующая эволюция. М.: Наука, 1980. 328 с.
73. Вавилов Н. И. Центры происхождения культурных растений // Происхождение и география культурных растений. Л.: Наука, 1987. С. 33–126.
74. Вейр Б. Анализ генетических данных: дискретные генетические признаки. М.: Мир, 1995. 400 с.
75. Битов М. В. Антропологические данные как источник по колонизации Русского Севера // История СССР. 1964. N 6. С. 81–109.
76. Битов М. В. Антропологические данные как источник по истории колонизации Русского Севера. М.: Институт этнологии и антропологии РАН, 1997. 201 с.
77. Воронина В. Г. Антрополого-генетическое изучение коренного населения Приморского края: Автореф. дис. канд. биол. наук. М.: МГУ, 1983.24 с.
78. Воронцов Н. Н. Теория эволюции: Истоки, постулаты и проблемы. М.: Знание, 1984. 64 с.
79. Герберштейн 3. Записки о Московских делах // Все народы едино суть. М.: Молодая гвардия, 1987. С. 501–626.
80. Генофонд и геногеография народонаселения / Под ред. Ю. Г. Рычкова: Том И. Генофонд населения России и сопредельных стран. СПб.: Наука, 2003. 671 с.
81. Гинтер Е. К. Влияние генетической структуры на груз наследственных болезней в русских популяциях // Вестн. РАМН. 1993. N 9. С. 23–26.
82. Гинтер Е. К., Мамедова Р. А., Ельчинова Г. И., Брусинцева О. В. Генетическая структура популяций и особенности территориального распределения аутосомно-рецессивных заболеваний в Кировской области // Генетика. 1994. Т. 30. N 1. С. 107–111.
83. Гинтер Е. К., Мамедова Р. А., Козлова С. И., Галкина В. А., Мошкина И. С., Руденская Г. Е., Хлебникова О. В., Нурбаев С. Д., Балановская Е. В., Рассанов В.П. Разнообразие наследственной патологии у населения республики Марий Эл и ее дифференциация по частотам генов наследственных болезней // Генетика. 1998. Т. 34. N 7. С. 963–972.
84. Гладкова Т. Д. Кожные узоры кисти и стопы обезьян и человека. М.: 1966. 149 с.
85. Головачев Г. Д. Наследственность человека и внутриутробная гибель. М.: Медицина, 1983. 152 с.
86. Грехова Л. В., Балановская Е. В., Рычков Ю. Г. Разработка технологии создания компьютерных региональных археологических атласов: поздний палеолит Северной Евразии // Гуманитарная наука в России: Соросовские лауреаты (История. Археология. Культурная антропология и этнография). М.: 1996. С. 286–304.
87. Даль В. Толковый словарь живого великорусского языка. М.: Цитадель, 1998 (по изданию 1882 г.).
88. Диалектологический атлас русского языка. Центр европейской части СССР. В трех выпусках / Общ. ред. Р. И. Аванесов, С. В. Бромлей. Вып. I. Фонетика/Ред. С. В. Бромлей, Т. Ю. Строганова, М.: Наука, 1986. Вып. И. Морфология / Ред. С. В. Бромлей, М.: Наука, 1989. Вып. III. Лексика. Синтаксис / Ред. О.Н. Мораховская. Часть I. М.: Наука, 1996. Часть II. М.: Институт русского языка им. В. В.Виноградова РАН, 2002.
89. Дерябин В. Е. Этническая антропология современных неславянских народов Восточной Европы. Многомерное количественное изучение. Рукопись, депонированная в ВИНИТИ, N 2111-В1998. 1998. 121 с.
90. Дерябин В. Е. Современные восточнославянские народы // Восточные славяне. Антропология и этническая история. М.: Научный мир, 1999. С. 30–59.
91. Дерябин В. Е. Многомерные биометрические методы для антропологов. Рукопись, депонированная в ВИНИТИ, 2001. 312 с.
92. Дерябин В. Е. Этническая антропология современных славянских народов Восточной Европы. Многомерное количественное изучение. ВИНИТИ, N 2714-В2001. 2002. 254 с.
93. Динамика популяционных генофондов при антропогенных воздействиях / Под ред. Ю. П. Алтухова. М.: Наука, 2004. 619 с.
94. Долуханов П. М. География каменного века. М.: Наука, 1979. 152 с.
95. Долуханов П. М. Истоки этноса. Санкт-Петербург, 2000. 221 с.
96. Доссе Ж. Иммуногематология. М.: Медгиз, 1959. 637 с.
97. Древняя Русь. Город, замок, село / Под ред. Б. А. Рыбакова. М.: Наука, 1985. 432 с.
98. Дубинин Н. П., Алтухов Ю. П., Курбатова О. Л., Сусков И. И. Интегральная генетическая характеристика «адаптивной нормы» в популяциях человека // Докл. АН СССР. 1976. Т. 230. N 4. С. 957–960.
99. Дуброва Ю. Е., Алтухов Ю. П., Кучер А. Н., Икрамов К. М. Гетерозиготность по биохимическим и иммунологическим маркерам генов и изменчивость морфофизиологических признаков у человека // Генетика. 1988. Т. 24. N 3. С. 556–563.
100. Дуброва Ю. Е., Карафет Е. М., Сукерник Р. И., Гольцова Т. В. Изучение связи гетерозиготности с параметрами плодовитости у лесных ненцев // Генетика. 1990. Т. 26. N 1. С. 122–129.
101. Дюшмен Ж.-П. Составление и значение изолинейной карты плотности населения // Картография. 1983. Вып. 2. С. 120–133.
102. Евсеева И. В., Болдырева М. Н., Грудакова Е. Г. Иммуногенетическая характеристика коренных народностей севера Европейской территории России // Иммунология. 2001. N 4. 22–27 с.
103. Евсюков А. Н., Жукова О. В., Папков В. Е., Сигнеев В. И., Шереметьева В. А., Шнейдер Ю. В., Рычков Ю. Г. География генетических процессов в народонаселении. Генные миграции в Северной Евразии (европейский регион) // Генетика. 1997. Т. 33. N 11. С. 1539–1550.
104. Евсюков А. Н., Жукова О. В., Шереметьева В. А., Шнейдер Ю. В., Рычков Ю. Г. География эффективного размера сельского населения Северной Евразии: 1. Эффективный размер и интенсивность случайного дрейфа генов // Генетика. 1996а. Т. 32. N 10. С. 1396–1405.
105. Ельчинова Г. И., Кадошникова М. КХ, Мамедова Р. А. Выявление особенностей генетической структуры популяций с помощью метода описания «генетического ландшафта» // Генетика. 1991. Т. 27. N 11. С. 1994–2001.
106. Ельчинова Г. И., Кадошникова М. Ю., Мамедова Р. А., Букина А. М., Петрова Н. В., Старцева Е. А. О частотном критерии выбора фамилий для изучения генетической структуры популяций // Генетика. 1991. Т. 27. N 2. С. 358–360.
107. Ельчинова Г. И., Парадеева Г. М., Ревазов А. А. Медико-генетическое изучение населения Костромской области. Сообщение IX. Интерпретация матрицы генетических расстояний // Генетика. 1988. Т. 24. N 11. С. 2043–2049.
108. Жеребцов Л. Н. Историко-культурные взаимодействия коми с соседними народами (X — начало XIX в.). М.: Наука, 1982. 224 с.
109. Зинченко Р. А., Ельчинова Г. И., Балановская Е. В., Нурбаев С. Д., Гинтер Е. К. Влияние генетической структуры популяций на размеры груза моногенных наследственных болезней в российских популяциях // Вестник РАМН. 2000. N 5. С. 5–11.
110. Зограф Н. Ю. Антропологические исследования мужского великорусского населения Владимирской, Ярославской и Костромской губерний // ИОЛЕАЭТ. XXVI. Тр. отд. антроп. М.: 1892. Т. XV. 270 с.
111. Исмагулов О. Этническая антропология Казахстана (соматологическое исследование). Алма-Ата, 1982. 211 с.
112. Казаковцева М. А., Воевода М. И., Осипова Л. П. Полиморфизм митохондриальной ДНК у северных секульпов // Генетика. 1998. Т. 34. С. 416.
113. Кайданов Л. 3. Генетика популяций. М.: Высш. школа, 1996. 320 с.
114. Кимура М. Молекулярная эволюция: Теория нейтральности. М.: 1985. 398 с.
115. Козлов А. И., Балановская Е. В., Нурбаев С. Д., Балановский О. П. Геногеография первичной гиполактазии в популяциях Старого Света // Генетика. 1998. Т. 34. N 4. С. 551–561.
116. Кольцов Н. К. О наследственных химических свойствах крови // Успехи экспериментальной биологии. 1922. Т. 1. Вып. 3–4. С. 333.
117. Кравчук О. П., Балановский О. П., Нурбаев С. Д., Макаров С. В., Спицын В. А., Гинтер Е. К. Геногеография коренного населения Марий Эл (по данным об иммуно-биохимическом полиморфизме) // Генетика. 1998. Т. 34. N И. С. 1542–1554.
118. Курбатова О. Л. Опыт генодемографического исследования больших панмиксных популяций. Генетическая структура двух последовательных поколений жителей Москвы // Вопр. антропологи. 1975. Вып. 50. С. 30–45.
119. Курбатова О. Л. Выявление адаптивного значения полиморфизма групп крови человека путем анализа совокупности локусов. Сообщ. 1. Уровни гетерозиготности и разнообразие фенотипов в двух поколениях // Генетика. 1996. Т. 32. С. 996–1006.
120. Курбатова О. Л. Динамика генофондов в популяциях человека// Динамика популяционных генофондов при антропогенных воздействиях / Под. ред. Ю. П. Алтухова. М.: Наука, 2004. С. 414–516.
121. Курбатова О. Л., Победоносцева Е. Ю. Генетико-демографические процессы при урбанизации: миграция, аутбридинг и брачная ассортативность // Наследственность человека и окружающая среда. М.: Наука, 1992. Вып. 2. С. 7–22.
122. Курбатова О. Л., Победоносцева Е. Ю., Свежинский Е. А. Генетико-демографические процессы в московской популяции в середине 1990-х годов. Миграция и эмиграция как факторы изменения генетического разнообразия популяции // Генетика. 1997. Т. 33. N 12. С. 1688–1997.
123. Кутлахмедов Ю. А. Применение теории надежности в радиобиологии многоклеточных систем // Надежность биологических систем. Киев: Наукова думка, 1985. С. 3–17.
124. Лакин Г. Ф. Биометрия. М.: Высш. школа, 1980. 293 с.
125. Левин М. Г. Новые материалы по группам крови у эскимосов и ламутов // Сов. этнография. 1959. Т. 3. С. 98–115.
126. Левонтин Р. Генетические основы эволюции. М.: Мир, 1978. 352 с. (Lewontin R.C. The Genetic Basis of Evolutionary Change. N.Y.; L.: Columbia Univ. Press, 1974).
127. Лемза С. В., Соколова О. В. Рестрикционный полиморфизм митохондриальной ДНК среди коренного населения Западной Сибири // Генетика. 1992. Т. 28. N 5. С. 136–140.
128. Ли Ч. Введение в популяционную генетику. М.: Мир, 1978. 355 с. (Li С. С. First Course in Population Genetics. California: Boxwood Press Pacific Grove, 1976).
129. Лимборская С. А., Балановский О. П., Нурбаев С. Д. Молекулярно-генетический полиморфизм в изучении народонаселения: геногеография Восточной Европы // Раса: миф или реальность? Тр. 1 Междунар. конф. РО Европ. антропол. ассоциации. М.: Старый сад, 1998. С. 59–60.
130. Лимборская С. А., Хуснутдинова Э. К., Балановская Е. В. Этногеномика и геногеография народов Восточной Европы. М.: Наука, 2002. 261 с.
131. Любинский А. В. Результаты проведенных в Кронштадте в последние 5 лет исследований зрения у нижних чинов // Из медицинских прибавлений к Морскому сборнику. Отд. оттиск. 1885. 23 с.
132. Майр Э. Популяции, виды и эволюция. М: Мир, 1974. 460 с.
133. Макаров Н. А. Север и Юг Древней Руси в Х-первой половине XIII века: факторы консолидации и обособления // Русь в IX–XIV веках. Взаимодействие Севера и Юга / Отв. ред. Н.А. Макаров, А. В. Чернецов. М.: Наука, 2005. С. 5–10.
134. Малярчук Б. А., Денисова Г. А., Деренко М. В., Рогаев Е.И., Власенко Л. В., Жукова С. Г. Изменчивость митохондральной ДНК в потгляциях русского населения Краснодарского края, Белгородской и Нижегородской областей // Генетика. 2001. Т. 37. N 10. С. 1411–1416.
135. Малярчук Б. А., Деренко М. В. Структура митохондриального генофонда и генетическая дифференциация русского населения Восточной Европы // Антропология на пороге третьего тысячелетия: М.: Старый сад, 2004. Т.1. С. 416–426.
136. Малярчук Б. А., Деренко М. В., Гржибовский Т., Чарный Я., Мишчицка-Шливка Д., Денисова Г. А., Костюнина Е. А. Изменчивость митохондриальной ДНК в популяциях русского населения Ставропольского края, Орловской и Саратовской областей // Генетика. 2002. Т. 38. N. 11. С. 1532–1538.
137. Маурер А. М., Перевозчиков А. В. Региональные обобщенные портреты великорусов по материалам Русской антропологической экспедиции 1955–1959 гг. // Восточные славяне. Антропология и этническая история. 2-е изд. М.: Научный мир, 2002. С. 95–108.
138. Медико-генетическое описание населения Адыгеи / Отв. ред. Е. К. Гинтер. Майкоп, 1997. 225 с.
139. Миллс Ф. Статистические методы. М.: Госуд. статист, изд-во. 1958. 800 с.
140. Моисеев В.Г. Происхождение уралоязычных народов по данным краниологии / Отв. ред. А. Г. Козинцев. СПб.: Наука, 1999. 132 с.
141. Моисеева И. Г., Никифоров А. А., Романов М. Н., Балановский О. П. Динамика разнообразия домашних животных под действием антропогенного фактора // Интеграция археологических и этнографических исследований. Сб. науч. тр. Омск. 2003. С. 284–287.
142. Народы и религии мира: Энциклопедия / Гл. ред. В. А. Тишков. М.: Большая Российская энциклопедия, 1999. 928 с.
143. Наследственные болезни в популяциях человека / Под ред. Е. К. Гинтера. М.: Медицина, 2002. 303 с.
144. Никонов В. А. Имя и общество. М.: 1974. 278 с.
145. Никонов В. А. География фамилий М.: 1988. 192 с.
146. Новорадовский А. Г., Спицын В. А., Агапова Р. К. Экогененетический подход к адаптации и здоровью человека // Генетика. 1992. Т. 28. N4. С. 176–185.
147. Носов Е. Н. Происхождение первых городов Северной Руси (постановка проблемы: история и археология) // Исторические записки. М.: 2002. Вып. 5 (123). С. 30–41.
148. Нурбаев С. Д., Балановская Е. В. Геногеография и генофонд. Оценивание надежности карты // Новые методы — новые подходы в современной антропологии. М.: Старый сад, 1997. С. 116–132.
149. Нурбаев С. Д., Балановская Е. В. Компьютерная технология геногеографического изучения генофонда. V. Оценивание надежности карт // Генетика. 1998. Т.34. N 6. С. 825–838.
150. Пасеков В. П., Ревазов А. А. К популяционной генетике населения Европейского Севера РСФСР. Сообщ. 1. Данные по структуре шести деревень Архангельской области // Генетика. 1975. Т. 11. С. 145–155.
151. Перевозчиков И. П. Проблема «третьей» расы // Горизонты антропологии. Труды Междунар. научн. конф. памяти акад. В. П. Алексеева, 1994 / Отв. ред. Т. И. Алексеева. М.: Наука, 2003. С. 97–101.
152. Перепелов А. В., Иноземцева В. С., Петрин А. Н., Ситников В. Ф., Нурбаев С. Д., Балановская Е. В., Руденская Г. Е. Наследственные болезни нервной системы в Мордовии // Генетическая эпидемиология наследственных болезней нервной системы. Саранск, 1996. С. 97–12.
153. Петрин А. Н., Перепелов А. В., Ситников А.Ф., Руденская Г.Е., Нурбаев С. Д., Балановская Е. В. Наследственные болезни нервной системы в Мордовии // Генетика. 1997. Т. 33. N 6. С. 836–843.
154. Петрищев В. Н., Кутуева А. Б. Полиморфизм митохондриальной ДНК в русском населении России // Генетика. 1993. Т. 29. N. 8. С. 1382–1390.
155. Померанц Г. С., Миркина 3. А. В тени Вавилонской башни. М.: Российская политическая энциклопедия (РОССПЭН), Серия «Humanitas» 2004. 368 с.
156. Почешхова Э. А. Генетико-демографический анализ подразделенной популяции адыгов. Автореф. канд. дне. М.: 1998. 24 с.
157. Почешхова Э. А., Балановская Е. В., Балановский О. П., Нурбаев С. Д. Генофонд адыгов: прошлое в настоящем // Раса: миф или реальность? Тр.1 Междунар. конф. РО Европ. антропол. ассоциации. М.: Старый сад, 1998. С. 71–72.
158. Почешхова Э. А., Соловьева Д. С., Серегин Ю. А., Балановский О. П., Вербенко Д. А., Виллеме Р., Балановская Е. В. Генофонд народов абхазо-адыгской языковой группы в системе европейских генофондов (по аутосомным и митохондриальным ДНК-маркерам) // Экология и демография человека в прошлом и настоящем. Третьи Антропологические чтения памяти академика В.П. Алексеева. Москва, 2004. С. 274–276.
159. Происхождение и этническая история русского народа. По антропологическим данным / Под ред. В. В. Бунака. М.: Наука, 1965.414 с.
160. Происхождение человека и древнее расселение человечества // Тр. Ин-та этнографии АН СССР. М.: 1951. Т. 16. 539 с.
161. Прокоп О., Геллер В. Группы крови человека. М.: Медицина, 1991. 512 с.
162. Ревазов А. А., Казаченко Б. Н., Тарлычева Л. В., Филиппов И.К. К популяционной генетике населения Европейского Севера РСФСР. Сообщ. З. Демографические и генетические характеристики двух сельских советов Пинежского района Архангельской области // Генетика. 1979. Т. 15. N 5. С. 917–927 с.
163. Ревазов А. А., Парадеева Г.М., Ельчинова Г. И., Гинтер Е. К., Петрин А. Н., Хисамова М. В. Медико-генетическое изучение населения Костромской области. Сообщ. VIII. Генетическая структура крупных подразделенных популяций и ее связь с распространенностью аутосомно-рецессивной патологии // Генетика. 1988. Т. 24. N 11. С. 2035–2042.
164. Ревазов А. А., Парадеева Г. М., Русакова Г. И. Пригодность русских фамилий в качестве «квазигенетического» маркера // Генетика. 1986. Т. 22. N4. С. 699–703.
165. Реклю Э. Человек и Земля // СПб: Брокгауз и Эфрон, 1906. Т.1. 327 с.
166. Рогинский Я. Я. Проблемы антропогенеза. М.: Высшая школа, 1969. 262 с.
167. Рогинский Я. Я., Левин М. Г. Антропология. М.: Высшая школа, 1978. 528 с.
168. Рогинский Я. Я., Рычков Ю. Г. Генетика расообразования у человека // Проблемы медицинской генетики. М.: Медицина, 1970. С. 216.
169. Родоман Б. Б. Уроки географии // Вопросы философии. 1990. N 4. С. 36–47.
170. Русская Америка в неопубликованных записках К.Т. Хлебникова. Л.: Наука, 1979. 243 с.
171. Рыбаков Б. А. Археологические открытия. Москва.: Наука, 1984. 526 с.
172. Рычков Ю. Г. Система древних изолятов человека в Средней Азии в свете проблем стабильности и эволюции популяций: Поиски и решения на путях популяционного генетики // Вопр. антропологии. 1973. Вып. 44. С. 3–22.
173. Рычков Ю. Г. Пространство и время в геногеографии // Вестник АМН СССР. 1984. N 7. С. 11–15.
174. Рычков Ю. Г. Генохронология исторических событий // Вопросы антропологии. 1986. Т. 77. С. 3.-18.
175. Рычков Ю. Г., Балановская Е. В. Генетическая память об этногенезе // Этнические связи народов севера Азии и Америки (по данным антропологии) / Ред. М.С. Великанова, И.М. Золотарева. М.: Наука, 1986. С. 149–166.
176. Рычков Ю. Г., Балановская Е. В. Генетическая дифференциация народонаселения: Сопоставимы ли данные о полиморфизме ДНК и иммунобиохимическом полиморфизме? // Тез. докл. на IV Всесоюз. симп. «Молекулярные механизмы генетических процессов». М.: Наука, 1987. С. 95.
177. Рычков Ю. Г., Балановская Е. В. Обобщенный картографический анализ в антропологии. Отражение летописных славянских племен в антропологической географии современного русского населения // Вопросы антропологии. 1988. Вып. 80. С. 3–37.
178. Рычков Ю. Г., Балановская Е. В. Этническая генетика: Соотношение адаптивной и нейтральной генетической дифференциации этносов // Генетика. 1990а. Т. 26. N 3. С. 541–549.
179. Рычков Ю. Г., Балановская Е. В. Генетическая дифференциация народонаселения: прогнозируемы ли данные о полиморфизме ДНК, исходя из иммуно-биохимического полиморфизма// Молекулярные механизмы генетических процессов. М.: Наука, 19906. С. 67–83.
180. Рычков Ю. Г., Балановская Е. В. Генофонд и геногеография народонаселения СССР // Информ. материалы Программы «Человек, наука, общество: комплексные исследования». Подпрограмма 3. «Диалектика социального и природного в развитии человека и его отношениях с миром». Вып. 1. М., 1990 в. С. 7–17.
181. Рычков Ю. Г., Балановская Е. В. Генофонд и геногеография населения СССР // Генетика. 1992. Т.28. С. 52–75.
182. Рычков Ю. Г., Балановская Е. В., Нурбаев С. Д., Шнейдер Ю. В. Историческая геногеография восточных славян // Восточные славяне и их соседи / Отв. ред. Т. И. Алексеева. М.: Научный мир, 1999. С. 109–135. (Изд. 2. М.: Научный мир, 2002. С. 109–134.)
183. Рычков Ю. Г., Батсуурь Ж. Монголы МНР и монголоидное население Азии в свете геногеографии // Вопросы антропологии. 1987. Вып. 78. С. 44–68.
184. Рычков Ю. Г., Рычков А. В., Балановская Е. В., Батсуурь Ж., Белковский А. Н., Будилова Е. В., Терехин А. Т. Геногеография народонаселения: опыт компьютерного картографирования популяционно-генетических данных // Генетика. 1990. Т. 26. С. 332–340.
185. Рычков Ю. Г., Шереметьева В. А. Популяционная генетика алеутов Командорских островов (в связи с проблемами истории народов и адаптации населения древней Берингии // Вопросы антропологии. 1972. Вып. 40. С. 45–70.
186. Рычков Ю. Г., Шереметьева В. А. Генетика циркумполярных популяций Евразии в связи с проблемой адаптации человека // Ресурсы биосферы (Итоги советских исследований по Межд. биол. прогр.). Вып. 3. Адаптация человека. 1976. С. 10–41.
187. Рычков Ю. Г., Шереметьева В. А., Таусик Т., Жукова О. В., Бородина С. Р. Генетика и антропология таежных охотников-оленеводов Сибири (эвенки Средней Сибири). Сообщение 3. Генетические маркеры и генетическая дифференциация в популяции эвенков Средней Сибири // Вопросы антропологии. 1976. Т. 53. С. 38–58.
188. Рычков Ю. Г., Ящук (Балановская) Е. В. Генетика и этногенез // Вопросы антропологии. 1980. N 64. С. 23–39.
189. Рычков Ю. Г., Ящук (Балановская) Е. В., Веселовская Е. В. Генетика и этногенез. О генетической прапамяти систем коренного населения Северной Азии и Америки // Вопросы антропологии. 1982. Т. 69. С. 3–18.
190. Рычков Ю. Г., Ящук (Балановская) Е. В. Генетика и этногенез: Состояние и тенденции генетического процесса в связи с особенностями развития народонаселения Европы (зарубежной) // Вопросы антропологии. 1983. Вып. 72. С. 3–17.
191. Рычков Ю. Г., Ящук (Балановская) Е. В. Генетика и этногенез. Историческая упорядоченность генетической дифференциации народонаселения: модель и реальность // Вопр. антропол. 1985. Вып. 75. С. 97–116.
192. Салищев К. А. Картография. М.: Высшая школа, 1982. 272 с.
193. Салищев К. А. Картоведение. М.: МГУ, 1990. 400 с.
194. Свифт Д. Путешествия в некоторые отдаленные страны света Лемюэля Гулливера, сначала хирурга, а потом капитана нескольких кораблей / Библиотека всемирной литературы. М.: Худ. лит., 1976. С. 153–386.
195. Северцов А. С. Основы теории эволюции. М: МГУ, 1987. 320 с.
196. Седов В. В. Восточные славяне в VI–XIII вв. // Серия Археология СССР. М.: 1982. 327 с.
197. Седов В. В. Славяне в древности. М.: Фонд археологии. 1994. 342 с.
198. Седов В. В. Освоение славянами Восточноевропейской равнины // Восточные славяне. Антропология и этническая история. 1-е изд. М.: Научный мир, 1999. С. 153–160.
199. Сент-Экзюпери А. Маленький принц. Спб.: Азбука. 176 с.
200. Сербенюк С. Н., Кошель С. М, Мусин О. Р. Методы моделирования геополей по данным в нерегулярно расположенных точках // Геодезия и картография. 1990. N 11. С. 31–35.
201. Сербенюк С. Н., Кошель С. М., Мусин О. Р. Программы МАГ для создания цифровых моделей геополей // Геодезия и картография. 1991. N 4. С. 44–46.
202. Серебровский А. С. Геногеография и генофонд сельскохозяйственных животных СССР // Научное слово. 1928. N 9. С. 3–22.
203. Серебровский А. С. Проблемы и методы геногеографии // Тр. I Съезда генетиков и селекционеров. 1930. Т. 2. С. 71–86.
204. Сладкова С. В., Ревазов А.А., Голубцов В. И., Кадошникова М.Ю. Анализ структуры городских и сельских популяций центральной части Краснодарского края // Генетика. 1990. Т. 26. N И. С. 2070–2075.
205. Соловьева Т. Г. Группы крови системы АВ0 и Rh-фактор в их взаимосвязи у доноров и недоноров Ленинграда. VII Междунар. конгресс антропол. и этнограф, наук. М.: Наука, 1964 (отд. оттиск). 9 с.
206. Сорокина И. Н. Изучение популяционно-демографической структуры населения Белгородской области. Автореф. канд. дис. 2005. 24 с.
207. Спицын В. А. Биохимический полиморфизм человека (антропологические аспекты). М.: МГУ, 1985. 214 с.
208. Спицын В. А., Агапова Р. К., Новорадовский А. Г. Возможность установления генетического гомеостаза в популяциях человека по комплексу маркеров генов // Генетика. 1993. Т. 29. N 5. С. 825–836.
209. Спицын В. А., Куххойзер В., Макаров С.В., Бычковская Л. С., Пай Г. В., Балановский О. П., Афанасьева И.С. Генофонд русского народа. Частоты генетических маркеров // Генетика. 2001. Т. 37. N 3. С. 386–401.
210. Спицын В. А., Спицына Н. X., Агапова Р. К. Особенности действия максимально возможного потенциального отбора в мировом народонаселении. Данные о структуре отбора в СНГ // Генетика. 1994. Т. 30. N 1. С. 115–118.
211. Спицын В. А., Цыбикова Э. Б., Агапова Р. К., Перельман М. И., Бочков Н. П., Афанасьева И.С. Оценка гетерозиготности по биохимическим локусам при легочной патологии // Генетика. 1996. Т. 32. N 7. С. 990–995.
212. Суперанская А. В., Суслова А. В. Современные русские фамилии. М.: Наука, 1984. 176 с.
213. Суслова А. В., Суперанская А.В. О русских именах. Л.: Лениздат, 1991. 220 с.
214. Трофимов А. М., Панасюк М. В. Математико-географическое моделирование и автоматизация географических исследований //География в системе наук (Серия: Современные проблемы географии). Л.: Наука, 1987. С. 194–206.
215. Туманов А. К., Томилин В. В. Наследственный полиморфизм изоантигенов и ферментов в норме и патологии человека. М.: Медицина, 1969. 435 с.
216. Харитонов В. М., Ожигова А. П., Година Е. 3., Хрисанфова Е. Н., Бацевич В. А. Антропология. Учебное пособие для студентов высших учебных заведений. М.: Владос, 2004. 272 с.
217. Хить Г. Л. Дерматоглифика народов СССР. М.: Наука, 1983. 280 с.
218. Хить Г. Л., Долинова Н. А. Расовая дифференциация человечества (дерматоглифические данные). М.: Наука, 1990. 201 с.
219. Хотко С. X. Очерки истории черкесов. От эпохи киммерийцев до Кавказской войны. С.-П., 2001. 432 с.
220. Хрисанфова Е. Н., Перевозчиков И. В. Антропология. М.: Изд-во Моск. ун-та, 1999 (2-е изд). 400 с.
221. Чебоксаров Н. Н., Чебоксарова И.А. Народы, расы, культуры. М.: Наука, 1971. 256 с.
222. Чепурковский Е. М. Географическое распределение формы головы и цветности крестьянского населения преимущественно Великороссии в связи с колонизацией ее славянами (Материалы для антропологии России) // Тр. Антропол. отдела. 1913. Т. 28. Вып. 2. 107 с.
223. Чурносов М. И. Генетико-демографическая структура и распространенность мультифакториальных признаков в популяции Курской области. Автореф. докт. дис. М., 1997. 40 с.
224. Шереметьева В. А., Евсюков А. Н. Интеграция систем морфологического полиморфизма в пространстве Северной Евразии // Теория антропологии и ее методы: истоки и развитие. V Бунаковские чтения. Тезисы докладов. Ч. 2. 2001. С. 63–64.
225. Шереметьева В. А., Рычков Ю. Г. Популяционная генетика народов Северо-Восточной Азии. М.: МГУ, 1978. 151 с.
226. Шмальгаузен И. И. Пути и закономерности эволюционного процесса. Избранные труды. М.: Наука, 1983. 360 с.
227. Шмальгаузен И. И. Стабилизирующий отбор // Шмальгаузен И. И. Пути и закономерности эволюционного процесса. Избранные труды. М.: Наука, 1985. 360 с.
228. Шнейдер Ю. В. Генофонд и геногеография населения Урала по данным о биохимических маркерах. Автореф. канд. дис. 1999. 25 с.
229. Щербина Ф. А. История Кубанского казачьего войска. Т.1. Екатеринодар, 1910. 701 с.
230. Яблоков А. В. Популяционная биология. М.: Высш. школа, 1987. 303 с.
231. Яблоков А. В., Юсуфов А. Г. Эволюционное учение. М.: Высш. школа, 1976. 331 с.
232. Янин В. JT. Средневековый город: Очерки археологии и истории / РАН. Отделени ист-филол. наук. М.: Наука, 2004. 416 с.
233. Ящук (Балановская) Е. В. Модель микродифференциации в условиях развивающейся системы популяций человека // Тез. 1 Всесоюзн. съезда мед. генет. Киев, 1984. С. 295.
234. Ящук (Балановская) Е. В. Проверка одной из гипотез наследования пальцевых узоров человека // Генетика. 1985. Т. 21. N 11.
235. Ammerman A. J., Cavalli-Sforza L. L. Neolithic Transition and the Genetics of Populations in Europe. Princeton. N.J.: Princeton University Press. 1984. 176 p.
236. Andreas O., Karlsson A. O., Wallerstro Т., Gotherstrom A., Holmlund G. Y-chromosome diversity in Sweden — A long-time Perspective // Eur. J. Hum. Genet. 2006. 14. P. 963–970.
237. Balanovska E. V. Gene diversity of North Eurasia population as compared to the world gene pool // The First Workshop on Information Technologies Application to Problems of Biodiversity and Dynamics of Ecosystems in North Eurasia (WITA’2001). Novosibirsk, Russia. 2001. P. 286.
238. Balanovsky O. P., Shadrina M. I., Limborska S. A., Balanovska E. V. Global distribution of the CCR5del32 mutation, causing resistance to HIV-1 infection: does it depend on climate, or history, or diseases // Materials of the first international young medics’ conference «Young doctors on the threshold of the third millennium». Yerevan, Armenia, 2001.
239. Balanovsky O. P., Balanovska E. V. The Gene Pool of Eastern European Populations: Computer Cartography of Anthropological, Classical Genetic and DNA data // The First Workshop on Information Technologies Application to Problems of Biodiversity and Dynamics of Ecosystems in North Eurasia (WITA’2001). Selected Papers. Novosibirsk, 2002. P. 255–258.
240. Balanovsky O. P., Shadrina М. I., Limborska S. A., Balanovska E. V. Global distribution of the CCR5del32 mutation, causing resistance to HIV-1 infection: does it depend on climate, or history, or diseases // Materials of the first international young medics’ conference «Young doctors on the threshold of the third millennium». Yerevan, Armenia, 2001.
241. Balanovsky O., Pocheshkhova E., Pshenichnov A., Solovieva D., Kuznetsova М., Voronko O., Chumosov М., Tegako O., Atramentova L., Lavryashina М., Evseeva I., Borinska S., Boldyreva М., Dubova N., Balanovska E. Is spatial distribution of the HIV-1-resistant CCR5Delta32 allele formed by ecological factors? // J. Physiol. Anthropol. Appl. Human Sci. 2005. N 24(4). P. 375–382.
242. Balanovsky O., Rootsi S., Pshenichnov A., Kivisild Т., Chumosov М., Evseeva I., Pocheshkhova E., Boldyreva М., Yankovsky N., Balanovska E., Villems R. Two sources of the Russian patrilineal heritage in their Eurasian context // Am. J. Hum. Genet. 2008. N 1. (in print).
243. Barbujani G., Magagni A., Minch E., Cavalli-Sforza L. L. An apportionment of human DNA diversity // Proc. Natl. Acad. Sci. USA. 1997. V. 94. P. 4516–4519.
244. Barbujani G., Sokal R.R. The zones sharp genetic change in Europe are also language boundaries // Proc. Natur. Acad. Science USA. 1990. V.87. N5. P. 1816–1819.
245. Bedoya G., Montoya P., Garcia J. Admixture dynamics in Hispanics: a shift in the nuclear genetic ancestry of a South American population isolate // Proc. Nat. Acad. Sci. USA. 2006. V. 9. N 103(19). P. 7234–7239.
246. Behar D. М., Metspalu E., Kivisild Т., Achilli A., Hadid Y., Tzur S., Pereira L., Amorim A., Quintana-Murci L., Majamaa K., Hermstadt C., Howell N., Balanovsky O., Kutuev I., Pshenichnov A., Gurwitz D., Bonne-Tamir B., Torroni A., Villems R., Skorecki K. The matrilineal ancestry of Ashkenazi Jewry: portrait of a recent founder event // Am. J. Hum. Genet. 2006. 78(3). P. 487–497.
247. Belyaeva O., Bermisheva М., Khrunin A., Slominsky P., Bebyakova N., Khusnutdinova E., Mikulich A., Limborska S. Mitochondrial DNA variations in Russian and Belorussian populations // Hum. Biol. 2003. 75(5). P. 647–660.
248. Berlyant A. М., Koshel S. М., Musin O. R., Suyetova I. A. Constructing a global digital data base using a world hypsometric map 1:15,000,000 scale: preliminary results // Mapping Sciences and Remote Sensing. 1992. V. 29. N 2. P. 146–154.
249. Bodmer W. F., Cavalli-Sforza L. L. Genetics, Evolution, and Man // San Francisco: W.H. Freeman. 1976. 782 p.
250. Bosch E., Calafell F., Perez-Lezaun A., Comas D., Izaabel H., Akhayat O., Sefiani A., Hariti G., Dugoujon J. М., Bertranpetit J. Y chromosome STR haplotypes in four populations from northwest Africa // Int. J. Legal Med. 2000. V. 114. P. 36–40.
251. Bowcock A., Cavalli-Sforza L. The study of variation in the human genome // Genomic. 1991. V. 11. P. 401–498.
252. Bowcock A. М., Bucci C., Hebert J. М., Kidd J. R., Kidd К. K., Friedlaender J. C., Cavalli-Sforza L. L. Study of 47 DNA markers in five populations from four continents // Gene Geography. 1987. V. 1. P. 47–64.
253. Bowcock A. М., Hebert J. M, Mountain J. L., Kidd J.R., Rogers J., Kidd К. K., Cavalli-Sforza L. L. Study of an additional 58 DNA markers in five human populations from four continents // Gene Geography. 1991a. 5(3). P. 151–173.
254. Bowcock A. М., Kidd J.R., Mountain J. L., Hebert J. М., Carotenuto L., Kidd К. K., Cavalli-Sforza L. L. Drift, admixture, and selection in human evolution: A study with DNA polymorphisms // Proc. Natl. Acad. Sci. USA. 1991b. V. 88. P. 839–843.
255. Carmeli D., Cavalli-Sforza L. L. The genetic origin of the Jews: A multi-variate approach // Hum. Biol. 1979. V. 51. P. 41–61.
256. Cavalli-Sforza L. L. Population structure and human evolution // Proc. F. Soc. London. Ser. B. 1966. V. 164. P. 362–379.
257. Cavalli-Sforza L. L., Bodmer W. F. The Genetics of Human Population. San Francisco / W. H. Freeman. 1971. 965 p.
258. Cavalli-Sforza L. L., Edwards A. W. F. Phylogenetics analysis: Models and estimation procedures // Am. J. Human Genet. 1967a. V. 19. P. 223–257.
259. Cavalli-Sforza L. L., Menozzi P., Piazza A. History and Geography of Human Genes. Princeton: Princeton University Press. 1994. 1059 p.
260. Cavalli-Sforza L. L. Menozzi P., Piazza A. History and Geography of Human Genes. Princeton: Princ. Univ. Press, 1995.
261. Cavalli-Sforza L. L., Piazza A. Human genomic diversity in Europe: A summary of recent research and prospects for the future // Europe Journal of Human Genetics. 1993. V. 1. P. 3–18.
262. Chacraborty R., Fuerst P. A., Nei M. Statistical studies on protein polymorfhism in natural populations. II. Gene differentiation between populations // Genetics. 1978. V. 88. P. 367–390.
263. Chikhi L., Destro-Bisol G., Pascali V., Baravelli V., Dobosz М., Barbujani G. Clinal variation in the nuclear DNA of Europeans // Hum. Biol. 1998a. P. 643–657.
264. Chikhi L., Destro-Bisol G., Bertorelle G., Pascali V., Barbujani G. Clines of nuclear DNA markers suggest a largely neolithic ancestry of the European gene pool // Proc. Nat. Acad. Sci. USA. 1998b. P. 9053–9058.
265. Chikhi L., Nichols R. A., Barbujani G., Beaumont M. A. Y genetic data support the Neolithic demic diffusion model // Proc. Nat. Acad. Sci. USA. 2002. P. 11008-110013.
266. Cinnioglu C., King R., Kivisild T. Underhill. Excavating Y-chromosome haplotype strata in Anatolia // Am. J. Hum. Genet. 2004. N 114. P. 127–148.
267. Comuzzie A. G., Crawford М. H. Biochemical heterozygosity and morphologycal variability: interpopulational versus intrapopulational analyses // Hum. Biol. 1990. V. 62. N 1. P. 101–112.
268. Crow J. F., Mange A. P. Measerement of inbreeding from frequency of marriges between person of the same surname // Eug. Quart. 1965. V. 12. P. 199–203.
269. Giacomo F. Di, Luca F., Anagnou N. Clinal patterns of human Y chromosomal diversity in continental Italy and Greece are dominated by drift and founder effects // Molecular Phylogenetics and Evolution. 2003. N 28. P. 387–395.
270. Dean М., Carrington М., Winkler C., Huttley G. A., Smith M. W., Allikmets R., Goedert J. J., Buchbinder S.P., Vittinghott E., Gomperts E., Donfield S., Vlahov D., Kaslow R., Saah A., Rinaldo C., Detels R., O’Brien S.J. Genetic restriction of HIV-1 infection and progression to AIDS by a deletion allele of the CCR5 structural gene. Hemophilia Growth and Development Study, Multicenter AIDS Cohort Study, Multicenter Hemophilia Cohort Study, San Francisco City Cohort, ALIVE Study // Science. 1996. V. 273. P. 1856–1862.
271. Destro-Bisol G., Donati F., Coia V., Boschi I., Verginelli F., Caglia A., Tofanelli S., Spedini G., Capelli C. Variation of female and male lineages in sub-Saharan populations: the importance of sociocultural factors // Molec. Biol. Evol. 2004. V. 21. P. 1673–1682.
272. Dobzhansky Th. Genetics and the origin of species. N.Y.: Columbia Univ. press, 1st ed. 1937. 364 p.
273. Dobzhansky Th. Genetics of the Evolunary Process. N.Y.: Columbia Univ. Press. 1970. 505 p.
274. Doron М., Behar M. G. Multiple Origins of Ashkenazi Levites: Y Chromosome Evidence for Both Near Eastern and European Ancestries // Am. J. Hum. Genet. 2003. N 73. P. 768–779.
275. Dragic Т., Litwin V., Allaway G.P. HIV-1 entry into CD4+ cells is mediated by the chemokine receptor CC–CKR-5 // Nature. 1996. 20; 381(6584). P. 667–673.
276. Edwards A. W. F., Cavalli-Sforza L. L. Affinity as revealed by differences in gene frequencies // The assessment of population affinities in man. Oxford. 1972. P. 37.
277. Finnila S., Lehtonen M. S., Majamaa K. Phylogenetic Network for European mtDNA// Am. J. Hum. Genet. 2001. V. 68. P. 1475–1484.
278. Fisher R. A. The Genetical Theory of Natural Selection. N-Y: Dover. 1930. 272 p.
279. Forster P., Harding R., Torroni A., Bandelt H. J. Free in PMC Origin and evolution of Native American mtDNA variation: a reappraisal // Am. J. Hum. Genet. 1996. 59(4). P. 935–945.
280. Fuerst P. A., Chacraborty R., Nei M. Statistical studies on protein polymorfhism in natural populations. I. Distribution of single locus heterozygosity // Genetics. 1977. V. 86. P. 455–483.
281. Galvani A. P., Slatkin M. Free in PMC Evaluating plague and smallpox as historical selective pressures for the CCR5-Delta 32 HIV-resistance allele // Proc. Nat. Acad. Sci. USA. 2003. V. 9. N 100(25). P. 15276-15279.
282. Galvani A. P., Novembre J. The evolutionary history of the CCR5-Delta32 HIV-resistance mutation // Microbes Infect. 2005. N 7(2). P. 302–309.
283. Genest J. Hereditary transmission for 300 years of a satellited Y chromosome in a family //Ann Genet. 1973. N 16(1). P. 35–38.
284. Hamilton G., Stoneking М., Excoffier L. Molecular analysis reveals tighter social regulation of immigration in patrilocal populations than in matrilocal populations // Proc. Nat. Acad. Sci. USA. 2005. N 102. P. 7476–7480.
285. Handt O., Meyer S., Haeseler A. Free in PMC Compilation of human mtDNA control region sequences // Nucleic Acids Res. 1998. V. 1. N 26(1). P. 126–129.
286. Hermstadt C., Elson J. L., Fahy E., Preston G., Turnbull D. М., Anderson C., Ghosh S. S., Olefsky J. М., Beal M. F., Davis R. E., Howell N. Analysis of complete mitochondrial DNA coding-region sequences for the major African, Asian, and European haplogroups // Am. J. Hum. Genet. 2002. V. 70. P. 1152–1171.
287. Hermstadt C., Preston G., Andrewsb R., Chinnery P., Lightowlers R. N., Turnbull D. М., Kubacka I., Howell N. A high frequency of mtDNA polymorphisms in HeLa cell sublines // Mutation Research. 2002. V. 501. P. 19–28.
288. Hirsfeld L., Hirsfeld H. Serological differences between the blood of different races. The results of researches on the Macedonian front // Lancet. 1919. P. 675.
289. Immel U. D., Krawczak М., Udolph J., Richter A., Rodig H., Kleiber М., Klintschar M. Y-chromosomal STR haplotype analysis reveals surname-associated strata in the East-German population // Eur. J. Hum. Genet. 2006. N 14(5). P. 577–582.
290. Jobling M. A. In the name of the father: surnames and genetics // Trends Genet. 2001. N 17(6). P. 353–357.
291. Jorde L. B. The genetic structure of subdivided human populations: a review // Current Development in Anthropological genetics. V. 1. Theory and Methods / Eds J. H. Miekle, М. H. Crawford. N. Y.; L.: Plenum Press. 1981. P. 135–208.
292. Karafet Т. М., Osipova L.P., Gubina M. A., Posukh O. L., Zegura S. L., Hammer M. F. High levels of Y-chromosome differentiation among native Siberian populations and the genetic signature of a boreal hunter-gatherer way of life // Hum Biol. 2002. N 74(6). P. 761–789.
293. Karlin S., Kenett R., Bonne-Tamir B. Analysis of biochemical genetic date on Jewish populations. II. Results and interpretations of heterogeneity indices and distance measures with respect to standards //Am. J. Hum. Genet. 1979. V. 31. P. 341–365.
294. Karlsson A. O., Wallerstro Т., Gotherstrom A., Holmlund G. Y-chromosome diversity in Sweden — A long-time Perspective // Eur. J Hum Genet.
2006. N 14. P. 963–970.
295. Kayser М., Lao O., Anslinger K. Significant genetic differentiation between Poland and Germany follows present-day political borders, as revealed by Y-chromosome analysis //Am. J. Hum. Genet. 2005. N 117. P. 428–443.
296. King Т. E., Ballereau S.J., Schiirer К. E., Jobling M. A. Genetic signatures of coancestry within surnames // Curr Biol. 2006. V. 21. N 16(4). P. 384–388.
297. Kivisild Т., Rootsi S., Metspalu М., Mastana S., Kaldma K., Parik J., Metspalu E., Adojaan М., Tolk H.-V., Stepanov V., Golge М., Usanga E., Papiha S. S., Cinnioglu C., King R., Cavalli-Sforza L., Underhill P. A., Villems R. The Genetic Heritage of the Earliest Settlers Persists Both in Indian Tribal and Caste Populations //Am. J. Hum. Genet. 2003. V. 72. P. 313–332.
298. Kivisild Т., Tolk H. V., Parik J., Wang Y., Papiha S. S., Bandelt H. J., Villems R. The Emerging Limbs and Twigs of the East Asian mtDNA Tree //Mol. Biol. Evol. 2002. 19(10). P. 1737–1751.
299. Kivisild Т., Villems R., Jorde L. B., Bamshad М., Kumar S., Hedrick P., Dowling Т., Stoneking М., Parsons T. J., Irwin J. A., Awadalla P., Eyre-Walker A., Smith J.M. Questioning Evidence for Recombination in Human Mitochondrial DNA// Science. 2000. 288(5473). P. 1931a.
300. Kobyliansky E., Livshits G. Anthropometric multivariate structure and dermatoglyphic peculiarities in biochemically and morpologically different heterozygous groups // Amer. J. Physical Anthropol. 1986. V. 70. P. 251–263.
301. Kobyliansky E., Livshits G. Relationship between levels of biochemical heterozygosity and morphological variability in human populations // Ann. Hum. Genet. 1983. V. 47. P. 215–223.
302. Koshel S. М., Musin O. R. Digital models for studying of environmental change // Proc. of Int. Symp. on Environmental Change and GIS (INSEG’91). 1991. Asahikawa, Japan. V. 2. P. 321–327.
303. Koshel S. М., Musin O. R. Spatial Modelling and Analysis for GIS // GIS Bmo 1994. Conference «Europe in Transition». 1994. P. 30.
304. Koshel S. М., Musin O. R. Semin V.N. Digital models and Geographical Information Systems // Proc. of Int. Conf. on GIS (GIS Bmo 1991). 1991. P. 50.
305. Latter B. D. H. Genetic differences within and between populations of the major human subgroups // Amer. Natur. 1980. V. 116. N 2. P. 230–239.
306. Levontin R.C. The apportionment of human diversity // Evol. Biol. 1972. V. 6. P. 381–398.
307. Lewontin R. C., Krakauer J. Distibution of gene frequency as a test of the theory of the selective neutrality of polymorphisms // Genetics. 1973. V. 74. P. 175–195.
308. Libert F., Cochaux P., Beckman G., Samson М., Aksenova М., Cao A., Czeizel A., Claustres М., de la Rua C., Ferrari М., Ferrec C., Glover G., Grinde B., Giiran S., Kucinskas V., Lavinha J., Mercier B., Ogur G., Peltonen L., Rosatelli C., Schwartz М., Spitsyn V., Timar L., Beckman L., Parmentier М., Vassart G. The deltaccr5 mutation conferring protection against HIV-1 in Caucasian populations has a single and recent origin in Northeastern Europe // Hum. Mol. Genet. 1998. N 7 (3). P. 399–406.
309. Limborska S. A., Balanovsky O. P., Balanovska E. V., Slominsky P. A., Schadrina M.I., Livshits L. A., Kravchenko S. A., Pampuha V. М., Khusnutdinova E. K., Spitsyn V. A. Analysis of CCR5A32 geographic distribution and its correlation with some climatico-geographic factors // Human Heredity. 2002. 53(1). P. 49–54.
310. Livshits G., Kobyliansky E. Biochemical heterozygosity as a preditor of developmental homeostasis //Ann. Hum. Genet. 1984. P. 173–184.
311. Livshits G., Sokal R. R., Kobyliansky E. Genetic affinities of Jewish populations //Am. J. Hum. Genet. 1991. V. 49. P. 131–146.
312. Loogvali E. L., Roostalu U., Malyarchuk B. A., Derenko М. V., Kivisild Т., Metspalu E., Tambets K., Reidla М., Tolk H. V., Parik J., Pennarun E., Laos S., Lunkina A., Golubenko М., Barac L., Pericic М., Balanovsky O. P., Gusar V., Khusnutdinova E. K., Stepanov V., Puzyrev V., Rudan P., Balanovska E. V., Grechanina E., Richard C., Moisan J. P., Chaventre A., Anagnou N. P., Pappa K. I., Michalodimitrakis E. N., Claustres М., Golge М., Mikerezi I., Usanga E., Villems R. Disuniting uniformity: a pied cladistic canvas of mtDNA haplogroup H in Eurasia // Mol. Biol. Evol. 2004. 21(11). P. 2012–2021.
313. Lucotte G., Mercier G. Del 32 mutation frequencies of the CCR5 coreceptor in different French regions // Life Sciences. 1998. V. 321. P. 409–413.
314. Lucotte G. Distribution of the CCR5 gene 32-basepair deletion in West Europe. A hypothesis about the possible dispersion of the mutation by the Vikings in historical times // Hum. Immunol. 2001. 62(9). P. 933–936.
315. Macaulay V., Richards М., Hickey E., Vega E., Cruciani F., Guida V., Scozzari R., Bonne-Tamir B., Sykes B., Torroni A. The Emerging Tree of West Eurasian mtDNAs: A SynthesisZ of Control-Region Sequences and RFLPs //Am. J. Hum. Genet. 1999. P. 232–249.
316. MacIntyre, Sooman. Non-paternity and prenatal genetic screening // Lancet. 1991. V. 5. N 338(8771). P. 869–871.
317. Malyarchuk B. A., Rogozin I. B. Mutagenesis by Transient Misalignment in the Human Mitochondrial DNA Control Region //Annals of Human Genetics. 2004. V. 68. P. 324–339.
318. Malyarchuk B. A., Derenko М. V. Mitochondrial DNA variability in Russians and Ukrainians: Implication to the origin of the Eastern Slavs // Annals of Human Genetics. 2001. V. 65. P. 63–78.
319. Malyarchuk B. A, Grzybowski T, Derenko М. V, Czamy J, Wozniak M, Miscicka-Sliwka D. Mitochondrial DNA variability in Poles and Russians // Annals of Human Genetics. 2002. V. 66. P. 261–283.
320. Martinson J. J., Chapman N. H., Rees D. C., Liu Y-Т., Clegg J. B. Global distribution of the CCR5 gene 32-basepair deletion // Nature Genet. 1997. V.16.P. 100–103.
321. Martinson J. J., Hong L., Karanicolas R., Moore J. P., Kostrikis L. G. Global distribution of the CCR2-64I/CCR5-59653T HIV-1 disease-protective haplotype //AIDS. 2000. N 14(5). P. 483–489.
322. McEvoy, Bradley. Y-chromosomes and the extent of patrilineal ancestry in Irish surnames // Hum Genet. 2006. N 119(1–2). P. 212–219.
323. Mecsas J., Franklin G., Kuziel W. A., Brubaker R. R., Falkow S., Mosier D. E. Evolutionary genetics: CCR5 mutation and plague protection // Nature. 2004. V. 12. N 427(6975). P. 606.
324. Menozzi P., Piazza A., Cavalli-Sforza L. L. Synthetics maps of human gene frequencies in Europe // Science. 1978. V. 201. P. 786–792.
325. Michoud D. Les problems poses par 1’incompatibility Rh fcetomatemalle. Lyon, 1961.
326. Moore L. Т., McEvoy В., Cape E., Simms K., Bradley D. G. A Y-chromosome signature of hegemony in Gaelic Ireland //Am. J. Hum. Genet. 2006. N 78(2). P. 334–338.
327. Mourant A. E. The genetics of the jews. Oxford: Clarendon Press. 1978.
328. Mourant A. E., Kopec A. C., Domaniewska-Sobczak K. The Distribution of the Human Blood Groups and Other Polymorphism. London, 1976. P. 1055.
329. Nei M. Variation and correlation of gene frequencies in subdivided populations // Evolution. 1965. V. 19. P. 256–258.
330. Nei M. Molecular Population Genetics and Evolution. Amsterdam: North-Holland Publ. Co., 1975. 290 p.
331. Nei М., Roychoudhury A. K. Genetic variation within and between the three major races in man, Caucasoides, Negroids and Mongoloids // Amer. J. Hum. Genet. 1974. V. 26. P. 421–443.
332. O’Brien S. J., Moore J. P. The effect of genetic variation in chemokines and their receptors on HIV transmission and progression to AIDS // Immunol. Rev. 2000. V. 177. P. 99–111.
333. Oota H., Settheetham-Ishida W., Tiwawech D., Ishida Т., Stoneking M. Human mtDNA and Y-chromosome variation is correlated with matrilocal versus patrilocal residence // Nature Genetics. 2001. N 29. P. 20–21.
334. Orekhov V., Poltoraus A., Zhivotovsky L. A., Spitsyn V., Ivanov P., Yankovsky N. Mitochondrial DNA sequence diversity in Russians // FEBS Lett, 1999. V. 19. 445(1). P. 197–201.
335. Osier М. V., Cheung К. H., Kidd J.R., Pakstis A. J., Miller P. L., Kidd К. K. An allele frequency database for anthropology // Am. J. Phys. Anthropol. 2002. N 119(1). P. 77–83.
336. Palanichamy М., Sun C., Agrawal S., Bandelt H-J., Kong Q-Р., Khan F., Wang C-Y., Chaudhuri K.T., Palla V., Zhang Y-P. Phylogeny of Mitochondrial DNA Macrohaplogroup N in India, Based on Complete Sequencing: Implications for the Peopling of South Asia // Am. J. Hum. Genet. 2004. V. 75. P. 966–978.
337. Piazza A., Menozzi P., Cavalli-Sforza L. L. Synthetic gene frequency maps of man and selective effects of climate // Proc. Nat. Acad. Sci. USA. 1981a. V. 78. P. 2638–2642.
338. Piazza A., Menozzi P., Cavalli-Sforza L. L. The making and testing of geographic gene frequency maps // Biometrics. 1981b. V. 37. P. 635–659.
339. Popova S. N., Slominsky P. A., Pocheshnova E. A., Balanovskaya E. V., Tarskaya L. A., Bebyakova N. A., Bets L. V., Ivanov V. P., Livshits L. A., Khusnutdinova E. K., Spitcyn V. A., Limborska S. A. Polymorphism of trinudeotide repeats in loci DM, DRPLA and SCA1 in East European populations // European J. of Human Genetics. 2001. N 9. P. 829–835.
340. Poloni E. S., Excoffer L., Mountain J. L., Langaney A., Cavalli-Sforza L. L. Nuclear DNA polymorphism in a Mandenka population from Senegal: comparison with eight other human populations //Ann. Hum. Genet. 1995. V. 59. P. 43–61.
341. Reidla М., Kivisild Т., Metspalu E., Kaldma K., Tambets K., Tolk H-V, Parik J., Loogva li E-L., Derenko М., Malyarchuk B, Bermisheva М., Zhadanov S., Pennarun E., Gubina М., Golubenko М., Damba L., Fedorova S., Gusar V., Grechanina E., Mikerezi I., Moisan J-P, Chaventre A., Khusnutdinova E., Osipova L., Stepanov V., Voevoda М., Achilli М., Rengo C., Rickards O., Stefano G. F., Papiha S., Beckman L., Janicijevic B., Rudan P., Anagnou N., Michalodimitrakis E., Koziel S., Usanga E., Geberhiwot Т., Hermstadt C., Howell N., Torroni A., Villems R. Origin and Diffusion of mtDNA Haplogroup X // Am. J. Hum. Genet. 2003. V. 73. P. 1178–1190.
342. Rendine S., Piazza A., Cavalli-Sforza L. L. Simulation and separation by principal components of multiple demic expansions in Europe // Am. Nat. 1986. V. 128. N 5. P. 681–706.
343. Rendine S., Piazza A., Menozzi P., Cavalli-Sforza L. L. A problem with synthetic maps: Reply to Sokal et al. // Human Biology. 1999. V. 71. N 1. P. 14–25.
344. Richards М., Macaulay V., Hickey E., Vega E., Sykes B., Guida V., Rengo C., Sellitto D., Cruciani F., Kivisild Т., Villems R., Thomas М., Rychkov S., Rychkov O., Rychkov Y., Golge М., Dimitrov D., Hill E., Bradley D., Romano V., Cali F., Vona G., Demaine A., Papiha S., Triantaphyllidis C., Stefanescu G., Hatina J., Belledi М., Di Rienzo A., Novelletto A., Oppenheim A., Norby S., Al-Zaheri N., Santachiara-Benerecetti S., Scozari R., Torroni A, Bandelt H. J. Tracing European founder lineages in the Near Eastern mtDNA pool //Am. J. Hum. Genet. 2000. V. 67. P. 1251–1276.
345. Roewer L., Croucher P. J., Willuweit S., Lu Т. Т., Kayser М., Lessig R., Knijff P., Jobling M.A., Tyler-Smith C., Krawczak M. Signature of recent historical events in the European Y-chromosomal STR haplotype distribution // Hum. Genet. 2005. N 116(4). P. 279–291.
346. Roewer L., Krawczak М., Willuweit S., Nagy М., Alves C., Amorim A., Anslinger K., Augustin C., Betz A., Bosch E., Caglia A., Carracedo A., Corach D., Dekairelle A.F., Dobosz Т., Dupuy B.M., Furedi S., Gehrig C., Gusmao L., Henke J., Henke L., Hidding М., Hohoff C., Hoste B., Jobling M. A., Kargel H. J., de Knijff P., Lessig R., Liebeherr E., Lorente М., Martinez-Jarreta B., Nievas P., Nowak М., Parson W., Pascali V. L., Penacino G., Ploski R., Rolf B., Sala A., Schmidt U., Schmitt C., Schneider P. М., Szibor R., Teifel-Greding J., Kayser M. Online reference database of European Y-chromosomal short tandem repeat (STR) haplotypes // Forensic Sci Int. 2001. V. 15. N 118(2–3). P. 106–113.
347. Rogers A. R., Jorde L.B. Genetics evidence on modem human population // Human Biology. 1995. V. 67. P. 1–36.
348. Rootsi S., Magri C., Kivisild Т., Benuzzi G., Help H., Bermisheva М., Kutuev I., Barac L., Pericic М., Balanovsky O., Pshenichnov A., Dion D., Grobei М., Zhivotovsky L. A., Battaglia V., Achilli A., Al-Zahery N., Parik J., King R., Cinnioglu C., Khusnutdinova E., Rudan P., Balanovska E., Scheffrahn W., Simonescu М., Brehm A., Goncalves R., Rosa A., Moisan J. P., Chaventre A., Ferak V., Furedi S., Oefner P. J., Shen P., Beckman L., Mikerezi I., Terzic R., Primorac D., Cambon-Thomsen A., Krumina A., Torroni A., Underhill P. A., Santachiara-Benerecetti A. S., Villems R., Semino O. Phylogeography of Y-Chromosome Haplogroup I Reveals Distinct Domains of Prehistoric Gene Flow in Europe //Am. J. Hum. Genet. 2004. P. 128–137.
349. Rosser Z. H., Zeijal Т., Hurles М. E., Adojaan М., Alavantic D., Amorim A., Amos W., Armenteros М., Arroyo E., Barbujani G., Beckman G., Beckman L., Bertranpetit J., Bosch E., Bradley D. G., Brede G., Cooper G., Corte-Real H. B., de Knijff P., Decorte R., Dubrova Y. E., Evgrafov O., Gilissen A., Glisic S., Golge М., Hill E. W., Jeziorowska A., Kalaydjieva L., Kayser М., Kivisild Т., Kravchenko S. A., Krumina A., Kucinskas V., Lavinha J., Livshits L. A., Malaspina P., Maria S., McElreavey K., Meitinger T. A., Mikelsaar A. V., Mitchell R. J., Nafa K., Nicholson J., Norby S., Pandya A., Parik J., Patsalis P. C., Pereira L., Peterlin B., Pielberg G., Prata M. J., Previdere C., Roewer L., Rootsi S., Rubinsztein D. C., Saillard J., Santos F. R., Stefanescu G., Sykes В. C., Tolun A., Villems R., Tyler-Smith C., Jobling M. A. Y-chromosomal diversity in Europe is clinal and influenced primarily by geography, rather than by language //Am. J. Hum. Genet. 2000. V. 67. P. 1526–1543.
350. Roychoudhury A. K. Gene differentiation among caste and linguistic populations of India // Hum. Hered. 1974. V. 24. P. 317–322.
351. Rychkov Yu. G., Sheremetyeva V. A. The genetic process in the system of ancient human isolates in North Asia // Population Structure and Human Variation / Ed. G. A. Harrison. Intemat. Biol. Programme. V. 11. Cambridge: Cambridge Univ. Press. 1977. P. 47–108.
352. Rychkov Yu. G., Sheremetyeva V. A. The genetics of circumpolar populations of Eurasia related to the problem of human adaptation // The Human Biology of Circumpolar Population. Intern. Biol. Programme. V. 21 / Ed. F. A. Milan Cambridge: Cambridge Univ. Press. 1979. P. 37–80.
353. Rychkov Yu.G., Yashchuk (Balanovskaya) E. V. Historical regulation of genetic differentiation of human populations (Model and reality) // Genetic Microdifferentiation in Human and Other Animal Populations. Proc. Intern. Symp. Indian anthropologist. 1985. V. 1. P. 219–232.
354. Saillard J., Forster P., Lynnerup N., Bandelt H-J., Norby S. mtDNA Variation among Greenland Eskimos: The Edge of the Beringian Expansion //Am. J. Hum. Genet. 2000. V. 67. N 3. P. 718–726.
355. Sajantila A., Lahermo P., Anttinen Т., Lukka М., Sistonen P., Savontaus M. L., Aula P., Beckman L., Tranebjaerg L., Gedde-Dahl Т., Issel-Tarver L., DiRienzo A., Paabo S. Genes and languages in Europe: an analysis of mitochondrial lineages // Genome Res. 1995. N 5(1). P. 42–52.
356. Sajantila A., Salem A. H., Savolainen P., Bauer K., Gierig C., Paabo S. Related Articles, Links Paternal and maternal DNA lineages reveal a bottleneck in the founding of the Finnish population // Proc. Natl. Acad. Sci. USA. 1996. V. 93(21). P. 12035-12039.
357. Sanchez-Mazas A., Butler-Brunner E., Excoffier L., Ghanem N., Salem М. B., Breguet G., Dard P., Pellegrini B., Tikkanen M. J., Langaney A., Lefranc G., Butler R. New data for AG haplotype frequencies in Caucasoid populations and selective neutrality of the AG polymorphism // Human Biology. 1994. V. 66. N 1. P. 27–48.
358. Seielstad M.T., Minch E., Cavalli-Sforza L. L. Genetic evidence for a higher female migration rate in humans // Nature Genetics. 1998. N 20. P. 278–280.
359. Semino O., Magri C., Benuzzi G., Lin A. A., Al-Zahery N., Battaglia V., Maccioni L., Triantaphyllidis C., Shen P., Oefner P. J., Zhivotovsky L. A., King R., Torroni A., Cavalli-Sforza L. L., Underhill P. A., Santachiara-Benerecetti A. S. Origin, Diffusion, and Differentiation of Y-Chromosome Haplogroups E and J: Inferences on the Neolithization of Europe and Later Migratory Events in the Mediterranean Area // Am. J. Hum. Genet. 2004. 74. P. 1023–1034.
360. Semino O., Passarino G., Oefner P. J., Lin A. A., Arbuzova S., Beckman L. E., Benedictis G., Francalacci P., Kouvatsi A., Limborska S., Marcikis М., Mika A., Mika B., Primorac D., Santachiara-Benerecetti A. S., Cavalli-Sforza L. L., Underhill P. A. The Genetic Legacy of Paleolithic Homo sapiens sapiens in Extant Europeans: AY Chromosome Perspective // Science. 2000. V. 290. N 10. P. 1155–1159.
361. Samson М., Soularue P., Vassart G., Parmentier M. The genes encoding the human CC-chemokine receptors CC–CKR1 to CC–CKR5 (CMKBR1-CMKBR5) are clustered in the p21.3-p24 region of chromosome 3 // Genomics. 1996. V. 36. N 3. P. 522–526.
362. Sokal R.R. Ecological parameters inferred from spatial correlograms // Contemporary Quantitative Ecology and related ecometrics / Patil G.P., Rosenzweid M, eds. Fairland, Md: International Cooperative Publishing House. 1979. P. 167–196.
363. Sokal R. R., Oden N. L., ThomsomB. A. A problem with synthetic maps // Human Biology. 1999a. V. 71. N 1. P. 1–13.
364. Sokal R. R., Oden N. L., Thomson B. A. Problems with synthetic maps remain: Reply to Rendine et al. // Hum. Biol. 1999b. V. 71. N 3. P. 447–453.
365. Spitsyn V. A., Kravchuk О. I., Nurbaev S. D., Krause D., Kuchheuser W. Climate-dependent genetic variation of alpha-2HS-glycoprotein // Human Biology. 1998. V. 70. N 3. P. 463–475.
366. Stephens J. C., Reich D. E., Goldstein D.B., Shin H. D., Smith M.W., Carrington М., Winkler C., Huttley G. A., Allikmets R., Schriml L., Gerrard B., Malasky М., Ramos M. D., Morlot S., Tzetis М., Oddoux C., di Giovine F. S., Nasioulas G., Chandler D., Aseev М., Hanson М., Kalaydjieva L., Glavac D., Gasparini P., Kanavakis E., Claustres М., Kambouris М., Ostrer H., Duff G., Baranov V., Sibul H., Metspalu A., Goldman D., Martin N., Duffy D., Schmidtke J., Estivill X., O’Brien S.J., Dean M. Dating the origin of the CCR5-32 AIDS-resistance allele by the coalescence of haplotypes //Am. J. Hum. Genet. 1998. V. 62. P. 1507–1515
367. Sykes B. Irven I. Surnames and the Y chromosome //Am. J. Hum. Genet. 2000. N 66(4). P. 1417–1419.
368. Tambets K., Rootsi S., Kivisild Т., Help H., Serk P., Loogvali E., Tolk H., Reidla М., Metspalu E., Pliss L., Balanovsky O., Pshenichnov A., Balanovska E., Gubina М., Zhadanov S., Osipova L., Damba L., Voevoda М., Kutuev I., Bermisheva М., Khusnutdinova E., GusarV., Grechanina E., Parik J., Pennarun E., Chaventre A., Moisan J., Barac L., Pericic М., Rudan P., Terzic R., Mikarezi I., Krumina A., Baumanis V., Beckman L., Villems R. The western and eastern roots of the extreme European genetic outliers — the origin of mtDNAs and Y-chromosomes of the Saami //Am. J. Hum. Gen. 2004. 74(4). P. 661–682.
369. Tanaka М., Cabrera V.M., Gonzalez A.M., Larruga J. М., Takeyasu Т., Fuku N., Guo L. J., Hirose R., Fujita Y., Kurata М., Shinoda K., Umetsu K., Yamada Y., Oshida Y., Sato Y., Hattori N., Mizuno Y., Arai Y., Hirose N., Ohta S., Ogawa O., Tanaka Y., Kawamori R., Shamoto-Nagai М., Maruyama W., Shimokata H., Suzuki R., Shimodaira H. Mitochondrial genome variation in eastern Asia and the peopling of Japan // Genome Res. 2004. V. 14(10 A). P. 1832–1850.
370. Torroni A., Richards М., Macaulay V., Forster P., Villems R., Norby S., Savontaus M. L., Huoponen K., Scozzari R., Bandelt H. J. mtDNA haplogroups and frequency patterns in Europe // Am. J. Hum. Genet. 2000. V. 66. N 3. P. 1173–1177.
371. Torroni A., Bandelt H. J., Macaulay V., Richards М., Cruciani F., Rengo C., Martinez-Cabrera V., Villems R., Kivisild Т., Metspalu E., Parik., Tolk H. V., Tambets K., Forster P., Karger B., Francalacci P., Rudan P., Janicijevic B., Rickards O., Savontaus M. L., Huoponen K., Laitinen V., Koivumaki S., Sykes B., Hickey E., Novelletto A., Moral P., Sellitto D., Coppa A., Al-Zaheri N., Santachiara-Benerecetti A. S., Semino O., Scozzari R. A signal, from human mtDNA, of postglacial recolonization in Europe //Am. J. Hum. Genet. 2001. V. 69. N. 4. P. 844–852.
372. Ward R. H., Neel J. V. The genetics of a tribal population, the Yanomama Indians. XIV. Clines and their interpretation // Genetics. 1976. V. 82. P. 103–121.
373. Wells R. S., Yuldasheva N., Ruzibakiev R., Underhill P. A., Evseeva I., Blue-Smith J., Jin L., Su B., Pitchappan R., Shanmugalakshmi S., Balakrishnan K., Read М., Pearson N. М., Zeijal Т., Webster М. Т., Zholoshvili I., Jamaijashvili E., Gambarov S., Nikbin B., Dostiev A., Aknazarov O., Zalloua P., Tsoy I., Kitaev М., Mirrakhimov М., Chariev A., Bodmer W. F. The Eurasian Heartland: A continental perspective on Y-chromosome diversity // Proc. Nat. Acad. Sci. 2001. V. 98. N 18. P. 10244-10249.
374. Wilson J. F., Weale М. E., Smith A. C., Gratrix F., Fletcher B., Thomas M. G., Bradman N., Goldstein D. B. Population genetic structure of variable drug response // Nature genetics. 2001. V. 29. P. 265–269.
375. Wright S. Isolation by distance // Genetics. 1943. V.28. P. 114–138.
376. Yao Y-G., Nie L., Harpending H., Fu Y-X., Yuan Z-G., Zhang Y. Genetic Relationship of Chinese Ethnic Populations Revealed by mtDNA Sequence Diversity // American Journal of Physical Anthropology. 2002a. N 118. P. 63–76.
377. Yao Y-G, Kong Q-Р., Bandelt H-J., Kivisild Т., Zhang Y-P. Phylogeographic Differentiation of Mitochondrial DNA in Han Chinese //Am. J. Hum. Genet. 2002b. N 70. P. 635–651.
378. Yudin N. S., Vinogradov S.V., Potapova T. A. Distribution of CCR5-delta 32 gene deletion across the Russian part of Eurasia // Hum. Genet. 1998. N 102(6). P. 695–698.
379. Zei G., LisaA., Fiorani O., Magri C., Quintana-Murci L., Semino O., Santachiara-Benerecetti A. S. From surnames to the history ofY chromosomes: the Sardinian population as a paradigm // Eur. J. Hum Genet. 2003. N 11(10). P. 802–807.
380. Zimmerman P. A., Wieseman М., Spalding Т., Boatin B. A., Nutman Т. B. A new intercellular adhesion molecule-1 allele identified in West Africans is prevalent in African-Americans in contrast to other North American racial groups // Tissue Antigens. 1997. N 50(6). P. 654–656.
ПРИЛОЖЕНИЕ: ОСНОВЫ ГЕНОГЕОГРАФИИ
Многие результаты, представленные в этой книге, кажутся кроликом, вытащенным из шляпы фокусника. Чтобы не казалось, что они появились «ниоткуда» и «сами по себе», мы решили привести в некоторые основы геногеографии — ведь учебника по ней нет. В главе 1 мы рассмотрели лишь некоторые идеи и понятия, на которые опирается геногеография. Здесь, в Приложении, постараемся бегло обрисовать важнейшие черты этой науки. Основные понятия и инструменты пришли из популяционной генетики человека. Но все они непременно преломляются в свете географии — «субкультуры, озабоченной пространством» [Родоман, 1990].
1. ПОНЯТИЯ
§ 1. Ген и генофонд
ГЕН И ГЕНОФОНД; ЧАСТНОЕ И ОБЩЕЕ
В результате генных мутаций ген может принимать множество состояний. Каждое такое состояние называется «аллель».
Представить себе генофонд можно как совокупность аллелей, циркулирующих в популяции.
Но важнее не статическое определение генофонда, а способ его изучения. Популяционная генетика, изучая генофонд, прежде всего интересуется его разнообразием, его дифференциацией.
Размах генетических различий между популяциями зависит от двух причин. Во-первых, от того, как долго и насколько разобщены популяции. Во-вторых, в какой степени и каким образом ген участвует в приспособлении популяции к особенностям среды (иными словами — от действия отбора). По приспособительному значению не только разные гены, но даже аллели одного гена могут резко отличаться друг от друга. А вот в том, что касается степени исторической разобщённости популяций, — здесь все гены находятся в равных условиях. Поэтому, если мы возьмём некий интегральный показатель по всем генам, и тем самым избавимся от их неравного приспособительного значения (от эффектов отбора), то с помощью этого показателя мы сможем увидеть, как генофонд зависит от истории популяции.
Структура генофонда — это те реально существующие и наиболее общие закономерности, которые характерны для всего генофонда в целом. Поэтому в описание структуры генофонда не входит специфика каждого из генов. Изменчивость одного гена — это лишь одна из бескрайнего множества проекций многомерного строения генофонда. Ее описание дает столь частное видение структуры генофонда, что само по себе не способствует решению основной задачи геногеографии. Чтобы решить эту задачу, нужно изучить изменчивость одного за другим многих генов, а затем тем или иным способом обобщить эти данные, избавиться от случайностей и искажений «частного» видения, получить общие характеристики генофонда.
Ясное понимание соотношения изменчивости отдельных генов и генофонда в целом — ключевой момент в геногеографии. Реально существующая, но недоступная непосредственному наблюдению структура генофонда проецируется во множество картин изменчивости, которые мы наблюдаем, перебирая один ген за другим. Отдельный ген выступает лишь в роли одного из маркёров генофонда, лишь как одно из бесконечного множества разнообразных и мелькающих отражений генофонда. Структура генофонда задаёт «общую модель» изменчивости каждого отдельного гена. Но оставляет ему значительную свободу «частного» проявления — картина изменчивости гена может значительно варьировать вокруг «общей модели» — по воле случая, под влиянием некоторых миграций или же по воле отбора. Поэтому так важно для изучения генофонда вычленить из изменчивости многих маркёров ту их общую составляющую, которая обусловлена общей структурой генофонда.
СКОЛЬКО ГЕНОВ И КАКИХ?
Здесь неизбежно возникает вопрос: какова количественная основа этой принципиальной разницы между двумя типами исследований? Если изучение общей изменчивости 120 маркёров считается изучением генофонда в целом, то будет ли достаточным изучение, например, 60 маркёров? Или 30? Или 10?
Этот вопрос в геногеографии формулируется так: сколько и каких маркёров надо включить в анализ, чтобы, обобщив изменчивость этих отдельных маркёров, получить надёжные характеристики генофонда в целом?
Необходимо убедиться, что разнообразие спектра маркёров отражает реальные характеристики генофонда. В таком случае по данным о нескольких маркёрах можно делать обоснованные выводы о генофонде в целом. Чем лучше в количественном и качественном отношении используемый набор маркёров, тем в большей степени его обобщённые характеристики приближаются к реальным характеристикам генофонда в целом.
Действительно «полигенные» исследования с высокой точностью описывают реальные характеристики генофонда, поэтому их результаты могут обладать предсказательной силой. Примером могут служить главные компоненты генофонда Европы («полигенное» исследование) [Cavalli-Sforza et al., 1994]: появляющиеся новые ДНК данные обязательно сравнивались с этим результатом, полученным по классическим маркёрам генетики — именно потому, что «старые» данные по классическим маркёрам рассматривались как прогноз для новых данных по ДНК маркёрам.
Как известно, основной вывод, сделанный Кавалли-Сфорца с соавторами [Cavalli-Sforza et al., 1994] на основе изучения главных компонент народов Европы, это вывод о том, что ведущие черты генофонда Европы сформировались в неолите в ходе постепенного распространения земледельческого населения из Малой Азии через Балканы далее к северу и западу Европы. Результаты же работ последних лет, выполненных в большинстве случаев на маркёрах митохондриальной ДНК, свидетельствуют скорее о более раннем, чем неолитическая эпоха, времени формирования основных черт европейского генофонда. И может сложиться поверхностное впечатление, что новые работы по ДНК маркёрам опровергают старое исследование, выполненное по классическим маркёрам, что оно не отражало закономерностей генофонда в целом. И можно даже перейти от этого впечатления к мнению, что каждый новый тип маркёров будет по-новому описывать европейский генофонд, и что реальной структуры генофонда в действительности нет. Однако это впечатление обманчиво.
В действительности, данные о «палеолитическом» времени возникновения присущих европейскому генофонду линий мтДНК могут вступать в противоречие только с «неолитической» интерпретацией главных компонент. Сам же факт основного направления изменчивости с юго-востока, установленный по классическим маркёрам, остаётся ни в коей мере не опровергнутым. Более того, он был подтверждён уже самыми первыми исследованиями по изменчивости ДНК маркёров в Европе.
§ 2. Ареал популяции
СТРУКТУРА АРЕАЛА
Для популяций человека важнейшими атрибутами являются брачная структура (доля браков, заключаемых вне популяции, или же степень нарушения свободы браков в пределах популяции) и ареал популяции.
Ареал представляет собой жизненное пространство популяции и является важным фактором в её эволюции: ареал либо создаёт условия для формирования генетических различий, либо их фиксирует, если они возникли за счет иных причин.
Оказывается, даже генофонд Москвы, где массы населения перемешиваются на клочке земли, не только в прошлом, но и сейчас обладает географической подразделённостью [Курбатова, 2004]. Тем более она была характерна для сельского русского населения, где брачные традиции («Хоть за курицу, но на свою улицу») приводили к генетическим различиям между популяциями. Даже для тех этносов, целостность которых поддерживается только культурной традицией (например, для евреев и цыган с их «виртуальными» ареалами), пространство остаётся важным источником генетических различий: географически разнесенные популяции по своим частотам генов зачастую сближаются с популяциями тех народов, среди которых они расселены [Mourant et al., 1978; Carmeli, Cavalli-Sforza, 1979; Karlin et al., 1979; Livshits et al., 1991]. Обычно, аргументируя несущественность ареала для этноса, приводят в пример устойчивые этносы с разорванными ареалами — например диаспоры и колонии. Однако с точки зрения генетики здесь проблемы, на наш взгляд, вообще нет. Если группа людей, проживающая вне основного ареала, придерживается прежней брачной структуры, то изменений в популяции и её генофонде просто не произошло. Неважно, где в тот или иной момент находится диаспора или колония — её члены в этом случае все равно генетически относятся к прежней популяции и участвуют в её воспроизведении. Можно считать, что её гены просто посланы «в командировку». Иной случай, если брачная структура резко меняется. Тогда независимо от того, заключают ли члены колонии только браки между собой в пределах своего нового ареала или же обмениваются генами с окружающими их популяциями, происходит формирование новой популяции с её собственным ареалом. Останется ли эта дочерняя популяция в рамках прежнего «материнского» этноса, или станет частью «удочерившего» её этноса, или же вообще станет со временем новым этносом — это дело не генетики, а истории и этнического самосознания. Генетика не определяет эти процессы, она лишь следует за ними. Для нее важно, что даже в «исключительных» этносах неоднородность популяции обычно сопряжена с географической подразделённостью. Тем более такая сопряжённость между подразделённостью самой популяции и структурированностью её ареала характерна для популяций, имеющих целостные, исторически сложившиеся и географически очерченные ареалы. Структурированность и целостность ареала вовсе не исключают, а обычно сопутствуют друг другу. Популяция населения крупного региона состоит из множества популяций разных иерархических уровней, вложенных друг в друга, как матрёшка в матрёшку. И ареалы этих субпопуляций также следуют «принципу матрёшки».
Структура и процесс формирования ареала часто является одной из важнейших страниц истории генофонда. Наиболее информативны эти страницы для тех народов, в жизни которых играли важную роль перемещения — массовые миграции, переселения, экспансия, колонизация новых территорий. История народа, история его генофонда порою может быть реконструирована через историю формирования ареала, который — при благоприятном стечении исторических обстоятельств — может сохранить память о развитии популяции не только в пространстве, но и во времени.
МЕХАНИЗМЫ ФОРМИРОВАНИЯ АРЕАЛА
Для популяций человека исторически сформировавшийся ареал популяции освящён памятью предков: любовь к отечеству — это зачастую «любовь к святым гробам»; это те корни, без которых человек становится «перекати-поле». Традиции, фольклор, предания и память народная любовно хранят черты и образы популяционного ареала, тех мест, в которых формировалась и жила популяция. Недаром столько крови проливается за «пядь родной земли», недаром поколения изгнанных народов живут мечтой о возвращении на свою историческую родину, на «свою» землю. И возвращаются, преодолевая немыслимые преграды, восстанавливая при этом не только ареал, но отчасти и генетическую структуру популяций. Наша многострадальная страна полна примеров этому.
При этом ареал некорректно представлять лишь в двумерном пространстве географической карты. Популяционный ареал, как правило, содержит и иные измерения. Это может быть не только третье измерение физического пространства — высотное. В качестве иных измерений могут выступать любые факторы культуры (конфессиональные, лингвистические, этнографические и т. д.) или же факторы среды [Fisher, 1930; Edwards, Cavalli-Sforza, 1972; Алексеева, 1972, 1975, 1977, 1986, 1998; Дубинин и др., 1976; Sokal, 1979а; Бунак, 1980; Piazza et al., 1981а; Алтухов, Курбатова, 1984, 1990; Вавилов, 1987; Новорадовский и др., 1992; Спицын и др., 1985, 1994; Курбатова, 1996]. Например, в характеристике хозяйственнокультурных типов (степные номады, охотники-оленеводы, охотники на морского зверя и т. д.), звучит то дополнительное измерение ареала, которое свойственно данной популяции и обуславливает устойчивость ареала. Именно благодаря другим измерениям ареала возможны, например, случаи длительного мирного сосуществования в одном географическом пространстве двух популяций, ориентирующихся на разные природные ресурсы, или же принадлежащих к разным конфессиям, или относящихся к разным социальным слоям (сословия, касты).
Важнейшим измерением при формировании ареала популяции являются поведенческие механизмы. Именно они чаще всего служат основой для возникновения симпатрического видообразования и существования симпатрических популяций [Dobzhansky, 1970; Майр, 1974; Яблоков, Юсуфов, 1976; Шмальгаузен, 1983; Воронцов, 1984; Северцов, 1987; Яблоков, 1987; Кайданов, 1996]. Если для птиц это может быть вариация песни, для грызунов — особенность их песенки-писка, для любых видов — своеобразие брачного поведения, то для человека поведенческие особенности, как правило, опосредованы через особенности культуры, воплощены в них. Весь исторически сложившийся облик обрядности, одежды, норм морали, пищи, домостроительства, множества этнографических, лингвистических, конфессиональных особенностей создают географически невидимые границы популяций.
Это приводит к тому, что на одной территории определенное время могут существовать популяции, практически не заключающие между собой браки. Уникальным примером такой симпатрии, например, может служить изолят адыгейцев, древнего коренного населения
Северного Кавказа. Их небольшая группа (причерноморские шапсуги) проживает среди массы пришлого населения на побережье Черного моря (от Туапсе до Сочи). Но даже в условиях огромного миграционного давления курортной зоны шапсуги сохраняют давние брачные традиции — подавляющая часть браков заключается в пределах популяций шапсугов общей численностью всего лишь 5 тыс. человек [Почешхова, 1998; Почешхова и др., 1998; Балановская и др., 1999].
ПОНЯТИЯ АРЕАЛ В ГЕНОГЕОГРАФИИ
Изучая популяции стандартными методами статистики, исследователь, как правило, стремится вычленить в наблюдаемой генетической изменчивости различия между популяциями (GST, FST, генетические расстояния). Но при этом неотъемлемое свойство популяции — её ареал — обычно так и остаётся за рамками исследования. Он не поддаётся обычному генетико-статистическому анализу — при кластеризации популяций и построении графиков главных компонент географическое положение популяций как бы исчезает из анализа. И потому полнота картины генофонда не достигается, а из межпопуляционной изменчивости исчезает её географическая суть.
Пространство при этом служит своего рода «учётным бланком», в котором фиксируются точки — популяции. Ареалы популяций, их положение в пространстве не учитываются. И изучение межпопуляционной изменчивости сводится к сравнению чисел в точках, чисел в таблице. Географическая структура генофонда при этом остаётся неизвестной. Вместе с географией генофонда и часть его истории остаётся за рамками исследования. В географической структуре генофонда запечатлена динамика его формирования, поэтому географический подход позволяет через анализ пространственной изменчивости прийти к анализу истории генофонда. Но для этого пространство из фона должно стать организующим фактором.
Это позволяет сделать лишь карта — лишь благодаря ей ареал становится важнейшим действующим лицом. Поэтому геногеография последовала за географией, сделавшей карту основой и инструментом тематических исследований.
§ 3. Дрейф и миграции, мутации и отбор
ГЕНЕТИЧЕСКИ ЭФФЕКТИВНЫЙ РАЗМЕР ПОПУЛЯЦИИ Nе
В популяции есть дети, взрослые, старики, и каждый из них несет два аллеля каждого аутосомного гена. Тогда, казалось бы, генетический размер популяций — то есть общее число генов в ней — можно просто считать в два раза большим, чем число людей в популяции. Но для изучения популяции важно знать, сколько генов будет передано следующему поколению. Следовательно, в подсчёт уже нельзя включать гены стариков и детей — генетического прошлого и генетического будущего популяции. Однако и оставшиеся гены также различны по своим судьбам. То, что взрослые, находящиеся в репродуктивном возрасте, оставляют разное число потомков, с точки зрения генетики означает, что они передадут меньшее или большее число копий своих генов следующему поколению. Чем больше в данной популяции семьи различаются по своему размеру, тем меньше генетически эффективный размер популяции. Но и это ещё не все: необходимо, чтобы дети — носители родительских генов — выжили, выросли, обзавелись своими семьями, оставили потомков, то есть, чтобы не прервалась передача генов по цепи поколений.
Например, даже неравное соотношение полов в популяции может означать, что гены не всех мужчин и женщин будут переданы следующему поколению. И это немаловажно. Представим себе «гаремную» популяцию (в которой лишь малая часть всех мужчин передаёт свои гены следующему поколению), и пусть в каждом из 10 гаремов по 50 жен (итого, 510 человек, передающих свои гены следующему поколению). Генетически эффективный размер Ne такой популяции будет менее 40, а вовсе не 500, как было бы, если бы равное число мужчин и женщин (по 250) участвовали в передаче генов следующему поколению. Иными словами, генетически эффективный размер Ne нашей «гаремной» популяции с 510 репродуктивно активными членами окажется меньше генетически эффективного размера крошечной популяции с 20 мужчинами и 20 женщинами, но заключающими браки свободно и равноправно.
Все эти и многие другие обстоятельства интегрированы в показателе генетически эффективного размера популяции Ne. Обычно он составляет около 30 % от общего числа генов в популяции. Это значит, что из всех генов популяции на каждый момент времени лишь треть связана с формированием генофонда следующего поколения. И генетические свойства нового поколения начинают зависеть от того, насколько полно (или же неравномерно) были представлены в этой трети гены родительского поколения.
При оценке дифференциации генофонда через равенство Fe=1/(1+4NeMe) по умолчанию предполагается стационарность генетического процесса и постоянство эффективного размера популяций Ne, причём не только в пространстве, но и во времени. Этот вопрос рассматривался, в частности, в работах [Rogers, Jorde, 1995; Bowcock et al., 1991, Rychkov, Sheremetyeva, 1977], где показано, что для широкого круга популяционно-генетических задач эффективный размер популяций можно принять постоянным для всей ойкумены на протяжении последних 10 тыс. лет [Rogers, Jorde, 1995, Bowcock et al., 1991]. Это связано с тем, что в ряду популяций в пространстве, как и во временном ряду поколений одной популяции, генетически эффективный размер Ne определяется не как простая арифметическая средняя (∑Nk/k) по k популяциям, а как гармоническая средняя (1/к∑1/ Nk)!. Так, например, для шести популяций с численностью 10, 100, 1’000, 10’000, 100’000, 1’000’000, средняя гармоническая величина Ne будет равна лишь 50, а не 185 тысячам, как было бы в случае арифметической средней. Иными словами, генетически эффективный размер задаётся самыми «малыми» популяциями (как в примере с неравенством полов в «гаремной» популяции он задавался наименьшей — мужской — частью популяции).
Очень важно и то, что рост численности населения главным образом связан с увеличением числа популяций, а не их среднего генетически эффективного размера.
СЛУЧАЙНЫЙ ДРЕЙФ ГЕНОВ
Ясно, что когда такая треть абсолютно мала (т. е. в нее входят «считанные» гены), случайные события легко могут исказить популяционную частоту гена при передаче из поколения в поколение. И чем меньше Ne, тем больше у потомков непредсказуемые отклонения от родительского генофонда. Когда такие отклонения накапливаются в долгой цепи поколений, то крайние звенья этой цепи становятся почти не похожими друг на друга. Процесс случайных отклонений в частотах генов, происходящих при передаче из поколения в поколение, официально назван «случайным дрейфом» генов. Это название удачно тем, что оно сразу говорит нам и о том, что изменения частоты гена в каждом поколении происходят чисто случайным образом (частота «дрейфует», как льдина); и о том, что в результате таких чисто случайных отклонений, популяции все же постепенно удаляются друг от друга. Они как осколки льдины, «отдрейфовывают» и друг от друга, и от материнской льдины, от которой они откололись — от прапопуляции. Если когда-то в результате событий истории две популяции разделились, а затем под действием дрейфа генов генетически удалились друг от друга, то генетическое расстояние между ними (расстояние, на которое они отдрейфовали) будет зависеть от двух величин — от генетического размера популяций (Ne) и от времени их раздельного существования (t). Значит, в генных различиях между популяциями в скрытом виде присутствует время, и время это измеряется поколениями.
Как представить себе дрейф генов? Предположим, что исходная частота аллеля равнялась 0.5. Тогда это можно представить как огромный кувшин с разноцветными горошинами, где половина горошин — красная. Эта частота сохранится и в следующем поколении, если Ne велико — то есть если мы почти все горошины пересыпаем в следующий кувшин, в следующее поколение. Если же Ne мало, и мы зачерпываем лишь пригоршню горошин из генофонда, то случайно может оказаться, что в ней нет красных горошин (частота аллеля равна нулю), или напротив, все горошины красные (частота аллеля равна единице). Предположим, что мы изучаем не исключение из правил, не панмиксный мегаполис, а обычную небольшую популяцию, из которых и состояло человечество на протяжении тысячелетий, на протяжении почти всей своей истории. В ней из огромного множества гамет, произведённых всеми мужчинами и женщинами, в следующее поколение передаётся лишь горстка. Значит, в следующем поколении частота аллеля будет уже не 0.5, а чисто случайно изменится в ту или иную сторону.
Итак, дрейф генов — это ошибка выборки из генофонда, совершаемая не исследователем, а самой историей. Ошибка тем больше, чем меньше генетически эффективный размер Ne — та часть популяции, которая должна передать генофонд следующему поколению. Чем меньше размер популяции, тем больше ошибка, тем сильнее случайный разброс в частотах гена от поколения к поколению, тем мощнее дрейф генов.
ГЕНЕТИЧЕСКИ ЭФФЕКТИВНЫЕ МИГРАЦИИ Ме
Обмен генами между популяциями называют миграцией генов независимо от того, что привело к проникновению «чужих» генов в популяцию — веками устоявшаяся структура брачных связей между соседними популяциями («поток генов»), случайные браки с пришельцами из других популяций или же перемещения целых групп населения.
Количественной характеристикой этого процесса служит скорость притока генов за поколение, обозначаемая Ме. При этом учитывают не только общее число «прибывших» генов, но и степень их «новизны», несхожести с собственными генами популяции — чем «неожиданней» прибывший с миграцией вариант гена, тем больше генетическая эффективность миграции. При этом «новизна» прибывшего гена может определяться не только географической, но и культурно-исторической разобщённостью популяций.
Представим, что в русской глубинке поселилась небольшая группа приезжих эфиопов и столь же немногочисленная группа переселенцев-белорусов. Поначалу и к тем, и к другим будут относиться как к чужакам, но потом станут заключать с ними браки, и со временем обе приезжие группы растворятся в местном населении. Будущим популяционным генетикам будет куда легче обнаружить миграцию эфиопов, чем след переселения белорусов: за счет резкого отличия мигрантов и принимающей популяции генетический эффект миграции эфиопов будет намного сильнее.
ДРЕЙФ И МИГРАЦИИ
Миграция генов — это социальный в своей первопричине процесс, который предотвращает утрату генетического сходства между популяциями в результате дрейфа генов. Любая популяция, таким образом, вовлечена в оба противодействующих процесса — дрейфа генов (Ne) и миграций генов (Мe). Их устойчивое противодействие задаёт новый предел для генетического расхождения популяций FST=Fe. Благодаря потоку генов, новый предел различий между популяциями Fe оказывается гораздо меньше единицы (как ожидалось в случае действия дрейфа генов в условиях полной изоляции), а конкретная величина предельного значения Fe определяется теми историческими событиями, которые предотвратили потерю (или привели к появлению) общих генов. Это справедливо не только для взаимодействия разных популяций, но и между частями одной популяции, особенно если она расселена на большой территории.
МУТАЦИИ И ОТБОР
В популяциях человека действуют все факторы генетической динамики, и лишь их удельный вес различен в разных популяциях и для разных генов. Кроме двух только что рассмотренных главных факторов микроэволюции (дрейфа и миграций генов), есть ещё два фактора — мутации и отбор. При решении главной задачи книги — изучения структуры русского генофонда — они играют второстепенную роль, и потому скажем о них лишь несколько слов.
Генные мутации изменяют сами гены, в то время как остальные факторы меняют частоты генов. В качестве фактора популяционной динамики действие мутаций оказывается настолько слабее дрейфа генов и миграций, что на популяционном уровне его уловить очень сложно (см. рассмотрение этого вопроса, например, в работе [Динамика популяционных генофондов…, 2004]).
Исключение составляют однородительские маркёры — митохондриальной ДНК и Y хромосомы. Восстановление исторической последовательности их мутаций и создаёт уникальную возможность установления исторической последовательности миграционных процессов.
Отбор, как и мутации, действует на каждый ген в отдельности и по-своему, в отличие от дрейфа и миграций, которые влияют на все гены сразу и одинаково. Собственно исторический (то есть общественно-исторический) и микроэволюционный (то есть естественно-исторический) процессы различаются не только по силе воздействия на генофонд человека, но и по характеру воздействия на его гены. В исторический процесс все гены населения вовлечены в равной степени независимо от их функции в организме. В микроэволюционный процесс гены вовлекаются «индивидуально» и лишь в меру своей значимости для адаптации популяции к условиям среды. Воздействие исторического фактора на генофонд математически строго моделируется как селективно-нейтральный процесс. Некоторые результаты его воздействия, например различия между популяциями, можно определить достаточно точно. Однако для селективно-значимых генов на действие исторических сил накладывается влияние эволюционной силы отбора. Это увеличивает или уменьшает уровень изменчивости данного селективно-значимого гена FSX(i) по сравнению с общим для всех генов селективно-нейтральным уровнем Fe.
§ 4. Дрейф и миграции в подразделённой популяции
Итак, два главных фактора — дрейф генов и их миграции — определяют скорость и итоги селективно-нейтральной микроэволюции генофонда. Чтобы понять, какой смысл популяционные генетики вкладывают в эти слова, лучше всего вместо формул рассмотреть несколько примеров.
ТОЛЬКО ДРЕЙФ ГЕНОВ
Перед Вами (рис. 1.1., приводится по [Алтухов, 1983]) компьютерная модель дрейфа генов — компьютерный эксперимент, проведённый Юрием Петровичем Алтуховым и его сотрудниками для панмиксных популяций. Так называют популяции, которые не подразделены внутри себя — все члены такой популяции имеют равную вероятность заключить брак друг с другом. На старте десять одинаковых панмиксных популяций с одной и той же частотой гена (0.5). Или лучше представить их маршруты как десять вариантов эволюции одной популяции — варианты изменения частоты от одной и той же стартовой частоты гена (0.5) в некой «прапопуляции». Мы видим, как от поколения к поколению резко меняется — «дрейфует» — частота гена в пределах от 0 до 1. На финише лишь в одном случае из десяти популяций сохранился полиморфизм. Все остальные популяции содержат либо только «красные горошины», либо навсегда потеряли их. Это означает, что из-за дрейфа генов панмиксные — бесструктурные — популяции теряют память о прошлом генофонда. Это значит, что по современным популяциям (состояние в конце графика) мы не сможем восстановить, каким же был генетический облик прагенофонда, облик исходной популяции. Это судьба панмиксных изолированных популяций. Они утрачивают генетическую память: многие «предковые» аллели исчезли, частоты других — непредсказуемо изменились.
Рис. 1.1. Быстрые изменения частоты гена в панмиксных популяциях (по [Алтухов, 1983]).
ДРЕЙФ И МИГРАЦИИ
Но теперь изменим лишь один параметр популяции — рассмотрим не панмиксную, а подразделенную внутри себя популяцию (рис. 1.2., приводится по [Алтухов, 1983]). Все то же, но каждая популяция разделена на подгруппы с небольшими миграциями между ними. В результате устойчивость генофонда резко возросла. На финише все десять подразделённых популяций сохранили полиморфизм и в какой-то степени воспроизводят исходную частоту гена, хотя и с большим разбросом. Это означает, что подразделённые популяции намного устойчивее к действию дрейфа генов и эволюционируют намного медленнее: частоты генов в субпопуляциях от поколения к поколению «скачут», но при этом средняя частота в тотальной «супер» популяции (в которую они входят) остаётся на месте. Это означает, что такая подразделённая популяция благодаря только одной лишь её подразделённости — имеет серьёзные шансы сохранить исходное разнообразие, сохранить генетическую память.
Рис. 1.2. Стабильность частоты гена в подразделённых популяциях (по [Алтухов, 1983]).
ЭКСПЕРИМЕНТАЛЬНЫЕ ПОПУЛЯЦИИ
Можно возразить: жизнь сложнее компьютерной модели. Согласны.
Поэтому перед вами прекрасный эксперимент на живом объекте — дрозофиле. На рис. 1.3. (приводится по [Алтухов, 1983]) представлены результаты известных экспериментальных работ Юрия Петровича Алтухова и Елены Юрьевны Победоносцевой. Мухи были расселены по отсекам популяционного ящика и обменивались генами точно так, как мы предположили в предыдущей компьютерной модели — равная численность, равновероятный обмен между отсеками, но основная часть скрещиваний происходит в отсеке.
Рис. 1.3. Динамика частоты гена в панмиксной и подразделённой популяции D.melanogaster (по [Алтухов, 1983]).
Черные кружки — панмиксная популяция.
Белые кружки — подразделённая популяция.
Слева вверху показана конструкция ящика, в котором обитала подразделённая популяция дрозофил.
Мы видим, что в подразделённой популяции средняя частота гена (белые кружки) остаётся практически неизменной: в течение 80 поколений варьирует около исходной частоты 0.5: от 0.6 до 0.4. Подразделённая популяция хранит генетическую память.
Другой ящик тех же мух, с той же численностью и в тех же условиях, но с полной свободой скрещивания, — моделирует панмиксную популяцию (рис. 1.3). В ней — за то же время — частота гена упала от 0.6 до 0.1 (черные кружки). Панмиксная популяция не помнит о прошлом, она теряет генетическую память.
ОТ НЕОЛИТА ДО СОВРЕМЕННОСТИ
Можно возразить: жизнь людей сложнее жизни мух. Возможно. Обратимся к человеку.
На человеке эксперименты проводит сама история. Человек для популяционной генетики является также очень интересным объектом — у него детально изучена изменчивость в пространстве и времени. На рис. 1.4. (приводится по [Rychkov, Sheremetyeva, 1977]) представлена характеристика популяций неолита и современности. Анализ был проведён Юрием Григорьевичем Рычковым и Аллой Арменовной Мовсесян по дискретно варьирующим признакам черепа. Предполагается, что эти признаки (дополнительные швы, вставные косточки, отверстия) по высокой наследуемости приближаются к генетическим маркёрам. Частота каждого из 12 признаков отложена на соответствующем радиусе, и получен полигон — своеобразный схематический «портрет» популяции.
Рис. 1.4. Устойчивость средних характеристик популяционной системы Сибири с эпохи неолита до современности (по [Rychkov, Sheremetyeva, 1977]).
Сравнение распределений 12 независимых признаков в неолитических (А) и современных (В) популяциях Сибири показывает, что невзвешенные частоты qt в современной популяционной системе являются хорошими оценками q0 в предковой неолитической популяции, t≈200 поколений. В центре рисунка помещена схематическая диаграмма теоретического оправдания такого сравнения.
Современные популяции: I — азиатские эскимосы; II — чукчи Чукотсткого полуострова; III — алеуты; IV — неги дал ьцы бассейна Амура; V — ульчи нижнего Амура; VI — тунгусы Восточной Сибири; VII — буряты Прибайкалья; VIII — монголы; IX — тувинцы Саянского нагорье; X — теленгиты Алтая; XI — хакасы Минусинской котловины, Енисея; XII — селькупы Западной Сибири; XIII — манси восточных склонов Урала; XIV — ханты бассейна Оби.
Неолитические популяции: а — серовская культура, Ангара; b — китойская культура, Ангара; с — глазковская культура, Ангара; d — серовская культура, верхняя Лена; е — глазковская культура, верхняя Лена; f — глазковская культура, Забайкалье.
Частота q=0 в центре круга; q=0.3 на периметре. 1-12: признаки, перечень которых приведен в [Рычков, Мовсесян, 1972; Мовсесян, 1973; Рычков, 1973].
Мы получаем уникальную возможность заглянуть в прошлое — ведь прямо по ДНК маркёрам такой анализ пока провести нельзя.
Современный генофонд представлен 24 коренными народами Сибири. Неолит представлен шестью палеоантропологическими сериями, охватывающими довольно большой промежуток времени. В среднем современность и неолит разделяет более пяти тысяч лет, 200 поколений сменились за это время. Мы видим, как резко различаются портреты всех современных популяций и насколько не похожи друг на друга древние популяции. Сходными во всей серии, состоящей из 31 «портрета», оказались лишь два «портрета»: обобщённый «портрет» современности и обобщённый «портрет» неолита. В данном виде анализа вся Сибирь рассматривается как одна подразделённая популяция. Прошли тысячелетия, а средние параметры этой подразделённой популяции все те же: неолит и современность отличаются друг от друга меньше, чем нынешние народы, живущие по соседству. Подразделённая популяция хранит генетическую память и проявляет фантастическую устойчивость своего генофонда.
УСТОЙЧИВОСТЬ ПОДРАЗДЕЛЕННЫХ ПОПУЛЯЦИИ
К сожалению, ДНК маркёры пока не позволяют разглядеть генофонды прошлого. Но можно привести и другие примеры — например, с использованием не дискретно варьирующих признаков черепа, а фамилий. Полные родословные, собранные Эльвирой Аслановной Почешховой уникальны — они охватывают всех ныне живущих адыгов-шапсугов и уходят на глубину шести поколений. Мы вместе Э. А Почешховой и Ю. А. Серегиным провели анализ состава фамилий в каждом поколении, а затем построили обобщённые карты распространения фамилий для каждого поколения шапсугов. Они позволили своими глазами увидеть, как меняется генофонд в пространстве и времени (глава 10, рис. 10.4.3).
Оказалось, что все шесть карт чрезвычайно похожи. Коэффициент корреляции между самыми удалёнными во времени картами — первого и шестого поколений — невероятно высок: он составил r=0.85. Мы видим, что генофонд сохранил себя на протяжении всех шести поколений.
Но самое удивительное в том, что это за народ. Мы видим отражение потерянного навсегда. Адыги-шапсуги — древнее население Северного Кавказа. Их сплошной ареал простирался от Кубани до Черного моря. Но их смела Кавказская война. К 1865 году все причерноморские аулы шапсугов были уничтожены, а прикубанские — переселены. Сейчас от них осталось два осколка: 5 тысяч человек в Прикубанье, и столько же — в предгорьях у Черного моря. Но они сохранили отражение разрушенного генофонда. У нас есть основания считать, что Прикубанье отражает прежнюю «Малую Шапсугию», жившую к северу от Кавказского хребта. А в Причерноморье постепенно просачивались те, кто остался в живых из «Большой Шапсугии». Они старались селиться именно в той долине, где испокон веков жили их предки. Они сохранили традиции брачной структуры. Подразделённая популяция вновь доказала нам свою необычайную устойчивость.
ИТОГИ МИКРОЭВОЛЮЦИИ
Все приведённые примеры показывают, что подразделённая популяция устойчива и хранит генетическую память, а панмиксная — нет. Мы убедились, что микроэволюция в этих популяциях идет с разной скоростью и приводит к разным результатам. Разное соотношение дрейфа и миграций в ходе микроэволюции мы видим в её итогах — в пространственной изменчивости популяций — независимо от того, рассматриваем ли мы эти итоги с помощью карт или же оценок различий между популяциями FST≈Fe=1/(1+4NeMe).
Например, и карты, и FSТ-статистики свидетельствуют о генетическом «однообразии» населения Европы и о генетическом разнообразии коренного населения Сибири. Отличия этих двух генофондов поражают: генетическое разнообразие локальных популяций в пределах одного «среднего» сибирского народа больше, чем все генетические различия между всеми народами Западной Европы! Столь впечатляюще разные итоги микроэволюции в Сибири и в Европе (глава 9, рис. 9.3.3.) заданы лишь разным соотношением дрейфа и миграций генов. Вот насколько мощны эти два фактора микроэволюции.
§ 5. Подразделённость генофонда
В предшествующем разделе мы видели, как наличие в популяции подразделённости резко меняет её свойства: и дрейф генов, и миграции начинают действовать по-другому, а сама популяция приобретает генетическую устойчивость. Это, возможно, самый яркий, но далеко не единственный пример того огромного значения, которое имеет подразделённость популяции для её генофонда.
Роль подразделённости столь велика, что её иногда (наряду с дрейфом генов, миграциями, мутациями и естественным отбором) называют ещё одним, пятым фактором микроэволюции. Это, конечно же, не вполне верно. Ведь фактор подразделённости влияет на генофонд не непосредственно, а через «обычные» факторы микроэволюции. Но это влияние столь ощутимо, что у самых разных авторов возникает желание упомянуть подразделённость (в виде популяционной структуры или же в обличии инбридинга) при перечислении важнейших факторов, определяющих генофонд.
В классической популяционной генетике подразделённость популяции является одним из центральных моментов: на ней строится и теория инбридинга, и расчёт межпопуляционной изменчивости, и анализ иерархически организованных популяций. Именно подразделённости посвящены множество математических моделей и основополагающие работы Самуила Райта, Масатоши Нея и многих других «классических» популяционных генетиков.
Мы не будем пытаться дать здесь сколько-нибудь полный обзор этого «главного» раздела популяционной генетики, а рассмотрим лишь несколько моментов, важных для анализа пространственной структуры русского генофонда.
ЧТО ТАКОЕ ПОДРАЗДЕЛЁННАЯ ПОПУЛЯЦИЯ
Чтобы представить, что генетики понимают под подразделённой популяцией, достаточно лишь знать, что её противоположностью является популяция панмиксная. В панмиксной популяции все члены имеют равную вероятность вступить в брак друг с другом — внутри панмиксной популяции нет барьеров для потока генов. А внутри подразделённой популяции такие барьеры есть. Подразделённая популяция — та, которая в процессе передачи информации в поколениях оказывается подразделённой на части: внутри каждой части поток генов свободен, а между частями — ограничен. Панмиксная популяция похожа на цельный листок березы или липы, а подразделённая — на рассечённый листок клевера. Как лист рябины состоит из нескольких мелких листочков, так и подразделённая популяция состоит из нескольких субпопуляций.
Подразделённость, то есть наличие барьеров для потока генов, может быть реализована самыми разными способами. Самый очевидный и самый частый — это пространственная, географическая подразделённость: популяция, расселившись на большой территории, естественным образом распадается на части, соответствующие географическому членению этой территории. Например, народы, живущие в горах, часто подразделяются так, что каждая группа занимает свою долину или свое ущелье. А живущие на равнине русские тоже подразделяются, но уже не по долинам, а по географическим областям. Ведь очевидно, что рязанец скорее женится на живущей по соседству рязанке, чем на далекой неизвестной ему вологодской красавице. Именно таким образом пространство, ареал популяции становится тесным образом связанным со структурой популяции, с её подразделённостью на составные части.
Подразделённость может быть реализована и множеством других способов. Например, обычай заключать браки среди кровных родственников тоже нарушает панмиксию. А значит, в популяции появляется некая, пусть слабая, подразделённость, которую в данном случае мы назовём неслучайным инбридингом. Неслучайным — потому что он происходит вследствие неслучайного, ассортативного скрещивания — родственники заключают браки преимущественно с родственниками, и это приводит к увеличению доли гомозигот в популяции. А сама популяция как бы подразделяется внутри себя на группы тех, кто является в большей степени родственниками. Обычай кровнородственных браков распространён, например, в Дагестане и среди многих других горных народов, где он вызван, как считается, экономическими причинами (стремлением сохранить самую большую ценность — с трудом созданный в горах надел земли — в руках одной большой семьи).
Явление, совершенно отличное внешне, но равнозначное с точки зрения популяционной генетики, можно наблюдать на противоположном конце Кавказа. Небольшие, изолированные друг от друга популяции адыгейцев не допускают кровнородственные браки вплоть до седьмой степени родства. Но в силу самой изолированности аулов дрейф смещает частоты генов в каждом ауле независимо, и, рассматривая всю систему из нескольких аулов, мы опять-таки видим увеличение доли гомозигот (явление, известное в популяционной генетике как эффект Валунда или действие подразделённости). И потому это явление возрастания гомозиготности популяционный генетик тоже назовёт инбридингом — но, в отличие от дагестанского варианта, случайным инбридингом.
ВЕЗДЕСУЩНОСТЬ ПОДРАЗДЕЛЁННОСТИ
Тут мы сталкиваемся с очень важным моментом геногеографии. Возникает вопрос — а что нам считать популяцией? Большую подразделённую популяцию (всех русских) или её отдельные «разделы» (население Рязанской, Вологодской и других областей)? Что правильнее: считать популяцией отдельный аул адыгейцев, а всех адыгейцев считать «суперпопуляцией», или же адыгейцев считать «просто популяцией», а отдельные аулы — её частями?
Для популяционной генетики этот вопрос не имеет смысла. Исследователь может выбирать для рассмотрения популяцию любого иерархического уровня — от небольшой индейской деревушки до населения всей Америки. Но что имеет огромный смысл и обязательно для каждого — это всегда, в любом случае отдавать себе отчет в том, популяцию какого уровня мы в данный момент рассматриваем.
Все человечество представляет собой одну гигантскую популяцию, подразделённую на множество меньших, но все ещё огромных популяций, которые дальше подразделяются на всё более дробные. Это принцип матрёшек, с тем отличием, что в большую матрёшку входит только одна следующего размера, а популяция обычно включает множество вложенных в нее одинаково меньших «матрёшек».
РАЗЛИЧИЯ МЕЖДУ ЧАСТЯМИ ПОДРАЗДЕЛЕННОЙ популяции
Легко видеть, что лист дуба подразделён на лопасти, но лист каштана или смоковницы подразделён намного больше. Популяции тоже различаются по степени подразделённости. Эту степень можно измерить несколькими способами.
Во-первых, можно сравнить, насколько отдельные части (субпопуляции) генетически отличаются друг от друга. Для этого нужно лишь знать частоты генов в каждой из субпопуляций и вычислить величину генетических различий между ними. То же самое можно описать и чуть другими словами: чтобы определить степень подразделённости популяции, нужно рассчитать дисперсию частоты гена в субпопуляциях. Понятно, что если популяция в большой степени подразделена (субпопуляции в большой мере изолированы друг от друга), то частота гена в субпопуляциях значительно варьирует, и дисперсия частоты будет велика.
Второй способ измерить подразделённость состоит в расчёте гетерозиготности. Как известно из правила Харди-Вайнберга, в панмиксной популяции с частотой аллеля q гетерозиготность составляет 2q(1-q). А в подразделённой популяции с той же средней частотой аллеля q гетерозиготность оказывается меньше (так называемый эффект Валунда). Причём это снижение гетерозиготности тем больше, чем выше степень подразделённости популяции. Поэтому, сравнивая среднюю гетерозиготность субпопуляций (обозначаемую[74] HS) с теоретически ожидаемой гетерозиготностью тотальной популяции Нт, можно вычислить степень подразделённости популяции, обозначаемой как GST. Формула расчёта очень проста: GST=(HT-HS)/HT.
Оба способа расчёта — и через дисперсию, и через снижение гетерозиготности — измеряют одну и ту же подразделённость. Поэтому, при условии использования адекватного математического аппарата, эти две величины оказываются равны друг другу.
РАЗЛИЧИЯ МЕЖДУ ПОПУЛЯЦИЯМИ
Существует много способов сравнить две популяции и определить степень их генетического различия. Эти меры получили название генетических расстояний (генетических дистанций). Все они сравнивают, насколько различаются частоты аллелей в двух популяциях. Возникает вопрос, как быть, если мы хотим сравнить не две, а три или большее число популяций? Для этого можно рассчитать генетические расстояния между каждой парой популяций. И увидеть, какие из популяций больше похожи друг на друга, а какие от них отличаются.
Если же усреднить все попарные различия между популяциями, то мы получим как бы общую характеристику всей рассматриваемой системы популяций — насколько все входящие в систему популяции генетически отличаются друг от друга. Легко видеть, что по смыслу это та же самая степень подразделённости, которую мы описывали совсем недавно, только с помощью других мер различий.
Для этого нужно лишь сменить точку зрения на ситуацию: вместо сравнения отдельных популяций, составляющих вместе «систему» популяций, начать говорить о различиях между субпопуляциями, входящими в подразделённую популяцию. Мы уже упоминали, что отличие «популяции» от «субпопуляции» заключается лишь в точке зрения: практически каждая популяция является звеном в цепи матрёшек — она состоит из нескольких популяций низшего уровня (субпопуляций), но и сама является субпопуляцией по отношению к группе населения более высокого иерархического уровня. Например, популяция «население Костромской области» состоит из субпопуляций — районов области, но в свою очередь является частью популяции «русский народ».
Вернемся к различиям между группой популяций. Мы сказали, что, рассчитав генетические расстояния между каждой парой популяций и усреднив все эти попарные отличия, мы получим величину подразделённости для данной группы популяций. Приятная неожиданность заключается в том, что этот (третий уже!) способ рассчитать подразде-лённость даст нам опять то же самое число, ту же величину подразделённости, что и два другие способа расчёта (через дисперсию частоты аллеля в субпопуляциях и через снижение гетерозиготности).
Поэтому разные меры генетических расстояний часто являются одновременно и мерами подразделённости. Например, часто используемый способ расчёта генетических дистанций — FST дистанции, и эта математическая величина является очень близким родственником классическому показателю подразделённости: FST-статистике Райта. Аналогично, неевские генетические расстояния (рассчитываемые по формуле, выведенной М. Неем) легко превращаются в неевскую же меру межпопуляционной изменчивости GST.
Есть и четвертый способ расчёта подразделённости, и он крайне важен. Дело в том, что он напрямую связывает подразде-лённость популяции с генетическим дрейфом и миграциями. Популяционный смысл этой связи в том, что генетические различия между субпопуляциями возникают за счет дрейфа, но уменьшаются за счет миграций между субпопуляциями (§ 4). Подразделённость (Fe) рассчитывается по формуле Fe=1/(1+4NeMe), где Ne — генетически эффективный размер популяции, задающий интенсивность дрейфа, а Ме — генетически эффективные миграции (£3).
ПОДРАЗДЕЛЕННОСТЬ. ДИФФЕРЕНЦИАЦИЯ И МЕЖПОПУЛЯЦИОННАЯ ИЗМЕНЧИВОСТЬ
Остается добавить, что у понятий «подразделённость популяции» и «генетические расстояния между популяциями» есть ещё два синонима: это «дифференциация» популяционного генофонда и «межпопуляционная изменчивость». Все эти термины несколько с разных сторон описывают одно и то же явление — подразделённость человечества на множество иерархически соподчинённых (вложенных одна в другую) популяций.
Мы видим, что все показатели, описывающие генофонд популяции, теснейшим образом связаны с понятием подразделённой популяции. Генетические расстояния превращаются в подразделённость, дисперсия частоты аллеля оказывается связанной с гетерозиготностью, и опять-таки измеряет степень подразделённости, и к той же величине подразделённости приводит соотношение дрейфа и миграций. Целью этого параграфа 5 было показать читателю, мало знакомому с теорией популяционной генетики, важность понятия подразделённой популяции и ввести термины, которыми мы широко пользуемся во всей книге. На взгляд авторов, важность концепции подразделённости вызвана именно тем, что все человечество представляет собой многоуровневую, иерархическую популяцию, и почти каждая конкретная популяция и сама состоит из нескольких субпопуляций, и входит в состав популяции более высокого иерархического уровня.
В следующем разделе 2 приводятся некоторые конкретные сведения об используемых мерах подразделённости, а также описывается наиболее сложный случай — анализ многоуровневых популяционных систем, когда каждая субпопуляция в свою очередь состоит из нескольких «субсубпопуляций».
2. ИНСТРУМЕНТЫ
Победа разума над сарсапарилой
О.ГенриВ главе 1 мы начали беглое рассмотрение инструментария геногеографии с главных инструментов, используемых в этой книге — генетических маркёров и карт. Однако в оркестре геногеографии постоянно, хотя и порой и незаметно, звучат и иные инструменты. Без них многое останется не озвученным и непонятным.
§ 1. Анализ селективно-нейтральной изменчивости МЕРЫ ИЗМЕНЧИВОСТИ ГЕНОФОНДА
Чтобы оценить изменчивость генофонда, в популяционной генетике обычно пользуются FST-статистикой Райта, GST-статистикой Нея, разными мерами генетических расстояний. Все эти показатели оценивают различия между популяциями в пределах «большого», подразделённого генофонда.
Эти меры подробно описаны во многих зарубежных руководствах по популяционной генетике. Из отечественных и переведенных монографий можно рекомендовать учебники [Ли, 1978; Вейр, 1995] В русскоязычных монографиях основные сведения о FST и СSТ-статистиках кратко, но очень емко освещены в работах Ю. П. Алтухова [Алтухов, 1983, 1989, 2003; Алтухов и др., 1997; Динамика популяционных генофондов…, 2004]. Оба показателя (FST≈GST) являются нормированной дисперсией частоты аллеля.
Например, FST=σ2q/q(1-q), где σ2q=k-1∑(qj- q)2, а средняя частота аллеля q в подразделённой популяции, состоящей из k субпопуляций (j=1,2…, k), рассчитывается как k-1∑qj.
Неевская мера генетического разнообразия (GSТ-статистика) имеет на наш взгляд, некоторые преимущества перед другими: она концептуально проста и логична; её посылки и преобразования имеют ясный и точный биологический смысл, теория её элегантна, расчёты не громоздки. GSТ-статистика может быть выражена и в понятиях FST, блестяще разработанных теорией популяционной генетики, и в привычных ныне многим понятиям генетических расстояний (как угловых, так и неевских), а поэтому GSТ-статистика позволяет использовать модели и результаты, изложенных в терминах всех этих мер. Также крайне важно, что GSТ-статистика может успешно применяться для популяций, в которых нарушено равновесие Харди-Вайнберга, нет случайного скрещивания и действует естественный отбор [Nei, Roychoudhury, 1974; Nei, 1975].
АНАЛИЗ ИЕРАХИЧЕСКИХ (МНОГОУРОВНЕВЫХ) ПОПУЛЯЦИЙ
Очень важное достоинство GSТ-статистик — возможность вести анализ иерархически соподчиненных популяций. Для этого разработан четкий алгоритм, позволяющий разложить генетическую изменчивость популяций огромного региона GSТ на её составляющие. Поясним этот механизм на примерах (детальное описание алгоритма и результатов его использования дано в [Рычков, Ящук (Балановская), 1980, 1983, 1986]). Каждый иерархический уровень популяций, начиная с самых «дробных» популяций и поднимаясь до уровня региона, обозначим цифрами 1, 2, 3 и т. д. Пусть первый уровень (1) — локальные популяции (села, веси, города). Второй уровень (2) — территориальные группы народа (например, казаки или поморы в пределах русского народа). Третий уровень (3) — этносы (то есть народы — например, русские, белорусы и украинцы). Четвертый уровень (4) — группы «родственных» народов (например, лингвистические ветви — славянская, романская). Пятый уровень (5) — население, говорящее на языках одной лингвистической семьи (индоевропейской или же уральской). И последний, верхний уровень (Т) — «тотально» население всего региона (например, Восточной Европы).
С помощью GST-статистик мы можем оценить среднюю генетическую изменчивость популяций на каждом уровне популяционной системы. Тогда G12 — обозначает средние генетические различия между локальными популяциями в пределах одной территориальной группы (например, между популяциями поморов); G23 — средние различия между территориальными группами в пределах одного народа (например, поморы, казаки и другие — в пределах русского народа); G34 — средние генетические различия между народами в пределах лингвистической ветви; G45 — средние различия между ветвями одной лингвистической семьи; G5T — различия между лингвистическими семьями региона. При этом соблюдается равенство GST=G12+G23+G34+G45+GST.
Все составляющие GST связаны аддитивно. Поэтому, если мы решим «миновать» какие-то уровни, это не создаст проблем. Например, у нас не для всех этносов региона есть генетические данные об их территориальных группах (удмурты и карелы представлены лишь одной группой популяций). Или нет сведений о генофондах разных ветвей лингвистической семьи (индоевропейская семья представлена только славянами). В этих случаях мы можем плохо представленные уровни просто «пропустить». Тогда у нас будет G13 — средние генетические различия между локальными популяциями в пределах одного народа (например, села и веси в пределах русского народа, минуя территориальные группы); G35 — средние генетические различия между народами в пределах лингвистической семьи (минуя лингвистические ветви); GST — различия между лингвистическими семьями региона (здесь мы на самом деле миновали «суперсемьи», например, ностратическую). При этом будет соблюдаться равенство GST=G23+G35+GST.
ДВЕ СОСТАВЛЯЮЩИЕ ИЗМЕНЧИВОСТИ; МЕЖДУ ПОПУЛЯЦИЯМИ И ВНУТРИ ПОПУЛЯЦИЙ
В понятие GSТ-статистик входят не только сами GST и их составляющие (G12, G23, G13…), которые оценивают различия между популяциями, но также НT и НS, обращенные «внутрь» популяций. Показатель НT оценивает общее генетическое разнообразие, накопленное всей «тотальной» популяцией. Он включает в себя и различия между популяциями GST, и различия между индивидами внутри популяций НS. Показатель НS оценивает различия внутри популяции и потому называется показателем гетерозиготности популяции. Это и понятно — показатель НS оценивает, насколько генетически похожи друг на друга представители одной популяции. НS может оцениваться для любого уровня иерархии, но обычно рассчитывается только для самого нижнего уровня, каким бы мы его ни выбрали — то есть это может быть гетерозиготность локальных популяций или же этносов. Все GSТ-статистики связаны между собой следующими соотношениями:
GSТ≈FST=DST/HT
HT=DST+HS
HT=1-∑q2i
HS=1-∑q2ij
где qij — частота i-того аллеля в j-той субпопуляции (j=1,2…, k), k — число субпопуляций; — средняя частота i-того аллеля в тотальной популяции, а DSТ=(k-1)-1(qi-qij)2 представляет собой дисперсию частоты аллеля.
DST, FST и GST — ЭТО ПО СУТИ ПОЧТИ ОДНО И ТО ЖЕ
Однако сама дисперсия DST зависит от частоты аллеля в популяции. Поэтому всегда используют показатель GST. Он, как и FST, представляет собой дисперсию частот аллелей, нормированную на общее генетическое разнообразие Ну, и не зависит от средней частоты аллеля. Для диаллельных генов равенство GST=FST выполняется строго, для мультиаллельных генов равенство выполняется лишь примерно: GST≈FST, поскольку в расчёт FST входит и оценка ковариации между частотами аллелей, а для GST — не входит. Но это не мешает обоим этим показателям быть очень близкими по величине и взаимозаменяемыми: ведь размах ковариации между частотами аллелей обычно меньше той случайной ошибки, с которой и FST, и GST варьируют около истинной оценки различий между популяциями. Поэтому вся огромная литература о статистических свойствах FST распространяется и на свойства GST. И мы дальше используем GST и FST как синонимы, хотя сами величины межпопуляционных различий оценивали с помощью неевских GST статистик.
§ 2. Анализ селективно-значимой изменчивости
КАК ОБНАРУЖИТЬ ДЕЙСТВИЕ ОТБОРА
По результатам воздействия на оценку генетических различий между популяциями легко выделяются два основных типа отбора: при дифференцирующем типе отбора размах изменчивости между популяциями по данному гену выше (FST(i)>Fe), а при стабилизирующем отборе ниже (FST(i)<Fe), чем реальный селективно-нейтральный уровень различий между популяциями (Fe). Тогда оказывается, что, зная селективно-нейтральный уровень изменчивости, мы можем обнаружить гены, имеющие селективную ценность, определить тип отбора и его интенсивность в данной группе населения в определённых условиях его среды. Это замечательное свойство используется в главе 5 при описании изменчивости классических маркёров в русском генофонде. Но все же задачу выявлению эффектов отбора и определению селективной структуры генофонда пришлось оставить за рамками данной книги, хотя разработке этих вопросов мы посвятили множество работ, которые читатель, интересующийся проблемами отбора, может легко найти [Балановская, Рычков, 19906,в; Балановская, Нурбаев, 1997, 1998а, б, в, 1999].
ЕСЛИ БЫ ОТБОРА НЕ БЫЛО
Предположим, что у нас имеется множество полиморфных селективно-нейтральных генов. Это значит, что при оценке различий между популяциями по этим генам можно пренебречь двумя из четырех факторов микроэволюции — отбором и мутациями. Останутся лишь два фактора — дрейф генов и миграции. Для одного и того же генофонда измерим различия между одними и теми же его популяциями по каждому i-тому гену (аллелю). Тогда мы получим ряд оценок — FST(i). Это и будут оценки межпопуляционной изменчивости генофонда по ряду i-тых селективно-нейтральных генов. При этом мы обнаружим, что все оценки FST(i) колеблются случайным образом около величины некоей средней величины Fe. Эта величина и есть искомая оценка дифференциации генофонда. Она не зависит от отбора (поскольку гены селективно-нейтральны) и задана только селективно-нейтральными факторами микроэволюции: соотношением миграций Ме и дрейфа генов Ne. В общем случае эти факторы одинаково воздействуют на все гены генофонда. И именно поэтому все оценки FST(i) лишь случайным образом и недостоверно отличаются как друг от друга, так и от истинного уровня дифференциации генофонда — Fe. Поэтому, если мы рассчитаем среднее значение FST, то и его отличия от истинного уровня дифференциации Fe будут недостоверны: то есть FST≈Fe.
КАК «СНЯТЬ» ВЛИЯНИЕ ОТБОРА
Однако, возьмём теперь не гипотетические селективнонейтральные гены, а обычные полиморфные генетические маркёры, с которыми приходится на практике работать популяционной генетике. Тогда мы обнаружим, что наряду с недостоверными отклонениями FST(i) от FST≈Fe, есть и иные отклонения — неслучайные и достоверные. Для каждого такого i-того гена достоверные отклонения FST(i) от величины Fe (истинной дифференциации данного генофонда) вызваны действием отбора на этот ген. Поэтому возникает вопрос — сколько таких генов, для которых действие отбора столь велико, что достоверно отклоняет его оценку межпопуляционной изменчивости FST(i) от истинной величины Fe? Как соотносятся между собой гены, близкие к селективно-нейтральным, и селективно-значимые гены? Мы обнаружили при изучении генофонда и всей ойкумены, и отдельных регионов мира, что к селективно-значимым можно отнести лишь треть полиморфных классических маркёров [Балановская, Нурбаев, 1997; 1998а, б,в.; 1999]. К такому же выводу пришли и авторы, использующие совершенно иные методические подходы и иную панель маркёров, чем мы [Bowcock et al, 1991; Sanchez-Mazas et al, 1994]. Это указывает на объективность полученной оценки. Можно предположить, что столь большой (две трети генов) буфер относительно селективно-нейтральных генов и обеспечивает устойчивость равенства FST≈Fe. Именно благодаря тому, что буфер условно селективно-нейтральных генов столь велик, средние оценки FST оказываются не столь чувствительны к случайным колебаниям той или иной выборки генов, по которой мы рассчитали это среднее значение. Или иными словами — именно поэтому оценки FST≈Fe почти не зависят от того, каково в выборке соотношение генов, подверженных тому или иному типу отбора — стабилизирующего или же дифференцирующего (если, конечно же, выборка генов из генома велика и случайна по отношению к эффектам отбора).
Поэтому и оказывается, что если рассчитать средние значения (FST) по большой выборке генов, репрезентативно отражающей геном в целом, то получим искомый интегральный показатель генетического расхождения популяций вслед за возникновением в ходе их истории тех или иных границ. Благодаря случайности выборки генов из генома, такой показатель уже не зависит от неравной приспособленности аллелей к среде, а примерно соответствует (FST≈Fe) истинному показателю дифференциации генофонда Fe, зависящему только от исторически сложившихся параметров — генетически эффективного размера популяций Ne и генетически эффективных миграций Ме [Wright, 1943]:
FST≈Fe=1/(4NeM+1)
Еще раз подчеркнём, что величина Fe указывает нам, какими должны быть различия между субпопуляциями в отсутствие отбора. Она отражает устойчивые демографические особенности данного генофонда — исторически сложившуюся структуру генных миграций Ме и размер популяций Ne. Таким образом, хотя на практике расчёт изменчивости генофонда проводится по генам, частично находящимся под действием отбора, но, включая в этот расчёт не один — два, а множество генов, удается «снять» действие отбора и оценить истинную дифференциацию генофонда. Эта средняя, объективная, селективно-нейтральная дифференциация генофонда уже не зависит от конкретных взятых в анализ генов, и задаётся не действием естественного отбора, а действием исторических факторов. Такой подход к «снятию» эффектов отбора тесно связан с концепцией «обобщённого гена».
§ 3. Картографический арсенал
В этом разделе мы рассмотрим, из каких элементов состоит картографическая технология геногеографии. При этом мы окинем лишь общим взглядом те методы, которые позволяют проводить разные операции с картами, и расскажем, для чего и в каких случаях они могут понадобиться. Собственно методы, составляющие картографическую технологию, и их технические подробности описаны в следующем разделе 3. Но большинству читателей сама техника построения и анализа карт вряд ли интересна. Поэтому здесь мы дадим лишь общее, но вполне достаточное для понимания книги описание картографического арсенала. Иными словами, технические детали оставим для раздела 3, а здесь сделаем акцент на взаимосвязи между этими методами, на их назначении.
Все картографические методы геногеографии можно подразделить на пять групп:
1) построение простой карты;
2) операции с отдельной картой;
3) операции с несколькими картами;
4) построение синтетических (обобщённых) карт;
5) построение и использование карт надёжности.
ПОСТРОЕНИЕ ПРОСТОЙ КАРТЫ
Построение карты отдельного признака — это первый, начальный этап. Термин «простая карта» удобен, так как он подчёркивает, что сначала строится карта отдельного признака, в противоположность сложным «обобщённым» (синтетическим) картам, которые создаются впоследствии из нескольких простых карт.
Исходными данными для построения простой карты служит информация о значениях признака в опорных точках — непосредственно изученных популяциях. Результатом картографирования являются значения признака, рассчитанные для каждой точки карты, точнее, для каждого узла равномерной сети, покрывающей всю карту. Именно «невидимая» цифровая модель карты — то есть совокупность численных значений признака, рассчитанных для каждого узла сети — и является для геногеографии настоящей «картой», а вовсе не её наглядный образ, видимый человеческим глазом. Именно с цифровой моделью проводятся все дальнейшие операции и преобразования, весь картографостатистический анализ.
В том числе можно провести визуализацию карты и получить графическую карту — привычное картографическое изображение. На этом этапе мы уже можем «разглядывать» карту. Однако с графическим изображением никаких операций проводить уже нельзя. Любую карту можно и нужно визуализировать, чтобы посмотреть, что же она из себя представляет. Однако все расчёты, весь анализ, проводятся не с изображением — а всегда с цифровой моделью, с «настоящей картой», «невидимкой».
Важно, что цифровая модель, полученная в результате картографирования, зависит от двух факторов: исходных данных в опорных точках и от параметров картографирования. На одних и тех же исходных данных можно получить различающиеся карты, в зависимости от выбранных параметров. В этом и состоит картографическое моделирование. Имея семейство карт, полученных на основе одних и тех же исходных данных, мы можем увидеть, какие структурообразующие элементы карты являются устойчивыми, непреходящими, не зависящими от метода построения карты. А какие элементы карт эфемерны и возникают лишь в отдельных картографических моделях. Это свойство — множественность картографических моделей — важное достоинство компьютерных карт пакета GGMAG.
ОПЕРАЦИИ С КАРТАМИ
Итак, мы получили цифровую модель (простую карту) для одного или нескольких отдельных признаков. Далее эти простые карты можно преобразовывать и комбинировать самыми различными способами. При этом те или иные математические операции производятся с числовыми значениями, находящимися в узлах карты. Например, такая операция, как сложение двух карт, состоит в том, что числовое значение определённого узла из первой карты складывается с числовым значением, находящимся точно в том же узле второй карты, и записывается в точно такой же узел третьей, создаваемой карты. Когда такие действия проведены с каждым узлом, мы получаем итоговую карту, являющейся суммой двух исходных карт.
ОПЕРАЦИИ С ОТДЕЛЬНОЙ КАРТОЙ
Операций с отдельной картой (неважно — с простой картой или с результатом обобщения ряда карт) предусмотрено много, и их удобно разделить на три группы: операции, проводимые с каждым узлом независимо; операции в плывущем окне (с той или иной группой узлов карты); операции, проводимые со всей картой (со всеми узлами карты сразу). Рассмотрим по очереди эти три группы процедур.
1) ОПЕРАЦИИ С ОТДЕЛЬНЫМ УЗЛОМ. Примером простейшей операции, проводимой независимо с каждым узлом, будет дополнение карты до единицы. Для этого значение, находящееся в данном узле карты (допустим, частота аллеля, равная 0.3), вычитается из единицы (1–0.3) и в результате получается искомая величина дополнения до единицы (в нашем примере 0.7). Когда такая операция проведена с каждым узлом карты, мы получаем карту, дополняющую исходную карту до единицы.
Смысл подобного преобразования станет ясен, если представить, что первая карта показывала распространение одного из аллелей двуаллельного гена. В этом случае вторая карта (дополнение до единицы) покажет распространение второго аллеля: ведь в каждой популяции, в каждой точке карты частота второго аллеля должна равняться единице минус частота первого аллеля! В результате мы получаем карты обоих аллелей, необходимые для дальнейших расчётов. Такой способ получения карты второго аллеля корректнее, чем независимое построение карты второго аллеля: лишь этот способ обеспечивает сумму частот равную единице в любой точке обеих карт. А это требование порой является необходимым для генетико-статистических расчётов.
Кроме вычитания, с картой можно проводить любые другие арифметические или алгебраические действия.
2) ОПЕРАЦИИ С ГРУППОЙ УЗЛОВ. Самым частым случаем преобразований в плывущем окне является построение трендовой карты. В этом случае значение в узле новой карты зависит не только от значения того же узла исходной карты, но и от значений в соседних узлах. Например, значения во всех соседних узлах усредняются, и это усреднённое значение записывается в «центральный» узел создаваемой трендовой карты. Затем мы переходим к следующему узлу, теперь он на время становится «центральным». У него уже несколько иные соседи, и мы проводим с ним ту же операцию. В результате по всей карте как бы проплывает окно заданного размера. В рамках этого окна мы проводим усреднение, и каждый узел карты поочерёдно становится «центральным». Результирующая карта по сравнению с исходной выглядит сглаженной. Благодаря усреднению соседних значений, резкие локальные скачки значений признака выровнялись, сгладились, и мы видим основные черты рельефа карты, не затушёванные локальными всплесками. Степень сглаживания будет зависеть от размера окна. Если мы выберем окно размером 3x3 узла сетки (один «центральный» узел и по одному соседу с каждой стороны, то есть восемь ближайших соседей для каждого «центрального» узла), то сглаживание будет очень небольшим. Если же размер окна будет 15x15 узлов сетки карты, то вся карта предстанет существенно выровненной.
В пакете GGMAG реализованы и много более сложные процедуры. Плывущее окно может быть не только постоянного, но и меняющегося размера. Например, мы можем задать минимальный размер окна 5x5 узлов, и для каждого узла этот размер будет автоматически увеличиваться до тех пор, пока число опорных точек, попавших в окно, не достигнет заданной величины. Тогда для разных узлов карты размер окна и соответственно степень сглаживания окажется разной, но в каждом случае вычисления будут проведены примерно с одной и той же степенью достоверности, поскольку результаты будут опираться хотя и на разное число интерполированных значений, но на одно и тоже число значений в опорных точках. Использование техники меняющегося окна необходимо, когда на карте есть и области с густым и разнообразным населением (например, Кавказ), и области с редким населением на огромных территориях (например, коренное население Сибири).
Эта техника плывущего окна — как постоянного, так и меняющегося размера — может применяться далеко не только для построения трендовых карт. Ведь вместо усреднения мы можем проводить любые другие вычисления по значениям, попавшим в окно, — например, рассчитать их дисперсию. И действительно, наиболее перспективное применение техники меняющегося окна состоит в построении карт межпопуляционного разнообразия, когда для каждой точки карты рассчитывается значение межпопуляционной изменчивости в окрестностях этой точки.
3) ОПЕРАЦИИ СО ВСЕМИ УЗЛАМИ КАРТЫ. Особым случаем преобразования отдельной карты является моделирование трендов с использованием многочленов Чебышева. В этом случае анализируется вся совокупность значений карты, и результирующая карта представляет значения трендового признака, вид которого зависит от исходных значений карты и от выбранной степени многочлена.
Анализ одновременно всех значений карты используется, например, и при расчёте корреляции карты с географическими координатами. В этом случае карта рассматривается как простая таблица, для каждой ячейки которой (узла) известна географическая долгота, широта и значение признака. По этим значениям вычисляется корреляция признака и географических координат. В зависимости от используемой формулы можно рассчитать обычный коэффициент корреляции, частную или множественную корреляцию.
ОПЕРАЦИИ С НЕСКОЛЬКИМИ КАРТАМИ
Этот тип преобразований карт очень похож на операции с отдельной картой. Разница заключается лишь в том, что проводится не операция вида «значение в узле карты и заданное значение», как для отдельных карт, а операция вида «значение в узле первой карты и значение в том же узле второй карты». Мы уже приводили пример дополнения карты до единицы. Аналогичным образом можно суммировать две или более карт, делить карты друг на друга и так далее — в зависимости от заданной нами математической формулы.
Проводятся и более сложные преобразования сразу нескольких карт. Например, та же технология плывущего окна может быть применена и к расчёту корреляции между двумя картами. В этом случае рассчитывается корреляция между всеми значениями в группе попавших в окно узлов одной карты и группе аналогичных узлов второй карты, и значение заносится в очередной «центральный» узел результирующей карты. Таким образом, для каждого узла карты получается свое значение коэффициента корреляции, и полученная карта носит название корреляционной. Она показывает, какова теснота связи на разных территориях.
А она зачастую различается не только по величине, но и по знаку!
Рассчитать корреляцию между двумя картами можно и более простым способом: как корреляцию между всеми узлами первой и (ранжированными в том же порядке) узлами второй карты. В этом случае мы получаем не корреляционную карту, а единственное значение коэффициента корреляции между двумя нашими картами.
Легко заметить, что операции с несколькими картами можно подразделить по тому же принципу, что и операции с отдельной картой: действия с каждым узлом независимо (например, суммирование карт); действия в плывущем окне (корреляционные карты); действия со всей совокупностью значений карты (расчёт коэффициента корреляции между двумя картами).
ПОСТРОЕНИЕ СИНТЕТИЧЕСКИХ КАРТ
По сути, этот тип преобразований ничем не отличается от только что рассмотренного анализа нескольких карт. Мы выделяем его как отдельный вид лишь потому, что этот анализ преследует особые цели и, к тому же, обычно использует более сложные математические формулы.
Самым простым из них является построение карт гетерозиготности. Гетерозиготность рассчитывается по обычной формуле из частот каждого аллеля: HS=1-∑q(j)2. Только эти частоты берутся соответственно из карт распространённости этих j-тых аллелей, и расчёт проводится независимо для каждого узла карты. Для двуаллельного случая, чтобы получить карту гетерозиготности, нужно лишь перемножить карты двух аллелей — q и (1-q), а затем полученную карту умножить на два. Как видим, весьма несложно.
Построение карт генетических расстояний основано на том же принципе, только формула чуть сложнее. В этом случае исследователь задаёт, во-первых, частоты аллелей в реперной популяции (то есть той популяции, генетические расстояния до которой мы хотим оценить), и, во-вторых, карты распространённости этих аллелей. Тогда для каждого узла карты программа (как и при расчёте гетерозиготности) берет частоты каждого аллеля в этом узле и по заданной формуле рассчитывает генетическое расстояние от этих частот до частот в реперной популяции. Как обычно, такая операция проводится независимо для каждого узла, и создается карта расстояний, показывающая степень генетической удаленности каждой точки карты от реперной популяции.
Технически более сложным является расчёт карт главных компонент. В этом случае данные по всем узлам всех исходных карт анализируются совместно: вычисляются коэффициенты корреляции между картами и далее по обычному принятому в статистике алгоритму рассчитываются значения каждой из главных компонент для каждого узла карты. Результатом является серия карт главных компонент: в узлах этих карт содержатся значения соответствующей главной компоненты в этой точке карты.
Важно отметить, что обобщённая карта, например карта главной компоненты, по своему формату ничем не отличается от простой карты распространения какого-либо признака: точно так же каждый узел карты содержит какое-либо численное значение. Это значит, что с обобщёнными картами (как и с корреляционными и вообще любыми), можно проводить все те же операции, что и с простыми картами — картами отдельных признаков. Например, часто строят карты трендов для главных компонент, можно построить корреляционную карту между картой генетических расстояний и картой гетерозиготности, или карту главной компоненты по картам главных компонент и так далее. Главное сформулировать задачу и подобрать оптимальный показатель — а картографическая технология GGMAG позволит легко реализовать его и построить требуемую карту.
ПОСТРОЕНИЕ И ИСПОЛЬЗОВАНИЕ КАРТ НАДЕЖНОСТИ
Карты надёжности занимают особое место в геногеографии. Они сродни простым картам тем, что строятся не на основании других карт, а на основании данных в опорных точках. Но для построения карт надёжности нужно знать лишь географическое расположение опорных точек (исходных популяций). Результатом будет оценка для каждого узла карты того, насколько этот узел удален от совокупности опорных точек. И, следовательно, насколько надёжна интерполяция значений в этом узле.
Карты надёжности отвечают на главный вопрос интерполяционный процедуры: насколько надёжен наш прогноз, то есть рассчитанное нами интерполированное значение в данном узле карты, если для данной области карты нет ни одной непосредственно изученной популяции. Карта надёжности показывает степень достоверности интерполяции для каждого узла карты. И использование карты надёжности может быть двояким.
Во-первых, полезно чисто визуальное сравнение карты надёжности и карты того признака, для которого она построена. Мы видим, что значениям, которые показывает карта признака, можно доверять, если они находятся в тех областях, которые карта надёжности показывает как достоверные, и следует относиться с осторожностью, если они находятся в областях ненадёжных, то есть мало обеспеченных исходными опорными точками.
Второй способ использования карт надёжности состоит в том, чтобы вообще исключить «ненадёжные» значения из карты признака — в тех узлах, для которых величина надёжности ниже заданного порога. Наша карта какого-либо признака после такого применения карты надёжности приобретает «белые пятна» изученности: если раньше значения признака показывались в каждой точке, то теперь они показываются лишь для надёжных узлов, а остальные узлы остаются пустыми (белыми).
Отметим, что карты надёжности двух разных признаков могут быть идентичными — в том случае, если эти признаки изучены в одних и тех же популяциях. Например, если мы анализируем совокупность многих признаков (пусть это будут русские фамилии), изученных в одних и тех же популяциях. В этом случае и для карты любой фамилии, и для любой производной или обобщённой карты фамилий будет подходить одна и та же карта надёжности. Однако если один из наших признаков изучен в одних популяциях, а другой в других, то карты надёжности этих признаков будут различаться. Например, при построении обобщённых карт это создаёт проблему — какая из карт надёжности отдельных признаков описывает надёжность всей совокупности признаков, то есть надёжность самой обобщённой карты? На практике пользуются разными методами объединения карт надёжности, с тем, чтобы получить общую, «усреднённую» карту надёжности. Области низкой надёжности именно «усреднённой» карты и будут «белыми пятнами» на обобщённой карте изучаемых признаков.
АРСЕНАЛ
Подведём итоги нашего осмотра картографического арсенала. Мы видели, по меньшей мере, дюжину разных методов, более или менее тесно переплетённых друг с другом.
1. Построение «простой» карты по данным в опорных точках при заданных параметрах картографирования.
2. Построение карты надёжности (по данным о расположении опорных точек).
3. Построение простой карты с учетом надёжности (ненадёжные узлы остаются пустыми и отображаются как «белые пятна»).
4. Визуализация карты (создание графического изображения по данным цифровой модели).
5. Преобразование отдельной карты (например, дополнение до единицы).
6. Преобразование совокупности карт (например, суммирование карт).
7. Построение трендовой карты (усреднение значений попавших в плывущее окно).
8. Построение трендовой карты с использованием многочленов Чебышева.
9. Построение карты межпопуляционной изменчивости или другого показателя, рассчитываемого по заданной формуле в плывущем окне постоянного или меняющегося размера.
10. Расчёт корреляции карты с географическими координатами.
11. Построение корреляционной карты.
12. Построение синтетических карт (главных компонент, гетерозиготности, генетических расстояний) по нескольким исходным картам.
Напомним ещё раз, что к любым картам могут применяться любые из этих операций — например, можно построить трендовую карту не только для простой, но и для обобщённой карты, рассчитать корреляцию корреляционной карты с географическими координатами и так далее.
3. КАРТОГРАФИЧЕСКАЯ ТЕХНОЛОГИЯ
«Его Величество дал миру карты… Блага, принесённые императором Карлом, распространяются на всю вселенную, даже на земли, еще не открытые».
Мартин Кортес де Алькабар, испанский королевский картограф, «Breve compendio de la sphera у de la arte de navegar, con nuevos instruments у reglas, exemplificado com muy subtiles demostraciones», 1530 г.В этом разделе важнейшие из методов, упомянутых при рассказе о картографическом арсенале, описаны подробнее, с указанием конкретных алгоритмов и особенностей расчёта. Но сначала мы кратко расскажем об истории разработки этих методов (§ 1), а в заключение (§ 9) рассмотрим особый аспект анализа главных компонент — так называемую проблему ложных корреляций.
§ 1. Как карты пришли в геногеографию
КАРТЫ И ГЕНОГЕОГРАФИЯ
Более полувека, прошедшего с момента зарождения геногеографической идеи до её современного воплощения, — срок достаточно большой, чтобы раскрылись те её стороны, которые первоначально оставались в тени, и принципиальная важность которых в начале не была определена. Мы имеем в виду карту как инструмент геногеографического исследования. Перефразируя утверждение академика Д. Н. Анучина, можно сказать, что степень геногеографического познания генофонда страны определяется степенью совершенства имеющейся для него карты. Современная геногеография уже немыслима без компьютерной картографии как её основы. Картографический анализ не только обеспечивает создание математически строгих, объективных и унифицированных карт, но и создаёт совершенно новые возможности для анализа явлений, моделируемых геногеографическими картами. По мысли А. С. Серебровского, геногеография способна обнаруживать главнейшие процессы, происходящие в генофонде. И лучше всего она это делает с помощью карт. На современном этапе развития геногеография имеет многообразный картографический инструментарий для корректного решения сложных задач. Именно картографическое исследование географической архитектоники генофонда позволяет анализировать географию и историю процессов, формирующих основные свойства генофонда.
Вся сложность ситуации заключалась в том, что вопрос о карте как инструменте геногеографии не был поставлен А. С. Серебровским, создававшим науку геногеографию. Именно поэтому в дальнейшем на долгое время возобладал чисто статистический анализ популяций, изъятых из географического пространства. Карты географического распространения генов, особенно генов и фенотипов человека, создавались, а чаще — рисовались и до, и после постановки А. С. Серебровским проблем геногеографии. Некоторые прекрасные работы, основанные на строгом картографическом методе, остались малоизвестны и незаслуженно забыты [Чепурковский, 1913]. Другие, представляющие результат иллюстрирования, а не картографического анализа распределения генов, широко известны [Mourant et al., 1976].
КОМПЬЮТЕРНОЕ КАРТОГРАФИРОВАНИЕ
Лишь с 70х годов XX века начал формироваться картографический подход к геногеографии — как на путях создания цифровых моделей карт, так и на путях математического анализа и точного отображения трендовых явлений на карте [Cavalli-Sforza, Bodmer, 1971; Ward, Neel, 1976; Rychkov, Sheremetyeva, 1977, 1979]. На рубеже 80х годов, благодаря органическому соединению с картографией и с созданием компьютерных банков данных о частотах генов в населении, начался принципиально новый этап в развитии геногеографии — компьютерное генетическое картографирование [Menozzi et al., 1978; Piazza et al., 1981a, 19816, Ammerman, Cavalli-Sforza,1984]. Геногеография популяций человека пережила и в переносном, и в буквальном смысле второе рождение: возник журнал Gene Geography (1987 г.). Как ни печально, его учредители не догадывались ни о происхождении и долгой предыстории геногеографии, ни о её связи с исследованием генофонда, и полагали, что созданием журнала оформили те идеи, что витали в европейской науке в 60 х годах нашего столетия [Terrenato, личное сообщение]. Возможно, именно поэтому журнал был ориентирован исключительно на публикацию данных о частотах генов в населении мира, оставляя за рамками своих публикаций проблемы не только генофонда, но и генетической картографии.
Как бы то ни было, началась эпоха компьютерной геногеографии и создания электронных карт географического распределения генетической информации. Это означает, что появилась практическая возможность от географии генов человека перейти к географии генофондов населения мира, регионов, отдельных стран и этнических групп. Появилась возможность исследовать генофонд не только общими генетико-статистическими методами, но и собственными уникальными методами геногеографии — картографическими.
Широкие возможности компьютерных карт и заставили нас взяться за их создание. При этом мы прошли долгий путь, причём полностью независимо от коллектива L. L. Cavalli-Sforza. Их «синтетические» карты мы увидели тогда, когда уже были созданы наши «обобщённые» карты. Тем более впечатляюще и закономерно, что оба коллектива независимо шли параллельными путями. Эти пути ни в чем не повторяли друг друга, однако при этом все общие инструменты картографирования оказались очень похожи. Поэтому мы не будем в этой книге останавливаться на анализе сходства и различий в технологиях — достаточно того, что получаемые карты обоих коллективов полностью сопоставимы.
ТРИАНГУЛЯЦИОННЫЕ КАРТЫ
На рубеже 80х годов — ещё до эпохи персональных компьютеров — один из авторов этой книги вместе с профессором Ю. Г. Рычковым и известными специалистами в области математического моделирования А. Т. Терехиным и Е. В. Будиловой начали разрабатывать первый вариант программного обеспечения для компьютерного картографирования. К сожалению, этот вариант так и не был опубликован. В его основе лежала триангуляционная процедура, использующая метод ближайшего соседа. Она позволяла строить и в целом корректные карты частот отдельных генов, и «обобщённые» карты — главных компонент изменчивости генофонда в целом. Иными словами, этот вариант программного обеспечения позволял создавать все те карты, которые примерно в это же время независимо разрабатывал коллектив под руководством L. L. Cavalli-Sforza [Menozzi et al., 1978; Piazza et al., 1981а]. Однако триангуляционная процедура построения карт приводила к трудно устранимому недостатку — на границах ареала значения признака были неустойчивыми. Были ещё несколько особенностей этой процедуры. Основную проблему составляло то, что такую карту было сложно «накрыть» равномерной сеткой и создать полностью сравнимые числовые матрицы разных карт. Эти особенности не позволяли решить сверхзадачу — сделать любую карту не только результатом, но и объектом следующего вида анализа.
АНАЛОГОВЫЕ КАРТЫ.
Это заставило нас приступить к созданию нового программного пакета, реализованного программистом А. В. Рычковым [Рычков и др., 1990; Балановская и др., 1990]. В нем был использован принцип интерполяции, моделирующий распространение генов из изученных популяций на все промежуточные области. Эту процедуру мы называли технологией «чернильных пятен». Ее можно представить как «растекание» разноцветных чернильных пятен. На первом шаге — в каждую точку карты, где имеется изученная популяция, наносится такое «пятно», цвет которого соответствует концентрации частоты гена. На следующем шаге
— пятна начинают расплываться во всех направлениях. На каком-то шаге итерации — соседние пятна начинаются смешиваться, реализуя некие промежуточные значения. Чем больше шагов итерационной процедуры — тем сильнее взаимовлияние даже самых отдалённых популяций и тем более «усреднённая» карта возникает перед нами. При этом сохранялась географическая локализация исходных частот генов — благодаря «маскированию» исходного значения частоты в фиксированной точке пространства. Важнейшим достоинством этого метода построения карт было то, что значения частот генов в обследованных географических точках (взаимное расположение которых могло быть сколь угодно нерегулярным) интерполировалось на узлы регулярной сетки. В результате мы получали двумерную цифровую матрицу, с которой можно было проводить любые операции одно- и многомерной статистики. Иными словами, решали нашу сверхзадачу — любая карта могла стать объектом следующего вида анализа. С помощью этого программного пакета были построены различные типы «синтетических» карт — и главных компонент, и генетических расстояний [Балановская и др., 1990] для популяций Центральной Азии и Кавказа.
У этого программного пакета было неоценимое достоинство перед всеми остальными (в том числе, и ныне широко используемыми) технологиями — он создавал как бы аналоговую модель миграции генов. Но все же и он не полностью удовлетворял нашим требованиям. Например, надо было волевым решением выбирать шаг, на котором останавливалась итерация. А основной недостаток заключался в том, что метод не позволял разделить две процедуры — создания карт только на основе исходных данных и «сглаживания» этих карт, то есть устранения случайных флуктуаций для выявления основных паттернов изменчивости. Эти обе процедуры протекали как бы одновременно — в процессе построения карты с числом итераций возрастало и «сглаживание» карты. В результате создавались сразу карты трендов (как и в технологии коллектива L. L. Cavalli-Sforza), а исходная «несглаженная» карта оставалась неизвестной. Этот серьезный недостаток заставил нас искать иные принципы создания карт.
КАРТЫ СРЕДНЕВЗВЕШЕННОЙ ИНТЕРПОЛЯЦИИ
Поэтому в 1990 г. было начато создание третьего варианта программного пакета, который и лег в основу всех последующих компьютерных карт, в том числе и приведённых в данной книге. Он создавался в долгой совместной работе с сотрудниками кафедры картографии МГУ, которыми руководил С. М. Кошель. Пакет использовал известную библиотеку программ MAG; проблемы визуализации цифровых матриц были решены с помощью оригинального пакета «Metacopy», а статистические разделы программы сначала разрабатывались нами совместно с сотрудниками кафедры картографии МГУ (С. М. Кошель, Д. Б. Патрикеев, А. В. Асриев, О. Р. Мусин, В. В. Иванов), а затем
— с помощью своих программистов (И. А. Краснов, В. Е. Папков, Т. П. Папкова, А. В. Рычков, С. Д. Нурбаев и др.).
Путь по созданию программного пакета необходимо было пройти вместе географам и генетикам. Ведь геногеография имеет собственный предмет исследования — пространственную структуру генофонда. При этом генофонд, с одной стороны, является объектом популяционной генетики, другой стороны
— выступает как один из множества объектов тематической картографии [Берлянт, 1986; Трофимов, Панасюк, 1987]. Поэтому компьютерная технология геногеографического анализа генофонда не могла быть просто перенесена из географии, не имеющей дела с генетической информацией. Она создавалась в сотрудничестве с географами, картографами и математиками специально для геногеографического изучения генофонда.
В результате в технологии картографического изучения генофонда максимально учтены и использованы методы картографической науки: методы построения интерполяционных карт, правила оформления карт, принцип анализа фоновых поверхностей. Однако сама технология картографостатистического моделирования и анализа направлена на решение задач популяционной генетики [Балановская и др., 1990; 1994а, б; 1995; 1997 и др.]. Созданный многообразный арсенал средств целиком задан принципами и логикой анализа генофондов. Корреляционный анализ и анализ показателей генетического разнообразия, картографирование главных компонент и размещение популяций в их пространстве, техника «меняющегося» окна и анализ генетических расстояний, оценка, надёжности картографического прогноза и многие другие методы статистического анализа карт разрабатывались специально для задач изучения генофонда.
Совокупность этих методических разработок трудно определить однозначно. В целом они относятся к тематической картографии, по классификации методов — к нескольким разделам математико-картографического моделирования [Берлянт, 1986; Трофимов, Панасюк, 1987]. Наиболее корректно их обозначить как картографо-статистические методы. Их общая цель: дать количественное выражение информации, содержащейся в геногеографической карте; выявить и выразить ту информацию, которая находится в неявном виде (закономерности, тренды, связи и т. д.); провести одно- и многомерный статистический анализ карт для выявления важнейших характеристик генофонда. Вся процедура картографо-статистического анализа генофонда основана на оригинальном программном обеспечении, что позволило создать своего рода компьютерную технологию геногеографического скрининга генофонда.
На основе созданной технологии были построены картографические модели различных параметров не только генофонда, но и целого спектра иных признаков, имеющих отношение к пространственной структуре популяций. Это и характеристики среды — как природные (климатические), так и антропогенные факторы (техногенные нагрузки); и характеристики материальной культуры; и частоты фамилий; и особенности размера популяций и инбридинга; и картографический анализ моногенной патологии [Балановская и др., 1996, 1997, 2000; Грехова и др., 1996; Перепелов и др., 1996; Евсюков и др., 1996, 1997; Петрин и др., 1997; Почешхова, 1998; Почешхова и др., 1998; Spitsyn et al., 1998; Гинтер и др., 1998].
ЗАРУБЕЖНЫЕ ПРОГРАММНЫЕ ПАКЕТЫ
Кроме трех перечисленных отечественных картографических пакетов, существует и ряд иных программ, используемых в зарубежных работах по геногеографии.
Наибольшее значение для геногеографии имел пакет программ, используемых группой L. L. Cavalli-Sforza. Этот пакет позволяет проводить как картографирование отдельного гена, так и расчёт синтетических карт главных компонент, хотя и не предусматривает другие виды статистического анализа и трансформации карт. Похожие, хотя и ещё менее мощные программы разрабатывались и некоторыми другими коллективами популяционных генетиков [например, Sokal, 1999а, б].
А в последние годы определенную популярность приобрела программа Surfer (Golden Software Surfer 7.0). Этот картографический пакет не является геногеографическим, а предназначен для картографирования любых, в первую очередь климатических параметров. Но он позволяет быстро построить интерполяционные карты любых признаков — в том числе и распространения генов, и поэтому нередко используется в современных работах для картографирования распространения гаплогрупп митохондриальной ДНК и Y хромосомы [Semino et al., 2000; Rootsi et al., 2004]. Но у программы Surfer есть очень крупный недостаток, отличающий её от остальных картографических программ, используемых в геногеографии. Это отличие состоит в том, что карты, построенные Surfer, являются только изображениями. Программа нацелена только на графический результат, а не на создание цифровой модели карты. То есть для каждой точки карты нельзя получить точные численные значения признака, а значит, нельзя проводить никакие виды картографо-статистического анализа, нельзя рассчитать карты главных компонент и так далее. Программа Surfer, таким образом, оказывается весьма эффективной для иллюстрации, для изображения распространённости отдельных признаков, но не позволяет проводить статистический анализ карт и строить все множество производных карт, в том числе синтетических. Иными словами, она позволяет картографировать распространённость отдельных генов, но не позволяет изучать генофонд.
§ 2. Принципы создания карт
Процедуры построения и анализа компьютерных карт пакетом GGMAG подробно описаны в целом ряде специальных публикаций [Балановская и др., 1994а, б, 1995, 1997, 1998; Сербенюк и др., 1990, 1991; Нурбаев, Балановская, 1998; Балановский и др. 1999]. Поскольку описание картографической технологии — тема будущей книги, мы укажем здесь лишь на ключевые моменты технологии. Для вдумчивого читателя мы постараемся называть разделы, посвящённые тому или иному методу, в соответствии с терминологией картографического арсенала (§ 3 предыдущего раздела 2). Иные пояснения даются в других местах книги по мере необходимости.
ОТ РАЗБРОСАННЫХ ПОПУЛЯЦИЙ К РЕГУЛЯРНОЙ карте
Данные о генофондах обычно крайне нерегулярны. Достаточно взглянуть на любую таблицу, чтобы увидеть, как неравномерно изучены гены — по каждому генетическому маркёру изучен свой набор популяций. С другой стороны, достаточно взглянуть на любую карту, чтобы увидеть, как неравномерно разбросаны изученные популяции. В этом проявилось не только «бесплановость» изучения генофонда, но и объективный фактор: резкие различия в численности и плотности коренного населения в разных регионах. Однако для геногеографического анализа, в отличие от чисто статистического, обе эти неравномерности не являются серьёзным препятствием, поскольку предметом анализа становится карта, а не первичный популяционно-генетический материал.
ПОДХОДЫ К СОЗДАНИЮ КАРТЫ
Все геногеографические карты основаны на единых методических подходах:
1. Единицей геногеографического наблюдения является популяция, характеризующаяся частотой гена и ареалом.
2. Для геногеографического изучения региона выбираются популяции, находящиеся на одном уровне популяционной структуры, вне зависимости от размеров их ареала.
3. Геногеографическая карта должна обладать не только географическим, но и генетическим масштабом: например, мировой диапазон изменчивости частоты гена, континентальный, региональный, этнический. Выбор генетического масштаба диктуется задачами исследования.
4. В генетически изученных популяциях (опорных точках карты) размещается исходная (табличная) частота гена. В популяционных ареалах проводится интерполяция — то есть для всех точек ареала популяции рассчитывается частота признака на основе данных об опорных точках (изученных популяциях).
5. Мы стремились к методу интерполяции, требующему минимума исходных предпосылок и позволяющему изменять любые параметры построения карты. Это позволяет вместо одной карты признака создать множество её моделей. Совокупность таких моделей выявляет наиболее устойчивые черты географического распределения признака, не зависящие от параметров построения карты.
6. В основе метода интерполяции лежит принцип
генетической проницаемости пространственных барьеров
за достаточно длительный промежуток времени, то есть ненулевой вероятности генных миграций в любую точку пространства. Эта вероятность генных миграций для разных точек различна и зависит от географического расстояния между популяциями.
7. В анализе генофонда отдельные признаки ‘ играют
служебную роль — они должны помочь выявить
генетическую неоднородность пространства и пространственную неоднородность генофонда. Лишь игнорируя — в процессе построения карты — природные и социальные барьеры, можно рассчитывать, что созданные карты сами обнаружат существование в пространстве генетически значимых барьеров.
8. Для простоты чтения карты все непрерывное множество значений признака подразделяется на несколько групп — интервалов признака. Число и размер интервалов выбираются в зависимости от задачи исследования. Но для каждой карты размеры всех её интервалов одинаковы (равноинтервальная шкала). Размер интервалов зависит от генетических расстояний между популяциями, тогда как площадь, занимаемая тем или иным интервалом, зависит ещё и от размеров ареалов разных популяций.
9. Основная задача при построении карты — интерполяция значений частот признака в опорных точках (взаимное расположение которых может быть сколь угодно нерегулярным) на узлы регулярной картографической сетки.
ИЗОТРОПНОСТЬ ПРОСТРАНСТВА
Принципиально важно, что при построении карты географическое пространство предполагается изотропным. Это означает, в процессе создания карты не учитываются ни природные, ни историко-культурные факторы, безусловно, влияющие на распространение генов. Любой учет этих факторов субъективен — он всегда связан с экспертной оценкой значимости фактора для генофонда. Такая оценка порой больше зависит от эксперта, чем от фактора, и её учет вводил бы в строгую математическую модель карты субъективный фактор научного мировоззрения эксперта. Сама карта может объективнее эксперта учесть и отразить реальное воздействие как природных, так и историко-культурных факторов на генофонд. Если анизотропность физического и культурного пространства нашла отражение в самих наблюдаемых частотах генов, то она проявится и при картографировании: барьеры, препятствующие свободному потоку генов, создадут перепад частоты гена; и чем мощнее барьер, тем более резкий перепад частот мы обнаружим на карте.
§ 3. Простые карты
ИНТЕРПОЛЯЦИЯ
Как мы уже говорили, принципиально важно, что при создании карты можно из целого спектра предусмотренных вариантов выбрать наиболее корректный вариант интерполяционной процедуры. В результате любой интерполяции по нерегулярно расположенным опорным точкам создается цифровая модель (ЦМ) генетического рельефа: рассчитываются значения признака в узлах регулярной сетки, покрывающей картографируемое пространство.
Полагая, что распределение признака на обширной и гетерогенной в природном и историческом отношениях территории не может определяться действием какого-либо единственного фактора микроэволюции, нами использован метод двумерной средневзвешенной интерполяции. Такая интерполяция более чувствительна к локальной геометрии распределения значений признака в опорных точках. Она может быть распространена не на всю территорию, а на область, ограничиваемую задаваемым радиусом действия весовой функции. Как и в модели изоляции расстоянием, такая интерполяция может использовать степенную зависимость значения признака от расстояния «узел сетки — опорная точка». Использована гипотеза линейного изменения частоты гена вдоль геодезической кривой, кратчайшим образом соединяющей две соседние точки карты. При этом длина каждой геодезической вычислялась на основе моделирования геоида Земли равновеликой сферой (по Красовскому).
ЦИФРОВАЯ МОДЕЛЬ
Итак, в основе компьютерных карт лежат их цифровые модели (ЦМ) — двумерные численные матрицы с прогнозируемыми частотами признака для каждого узла сетки карты. Это позволяет работать с картой как с обычной матрицей, осуществляя любые виды арифметических и алгебраических преобразований, используя любые методы одномерной и многомерной статистики, применяя методы иных разделов математической науки (например, теории надёжности).
Компьютерное картографирование, независимо от конкретной интерполяционной процедуры, всегда представляет собой создание цифровой модели карты. Значения цифровой модели (ЦМ) картографируемого признака рассчитываются для узлов регулярной сетки ЦМ по эмпирическим значениям признака в опорных точках — генетически изученных популяциях. Выражение «опорные точки» — не образ, а конкретный термин, поскольку исходные значения признака в изученных популяциях действительно служат опорой изображенной на карте поверхности распределения признака: поверхность как бы сетью «натянута» на ординаты значений картографируемого признака в этих точках, преобразуя несвязно разбросанные опоры в изгибы, вершины и впадины генетического рельефа. В узлах регулярной сети ЦМ находятся значения картографируемого признака, рассчитанные с помощью интерполяционной процедуры: ортогональных полиномов на основе информации обо всех исходных генетически изученных популяциях в пределах заданного радиуса. При расчёте полинома значение признака в каждой популяции берется с весом, обратным расстоянию от популяции до узла сетки; по совокупности всех изученных популяций рассчитывается среднее значение в каждом узле сетки; в результате проведёния этой процедуры для каждого узла создается ЦМ карты [Сербенюк и др., 1990, 1991; Берлянт и др. 1991а, б; Koshel et al., 1991; Koshel, Musin, 1991, 1994; Koshel, 1992; Berlyant et al., 1992]. Таким образом расчёт ортогональных полиномов проводится согласно [Сербенюк и др., 1990].
f(x,у)=∑wi(x,y)zi / ∑wi(x,y),
где х, у — декартовы координаты узла сетки; z — частота признака;
wi(x,y)=1/dai(х, у) — некоторая положительная
убывающая функция от расстояния (весовая функция);
di=√(х-хi)2+(у-уi)2.
Для такой функции выполняется условие интерполяции f(xi,yi)=zj, i=1…n.
Применялось предложенное [Сербенюк и др., 1990] обобщение этого метода:
f(x,у)=∑wi(x,y)Pdii(x,y) / ∑wi(x,y),
где Pdii=zi+∑akli(x-xi)k(y-yi)l — полином степени d; xi, уi — координаты i-той опорной точки; коэффициенты akli выбираются так, чтобы обеспечить сходимость функции и её частных производных вплоть до порядка d при х∈[0, +∞], у∈[0,+∞].
Например, для создания ЦМ карт русского генофонда, пространство карты было покрыто густой равномерной сетью, состоящей из 9000 узлов. Для каждого узла сетки с помощью интерполяционной процедуры рассчитано значение частоты гена: в расчёт входили все изученные популяции в пределах заданного радиуса, взятые с весом, обратным расстоянию от данного узла сетки до конкретной изученной популяции. В данном случае была использована нулевая степень полинома, шестая степень весовой функции и учитывалась информация об исходных популяциях в радиусе 2000 км от данного узла сетки. Такой расчёт проводился независимо для каждого узла сетки. Это означает, что для каждого из 9000 узлов сетки учитывались почти одни и те же изученные популяции, но расстояния до каждой популяции и, следовательно, её «вес» при определении частоты гена в данном узле сетки — менялись. Еще раз подчеркнём, что рассчитанные значения в каких-либо узлах сетки никак не влияют на определение частоты гена в других её узлах. И поэтому все равно, с какой именно точки начнётся построение карты.
После того, как для каждого узла сетки получен независимый прогноз частоты гена, можно считать, что цифровая модель (ЦМ) карты создана: у нас имеется двумерная матрица, в каждой ячейке которой (для каждого узла равномерной сетки) хранится прогнозируемое значение признака. Далее с ЦМ (как с обычными матрицами) проводим все дальнейшие преобразования и статистические расчёты — корреляций, трендов, расстояний, главных компонент, — получая количественные оценки связей и закономерностей. При этом карта становится не иллюстрацией, а математической моделью пространственной изменчивости. Она служит инструментом количественного анализа генофонда: то есть становится не «графическим», а «алгебраическим» объектом.
Возникает закономерный вопрос: как меняются статистические характеристики (средняя частота признака, дисперсия и т. д.) в результате картографирования? Иными словами, насколько и как различаются характеристики опорных точек и ЦМ карты, созданной на их основе? Ответ на этот вопрос подробно рассмотрен в главе 5 (раздел 5.1., § 5).
КАК ЗАВИСИТ КАРТА ОТ ПАРАМЕТРОВ ЕЕ ИНТЕРПОЛЯЦИИ?
Итак, построение простой карты можно представить себе следующим образом. Сначала создается картографическая основа, напоминающая контурную карту (со своими картографической проекцией, морями, реками и границами). На нее наносятся исходные точки — популяции, изученные по данному гену. А сверху накладывается как бы листок в клетку — равномерная прямоугольная сеть. И для каждого узла этой сетки рассчитывается новое, интерполированное значение частоты гена. В каждом узле такое значение определяется всей совокупностью исходных точек в пределах заданного радиуса, но исходные значения частот гена берутся с весом, обратно пропорциональным расстоянию di: чем дальше исходная популяция от узла сетки, тем меньше её вес. После того, как расчёт проведён для каждого узла сетки и как бы занесён в каждую клетку, этот «листок в клеточку» становится цифровой матрицей (ЦМ) частоты гена. Для следующего гена повторяем ту же самую процедуру. И если для всех генов мы использовали строго одни и те же картографическую основу и равномерную сетку, то в результате получаем серию ЦМ всех генов — полностью сопоставимых и унифицированных.
Параметры интерполяционной процедуры выбираются в соответствии с оптимальным значением дисперсии признака (по всем узлам карты). Например, в таблице 3.1. приведены значения статистических показателей карты в экспериментальной ситуации для одного из регионов. Проведены три эксперимента. В каждом из них географические координаты популяций и значения картографируемого признака задавались случайным образом. В каждом эксперименте изменялся только один параметр — густота сети (от 64 до 6021 узлов). Таблица 3.1. демонстрирует, что даже при увеличении в 100 раз густоты сетки ЦМ, изменения в оценке средних и дисперсий картографируемого признака невелики. Та густота сетки, которой соответствует «перегиб» кривой значений дисперсий (минимум), принята оптимальной.
Таблица 3.1. Приложения
Зависимость статистических показателей карты от параметров её построения (густоты сетки карты)
ВИЗУАЛИЗАЦИЯ КАРТЫ
Итак, при статистическом анализе ЦМ предстает как двумерная матрица значений признака. При этом каждому узлу сети ЦМ соответствуют точные значения географических координат местности. Это позволяет перейти от матрицы к собственно картографическому образу.
Для формирования собственно карты как зрительного картографического образа создается электронная картографическая основа: контуры территории в заданных географических проекции и масштабе, гидрографическая сеть, внутренние водоёмы и омывающие моря, административные границы, опорные точки, градусная сеть; программно обеспечивается создание легенды карты. Пространственное распределение признака изображается на картографической основе с помощью группировки значений ЦМ в интервалы шкалы изменчивости признака. Интервалы на карте разграничиваются изолиниями.
При визуализации карты мы группируем значения признака в те или иные интервалы и окрашиваем их по аналогии с физической картой. На цветных картах наиболее низкие значения признака окрашиваются синими тонами морских впадин, средние — зелёным цветом равнин, высокие значения признака — красно-коричневыми оттенками гор. На черно-белых картах — повышение частоты признака выражается в большей интенсивности окраски. Основной принцип наших карт — использование равномерной шкалы интервалов.
При переходе от ЦМ к карте значения признака объединяются в интервалы, указанные в легенде карты, и послойно окрашиваются. Благодаря интервалам шкалы не только создается образ карты, но и косвенно учитывается доверительный интервал самих значений признака. Области, окрашенные одним цветом, читаются как области, характеризуемые значением признака, варьирующим в пределах, указанных в легенде шкалы интервалов. Изолинии, соединяющие точки с одинаковым значением признака, рассматриваются как вспомогательные линии при чтении карты, а не как области точных значений.
Итак, при визуализации карты отображается не только её основное содержание, то есть значения признака и разделяющие их изолинии, но и ряд географических объектов на картографируемой территории, помогающие читателю соотнести карту с известным ему географическим пространством. Практически на каждой геногеографической карте отображаются моря (береговая линия), озера и реки, государственные и этнические границы, города, а на некоторых картах могут отображаться и дополнительные объекты (ледники, горы и другие). Также показывается расположение исходных изученных популяций (опорных точек), отображаемых ромбиками или кружками. Для облегчения чтения карт мы обычно приводим не только гидрографическую сеть, но и названия нескольких крупных городов (независимо от того, были они изучены по данному признаку или нет). Легенда карты не только помогает понять её содержание, но и несет большой объём статистической информации.
ЛЕГЕНДА КАРТЫ
Каждая карта сопровождается легендой, которая может включать до четырех окон: статистическое окно, гистограмму картографированных значений, гистограмму исходных значений, гистограмму со стандартными граничными значениями.
ГИСТОГРАММЫ. Вариационно-статистическое распределение признака на карте (гистограмма) дается в одном из окон легенды в виде гистограммы, имеющей, как указывает Г. Ф. Лакин, «не только иллюстративное, но и аналитическое значение» [Лакин, 1980, с. 293]. Штриховка гистограммы соответствует штриховке интервалов на карте. Над столбцами гистограммы указана в % доля площади, занятая данным интервалом частот.
При необходимости на картах приводятся также две других гистограммы: а) вариационно-статистическое распределение исходных значений признака (в опорных точках), построенное в тех же интервалах, что и карта в целом. Сравнение гистограмм исходных и картографированных значений признака позволяет оценить новую информацию, которую вносит учет ареала при картографировании признака; б) вариационно-статистическое распределение картографированных значений признака в универсальной шкале: например, для частот генов — от 0 до 1. Это дает возможность сохранять единый генетический масштаб при сравнении распределений различных генов.
СТАТИСТИЧЕСКОЕ ОКНО ЛЕГЕНДЫ содержит, как правило, следующие показатели:
K — число опорных точек (их географическое положение приведено на карте);
N — число узлов регулярной сетки (число значений матрицы ЦМ);
MIN, MAX, M, S2 — экстремумы, средняя и варианса признака, где М=∑pijРц/N; S2=∑(pij — М)2 / N, рij — значение признака в узле матрицы ЦМ с координатами i и j;
HT, HS, GST — характеристики общего, внутри- и межпопуляционного генного разнообразия [Nei, 1975] (в качестве популяций выступают узлы сетки): НT=M(1-M); HS=HT-DST; GST=DST/HT-FST; DST=S2. Приведенные значения показывают вклад картографируемого аллеля в генное разнообразие локуса (L): НТ(L)=∑НТ(i); DST(L)=∑HST(i); HS(L)=∑HS(i); GST(L)=∑GST(i)/∑HT(i); берется сумма всех i-тых аллелей в локусе L.
Показатели, приводимые в «статистическом» окне легенды, несут разнообразную вспомогательную информацию о карте. Число опорных точек (K) и их размещение на карте помогают оценить надёжность исходной информации, а также выявить области карты, не обеспеченные ею, где мы целиком полагаемся на интерполяционную процедуру. Число узлов карты (N) несет косвенную информацию о достоверности картографо-статистических показателей: их ошибки благодаря густоте сетки невелики (в легенде есть вся информация для расчёта ошибок). Экстремумы (MIN, МАХ) дают представление о вариационном размахе (R=МАХ-MIN) признака и позволяют сравнивать разные генофонды.
Величина М указывает среднее значение ЦМ, а карта позволяет видеть, как этот «центр тяжести» [Миллс, 1958, с. 89] вариационно-статистического ряда распределён по территории. Величина М отличается от среднего значения признака, рассчитанного по опорным точкам принципиальным моментом: М является средневзвешенной величиной. В качестве веса выступает важнейшая характеристика популяции — её ареал, и потому географическое пространство популяции с необходимостью входит в расчёт среднего значения (М) и вариансы (S2) частоты гена (см. раздел 5.1, § 5). Благодаря карте, мы определяем не только величину средней, но и занятые ею области картографируемого пространства.
§ 4. Надёжность картографического прогноза
Компьютеры ненадёжны, но люди ещё ненадёжнее.
Законы ненадёжности Джилба.
Карта каждого гена сопровождается специальной картой надёжности, которая для каждого узла сетки указывает достоверность рассчитанного значения частоты гена.
ЧТО ТАКОЕ «НАДЁЖНОСТЬ» КАРТЫ
При решении задачи математического моделирования существуют два аспекта: 1) адекватность (то есть соответствие) предлагаемой математической модели анализируемым данным;
2) надёжность (то есть статистическая достоверность) результатов математического моделирования.
Если вопросы адекватности математических моделей геногеографии (их соответствия картографируемым данным, прогностической ценности и т. д.) анализировались целым рядом авторов, то работы по решению проблемы надёжности результатов картографирования в мировой литературе отсутствуют. Нерешённость проблемы надёжности картографирования не позволяет проводить строго объективную интерпретацию геногеографических карт, является основным мотивом справедливой критики и тормозит широкое использование геногеографических методов. Поэтому наша компьютерная технология геногеографического изучения генофонда уже несколько лет включает в себя оценку надёжности (достоверности) картографического прогноза — построение карт надёжности картографических моделей генофонда.
Новая характеристика «надёжность карты» количественно характеризует степень устойчивости анализируемых значений картографической модели. Надёжность измеряется вероятностью осуществления прогноза карты в каждой её точке и оценивает статистическую достоверность каждого картографированного значения.
Любая геногеографическая карта предлагает модель распространения признака (например, частоты гена) в географическом пространстве. Поскольку любое значение карты, полученное в результате интерполяционной процедуры картографического моделирования, является прогнозом, важно оценить, какова надёжность такого прогноза, какова вероятность его осуществления. Оценка надёжности дает ответ на вопрос: если в данной (любой) точке пространства провести изучение генофонда, то какова вероятность получить значение частоты гена, достаточно близкое к прогнозу, показанному на его карте?
Надёжность карты в разных частях её пространства может значительно различаться, например, из-за неравномерного распределения на карте исходной информации. На нее накладывается и неравномерность их изученности, и неравная их значимость для карты (популяции в регионах с мощными эффектами дрейфа генов дают менее надёжный прогноз, чем популяции с большой численностью и интенсивным генным обменом). Результатом такой множественной неравномерности является и неравномерная надёжность любой геногеографической карты, при чтении которой всегда возникает вопрос: насколько надёжен прогноз в той или иной точке её пространства? Ответ на такой вопрос могут дать только карты надёжности, на которых для всех точек того же самого картографируемого ареала приведены комплексные оценки надёжности (вероятности правильности картографического прогноза). Совместный анализ геногеографической карты признака и карты её надёжности позволяет по-разному относиться к значениям в надёжных и ненадёжных областях карты и давать корректную интерпретацию пространственной изменчивости изучаемого признака.
Карты надёжности создаются, исходя из основных положений математической теории надёжности. В биологических науках также используются приложения этой теории — при изучении экологических систем, генетических систем, клеток, клеточных популяций и тканей, процессов старения, репарации и др. При этом теория надёжности «рассматривается как важный эвристический метод исследования биологических объектов. Подобный подход возможен на любом уровне интеграции» [Кутлахмедов, 1985, стр. 7].
Из теории надёжности в геногеографию вводятся два понятия: уровень строгости (достоверности) а и вероятность прогноза Р [Нурбаев, Балановская, 1997, 1998; Балановская, Нурбаев, 1999].
1) УРОВЕНЬ СТРОГОСТИ (α). Уровень строгости служит постоянным коэффициентом при интегрировании дифференциального уравнения, описывающего надёжность анализируемой системы. Он задаётся в соответствии с требованиями надёжности к данной системе. Уровень строгости (обычно от α=0.3 до α=0.7) исследователь выбирается, исходя из требований к степени надёжности результатов, масштаба картографируемой территории, объёма доступной исходной информации.
2) ОЦЕНКА НАДЁЖНОСТИ ПРОГНОЗА В ТЕРМИНАХ ВЕРОЯТНОСТИ (Р). Значение надёжности прогноза является решением дифференциального уравнения надёжности. При любом заданном уровне строгости оценка надёжности (вероятность осуществления прогноза Р) варьирует от Р=0 (абсолютно ненадёжные области) до Р=1 (такой высокой надёжностью прогноза могут обладать лишь исходные популяции). Оценка надёжности меняется при изменении уровня строгости а: те объекты, надёжность которых приближается к максимальной (Р∞1) при уровне строгости α=0.50, при переходе к более высокому уровню строгости α=0.90 будут оценены как менее надёжные (Р<<1).
КАРТЫ НАДЁЖНОСТИ
На картах надёжности интенсивность окраски соответствует степени достоверности картографического прогноза. Первый интервал (белый цвет) соответствует самой низкой оценке надёжности (Р<0.90). Второй интервал (0.90<Р≤0.95) окрашен на черно-белых картах в светло-серые тона — надёжность приближается к достоверной, но не достигает традиционного для биологических исследований требования 95 % уровня вероятности. Третий интервал (0.95<Р≤0.975) — уже удовлетворительная оценка, поскольку вероятность выше 0.95; он окрашен в интенсивно серый цвет. Четвертый интервал (0.975<Р≤0.99), окрашенный в темно-серый цвет, указывает на географическое положение высоко достоверных районов карты. Пятый балл (Р>0.99) соответствует наивысшей оценке надёжности (области исходных популяций) и окрашен на карте в самые интенсивные тона. Таким образом, повышение интенсивности цвета на карте надёжности соответствует увеличению надёжности картографирования.
При дальнейшем картографо-статистическом анализе надёжными считаются только те области карты, где вероятность правильного прогноза выше 95 % (Р>0.95): только эти области распространения данного гена (или другой характеристики генофонда) учитываются при всех видах расчётов — корреляций, главных компонент, гетерозиготности и т. д.
КАРТЫ С УЧЕТОМ НАДЁЖНОСТИ
На картах признаков их значения показаны только в «надёжной» зоне, то есть для узлов ЦМ с вероятностью правильного картографического прогноза выше 0.95. В областях с меньшей надёжностью значения признака не приводятся («белые пятна» на карте данного признака).
Итак, «ненадёжные», то есть слабоизученные области, залиты на картах белым цветом и не используются в анализе, а все характеристики карты рассчитываются только по её надёжному пространству [Нурбаев, Балановская, 1997, 1998]. Число узлов карты (N), вошедших в «надёжное пространство» данного гена, указано в легенде каждой карты. Например, для ряда обобщённых карт русского генофонда N=1294. Это означает, что из 9000 узлов карты около 5000 узлов соответствуют ареалу других народов Восточной Европы, Кавказа и Урала, а остальные 2706 узлов русского ареала являются ненадёжными для данной системы признаков.
Таким образом, входными параметрами математической модели надёжности являются исходная геногеографическая карта (размещение опорных точек) и уровень строгости (α), выбранный для надёжности этой карты. Выходным параметром является вероятность прогноза (Р) значения признака в каждом узле исходной карты. Карты надёжности служат для отбора лишь тех точек картографического пространства, которые удовлетворяют требованиям надёжности.
§ 5. Простые преобразования простой карты
Мы уже говорили о том, что самые простые преобразования карты — это операции с отдельным узлом карты. Их проще всего представить, потому что такие операции проводятся с каждым узлом независимо.
СПЕКТР ПРОСТЫХ ПРЕОБРАЗОВАНИЙ
Статистическая трансформация отдельной карты осуществляется на уровне цифровой модели: с каждым значением матрицы ЦМ производятся операции, заданные тем или иным алгоритмом. В результате замены всех исходных значений матрицы преобразованными значениями создается новая — результирующая — ЦМ новой карты. К основным операциям по трансформации отдельной карты отнесены следующие: арифметические операции с константой (увеличение или уменьшение значений ЦМ на константу, умножение или деление на нее); возведение значений ЦМ в степень (положительную, отрицательную, целую, дробную); тригонометрические функции; логарифмические функции; перевод в абсолютные значения (взятие по модулю); дополнение до единицы. Эти операции комбинируются в любые сочетания, образуя цепочки многоступенчатых преобразований.
Трансформация отдельной карты широко используется при решении различных задач. Обычно такие преобразования являются промежуточными при сложных расчётах, однако они могут иметь и самостоятельное значение, например: при создании карты распределения частоты гена на основе карты альтернативного аллеля путем «вычитания карты» из единицы (1-q); при создании карты распределения гомозиготного генотипа на основе карты частоты аллеля путем возведения карты в степень (q2); при картографировании гетерозиготности и генетических расстояний двухаллельного локуса на основании карты частоты гена одного из аллелей;
для различных нормализующих преобразований карты признака: lg(x), lg(x ± const), arcsin(√x), 1/х, 1/√x, √x + √x+1, x1..5, x2.
Статистическая трансформация совокупности карт проводится путем трансформации их ЦМ. Все трансформируемые карты обязательно должны быть построены на единой картографической основе и иметь одинаковое число узлов сетки с идентичной географической привязкой. Процедура преобразования состоит в следующем. Последовательно с Rij элементом каждой матрицы ЦМ (где i и j — координаты узла равномерной сетки) осуществляется заданная операция, результат которой после обработки всех исходных ЦМ заносится в соответствующий Rij элемент результирующей ЦМ. После повторения этой процедуры для каждого узла цифровой модели будет получена новая матрица ЦМ — результирующей карты.
Элементарные операции комбинируются в любые алгоритмы, включающие также трансформации отдельной карты. Методы статистической трансформации карт позволяют осуществлять переход от географии отдельного гена к основной цели и проблеме геногеографии — географии генофонда. Этот путь пролегает через промежуточные ступени: географию генотипов и географию важнейших показателей генетического разнообразия.
В качестве примера статистической трансформации совокупности карт рассмотрим создание карт гетерозиготности, что отчасти иллюстрирует как спектр возможных приложений, так и набор элементарных трансформаций.
СОЗДАНИЕ КАРТ ГЕТЕРОЗИГОТНОСТИ
Уровень гетерозиготности служит интегральным индикатором состояния генофонда: он реагирует на воздействия всех важнейших факторов микроэволюции — дрейфа генов, инбридинга, миграций, давления отбора, служит генетической компонентой продолжительности жизни [Алтухов, 1984, 1995, 1996, 1999; Livshits, Kobyliansky, 1984а, b; Kobyliansky, Livshits, 1983, 1986; Comuzzie, Crawford, 1990; Алтухов, Курбатова, 1990, 1993; Дуброва и др., 1988, 1990; Курбатова, 1996; Спицын и др., 1996]. Величина среднего уровня гетерозиготности является важной характеристикой генофонда — есть основания полагать, что снижение или повышение гетерозиготности за пределы естественных флуктуаций несет угрозу для генофонда. Однако при картографировании гетерозиготности возникают методические сложности: для нее нельзя прямо использовать интерполяционную процедуру, так как функциональная связь гетерозиготности популяций с их географическим ареалом сложнее, чем в случае частот генов.
Поясним это на примере. Пусть на картографируемой территории наблюдается тренд (градиент) частот генов, так что опорные популяции А1 и А5, территориально удалённые друг от друга, характеризуются следующими частотами гена: qA1=0.1; qA5=0.9. Тогда на карте в промежуточных точках А2, АЗ и А4, лежащих на трансекте, проходящей через А1 и А5, интерполяционной процедурой задаются промежуточные значения частоты гена: qA2=0.3,
Чаз=0 5 и ЧА4=°-7-
Поскольку гетерозиготность Н определяется через q: H=2q(1-q), то НА1=0.18; НА2=0.42; НАЗ=0.50; НА4=0.42; НА5=0.18. Т. е. при ярко выраженном линейном градиенте частоты гена (qA1=0.1; qA3=0.5; qA5=0.9), значения гетерозиготности меняются нелинейно: в крайних точках они одинаково низки (НА1=НА5=0.18), а на промежуточной территории карты наблюдается повышение гетерозиготности до максимальных для двуаллельного локуса значений (НАЗ=0.50). Если бы мы для получения карты гетерозиготности воспользовались непосредственно интерполяционной процедурой, то не сумели бы восстановить истинный рельеф гетерозиготности. В этом случае, поскольку в опорных популяциях А1 и А5 значения гетерозиготности одинаковы (НА1=НА5=0.18), вся карта гетерозиготности представляла бы собой унылую равнину: НА1=0.18; НА2=0.18 НАЗ=0.18; НА4=0.18; НА5=0.18.
Этот пример показывает, что геногеографические карты признаков, нелинейно-связанных с частотой гена и географическим пространством, нельзя получить прямым путем, интерполируя значения этих признаков: в этих случаях необходимо использовать трансформацию карт исходных признаков. Таким образом, единственный путь создания карт гетерозиготности — это трансформация карт частот генов.
Карта ожидаемой гетерозиготности полиаллельного локуса создается путем трансформации совокупности карт аллелей [Балановская и др., 19946]. На первом этапе для каждого аллеля создаются карты географического распределения его частоты (для всех аллелей — в одном и том же ареале, с одними параметрами построения карты и т. д.). Затем для каждого локуса рассчитываются карты гетерозиготности (Н) путем статистической трансформации карт аллелей локуса по алгоритму:
Н=1=∑q2a, где qa — значения частоты a-того аллеля (в локусе — А аллелей).
Согласно этому алгоритму с картами аллелей каждого локуса проводятся следующие трансформации: 1) значения ЦМ карты каждого аллеля возводятся в квадрат (карты распространения гомозиготных генотипов); 2) полученные карты суммируются в пределах локуса (карта гомозиготности локуса); 3) дополнение этой карты до 1 дает искомую карту ожидаемой гетерозиготности.
В результате такой многоступенчатой трансформации создаются карты пространственного распределения гетерозиготности для каждого локуса. Карта средней гетерозиготности по совокупности локусов получается с помощью двух последовательных трансформаций: 1) сложение карт гетерозиготности всех локусов; 2) деление суммарной карты на число локусов.
С помощью приведённых алгоритмов статистической трансформации можно получить геногеографические карты гетерозиготности любого генного локуса, карты средней гетерозиготности нескольких локусов или же генофонда в целом.
Важно подчеркнуть, что для систем сцепленных генов карты интегральной гетерозиготности могут отличаться от карт средней гетерозиготности не только по величине показателей, но и по их географии. Отметим, что обоснование преимуществ трансформации карт относится не только к гетерозиготам, но и в целом к картографированию генотипов.
§ 6. Карты корреляций и трендов
Карты корреляций и трендов относятся к следующему шагу по сложности преобразования — это операции, проводимые не с отдельным узлом карты, а с заданной группой узлов. Такие операции проводятся благодаря разработанной нами технике «плывущего окна». Эта техника позволяет решать многие сложные задачи анализа генофонда. Одним из многих, но наиболее часто используемым приложением метода «плывущего окна» является задача выявления трендов. Однако тренды можно выявлять и иным методом — моделирования с учетом всех узлов карты. Это уже третий шаг по сложности — операции со всеми узлами карты сразу! В этом разделе на примере карт трендов мы рассмотрим оба типа операций — и с группой узлов, и со всеми узлами карты. Так их будет проще сравнить.
ЧТО ТАКОЕ ТРЕНДЫ?
Геногеографическая карта отдельного гена может дать ответы на конкретные вопросы о распределении частоты гена по ареалу популяции, может служить для прогнозирования значений признака в генетически неизученных областях ареала, для планирования полевых исследований или же для решения других, не менее важных, но все же частных вопросов. Однако основное назначение геногеографической карты — выявление пространственных закономерностей. Такими закономерностями (трендами) могут быть и клинальная изменчивость (градиент значений признака), пронизывающая весь ареал генофонда; и некое ядро — центр влияния с расходящимися кругами убывающей интенсивности; и взаимопроникновение влияний нескольких центров; и пространственная динамика колебательного типа; или иные более сложные и комбинированные пространственные закономерности.
Они могут быть различны для разных признаков в одном и том же регионе. Но отличительными чертами пространственных закономерностей являются их объективность и устойчивость во времени и пространстве. Масштаб пространства и масштаб времени в общем случае соизмеримы. Чем крупнее ранг историко-географического региона, охваченного геногеографическим анализом, тем более глубокие и древние закономерности мы надеемся выявить. Однако карта доносит их до нас с наложившимися влияниями и воздействиями более поздних эпох.
Если представить географическую карту современного генофонда как совокупность наложенных друг на друга карт различных генетических эпох, тогда перед исследователем встает задача вычленения серии таких карт из суммарной, построенной на данных о ныне наблюдаемой генетической изменчивости. Наиболее простые способы решения этой задачи — для отдельной геногеографической карты — возможны в терминах вычленения трендовых (фоновых) поверхностей геногеографических карт, представленных в данном разделе.
КАК ОБНАРУЖИТЬ ТРЕНД?
Картографическое распределение (Z) признаков любой природы — экономических, геологических, демографических, биологических — можно рассматривать как картографическое воплощение совместного действия совокупности факторов. Одна их группа представляет основные, наиболее значимые и устойчивые факторы, обозначаемые как фоновые (ZF), другая группа включает остаточные (ZO), второстепенные воздействия. Они накладываются таким образом, что Z=ZF+ZG [Берлянт, 1986].
Если такую операцию подразделения Z на ZF и ZO провести для каждого узла сетки ЦМ, то в результате получим две ЦМ новых карт: 1) фоновую ЦМ (ZF), отражающую географию воздействия ведущих и длительно действующих факторов, сформировавших генетический рельеф; 2) остаточную ЦМ (ZG), отражающую эфемерные явления. Эта ЦМ дополняет фоновую поверхность до исходной (Z0=Z-ZF) и потому содержит как положительные, так и отрицательные значения.
Меняя параметры алгоритма, можно для одной и той же исходной карты получить серию фоновых поверхностей (ZF1, ZF2, ZF3… ZFN), отражающих различные комплексы ведущих факторов. Построенная серия фоновых карт и будет представлять собою решение поставленной задачи: вычленения из суммарной карты (ныне наблюдаемой генетической изменчивости) её составляющих, отражающих разные эпохи и события. Каждая из карт этой серии несет информацию о тренде — основных пространственных закономерностях — определенного «стратиграфического пласта» генофонда. Глубина залегания этого пласта, степень его древности задаются параметрами построения фоновой картографической поверхности.
Мы приведем два наиболее универсальных способа получения фоновых карт — с помощью осреднения в «плывущем окне» (операции с группой узлов) и с помощью аппроксимирующей функции (операции со всеми узлами карты).
ТРЕНД В «ПЛЫВУЩЕМ ОКНЕ»
Вариантов получения фоновой карты методом осреднения немало — оно может проводиться вдоль определённых направлений или линий (например, параллелей или меридианов, рек или границ акваторий) или же для нескольких точек по границам ячейки определённых размеров (обычно по вершинам шестиугольника). Такие методы традиционны в картографии [Берлянт, 1969, 1986; Салищев, 1990]. Имея возможность получить компьютерное решение этой задачи, мы сочли более информативным осреднение не по линиям и точкам, а по площадям равномерно перемещающегося окна [Балановская, Нурбаев, 1995].
Разработанный метод получения трендовой поверхности с помощью осреднения в «плывущем окне» сводится к следующей процедуре. С помощью выбранного алгоритма вычисляется среднее значение для всех узлов ЦМ, находящихся на площади прямоугольника заданного размера. Результат осреднения присваивается центральной точке (узлу сетки ЦМ) прямоугольника. Затем прямоугольник перемещается на один шаг, равный расстоянию между узлами ЦМ, его центром становится соседний узел сетки ЦМ, и такая же процедура осреднения повторяется для него. После того, как для каждого узла сетки ЦМ повторена эта процедура и каждому узлу присвоены значения, средние по площади заданного прямоугольника, построение цифровой модели фоновой поверхности ЦМ (ZF) окончено.
Остаточная поверхность вычисляется как разность между исходной и фоновой картами: ЦМ (ZO)=UM (Z) — ЦМ (ZF).
«ПЛЫВУЩЕЕ ОКНО» ПОСТОЯННОГО РАЗМЕРА
Наиболее очевидным вариантом метода плывущего окна является осреднение в окне с размером, постоянным по всему ареалу генофонда [Балановская, Нурбаев, 1995]. В этом случае царит полное равноправие — все узлы фоновой карты в любой части ареала получают информацию от одинакового числа узлов исходной карты и в одинаковой мере стирают флуктуации, наслоившиеся на трендовую поверхность.
Основная задача, стоящая здесь перед исследователем, — подобрать такой размер окна, который отвечал бы цели работы: необходимости сохранения локальных особенностей процесса, сформировавшего генетический рельеф, или же воспроизведения лишь самых общих его тенденций. С увеличением размера окна — меняя масштаб осреднения — мы вскрываем всё более глубокие подстилающие пласты «генетической коры» и более устойчивые тенденции генетического процесса. Однако платой за это является потеря фоновой картой информации обо всех локальных особенностях генофонда.
Наиболее универсальным является размер окна, соответствующий среднему ареалу популяции при избранном масштабе исследования. Например, если нас интересуют закономерности, наиболее близкие к современности, или же мы исследуем внутреннюю структуру генофонда отдельного этноса, то целесообразно избрать окно осреднения, равное среднему ареалу элементарной популяции. При изучении генофондов крупных многонациональных регионов, при исследовании общих закономерностей их формирования, как бы снимающих отдельные события истории этноса, целесообразно использовать окно, равное среднему этническому ареалу. При изучении ведущих, глобальных закономерностей, сформировавших основные, подстилающие слои генофонда, можно использовать окна много больших размеров, соответствующих тем или иным надэтническим уровням популяционной иерархии.
В работе [Балановская, Нурбаев, 1995] для иллюстрации разных масштабов осреднения приведено исходное распределение частоты гена НР*1 в Северной Евразии и три фоновые поверхности, полученные из исходной с помощью плывущего окна постоянного — для узлов каждой карты — размера. Окна осреднения соответствует площадям: «а» — 300x300 км; «б» — 900x900 км; «в» — 1500x1500 км. Различия между картами по степени обобщения генетической поверхности таковы. Карта с окном «а» в целом повторяет исходную карту, стирая «случайные черты» и облегчая её прочтение. При увеличении окна осреднения до «б» уже проявляются более глубоко лежащие закономерности. В основе генетического рельефа этой карты выявляется гряда высоких значений, широтно простирающаяся через весь субконтинент от запада до северо-востока и связанная с тремя пиками значений: северо-восточным; западносибирским; европейским. Как на север, так и на юг от гряды идет постепенное понижение генетического рельефа. В целом карта демонстрирует двухвекторный широтный тренд значений признака. Такое своеобразное широтное направление изолиний, возможно, отражает особенности разнонаправленного взаимодействия этого гена с факторами природной среды в северных и южных широтах.
При дальнейшем увеличении размеров плывущего окна — до «в» — сквозь широтную изменчивость начинает проявляться наиболее глубинная тенденция: долготный градиент
значений частоты гена в направлении «запад — восток». Эта пространственная закономерность — долготного тренда — является ведущей при формировании генофонда Северной Евразии (с палеолитической эпохи). Она может рассматриваться как базисная при формировании и генетического рельефа гена НР*1. По аналогии с геологическими процессами её можно представить как направление наклона основной «глубинной» геологической платформы, на которую накладывается воздействие вторичных факторов, формирующих рельеф местности.
Выделить основные и вторичные факторы и тем более локализовать их географически, глядя на исходную карту, практически невозможно. Однако после их выявления методами фоновых карт, прочтение исходной карты приобретает большую научную глубину и объективность, позволяет обсуждать пространственную изменчивость признака в терминах закономерностей, тенденций, локальных особенностей и аномалий, позволяет подойти ближе к пониманию факторов, сформировавших структуру генетического рельефа.
Для большой наглядности для карт любых признаков обычно приводятся карты трендов, полученные при небольшом окне сглаживания случайных колебаний в частоте признака. В этом случае легенды самих трендовых карт обычно несут информацию о сглаженном рельефе, характеристики исходного генетического рельефа можно найти в таблицах.
«ПЛЫВУЩЕЕ ОКНО» МЕНЯЮЩЕГОСЯ РАЗМЕРА
Однако способ осреднения в постоянном окне имеет свои ограничения. Он эффективен при соблюдении двух условий — во-первых, равномерной изученности признака во всем картографируемом пространстве и, во-вторых, малой изменчивости размеров популяционных ареалов. Если нарушено хотя бы одно из этих условий, то осреднение в разных частях картографируемого пространства осуществляется как бы на разных уровнях обобщения.
Например, при использовании окна с размером, равным среднему этническому ареалу народов Северной Евразии, резкие различия в размерах этнических ареалов народов Сибири и народов Кавказа приведут к тому, что генетический рельеф Кавказа окажется в значительной мере стёртым. Осреднение для популяций Кавказа будет происходить не на уровне этносов, а на уровне лингвистических семей или даже более крупном, поскольку окно осреднения намного превышает этнический ареал народов Кавказа. В Сибири то же самое окно осреднения окажется меньше этнического ареала и недостаточным для устранения флуктуаций, возникающих в результате дрейфа генов и локальных миграций, поскольку осреднение будет происходить на субэтническом уровне организации. Подобная неравномерность осреднения приводит к неоднородности фоновой карты, поскольку в разных её частях оказываются отражёнными пласты различной древности, закономерности разных уровней обобщения.
Для устранения этих искажений нами специально разработан метод осреднения в «меняющемся окне» («Changing Window»): плывущее окно осреднения в разных частях картографируемого пространства принимает разные размеры в зависимости или от изученности признака, или от размера ареала популяции, или иных заданных параметров [Балановская, Нурбаев, 1995].
Чаще всего используется окно осреднения, меняющееся по картографируемому пространству в зависимости от числа опорных точек карты (популяций с исходной информацией), попадающих в окно осреднения. При построении фоновой поверхности распределения алгоритм осреднения учитывает следующие параметры [Балановская, Нурбаев, 1995]:
WMIN — минимальный размер окна, с заранее заданным наименьшим числом узлов сетки карты.
WMAX — максимальный размер окна. Размер окна (измеряемый в числе узлов сетки карты) не увеличивается больше WMAX, даже если в него не попало ни одной опорной точки.
KOPT — заданное оптимальное число опорных точек, служащее пределом для увеличения окна.
fK — функция зависимости веса значений признака от числа опорных точек в каждом из квадрантов окна (для этого окно подразделяется на четыре равных части — 4 квадранта). Эта функция определяет степень участия узлов сетки квадранта (в зависимости от их числа) при расчёте средней величины.
Процедура осреднения производится в следующем порядке. Начиная с минимального размера WMIN, окно осреднения увеличивается до тех пор, пока в него не попадает число опорных точек равное KOPT. Если окно увеличилось до WMAX, то даже если число опорных точек, попавших в окно, ещё не достигло KOPT, окно перестает увеличиваться и проводится расчёт.
Затем проверяется, сколько опорных точек находится в каждом из квадрантов окна — чем больше точек в квадранте, тем больший вес придаётся значениям узлов сетки этого квадранта (в соответствии с функцией fK) при расчёте среднего значения, которое присваивается центральной точке окна. Благодаря такой процедуре осреднения (повторенной для каждого узла сетки ЦМ), окно осреднения пропорционально популяционным ареалам и изученности картографируемого гена в различных областях картографируемого пространства. Благодаря различному весу квадрантов окна значения средних формируются по наиболее точным (наиболее обеспеченным опорными точками) областям окна.
В эффективности такого алгоритма легко убедиться при сравнении карты, полученной на его основе, с картами, полученными при плывущем окне постоянного размера. Это сравнение удобно тем, что оптимальное окно ожидается равным «б», WMIN соответствует фоновой поверхности с окном «а», WMAX соответствует фоновой поверхности с окном «в». В таблице 3.2. приведены статистические параметры сравниваемых карт: исходной карты распределения гена НР*1, трех карт с постоянным окном и карты с меняющимся окном (далее называемой CW — сокращенно от «Changing Window»).
Как и следовало ожидать, при увеличении размера окна осреднения экстремумы (MAX, MIN) сближаются и размах изменчивости R (R=MAX-MIN) падает (Ra=0.39, RB=0.24). При этом значение средней остаётся практически неизменным, варьируя около 0.33 (табл. 3.2). Наибольшие изменения наблюдаются в показателе межпопуляционной изменчивости GST: при увеличении окна от «а» до «в» его величина падает втрое (GSTa=0.018, GSTb=0.006). Наблюдаемое изменение GST соответствует переходу в анализе межпопуляционной изменчивости от уровня локальных популяций к уровню лингвистических семей.
Таблица 3.2. Приложения
Статистические показатели исходной и трендовых карт при различных параметрах алгоритма осреднения(на примере распределения гена НР*1)
Практически по всем статистическим параметрам (табл. 3.2.) карты с CW наиболее близки к карте с постоянным окном осреднения «б», причём особенно важна близость показателей GST (GST(CW)=0.011, GSTб=0.010). Однако при практически одинаковом размахе изменчивости (RCW=Rб=0.33) минимальные значения частоты гена НР*1 на карте с меняющимся окном приближаются к значениям карты с окном «в», а максимальные — к показателям карты с окном «а». Это связано с различной обеспеченностью областей экстремумов исходными данными: области минимальных значений оказались слабо обеспечены исходными данными и потому менее надёжны и более интенсивно осредняются, чем области максимальных значений, надёжно обеспеченные для данного гена опорными данными и потому сохраняющиеся при методе меняющегося окна.
Генетический рельеф карты с CW в целом также наиболее близок к карте с постоянным окном осреднения «б». Однако карта с CW географически и исторически более точно воспроизводит границы ареалов тех или иных частот, поскольку ориентирована на фактический размер популяционного ареала и генетическую изученность народов. Карта CW отражает масштаб осреднения, связанный не с аморфным физическим пространством, а с историческим пространством, освоенным этносом.
Таким образом, метод «Changing Window» — осреднения в плывущем окне, размер которого меняется в зависимости от реального масштаба популяционного ареала и обеспеченности исходной информацией — позволяет даже в чрезвычайно гетерогенном регионе проводить осреднение во всех его частях на заданном уровне обобщения. Благодаря этому методу географическое пространство, вмещающее генофонд, перестает быть аморфным, однородным и нейтральным по отношению к структуре генофонда: при ориентации на реальный размер популяционного ареала в неявном виде учитываются природные и социальные барьеры на пути распространения генов. Возможность гибко изменять все четыре параметра окна осреднения (WMIN, WMAX, KOPT’ fK) позволяет создавать серии картографических версий заданного уровня обобщения и тем самым как бы объемно моделировать генетический рельеф тех или иных исторических эпох.
ВЫЯВЛЕНИЕ ТРЕНДА АППРОКСИМИРУЮЩЕЙ ФУНКЦИЕЙ
Однако методы осреднения в окне — постоянного или меняющегося размера — «носят эмпирический характер и содержат элементы субъективизма» [Берлянт, 1986, с. 169]. Альтернативными считаются методы аппроксимации той или иной функцией, поскольку их модели опираются на строгий математический аппарат. При использовании аппроксимирующих функций фоновая и остаточная составляющие выделяются строго формально: аппроксимирующая функция описывает фоновую поверхность карты, отражающую искомые закономерности, а неучтенная часть соответствует остаточной компоненте [Берлянт, 1986]:
Z=f(u,v) + Eps=ZF + ZO; f(u, v)=ZF; Eps=ZO.
Поставленной задаче — разделения фоновой и остаточной поверхностей — с математической точки зрения полностью соответствует математический аппарат разложения в ряды, в частности, ортогональные многочлены (полиномы) Чебышева. При их использовании фоновая поверхность представляет собой графическое изображение аппроксимирующего многочлена, сумма квадратов отклонений которого от фактической поверхности минимальна [Берлянт, 1986]. Но у математических моделей есть общий недостаток — простоте и четкости математического аппарата не всегда соответствует простота и ясность интерпретации.
В картографии, геологии, физике для аппроксимации принято использовать 1-й, 2-й и 3-й порядки ортогональных многочленов Чебышева, содержательная интерпретация которых наиболее очевидна. Согласно [Берлянт, 1986], каждой из этих моделей соответствуют определённые классы явлений, для которых они оптимальны. Аппроксимация многочленом 1-го порядка (ZF1) моделирует моноклинальные поверхности, выявляющие направление сквозного градиента частот в распределении картографируемого признака и пронизывающие в едином направлении весь картографируемый ареал. Многочлены
2-го порядка (ZF2) служат адекватной моделью для явлений, распространяющихся из единого центра с уменьшением градиента плотности признака во все стороны по мере удаления от центра. Многочленом 3-го порядка (ZF3) наиболее оптимально аппроксимируется наложение двух различно ориентированных факторов или поверхности интерференции, создаваемой двумя центрами.
Фоновые поверхности, полученные из исходной поверхности рассмотренного выше распределения гена НР*1 с помощью ортогональных многочленов Чебышева, дали следующие результаты (эти же закономерности характерны практически для всех геногеографических карт) [Балановская, Нурбаев, 1995]. Аппроксимация многочленом:
1) 1-го порядка-моноклинальная изменчивость — позволяет определить направление общего наклона картографической поверхности данного гена. Эту карту можно интерпретировать как основной тренд гена, преобладающее направление общерегионального градиента частот.
2) 2-го порядка указывает расположение гипотетического центра распространения гена согласно модели эволюции из единого центра. Пик прогнозируемых значений значительно превосходит реально наблюдаемые пределы вариации аллеля.
3) 3-го порядка, т. е. в предположении наложения влияния двух центров, практически не отличается от предыдущей: ядро лишь несколько смещается в том или ином направлении.
4) более высоких порядков в географии, как правило, не используется. Объясняется это тем, что «содержательная интерпретация фоновых поверхностей, описываемых уравнениями четвертой и более высоких степеней, встречает затруднения» [Берлянт, 1986, с. 173]. Видимо, это справедливо по отношению к несложным поверхностям, которые удовлетворительно описываются уже многочленом 2-го порядка [Берлянт, 1986]. Однако для геногеографических карт со сложным рельефом, сформировавшимся под действием многих, часто разнонаправленных и локальных факторов, использование более высоких степеней не только оправдано, но и необходимо. Компьютеризация процедур расчёта, усложняющихся пропорционально степени многочлена, позволяет построить аппроксимирующие поверхности любого порядка (необходимо лишь оборудование достаточно высокого класса, иначе построение карты высокой степени многочлена может занять несколько суток непрерывной работы компьютера).
В работе [Балановская, Нурбаев, 1995] приведены карты динамики прогнозируемого рельефа с ростом степени многочлена. Картина как бы постепенно уточняется, начинает учитывать локальные центры в изменчивости гена и от абстрактного указания на расположение источника распространения генов переходит к моделированию реального процесса его распространения. Поскольку величина порядка многочлена на единицу больше числа локальных экстремумов ряда, то можно предложить математически строгий критерий определения оптимальной степени многочлена. Его можно сформулировать следующим образом: степень оптимальной аппроксимирующей поверхности ортогонального многочлена Чебышева должна быть на единицу больше наблюдаемого числа локальных экстремумов исходной (аппроксимируемой) картографической поверхности. Многие особенности результирующей карты восстанавливают при этом реалии исходной карты распространения гена. Однако при этом карта моделирует потоки распространения гена из центров, независимых от внешних воздействий.
Таким образом, метод аппроксимации многочленами Чебышева позволяет подразделить фактическую поверхность и выделить её составляющие, различающиеся по происхождению. Первая составляющая (аппроксимируемая 1-й степенью многочлена и по определению не учитывающая локальные экстремумы) — это общий сквозной тренд моноклинальной изменчивости, пронизывающий весь ареал и объединяющий внешние воздействия на генофонд — как природной, так и социальной среды. Вторая составляющая — это реконструкция центров, путей и направлений собственного саморазвития, независимого от внешнего мира; причём при высоких степенях многочлена эта составляющая реконструирует не только первичные, но и вторичные центры независимого развития.
ОСТАТОЧНАЯ ПОВЕРХНОСТЬ
Интересные результаты может дать и исследование остаточных поверхностей. Если остаточная поверхность отражает лишь случайные воздействия на генофонд, она мозаична и, как правило, малоинтересна. Однако она может зафиксировать и локальные аномалии в воздействии общих факторов, которые порой представляют не меньший интерес, чем сами закономерности. Сопоставляя фоновую и остаточную поверхности, можно обнаруживать области, отклоняющиеся от выявляемого тренда, и анализировать причины возникновения и важность тех или иных локальных особенностей в распределении того или иного гена. При обобщении остаточных поверхностей большой совокупности генов исчезает мозаичность случайных всплесков карты и появляется уникальная возможность обнаружить области аномалий в пространственной динамике генофонда в целом, указывающих на особенности его эволюции.
Таким образом, технология вычленения трендов позволяет на основе исходной геногеографической карты создавать серии трендовых (фоновых) карт и выявлять закономерности в пространственном распределении картографированного признака.
КОРРЕЛЯЦИОННЫЕ КАРТЫ
При исследовании пространственной изменчивости генофонда одной из важнейших задач является анализ связей между различными генами, между общими характеристиками генофонда (гетерозиготность, главные компоненты, дифференциация и т. д.), между параметрами генофонда и параметрами среды, культуры и т. д. Картографические технологии геногеографии создают целый спектр возможностей для количественного анализа пространственных связей.
Одним из инструментов является корреляционно-регрессионный анализ. В методы статистической трансформации карт входят алгоритмы расчёта различных показателей связей между геногеографическими картами: парной, ранговой, частной и множественной корреляции, коэффициентов регрессии. Для оценки связи между признаками рассчитываются корреляции между цифровыми моделями (ЦМ) карт соответствующих признаков. Чаще всего в геногеографии используются два показателя связи — коэффициент ранговой корреляции Спирмена и коэффициент частной корреляции [Айвазян и др., 1989]. Оба этих показателя, в отличие от наиболее известного коэффициента парной корреляции Пирсона, используются в тех случаях, когда необходимо определить взаимозависимость между рядами, распределенными не по нормальному закону (распределение частот аллелей в большинстве случаев отличается от нормального).
Для многих разделов, например, экологической генетики, чрезвычайно важно получить не общую на весь ареал оценку связи, а карту, которая позволяет видеть географию связи. Такая карта, показывающая тесноту связи на разных территориях, является уникальным инструментом для оценки пространственной изменчивости самих связей [Балановская, Нурбаев, 1999].
Традиционно исследователь использует для анализа единственный коэффициент корреляции на весь ареал. Такие «валовые» коэффициенты корреляции позволяют оценить степень связи в анализируемой системе в целом (например, степень связи мёж-ду частотой гена и климатическими факторами среды, широтой и долготой местности [Spitsyn et al., 1998; Кравчук и др., 1998]). Однако гетерогенность среды и генофонда приводят к тому, что такая связь может различаться в различных частях ареала, причём не только по величине, но даже и по знаку. Поэтому наиболее полный и корректный анализ можно провести при картографировании самих корреляций, когда карта демонстрирует степень связи между анализируемыми параметрами в различных частях ареала.
Использование технологии «плывущего окна» позволяет создавать принципиально новые карты связей и зависимостей. В общем виде подход реализован нами следующим образом. На одной картографической основе строятся компьютерные интерполяционные карты всех анализируемых признаков (например, карта одного гена и карта средового параметра). Пункты изучения признаков не обязательно должны совпадать в пространстве, поскольку при переходе от исходных значений к карте интерполяция будет проведена на узлы густой равномерной сети. А уже сами картографические основы, сами сети карт должны быть идентичны. Далее используется процедура «плывущего окна»: в пределах части ареала («окна» заданного размера — постоянного или меняющегося) рассчитывается коэффициент корреляции (непараметрический), значение которого заносится в центральный узел «окна». Далее окно скользит на один узел, и вся процедура повторяется до тех пор, пока в каждый узел карты не будет занесено соответствующее ему значение корреляции. В результате этой процедуры получаем карту корреляций, демонстрирующую их гетерогенность в пространстве ареала. Размер окна (выбираемый в зависимости от задачи и масштаба исследований) может быть постоянным в пространстве карты, либо меняющимся, например, в зависимости от изученности частей ареала. Расчёт можно провести с учетом надёжности картографирования: части ареала с низкой достоверностью картографического прогноза не включаются в анализ корреляций.
Карта демонстрирует интенсивность связи в каждой точке пространства и позволяет анализировать пространственную изменчивость связей. Приведём распространённый пример. Коэффициент корреляции между картами двух признаков близок к 0. из чего делается вывод об отсутствии связи между признаками. Карта корреляций обнаруживает ошибочность этого вывода: половина ареала занята значениями корреляций r≈-1, другая половина — значениями r≈+1, и лишь узкий коридор между ними — промежуточными значениями r≈0. То есть карта обнаруживает не только высокую связь между признаками, но и её пространственную изменчивость: наличие двух областей с противоположным направлением связи, что позволяет искать факторы, определяющие взаимодействие признаков, формулировать гипотезы, которые можно проверять с помощью дальнейшего картографо-статистического анализа.
Таким образом, карты корреляций позволяют корректно анализировать связь как между параметрами среды и структурой популяции, так и между любыми другими признаками, гетерогенными в пространстве.
Корреляционные карты подразделяются на два основных типа: 1) картографирование связей между геногеографическими картами; 2) картографирование корреляций между картой частоты признака и географическими координатами местности — широтой и долготой.
В целом, в результате картографо-статистического корреляционного анализа создаются новые геногеографические карты закономерностей и связей, которые являются чрезвычайно чувствительным инструментом с большой разрешающей силой [Балановская, Нурбаев, 1999].
§ 7. «Синтетические» карты генетических расстояний
Карты изменчивости не одного признака, а сразу всей совокупности признаков, наиболее информативны при изучении закономерностей генофонда. Такие карты называют «синтетическими» или обобщёнными, поскольку они обобщают (синтезируют воедино) изменчивость многих отдельных признаков. Наиболее известны «синтетические» карты главных компонент — они служат основным инструментом изучения генофонда для коллектива Л. Л. Кавалли-Сфорца [Cavalli-Sforza et al., 1994]. В нашей картографической технологии реализован не один; а несколько подходов к созданию «синтетических» карт — не только главных компонент, но и карт общего генетического разнообразия, карт межпопуляционных генетических различий, карт гетерозиготности, а также карт генетических расстояний.
Наш опыт показывает, что наиболее объективным, мощным и вместе с тем наглядным вариантом «синтетических» карт являются карты генетических расстояний. Они позволяют формулировать и проверять гипотезы сходства и различий популяций. Ведь мы можем построить для одного и того же генофонда целую серию карт расстояний от самых разных популяций, как реальных (например, того или иного района, выделяющегося своеобразием, если мы хотим обнаружить генетические близкие ему популяции), так и обобщённых (начиная от обобщённых характеристик всего генофонда до характеристик самых разных его частей). В совокупности, вся серия карт генетических расстояний создаёт удивительно яркий и объёмный образ генофонда. При этом мы не являемся только созерцателями «портрета», а активно используем инструмент генетических расстояний, чтобы задавать генофонду все новые вопросы, получая всё более полные ответы.
ЧТО ТАКОЕ «КАРТА ГЕНЕТИЧЕСКИХ РАССТОЯНИИ»?
Это карта, рассчитанная по совокупности множества карт разных генов. В каждом узле такой карты находятся не частота гена, а величина средней генетической удаленности данного узла сетки от той популяции, которая нас интересовала при создании данной карты генетических расстояний. Для этого рассчитываются многомерные расстояния (показатели генетических различий) от каждой популяции на изучаемой территории до генетических характеристик популяции, интересующей исследователя (так называемой «реперной» популяции). Соответственно, на карте каждая популяция присущим ей значением расстояний говорит о себе, насколько она генетически сходна с реперной популяцией. Например, если за реперную точку отсчёта взять обобщённую русскую популяцию, придав ей средние — по всем русским популяциям — значения частот признаков, то карта генетических расстояний покажет, насколько все русские популяции сходны или же отличны от среднеэтнических характеристик. Затем мы можем задать вопрос, а какие русские популяции и насколько близки к татарскому этносу? И тогда для тех же русских популяций мы рассчитаем их генетические расстояния до татар, а карта наглядно даст ответ на поставленный вопрос. Если в следующие карты мы включим не только русские, но и соседние популяции Восточной Европы, то значения расстояний будут показаны и для популяций иных народов. Тогда по карте можно сразу же увидеть, какие из них генетически наиболее близки к русскому или к татарскому генофонду.
АЛГОРИТМЫ
Для построения карт генетических расстояний наряду с традиционной и общеизвестной оценкой генетических расстояний по М. Nei [1975], нами используется алгоритм расчёта угловых расстояний © [Cavalli-Sforza, Edwards, 1967], где для локуса / с А аллелями:
θl=across∑√qnaqma, где qa — частота a-того аллеля, п и т — популяции.
Эта функция привлекательна тем, что её квадрат пропорционален времени, потребовавшемуся на формирование генетического расстояния. Картографирование квадратов расстояний, таким образом, связывает географию генофонда со временем его развития. Для совокупности L локусов:
θ2=1/k∑θ2l; k=∑(Al-1).
Этот несложный алгоритм позволяет создать карту с принципиально новым генетическим рельефом, обнаруживающим в терминах генетических расстояний близость либо отдалённость любых районов от заданных (реперных) значений: близости соответствуют низины, отдалённости — поднятия генетического рельефа, в какой бы части ареала они ни встречались. Для создания такой карты достаточно для каждого из аллелей локуса вместо qam использовать реперную (например, средне региональную) частоту аллеля qa и провести для каждого узла сетки карты расчёт расстояний от локального значения признака в узле до средне-регионального: а I=
θ2l=across2∑√qanqa,
где qa — константа, соответствующая заданному средне региональному значению частоты гена а; qan — значение частоты гена а в n-ном узле (с координатами i,j) сетки карты, где n принимает значения от 1 до N (общего числа узлов карты).
Помещая каждое из полученных значений θ2 в соответствующий n-ный узел новой карты, мы картографируем генетические расстояния и получаем искомую карту генетической удаленности каждой из точек карты от реперных частот. Усреднением карт по всем анализируемым генам получаются средние карты генетических расстояний, которые и используются как окончательный результат анализа.
Располагая достаточно большой выборкой генов и популяций, можно с помощью описанного инструментария — картографирования генетических расстояний — исследовать историю генофонда в целом, обнаруживать генетические следы исторических событий [Рычков, Батсуурь, 1987; Рычков, Балановская, 1988; Балановская и др., 1997, 1998; Кравчук и др., 1998, Почешхова, 1998]. Принципиально важно, что, создавая серии карт генетических расстояний, мы можем последовательно формулировать и проверять гипотезы о сходстве и генетических различиях между любыми группами народонаселения. Это позволяет перейти от картографического моделирования к картографическому эксперименту и открывает чрезвычайно широкие перспективы для геногеографии. В целом, инструментарий генетических расстояний является много более мощным и перспективным, чем методы главных компонент, автокорреляций, «wombling»-анализа и другие, используемые ныне мировым научным сообществом для описания генофондов.
§ 8. «Синтетические» карты главных компонент
Карты главных компонент представлять не надо, как и их аналог для признаков с внутригрупповой корреляцией — канонические переменные. Эти методы уже давно стали традиционными как в антропологии, так и в генетике.
СУТЬ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ
Метод главных компонент относится к группе методов снижения размерности, наряду с многомерным шкалированием, факторным анализом, анализом канонических переменных, методом экстремальной группировки признаков и другими [Айвазян и др., 1989]. Снижение размерности представляет собой переход от исходного набора многих показателей к небольшому числу вспомогательных переменных, на основании которых можно достаточно точно воспроизвести свойства анализируемого массива данных [Айвазян и др., 1989].
Первой главной компонентой исследуемой системы показателей называется такая нормированно-центрированная линейная комбинация этих показателей, которая среди всех прочих нормированно-центрированных линейных комбинаций обладает наибольшей дисперсией. Любой k-той главной компонентой называется такая нормированно-центрированная линейная комбинация, которая некоррелирована с предыдущими главными компонентами и среди всех прочих нормированно-центрированных и некоррелированных с предыдущими линейными комбинациями обладает наибольшей дисперсией [Айвазян и др., 1989].
Главные компоненты обладают следующими основными свойствами [Айвазян и др., 1989; Дерябин, 2001]:
1. Первые главные компоненты характеризуются наибольшей информативностью, которая определяется величиной их дисперсии (долей от общей суммарной дисперсии всех исходных признаков).
2. Все главные компоненты нескоррелированы и поэтому представляют собой независимые признаки.
Таким образом, анализ главных компонент представляет собой процедуру для упрощения многомерных данных с минимальной потерей информации [Cavalli-Sforza et al., 1994].
КАРТОГРАФИРОВАНИЕ-ГЛАВНЫХ КОМПОНЕНТ
Геногеография позволяет не только провести стандартную процедуру анализа главных компонент, но и увидеть их распределение в географическом пространстве. Каждая из карт главных компонент отражает динамику новых обобщённых признаков генофонда, имеет свой генетический ландшафт и выдвигает на первый план особый исторический сценарий [Cavalli-Sforza, Piazza, 1993] развития генофонда. Карты главных компонент уже не раз публиковались и демонстрировались для самых разных генофондов — Восточной Европы, Европы, Евразии, мира [Menozzi et al., 1978; Ammerman, Cavalli-Sforza, 1984; Rendine et al., 1986; Рычков, Балановская 1992; Cavalli-Sforza et al., 1995; Балановская, Нурбаев, 1997; Рычков и др., 1997, 1998].
Основным стимулом для развития всей компьютерной геногеографии (как для зарубежной, так и для отечественной геногеографических школ) явилось именно стремление построить географические карты главных компонент. По мнению Л. Д. Кавалли-Сфорца [Cavalli-Sforza et al., 1994], построение карт главных компонент может облегчить визуализацию древних миграций, а также иные факторы, однотипно влияющие одновременно на целый ряд генов. Впервые карты главных компонент были созданы коллективом под руководством L. L. Cavalli-Sforza [Menozzi et al., 1978], причём для этого коллектива карты главных компонент («синтетические» карты) являются основным методом картографического обобщения [Menozzi et al., 1978; Piazza et al., 1981 a,b; Ammerman, Cavalli-Sforza, 1984; Cavalli-Sforza et al., 1995]. Независимо собственная технология картографирования главных компонент разрабатывалась одним из авторов (Е. В. Балановской) в сотрудничестве с Ю. Г. Рычковым, С. М. Кошелем, Д. Б. Патрикеевым, Т. П. Папковой, С. Д. Нурбаевым. Последняя версия включает нормировку исходных данных, нормировку дисперсии, расчёт по корреляционной матрице и оптимизацию решения (упорядочивание собственных векторов и собственных чисел для обеспечения инвариантности решения). Основное отличие наших карт от создаваемых коллективом L. L. Cavalli-Sforza — в том, что наши карты обладают большей точностью и разработанностью деталей рельефа главных компонент (это связано с особенностями построения исходных карт генов). Однако по самой сути подхода и те, и другие карты главных компонент чрезвычайно сходны и могут сопоставляться без дополнительной коррекции.
Расчёт главных компонент осуществляется следующим образом. По значениям признаков (частот аллелей) в популяциях рассчитывается матрица корреляций всех аллелей друг с другом. Значения главных компонент для данной популяции вычисляются по значениям исходных признаков, умноженных на соответствующие коэффициенты. В качестве коэффициентов выступают собственные векторы ковариационной матрицы отдельных признаков, при условии некоррелированности получаемых на их основе главных компонент. Поэтому первым шагом является расчёт коэффициентов ковариации, затем производится решение соответствующего уравнения, корнями которого являются собственные вектора ковариационной матрицы, и, наконец, перемножением этих коэффициентов и значений частот аллелей находятся величины главных компонент.
Этот алгоритм расчёта главных компонент заложен практически во всех статистических программных пакетах. Поскольку в геногеографии необходимо провести расчёт карт главных компонент не по исходным данным, а по картам отдельных признаков, то для этого созданы оригинальные программы картографического пакета GGMAG. Так как цифровая модель карты представляет собой числовую матрицу со значениями частоты аллеля в каждом узле, то задача расчёта главных компонент сводится к получению значений главных компонент в каждом узле цифровой модели. При расчёте с использованием картографического пакета последовательность значений во всех узлах ЦМ выступает в том же качестве, как последовательность значений в одной строке таблицы данных при расчёте в обычном статистическом пакете. По данным во всех узлах ЦМ рассчитывается матрица корреляций всех ЦМ друг с другом. По корреляционной матрице вычисляются значения главных компонент для каждого из аналогов популяций (узлов равномерной сетки карты). Полученные значения главных компонент вновь присваиваются каждому узлу ЦМ. В результате создается ЦМ карт 1 главной компоненты, 2, 3… N главной компоненты, где N — число исходных карт отдельных признаков [Cavalli-Sforza et al., 1994; Балановская, Нурбаев, 1997]. Число результирующих карт главных компонент равняется числу исходных признаков, однако обычно рассматриваются карты только первых двух-трех компонент, описывающих основную часть изменчивости всех исходных признаков.
Таким образом, при расчёте карт главных компонент используется тот же алгоритм, что и при обычных статистических расчётах. Единственное отличие состоит в том, что получаемые значения главных компонент в популяциях (узлах сетки карты) имеют координатную привязку и поэтому представляются не в табличном формате, а в формате цифровой модели. Как указывалось, эта функция расчёта по значениям, привязанным к узлам ЦМ, реализована в программном пакете GGMAG.
ЗАЧЕМ НАДО СТРОИТЬ КАРТЫ ГЛАВНЫХ КОМПОНЕНТ?
Этот вопрос кажется простым — конечно, чтобы своими глазами увидеть невидимое — главные закономерности в изменчивости генофонда. Но на самом деле вопрос не так прост. Он подразумевает иное — а зачем надо разрабатывать сложные специальные программы? Почему геногео-графикам так важно строить карты главных компонент по исходным картам генов? Почему бы не рассчитать главные компоненты с помощью обычных статистических пакетов, а затем уже построить карты по полученным значениям главных компонент, как мы строим простые карты отдельных признаков? Иными словами, зачем так стараться создавать сложные карты, если можно построить простые? Особое значение, которое приобретает именно картографический, а не чисто статистический анализ главных компонент, объясняется в первую очередь неравномерностью исходных данных.
Неравномерность состоит в том, что по аутосомным генетическим маркёрам практически каждый локус изучен по собственному, отличающемуся от других, набору популяций. Это делает исходную информацию о генах несопоставимой и недоступной для прямого анализа главных компонент генофонда. Анализ главных компонент генофонда по исходным популяциям просто невозможен: большинство ячеек в матрице «популяции на гены» оказываются незаполненными, причём столь случайным образом, что из нее нельзя выбрать информацию, достаточно полно представляющую генофонд.
При изучении генофондов использование традиционного инструментария главных компонент наталкивается на почти непреодолимые трудности: необходимо, чтобы все популяции были изучены по одному и тому же набору генных маркёров. Однако (в отличие, например, от антропологии) программа генетических исследований не стандартизирована: практически каждый маркёр изучен по особому набору популяций. Требование унифицированности данных чрезвычайно сужает и набор популяций, и набор маркёров. Остаются два выхода: 1) ограничить число анализируемых популяций; 2) ограничить набор маркёров. Однако как несколько популяций не могут надёжно представлять всю популяционную систему, так и малый набор маркёров не может служить характеристикой генома в целом. При малом наборе популяций и маркёров анализ генофонда невозможен: анализируется случайный ряд популяций по нескольким генам, но не генофонд того или иного масшта- ба. Именно поэтому, как правило, исходная информация о генах не позволяет широко использовать классический анализ главных компонент.
Выход из этой ситуации дает геногеография. Картографическая интерполяция помогает найти наиболее вероятные значения признака для тех точек карты и популяций, по которым исходная информация отсутствует. В результате заполняются «пробелы» вырожденной матрицы и появляется возможность включить в анализ главных компонент генофонда все изученные популяции и полный репрезентативный набор генных маркёров, в своей совокупности отражающие основные свойства и историю генофондов. Карты «надёжности» [Нурбаев, Балановская, 1997, 1998] позволяют выбрать из всей совокупности интерполированных значений лишь те, которые обладают высокой надёжностью. (Карты надёжности несут информацию о достоверности интерполированных значений признака в каждой точке картографируемого ареала, поэтому те области карты, которые не были обеспечены исходной информацией, не участвуют в анализе главных компонент.)
Например, изучение генофонда Восточной Европы опирается на генетическую информацию о 1586 популяциях, однако ни одна (!) из популяций не изучена по всему набору 30 локусов (100 аллелей). Практически каждый ген изучен по собственному, отличающемуся от других, набору популяций. Это делает исходную информацию о генах несопоставимой и недоступной для прямого анализа главных компонент генофонда.
Итак, единственный выход — это выход геногеографический: создать серию унифицированных карт. Причём карты каждого гена должны одновременно удовлетворять двум противоположным требованиям: с одной стороны, полностью учитывать всю исходную информацию о гене; а с другой стороны — быть полностью сопоставимыми с картами всех других генов.
На этих картах каждый узел их равномерной сетки является аналогом популяции. Для всей совокупности таких новых популяций (на картах генофонда Восточной Европы их около 9000) и по всей совокупности генов (карты 100 генов) рассчитываются главные компоненты — по стандартной по процедуре, описанной выше. Полученные значения главных компонент вновь присваиваются каждой из 9000 узлов сетки. Эта процедура стандартна и полностью соответствует привычному — не картографическому — анализу главных компонент. На основе 100 карт генов рассчитывается корреляционная матрица. Значения главных компонент рассчитываются для каждого узла равномерной сетки карты. В результате создается ЦМ карт 1, 2, 3… 100 компонент; благодаря нормировке и оптимизации решения среднее значение соответствующей компоненты равно нулю, дисперсия — единице, корреляция между картами компонент равна нулю. В результате анализа мы характеризуем аналоги популяций новыми признаками — главными компонентами, обобщающими информацию обо всех исходных признаках.
Отличие картографического анализа лишь в том, что самих популяций (узлов сетки) очень много, и они имеют строго упорядоченную географическую привязку. Благодаря этому мы можем, объединив значения главных компонент в интервалы и окрасив их (отрицательные значения — в светлые тона, положительные значения — в темные) увидеть своими глазами, как значения главных компонент распределены в пространстве. Таким образом, карты главных компонент представляют собой отображение трехмерного пространства: два измерения -
географические, третье измерение — это генетический ландшафт главной компоненты. Обычно первые три компоненты вбирают в себя наибольшую часть общей дисперсии и как бы конденсируют в себе информацию об основных параметрах изменчивости наибольшей части генов.
КАК АНАЛИЗИРОВАТЬ КАРТЫ ГЛАВНЫХ КОМПОНЕНТ?
Далее можно изучать полученный генетический ландшафт главных компонент разными методами.
Во-первых, можно чисто качественно интерпретировать пространственные закономерности в терминах экологии или истории [Cavalli-Sforza et al.„1994; Рычков и др., 1997, 1999]. Но интерпретации могут быть разными. Главное в ином — мы выявляем объективно существующие пространственные закономерности всего генофонда, обнаруживаем «главные сценарии» в его изменчивости. Далее эти объективные закономерности могут поддаваться (или не поддаваться) той или иной интерпретации того или иного автора — важно, что есть реальный объект для обсуждения и выдвижения гипотез.
Во-вторых, выявленные картами главных компонент географические закономерности можно изучать количественно. Примером количественного изучения могут служить корреляции между картами главных компонент генофонда Европы и картами расселения земледельческого населения, материальной культуры палеолита, гетерозиготности, заболеваемости [Ammerman, Cavalli-Sforza, 1984; Cavalli-Sforza et al.„1994; Балановская и др., 1997; Рычков и др., 1998].
В-третьих, можно перейти к пространству главных компонент. Ведь на карте мы видим распределение аналогов популяций с определенными значениями главных компонент в географическом пространстве. Наша задача — увидеть, как распределены эти популяции в самом пространстве главных компонент.
ПРОСТРАНСТВО ГЛАВНЫХ КОМПОНЕНТ
Мы говорили, что метод главных компонент может использоваться как в обычном статистическом, так и в картографическом обличье. И эти два подхода не изолированы: существует переход от карт главных компонент к обычному, статистическому представлению тех же результатов на графике.
Обычное представление главных компонент — двумерный график, по осям которого отложены значения главных компонент, а каждая изученная популяция представляется как точка на графике. Положение точки задаётся её координатами — значениями главных компонент в этой популяции. На таком двумерном графике популяции расположены в собственном пространстве — пространстве главных компонент. А на карте — эти же популяции представлены в реальном географическом пространстве. При картографическом представлении популяцией является узел цифровой модели, и для этой «картографической популяции» известно значение главной компоненты и её положение в географических координатах.
И обычное, и картографическое представление результатов являются двумерными, но в первом случае популяция характеризуется одновременно по значениям двух главных компонент
и без указания географического положения, а во втором случае одна карта показывает значения только одной компоненты, зато представлена география. Итак, на двух картах представлена та же информация, что и на одном графике, плюс географическое измерение. И мы можем при желании отказаться от этого дополнительного измерения и «свернуть» две карты в один двумерный график.
Сделать это очень легко. Поскольку из карты первой компоненты известно значение компоненты для каждого узла карты, а из второй карты известны значения второй компоненты для тех же узлов, то каждый узел карты можно представить на обычном двумерном графике. Отличие такого графика пространства главных компонент, полученного через карты, от графика, полученного обычным статистическим путем, состоит только в числе и в географической равномерности точек-популяций: на картографическом графике их обычно сотни и тысячи — столько, сколько узлов в цифровой модели карты, в равномерной сети, покрывающей карту.
Несмотря на простоту такого графика, в процессе визуального анализа взаиморасположения изученных групп создается образ, несущий новую информацию о группах. В результате пространство главных компонент [Балановская, Нурбаев, 1997] становится важным инструментом для осмысления результатов, их критической интерпретации и сопоставления с информацией об истории и экологии изучаемых групп.
ЭТНИЧЕСКИЕ ОБЛАКА
При работе с картами возникает одна сложность. При обычном представлении мы опознаем каждую точку-популяцию по её номеру или названию, подписанному рядом с ней на графике. Но как назвать тысячи популяций, единственным «именем» которых являются их географические координаты? Для этого карта подразделяется на несколько зон, и узлы обозначаются особым значком в зависимости от того, в какую зону они входят. Этими зонами могут быть, например, ареалы народов, и такой приём позволяет обогатить график главных компонент новым содержанием. Если мы анализируем данные по нескольким народам, то на обычном графике главных компонент каждый народ будет представлен одной или немногими точками (изученными популяциями), а на графике, полученном через карты, каждый народ будет представлен целым облаком точек (узлов карты). Причём число точек в этническом облаке будет прямо соответствовать размеру этнического ареала. А компактность или же размытость этнического облака будет свидетельствовать соответственно о сходстве или же различиях разных популяций этого народа, то есть о большей или меньшей внутриэтнической гетерогенности.
Тем самым график главных компонент, построенный через карты главных компонент, показывает не только взаимное генетическое сходство изученных народов, но и степень популяционных различий внутри этих народов.
Как осуществить это технически? Процедуры и примеры их применения подробно описаны в [Балановская, Нурбаев, 1997]. Выделим на картах компонент ареалы интересующих нас этносов. А затем осуществим переход от географического пространства к пространству главных компонент следующим образом. Обозначим аналоги популяций — узлы сетки карты — в ареале каждого этноса значками единого цвета и формы. То есть цвет или значки будут выступать маркёрами этнической принадлежности популяций. Для каждого узла сетки считаем значения 1 и 2 компонент соответственно с ЦМ — цифровых матриц карт 1 и 2 компонент. Подчеркнём, что значения компонент считываются с ЦМ, а не с визуализированных карт: в ЦМ карты каждый аналог популяции — узел сетки — имеет математически строго определённое значение картографированного признака и не зависит от заданной шкалы интервалов. Разместим каждую популяцию в пространстве 1 и 2 главных компонент.
Количество точек — популяций — прямо пропорционально ареалу этноса. Популяции каждого этноса образуют как бы «этническое облако», причём «этническое облако» отражает межпопуляционную изменчивость этноса в пространстве главных компонент. «Центры тяжести» этнического облака соответствуют результатам традиционного — не картографического — анализа главных компонент, если бы этот анализ проводился по средним этническим частотам генов.
Важно отметить, насколько большую информацию мы получаем, используя всю картографическую информацию о разнообразии этноса, а не только положение в пространстве главных компонент этнических центров: различие в информативности «этнических облаков» (их размеров, положения, конфигурации, плотности и т. д.) и их «центров тяжести» соответствуют различиям в информативности картографического и традиционного анализа.
Этнические облака могут частично перекрываться. Такое перекрывание этнических облаков можно интерпретировать как генетическую близость. Возможны ситуации, когда этнические облака не перекрываются вовсе или же генофонд одного этноса размещён в пределах этнического облака другого этноса. К одним из наиболее важных преимуществ картографо-статистического анализа главных компонент следует отнести то, что этнос представлен в пространстве главных компонент не точкой, а всеми вариациями популяций в пределах этнического ареала. Компактность «этнического облака» свидетельствует о генетической однородности этноса, размытость границ — о неоднородности его генофонда. Поэтому для одних этносов «этническое облако» может сгущаться до состояния грозовой тучи, а для других — рассеиваться как перистые облака.
Важно подчеркнуть, что пространство главных компонент является не иллюстрацией, а важным элементом количественного анализа, поскольку положение популяций в этом пространстве адекватно отражает расстояния между популяциями. Причём «… геометрическое расстояние между любой парой популяций представляет собой «истинное» многомерное генетическое расстояние с наименьшей возможной ошибкой» [Cavalli-Sforza, Piazza, 1993, с.13]. (Хотя эта формулировка лучше соответствует другому методу снижения размерности — многомерного шкалирования — но в первом приближении может применяться и к графику главных компонент). Таким образом, благодаря пространству главных компонент, мы можем оценивать взаиморасположение популяций различных этносов, степень сходства и различий их генофондов, причём выражать эти сходство и различия в точных терминах генетических расстояний. Такая возможность — очень важное достоинство пространства главных компонент. Это означает, что визуальный образ, создаваемый пространством главных компонент, основан на математически точных пропорциях и соотношениях популяций.
Последнее замечание касается набора популяций. Поскольку в их качестве выступают узлы равномерной сетки, то весь ареал этноса представлен в пространстве главных компонент полностью и равномерно. Однако изученность этноса никогда не бывает равномерной: одни территории исследованы подробно, другие представляют собой белые пятна. Оценки частот генов для малоизученных территорий — лишь прогноз с определённой степенью надёжности. Это означает, что и значения главных компонент в разных частях ареала определены с разной степенью надёжности: для одних частей — они высоко достоверны, для других — имеют чисто прогностическое значение. Если у нас есть инструмент для оценки надёжности картографической информации, то мы можем оставить в «этническом облаке» лишь те популяции, в отношении которых информация достаточно достоверна. Эти диаграммы отражают «надёжное» пространство главных компонент в отличие от исходных диаграмм, отражающих «прогнозируемое» пространство главных компонент.
Сравнение «прогнозируемого» и «надёжного» пространства демонстрирует, какие популяции каждого из этнических облаков можно интерпретировать уверенно, а в отношении каких следует соблюдать осторожность. Важным выводом из сопоставления этих двух видов диаграмм является высокая устойчивость «центров тяжести» — средних этнических оценок главных компонент. В общих чертах все выводы, сделанные нами в отношении центров тяжести этнических генофондов и этнических облаков в целом при анализе прогнозируемого пространства, сохраняют свое значение при рассмотрении «надёжного» пространства главных компонент [см. Балановская, Нурбаев, 1997]. Лучше всего использовать одновременно обе диаграммы — «прогнозируемого» и «надёжного» пространства главных компонент: «прогнозируемое» пространство позволяет видеть этнос как целое в многообразии составляющих его популяций; «надёжное» пространство позволяет оставлять лишь те заключения, которые опираются на надёжно определённые популяции.
Рис. 3.2 Карта главной компоненты, построенная прямым способом: расчёт главным компонент и потом построение карты главной компоненты
Приведена карта второй главной компоненты изменчивости частот русских фамилий по «сельсоветным» данным
Рис. 3.1. Карта главной компоненты, построенная интерполяционным способом: сначала построение карт отдельных признаков и потом расчёт по этим картам главных компонент.
Приведена карта второй главной компоненты изменчивости частот русских фамилий по «сельсоветным» данным.
§ 9. Проблема ложных корреляций
В заключение коснемся важного методического вопроса, относящегося к картографированию главных компонент. Этот вопрос был очень остро поставлен в дискуссии между R. Sokal и L. L. Cavalli-Sforza об эффекте ложных корреляций, вносимых интерполяционной процедурой картографирования [Sokal et al., 1999ab; Rendine et al., 1999].
В чем же проблема? Поскольку число изученных популяций всегда много меньше числа узлов карты, при создании картографической модели необходимо использовать процедуру интерполяции данных. R. Sokal указывает, что это может привести к возникновению ложных корреляций между картами. Дело в том, что на территории промежуточной между изученными популяциями интерполяция прогнозирует постепенные изменения. И даже если в действительности картина более сложна, мы не сможем её выявить, пока не изучим промежуточные популяции, и наша карта будет «гладкой», с постепенными изменениями. Если теперь предположить, что постепенные изменения в данной области карты появятся на нескольких картах, то эти карты будут коррелировать друг с другом в данной области. Очевидно, что эта корреляция «индуцирована» интерполяцией и может иметь, а может и не иметь оснований в реальном распределении двух признаков. А так как главные компоненты вычисляются по матрице корреляций между картами, то и главные компоненты должны нести те или иные искажения вследствие ошибки таких ложных корреляций. Если же значения главных компонент были бы рассчитаны «прямым способом», то есть по исходным данным (без всяких карт), а уже потом по результатам такого расчёта построена карта главных компонент, то в этом случае, как указывает R. Sokal, мы избежали бы ошибки ложных корреляций. Вместе с тем R. Sokal согласен, что подобный способ расчёта (сначала рассчитать значения главных компонент, а потом уже картографировать «готовые» значения) возможен лишь в тех чрезвычайно редких случаях, когда весь ряд популяций изучен по всему набору признаков.
В целом, соглашаясь с логикой R. Sokal, мы считаем, что предложенный им выход — отказ от карт главных компонент — является мерой крайней и поспешной. Следует, по-видимому, провести более тщательное изучение этого вопроса — как теоретическое, так и путем прямого эксперимента. По аутосомным генетическим маркёрам провести такой эксперимент нельзя, так как нельзя построить карту главных компонент «прямым способом», поскольку популяции изучены по разному набору маркёров (в таблице «все популяции на все маркёры» многие ячейки пустуют). Однако квазигенетические маркёры (фамилии) и однородительские ДНК маркёры изучены обычно во всех популяциях (см. главы 6 и 7). Это позволило нам провести экспериментальную проверку значимости эффекта ложных корреляций.
ЭФФЕКТА ЛОЖНЫХ КОРРЕЛЯЦИЙ — НЕТ!
Итак, мы решили напрямую проверить — есть ли в действительности, а не в теории, эффект ложных корреляций?
РУССКИЕ ФАМИЛИИ. Для этого нами были построены карты главных компонент изменчивости русских фамилий в двух вариантах — расчёт «по картам» и расчёт «прямым способом». Во избежание всяких сомнений, эти карты были построены по популяциям строго одного уровня — по данным о частотах фамилий в сельсоветах. Рис. 3.1. демонстрирует результат первого способа расчёта («по картам»), вызвавшего сомнения R. Sokal (построение карт отдельных признаков и потом расчёт по этим картам главных компонент). На рис. 3.2. приведена карта этой же компоненты, но рассчитанная «прямым способом» и рассматриваемая как эталон правильности (расчёт главных компонент по исходным данным).
При сопоставлении этих карт становится очевидным их полное сходство. Коэффициент корреляции составил r=0.963. Это значит, что расчёт главных компонент «по картам» и «прямым способом» дал идентичные результаты.
ГАПЛОГРУППЫ У ХРОМОСОМЫ В РУССКОМ ГЕНОФОНДЕ. Но, может быть, только фамилии обнаруживают столь полное совпадение? Нет. Мы провели полностью аналогичный анализ и для ДНК маркёров — изменчивости гаплогрупп Y хромосомы в историческом русском ареале. И вновь расчёт главных компонент «по картам» и «прямым способом» дал идентичные результаты: коэффициент корреляции составил r=0.997 [Balanovsky et al., 2008].
АДЫГЕЙСКИЕ ФАМИЛИИ. Такое же полное сходство (коэффициент корреляции составил r=0.98) мы обнаружили при сравнении расчёта главных компонент «по картам» и «прямым способом», проведённым по фамилиям иного народа — адыгейцев. Здесь важно не только то, что фамилии этого народа «говорят» на языке совсем другой лингвистической семьи и имеют много более древнюю историю и устойчивость. Для картографирования важнее иное — сам ареал адыгейцев имеет конфигурацию, альтернативную русскому ареалу. Если русский ареал един и компактен, то ареал адыгейцев он состоит из двух самостоятельных частей, разделённых Большим Кавказским хребтом. И, тем не менее, оба столь полярно различающиеся ареалы русского и адыгейского народа продемонстровали высочайшую степень сходства между картами главных компонент, полученными «по картам» и «прямым способом».
ВЫВОД. Проведённые эксперименты показали, что метод вычисления главных компонент по интерполированным данным не приводит к ошибке «ложных корреляций».
Важно подчеркнуть, что при расчёте компонент учитывались лишь области с высокой достоверностью прогноза (р>0.95), полученные благодаря специальной технологии оценивания надёжности карт. Можно полагать, что именно включение в анализ только областей с высокой надёжностью важно для избавления от ложных корреляций.
Разумеется, требуются многочисленные исследования, чтобы выяснить границы применимости метода главных компонент в общем случае. Однако практически полное совпадение результатов, полученных «по картам» и «прямым способом» во всех трех случаях — русских фамилий, адыгейских фамилий и гаплогрупп Y хромосомы в русском ареале — указывает, что (при учете надёжности информации) результирующие карты главных компонент не содержат ошибки ложных корреляций.
Это позволяет утверждать, что обсуждаемые в данной книге карты главных компонент правомочны и отражают реальную картину пространственной изменчивости русского генофонда.
4. ОБЪЕКТИВНОСТЬ ГЕНОГЕОГРАФИИ
Суха теория, мой друг Но древо жизни вечно зеленеет
Гёте. «Фауст»В предыдущих разделах мы бегло осмотрели понятийный аппарат и арсенал геногеографии. По ходу книги по мере необходимости давались «технические» пояснения. Но чтобы увидеть единство этой книги, анализирующей разные признаки, по-разному рассказывающие о русском генофонде, надо ответить на ряд важнейших общих вопросов. Без ответа на них результаты останутся отдельными страницами разрозненных томов.
Например, насколько изложенные выше положения о структуре генофонда являются спорными? Получим ли мы с помощью арсенала геногеографии действительно объективный портрет генофонда? Как глубока генетическая память? Насколько далеко в глубь времен проникают генетические «зонды»? Соответствуют ли данные генетики данным других наук — археологии, истории, демографии, антропологии, лингвистики? Насколько надёжны и устойчивы оценки изменчивости генофонда? Можно ли в данных о совершенно разных признаках разглядеть общую картину изменчивости генофонда?
В этом разделе мы попробуем дать краткие ответы на эти первостепенные вопросы.
Поговорим, например, о важной характеристике генофонда — его разнообразии (дифференциации).
Выше мы утверждали, что если возьмём средний по множеству генов показатель различий между популяциями FST, то получим такую интегральную оценку дифференциации генофонда, которая уже не зависит от неравной приспособленности аллелей к среде и потому называется «селективно-нейтральной». Иными словами — не зависит от действия отбора. Эта оценка определяется только историей генофонда (FST≈Fe) и зависит только демографического облика популяции: от соотношения исторически сложившихся размера популяций Ne и миграций Ме:
FST≈Fe=1/(4NeMe+1).
Это положение — одно из самых важных для понимания изменчивости генофонда и истории его сложения, как бы мы его ни изучали: с помощью многомерной статистики или компьютерных карт. Однако именно оно зачастую вызывает сомнения. Действительно, казалось бы, как можно по генам, каждый из которых потенциально подвержен отбору, получить портрет генофонда, сформированный только историей? Получить селективно-нейтральный портрет генофонда, не зависящий от отбора, не зависящий от биологической функции гена, не зависящий от среды? Можно ли найти доказательства этому странному положению?
Чтобы дать убедительный ответ на этот один из самых коварных вопросов — а без ответа на него нет смысла описывать ни русский, ни любой другой генофонд! — мы приведём два ряда доказательств: § 1 и § 2 данного раздела. Эти доказательства выходят далеко за пределы не только русского генофонда, но и Европы. Но лишь охватив изменчивость многих генофондов, в больших масштабах времени и пространства, можно проверить основную гипотезу: гипотезу выполнения равенства FST≈Fe=1/(4NeMe+1).
Первый ряд доказательств относится к генохронологии (§ 1). Генохронология по данным генетики оценивает возможное время реальных исторических событий. Она дает датировки давно прошедших событий в истории генофонда. Причём все её датировки основаны на предположении равенства FST≈Fe=1/(4NeMe+1). Поэтому генохронология дает одну из самых очевидных возможностей проверки этого равенства. Если генетическая датировка будет соответствовать исторической дате события, то гипотеза FST≈Fe верна, и мы действительно можем реконструировать селективнонейтральную историю генофонда по совокупности генов, подверженных отбору.
Второй ряд доказательств (§ 2) относится к прямому сопоставлению оценок разнообразия генофонда, полученных по данным генетики (FST) и по данным других наук (Fe). При этом для одного и того же генофонда мы получаем две независимые оценки его дифференциации. С одной стороны, оценку дифференциации генофонда FST, полученные по множеству генов. А с другой стороны — оценку дифференциации Fe, полученную по информации, вообще никакого отношения к генам не имеющей: по чисто демографическим оценкам размера популяций Ne и миграций Ме; или же по данным о распределении фамилий. Если такие ряды независимых оценок будут соответствовать друг другу — то мы получим веское доказательство справедливости основной гипотезы FST≈Fe=1/(4NeMe+1).
Оба ряда приводимых доказательств созданы благодаря таланту и усилиям Юрия Григорьевича Рычкова и его школы. Они сводят воедино данные многих исследователей, многих научных работ по изучению генофонда народов СССР, которые специально планировались профессором Ю. Г. Рычковым для проверки равенства FST≈Fe и были проведены под его руководством. Эти данные публиковались в целом ряде статей в разном составе авторов, однако сейчас незаслуженно забыты. Мы приведём эти результаты так, как они изложены в наших совместных публикациях с Ю. Г. Рычковым: описание генохронологии (§ 1) приводится по книге Е. В. Балановская, Ю. Г. Рычков «Геногеография (гены человека на карте СССР)» [Балановская, Рычков, 1990а]; сопоставление генетических и не генетических оценок дифференциации (§ 2) — по статьям цикла Е. В. Балановской и Ю. Г. Рычкова «Этническая генетика» [Балановская, Рычков, 19906,в; Рычков, Балановская, 1990а]. Мы старались — вопреки вынужденным сокращениям — полностью сохранить дух и стиль изложения этих работ. Хотя обобщение и описание этих результатов приведено в наших общих с проф. Ю. Г. Рычковым публикациях, однако основная часть данных была получена задолго до начала нашей совместной работы. Поэтому, не беря на себя смелость редактировать или исключать те черты, которые кажутся нам отнюдь не бесспорными, из уважения к памяти Ю. Г. Рычкова мы приводим их именно в том виде, который его удовлетворял.
В § 3 мы рассмотрим, от чего зависит устойчивость оценок изменчивости генофонда, в § 4 дадим обзор генетической изменчивости в основных регионах мира, а в § 5 немного поговорим об истории нашей науки.
§ 1. Генохронология
МЕРА — ПОКОЛЕНИЕ
Человеческие гены вовлекаются в исторический процесс, поскольку человек не только творец истории и исторического времени, но и творение этой истории. Это значит, что генетические процессы, происходящие в человечестве, не только регулируются историей, но и происходят в историческом времени. Причём гены обеспечивают людям всего лишь возможность кратковременной жизни, тогда как люди обеспечивают генам возможность передачи по длинной цепи поколений.
Поколение — естественная генетическая единица времени. А смена поколений — это ход часов, отмеряющих время течения генетических процессов. Но поколение — это ещё и определённый период в социальной истории человека. Поэтому можно два ряда событий (естественной истории населения и его социальной истории) выразить через одну единицу времени — поколение. Историческая наука при датировке пользуется иным — астрономическим временем, к которому сводимы любые календарные системы — линейные и циклические. Есть ли здесь место поколению? Можно ли представить в поколениях хронологию всеобщего или локального исторического процесса, не возвращаясь при этом к «доисторическому» способу времяисчисления, когда заучивание каждым своего места в генеалогической цепи, тянущейся от предков-основателей, было равносильно изучению истории и познанию исторического времени?
Термин «историческое событие» в его прямом значении — событие в истории. Но обычно историческим событием мы называем то, что (как мы сейчас думаем) не исчезнет из истории в будущем, то, что войдёт в нее. Генохронология датирует такие события, которые и в прямом, и в переносном смысле являются историческими: только оставив свой след в истории дальнейших поколений, эти события могут быть уловлены генетическим методом.
ИСТОРИЧЕСКОЕ СОБЫТИЕ
Будем считать генетически значимым такое историческое событие, которое привело к изменению дифференциации генофонда [Fe=1/(4NeMe+1)], то есть затронуло важнейшие параметры генофонда — дрейф генов Ne и миграции генов Ме, рассмотренные нами выше (Приложение, раздел 1, § 3). Например, это может быть изменение типа хозяйства или даже какой-нибудь конкретной технологии культуры, которое привело к росту эффективности хозяйства. А затем через это изменение — к приросту численности населения, к изменению возрастной структуры, а значит, и к изменению генетического размера популяции Ne. Но цепь генетических последствий такого события на этом может не оборваться и продолжиться дальше в форме увеличения подвижности населения, роста культурно-экономических контактов и так далее, что непременно скажется на изменении показателя миграции Ме. Таких событий — множество.
Намного сложнее найти пример такого события общественной истории, для которого можно было бы категорически отрицать его генетические последствия. Вся разница лишь в длине цепи и отдалённости генетических последствий от их исторической первопричины. Так, события в области не только материальной, но и духовной культуры потенциально являются и событиями в истории генофонда. Наглядными примерами могут служить широко известные генетические последствия событий в истории мировых религий и малых сект (генетикам хорошо известно чрезвычайное генетическое своеобразие ряда сектантских общин, заключающих браки только с единоверцами). Для формирования русского генофонда важнейшее значение имели духовная мощь русского монашества и его распространение за пределы этнического ареала. Монастыри и одинокие скиты не приносили гены на окраины ареала, где они основывались в надежде уйти от суеты мирской жизни. Но они становились форпостами русской культуры, центрами духовной и культурной жизни, вокруг которых организовывалась общественная и экономическая жизнь (вспомним хотя бы, что важнейшие ярмарки России проводились у монастырей, куда съезжался православный люд), возникали новые крупные популяции.
ГЕНЕТИЧЕСКИЕ ЧАСЫ
Современная наука предлагает немалый. набор самых совершенных часов для измерения времени в различных эволюционных процессах. Но для анализа генетических последствий они не годятся. Ведь радиоуглеродные часы будут отсчитывать время, прошедшее с момента гибели какого-либо существа, будь то водоросль, дерево, бабочка или человек. Они имеют отношение к хронометрированию именно той истории, которая когда-то (и часы должны указать, когда именно) оборвалась. Здесь все зависит от того, успел ли тот человек, кости которого из археологических раскопок попали в радиоуглеродную лабораторию (или в лабораторию палеоДНК), оставить потомков или передать какую-либо иную весть в будущее. И если нет, то такие часы будут указывать всего лишь время обрыва какой-либо цепи. Получается, что, располагая совершенным хронометром, мы не имеем никакой гарантии и можем лишь надеяться, что датируемое им событие прошлого имело отношение ко всему последовавшему за ним будущему. Парадокс фантастической бабочки Рэя Брэдбери, описанный одновременно с изобретением радиоуглеродных часов, имеет прямое отношение к ним.
Поэтому воспользуемся поколением как единицей времени. Основываясь на исследованиях, проведённых генетиками и антропологами, можно считать, что у человека, к какому бы кругу народов и культур он ни принадлежал, средняя длительность поколения составляет около 25–26 лет, если за точку отсчёта взять средний возраст родителей при появлении у них первого ребенка. В таком темпе происходит нарождение новых поколений у папуасов Новой Гвинеи и москвичей, у пигмеев Конго и армян, у эскимосов и чукчей Чукотки и литовцев, у алеутов Командорских островов и уйгуров Средней Азии, у удэгейцев дальневосточного Приморья и монголов.
Итак, используя гены современного человека как часы, отсчитывающие время генофонда, мы точно знаем, что (в отличие от калий-аргоновых и радиоуглеродных часов) у этих генов были свои предшественники в каждом предыдущем поколении, и что время, отсчитываемое поколениями, не прерывалось ни разу. Точка отсчёта времени всегда условна — ведь и сегодня на традиционных календарях разных народов одни и те же события приходятся на разные даты из-за разных точек, выбранных в качестве начала летоисчисления Поэтому мы примем за начальный момент для обратного отсчёта времени год генетического изучения тех популяций, события в истории которых мы попытаемся отыскать в генетической летописи.
ДАТИРУЕМЫЕ СОБЫТИЯ
Генохронологически датированные события расположим в хронологическом порядке: от совсем недавних времен — к древним[75].
ХОТОНЫ. На крайнем северо-западе Монголии проживает небольшая этническая группа — хотоны. Как этнос они начали формироваться около 250 лет назад, когда во время войн джунгаров пленные (из узбеков, казахов, уйгуров и других народов Центральной Азии) были поселены в этом уголке Монголии в надежде, что они наладят в этой скотоводческой стране земледелие. Хотя навыки к земледелию, принесенные с родины, в новой окружающей этнической среде постепенно утрачивались, но новая этническая общность — хотоны — все же возникла. После революции в Монголии хозяйство хотонов претерпело резкую реорганизацию. Их земледелие оказалось столь малоэффективным, что в 1934 г. специальным постановлением хотоны были переориентированы на новый для них тип хозяйства — скотоводство.
Это постановление повлекло полную реорганизацию и всей популяционной структуры хотонов, в том числе структуры брачных связей, а значит, и миграций генов. Как видим, цепь, связывающая исторические события с возможными генетическими последствиями, здесь очень коротка.
Запомним дату события: 1934 год. Генетически хотоны были исследованы под руководством Ю. Г. Рычкова монголом Ж. Батсуурем в 1978 г. Эта дата будет точкой обратного отсчёта генетического времени.
УЙГУРЫ и ДУНГАНЕ. В связи с историей хотонов мы уже упомянули уйгуров — древний народ Центральной Азии с весьма трудной исторической судьбой. Была эпоха их гегемонии в этом районе мира, расцвет культуры, собственная письменность, но их силы истощились в борьбе с пришельцами, завоевавшими их родину. Один из актов этнической трагедии происходит в 70х годах XIX века, когда в борьбе за самосохранение уйгуры примкнули к восстанию дунган. Дунгане — ещё одно многомиллионное национальное меньшинство Китая, также испытывавшее притеснения. Дунгане и уйгуры в этом восстании потерпели сокрушительное поражение от регулярной китайской армии. В поисках спасения уйгуры и дунгане отдельными группами и семьями устремились из разных районов через горные перевалы в среднеазиатские пределы России.
Русским пограничникам было дано указание, пропустив беглецов, закрыть границу перед преследовавшими частями китайской армии. Эти события происходили с осени 1870 по 1881 г., когда граница была окончательно закрыта. Но до 1884 г. мелкие группы беженцев просачивались через границу. В Средней Азии им были отведены территории для поселения. Часть уйгурских и дунганских семей поселилась в Ферганской долине, где 100 лет спустя, в 1970 г., их современные поколения, образовавшие несколько популяций, были изучены под руководством Ю. Г. Рычкова уйгуром Х.А. Каримовым.
Итак, датировка описанных событий и начала формирования в Фергане популяций уйгур и дунган: 1870–1884 гг. Точка обратного отсчёта времени: 1970 г.
АЛЕУТЫ. Из конца XIX века переместимся в его начало. Тогда в число территориальных владений России входила Русская Америка, простиравшаяся от Аляски на севере до Калифорнии на юге. Географически и экономически к ней относились и Алеутские острова, хотя административно они управлялись не из Новоархангельска — столицы Русской Америки, а из Охотска, игравшего тогда роль форпоста России на Тихом океане, которая позднее перешла к Владивостоку. Алеутские острова издревле, как указывают радиоуглеродные датировки археологических и палеоантропологических материалов, на протяжении 8 тысяч лет, были заселены алеутами — народом, родственным эскимосам, но с иной специализацией традиционного хозяйства.
Что же касается Командорских островов, лежащих между Алеутской грядой и Камчаткой, то они не были обитаемы ни в древности (по данным археологической разведки), ни в момент их открытия при кораблекрушении экспедиции Беринга в 1741 г., ни позднее вплоть до 1826–1829 гг. (если не считать временно высаживавшихся там промысловых артелей русских, добывавших песца и морского зверя и возвращавшихся с добычей на Камчатку). В документах Российско-Американской компании сохранилось одно яркое свидетельство необитаемости островов в начале XIX
в. С одного из кораблей Российско-Американской компании сообщалось (командиром брига «Финляндия» штурманом И. Ф. Васильевым), что в 1812 г. с острова Беринга им был снят один русский, оставленный там своей артелью на год охранять добытые шкуры, которые не могли увезти с собой, да забытый на целых три года. Другие его семеро товарищей, в свою очередь, были высажены в 1805 г. на острове Медном и забыты там на целых семь лет [Русская Америка, 1979]. Так, эта русская робинзонада определённо указывает, что и в 1812 г. Командоры все ещё были необитаемы.
Наконец, было решено основать на Командорах постоянное поселение, которое служило бы и стоянкой для судов — единственной связи Русской Америки с Россией. Но поскольку Русской Америке и так остро недоставало русских, на Командорские острова было решено переселить алеутов с Алеутского архипелага. Осуществлял этот проект Ф. П. Литке во время кругосветной экспедиции на военном шлюпе «Сенявин» в 1826–1829 гг.
Этими годами (1826–1829 гг.) и датируются два исторических события: Командорские острова утратили очарование необитаемости, но в составе народов России появился новый народ — алеуты (Алеутские острова ныне относятся к США). Их генетическое исследование было проведено Ю. Г. Рычковым вместе с И. В. Перевозчиковым и В. А. Шереметьевой в 1970 г.
ВОСТОЧНО-САЯНСКИЕ ТЮРКИ. Спустимся далее в глубь времен, пропустив ещё тысячу триста лет. Следующая группа народов — тюркоязычные тувинцы, тоджинцы и тофалары в Саянах. Напомним, что ныне тюркские языки распространены от Колымы на северо-востоке Евразии до Босфора на юго-западе Евразии. Но предполагаемая их родина — в Алтае-Саянском нагорье и прилегающих районах Монголии. Время появления тюрок на исторической арене зафиксировано в древнекитайских летописях. Древний Китай на протяжении тысячелетий вел с переменным успехом, но в целом наступательные войны за овладение Центральной Азией, поэтому естественно, что все происходящее в этом регионе, тем более сложение нового народа — потенциального противника — привлекало пристальное внимание и фиксировалось в хрониках. Первое упоминание о тюрках относится к 518 г., и в нем уже встречаются этнонимы «теле» и «тубо», которые и сегодня звучат в названиях народов: «теле» — на Алтае (теленгиты, телеуты, телесы), «тубо» — на Алтае и в Саянах (тубалары, тофалары, тувинцы).
В период 626–659 гг. погибли две тюркские империи — Западный Каганат и Восточный Каганат, между которыми Саяны составляли северный пограничный район. Выход из-под центральной власти дал начало самостоятельному развитию тюркоязычных народностей на Северной (Сибирской) окраине Внутренней Азии.
Можно предположить, что это произошло в названный период распада империи: 626–659 гг. А самая ранняя дата из истории тюрок — 518 г. также может служить вехой в генетическом путешествии в прошлое.
ТОФАЛАРЫ и ТУВИНЦЫ. Другими событиями с зафиксированными датами история Саян небогата. Но, пожалуй, можно попытаться отыскать в генетике современных популяций след ещё одного события. В конце жизни Чингисхана (умер в 1227 г.) монголы покорили саянских тюрок. Владычество монголов в Саянах длилось с XIII по XVI вв. Еще по указанию Чингисхана были созданы золотые прииски в самом центре земли тофаларов. Прииски действовали и века спустя, пока на огромной площади не были сведены все леса, пошедшие на костры для разогрева мерзлой земли в штольнях. И ныне этот район — на протяжении дня пути через него — полностью лишен леса и обходится тофаларами, чье традиционное хозяйство базируется на охоте и транспортном оленеводстве. Так возникла экологическая граница, разъединившая популяции тофаларов, живущих по разные стороны зоны золотых приисков.
Поэтому попытаемся с помощью генохронологии отыскать в генах современных тофаларов след событий, связанных с монгольским завоеванием Саян и происходивших в XIII–XVI вв. Генетическое исследование тофаларов и других групп саянских тюрок было проведено Ю. Г. Рычковым со студентами Московского университета в 1964 г.
ТУНГУСО-МАНЬЧЖУРЫ ПРИМОРЬЯ. Углубимся в прошлое ещё на тысячелетие и переместимся на Дальний Восток, в Приморье, где ныне проживают тунгусо-маньчжурские народности: удэгейцы и нанайцы, по традиционному укладу — рыболовы и охотники. Теперь их всего несколько сот человек в двух посёлках. Однако за той картиной демографии и быта, которую застали русские в момент присоединения Приморья к России, скрывалась длительная и насыщенная событиями история народов Дальнего Востока. Она восстановлена российскими исследователями и проконтролирована по все тем же древнекитайским хроникам.
Некогда население этого края было столь многочисленным, что в Приморье и соседней Маньчжурии возникали мощные племенные союзы и государства с городами, укреплениями, регулярным войском и высокой культурой, соперничавшей порой с древнекитайской. Знаменитый Конфуций посетил этот край. Первые отрывочные сведения об этих племенах восходят ещё ко II тысячелетию до н. э., а с середины I тысячелетия до н. э. они становятся уже постоянными в китайских хрониках. Еще позднее эти племёна становятся известны как создатели Золотой империи чжурчженей, затем государств Мохэ и Бохай. В конечном счете, все они потерпели поражение в борьбе с Древним Китаем, а затем и с монголами.
У современных потомков этих блестящих предшественников на момент их генетического обследования все ещё сохранялись элементы преемственности материальной и духовной культуры. Так, один из мифов, сохранившихся до наших дней, описывает, как однажды на небе вспыхнуло сразу десять солнц, испепелив на Земле все живое и расплавив Землю. О времени возникновения мифа есть некоторые сведения — древние китайцы знали о нем, по меньшей мере, не позднее III в. до н. э.: в это время он уже нашёл отражение в китайской поэзии. Вот отрывок из стихотворения «Призывание души» Цюй Юаня, жившего в III в. до н. э.:
Восточной стороне не доверяйся. Там великаны хищные живут И душами питаются людскими. Там десять солнц всплывают в небесах И расплавляют руды и каменья, Но люди там привычны ко всему.Таковы стихи III в. до н. э. о той стороне, где современное коренное население все ещё помнит легенду о десяти солнцах, нарушивших порядок поочерёдного появления на небе и вспыхнувших все разом.
Итак, I тысячелетие до н. э., причём не позднее III в., а скорее всего, первая половина-середина I тысячелетия — такова историческая датировка этногенеза тунгусо-маньчжурских народов Приморья, которую можно сопоставить с данными генохронологии.
Генетическое исследование тунгусо-маньчжурских народностей Приморья было проведено в 1970–1973 гг. под руководством проф. Ю. Г. Рычкова приморской исследовательницей В. Г. Ворониной.
ЗАСЕЛЕНИЕ АМЕРИКИ. Перейдя рубеж нашей эры, мы оказались в раннем железном веке в пору его расцвета повсюду в Евразии, в том числе на Дальнем Востоке. Пожалуй, только крайний северо-восток нашей страны в это время все ещё пребывает в каменном веке в отношении материальной культуры. Весь образ жизни этих племён и даже тип их жилища, как указывал академик А. П. Окладников, оставались и на пороге новой эры близким к образу жизни древнейшего населения Сибири — охотников на мамонтов и на других крупных стадных животных ледниковой эпохи. Исчезнувших мамонтов, носорогов, лошадей заменили киты, моржи, тюлени — добыча, которая по-прежнему надолго обеспечивала пищей все население какого-либо посёлка на побережье пролива и моря Беринга.
Поэтому без особых потерь информации пойдём ещё дальше в глубь времени — в верхний палеолит. Это отнюдь не пора безлюдья и запустения. Костры на стоянках верхнепалеолитических охотников светились повсюду на территории нашей страны. В том числе и в Сибири, которая не подвергалась покровному оледенению, где на месте современной равнинной и горной тайги и даже тундры простирались различные варианты степных ландшафтов. Именно в это время произошло подлинное — первое в истории человечества — открытие Америки древними сибирскими охотниками на мамонта. Следуя за стадами мамонтов, они пересекли тот условный меридиан, который сегодня разделяет два острова Диомида. В то время, о котором идет речь, вместо островов перед людьми, по-видимому, предстали две относительно небольшие, покрытые кустарниками сопки, каких и сегодня немало на Чукотке и Аляске. И к северу, и к югу от этих сопок простиралась суша, а реки Чукотки и Аляски продолжали течь в своих долинах по этой земле, как текут они и сегодня под водами Берингова моря. Первооткрыватели Америки шли по земле, которую после таяния ледников покрыло море. И о суше, ставшей дном Берингова и Чукотского морей, теперь догадываются лишь ученые, называя эту исчезнувшую землю Берингией.
Но когда Сибирь и Америка ещё не были разделены морем, а Америка даже не была заселена человеком, предки тех, кого мы сейчас называем «коренным населением Америки» и «коренным населением Сибири» генетически отличались не более, чем сегодня различаются популяции в пределах одного народа. Радиоуглеродных дат для стоянок, найденных российскими и американскими археологами, много, и разброс в оценках времени велик. Но все же средняя дата (по данным на 80е годы XX века, когда было проведено описываемое исследование) для самых древних стоянок статистически вполне реальна: 25±3.4 тысяч лет назад. Эта дата и включена в генохронологию. Ею отмечен канун такого события, как разделение исторических путей популяций Америки и Сибири.
НАРОДЫ СИБИРИ. Оставим теперь в стороне праамериканцев и обратимся к населению, оставшемуся в Сибири и начавшему формировать собственный генофонд, то есть к далеким прямым предкам современных сибирских народов. Эпоха верхнего палеолита в укладе жизни этих людей ещё продолжалась. Очень медленно, растянутые на тысячелетия, происходили незаметные изменения климата, ландшафта, животного мира в направлении к современным. Такие изменения едва ли могут быть отмечены в памяти сотен поколений. Воспоминания о них накапливаются лишь в виде мифов и воспринимаются как чудесные сказки. Лишь современная археология может установить их здравый смысл. Лишь современная генетика может подтвердить, что столь далекие предки действительно существовали и более того — их гены дошли и до сказителя, и до слушателей его сказок.
Радиоуглеродные датировки существуют для многих сибирских стоянок различной древности. Здесь можно провести лишь условную границу древности, основываясь уже не на географических рубежах вроде Берингова пролива, а на рубежах различных археологических культур. Тогда для древнейших стоянок средняя радиоуглеродная дата (по данным на 80е годы XX века) составит 20 ± 2.5 тысяч лет назад. Люди, оставившие для последующей радиоуглеродной датировки угли костра, зажжённого в ледниковом периоде, передали и другие вести в будущее, и, прежде всего потомков, разведших в тех же или в новых местах и в новых поколениях новые костры.
Добавим в заключение, что генетическое исследование современных коренных народов Сибири и Америки проведено соответственно российскими и американскими генетиками и антропологами за последние 20–30 лет XX века. По отношению к тем десяткам тысячелетий, на которые нам предстоит опуститься в глубь времен, эти два-три десятка лет, конечно, могут быть приняты за единую точку отсчёта времени.
Как мы видим, в представленных фрагментах истории народов нет никакой системы. Единственное условие их включения в геохронологический анализ — наличие в прошлом какого-либо события, время которого документировано и которое могло иметь генетические последствия на всем дальнейшем протяжении времени, вплоть до современности, в которой мы пробуем отыскать его генетические следы.
РАСЧЁТ ГЕНЕТИЧЕСКИХ ДАТ
Теперь, располагая необходимой генетической информацией об этих популяциях, можно перейти к генетическим датировкам исторических событий.
Для этого генохронология использует простую формулу:
Ft=Fe(1-e-t/2Ne)=(4NeMe+1)-1(1-e-t/2Ne), где t — символ неизвестного нам числа прошедших со времени событий поколений, Fe=(4NeMe+1)-1, то есть определяется селективно-нейтральными демографическими данными о размере популяций Ne и миграций генов Ме (раздел 4 Приложения). Формула описывает накопление с ходом времени межпопуляционных различий Ft. Эта величина различий между популяциями, достигнутая по прошествии t поколений от разделении прапопуляции, представляет собой ныне наблюдаемые нами генетические различия между дочерними популяциями Ft=FST.
Таблица 4.1. Приложения
Историческая и генетическая датировки событий в истории генофондов
Таким образом, левая часть равенства Ft=FST оценивается нами как средняя FST=L-1∑FST(i) по данным о L множестве i-тых генов, каждый из которых может быть подвержен тому или иному типу отбора. Это означает, что генофонд данной исследуемой группы населения был изучен по широкому спектру (i) генетических маркёров. Для каждого i-ro маркёра были получены свои оценки — FST(i) — дифференциации популяций в пределах генофонда данной группы населения. Далее оценки FST(i) были усреднены по всей совокупности i-тых генов и для данного генофонда получена средняя оценка: FST. Правая же часть равенства содержит только селективно-нейтральные параметры — время t, размер популяций Ne, миграции генов Ме.
На основании этого равенства, предполагающего селективную нейтральность FST, рассчитываются оценки генохронологии — время в поколениях t, прошедшее от исходного исторического события до времени изучения этого генофонда. Время в поколениях t было умножено на среднюю величину поколения (25 лет), что позволило перейти к более привычным для нас датам солнечного календаря — в годах.
Если гипотеза верна — исторические датировки должны быть близки к генетическим датировкам. Если гипотеза неверна — между историческими и генетическими датами сходства не будет.
СРАВНЕНИЕ ГЕНЕТИЧЕСКИХ И ИСТОРИЧЕСКИХ ДАТ
Итоги генохронологии сведены в таблице 4.1. Сопоставим описанные выше исторические даты (левый столбец), полученные по данным истории и археологии, с датами генетическими (правый столбец), полученными по данным об изменчивости современного генофонда.
ХОТОНЫ. Историческая дата: постановление о переходе хотонов от земледелия к скотоводству было принято в 1934 г. Генетический календарь показал, что для генофонда хотонов переломным стал год 1936.
УЙГУРЫ и ДУНГАНЕ. По историческим данным дунгане и уйгуры переселились из Китая в 1870–1884 гг. Генетическая датировка: 1870–1886 гг.
АЛЕУТЫ. Исторически зафиксированное заселение алеутами Командорских островов приходится на 1826–1829 гг. Генетическая датировка: 1827 г.
ТОФАЛАРЫ и ТУВИНЦЫ. Исторические летописи дают двухвековой разброс для даты «рассечения» золотыми приисками земли тофаларов (XIII–XVI вв.). Генетическая датировка легла в эти пределы: 1420 г.
ВОСТОЧНО-САЯНСКИЕ ТЮРКИ. По историческим данным, начало самостоятельного этногенеза восточно-саянских тюрок, вероятнее всего, приходится на период 626–659 гг. Генетическая датировка: 640 г.
ТУНГУСО-МАНЬЧЖУРЫ ПРИМОРЬЯ. Начало этногенеза тунгусо-маньчжуров Приморья по генетической датировке определяется VI в. до н. э. Не эти ли события, вызвавшие вспышку этногенеза, привлекли внимание Конфуция (551–479 гг. до н. э.), совершившего путешествие к «восточным иноземцам»?
НАРОДЫ СИБИРИ. Средняя радиоуглеродная датировка древнейших поселений (20±2.5 тыс. лет назад) перекрывается с датировкой генохронологии (19.4±1.7 тыс. лет назад), полученной по оценкам дифференциации сибирского генофонда, включающего все современные коренные народы Сибири.
ЗАСЕЛЕНИЕ АМЕРИКИ. И, наконец, что касается времени открытия и заселения Америки, то здесь генетические часы (26 тыс. лет назад) вновь показывают такую же точность, что и радиоуглеродные (25 тыс. лет назад). Отметим ещё одно важное обстоятельство. Радиоуглеродные часы указывают на время появления археологических стоянок, на время, когда на этих стоянках горели костры (ведь угли от древних костров и используются главным образом для такой датировки). Но что стало в дальнейшем с людьми, оставившими эти стоянки? Об этом, конечно же, радиоуглеродный метод не позволяет судить. Генетические же часы говорят и об этом. Показываемая ими дата означает, что гены тех людей, что разожгли эти костры на своих стоянках тысячи лет назад, дошли до нашей современности.
Итак, все генетические датировки случайно выбранных исторических событий в происхождении самых разных народов оказались соответствующими датировкам историческим. Совпадение датировок открывает удивительную возможность анализа древней истории населения по данным о его современном генофонде, о генетической дифференциации ныне живущих популяций.
Конечно, генохронологические датировки немногочисленны и в этом отношении оставляют сомнение, как всякое ограниченное наблюдение. Однако эта ограниченность иного рода, чем та, с которой обычно мы встречаемся при статистических наблюдениях. Те исторические события, которые были подвергнуты генохронологическому изучению, рассеяны почти по всему мыслимому диапазону времени человеческой истории — от десятков лет (хотоны) до десятков тысяч лет (коренное население Сибири и Америки). Что же. касается ограниченного числа контрольных исторических дат, то число таких дат оказалось не меньше числа контрольных образцов органического вещества, которые послужили для разработки (калибровки) радиоуглеродного метода датирования.
Результаты как генохронологии, так и изучения этапов становления генофондов коренного населения Европы, Сибири и Америки [Рычков, Ящук (Балановская), 1980, 1983, 1986] свидетельствуют, что генофонд представляет не хаотическую массу генов, а исторически стратифицированную систему изменчивости генных частот, в слоях которой содержится память о событиях и этапах развития генофонда многотысячелетней давности. Для геногеографии — как истории генофонда в образах пространства — этот вывод очень важен.
Итак, геногеография создаёт пространственный образ генофонда, отображающий процесс и этапы его формирования. Из-за краткости нашей жизни практически невозможно непосредственно наблюдать генетикоэволюционные процессы в человеческих популяциях. Создание возможности такого наблюдения как за самими процессами, так и за их результатом — основная идея геногеографического подхода.
§ 2. Соответствуют ли данные генетики прогнозу?
Итак, мы выявили согласованность между историческими датами и датами генетическими, полученными по множеству генов, подверженных отбору. Что нам это дает? Прежде всего, согласованность дат, полученная для огромного диапазона человеческой истории — от современности до палеолита — говорит о точности генетической летописи, хранимой нашим генофондом. Свидетельствует о ясной и глубокой памяти генофонда. Во-вторых, она свидетельствует об объективности геногеографии, что является предметом обсуждения данного раздела.
Но самое главное для предмета всей нашей книги и возможности изучения генофонда — такая согласованность свидетельствует о селективной нейтральности средних генетических различий между популяциями FST, полученных по множеству селективно-значимых генов. Это положение лежало в основе генетических датировок: FST≈Fe=1/(4NeMe+1).
Напомним, что Fe — это величина селективно-нейтральной дифференциации генофонда. Это тот ожидаемый уровень генетических различий между популяциями, который определяется демографическими параметрами размера популяций и миграций Fe=(4NeMe +1)-1 при стационарном процессе[76], то есть когда достигнуто равновесие между дрейфом и миграциями. Стационарные распределения являются базисными во многих аспектах изучения генетической структуры популяций. Например, согласно Р. Левонтину: «… популяционная генетика — это теория, рассматривающая равновесное состояние…», причём «… в практических приложениях мы пользуемся только равновесными положениями и стационарными распределениями» [Левонтин, 1978; стр.275]. При этом стационарность генетического процесса (например, при использовании равенства Fe=[4NeMe+1]-1) обычно принимается по умолчанию. Эмпирически наблюдаемые различия между популяциями FST оцениваются как средняя арифметическая по всему набору (L) i-тых генетических маркёров, то есть FST=[L-1∑FST(i)], где i=1, 2…, L. Близость оценок FST≈Fe связана с тем, что с ходом времени FST растёт не линейно, а по экспоненте. Большая часть генетического разнообразия (40–80 % от Fe возникает уже в самые первые поколения существования дочерних популяций, как это было показано Ю. Г Рычковым для популяций Берингоморья и R. Ward для индейцев племени яномама (см. [Рычков, 1984]).
Выполнение равенства FST≈Fe означает для нас возможность изучить генофонд в целом (Fe) по отдельным генам FST(i), каждый из которых потенциально подвержен отбору[77]. Почему это для нас так важно? Потому что мы всегда имеем дело лишь с частным проявлением — отдельным геном и с его частной судьбой, столь зависимой от особенностей среды и многих иных случайностей. А нам необходимо разглядеть общее — «исторический» портрет генофонда как такового, не зависящего от превратностей судьбы того или иного гена, случайно попавшего в нашу выборку из генома.
Однако история сложна, многогранна и полна событий. Не случилось ли так, что любой генетической дате можно в истории подобрать соответствующее ей событие? Чем обширнее эрудиция автора, чем богаче его творческое воображение — тем проще подобрать к генетической дате её исторический эквивалент. Как ответить на такого рода сомнения? Любые ответы — что чем дальше вглубь, тем меньше исторических дат; что генетический смысл имеют лишь те исторические события, которые привели к переломному изменению популяционной структуры, и так далее — звучат как оправдание и оттого не убедительно. Тем более, что нас самих всегда отпугивали смелые интерпретации генетического рельефа в терминах истории — слишком велик соблазн отыскать в калейдоскопе исторических событий такое, которое может объяснить особенности географического распространения гена.
Поэтому попробуем найти другие ряды доказательств равенства FST≈Fe, пусть не столь эффектные, как генохронология, но зато более прямолинейные. Логика здесь проста. Надо сравнить не даты, а непосредственно эмпирические данные генетики (FST) и их прогноз — величину Fe, получив прогноз из качественно иных данных, не имеющих отношения к генетике.
Такие «не генетические» и вообще «не биологические» данные нам могут дать две науки. Первая наука — демография. С помощью чисто демографических оценок размера популяций Ne и миграций Ме, можно получить искомый прогноз Fe=1/(4NeMe+1). Вторая наука — лингвистика, или точнее антропонимика — наука об именах и фамилиях. Используя данные о фамилиях как об аналогах генов, можно получить независимые, не биологические и потому не зависящие от отбора (селективно-нейтральные) оценки дифференциации генофонда Fe. Обе оценки — по демографии и по фамилиям — дают прогноз величины Fe по «не генетическим» данным. Получив этот прогноз, мы можем сравнить его с эмпирической величиной FST, полученной по данным генетики.
Выражение FST≈Fe=1/(4NeMe+1) означает, что средние оценки FST, полученные по случайной репрезентативной выборке классических или ДНК маркёров, соответствуют селективно-нейтральному уровню дифференциации генофонда Fe. Этот вывод явился эмпирически обобщением, полученным в результате анализа многочисленных данных самыми разными исследователями. При этом выявлено, что случайная выборка из генома размером 20–30 локусов (или 50 аллелей) уже дает устойчивую оценку FST [Cavalli-Sforza, Piazza, 1993; Bowcock et al., 1987; Айала, Кайгер, 1988; Fuerst et al., 1977; Chacraborty et al., 1978; Nei, 1975]. Например, в работах L. L. Cavalli-Sforza и его коллег [Bowcock et al., 1991a; Bowcock et al., 1991b] считается достаточным для корректной оценки FST≈Fe лишь увеличение выборки генов, а среднее значение FST рассматривается как селективно-нейтральное без каких-либо дополнительных обоснований.
Равенство FST≈Fe принимается по умолчанию практически во всех известных нам исследованиях. Например, в обширной и детальной дискуссии, которая развернулась вокруг теста на селективную нейтральность Левонтина-Кракауэра (где Fe определяется через FST) и в которой участвовали крупные авторитеты в области популяционной генетики (R. С. Lewontin, J. Krakauer, М. Nei, Т. Maruyama, A. Robertson, W. J. Ewens, M. W. Feldman, L. B. Jorde, L. L. Cavalli-Sforza и др.) основополагающее равенство FST≈Fe ни разу не подвергалось сомнению [Nei, 1965; Cavalli-Sforza, 1966; Lewontin, Krakauer, 1973; Левонтин, 1978; Кимура, 1985; Jorde, 1981; Bowcock et al., 1991a,b; Sanchez-Mazas et al., 1994; Poloni et al., 1995; Cavalli-Sforza, Piazza, 1993].
В основе такого общепринятого подхода лежат многочисленные данные, полученные при сопоставлении генетической и не генетической информации о дифференциации генофонда. Например, в основополагающей монографии L. L. Cavalli-Sforza, W. F. Bodmer [1971] приводятся результаты изучения широкого спектра генов в различных регионах ойкумены: в подразделённой популяции Италии, в коренном населении Африки и у аборигенов Новой Гвинеи. Авторы приходят к заключению о выполнении равенства FST≈Fe: «во всех этих случаях F оценки, полученные по данным о генных частотах, и ожидаемые F оценки, полученные на основе матрицы брачных миграций, находятся в хорошем согласии» [Cavalli-Sforza, Bodmer, 1971, стр. 454].
Целенаправленно и пристально вопрос о равенстве FST≈Fe рассматривался в многочисленных работах Ю. Г. Рычкова и его школы.
Одна из наших совместных работ по этнической генетике [Рычков, Балановская, 1990 а] специально была посвящена обобщению всей накопленной информации о сравнении эмпирических оценок FST и селективно-нейтрального показателя Fe, получаемого по «не генетическим» данным.
Результаты, приведенные в таблице 4.2. убедительно свидетельствуют о близости эмпирических оценок FST и их прогноза Fe, полученного по «не генетическим» данным — как по демографии, так и по фамилиям.
При этом равенство FST≈Feоказывается необычайно устойчивым и выполняется при разных, столь варьирующих условиях (табл. 4.2.):
а) при использовании для оценки FST значительно различающихся панелей генов;
б) при анализе популяций разного происхождения (от Прибалтики до Дальнего Востока);
в) при анализе популяций разных иерархических уровней и древности — от современных народов до Сибиро-Американской общности, уходящей корнями в верхний палеолит.
Остановим внимание лишь на одном удивительном моменте: равенство FST≈Fe соблюдается даже в совокупности циркумполярных популяций Заполярья, включающей целый ряд народов Арктики — от лопарей на западе до алеутов и эскимосов на востоке [Рычков, Шереметьева, 1976; Rychkov, Sheremetyeva, 1979]. Эти популяции в течение длительного времени преемственного развития (по-видимому, ещё с донеолитической эпохи, 10-5 тыс. до н. э. [Рычков, Шереметьева, 1976; Rychkov, Sheremetyeva, 1979]) испытывали мощное давление экстремальных условий среды, чрезвычайно суровой и практически однородной во всем огромном ареале Заполярья. Естественно было бы ожидать, что именно в этих популяциях мощное давление однородной среды отклонит оценки разнообразия FST от селективнонейтрального уровня Fe и приведёт к нарушению равенства FST≈Fe Однако этого не произошло].
Показанное сохранение равенства FST≈Fe даже в подразделённой популяции, находящейся в столь экстремальных условиях и занимающей обширнейшую территорию (все Заполярье Восточного полушария площадью 3750 км2), указывает, что в менее экстремальных ситуациях мы тем более можем определять селективно-нейтральную изменчивость Fe через среднюю оценку FST по репрезентативной выборке генов.
§ 3. Надёжны ли оценки изменчивости генофонда?
В этом разделе мы рассмотрим вопрос об устойчивости оценок изменчивости генофонда и попробуем сформулировать те правила, выполнение которых позволяет рассчитать надёжные устойчивые величины.
Итак, мы доказали согласованность (FST≈Fe) между эмпирическими оценками дифференциации генофонда FST и прогнозом Fe, полученном по трем независимым рядам данных — исторических датировок (§ 1), данных демографии и антропонимики (§ 2). Это дает нам полное право использовать обобщение, проведённое по выборке генов, для характеристики генофонда в целом.
Однако следует ответить ещё на два вопроса. Во-первых, какую часть генов (а, следовательно, и тотального генофонда) описывают оценки FST, получаемые по выборке полиморфных генов? А во-вторых, насколько надёжны такие оценки? Иными словами, насколько они устойчивы? В какой степени зависят от набора генетических маркёров, от набора популяций, от набора использованных методов?
Таблица 4.2. Приложения
Сравнение двух оценок дифференциации генофонда: эмпирических FST
Примечания:
* данные, источники информации, методы, доверительные интервалы и характеристика генных маркёров (наборы которых существенно отличаются друг от друга) приведены в цикле работ, выполненных учениками Ю.Г. Рычкова под его руководством. Поскольку сейчас нам уже сложно восстановить точно, какие именно исследования были выполнены каким коллективом соавторов, отсылаем читателя к работам, где приведены краткие сводки этих работ и данных [Рычков, 1984; Рычков, 1986; Рычков, Балановская, 1990 а].
** данные по адыгейцам [Балановская и др., 1999].
Специально проведённые исследования [Балановская, Рычков, 19906,в; Рычков, Балановская, 1990а] позволили сформулировать два вывода.
ВЫВОД 1
Средние оценки различий между популяциями FST≈Fe, полученные по классическим и ДНК маркёрам, адекватно описывают межпопуляционное разнообразие структурных генов генома. При этом они не зависят от того, получены ли они по классическим (иммуно-биохимическим) маркёрам или же по ДНК маркёрам (молекулярно-генетическим). Согласно [Bowcock et al., 1987; Рычков/ Балановская, 19906; Bowcock et al., 1991a,b; Cavalli-Sforza, Piazza, 1993] с помощью таких оценок FST мы описываем средний уровень изменчивости аутосомных генов — наиболее значительной части генома, включая не только уникальные последовательности ДНК, но и мини- и микросателлитные последовательности [Лимборская и др., 1998; Беляева и др., 1998]).
Отметим, что факт независимости Fst от типа маркёров — классические или ДНК — до сих пор порой вызывает недоумение. Ход рассуждения таков. Как же так? Классические маркёры определяются по их белковым продуктам, и потому должны быть намного сильнее подвержены отбору, чем ДНК маркёры — случайно взятые фрагменты ДНК, в большинстве своем от отбора укрытые. Из этого делается, казалось бы, логический вывод, что изменчивость (FST) классических маркёров, ограничиваемая отбором, должна быть намного меньше, чем изменчивость ДНК маркёров. Ошибка «логики» здесь в том, что она помнит только о стабилизирующем типе отбора, сужающим изменчивость (FST), забывая о дифференцирующем отборе, который может увеличить изменчивость гена (FST) по сравнению с селективно нейтральной. Если же выборка генов случайна по отношению к отбору — то отбор не в силах сместить среднюю оценку FST.
Данные, приведённые в таблице 4.3. для мирового генофонда (и подробнее рассмотренные в разделе 8.1.) демонстрируют очень хорошее согласие между классическими и ДНК маркёрами в оценках различий между популяциями. Причём для восточноевропейского генофонда анализ проведён максимально строго. Во-первых, и ДНК, и классические маркёры анализируются в Восточной Европе по полностью идентичному набору этносов. А это очень важный момент. Представим, что в одну выборку народов Восточной Европы мы бы включили только восточных славян, а в другую — и восточных славян, и лопарей, и калмыков, и народы Кавказа. Понятно, что реальных размах генетических различий во второй выборке должен быть намного шире, чем в первой (чисто «славянской»). И тогда разница между уровнями изменчивости двух типов маркёров могла бы быть вызвана не тем, что изучены разные маркёры, а тем, что изучены разные наборы народов. Во-вторых, в выборку ДНК маркёров включены, главным образом, высокополиморфные мини- и микросателлитные маркёры. Это привело к тому, что уровень гетерозиготности HS оказался в два раза (!) выше, чем по классическим маркёрам. И, несмотря на это, оценки межпопуляционных различий FST оказались одинаковы (раздел 7.1). Такое соответствие оценок FST по классическим и ДНК маркёрам — при идентичном наборе популяций и резко различном размахе полиморфизма (гетерозиготности) — указывает на то, что мы получаем не частную оценку изменчивости конкретной выборки генов, а общую оценку изменчивости генофонда.
ВЫВОД 2
Средние оценки различий между популяциями генофонда (FST≈Fe) обладают высокой устойчивостью. В таблице 4.3. приведены четыре ряда оценок разнообразия мирового генофонда, полученных принципиально различными методами [Levontin,1972; Latter, 1980; Рычков, Балановская, 1990 б; Bowcock et al., 1987]. Все ряды оценок резко различаются по всем исходным параметрам: по числу изученных народов мира и их составу; по числу генных маркёров и их составу; и даже сами меры межпопуляционного разнообразия — различны. Общими для этих работ были лишь охват всего мирового разнообразия в целом и проведение исследования на едином (этническом) уровне популяционной системы. При этом оценки межпопуляционного разнообразия FST оказались чрезвычайно устойчивыми и индифферентными к методическим расхождениям авторов. Характер маркёров — белковые продукты генов [Levontin, 1972; Latter, 1980; Рычков, Балановская, 1990 а] или же ДНК-полиморфизм [Bowcock, 1987; Bowcock et al., 1991a; Bowcock, Cavalli-Sforza, 1991] — также не сказался на значениях FST и HS (табл. 4.3).
Полученный результат является важнейшим свидетельством устойчивости средних оценок разнообразия генофонда.
НАСКОЛЬКО УСТОЙЧИВЫ ОЦЕНКИ ДИФФЕРЕНЦИАЦИИ ГЕНОФОНДА?
Основываясь на приведённых данных, кратко ответить на этот вопрос можно так.
Средние оценки дифференциации генофонда FST, полученные по репрезентативному набору полиморфных маркёров (и по классическим, и по ДНК маркёрам) характеризуют основную часть генофонда. Эта характеристика отражает селективно-нейтральный процесс формирования генофонда. При корректной организации материала (выборка генов, выборка популяций, выборка индивидов), эта характеристика является чрезвычайно устойчивой, что можно считать отражением реального уровня изменчивости генофонда.
Таблица 4.3. Приложения
Устойчивость средних характеристик генного разнообразия: межпопуляционного FST и внутрипопуляционного HS
Однако, сужая масштаб исследования — переходя от генофонда всей ойкумены, всего человечества ко всё более дробным уровням популяционной структуры, — мы переходим к исторически менее устойчивым генофондам и должны быть готовы к менее устойчивым оценкам генного разнообразия. Здесь от исследователя требуются особая методическая точность и чуткость, чтобы компенсировать сужение масштаба исследований. Это особенно важно, когда мы переходим к анализу лишь одного этноса.
Не претендуя на полноту, попробуем обобщить методические требования к изучению генного разнообразия в подразделённых популяциях меньшего размера, чем ойкумена.
ТРЕБОВАНИЕ ПЕРВОЕ: ЕДИНЫЙ УРОВЕНЬ ПОПУЛЯЦИОННОЙ ИЕРАРХИИ
Это требование означает, что нельзя включать в один анализ, например, данные о народах в целом (среднеэтнические) и данные о локальных популяциях внутри этноса.
Иерархичность организации генофондов не требует специальных доказательств. Определим популяцию человека как исторически сложившуюся, занимающую определённый ареал и устойчивую в поколениях совокупность людей, генетический вклад которых в каждое последующее поколение своей популяции больше, чем вклад мигрантов (пришельцев из иных популяций).
Такой генетический вклад (соотношение генов из «своей» популяции и из «иных» популяций среди всех генов, переданных в следующее поколение) рассчитывается на основе брачных миграций и оценивается через гаметный вклад. Кроме генофонда человечества, то есть видовой популяции Н. sapiens (гаметный вклад которой по определению 100 %, поскольку нет межвидовых скрещиваний), этому определению наиболее бесспорно отвечают этносы — племёна, народности, народы, нации. Этнографы и антропологи знают: если в каком-либо этносе начинают устойчиво преобладать браки с пришельцами из иных народов, значит, дни этого этноса могут быть сочтены. Этнический уровень организации популяционной иерархии существует как данная нам реальность: сами этносы, уровень их эндогамии, их история, динамика их ареалов определены достаточно рельефно, благодаря этническому самосознанию [Долуханов, 2000]. Именно поэтому выбор как единиц исследования именно этносов (а не административных или территориальных групп населения) позволяет сравнивать примерно на едином уровне иерархии даже столь разные генофонды, как, например население Европы и коренные народы Америки [Рычков, Ящук (Балановская) 1980, 1982, 1983, 1984,1986; Rychkov, Yashchuk (Balanovskaya), 1985].
Для проведения исследования на иных уровнях популяционной иерархии (выше или ниже этноса) требуется реконструкция популяций с помощью разных наук — демографии, этнографии, лингвистики, антропологии. Даже при выделении наиболее очевидного уровня элементарных популяций необходимо учесть гаметный вклад. Показано, что даже в разных частях ареала одного и того же этноса — русского народа — элементарным популяциям соответствуют разные группы населения: отдельные деревни (Архангельская, Вологодская области), сельсоветы (Костромская область), группы сельсоветов (Кировская область), районы (Белгородская область) и даже группы районов (Краснодарский край) [Пасеков, Ревазов, 1975; Ревазов и др., 1979, 1988; Сладкова и др., 1990; Брусинцева и др., 1993; Сорокина, 2005].
При изучении подразделенного генофонда необходимо стремиться к тому, чтобы все изучаемые субпопуляции принадлежали к одному уровню популяционной иерархии — будь то элементарные популяции или этносы. Нарушение этого требования может исказить оценки межпопуляционного разнообразия. Как бы ни было трудно фиксировать уровни популяционной иерархии, ещё больше осложнений возникнет, если их не выявить, если включить в анализ популяции безотносительно к их рангу в популяционной системе.
Поясним на примере. Даже в крупных исторически сложившихся популяционных системах (таких, как коренное население Америки, Сибири, Европы) третья часть всей межпопуляционной изменчивости FST (рис. 4.1.) приходится на разнообразие популяций в пределах этноса [Рычков, Ящук (Балановская), 1980, 1982, 1983, 1984, 1986; Rychkov, Yashchuk (Balanovskaya), 1985].
Рис. 4.1. Соотношение внутри- и межэтнической дифференциации в генофондах коренного населения Европы, Сибири и Америки
Рис. 4.2. Соотношение внутри — и межэтнической дифференциации в субгенофондах Сибири
Теперь спустимся на один популяционный уровень — к субрегионам (рис. 4.2.) и рассмотрим три субрегиона Сибири — Западную, Среднюю и Восточную Сибирь. Мы видим, что в них на разнообразие популяций в пределах этноса приходится уже много больше — две трети от всей межпопуляционной изменчивости FST субрегиона (рис. 4.2). Предположим, что исследование Средней Сибири будет проведено на уровне этносов, а Восточной Сибири — на уровне локальных популяций. Из рис. 4.2. ясно, что будет нельзя сравнивать полученные оценки изменчивости! Мы видим, что дифференциацию Средней Сибири в этом случае мы занизили в три раза (откинув 63 % всей изменчивости, которая приходится на различия локальных популяций внутри этноса) по сравнению с Восточной Сибирью.
Например, исследователь № 1 решил сравнить два субрегиона — Среднюю и Восточную Сибирь. При этом он совершил ошибку смешения разных уровней иерархии, смешения разных «матрёшек»: в Средней Сибири — оценил различия между этносами, а в Восточной Сибири — между локальными популяциями. Иными словами, он оценил разнообразие генофонда Средней Сибири (обозначим как MS) по различиям между его народами — долганами, нганасанами, кетами, энцами и другими. Он включил в анализ средние частоты для каждого народа (этнический уровень). В этом случае он получил бы в результате величину FST(MS-№ 1)=2.59[78], А в Восточной Сибири (ES) исследователь № 1 включил в анализ у бурят — все 17 изученных популяций, а не одну «средне-бурятскую» частоту, для эвенов — включил все 15 изученных популяций вместо «средне-эвенской», для якутов — все 36 популяций, для юкагиров — все 4 популяции. И так далее. То есть в Восточной Сибири он провёл анализ на другом уровне — уровне различий локальных популяций в регионе, а не этносов. Поэтому он получил бы в результате величину FSТ(ЕS-№ 1)=6.37. Сравнив изменчивость двух субрегионов Сибири, исследователь № 1 пришёл бы к выводу, что разнообразие генофонда Средней Сибири (2.59) намного меньше, чем Восточной Сибири (6.37): FST(MS-№ 1)<<FST(ES-№ 1).
Предположим, что исследователь № 2 также решил сравнить эти два субрегиона. Он совершил ту же ошибку смешения уровней иерархии, смешения разных «матрёшек», только как бы наоборот: в Средней Сибири — оценил различия между локальными популяциями, а в Восточной Сибири — между этносами. То есть, рассматривая генофонд Средней Сибири, он включил в анализ все 8 популяций долган вместо «средне-долганской» (как делал исследователь № 1), все 4 популяции нганасанан вместо «средненганасанской», все 5 популяций кетов, все 4 популяции энцев и т. д. Иными словами, в Средней Сибири он провёл анализ на уровне локальных популяций, а не этносов. Тогда он получил бы в результате величину FST(MS-№ 2)=7.00. А в Восточной Сибири исследователь № 2 поступил включил в анализ у нивхов Сахалина одну «средне-нивхскую» частоту, для эвенов — «среднеэвенскую», для якутов — «средне-якутскую», для юкагиров — «средне-юкагирскую». И так далее. То есть в Восточной Сибири он провёл анализ на уровне не локальных популяций, а этносов. Тогда он получил бы в результате величину FST(MS-№ 2)=2.36. Сравнив изменчивость, исследователь № 2 пришёл к выводу, что разнообразие генофонда Средней Сибири (7.00) намного больше, чем Восточной Сибири (2.36): FST(MS-№ 2)>> FST(ES-№ 2)!
Итак, оба исследователя изучали одни и те же регионы, использовали одну и ту же базу данных, исходные данные у них были совершенно одинаковы. Но выводы их оказались диаметрально и статистически достоверно (!) противоположны. И при этом оба вывода неверны. На самом деле изменчивость этих двух генофондов практически одинакова, причём на любом из уровней иерархии! На уровне различий между популяциями субрегионов в Средней Сибири FST(MS)=7.00, а в Восточной Сибири FST(MS)=6.37. На уровне различий между этносами субрегионов в Средней Сибири FST(MS-ET)=2.59, а в Восточной Сибири F8T(ES-ET)=2.36. А единственная причина, по которой получены совершенно неверные выводы лишь в том, как они организовали одни и те же данные, на каком уровне популяционной иерархии проводили анализ — причина в смешении разных уровней иерархии, сравнении разных «матрёшек».
Поясним ещё одним примером — реальным. Авторитетный исследователь[79] изучил один из коренных народов Сибири, и получил величину различий между популяциями этого народа FST(данного этноса)≈9. Много это или мало? Чтобы ответить на этот вопрос, он сравнил с величиной изменчивости популяций Сибири FST(Сибири)≈11. И сделал вывод, что различия популяций этого этноса несколько меньше, чем это принято в Сибири, но, в общем-то, такие же, как для других сибирских народов. Но вся беда в том, что та величина, с которой он сравнивал свой единственный этнос, FST(Сибири)≈11, охватывает популяции не одного этноса, а все популяции всех этносов Сибири! Иными словами, в эту величину (FST(Сибири)≈11) уже вошли не только различия между популяциями усредненного сибирского этноса, но и различия между всеми народами всей Сибири. На рисунке рис. 4.1. мы видим, что средняя гетерогенность сибирского этноса (различия между популяциями одного «усредненного» народа Сибири) составляет треть от FST(Сибири)≈11, то есть примерно FST(среднего этноса)≈3. Это означает, что народ, изученный этим исследователем, обладает уникально огромными различиями между популяциями — в три раза большими, чем для среднего этноса Сибири! Что требует специальных исследований и объяснений. Налицо совершенно неверный вывод — гетерогенность этого сибирского этноса (на изучение которого было потрачено столько сил!) вовсе не меньше среднего по Сибири (как заключил автор), а в три раза больше «нормы»! И столь ошибочный вывод был сделан лишь потому, что автор забыл об уровнях популяционной иерархии.
Ошибка FST, заданная неправильной организацией материала, столь велика, что сопоставление генофондов теряет всякий смысл: FST зависит уже не от свойств генофонда, а лишь от соотношения этносов и локальных популяций в выборке. Если наиболее изученные регионы (или гены) исследованы на уровне локальных популяций, а менее изученные — на уровне этносов, то оценки FST(i) — только за счет выборки популяций — для наиболее изученных объектов будут на треть-две трети больше, чем для слабо изученных. В этом случае сравнение регионов (или генов) будет отражать только ошибку в организации данных, а не особенности генофонда. Сравнительное изучение дифференциации региональных генофондов или разных генов в этом случае проблематично: оценки абсолютно ненадёжны, независимо от того, каковы статистические оценки их достоверности.
Поэтому, сравнивая дифференциацию разных генов FST(i) при анализе одного и того же генофонда, мы должны включать в анализ популяции одного и того же иерархического уровня. Когда мы переходим к сравнению генофондов разных регионов, то здесь добавляется ещё одно требование: иерархические уровни самих регионов, самих тотальных популяций должны быть идентичны.
Например, корректно сравнивать по величине дифференциации (FST) генофонды таких регионов, как Европа, Сибирь и Америка — они находятся на одном иерархическом уровне. Можно сравнивать субрегионы — генофонды Средней Сибири и Северной Европы — они также находятся на одном иерархическом уровне (субрегионов). Но нельзя сравнивать субрегион с регионом — например, Среднюю Сибирь с Европой в целом, считая их равноценными партнерами сравнения, забывая об их иерархии. Это наглядно видно из сравнения рис. 4.1. и 4.2. — легко рассчитать, что дифференциация FST Сибири в два раза больше, чем дифференциация её субрегионов. Значит, сравнивая Среднюю Сибирь и Европу, мы сравниваем «половинку» с «целым», приравниваем их. Что же сказать о таких сравнениях, как дифференциация отдельного этноса и региона в целом? В этом случае малая часть (треть или даже четверть) как бы приравнивается к целому! Выводы таких сравнений — а их немало в популяционных публикациях — содержат столь крупную методическую ошибку, что она сводит на нет все усилия авторов. Иными словами, сравнение популяций разных иерархических уровней содержит в себе очень серьёзную ошибку и приводит к заведомо неверным результатам, если при интерпретации мы забываем о разном «ранге» сравниваемых популяций.
ТРЕБОВАНИЕ ВТОРОЕ: ПОЛИМОРФИЗМ ГЕНЕТИЧЕСКИХ МАРКЕРОВ
Это требование налагает запрет на включение в анализ редких аллелей.
Надёжность эмпирических оценок FST(i) зависит от уровня полиморфизма изучаемых генов. Эта важно учитывать при оценке селективных сил, поскольку при низком уровне полиморфизма (то есть если частота аллеля близка к 0 или 1) динамика частот генов «будет независима не только от далекого прошлого, но, возможно, и от недавней истории процесса отбора» [Левонтин, 1978].
Традиционно предлагаются два критерия полиморфизма: 1 % (то есть 0.01≤q≤0.99) и 5 % (0.05≤q≤0.95). Иногда — например, при исследовании гетерозиготности Н — вводятся и более жесткие рамки: Н>0.02, что соответствует 0.14≤q≤0.86. Необходимость введения критерия полиморфизма при анализе FST-статистик убедительно показана при компьютерном моделировании FST(i) при разных значениях генных частот (i) (рис. 4.3., приводится по [Bowcock et al., 1991]). Из графика видно, что при средней частоте гена в тотальной популяции q<0.05 оценки межпопуляционной изменчивости FST(i) варьируют случайным образом в чрезвычайно широком диапазоне. Они выходят на плато при q≈0.05 и практически неизменны при q>0.10. Вспомним, что для достоверного определения FST(i) и q при малых концентрациях гена необходимы ещё и огромные популяционные выборки: чем меньше частота аллеля, тем больше должна быть выборка для того, чтобы эта частота достоверно отличалась от нуля. Из этого становится ясно, как важно следовать критерию полиморфизма, и сколь высока возможность ошибки при включении генов с низким уровнем полиморфизма (редких аллелей).
Рис. 4.3. Компьютерное моделирование ожидаемых оценок межпопуляционного разнообразия FST в отсутствие отбора.
По оси абсцисс — частота гена q; по оси ординат — FST; % — вероятность значений FST (квантили) по [Bowcock et al., 1991].
Насколько велика может быть эта ошибка, видно, например, из двух опубликованных оценок дифференциации коренного населения Австралии по гену FY*B: 1) FST(i)=0 при q=0.00 [Балановская, Рычков, 1990]; 2) FST(i)=8.5 при q=0.01 [Cavalli-Sforza, Piazza, 1993]. Величина FST(i)=8.5 очень велика — она составляет половину изменчивости человечества (FST=14.5, табл. 4.3). Насколько можно судить по приведенным данным, во второй работе в выборку попали метисы коренных австралийцев с европейцами (у которых частота этого гена существенна) — такой случайности достаточно, чтобы на порядок изменить не реальную дифференциацию коренных австралийских популяций, а получаемую оценку дифференциации низко полиморфного гена.
Итак, включение в выборку низко полиморфных генов приводит к неустойчивости (непредсказуемости оценок дифференциации генофонда FST, а также к отклонению от изменчивости по селективно-нейтральному типу (то есть FST≈Fe).
Именно поэтому для получения устойчивых оценок дифференциации генофонда FST желательно использовать выборки генов, соответствующию строгому критерию полиморфизма: 0.05≤q≤0.95. Это важно ещё и потому, что для слабо полиморфных генов велика не только случайная ошибка. На её фоне проявляется и систематическая ошибка: включение слабо полиморфных генов вызывает занижение средней оценки дифференциации FST.
Поясним этот момент. На рис. 4.4. представлены оценки для шести основных регионов мира из сводки [Cavalli-Sforza et al.,
1994]. Мы рассчитали их в двух вариантах: 1) по всем маркёрам (0<q<l, левый столбик); 2) с учетом критерия полиморфизма (0.05<q<0.95, правый столбик). Мы видим, что для всех регионов пренебрежение критерием полиморфизма привело к занижению изменчивости генофонда. Лишь в Европе различия между обеими оценками невелики — видимо оттого, что именно европейские ученые и выбирали панель классических маркёров для популяционных исследований: в Европе они большей частью полиморфны.
Итак, рассмотрение разных оценок изменчивости генофондов основных регионов мира выявило, что устойчивость оценок FST связана с тремя факторами: 1) долей низко полиморфных генов; 2) средним уровнем их полиморфизма; 3) организацией данных о генофонде. Существует ещё один фактор — использование маркёров одного или же разных типов. Чтобы учесть его, необходимо выполнить ещё одно требование к организации исходных данных.
ТРЕБОВАНИЕ ТРЕТЬЕ: РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ ГЕННЫХ МАРКЕРОВ
Это требование означает, что нельзя включать в анализ маркёры одного лишь типа — это может привести к смещению полученных оценок изменчивости.
Структура генофонда отражена в результатах его изучения с той или иной точностью. Но, как положено в естественных науках, два корректных исследования одного и того же параметра для одного и того же генофонда должны привести к одинаковым выводам. Конечно же, число генов, по изменчивости которых делается вывод об изменчивости всего генофонда, должно быть достаточно велико, но оно всегда намного меньше общего числа генов в геноме (и, соответственно, в генофонде). Поэтому обобщённая изменчивость в разных исследованиях может определяться по совершенно разным, не перекрывающимся множествам генов, но результаты этих исследований все равно должны совпасть.
Это и понятно, поскольку целью этих работ является не изучение изменчивости данного набора генов, а исследование закономерностей генофонда. И если сравнивается изменчивость двух разных типов генов в одном и том же ареале, то ожидаемым и естественным должно быть совпадение результатов. Если же результаты несходны, то это тревожный знак того, что, по крайней мере, одна из систем не дает оценку «обобщённого гена», по крайней мере, один из результатов неверен. Неверен в том смысле, что он не отражает общую структуру генофонда, хотя возможно, вполне удовлетворительно описывает изменчивость данного набора генов.
Это снова подводит нас к вопросу о том, сколько и каких конкретных генов надо включить в анализ, чтобы их совокупная изменчивость соответствовала изменчивости некоего «обобщённого гена», отражала изменчивость не конкретного набора генов, а генофонда в целом. Но прежде ещё раз подчеркнём, что характеристику генофонда можно получить по разным панелям генетических маркёров, и все эти оценки могут быть правильными и равноценными и, что наиболее существенно, они должны совпадать друг с другом.
Формулируя требования к репрезентативности выборки генов — по отношению ко всему геному — важно учитывать обе её стороны, количественную и качественную.
1) КОЛИЧЕСТВЕННЫЙ АСПЕКТ ФОРМИРОВАНИЯ ВЫБОРКИ — ЧИСЛО ГЕННЫХ МАРКЁРОВ В ДАННОЙ ПАНЕЛИ.
Разные авторы пришли к эмпирическому обобщению, что, как правило, выборка примерно из 20–30 локусов (или ≈50 аллелей) является достаточной для надёжной оценки FST. При дальнейшем увеличении выборки средняя оценка FST практически не меняется [Bowcock et al., 1987; Айала, Кайгер, 1988; Cavalli-Sforza, Piazza, 1993]. Меньшая выборка генов тоже может давать корректные результаты, но необходима проверка её корректности. Меньшая выборка требует обязательного контроля её репрезентативности с помощью прямых оценок Fe (§ 2) или иных доказательств её адекватности и соблюдения равенства FST=Fe.
Рис. 4.4. Оценки селективно-нейтральной дифференциации генофондов FST≈Fe для основных генофондов коренного населения ойкумены
Примечания: заштрихованные столбцы — оценка по всем генам (0<q<1); черные столбцы — оценка по генам, удовлетворяющим пятипроцентному критерию полиморфизма (0.5<q<0.95)
2) КАЧЕСТВЕННЫЙ СОСТАВ ВЫБОРКИ ГЕНОВ ИЗ ГЕНОМА — ЕЁ СЛУЧАЙНОСТЬ ПО ОТНОШЕНИЮ К ДЕЙСТВИЮ ЕСТЕСТВЕННОГО ОТБОРА.
Если в выборке будут преобладать гены, подверженные стабилизирующему отбору — средняя оценка FST будет занижена. Если будут преобладать гены, на которые действует дифференцирующий отбор — средняя оценка FST будет завышена по сравнению с истинной, селективно-нейтральной дифференциацией генофонда. При этом важно знать, что некоторые типы маркёров — например генетико-биохимические маркёры (в отличие от иммунологических) [Балановская, 1998] или, тем более, гены наследственной патологии — всегда занижают среднюю оценку FST, поскольку для них преобладающим является стабилизирующий отбор.
В разных разделах мы приводили целый ряд примеров высокой устойчивости FST и выполнения равенства FST=Fe при использовании очень разных наборов классических маркёров. Адекватные выборки генов различаются столь сильно и по их размеру, и по их составу, что невозможно определить иное «правило» для их создания, чем случайность по отношению к эффектам отбора (что обычно обеспечивается включением в выборку самых разных типов классических маркёров). Более того, новые аутосомные маркёры не меняют картины: накапливающаяся информация по ДНК маркёрам указывает, что их средние FST близки к FST=Fe, определяемым по «классическим» маркёрам (см., например, табл. 4.3. и раздел 8.1). При включении в выборку новых маркёров со своеобразной функцией в организме, с особым характером микроэволюции, требуется специальная проверка выполнения для них равенства FST≈Fe.
Такая проверка была проведена, например, для генов, связанных с иммунным ответом, для системы HLA (human leukocytal antigen) [Евсеева, 2001]. Ряд тесно сцепленных локусов этой генетической системы обладает выраженным полиморфизмом: панель аллельных вариантов каждого локуса необычайно обширна, поскольку обеспечивает генетический контроль иммунного ответа. Одни и те же народы Крайнего Севера, представляющие три разных лингвистических семьи, были изучены как по панели аллелей HLA (проверялось наличие 160 аллелей 6 локусов HLA-I и HLA-II классов), так и по панели классических маркёров (15 аллелей 5 локусов иммуно-биохимического полиморфизма). Каждый аллель HLA природой предназначен для ответа на запросы особой внешней среды. Поэтому можно было ожидать, что оценки дифференциации FST системы HLA — причём в экстремальных условиях Крайнего Севера! — будут чрезвычайно смещены (FST≠Fe) от селективно-нейтральных. Однако проверка показала, что — вопреки ожиданиям — средняя оценка дифференциации по системе аллелей HLA соответствует селективно-нейтральной дифференциации! Видимо, разнообразие факторов среды, на которые система HLA обеспечивает иммунный ответ, столь велико, что все разнонаправленные векторы компенсируют и взаимно «гасят» друг друга при расчёте средних оценок FST. В силу исключительного высокого полиморфизма система HLA дает устойчивую и объективную картину различий между генофондами.
§ 4. Сравнение основных регионов мира
При рассмотрении русского генофонда мы учитывали характеристики генофонда ойкумены и генофондов коренного населения всех крупных историко-географических регионов мира. Поэтому кратко сравним их (табл. 4.4. и 4.5.). Эти характеристики, полученные в цикле работ Ю. Г. Рычкова и Е. В. Балановской, являются наиболее полным обобщением данных о генофонде всех регионов мира по классическим маркёрам, и поэтому служат важнейшим дополнением к обобщающей монографии Кавалли-Сфорца с соавторами [Cavalli-Sforza et а., 1994].
ОРГАНИЗАЦИЯ ДАННЫХ
Эти характеристики получены по репрезентативной выборке классических маркёров (49 аллелей 20 локусов) и с учетом иерархической структуры популяций — в каждом из регионов в качестве популяций выступают этносы. Всего по частотам генов в -50000 популяций были получены характеристики 5135 этносов, в среднем по каждому локусу изучено 257 народов мира. Для всех видов анализа и во всех генофондах выполнены единые требования: репрезентативность и единообразие выборки генов для всех генофондов; достаточный уровень полиморфизма; единый уровень анализа популяционной системы (этнический); единый исторический масштаб и целостность генофондов (историко-географический регион).
Организованный таким образом генофонд в наибольшей степени отвечает как требованиям, предъявляемым к объектам популяционно-генетического анализа, так и основным положениям и моделям теоретической популяционной генетики (в частности, предположению о стационарности генетического процесса).
Во-первых, генофонд ойкумены является сложно организованной популяционной системой самого высокого уровня и потому обладает наибольшей устойчивостью средних генных частот во времени. Во-вторых, этносы являются не только наиболее точно фиксированными и универсальными популяционными единицами, но и сами обладают высокой устойчивостью средних генных частот. В-третьих, историко-географические регионы — в отличие от чисто географических, политических, расовых, культурологических или конфессиональных подразделений — наиболее полно и комплексно отражают вехи в пространственно-временной эволюции генофонда Homo sapiens. Они не позволяют оставить за рамками анализа те группы населения, которые по демографическим параметрам или темпам социально-экономического развития находятся на периферии современности (поскольку вклад популяции в генофонд человечества не определяется её численностью и динамичностью на данном временном срезе).
Таблица 4.4. Приложения
Организация данных о коренном населении историко-географических регионов
Пояснения требуют лишь два момента.
Историко-географические регионы охватывают все коренное народонаселение ойкумены за исключением населения Северной Африки: им пришлось пожертвовать, поскольку его включение в регион, объединяющий народы Европы и Юго-Западной Азии, могло показаться слишком смелым решением — также, как и выделение его в отдельный регион Средиземноморья в целом (Северная Африка, Южная Европа, Ближний Восток); а объединение с населением «черной Африки» неверно по существу — по истории генофондов Северной Африки и Африки южнее Сахары.
Второй момент — объединение Европы и Юго-Западной Азии в один генофонд. Хотя все расчёты сначала были проведены и для каждого из этих регионов отдельно, однако их тесная связь на протяжении всей истории Homo sapiens (по крайней мере, последних 40 тысяч лет) столь ярко проявилась в особенностях их общего генофонда (самая низкая межпопуляционная изменчивость и самая высокая гетерозиготность), что дробить этот общий генофонд в угоду европоцентризму мы не стали. Дело в том, что генетические различия между народами Европы очень малы. Мы объединили народы европейской оконечности Евразии с народами Юго-Западной Азии, чтобы показать, что даже в этом случае эти различия остаются малыми.
Анализируется репрезентативная выборка генов (49 аллелей 20 локусов). Для анализа была использована сводка [Mourant et al., 1976]. В ней подведен итог тому этапу изучения генетики человека, когда реестр маркёров представлял собой достаточно случайную выборку из генофонда и потому мог служить надёжной основой для характеристики «обобщённого» гена. Население Северной Евразии в сводке практически не представлено и информация о нем взята из Банка данных «GENE POOL» (см. главу 3). Историко-географические регионы выделены согласно [Mourant et al., 1976; Брук, 1981]. На основе популяционных частот 49 аллелей мы рассчитали частоты для каждого из народов мира.
Основные характеристики генофондов мира сведены в таблице 4.5. Дадим только краткое описание некоторых параметров (подробно см. [Балановская, 1998]).
Таблица 4.5. Приложения
Сравнительные характеристики генетического разнообразия (Hj, HS, FST), генетических расстояний (d) и корреляции селективной структуры (к) в иерархической популяционной системе ойкумены
ГЕНЕТИЧЕСКИЕ РАССТОЯНИЯ «РЕГИОН — МИР»
Степень сходства по частотам генов между каждым из регионов с одной стороны и ойкуменой с другой стороны определена через генетические расстояния dРЕГ-МИР (рис. 4.5., табл. 4.5.). Диапазон различий оказался чрезвычайно велик: он достигает трёхкратного уровня, колеблясь от 0.108 в Северной Евразии до 0.360 в Австралии. Коренное население Австралии, Африки и Меланезии в пространстве генных частот значительно удалено от мировых средних (dРЕГ-МИР>0.24), то есть эти регионы генетически своеобразны, они являются «генетическими окраинами» ойкумены. Ближе находятся Евразийские регионы (В.Азия, Индостан и Европа), и наиболее близок к мировому «генетическому центру» (dРЕГ-МИР=0.108) генофонд Северной Евразии.
Рис. 4.5. Средние генетические расстояния dРЕГ-МИР между генофондом каждого региона и мировым генофондом.
ГЕНЕТИЧЕСКОЕ РАЗНООБРАЗИЕ
Для каждого генофонда рассчитаны (табл. 4.5.) три основные характеристики генного разнообразия [Nei, 1975] в среднем по всем генам: НT — общее разнообразие региона, HS — средняя гетерозиготность этносов (рис. 4.6.); GST≈FST — дифференциация этносов в регионе. Мы видим, что уровень гетерозиготности HS в коренном населении трех регионов достоверно выше, чем в среднем по всем генофондам: он выше в Европе, Северной Евразии, Индостане (HS>0.32).
Рис. 4.6. Внутрипопуляционное разнообразие HS регионов мира
Достоверно снижена гетерозиготность коренного населения Австралии и Америки (HS<0.25).
Уровень межэтнических различий FST концентрирует в себе итоги микроэволюции генофонда, связанные с эффектами генных миграций и дрейфа генов: размах различий по FST между регионами во много раз выше, чем по HS и Нт (табл. 4.5). Достоверно выше среднерегионального FST в Америке и Меланезии, достоверно ниже — в населении Европы и В. Азии.
Население Северной Евразии характеризуется высоким уровнем всех показателей генетического разнообразия: по уровню общего разнообразия НT этот генофонд занимает первое место в мире; по уровню гетерозиготности HS — второе; по уровню FST — третье место в мире.
Рис. 4.7. Сходство селективной структуры генофонда каждого региона с мировым генофондом
Приведён показатель сходства k — коэффициент контингенции.
СЕЛЕКТИВНАЯ СТРУКТУРА
Направление и интенсивность отбора оценивались через отклонения FST(i) от селективно-нейтрального уровня FST. Рассмотрен новый параметр генофонда — его селективная структура, в которой выделяются три класса генов. Класс «LOWER DIFF» включает гены, дифференциация которых достоверно ниже селективно-нейтральной: FST(i)<FST; для этих генов выдвигается гипотеза стабилизирующего отбора. Класс «NEUTRAL» включает условно-нейтральные гены с межпопуляционной изменчивостью FST(i), достоверно близкой к селективно-нейтральнои: FST(i)≈FST. Класс «SUPER DIFF» включает гены, дифференциация которых достоверно выше селективно-нейтральной: FST(i)>FST; для этих генов выдвигается гипотеза дифференцирующего отбора. На основе трех статистических критериев — у2, t, F — была определена достоверность отличий FST(i) от FST для каждого гена в каждом из генофондов ойкумены и получены оценки селективной структуры генофондов.
Показано, что в разных генофондах одни и те же гены подвержены разным типам отбора.
Наименее устойчив класс «NEUTRAL»: ни один из генов не оказался селективно-нейтральным во всех регионах мира. Генный состав класса «LOWER DIFF» в генофондах мира более стабилен, чем класса «SUPER DIFF».
Степень сходства по селективной структуре в целом (коэффициент контингенции к) региональных генофондов с мировым позволяет распределить генофонды по степени близости к «общевидовому» ответу на давление среды (табл. 4.5., рис. 4.7). В целом по структуре отбора регионы имеют незначительное сходство с общемировым (k=0.29). В восточно-азиатском (k=0.18) и австралийском (k=0.13) генофондах сложились свои независимые типы селективной структуры генофондов. Генофонды коренного населения Африки и Европы, Америки и Индостана, Меланезии и Океании, столь различные и географически, и антропологически, — демонстрируют один и тот же невысокий уровень сходства с глобальной селективной структурой (k≈0.3). И лишь один регион — Северная Евразия — занимает особое положение: уровень его сходства с глобальной селективной структурой (k=0.60) в два раза выше среднерегионального!
При этом высокий уровень сходства отмечается не для какого-нибудь одного, а для всех классов селективной структуры: для LOWER DIFF коэффициент связи k=0.6, для NEUTRAL k=0.5, для SUPER DIFF k=0.7.
ИТОГИ. СЕВЕРНАЯ ЕВРАЗИЯ
Сведем воедино показатели, полученные с помощью трех основных инструментов — частот генов, их разнообразия и селективной структуры (табл. 4.5, рис. 4.5.-4.7). Комплексная оценка позволила получить принципиально новые результаты. Одним из них является особое положение генофонда Северной Евразии — по всем независимым показателям он наиболее полно воспроизводит мировой генофонд. Из всех региональных генофондов мира лишь генофонд Северной Евразии занимает центральное положение в пространстве как генных частот (наименьшее расстояние до мирового генофонда dРЕГ-МИР=0.108), так и селективной структуры (наибольший показатель сходства с мировой селективной структурой kРЕГ-МИР=0.60), и сохраняет наибольшее генное разнообразие (Нт=0.362). Поэтому именно этот регион является наиболее информативным для изучения общих проблем эволюции.
ИТОГИ. ЕВРОПА
Вопрос о том, каково генетическое разнообразие народов Западной Европы, обычно волнует всех.
В главе 5 (табл. 5.3.1.) мы привели оценки генетических различий между локальными популяциями (Епоп.этн) для многих народов Западной Европы и для многих народов Сибири. И в том, и в другом регионе рассмотрены наиболее генетически изученные народы. По одним и тем же наиболее изученным классическим маркёрам (АВ0, PTC, MNS, RH, FY, FUT2, PI, KEL, LE, HP, GC, TF) мы рассчитали среднюю генетическую гетерогенность для европейского этноса и для сибирского этноса (FПОП-ЭТН - различия популяций внутри одного народа). Сводка данных по Сибири была составлена нами и Н. А. Таусик в то же время, что и сводка по Зарубежной Европе [Mourant et al., 1976]. «Выровняв» таким образом и число народов, и число аллелей, мы получаем наиболее сопоставимые оценки для генофондов этих регионов.
Различия популяций в пределах этноса Зарубежной Европы оказались чрезвычайно малы: FПОП-ЭТН=0.76±0.24. Средние генетические различия популяций в пределах коренного сибирского этноса очень велики: FПОП-ЭТН=404±0.98. Это означает, что гетерогенность сибирского этноса в пять раз выше, чем в Западной Европе.
Обратим внимание, что эта величина почти в три раза меньше, чем приведённая в таблице 4.5. FПОП-РЕГ=2.41 для «синтезированного» нами много более гетерогенного региона, объединившего Западную Европу с Юго-Западной Азией.
Рассчитаем теперь генетические различия не внутри этноса, а между народами Западной Европы — может быть, они окажутся велики? Нет, генетические различия между теми же народами Западной Европы столь же малы и составили всего лишь FЭТН-РЕГ=0.87.
Теперь мы можем рассчитать, каковы же генетические различия между всеми популяциями всех народов Западной Европы. Этот общий размах межпопуляционных различий для Европы составил, FПОП-РЕГ=FПОП-ЭТН+FЭТН-РЕГ=0.76+0.87=1.71. Таким образом, оказывается, что всегенетические различия всего населения Западной Европы (FПОП-РЕГ=1.71) в два раза меньше, чем гетерогенность (FПОП-ЭТН=4.04) лишь одного «среднего» коренного народа Сибири!
Таким, образом, генетические различия всех элементарных популяций всей Зарубежной Европы — от португальцев до лопарей и от исландцев до греков — достигают лишь чрезвычайно низкого уровня. В генетическом масштабе населения не только ойкумены, но и всех иных регионов мира, европейский мир предстает генетически гомогенным. Наши исследования ([Рычков, Ящук (Балановская), 1983; Балановская, 1998]) показывают, что эта гомогенность возникает не на последних этапах развития европейской цивилизации, а свойственна этому региону практически на всем протяжении его, в том числе и не писаной, истории.
Но в данном контексте важно установить сам уровень генетических различий популяций Европы, являющийся итогом особенностей её исторического развития. Важно и то, что эти результаты получены по классическим маркёрам четверть века назад. Эти результаты позволяли прогнозировать и столь же низкое генетическое разнообразие народов Западной Европы по маркёрам митохондриальной ДНК. Широко развернувшиеся в последние годы исследования мтДНК народов Европы показали удивляющую многих гомогенность населения Западной Европы (см. главы 6, 8, 9), полностью подтвердив возможность прогнозирования параметров изменчивости большинства ДНК маркёров по данным о классических маркёрах.
Большинства — но, к счастью, не всех. Высокая изменчивость гаплогрупп Y хромосомы — как в пределах Европы, так и в пределах русского народа [Balanovsky et al., in print] — служит важным исключением. Оно не просто подтверждает правило, но и обнаруживает «исключительный» маркёр, помогающий дифференцировать потоки миграций, анализировать географическую и этноисторическую изменчивость населения Европы. Правда, необходимо ещё оценить степень изменчивости Y хромосомы в других регионах мира — не окажется ли, что там она ещё выше, и Европа тогда и по этому маркёру сохранит положение гомогенного региона (в сравнении с другими регионами).
Знание как основных «правил» изменчивости каждого регионального генофонда, так и редких «исключений», позволяет планировать генетическое исследование так, чтобы дать и полноценную характеристику генофонда в целом, и проследить отдельные его своеобразные черты. В этом и состоит идеология изучения генофонда с помощью множества «очевидцев».
§ 5. Немного истории
В этом разделе мы не станем писать подробную историю геногеографии — такая задача потребовала бы отдельной книги и специального исследования. Это задача скорее для историков науки, а наше видение, конечно же, субъективно. Но все же и наши сведения имеет смысл привести — наравне с иными свидетельствами они помогут восстановить истинную картину. К тому же мы лишь наметим основные вехи развития нашей науки — в том свете, как они видятся авторам. Причём опишем их далеко не всегда в хронологическом порядке, а следуя логике развития науки. Для удобства чтения назовём эти вехи по именам ученых, внесших решающий вклад на поворотных этапах геногеографии, а для современного этапа будем считать такими вехами разработку того или иного геногеографического метода.
А. С. СЕРЕБРОВСКИЙ
Возникновение и термина «геногеография», и самой идеи чтения истории популяций в книге пространственного распространения генов связаны с именем Александра Сергеевича Серебровского.
В этой книге мы уже не раз упоминали его имя как основателя геногеографии. Поэтому сейчас приведём только один пример элегантности его работ: едва ли не первым геногеографическим исследованием было изучение истории народов Дагестана по географической изменчивости морфологических признаков у домашних кур, которых разводили эти народы. Действительно, большая или меньшая изоляция популяций человека друг от друга приводит и к соответствующим различиям между популяциями домашней птицы, тесно связанными с популяциями человека. А для кур во времена Серебровского было известно уже немало фенотипических признаков, которые могли служить хорошими генетическими маркёрами [Моисеева и др., 2003]. Для популяций человека таких маркёров почти не было. Но сходство или различия между популяциями кур того или иного ущелья можно было использовать как свидетельства сходства или различий между популяциями их хозяев.
Серебровскому принадлежит и понятие генофонда, и мысль о том, что геногеография является наукой исторической, призванной изучать историю генофонда.
Ф. Г. ДОБРЖАНСКИЙ
Эти идеи, как и многие другие достижения российской генетики, были перенесены в англоязычную науку Феодосием Григорьевичем Добржанским — известным российским генетиком, который с конца 20х годов работал в США и оказал огромное влияние на зарубежные генетические и эволюционные научные школы [Dobzhansky, 1937 и др.]. Русскоязычный термин «генофонд» превратился благодаря Добржанскому в «gene pool», аналогично на американском континенте была интродуцирована и геногеография (gene geography). Правда, представление о сложности генофонда при этом значительно потускнело (pool — нечто бесструктурное). Что же касается интродуцированной геногеографии, то она стала соответствовать тому, что мы сейчас называем частной геногеографией — то есть изучению географического распространения отдельных генов. Нужно ли говорить, что при этом исчезла сама тема геногеографического изучения не генов, а генофонда. Затерялось и представление о геногеографии как о науке исторической — термин «gene geography» стал ассоциироваться скорее с изучением медицинских следствий из закономерностей распространения гена, чем с изучением истории народов. Мы перечислили эти особенности зарубежного восприятия геногеографии, чтобы ярче подчеркнуть те черты этой науки, которые особенно важны для отечественной традиции.
Т. Д. ЛЫСЕНКО
Об этом имени и о сессии ВАСХНИЛ 1948 года написано много. Мы лишь напомним, что после признания генетики лженаукой в СССР начались гонения на генетику и генетиков, включая и геногеографию.
Е. М. ЧЕПУРКОВСКИЙ
Однако геногеографический или очень близкий к нему по духу подход сохранялся в среде антропологии, которая, хотя и ценой больших жертв, избежала участи генетики (см. об этом в разделе 2.1). Антропологию того времени связывали с геногеографией два моста. Первым был географический подход, который постепенно становился краеугольным камнем этнической антропологии. Этот подход, восходящий к классическим работам Ефима Михайловича Чепурковского, можно в терминах популяционной генетики описать так: для популяций, сходных по значениям ряда признаков и занимающих соседние географические ареалы, можно предполагать их родство по происхождению; а популяции, сходные по значениям ряда признаков, но географически далекие друг от друга, нельзя считать родственными по происхождению, если для этого нет иных убедительных свидетельств. Этот географический метод важен для антропологии тем, что он отметает множество фантастических гипотез, основанных на сходстве нескольких признаков в популяциях, которые географически и исторически удалены друг от друга.
В. В. БУНАК
Вторым мостом, связывающим антропологию с геногеографией, было отношение к генам как к новым антропологическим признакам. Антропогенетика (по сути, та же геногеография) длительное время была частью антропологии, и ведущие антропологии возлагали большие надежды на использование этих новых признаков («кровяных групп») — ведь они лишены многих недостатков, свойственных «обычным» антропологическим признакам.
Главным достоинством генетических признаков в глазах антропологов было то, что они проявляются независимо от окружающей среды: у ребенка будет та группа крови, которую он унаследовал от родителей, независимо от того в каких условиях ребенок рос. А для многих антропологических признаков на генетическую, унаследованную составляющую, накладывается влияние условий жизни индивидуума и всей популяции. Достоинством была и «дискретность» генетических признаков — за них отвечал один ген, а не совокупность генов, как для антропологических признаков.
Поэтому таким разочарованием проникнута работа ведущего антрополога Виктора Валерьяновича Бунака [Бунак, 1969]. Ее основной вывод — в «полиареальности», то есть мозаичном, а не закономерном распределении частот генов по ареалу.
Это ведь сейчас мы знаем, что распределение генов в действительности подчиняется строгим закономерностям — но чтобы их выявить, нам необходимо проанализировать десятки генов. А в распоряжении антропологов того времени было, по сути, только две генетические системы — группы крови АВ0 и резус, поэтому и был получен результат «по-лиареального» распределения генов.
Г Ф. ДЕБЕЦ
Столь глубокая внутренняя связь антропологии и геногеографии и была причиной того, что после снятия в нашей стране запрета на генетику геногеография возродилась из антропологических недр. Это второе рождение геногеографии связано с именем Юрия Григорьевича Рычкова, а связующим звеном, пронесшим мечту о настоящей генетической антропологии через десятилетия запрета на генетику, был его учитель, ведущий антрополог советской школы Георгий Францевич Дебец. По словам Юрия Григорьевича, мечтой и целью Дебеца было создание со временем подробного атласа распространения генетических признаков в населении нашей страны. И когда эта работа стала возможной (как по политическим, так и по техническим условиям), она была начата под руководством Ю. Г. Рычкова.
Ю. Г. РЫЧКОВ
С именем Юрия Григорьевича связаны широкомасштабные исследования генофонда народов СССР, которые проводились в рамках генетико-антропологической экспедиции не только в Сибири, но и во многих других регионах СССР. Но главное — именно благодаря Ю. Г. Рычкову началось возрождение геногеографии как науки. Для реализации мечты Г. Ф. Дебеца о геногеографическом атласе первым необходимым шагом было сведение воедино всех опубликованных и архивных данных о частотах генетических систем в популяциях СССР. Эта огромная работа была начата для населения Сибири Н. А. Таусик, завершала эту работу Е. В. Ящук (Балановская). На этом этапе первоочередным стал вопрос, который ставил ещё Г. Ф. Дебец — вопрос об организации данных для картографирования на популяционном или же. на этническом уровне.
Для большинства антропологов естественно является анализировать (и картографировать) популяционные данные как они есть — то есть использовать имеющиеся значения признака для каждой изученной популяции и наносить на карту эти значения в точки, занимаемые популяциями. Альтернативный подход — усреднить значения во всех изученных популяциях данного народа и наносить на карту именно усреднённое, этническое значение признака, помещая его в исторический или географический центр этнического ареала. Для антропологических признаков обычно пользуются популяционными данными, но для генетических признаков был весомый аргумент в пользу картографирования этнических данных. Этот аргумент состоял в ограниченном объёме, в нехватке генетических данных для сплошного популяционного картографирования. Нехватка данных усугублялась тем, что большинство популяций были изучены по немногим генам, и наборы этих генов для каждой популяции различались (программа признаков, изучаемых антропологами, стандартизована в значительно большей мере). Поэтому наиболее объективную генофонда картину можно было создать именно на этническом уровне.
АНАЛИЗ GST В ПОПУЛЯЦИОННЫХ СИСТЕМАХ: ЭКВИДИСТАНТНОСТЬ
Но прежде, чем использовать вместо частот в локальных популяциях среднеэтнические частоты генов, необходимо было понять, не потеряется ли основная часть изменчивости при таком переходе от популяционных к этническим частотам? В более общем виде — какие закономерности связывают эти характеристики? Прекрасно разработанный в популяционной генетике аппарат анализа межпопуляционной изменчивости в иерархических системах популяций был применён к генетическим данным о народонаселении Сибири, а затем Западной Европы и Америки. Причём рассматривались не двууровневые системы («локальные популяции» и «этносы»), а многоуровневые системы (добавляя над уровнем «этносы» уровни «лингвистические группы» и «лингвистические семьи» при лингвистической классификации или иные объединения этносов при этно-конфессиональной, антропологической и этнографической классификациях народов) [Рычков, Ящук (Балановская), 1980, 1983, 1986].
Результатом этих работ стало открытие принципа эквидистантности (равноудалённости) разных уровней популяционной системы: изменчивость популяций в пределах этноса была равной изменчивости этносов в пределах лингвистической группы, и межпопуляционная изменчивость средних частот аллелей в лингвистических группах, относящихся к одной лингвистической семье, равнялась все той же величине. Эквидистантность оказалась характерна не только для всех изученных популяционных систем человека (коренное население Сибири, Америки и Европы) [Рычков, Ящук (Балановская), 1984], но и для других видов организмов [Алтухов, 2003]. Была предложена (и доказана её справедливость) популяционно-генетическая модель скачкообразного роста популяционной системы, состоящего в распаде единой прапопуляции на дочерние, которые, в свою очередь, со временем распадаются на популяции следующего, низшего уровня. И при росте популяционной системы на один уровень, генетическое разнообразие популяций увеличивается на одну и ту же величину («квант»), что и приводит к феномену эквидистантности всех уровней системы [Рычков, Ящук (Балановская), 1985].
Феномен эквидистантности позволил дать и общий ответ на вопрос — можно ли строить карты по среднеэтническим частотам генов? Стало ясно, что в зависимости от масштаба, от ранга популяционной системы мы теряем при этом лишь около трети или четверти информации, но приобретаем устойчивость оценок. Этим открывалась возможность создания картографического атласа генофонда СССР.
Разработанная тогда методология анализа межпопуляционной изменчивости широко используется в геногеографии и сейчас. Уровень межпопуляционной изменчивости является универсальным и весьма информативным показателем при характеристике любого этнического или регионального генофонда. Для генофондов крупных регионов методология применяется уже в полную силу — с анализом изменчивости на разных уровнях популяционной системы и с обязательным использованием феномена эквидистантности. Примером может служить изучение генофонда Кавказа [Балановская и др., 1999; см. также раздел 2.2. этой книги].
ПЕРВЫЕ КАРТОГРАФИЧЕСКИЕ ТЕХНОЛОГИИ
Несмотря на успехи, достигнутые при чисто статистическом анализе генофондов, целью отечественной геногеографической школы оставалось создание крупных картографических атласов. При наличии исходных данных вопрос упирался в метод построения карт, который должен был быть, во-первых, объективным (воспроизводимым в руках разных исследователей), а во-вторых, обеспечивать «непрерывное» картографирование (расчёт ожидаемого значения частоты гена для каждой точки карты, даже вдалеке от непосредственно изученных популяций). Выбор метода интерполяции — способа расчёта ожидаемого значения из данных по опорным точкам — стал главной задачей. Поскольку интерполяционное картографирование необычайно трудоёмко и требует значительных вычислений, этот метод с самого начала задумывался как компьютерный. Однако на каждом этапе карты строились также и вручную — это позволяло параллельно развивать теоретические подходы к картографированию. В течение нескольких лет были созданы три разных компьютерных метода — триангуляционный, «чернильных пятен» и средневзвешенной интерполяции — и созданы соответственно три разных картографических технологии. Опишем их предельно кратко и образно.
Триангуляционный метод разрабатывался совместно с сотрудниками кафедры биофизики МГУ А. Т. Терехиным и Е. В. Будиловой. Он основывается на соединении всех изученных популяций линиями, формирующими густую нерегулярную сеть треугольников, и вдоль этих линий вычисляются градиенты частоты гена. В результате из множества треугольников рождается визуальная карта распространения гена. К сожалению, у этого метода серьёзное ограничение — значение признака рассчитывалось для областей, и эти области менялись от карты к карте. Нельзя было рассчитать точные значения частоты гена для каждой точки карты. Исследователь видит результирующую карту, но не может получить числовую матрицу, лежащую в её основе. А значит, и не может дальше делать с картой любые статистические преобразования, не может превращать одну карту в другую или по совокупности исходных карт создать синтетическую карту.
Поэтому следующим методом в геногеографии стала технология, созданная совместно с А. В. Рычковым. Ее образно можно назвать «технология чернильных пятен». Каждая изученная популяция представлялась в виде небольшого «пятна» с заданной интенсивностью цвета, соответствующей частоте гена. Начинался итерационный процесс, на каждом шаге которого каждое пятно, видимое на экране компьютера, расширялось на один пиксель. На каком-то этапе соседние пятна (происходящие из соседних изученных популяций) начинали сливаться, и тогда зона «контакта популяций» окрашивалась в промежуточный цвет или же в серию переходов промежуточных цветов, если популяции различались друг от друга более чем на один интервал шкалы. Полным завершением этого процесса было бы полное слияние всех пятен друг с другом, когда вся карта представлялась равномерным серым пятном — все генетические различия полностью нивелировались! Поэтому главным вопросом при использовании этой технологии был выбор — на каком шаге итерации следует остановиться, чтобы популяции успели «провзаимодействовать», но не стали бы полностью идентичными. Этот вопрос решался по анализу дисперсии на каждой итерации: дисперсия, изначально очень большая, постепенно снижалась и выходила на плато. Именно этот момент и был сигналом к остановке итерационной процедуры и рассмотрению полученной карты.
Как можно видеть, такой метод по сравнению с триангуляционным обладает тем преимуществом, что позволяет рассчитать значения для каждой точки карты. Этот метод был использован для первого геногеографического атласа, созданного для населения Монголии [Балановская и др., 1990]. Однако дальнейшее развитие геногеографии оказалось связанным с иным, третьим методом, который также позволял получить числовые значения для каждой точки карты, но обладал и рядом дополнительных преимуществ. А главное — субъективные факторы (как, например, остановка на той или иной итерации) были сведены к минимуму.
ТЕХНОЛОГИЯ НА ОСНОВЕ СРЕДНЕВЗЕЩЕННОИ ИНТЕРПОЛЯЦИИ
Ведущая роль в создании этой технологии принадлежит картографической группе кафедры картографии МГУ под руководством С. М. Кошеля. Наша совместная работа является замечательным примером долгого и плодотворного сотрудничества профессиональных картографов и геногео-графов. Еще до встречи с генетиками группа С. М. Кошеля широко использовала картографический пакет MAG и разработала оригинальную программу Metacopy для визуализации карт. Привнесение генетической методологии значительно изменило ситуацию. Программный пакет превратился в GG MAG (GG обозначает геногеографию — Gene Geography) и приобрёл множество функций, специально нацеленных на анализ генетических данных: начиная от использования данных в нерегулярно расположенных опорных точках (поскольку генетические данные именно таковы) до внедрения в пакет широких возможностей математических и статистических операций с картами. Пакет GGMAG прошёл длительную эволюцию, и в настоящий момент используется его последняя, четвёртая версия с некоторыми оригинальными добавлениями.
Подробное описание самой технологии приводилось в разделе 3 Приложения, поэтому здесь укажем лишь её основные черты. Во-первых, при интерполяции для каждой регулярно расположенной точки карты (узел «сетки» карты) рассчитывается с помощью ортогональных полиномов средневзвешенное значение, получаемого из значений в нерегулярно расположенных опорных точках (популяциях). Значения во множестве опорных точках усредняются, причём каждая опорная точка выступает с весом, обратно пропорциональным расстоянию от нее до данного узла сетки. Тем самым прогнозируемое значение приближается к значениям в ближайших опорных точках, а удалённые опорные точки сказываются на прогнозе незначительно. Заметим, что тот же принцип независимо использовался и в нескольких зарубежных программах, специально созданных для картографирования генетических данных. Правда степень весовой функции от расстояния (между узлом сетки и опорной точкой) в них строго фиксирована (обычно это квадрат), тогда как в пакете GGMAG исследователь может задавать любую степень (часто оптимальные результаты получаются при использовании шестой или даже десятой степени). Другое важнейшее отличие GGMAG — использование для интерполяции ортогональных полиномов. Это позволяет адекватно прогнозировать изменение значений признака в пространстве даже при отсутствии данных, прямо указывающих на это изменение: интерполяционный алгоритм улавливает наличие тренда по окружающим точкам и продолжает его на смежные территории. Аналогично выбору степени весовой функции, исследователь может задать и различную степень полинома (при нулевой степени расчёт ведется без учета полинома, только как средневзвешенная интерполяция). Исследователь также может сам определить тот радиус, в пределах которого учитываются опорные точки (исходные популяции). Это позволяет моделировать разный круг взаимодействующих популяций. Сочетания всех трёх параметров (радиус для опорных точек, степень весовой функции расстояния до опорной точки, степени полинома) создают широчайший спектр возможностей для построения наиболее корректной компьютерной модели при данном сочетании популяций и значений признаков.
КАРТЫ. ПОСТРОЕННЫЕ ВРУЧНУЮ
Хотя магистральной линией было создание компьютерной геногеографии, на разных этапах множество карт было построено и вручную. С компьютерными картами их роднило всё — и непрерывность картографирования (значения для каждого узла равномерной сетки карты), и использование математического расчёта, а не научной интуиции при выборе картографируемого значения, при этом сам алгоритм вычислений мог быть самым разным. «Ручные» карты, сыгравшие наибольшую роль в истории геногеографии — это карты антропологических признаков в русских популяциях. Эта работа была специально задумана как проверка картографического метода — предполагалось, что если эти новые методы чего-то стоят, то они должны выявить новое даже в наиболее полных и прекрасно разработанных данных. А наиболее полными были данные по антропологии русского народа, собранные Русской антропологической экспедицией. Результаты этого геногеографического анализа антропологических данных описаны в разделе 2.3, поэтому скажем только, что успех этой работы превзошел ожидания. О следах летописных славянских племён, обнаруженных, благодаря геногеографическому методу в современном русском населении, был сделан доклад на авторитетной конференции, на которой присутствовало большинство отечественных антропологов и археологов [Рычков, Балановская, 1988]. То полное признание и одобрение, которое получили эти результаты, следует целиком отнести к тому стилю картографирования и той методологии анализа, которая впоследствии оформилась в компьютерную геногеографию. С этого времени можно начинать отсчёт широкого применения отечественной картографической технологии в изучении популяций человека.
БАНКИ ДАННЫХ
Наряду с картографической технологией и статистическими методами важное место в геногеографии занимают банки данных. Дело в том, что объём данных, которые используются даже не в слишком масштабном геногеографическом исследовании, огромен, а сами исходные данные обычно рассеяны во множестве статей.
Представьте себе анализ даже такого сравнительно небольшого, хотя и гетерогенного региона, как Кавказ. Пусть Вам необходимо проанализировать данные только по классическим маркёрам. Однако подобные данные получали и публиковали самые разные авторы — от медицинских исследований групп крови АВ0 и резус, до работ по многим системам, выполненными в московских и кавказских генетических лабораториях. Некоторые данные по Кавказу публиковались и зарубежными авторами. Библиография данных о Кавказе насчитывает многие десятки наименований, и далеко не все эти статьи легко доступны, а многие из них даже неизвестны большинству исследователей. Итак, тому, кто решит провести геногеографическое изучение Кавказа, предстоит провести сперва большую работу по сбору и систематизации данных о частотах генов, опубликованных за несколько десятилетий. Если же представить, сколько разных генофондов было изучено геногеографами, и вообразить, какой объём предварительной работы требуется, к примеру, для анализа в масштабе СССР, то задача сбора и систематизации опубликованных генетических данных предстанет во всем своем величии и неприступности.
Кардинальное решение этой задачи может быть только одно — собрать ВСЕ когда-либо опубликованные данные по частотам генов в ЕДИНОЕ хранилище. И при анализе любого генофонда лишь обращаться в хранилище и брать готовые систематизированные данные по частотам генов в популяциях интересующего региона.
Именно таким хранилищем и стал банк данных «GENEPOOL», разработанный под руководством одного из авторов этой книги. В банк данных вводилась практически вся доступная информация по частотам классических маркёров в популяциях Северной Евразии, а отчасти и по другим регионам мира. Впоследствии банк был пополнен и данными по аутосомным ДНК маркёрам. Структурная организация банка и запрограммированные функции делают его не только хранилищем данных, но и инструментом их проверки, систематизации и анализа. Аналогичный банк данных создавался и зарубежной геногеографической школой Кавалли-Сфорца. Он содержит информацию по остальным регионам мира (кроме Северной Евразии, представленной весьма скудно), хотя запрограммированные возможности этого банка не столь обширны.
Отечественной геногеографической школой создавался и ряд других банков данных: «ПАЛЕОЛИТ РОССИИ», база данных о русских фамилиях, банк данных по митохондриальной ДНК в населении мира и банк данных «РУССКИЙ ГЕНОФОНД» кратко описаны в разделе 5 Приложения.
ЦЕЛЬ — СИНТЕТИЧЕСКИЕ КАРТЫ
Использование банка данных является первым необходимым шагом при картографическом анализе любого гена. Но на всех этапах разработки картографической технологии главной целью оставалось картографирование не отдельных генов, а извлечение из карт отдельных генов общей информации о генофонде. Общепринятым методом обобщения тогда был (и остаётся доныне) анализ главных компонент. Этот статистический метод позволяет в изменчивости множества признаков выделить основные тенденции и представить их в изменчивости немногих новых условных признаков — главных компонент. Это метод чисто статистический, но чтобы сделать его картографическим, нужно, казалось бы, совсем немного — рассчитать значения главных компонент для каждой популяции и нанести их на карту.
Сложность заключается в том, что разные гены изучены в разных популяциях, а для расчёта главных компонент необходимы данные о значении каждого гена в каждой популяции. Решить эту проблему можно было лишь с помощью карт, основанных на цифровых матрицах. Ведь для таких карт мы имеем значение признака в каждой точке карты. А для другого признака — опять-таки знаем его значение в каждой из тех же самых точек. Таким образом, расчёт главных компонент проводится не по исходным данным, а по картам. Точнее, по картографированным (интерполированным) значениям в каждой точке карты (каждом узле регулярной сетки карты). Карты главных компонент строились и технологией «чернильных пятен». Но когда была создана технология картографирования на основе средневзвешенной интерполяции, и был разработан алгоритм проведения с цифровой матрицей математических операций, то создание карт главных компонент в отечественной геногеографической школе стало обычной и широко используемой процедурой.
Каково же было удивление, когда на этом этапе обнаружилось, что в зарубежных статьях (к тому же не в самых последних, а давностью в несколько лет) уже опубликованы карты главных компонент генофонда! Впрочем, изумление перед этим фактом быстро сменилось сознанием того, что такое совпадение подтверждает правильность избранного пути, а также ту огромную востребованность в геногеографии общих параметров генофонда, которая назрела в мировой науке.
Очевидно, именно такой была общая логика развития популяционной генетики в 70е и 80е годы, как за рубежом, так и в нашей стране: 1) необходимо обобщить данные о многих генах; 2) был общепринятый метод обобщения — главные компоненты; 3) для содержательной интерпретации результатов нужно было знать географию главных компонент, то есть построить для них карты; 4) для расчёта необходимы данные по каждому признаку в каждой точке карты; 5) получить такие данные возможно только при картографировании каждого признака, причём самым главным результатом картографирования должна быть не сама графическая карта, а лежащая в её основе матрица точных значений признака в каждом узле карты.
Самое забавное, что вместо разочарования и глубокого огорчения, что приоритет синтетических карт остался закреплён не за нами, основным чувством была радость
— нам стало намного проще объяснять, сколь необходимы геногеография и компьютерные картографические технологии. Если до этого солидные члены солидного Ученого совета заявляли, что подобные нашим контурные карты они рисовали в пятом классе, и нечего заниматься такими пустяками в Академии наук, то теперь авторитет «заграничных» исследований и популярность синтетических карт в мировой науке позволила нам развернуть куда более обширную работу и у нас в России.
CAVALLI-SFORZA И ЕГО ШКОЛА
Публикации карт главных компонент, о которых мы только что рассказали, принадлежали коллективу, который возглавлял Луиджи Лука Кавалли-Сфорца. Сразу оговоримся, что с историей зарубежной геногеографии авторы знакомы существенно меньше, чем с историей отечественной науки. Поэтому очертим её лишь несколькими штрихами и назовём только два имени.
Первое из них принадлежит А. Е. Mourent, организатору и автору крупнейшей сводки данных о частотах генов в населении мира [Mourent et al., 1976]. Этот прекрасный труд сыграл огромную роль для развития геногеографии. На страницах этой книги были сведены данные, кропотливо собранные из сотен публикаций разных лет, причём для каждой изученной популяции приводились подробные сведения о её географическом положении, отнесении к основным регионам мира, характере выборке (пациенты, здоровые, военнослужащие, коренное или «смешанное» население), а также подробная библиографическая ссылка на исходную публикацию этих данных. Для самых изученных генов были приведены и карты их распространения в мире. По сути, этот труд явился прообразом банка данных о генофонде популяций всего мира, а по полноте и объёму данных по классическим маркёрам он не утратил своего значения и сейчас.
Второе имя хорошо известно каждому, кто хотя бы бегло знаком с работами по популяционной генетике человека. Лаборатория и научная школа L. L. Cavalli-Sforza являются, пожалуй, наиболее известными в мировой науке. Этим коллективом выполнен целый ряд ставших классическими работ: по совершенствованию методов расчёта генетических расстояний, построению кластеров родства популяций, анализу фамилий как аналога генетических маркёров и множество иных исследований. Именно перу Кавалли-Сфорца принадлежит крупнейшая обобщающая монография в области популяционной генетики человека [Cavalli-Sforza et al., 1994]. Для нашего рассказа наиболее важно, что именно этим коллективом была независимо разработана картографическая технология, в общих чертах аналогичная технологии, созданной отечественной геногеографической школой. Именно эта технология легла в основу названного обобщающего труда, в котором не только приведены геногеографические карты для регионов всего мира, но и дано тщательное описание их генофондов.
Главным и важнейшим инструментом для школы Кавалли-Сфорца являются карты главных компонент («синтетические карты» в его терминологии). Каждая из карт интерпретируется как отражение одного из исторических сценариев, сформировавших генофонд популяции, причём предполагается, что более значимые компоненты описывают хронологически более ранние этапы формирования генофонда.
СОВРЕМЕННАЯ ОТЕЧЕСТВЕННАЯ ГЕНОГЕОГРАФИЯ
В своих важнейших чертах отечественная геногеографическая школа перекликается с только что описанной зарубежной. Это, во-первых, нацеленность на изучение не частной геногеографии отдельных генов, а общих черт строения генофонда. Во-вторых, это широкое использование компьютерных карт, и в первую очередь обобщённых карт (например, главных компонент). В-третьих, применение всего комплекса остальных (не картографических) популяционно-генетических методов для целей геногеографии — выявления объективных закономерностей в структуре генофонда.
Особенностью же отечественной школы является в первую очередь наличие развитой и широко разветвлённой картографической технологии [Балановская и др., 1994а, 19946, 1995, 1997]. В разделе 3 Приложения описывается, сколь большой комплекс методов и математических преобразований может быть выполнен с картами отдельных генов. Поэтому, например, результатом работы отечественной школы стало создание не одного, а трех типов синтетических карт: наряду с картами главных компонент создаются и анализируются карты гетерозиготности и карты генетических расстояний. Важным достоинством отечественной картографической технологии является также возможность расчёта корреляций между картами разных признаков, построение корреляционных карт и карт межпопуляционного разнообразия. Одним из последних и самых важных достижений отечественной геногеографии авторы считают внедрение в технологию карт надёжности. Эти карты показывают степень достоверности картографического прогноза на разных территориях в зависимости от обеспеченности исходной информацией, позволяют включать в компьютерные карты лишь данные с высоким уровнем надёжности и исключать из картографирования мало надёжные территории [Нурбаев, Балановская, 1998].
Еще одной особенностью отечественной школы можно считать анализ не только исторической (селективно-нейтральной) изменчивости генофонда, но и выявление действия естественного отбора на конкретные гены. Выше рассказывалось об анализе межпопуляционной изменчивости в генофондах разных регионов и выявленном при этом феномене эквидистантности. Такие устойчивые показатели межпопуляционной изменчивости получаются при усреднении величин изменчивости, характерных для большого числа изученных генов. При этом изменчивость каждого отдельного гена может отличаться от среднего, селективно-нейтрального уровня. И единственной причиной, которая может вызвать достоверные отклонения изменчивости данного гена от средней, является действие естественного отбора на этот ген. Если изменчивость данного гена снижена, можно предполагать действие стабилизирующего отбора. Указанием же на дифференцирующий отбор является ситуация, когда изменчивость рассматриваемого гена оказывается достоверно выше средней изменчивости всей совокупности изученных генов. Именно на этом основана технология выявлении эффектов отбора, опубликованная в работах [Рычков, Балановская, 1990а; Балановская, Нурбаев, 1997, 1998а, 19986, 1998в, 1999].
Итак, мы вкратце описали основные вехи развития геногеографии — от работ А. С. Серебровского до формирования современной геногеографической технологии, позволяющей проводить всесторонний анализ пространственной изменчивости как отдельных генов, так и генофондов. Подводя общий итог, можно выделить три основные группы методов современной геногеографии:
1) анализ межпопуляционной изменчивости при иерархической организации изучаемых популяций (анализ средней FST);
2) анализ селективной структуры (выявление действия естественного отбора на отдельные гены по отклонениям от средней FST);
3) картографические методы (анализ пространственной структуры генофонда с помощью интерполяционных карт).
РАЗНЫЕ ГЕНОФОНДЫ. РАЗНЫЕ ПРИЗНАКИ
Рассказывая об истории нашей науки, мы говорили больше об истории идей — истории разработки тех или иных геногеографических методов. И это оправдано, потому что именно наличие мощного метода является главнейшим условием для надёжных исследований конкретных генофондов. Более того, именно разработка методов всегда была стимулом для разработки теоретических вопросов геногеографии. Но неверно думать, что её история сводится лишь к разработке методов. Намного более многочисленны — столь многочисленны, что здесь невозможно перечислить даже главнейшие из них — были исследования конкретных генофондов или конкретных генов.
Чтобы дать хотя бы общее представление о масштабе и количестве выполненных геногеографических работ, перечислим некоторые из изученных нами генофондов. Из геногеографически изученных генофондов отдельных народов следует назвать адыгов, башкир, белорусов, марийцев, монголов, осетин, русских, украинцев. Из региональных генофондов — Кавказ, Восточную Европу, всю Европу, Уральский регион, Сибирь, Северную Евразию, Старый Свет (Евразия и Северная Африка). Также изучались генофонды всех основных регионов мира (см. § 4 этого раздела).
Разнообразие признаков, изучаемых геногеографией, ещё ярче, чем разнообразие изученных ею генофондов. Если изначально геногеография мыслилась как наука о географии генов, то сейчас перечень используемых для описания генофонда маркёров намного шире. Это, во-первых, антропологические признаки (соматология, дерматоглифика, одонтология). Во-вторых, данные археологии. Одно из важнейших геногеографических исследований — генофонда палеолита — выполнено не на данных о частотах генов, а на данных о признаках материальной культуры (орудия, искусство, жилища) и фауны разных этапов палеолитической эпохи. В-третьих, в современной геногеографии широко используется анализ квазигенетических маркёров, в первую очередь фамилий. Время от времени геногеографические технологии применяются и для признаков, вовсе далёких от генетики, таких как заболеваемость, техногенная напряжённость среды, гормональный статус или показатели антропологического развития детей. Правда, в этих случаях решаются не столько популяционные, геногеографические задачи, сколько геногеографические технологии используются для решения задач смежных наук. Но конечно, большинство геногеографических исследований проводились на основе данных о частотах генетических маркёров, причём всех их типов: и классических, и аутосомных гипервариабельных ДНК маркёров, и инсерционно-делеционного ДНК полиморфизма, и маркёров митохондриальной ДНК, и гаплогрупп Y хромосомы.
5. АТЛАСЫ ГЕНОФОНДОВ
В этом разделе рассматриваются технические вопросы создания всего множества карт, приведённых в книге. Описаны исходные данные для картографирования, указаны параметры построения разных видов карт, отмечены особенности различных Атласов.
§ 1. Атласы русского генофонда
БАНК ДАННЫХ «РУССКИЙ ГЕНОФОНД»
Создание геногеографических Атласов невозможно без предварительной разработки банков данных, содержащих исходную информацию. В ряду созданных нами банков, использованных в этой книге («GENEPOOL», «World Mitochondrial», «Палеолит Северной Евразии» и другие) банк данных «Русский генофонд»[80] занимает особое место.
Этот Банк данных (информация на конец 2005 г.) содержит данные о русских популяциях (более 500), изученных по признакам генетики и антропологии (350 маркёров различного типа).
Для того чтобы стать не просто хранилищем самых разнообразных сведений о русском генофонде, а материальной основой для синтеза этой информации, Банк данных должен был решить задачу унификации данных. Вся информация дается в Банке по единой схеме и для генетических, и для антропологических данных. Именно единство формата позволяет отбирать любые данные по общим формальным признакам и комбинировать их.
Банк данных (БД) включает в себя десять разделов, объединяемых в три группы: А) информация, общая для всех тематических разделов БД; Б) тематические разделы; В) справочники.
A) ОБЩАЯ ИНФОРМАЦИЯ
1. Популяционный раздел.
Детальные описания каждой популяции — административная принадлежность, географические координаты, особенности сбора выборки, статус и т. д.
2. Библиографический раздел.
Сведения по тем источникам, откуда были взяты данные.
Б) ТЕМАТИЧЕСКИЕ РАЗДЕЛЫ
3. Соматологические признаки (3276 записей),
4. Дерматоглифические признаки (201 запись).
5. Классические генетические маркёры (2754 записей);
6. Аутосомные ДНК маркёры (962 записи);
7. Гаплогруппы митохондриальной ДНК (363 записи).
8. Гаплогруппы У хромосомы (112 записей);
B) СПРАВ0ЧНИКИ
9. Административно-территориальная классификация
Перечень государств мира, областное деление стран СНГ до уровня областей, административное деление России на субъекты РФ и их подразделение на районы. Справочник позволяет каждой изученной русской популяции дать точную привязку к территории и административной единице.
10. Справочник маркёров и другие специальные справочники.
Основные задачи БД — обеспечить удобный ввод данных, проверку правильности их введения, возможность поиска (фильтрации) и любого комбинирования данных, выгрузку нужной комбинации данных в заданном виде, который «понимает» та или иная программа последующего анализа.
Банк данных обладает развитой системой поиска и отбора информации по различным параметрам и по запросам различного характера: группе популяций,
набору маркёров, интервалу значений признаков, любому сочетанию этих условий и т. д. Фактически — благодаря использованию готовых иерархически организованных списков — не представляет затруднений быстро отобрать из всего массива данных сведения по интересующей пользователя популяции или группе популяций, причем по любому конкретному маркёру или их заданной группе.
ОТ БАНКА — К АТЛАСАМ
Информация из банка данных выгружалась в формат данных для картографирования, и с использованием нашего геногеографического программного пакета GGMAG создавались карты — как для отдельных признаков, так и синтетические карты.
Все карты Атласов русского генофонда построены при следующих постоянных параметрах:
— Число узлов ЦМ: 88x103;
— Параметры интерполяции: степень полинома 0. радиус 10, степень весовой функции 6;
— Построение трендовых карт: осреднением в плывущем окне постоянного (для данной карты) размера. Для разных карт использованы окна разной величины (см. ниже описания каждого отдельного Атласа).
— Шкалы: равномерные, как правило, семиинтервальные.
— Надёжная область: зона с вероятностью правильного прогноза более 95 % при заданном уровне строгости.
Другие параметры (например, размер окна сглаживания, уровень строгости, мера расстояний) различались от Атласа к Атласу и указаны ниже при описании построения соответствующих карт.
АТЛАС СОМАТОЛОГИИ РУССКОГО НАРОДА
(рассмотрен в главе 4).
Атлас основан на информации базы данных «Соматология» (содержит 3 276 записей) банка данных «Русский генофонд». Сводка данных составлена проф. В. Е. Дерябиным по материалам Русской антропологической экспедиции под руководством В. В. Бунака и Т. И. Алексеевой [Происхождение…, 1965],
антропологической экспедиции М. В. Витова [Битов, 1964, 1997], а также по данным В. П. Алексеева [Алексееу и др., 1994]. При составлении сводки (включена информация только о мужчинах) В. Е. Дерябиным была проведена коннексия[81] данных с учетом различий в методических приёмах измерений разных авторов. При невозможности коннексии по какому-либо признаку данные по этому признаку не включались в подраздел объединённых данных.
Атлас состоит из трёх разделов.
1. «ПРОСТЫЕ» КАРТЫ. ПЕРВЫЙ РАЗДЕЛ основывается на данных Русской антропологической экспедиции (РАЭ). Раздел включает в себя карты 30 антропологических признаков, изученных РАЭ в 107 русских популяциях.
Перечень признаков: длина тела, процент светлых глаз, поперечный диаметр головы, продольный диаметр головы, ширина носа, высота носа от бровей, горизонтальный профиль лица, рост бороды, скуловой диаметр, наименьший лобный диаметр, морфологическая высота лица, нижнечелюстной диаметр, высота носа от переносья, высота верхней губы, ширина рта, толщина губ, цвет глаз, цвет волос по Фишеру (средний балл), цвет волос по Бунаку (средний балл), рост волос на груди, рост бровей, высота переносья, частота вогнутой спинки носа, частота выпуклой спинки носа, положение кончика носа, положение основания носа, профиль верхней губы, складка верхнего века, наклон лба, развитие надбровья (средний балл).
2. «ПРОСТЫЕ» КАРТЫ. ВТОРОЙ РАЗДЕЛ включает как данные РАЭ, так и данные М.В. Витова по северным русским популяциям [Битов, 1964, 1997]. Этот раздел мы обозначаем как «АБВ» — от первых букв фамилий исследователей (Алексеева, Бунак, Битов). Раздел «АБВ», в отличие от раздела «РАЭ», включает меньше признаков, но зато основывается на данных о большем числе популяций (180 популяций). Раздел состоит из 18 карт, показывающих изменчивость основных антропологических признаков. Публикуются трендовые варианты карт, полученные осреднением в окне 5x5 узлов сетки.
Приведены значения этих 18 признаков в 180 русских популяциях: 107 изученных Русской антропологической экспедицией; 60 изученных М. В. Битовым; 13 изученных В. П. Алексеевым с соавторами. В 11 случаях обе экспедиции обследовали русское население одних и тех же районов. Однако, согласно концепции построения БД, эти популяции введены независимо, поскольку при совпадении этнической и административно-территориальной привязки популяций фактически были изучены разные выборки из одной генеральной совокупности.
Перечень признаков: длина тела, продольный диаметр головы, поперечный диаметр головы, наименьшая ширина лба, морфологическая высота лица, скуловой диаметр, нижнечелюстной диаметр, высота носа от бровей, ширина носа, цвет глаз, доля светлых волос, доля темных волос, рост бороды, горизонтальный профиль лица, доля вогнутых спинок носа, доля выпуклых спинок носа, положение кончика носа, профиль верхней губы.
3. ОБОБЩЁННЫЕ КАРТЫ. ТРЕТИЙ РАЗДЕЛ Атласа содержит обобщённые карты двух видов — карты канонических переменных и карты расстояний, а также карты надёжности. Все обобщённые карты построены в двух вариантах: РАЭ (см. первый раздел Атласа) и АБВ (см. второй раздел Атласа).
Карты канонических переменных являются аналогами карт главных компонент и показывают основные закономерности в изменчивости русских популяций. Карты канонических переменных: не вычислялись из карт исходных признаков, а картографированы «готовые» значения канонических переменных, рассчитанные В. Е. Дерябиным по 18 (АБВ) или 30 (РАЭ) признакам. Приводятся трендовые карты (размер окна сглаживания 5x5 узлов сетки).
Карты генетических расстояний показывают сходство каждой русской популяции со среднерусскими характеристиками[82]. Карта по данным РАЭ построена в трёх вариантах (главы 2 и 4), различающихся числом признаков и методом построения, в одном из вариантов степень весовой функции в виде исключения равнялась 10. Карта по данным АБВ показывает расстояния Махаланобиса, рассчитанные от усреднённой русской популяции до каждой из 180 популяций в программе DJ. Использованы данные по 16 признакам: признаки «доля темных волос» и «доля светлых волос» не использованы из-за отсутствия данных по их внутригрупповой корреляции с остальными признаками, а эти корреляции необходимы для расчёта по Махаланобису. Полученные величины расстояний картографированы аналогично отдельным признакам, приводится трендовая карта (окно 3x3).
Карты надёжности показывают, для какой территории картографирование (интерполяционный прогноз) является статистически надёжным. Созданы две карты надёжности — для данных РАЭ (уровень строгости 0.5) и для данных АБВ (уровень строгости 0.7). Все карты Атласа приводятся в границах «надёжной» зоны, т. е. территории, хорошо обеспеченной исходными данными.
4. ГЕНЕТИЧЕСКИЙ ДЕТЕКТИВ. Сложность работы по созданию Атласа проиллюстрируем лишь одним примером. Казалось бы, коль скоро разработаны сложнейшие программные пакеты для картографирования, создана база антропологических данных, проведена их коннексия, то задача картографирования данных уже решена — остаётся лишь определить географические координаты популяций. Однако даже столь частная задача (о которой мы, как правило, и не упоминаем) может превратиться в неразрешимую проблему. Обычная процедура определения координат проходит следующим образом: в компьютерном Атласе (например, [Большой атлас России…, 2002]) открывается карта той административной области, к которой принадлежит популяция. В ней по справочникам отыскивается заданная популяция. Далее она отыскивается на карте, определяются ее точные координаты, которые и заносятся в популяционный справочник Банка данных.
Однако проблема в том, что авторы далеко не всегда указывают точную привязку изученных популяций, часто дают им произвольные рабочие наименования или допускают ошибки в их названиях. Могут встречаться несколько популяций со сходными названиями, со временем меняются и названия популяций и административные границы регионов и т. д. И тогда уже ординарная процедура определения координат превращается в детективную историю.
Например, популяции, обследованные М. В. Битовым, указаны в списке под условными названиями, соответствующими административному району — это первый источник информации. На картах М. В. Витова для этих же популяций указаны конкретные названия обследованных населённых пунктов — это уже второй источник информации. Третий источник информации — Банк данных «Русский генофонд» — содержит справочник всех районов России, соотнесённых с её областным делением. Необходимо сопоставить эти три источника. При совпадении их информации можно предположить, к какой административной области относится искомая популяция, и далее определять координаты по обычной процедуре. Однако после этих сопоставлений и ряда специальных ухищрений осталось несколько неидентифицируемых популяций.
Например, среди популяций М. В. Витова (источник информации № 1) есть «Приозёрская», а Приозёрский район (согласно источнику информации № 3) существует только в Ленинградской области. Однако на карте М. В. Витова (источник информации № 2) в занимаемой этим районом части Ленинградской области не отмечено ни одной изученной популяции. С другой стороны, на карте есть несколько населённых пунктов, которым нет соответствия в списке названий популяций. Просмотрев эти населённые пункты и другую вспомогательную информацию (время, маршруты обследования и многое иное) мы предположили, что наиболее вероятным кандидатом для популяции «Приозерский район» (источник информации № 1) может быть Конево (один из «беспризорных» пунктов источника информации № 2, т. е. не имеющий соответствий в источнике № 1). Основания для гипотезы были очень хрупкие: Конево находится рядом с Плесецким (Плисецким у М. В. Витова) районом Архангельской области, изученным М. В. Битовым в этом же 1955 году (правда, наряду с ещё 15 районами Костромской, Вологодской и Архангельской областей). В настоящее время вблизи от Конево существуют два района — Плесецкий и Каргопольский. Проблема в том, что оба района изучены М. В. Битовым и значатся в источнике информации № 1.
Тогда — на следующем витке детективной истории — мы предположили: а вдруг ранее существовал и Приозёрский район, а теперь он поглощен Плесецким и Каргопольским? Хотя вероятность этого мала, мы все же стали звонить в различные администрации Архангельской области, надеясь получить ответы на свои вопросы. Администрация Плесецкого района решала проблемы «космического» масштаба, и более перспективным оказался поиск через Каргопольский район. О Приозёрском районе там ничего не знали. Но в результате поисков мы выяснили, что в настоящее время в составе района имеется Приозёрский сельсовет. Беда только в том, что Конево в него не входит. Мы решили все же продолжать поиск. Дозвонившись в Приозёрский сельсовет, мы узнали, что Конево входило в него! Ныне, после укрупнения районов и смене их границ, Конево отошло к другому — Плесецкому району. Но ранее всегда относилось к Приозёрскому району, затем ставшему Каргопольским. Таким образом, в результате этих розысков, мы смогли популяцию «Приозёрский район» правильно поместить в Архангельской, а не в Ленинградской области, связав с популяцией «Конево» на карте М. В. Витова.
Однако оставался также не идентифицированным, например, «Виноградовский район». На карте М. В. Витова (источник информации № 2) такого населённого пункта нет. Однако район со столь южным названием по нашему справочнику Банка данных (источник информации № 3) числится в Архангельской области. Ищем дополнительные сведения. Оказывается, что в перечне изученных в том же 1955 году популяций (источник информации № 1) рядом с «Виноградовским» перечислен и Шенкурский район. А недалеко от Шенкурска на карте М. В. Витова (источник информации № 2) указано село Семёновское, которое оказалось также «беспризорным» — его нет в списке изученных популяций (источник информации № 1). Сопоставив логически всю цепь данных, можно выдвинуть мало вероятную, но все же гипотезу: Семёновское — это и есть Виноградовский район.
Беда только в том, что такого населённого пункта в Виноградовском районе не оказалось! Оставалось пытаться все же выяснить этот вопрос в районном центре Виноградовского района. Им оказался посёлок Березняки. В результате долгих розысков и звонков мы выяснили, что «столица» Виноградовского района — Березняки — до 1960 года называлась «Семёновское»! Оказалось, что Семёновское, указанное на карте М. В. Битовым, через пять лет после антропологического обследования было переименовано. О прежнем названии сейчас не помнят даже жители села — лишь в архиве района мы смогли обнаружить эту информацию! Итак, в результате дедуктивного метода и долгих поисков информация всех трёх источников совпала: мы сумели «Виноградовский район» из списка популяций совместить с Семёновским карты М. В. Витова и п. Березняки современной карты России.
Не будем перечислять другие истории нашего «расследования» (например, «Кировский район» оказался Фирово Тверской области) — мы хотели лишь показать на этих примерах, что до момента появления на свет карты распространения признака приходится преодолевать множество самых непредсказуемых препятствий.
АТЛАС ДЕРМАТОГЛИФИКИ РУССКОГО НАРОДА
(рассмотрен в главе 4).
Атлас основан на информации базы данных «Дерматоглифика» (содержит 201 запись) банка данных «Русский генофонд». Сводка данных составлена сотрудником Института этнологии и антропологии РАН к.и.н. Н. А. Долиновой (часть этих данных опубликована в монографии Г. Л. Хить «Дерматоглифика народов СССР»). Составитель любезно предоставила нам эту сводку для картографирования в русском ареале.
Атлас основывается на значениях 7 ведущих некоррелированных дерматоглифических признаков в 28 русских популяциях, в основном из Центральной России. Имеющаяся в банке данных популяция № 29 (Крымская) не учитывается при картографировании, так как находится вне «исконного» ареала.
Перечень признаков: дельтовый индекс, положение осевого карпального трирадиуса, индекс Камминса (основных ладонных линий), дополнительные межпальцевые трирадиусы, узоры на тенаре (Th/I), узоры на гипотенаре, европеоидно-монголоидный комплекс.
«ПРОСТЫЕ» КАРТЫ. Построены карты семи ведущих дерматоглифических признаков, перечисленных в главе 4. Приводятся трендовые карты (окно 5x5).
ОБОБЩЁННЫЕ КАРТЫ. Главные компоненты рассчитаны по картам распространения шести отдельных признаков (исключен европеоидно-монголоидный комплекс, который является производным из частот остальных признаков) в ареале надёжного пространства. Приводятся трендовые карты (окно 9x9).
Карта надёжности построена при уровне строгости 0.5. Она одна для всех карт дерматоглифики — простых и обобщённых — поскольку все эти карты основаны на информации об одних и тех же 28 русских популяциях.
АТЛАС КЛАССИЧЕСКИХ МАРКЁРОВ РУССКОГО НАРОДА (рассмотрен в главе 5)
Атлас основан на информации базы данных «Классические маркёры» (содержит 2 754 записей) банка данных «Русский генофонд». Данные собирались в течение ряда лет авторами этой книги и их коллегами (участвовавшими в создании БД «GENEPOOL») из многих источников. Некоторые публикации, надо полагать, не были нами найдены, но процент таких пропусков в базе данных, как нам кажется, очень мал. Поэтому Банк данных можно рассматривать как практически полное собрание всех накопленных в науке данных о полиморфизме классических маркёров в русском населении.
Чтобы сделать эту информацию доступной широкому кругу специалистов, мы приводим её на сайте и в Приложении (раздел 6).
Банк данных содержит частоты 100 аллелей 33 локусов иммуно-биохимического и физиологического полиморфизма. Использованы данные о частотах генов в 290 русских популяциях. В среднем локус изучен в 26 популяциях, но изученность разных маркёров крайне неравномерна.
Перечень признаков: АВН, АВ0, АСР, АК, СЗ, CER, СНЕ, CV, DI, ESD, F13B, FY, GC, GD, GLO1, HLA-A, HLA-B, HLA-C, HP, JK, KEL, KEL-KP, КМ, LEW, LU, MNS, P, 6PGD, PGM1, PI, PTC, RH, TF.
ИСХОДНЫЕ ДАННЫЕ, представляют собой частоты классических маркёров в русских популяциях, географические координаты которых лежат в пределах от 43° до 70° северной широты и от 24° до 60° восточной долготы плюс популяция г. Асбест, включённая в порядке эксперимента из-за её хорошей изученности (результаты этого эксперимента описаны в главе 5). Таким условным способом были отобраны русские популяции «исконного ареала» и как можно видеть, ареал взят с большим «запасом» — фактически включена вся Европейская часть России.
Для рассматриваемого ареала в Банке данных имелись сведения о ряде русских популяций по 24 локусам из 33. Однако степень изученности этих локусов резко различалась — как по числу изученных популяций, так и по географии этих популяций (например, чтобы они не были сосредоточены лишь в одной половине ареала). Поэтому 24 локуса были разделены на три группы.
1) В первую группу маркёров вошли тридцать пять аллелей тринадцати локусов, изученных для русских популяций достаточно хорошо (АВ0, АСР, ESD, GC, GLO1, HP, MN, 6PGD, PGM1, PI, PTC, RH-D, TF).
2) Во вторую группу маркёров вошли локусы, изученные не столь подробно: CV, KEL, LEW, а также HLA*B27. Для этих маркёров или число популяций было признано недостаточным (например, только 8 для системы HLA), или их география была неудовлетворительной (например, для цветовой слепоты в основном ограничена одним лишь центром исконного ареала).
3) В третью группу маркёров вошли слабоизученные локусы: АК, C3F, GD, HLA, КР, LU, Р.
Картографированы были маркёры всех трёх групп. Однако анализ главных компонент проведён только по локусам первой группы (наиболее изученным), картографо-статистический анализ (табл. 5.2.1.) — для первой и второй групп, третья же группа генов для количественного изучения русского генофонда не использовалась — карты привлекались лишь для общего сравнения с остальными разделами Атласа.
«ПРОСТЫЕ» КАРТЫ. Раздел включает 66 карт, показывающих распространение каждого из картографируемых аллелей первой и второй групп: 44 карты аллелей, перечисленных в табл. 5.2.1. (для диаллельных локусов строились карты обоих аллелей)[83], а также 22 карты аллелей трёх локусов HLA.
Для 44 аллелей был проведён картографо-статистический анализ этих карт, в том числе построены корреляционные карты связи каждого из аллелей с географической долготой, широтой и множественной корреляции с географическими координатами (табл. 5.2.1). Приводятся трендовые карты (выбор размера окна зависел от степени изрезенности рельефа карты, чаще всего использовались окна 7x7 и 11x11).
Каждая карта первого раздела сопровождается своей картой надёжности (уровень строгости 0.3). В этом особенность Атласа по классическим маркёрам. Если в остальных Атласах все признаки изучены в одних и тех же популяциях, то каждый из классических маркёров изучен в различных популяциях: от 8 популяций по генам системы HLA до 182 популяций по системе АВ0. Соответственно, резко различаются площадь и очертания «надёжной» зоны для карт разных классических маркёров. На приводимых картах значения частоты аллеля показаны только в пределах «надёжной» зоны. Поэтому карты распространения одних маркёров показывают их изменчивость в пределах одной лишь Центральной России, тогда как другие маркёры картографированы в русском населении практически по всей Восточной Европе.
Понятно, что общее число карт надёжности (18 карт) соответствует числу локусов первой и второй групп, а не числу аллелей: все аллели локуса изучены в одних и тех же популяциях, поэтому их изученность описывается одной и той же картой надёжности.
ОБОБЩЁННЫЕ КАРТЫ представлены синтетическими картами главных компонент (и их трендами, полученными в окнах 9x9, 11x11, 15x15). Они обобщают 35 карт аллелей первой группы и рассчитаны только по «надёжному пространству» обобщённой карты надёжности. Для её построения все карты надёжности для локусов из первой и второй групп (кроме HLA), были усреднены, при этом каждая карта надёжности отдельного локуса выступала с весом, равным числу аллелей в этом локусе. Например, «вес» карты надёжности системы АВ0 был равен трем, глиоксалазы 1 — двум, а трансферрина — пяти.
АТЛАС ГАПЛОГРУПП Y ХРОМОСОМЫ РУССКОГО НАРОДА (рассмотрен в главе 6)
Атлас основан на информации базы данных «Гаплогруппы Y хромосомы» (содержит 112 записей) банка данных «Русский генофонд». Информация представляет собственные данные авторов [Balanovsky et al., in print].
Атлас основан на данных о 14 русских популяциях, обследованных в ходе экспедиционной работы по изучению русского генофонда. Картографируются 8 гаплогрупп Y хромосомы, удовлетворяющих однопроцентному критерию полиморфизма: средняя частота в 14 популяциях выше 0.01.
Перечень признаков: гаплогруппы E3b, I1а, I1b, J2, N2, N3, R1a, R1b.
«ПРОСТЫЕ» КАРТЫ. Карты восьми гаплогрупп построены в пределах «надёжного» пространства русского ареала и использованы для создания карт главных компонент. В книге вместо этих «русских» карт приводятся карты распространения гаплогрупп на всей территории Европы (включая и надёжный русский ареал, очерченный серой линией). Создание «европейских карт» описано ниже.
ОБОБЩЁННЫЕ КАРТЫ. Синтетические карты главных компонент построены по восьми картам гаплогрупп в пределах надёжно изученного русского ареала. Приводится трендовая карта (окно 7x7).
Карта надёжности едина для всех простых и обобщённых карт (уровень строгости 0.3).
АТЛАС ФАМИЛИЙ РУССКОГО НАРОДА (рассмотрен в главе 7)
Атлас основан на информации базы данных «ONOMA». Содержится информация о фамилиях 1 201 000 человек.
Представлены 1166 популяций, относящихся к 107 районам одиннадцати административных областей. Общее число фамилий в базе данных превышает 67 тысяч. В алфавитном порядке первой стоит фамилия «Аабд», последней — «Ящуков». Исходно фамилии сгруппированы по населённым пунктам (или сельским объединениям), для которых указана их административная принадлежность. Это позволило рассчитывать частоту фамилии для любых заданных групп популяций.
ИСХОДНЫЕ ДАННЫЕ. Фамилии коренного сельского населения изучены главным образом в пределах «исконного» русского ареала. Для этого собирались данные по сельским поселениям, а также по тем небольшим городам, население которых сформировалось главным образом за счет жителей ближайших деревень. Население крупных городов игнорируется по той же причине, почему оно не изучается нами и по остальным маркёрам — чтобы минимизировать влияние недавних миграций. Единственное исключение сделано для фамилий Кемеровской области. Этот регион представляет «периферийное» русское население, далеко за пределами «исконного» ареала. И поскольку всё население — и сельское, и городское — сформировано мигрантами (из «исконного» ареала), то не было и смысла отсеивать «мигрантное» население городов.
Исходные данные представляют собой списочный состав населения изученного региона: перечень фамилий в каждом населённом пункте, где каждая фамилия соответствует одному человеку — её носителю. Очевидно, что одни и те же фамилии в этом списке могут повторяться многократно (родственники, однофамильцы). Программа «ONOMA» и создана для того, чтобы перейти от списка членов популяции к частотам фамилий в популяции, а затем провести необходимые расчёты.
Исходные данные могут дать информацию только о том, сколько раз та или иная фамилия встречена в данном населённом пункте. Этого достаточно для изучения структуры генофонда, а сама информация остаётся при этом анонимной — имеются данные не о людях, а лишь о частотах их фамилий.
Для статистического анализа использовалась вся база данных целиком, а для картографического — только данные о 75 фамилиях. Эта информация получена из двух источников.
1) Данные А. П. Бужиловой по частотам 75 русских фамилий в 55 популяциях уровня сельсоветов, представляющих 23 области Европейской части России. Средний объем выборки по масштабам, принятым в анализе фамилий, невелик — немногим более 300 человек.
2) Информация нашей базы данных «ONOMA» по тем же 75 фамилиям в 51 популяции уровня районов, представляющих 7 областей. Из 50 районов, используемых в статистическом анализе (см. табл. 7.2.1.) Репьёвский район Воронежской области не успел пока войти в картографический анализ, зато обширный Каргопольский район Архангельской области представлен как три популяции, что и дает в сумме 51 картографированную популяцию. Средняя выборка на район значительна — около 20 000 человек.
Сравнение этих двух источников показывает, что второй (наша база данных) основан на обширных выборках, но представляет только 7 областей, а у первого (данные А. П. Бужиловой) выборки невелики, зато география популяций очень хорошая. Поэтому для картографирования данные этих двух источников были объединены. По пяти районам (Холмогорский район Архангельской, Кашинский район Тверской, Кологривский и Вохомский районы Костромской, Велижский район Смоленской областей) имелись данные в обоих источниках. Для этих районов данные А. П. Бужиловой не использовались, и в этих точках картографировались только данные нашей базы данных. Таким образом, общее число опорных точек картографирования составило 101 популяцию: 50 популяций Бужиловой плюс 51 популяция нашей базы данных.
Кроме различия в уровне иерархии популяций (сельсоветы или же районы) между двумя источниками имеется и ещё одно — важнейшее — различие. Данные А. П. Бужиловой ограничены 75 фамилиями, которые оказались по её данным наиболее распространенными. В нашей же базе данных представлено не 75, а 14 000 «условно коренных» распространенных фамилий. Но поскольку для картографирования оба источника объединяются, то мы можем построить подробные «простые» карты лишь тех же 75 фамилий.
ПРЕОБРАЗОВАНИЕ ИСХОДНЫХ ДАННЫХ. В отличие от всех иных признаков, где преобразования от экспериментальных данных до частот признаков многократно описаны и общеизвестны, преобразования с данными о фамилиях не стандартизованы. Поэтому схематично приведем их.
1. «Маскулинизация» фамилий. В исходных данных присутствуют фамилии и мужчин, и женщин. Поэтому, чтобы одну и ту же фамилию не учитывать как две разные, все фамилии преобразуются к орфографии мужского рода. Например, список «Иванов, Смирнова, Иванова, Сидорова» превращается в «Иванов, Смирнов, Иванов, Сидоров». Надёжный алгоритм такого преобразования разработать не так просто (см. «Крик души» в конце параграфа).
2. Исключение неинформативных популяций. Как правило, в каждом районе есть несколько посёлков, где большинство жителей — недавние мигранты или их потомки. Такие поселения являются чуждыми включениями и не отражают изучаемую популяцию. К тому же они, как правило, недолговечны — их состав текуч, и сами они так же быстро исчезают с карты, как и появляются. Информация об уровне миграций в населённых пунктах собирается в ходе экспедиционного обследования. Разработана специальная методика: каждому населённому пункту местными экспертами проставляется степень его «мигрантности» по пятибалльной шкале. Оценки обычно выставляют два эксперта, правила оценок стандартизованы, что, как мы надеемся, сводит к минимуму субъективный момент в определении уровня миграций. Программа выводит список населённых пунктов вместе с оценкой «мигрантности» и позволяет выбрать, какие из них необходимо исключить из анализа (пункты с высоким уровнем миграции).
3. Исключение неинформативных фамилий. Очевидно, что часть пришлых, «залётных» фамилий может встретиться и в тех населённых пунктах, где население в основном коренное. Поэтому мы исключаем фамилии, число носителей которых в изучаемом районе меньше заданного порога. Обычно мы пользуемся разработанным нами «демографическим» критерием: фамилия считается неинформативной, если она встречена менее чем у пяти человек в районе (см. раздел 7.3). Программа «ONOMA» позволяет подразделить согласно этому критерию весь список фамилий на условно «коренные» и условно «пришлые». Условия их выделения (строгость критерия) можно выбрать разные. Все дальнейшие операции можно проводить с любыми выделенными группами фамилий — «коренными» (частыми), «пришлыми» (редкими) или по всей совокупности фамилий.
4. Расчёт частот фамилий. Каждая фамилия «прикреплена» в базе данных к тому населённому пункту, где она встречена. Однако мы не проводим анализ на уровне отдельных населённых пунктов[84]. Нами принята организация данных на трёх других более высоких иерархических уровнях. Первый уровень — «популяция» (сельская администрация, волость, сельсовет), объединяющая несколько населённых пунктов. Второй уровень — «район». Он включает все популяции, относящиеся к данному району согласно современным административным границам. Третий уровень — «регион». Он соответствует области или нескольким соседним областям и включает все районы, которые были обследованы в этих областях. Программа работает последовательно с каждым из уровней. Сначала объединяются списки фамилий всех населённых пунктов, относящихся к данной популяции, и рассчитывается частота каждой фамилии в полученном списке. Это частоты на уровне популяций. Далее усредняются частоты фамилии во всех популяциях данного района, и записывается полученная частота фамилии в районе. Далее усредняются частоты фамилии во всех районах данного региона, и записывается полученная частота фамилии в регионе. На всех уровнях иерархии можно рассчитывать и взвешенные, и невзвешенные средние частоты, что определяется конкретной задачей. Программа обеспечивает анализ и на любых других уровнях иерархии — например, населённых пунктов, или же заданных групп районов, или же заданных областей, или, например, географически соседних районов разных областей.
5. Размещение в базе данных. Частоты каждой фамилии в каждой популяции, каждом районе и каждом регионе записываются в базу данных. Причём, частота фамилии в данной группе населения может быть рассчитана разными способами. Осуществляется целый веер расчёта частот. Фамилии могут быть «коренные», «пришлые» или любые. Частоты взвешенные или невзвешенные на том или ином уровне. Население может включаться только сельское или же и городское. Неинформативные популяции могут исключаться в разных вариантах или же включаться в анализ. То есть мы получаем несколько оценок частоты одной и той же фамилии в одной и той же группе населения. Чтобы избежать путаницы, они помещаются в разные разделы базы данных. Весь веер полученных частот для каждой популяции может храниться в БД и использоваться для дальнейшего анализа. Каждый из- этих вариантов расчёта оптимален для решения своего круга задач.
6. Оценка случайного инбридинга. Традиционно в популяционной генетике фамилии используются для расчёта случайного инбридинга (см. раздел 7.6). Инбридинг оценивается просто — методом изонимии (I). Он представляет вероятность случайного заключения брака между носителями одной фамилии (это справедливо при условии панмиксии). Соответственно, вероятность случайного инбридинга рассчитывается как четверть от суммы квадратов частот всех фамилий [Crow, Mange, 1965]. Программа «ONOMA» рассчитывает коэффициент изонимии (I) для популяций любого уровня и для частот фамилий, полученных разными способами.
Перечень признаков: Абрамов, Александров, Алексеев, Андреев, Анохин, Антонов, Афанасьев, Балашов, Белов, Борисов, Быков, Васильев, Веселов, Виноградов, Волков, Воробьёв, Воронин, Голубев, Горбачёв, Григорьев, Гуляев, Гусев, Денисов, Дружинин, Егоров, Ершов, Ефимов, Иванов, Ильин, Калинин, Киселёв, Ковалёв, Козлов, Костеров, Котов, Кротов, Крылов, Кудряшов, Кузьмин, Кузнецов, Курочкин, Лебедев, Макаров, Михайлов, Морозов, Никитин, Николаев, Новиков, Носков, Осипов, Павлов, Пестов, Петров, Поляков, Попов, Прокофьев, Романов, Савельев, Семёнов, Сидоров, Смирнов, Соколов, Соловьёв, Степанов, Тарасов, Тимофеев, Тихонов, Трифонов, Фёдоров, Филиппов, Цветков, Чернов, Чистяков, Щербаков, Яковлев.
«ПРОСТЫЕ» КАРТЫ включают 75 карт, построенных в пределах «надёжного» пространства и при минимальном сглаживании (окно 3x3).
ОБОБЩЁННЫЕ КАРТЫ включают карты главных компонент (тренд в окне 7x7), карты генетических расстояний и карты случайного инбридинга.
Карты главных компонент и генетических расстояний (от среднерусских частот фамилий) рассчитаны по 75 картам отдельных фамилий в пределах надёжного пространства (уровень строгости 0.5). Карты главных компонент обсуждаются в главе 7. Карта генетических расстояний не приводится, поскольку неравномерная изученность не позволяет рассматривать ее как надёжный результат, хотя её общий паттерн весьма напоминает карты расстояний, приводимые в соматологическом атласе.
Карта случайного инбридинга основана только на информации нашей базы данных по 49 районам. Поэтому эти карты построены по данным не о 75, а обо всех 14000 «коренных» фамилий. Расчёт оценок случайного инбридинга проводился в программе ONOMA в двух вариантах — на уровне популяций (сельсоветов) и на уровне районов. Приводится «районная» карта (тренд 11x11).
КРИК ДУШИ
При описании программы или базы данных, чем понятней стараешься изложить механизмы их работы, тем проще кажется задача создания этих программных продуктов. Поэтому проиллюстрируем нелегкую работу программистов одним лишь примером. Он касается простейшей, казалось бы, задачи — приведения фамилий к орфографии мужского рода.
В действительности, нельзя создать алгоритм определения того, к мужскому или же к женскому роду относится фамилия, однозначно охватывающий все 100 % фамилий. Фамилии, оканчивающиеся на «А», далеко не всегда оказываются женскими. Могут быть и мужские. Например, ДУБРАВА. Мало того, даже одна и та же фамилия, оканчивающаяся на «А», может включить в себя две разных фамилии, одна из которых мужского рода, а другая — женского. Например: ГОЛОВА. Это может быть как ГОЛОВА так и ГОЛОВА. В первом случае это и мужская и женская фамилия и изменять её нельзя. А во втором случае это женская фамилия и её надо превратить в мужскую — ГОЛОВ. Для программной обработки в таких случаях нет признака пола. И создать общий для всех популяций алгоритм, чтобы различить эти фамилии — нельзя.
Если женская фамилия оканчивается на «АЯ», то мужская фамилия равновероятно может оканчиваться на «ИИ», «ОЙ», «ЫЙ». Если в списках присутствует только женская фамилия, то конвертировать её в мужскую без ошибки нет возможности. Гипотетический пример. В популяции встречаются две мужские фамилии ГОРСКИЙ и ГОРСКОЙ. Обе они дают одну женскую фамилию ГОРСКАЯ. Тогда обнаружив в списке женскую фамилию, не зная ударения, нельзя однозначно произвести из нее мужскую фамилию.
Утешает одно — таких случаев немного.
Учитывая это, после просмотра преобразования фамилий нескольких районов из разных областей и поиска ошибок, был принят следующий алгоритм трансформации фамилий в мужские.
1. В большинстве случаев фамилии с окончаниями ОВА, ЕВА, ИНА, ИВА, ЕНА, ЫНА являются женскими и их можно заменить на мужские, отбросив последнюю букву «А».
2. Для других фамилий оканчивающихся на «А» применить следующую методику.
2.1. Отбросить последнюю букву и запомнить трансформированную фамилию.
2.2. По этой трансформированной фамилии организовать её поиск по базе.
2.3. Если нет такой — считать, что фамилии “мужская”.
2.4. Если такая находится, то значит это фамилия “женская” и её надо заменить на найденную мужскую.
3. Для окончаний «АЯ>> искать трансформированные фамилии с окончаниями «ИИ», «ОИ», «ЫИ». При положительном поиске произвести замену женской фамилии на найденную мужскую.
§ 2. Атласы генофондов Европы и Евразии
Атлас генофонда Восточной Европы рассматривается в главе 8 и состоит из пяти разделов: классические маркёры; аутосомные ДНК маркёры; митохондриальная ДНК; соматология; дерматоглифика. Фактически это отдельные атласы, но для целей нашей книги их удобнее рассмотреть все вместе. Перечень всех маркёров Атласа сведен в обобщающей таблице 8.1.1.
РАЗДЕЛ «КЛАССИЧЕСКИЕ МАРКЁРЫ ВОСТОЧНОЙ ЕВРОПЫ»
Карты основаны на информации Банка данных «GENEPOOL» (см. главу 1) о частотах 100 аллелей 30 классических генетических маркёров в популяциях Восточной Европы (в широком смысле, т. е. включая Урал и Северный Кавказ). Как и для карт классических маркёров в русском ареале, число изученных популяций резко варьирует: от 12 до 881 популяций по разным локусам. В сравнении с ранее проводившимся анализом [Балановская, Нурбаев, 1997; Рычков и др., 2002] данные пополнены информацией о популяциях русских и калмыков.
«ПРОСТЫЕ» КАРТЫ. По этим данным построены сто карт отдельных аллелей для ареала народов Восточной Европы.
ОБОБЩЁННЫЕ КАРТЫ включают три типа карт, построенных по 100 картам отдельных аллелей: карты главных компонент, карта гетерозиготности (средняя по 33 локусам) и карты генетических расстояний от средних частот генов в русских популяциях и от средних частот генов в популяциях белорусов.
Карты надёжности построены при уровне строгости 0.3 для каждого из локусов (30 карт надёжности). Общая карта надёжности создана на основе 30 различающихся карт следующим способом. На первом этапе каждая карта надёжности преобразована в балловую: значения менее 0.95 (низкая надёжность) заменены на значение «0»; значения выше 0.95 заменены на «1». Полученная карта принимает только два значения: в узлах с низкой надёжностью ноль, в узлах с высокой надёжностью — единица. Именно эти балловые карты были усреднены. (При усреднении взвешивание по числу аллелей не проводилось, чтобы обеспечить совместимость с аналогичной «среднебалловой» картой надёжности по ДНК маркёрам. Надёжными узлами полученной карты считались узлы со значением выше 0.5 (то есть те узлы, которые являются надёжными более чем для половины изученных локусов). Чтобы привести к обычному виду карты надёжности, значения в каждом узле были увеличены на 0.45, после этого надёжными, очевидно, являются узлы со значениями выше «обычного» порога 0.95. Необходимость такой «среднебалловой» карты (а не обычной средней карты, как например, в атласе классических маркёров для русских популяций) вызвана тем, что низкая надёжность в абсолютном значении является крайне малой, и единственная карта с низкой надёжностью на какой-либо территории дает на усреднённой карте надёжность ниже 0.95, даже если все остальные карты на этой территории высоко надёжны. В дальнейшем анализе при построении обобщённых карт использовались карты отдельных аллелей только в надёжном пространстве «среднебалловой» общей карты надёжности.
РАЗДЕЛ «АУТОСОМНЫЕ ДНК МАРКЁРЫ ВОСТОЧНОЙ ЕВРОПЫ»
Карты основаны на информации Банка данных «GENEPOOL» (см. главу 1). Картографический анализ проводился неоднократно в течение нескольких лет (по данным о четырех, семи и шести локусах), в главе 8 описывается вариант, выполненный по шести наиболее изученным локусам. Из них четыре ДНК маркёра относятся к микросателлитным: CAct685 (14 аллелей), DM (28 аллелей), DRPLA (23 аллеля), SCA1 (19 аллелей); один ДНК маркёр представляет класс минисателлитных маркёров: АроВ (28 аллелей); и один ДНК маркёр инсерционно-делеционного полиморфизма: CCR5del32 (2 аллеля).
«ПРОСТЫЕ» КАРТЫ. Раздел включает 114 карт распространения 114 аллелей 6 аутосомных ДНК маркёров.
ОБОБЩЁННЫЕ КАРТЫ. Раздел включает карты главных компонент, генетических расстояний и средней гетерозиготности.
Карты главных компонент (тренд 11x11) построены по 51 одной карте полиморфных аллелей — использованы карты только тех аллелей, средняя частота которых в Восточной Европе выше 1 %.
Карты генетических расстояний построены по 114 аллелям (включая как 51 условно-полиморфный аллель, так и прочие редкие аллели, поскольку расстояния Нея позволяют совместное использование частых и редких аллелей). Созданы пять карт расстояний: от среднерусских частот, от средних частот в уральской семье, индоевропейской, алтайской и от средних частот в Восточной Европе. Расчёт средних частот, например, по уральской семье, проводился так: брались данные по частотам 114 рассматриваемых аллелей в популяциях уралоязычных народов, локализованных в Восточной Европе; рассчитывались сначала среднеэтнические частоты (по всем популяциям данного народа), и затем уже усреднением среднеэтнических получали средние частоты в популяциях уральской семьи. Средневосточноевропейские значения получены усреднением частот во всех семьях. Такой иерархический расчёт средних частот выполнен в программе MEGERA 2.0. Карты генетических расстояний от каждой семьи строились сначала по каждому локусу отдельно, и затем усреднением шести карт получены итоговые карты. (Карта расстояний от русских основана на пяти локусах, поскольку CAct685 не изучен в русских популяциях). Приводятся трендовые варианты карт (окно 9x9).
Карты гетерозиготности построены для шести локусов (по 114 аллелям), и рассчитана средняя карта гетерозиготности. Приводится трендовая карта (окно 11x11).
Карты надёжности построены при уровне строгости 0.3 для каждого из локусов (6 карт надёжности). Обобщённая (среднебалловая) карта надёжности создана так же, как для восточноевропейского атласа классических маркёров.
РАЗДЕЛ «МИТОХОНДРИАЛЬНАЯ ДНК ВОСТОЧНОЙ ЕВРОПЫ»
Карты основаны на информации Банка данных «World Mitochondrial» по частотам гаплогрупп и гаплотипов мтДНК. Использована информация на 2003 год о 22 восточноевропейских популяциях.
«ПРОСТЫЕ» КАРТЫ. Раздел включает карты распространения в Восточной Европе 16 отдельных гаплогрупп (С, D, Н, HV, I, J, К, R, Т, U2, U3, U4, U5a, U5b, V, W), а также карту «бланка» (суммарной частоты всех прочих редких гаплогрупп).
ОБОБЩЁННЫЕ КАРТЫ. Раздел включает суммарные карты гаплогрупп и карты гаплотипического разнообразия (являющегося для однородительских маркёров аналогом средней гетерозиготности аутосомных маркёров).
Суммарная карта распространения восточно-евразийских гаплогрупп построена по данным о суммарной частоте гаплогрупп А, В, С, D, G, F, Y, Z.
Карты главных компонент построены по 17 картам отдельных гаплогрупп.
Карта общего гаплотипического разнообразия показывает географическое распределение уровня гаплотипического разнообразия, который был рассчитан по данным о частотах отдельных гаплотипов (линий). Приводится трендовая карта (окно 11x11).
РАЗДЕЛ «АНТРОПОЛОГИЯ ВОСТОЧНОЙ ЕВРОПЫ»
Подраздел «СОМАТОЛОГИЯ» описывает изменчивость 22 признаков соматологии в 253 популяциях Восточной Европы.
ОБОБЩЁННЫЕ КАРТЫ. Подраздел включает карты первой и второй канонических переменных изменчивости 22 антропологических признаков в популяциях восточноевропейских народов. В отличие от карт главных компонент в остальных атласах, эти карты строились не по картам отдельных признаков, а по значениям признаков в изученных популяциях. Расчёт значений канонических переменных выполнен В. Е. Дерябиным, и эти данные были затем нами картографированы.
Подраздел «ДЕРМАТОГЛИФИКА». Исходные данные о значениях шести ведущих некоррелированных признаков в 72 популяциях Восточной Европы были предоставлены Н. А. Долиновой.
«ПРОСТЫЕ» КАРТЫ. Были построены шесть карт распространения ведущих признаков дерматоглифики в Восточной Европе.
ОБОБЩЁННЫЕ КАРТЫ представлены картами главных компонент (тренды в окне 15x15). Расчёт главных компонент проведён в двух вариантах — только по «надёжному» ареалу карты, и по всему пространству карты. Надёжный ареал при уровне строгости 0.5 состоит из обширной центральной зоны и нескольких отдельных «анклавов» по периферии Восточной Европы. Поскольку восприятие карты главных компонент в таком разорванном ареале может затруднить читателя, мы приводим карты главных компонент в «полном» ареале, то есть построенные без учета надёжности. Впрочем, изученность дерматоглифики достаточно высокая, и как «надёжные», так и «безнадёжные» карты выявляют одинаковые закономерности в географии главных компонент.
АТЛАС «ГАПЛОГРУППЫ Y ХРОМОСОМЫ В ЕВРОПЕ»
Карты основаны на сводке о частотах гаплогрупп Y хромосомы в населении Европы, составленной А. С. Пшеничновым по литературным данным, и включающей также наши неопубликованные данные по русским, украинским и белорусским популяциям. Для картографирования выбраны восемь гаплогрупп, которые наиболее часты в населении Европы: E3b, J2, Иа, I1b, N2, N3, R1a, R1b.
Поскольку разные источники (оригинальные публикации) использовали разные схемы определения гаплогрупп, и типирование проводилось с разным уровнем филогенетического разрешения (дробности определения гаплогрупп), не для всех популяций было возможно определить частоты каждой из восьми гаплогрупп. В случае, если источник содержал информацию по парагруппе R1 (xRlb), эти частоты учитывались как относящиеся к гаплогруппе R1a. Число изученных популяций максимально для гаплогруппы R1a (К=148) и минимально для гаплогруппы N2 (К=74).
Большинство малочисленных выборок (N<40), имевшихся в сводке данных, не использовались для картографирования или были присоединены к более крупным выборкам. Такое объединение выборок проводилось только для географически близких популяций, принадлежащих к одному народу.
АТЛАС ГЕНОФОНДА ЕВРАЗИИ
(рассмотрен в главах 5, 6, 9)
Классические маркёры представлены четырьмя картами для генов групп крови АВ0 и резус (глава 5, раздел 5.2). Аутосомные ДНК маркёры представлены картой гена CCR5 (глава 6, раздел 6.1). В обоих случаях использована информация банка данных GENEPOOL. Но главным образом Атлас включает карты по митохондриальной ДНК (глава 9, раздел 9.2).
БАНК ДАННЫХ ПО МИТОХОНДРИАЛЬНОЙ ДНК. Источником исходных данных по мтДНК послужил банк данных World Mitochondrial. (Его последние версии обозначаются также MURKA database). Банк данных объединяет подавляющее большинство опубликованных данных по изменчивости митохондриальной ДНК в популяциях всех регионов мира. Объём банка данных на 2007 год превышает 67 000 изученных образцов мтДНК. Создание банка велось под общим руководством первого автора этой книги: начальные версии составлялись другим автором, затем сбор данных осуществлял А. С. Пшеничное, а нынешняя версия банка данных в значительной мере пополнена В. В. Запорожченко, которым написана также программа автоматического отнесения образцов к гаплогруппам.
Для каждого образца содержится информация по ГВС1, а также (при наличии таких данных в оригинальных статьях) по ГВС2 и по информативным мутациям в кодирующем регионе мтДНК («ПДРФ маркёры»). В банк включены также сведения по изученным популяциям, включая их этническую (народ) и административную принадлежность (страна, провинция) и географические координаты.
ОПРЕДЕЛЕНИЕ ЧАСТОТ ГАПЛОГРУПП. Особенность всех митохондриальных баз данных в том, что информация содержится в формате «образец (из определённой популяции) — его гаплотип», а не в формате «популяция — частота аллеля (гаплогруппы)», обычном для популяционно-генетических баз данных. Соответственно, на первом этапе использования митохондриальной базы данных необходимо для каждого образца указать его гаплогруппу, и только потом можно рассчитать и картографировать частоты гаплогрупп. Однако определение гаплогруппы для огромного массива образцов, изученных разными авторами по различным наборам маркёров с использованием различающихся обозначений одних и тех же гаплогрупп, представляет собой сложную задачу.
Для создания Атласа митохондриальной ДНК Евразии (версия 2007 года) мы использовали следующий алгоритм. Для образцов, по которым имелись удовлетворительные данные о ПДРФ маркёрах кодирующей части мтДНК, гаплогруппы определялись по наличию характеристических мутаций в кодирующей части, то есть наиболее корректным путём. Для образцов, по которым имелись данные только по ГВС1 (или данные по обоим сегментам, и ГВС1, и ГВС2), гаплогруппа определялась по степени сходства данного гаплотипа со всеми гаплотипами, для которых надёжно известна гаплогруппа. В качестве такой референтной базы (обучающей выборки) использовались образцы, секвенированные полностью или подробно охарактеризованные по ПДРФ маркёрам. Например, если гаплотип данного образца по набору мутаций оказывался наиболее сходен с восемнадцатью другими гаплотипами, несомненно относящимся к гаплогруппе U4, то и рассматриваемый гаплотип мы относили к той же гаплогруппе. Такая операция проводилась программным путём (используя возможности MURKA database), при необходимости результаты проверялись и корректировались вручную (экспертная оценка). Такой способ достаточно эффективен и в большинстве случаев точен (как показано для похожего алгоритма [Behar et al., 2007]), но не гарантирует стопроцентное определение гаплогруппы. Действительно, если тестируемый образец сходен с двадцатью гаплотипами, относящимися к одной гаплогруппе, и с сорока гаплотипами другой гаплогруппы, то классифицировать наш гаплотип затруднительно. Во всех подобных случаях гаплогруппа не проставлялась (считалась неизвестной), и популяции, в которых доля таких неизвестных гаплогрупп превышала 1 %, не включались в картографический анализ. Впрочем, для ряда гаплогрупп (тех, для которых общепринято выделение по ГВС1) такого исключения популяций не проводилось, поэтому карты разных гаплогрупп основаны на несколько различающихся наборах популяций.
Такой алгоритм позволил гарантировать высокую надёжность исходных картографируемых данных (частот гаплогрупп) и при этом использовать все имеющиеся данные: как из работ, включавших обязательное определение ПДРФ маркёров, так и данные из многочисленных исследований, в которых проводилось лишь секвенирование ГВС1 (например, публикации лабораторий судебно-медицинской экспертизы). Использованные для картографирования частоты гаплогрупп представлены на сайте (к моменту выхода книги представлены частоты 11 основных гаплогрупп в 136 популяциях Западной Евразии).
«ПРОСТЫЕ» КАРТЫ. Были построены 43 карты распространения отдельных гаплогрупп. Можно было построить карты для множества дробных гаплогрупп, но для целей этой книги мы выбрали 43 гаплогруппы, представляющие основное разнообразие митохондриальной ДНК в Евразии.
Перечень картографированных признаков: гаплогруппы А, А4, А5, А* В, С, D, F, Н, J, К, Ml, М3, М7, М7* М7а, М7b, М7Ы, М7b2, М7bЗ, M7b* М7с, Т, Tl, Т2-Т5, Т2, Т* U2, U2* U2a, U2b, U2c, U2e, U4, U5a, U5b, V, W, X, XI, X2, X*,Z.
ОБОБЩЁННЫЕ КАРТЫ. Весь анализ проведён в пределах надёжного пространства, задаваемого картой надёжности (построенной по 278 популяциям при уровне строгости 0.2).
Суммарные карты западноевразийских и восточноевразийских гаплогрупп основаны на картах гаплогрупп H, J, К, Ml, М3, T, Tl, T2-T5, T2, T* U2, U2* U2a, U2b, U2c, U2e, U4, U5a, U5b, V, W, X, XI, X2, X* (западноевразийские гаплогруппы) и A, A4, A5, А*, В, С, D, F, M7, M7* M7a, M7b, M7bl, M7b2, M7b3, M7b*, M7c, Z (восточноевразийские гаплогруппы).
Карты главных компонент изменчивости генофонда построены по картам 20 гаплогрупп А, В, С, D, F, Н, J, К, Ml, М3, М7, Т, U2, U4, U5A, U5B, V, W, X, Z. Набор гаплогрупп сократился только за счет уменьшения их дробности — чтобы гаплогруппы со множеством субгаплогупп (например, многочисленные варианты М7 или U2) не смещали оценки главных компонент.
Карта генетических расстояний суммирует расстояния от средних частот тех же 20 гаплогрупп в русских популяциях.
Наконец, для построения карты гаплотипического разнообразия отдельной гаплогруппы (V) рассчитано разнообразие всех гаплотипов, входящих в гаплогруппу V (дополнение до единицы суммы квадратов частот всех гаплотипов), и полученные значения картографированы. «Карта прародины» получена перемножением карт разнообразия и карты частоты гаплогруппы V.
* * *
Созданные атласы русского генофонда обобщают практически всю информацию об изменчивости русских популяций, накопленную антропологией и генетикой. Восточно-Европейский атлас выявляет взаимодействие русского генофонда с соседями — опять-таки не только по ДНК маркёрам, но и по классическим генетическим маркёрам, а также по антропологическим признакам. А евразийский атлас показывает место русского генофонда в общей системе генофондов Евразии.
Авторы надеются, что эта книга послужит не памятником научным эпохам изучения русского народа по данным антропологии и классическим генным маркёрам, а инструментом при его дальнейшем исследовании в «ДНК-эру». Думается, что ценнейшим преимуществом «ДНК-эры» является её богатое наследство: уникальная возможность объективного сравнения новых результатов с итогами прошлых исследований. Такое сравнение выявляет и новые возможности, и новые промахи молекулярно-генетических исследований, позволяет прокладывать путь не по абрису, а по надёжной геногеографической карте.
6. ТАБЛИЦЫ ЧАСТОТ ГЕНОВ
В этом разделе мы приводим те исходные генетические данные, на которых основано наше изучение русского генофонда. Для русских популяций информация приводится полностью — указаны изученные популяции, частоты генов, объем выборки, литературная ссылка на оригинальную публикацию этой информации, административная принадлежность и географические координаты популяций (таблицы 6.1. — 6.4).
Но изучение русского генофонда проведено не изолированно — в книге мы широко пользуемся данными по другим народам Европы и по другим регионам Евразии. Не имея возможности вместить в книгу всю имеющуюся информацию о популяциях человека, мы приводим усредненные данные по крупным регионам мира, а для Северной Евразии — дополнительно и по ее субрегионам. Для каждого гена в каждом регионе указаны две ключевые характеристики — средняя частота и межпопуляционная изменчивость (таблицы 6.5. и 6.6). Эти сведения являются результатом кропотливого труда, выполненного много лет назад, и мы рады возможности, наконец, представить их широкому, кругу читателей.
Почему мы столь подробно приводим информацию для классических маркеров? Накопление данных по классическим маркерам продолжалось во всем мире несколько десятилетий и в основном завершилось. Подавляющее большинство новых работ посвящено теперь иным — ДНК маркерам. Поэтому важно зафиксировать в таблицах итоги изучения классических маркеров — как в русских популяциях, так и во всем мире (таблицы 6.1. — 6.6. Приложения). Что же касается ДНК маркеров, то по ним объем информации растет как лавина, и сегодняшние сводки данных устареют уже через несколько лет. Тем не менее, мы приводим информацию и по ДНК маркерам — в главе 9 помещена таблица 9.2.1. с частотами гаплогрупп митохондриальной ДНК в основных регионах Евразии, глава 6 завершается таблицей 6.4.1. с частотами гаплогрупп Y хромосомы у народов Европы, а в главе 5 содержится таблица 5.1.1. с частотами аллеля CCR5del32 в русских популяциях. Объем табличных данных по русским фамилиям столь огромен, что мы можем привести лишь частоты 250 «общих» фамилий в шести регионах (глава 7, табл. 7.3.4). Таким образом, мы постарались опубликовать наши исходные данные по возможности полностью, насколько это позволяет объём книги. Исключение составляют лишь соматологические и дерматоглифические данные. Публикация этих сводок является прерогативой их составителей — проф. В. Е. Дерябина и к.и.н. Н. А. Долиновой.
Вся приводимая информация по разнообразным генетическим маркерам и по фамилиям является лишь печатной версией — и то очень ограниченной и частичной — созданных нами Банков данных о генофонде народов мира. Именно эти электронные базы данных являются реальной основой нашего исследования. В таблицах этой книги они отражены лишь частично. Поэтому исходную информацию банков данных мы постепенно публикуем на нашем сайте .
Таблица 6.1.
Частоты аллелей систем АВ0, MN, Rhesus в русских популяциях.
Продолжение таблицы 6.1.
Продолжение таблицы 6.1.
Продолжение таблицы 6.1.
Продолжение таблицы 6.1.
Таблица 6.2.
Частоты гаплотипов и субвариантов систем ABO, MN, Rhesus в русских популяциях.
Продолжение таблицы 6.2.
Таблица 6.3.
Частоты аллелей системы HLA в русских популяциях.
Продолжение таблицы 6.3.
Таблица 6.4.
Частоты аллелей других классических маркёров. в русских популяциях.
Таблица 6.5.
Средние частоты классических маркеров в регионах мира
Таблица 6.6.
Межпопуляционное разнообразие классических маркеров в регионах мира
Таблица 6.7.
Средние частоты q и межпопуляционное разнообразие классических маркеров в субрегионах Северной Евразии
СПИСОК ЛИТЕРАТУРЫ К ТАБЛИЦАМ ПРИЛОЖЕНИЯ
1) Boyd W. С., Boyd L. G. Sexual and racial variations in ability to taste phenilthiocarbamid, with some data on the inheritance // Ann. Eugen. 1937. V. 8. 60 p.
2) Glossman O. Materialen zur Frage der isohamagglutination // Ukrain. Zbl. Blutgruppenforsch. Bd 3, H. 1. 1929. lip.
3) Mourant A. E., Kopec A. C., Domanievska-Sobczak K. The Distribution of the Human Blood Groups and other polimorphisms. London: Oxford Univ. Press. 1976. 1055 P.
4) Post R. N., Neel J. V., Schull W.J. Tabulations of phenotype and gene frequencies for 11 different genetic systems, studied in the American Indians // Biomedical challenges presented by the American Indians. Sci. Publ., N 165. Washington, D. C.: Pan American Health Organization, 1968. 141–185 p.
5) Sistonen P., Mainio E., Lukka М., Sajantila A. Blood groups and other genetic blood markers in the Vologda Russians // Physical anthropology and population
genetics of Vologda Russians / Suomen Anthropologinen seura. The Finnish Anthropological Society. Helsinki: 1993. N 32. 58 p.
6) Tongmao Z., Gliang Z., Dazhang L., Zhijong C., Jinxiang Z. The distribution of human immunoglobulin Gm, Km factors in Han nationality and Uighurs // Acta genet. Sinica. 1983. V. 10. P. 311.
7) Абдиров Ч., Рысназаров H. Распределение групп крови по системе АВ0 и MN у населения Каракалпакской АССР // Тр. суд. мед. экспертов Узбекистана. Ташкент: 1975. Т. 3. С. 142.
8) Акимова 3. И., Шамшина Н. М. Распределение групп крови системы АВ0 и резус среди населения (доноров) Ульяновской области // Науч. практ. конф. врачей. Ульяновск: 1977. С. 103.
9) Алексеев В. П., Беневоленская Ю. Д., Гохман И. И., Давыдова Г. М., Жомова В. К. Антропологические исследования на Лене // СЭ. 1968. N 5. С. 21.
10) Алексеева Т. И., Волков-Дубровин В. П., Павловский О. М., Смирнова Н. С., Спицын В. А., Щекочихина Л.К. Антропологические исследования в Забайкалье в связи с проблемой адаптации у человека (морфология, физиология и популяционная генетика): I. Население Баргузинской котловины в свете исторических и популяционно-генетических данных // Вопр. антропологии. 1970. Вып. 36. С. 3.
11) Амбалов Ю. М., Линник В. Г., Малышева Л. И., Маликова Л. П. Распределение лейкоцитарных антигенов в здоровой популяции коренных жителей Ростовской области (казаков) // Второй Всесоюзный съезд мед. генетиков. Тез. докл. 4–6 декабря 1990 г. Алма-Ата. М.: 1990. С. 3.
12) Анненков Г. А., Котрикадзе Н. Г., Мгебришвилли О. М. Полиморфизм сывороточных гаптогпобинов и трансферринов у людей различных национальностей г. Сухуми // Вопр. антропологии. 1972. Вып. 41. 77 с.
13) Асеева С. М. Группы крови у населения Абхазии // Тр. Тропического ин-та Наркомздрава АССР Абхазии. Тбилиси: 1936. Вып. 2. С. 110.
14) Барашевич Н. К., Моралева А.В., Малышева Г.1А. Группы крови системы АВ0 и резус фактор у населения Ивановской области // Гемолитическая болезнь и желтухи у новорожденных. Иваново: 1973. 50 с.
15) Белкина В. И. Реакция изогемагглютинации у народов Алтая // Тр. III Всесоюзн. съезда зоологов, анатомов и гистологов. Л: 1928. С. 318.
16) Белов А. П. Об установлении типов Нр в жидкой крови человека и о распределении типов Нр среди части жителей Советского Союза // Пробл. гематологии и переливания крови. 1964. Т. 9. N 7. С. 18.
17) Беляев А. И. Кровяные группы у туберкулезных больных // Ukrain. Zbl. Blutgruppenforsch. Bd 1(6), H. 1932. 2(3). С. 53.
18) Беневоленская Ю. Д., Давыдова Г. М. Русское население Псковского обозерья // Полевые исследования Ин-та этнографии АН СССР в 1977 г. М.: 1979. С. 180.
19) Беседин Г. И. К вопросу о групповом (по крови) распределению русских // Рус. антропол. 1927. Т. 16. Вып. 1, 2. С. 28.
20) Брилль Г. Е. Группы крови и гематологические заболевания // Тр. Сарат. мед. ин — та. 1970. Т. 71. С. 57.
21) Бронникова М. А. Судебно-медицинское исследование вещественных доказательств. М.: Медгиз, 1947. 206 с.
22) Бубнов Ю. М. Изучение отбора нормальных признаков человека //1 Всесоюз. конф. по мед. генетике: Тез. докл. М.: 1975. С. 48.
23) Будяков О. С. Определение подгрупп А1 и А2 в жидкой крови фитагглютининами // Вопр. антропологии. 1966. Вып. 22. С. 120.
24) Бунак В. В. Русское население в Забайкалье // Тр. Ин-та этнографии АН СССР. Нов. сер., Антропол. сб. 4. М.: 1963. Т. 82. 195 с.
25) Бунак В. В. Геногеографические зоны Восточной Европы, выделяемые по факторам крови АВ0 // Вопр. антропологии. 1969. Вып. 32. С. 6.
26) Вайнштейн С. Г. Распределение агглютиногенов системы Льюиса в эритроцитах жителей Казани // I Всесоюзн. конф. по мед. генетике: Тез. докл. М.: 1975. С. 50.
27) Веревкина Л. В., Разживина Е. А., Тихомирова Н. В. Группы крови системы АВ0 у больных псориазом и экземой // Генетика человека и патология: Материалы I итоговой конф. НИИ мед. генетики. Томск: 1989. С. 58.
28) Вишневский Б. Н. К вопросу о расовом биохимическом показателе // Врачебное дело. 1925. N 6. С. 484.
29) Вишневский Б. Н. Кровяные группы и антропология // Ukrain. Zbl. Blutgruppenforsch. Bd 1, H. 2. 1927. 3 с.
30) Вишневский Б. Н. К исследованию кровяных групп народностей СССР // Ukrain. Zbl. Blutgruppenforsch. Bd 3, H. 4. 1928. С. 277.
31) Гафаров Н. И., Филимонов С. Н., Горбатовский Я. А. Распределение сывороточных биохимических маркеров крови среди здоровых лиц и при инфаркте
миокарда// Проблемы генетики человека. Новокузнецк: 1991. С. 52.
32) Генофонд и геногеография народонаселения / Под ред. Ю. Г. Рычкова: Том I. Генофонд населения России и сопредельных стран. СПб.: Наука, 2000. 611 с.
33) Горбатовский Я. А., Лузина Ф. А., Филимонов С. Н. Группы крови системы Льюис у больных инфарктом миокарда // Проблемы генетики человека. Новокузнецк: 1991. С.52.
34) Гридчик Л. П. Групповая дифференцировка крови по системе АВ0 у жителей городов Ногинск и Электросталь (Моск. обл.) // Вопр. антропологии. 1970. Вып. 35. С. 139.
35) Грубина А. Распределение кровяных групп среди школьников Кзыл-Орды (Казахстан) // Ukrain. Zbl. Blutgruppenforsch. Bd 4, H. 4. 1929. C.240.
36) Давыдова Г. М. Антропологические исследования среди семейств русского Забайкалья // Тр. Ин-та этнографии АН СССР. Антропол. сб. 4. М.: 1963. Т. 82. С. 196.
37) Давыдова Г. М. Популяционно-генетическое исследование манси // Этногенез финно-угорских народов по данным антропологии. М.: 19746. С.96.
38) Дебец Г. Ф. Антропологические исследования на Петровских озерах // Краткие сообщения о научных работах НИИ и Музея антропологии за 1938–1939 гг. М.: 1941а. С.21.
39) Добротина И. А. Распределение генетического типа гаптогпобина у больных некоторыми дерматозами // Сов. медицина. 1973. N 12. С. 75.
40) Добротина И. А., Казакова И. М., Ежова Г. П. Антигены клеток крови и других тканей человека. Горький: 1990. 67 с.
41) Дьяченко В. Д. Антропологический состав и распределение некоторых наследственных факторов у народов Украины и Молдавской ССР (сравнительно с другими народами мира). 1968.
42) Евнина И. И., Мошлевская Г. П., Шургая А. М., Соколова А. Е., Нагичева Л. Н., Колосова Л. Д., Аверко Н. Н., Светличный Э. А., Сычев B.C. Активность некоторых ферментов пентозно-фосфатного цикла и гликолиза в крови больных врожденными пороками сердца // XVII Всесоюз. съезда терапевтов. М.: 1974. С.230.
43) Ермильченко Г. В., Соловьева Н. П. Изучение частоты дефицита активности Г6ФД в крови у лиц из популяции Архангельской области // Пробл. гематологии и переливания крови. 1973. Т. 18. N 11. С. 23–26.
44) Зайцева Г. А., Драверт Е. Д., Стражникова Г. А., Муравьев А. В., Арибжанов И. М. О некоторых различиях в распределении антигенов у доноров Коми, Марийской АССР и города Кирова // Современные вопросы трасфузиологии: Тез. докл. к науч. — практ. конф. Горький: 1981. С. 33.
45) Зам П. Т., Волынская Т. А. К вопросу об изогемагглютинации у вотяков. 1927…
46) Золотарев Д. А. Кольские лопари // Материалы комиссии экспедиционных исследований АН СССР. Сер. Север. Л: 1928. Вып. 9. С. 100.
47) Золотарева И. М. Распределение групп крови у народов Северной Сибири // Тр. VIIМКАЭН. М.: 1968. Т. 1. С. 31.
48) Ибраимов А. И., Байбурина С. X., Кожухова А. С. Изучение способности ощущать вкус фенилтиокарбамида (РТС-тест) среди населения, проживающего в Киргизии // Генетика. 1977. Т. 13. С. 330.
49) Иванов В. П., Спицын В. А., Романцов О. В. Распространение некоторых полиморфных систем крови в популяции русского населения Курской области // Генетика человека и патология: Материалы 2-й итог. Конф. НИИ мед. генетики. Томск: 1992. С. 88.
50) Иванов В. П., Тостановская А. И., Шмидт С. И. Фенотипические частоты эритроцитарных антигенов систем АВ0, резус, MN, их генофонд и сравнительное изучение среди жителей центрального Казахстана // Генетика. 1977. Т. 13. С. 1463.
51) Иванова P. Л, Каражанова Л. К., Жангелова М. В., Набиев А. Н Распределение антигенов гистосовместимости у больных хроническим диффузным гломерулонефритом (ХДГН) // Второй Всесоюз. съезд мед. генетиков. Алма-Ата 4–6 декабря 1990 г. М.: 1990. С. 163.
52) Икрамова Н. Т., Маркевич Э. М., Шакиханов Р. Р. Распределение резус принадлежности и групп крови в популяции Узбекистана // I Всесоюз. конф. по мед. генетике: Тез. докл. М.: 1975. С. 63.
53) Ирисова О. В. Этногеографическое распределение типов фосфоглюкомутазы (КФ 2.7.5.1): Некоторые данные о полиморфизме PGM1 среди населения Советского Союза// Вопр. антропологии. 1977. Вып. 56. С. 45–56.
54) Исмаилов М. Ф., Курмышкин А. А., Исмаилов Ш. М., Тананов А. Т. Распределение антигенов I класса главного комплекса гистосовместимости среди здоровых жителей Казани // Казан, мед. журн. T.LXXIII. 1992. N 3. С. 161–164.
55) Исмаилова Б. Д., Алексеенко И.Ф., Кудояров Д. К. Типы гаптоглобинов у детей русской и киргизской национальностей севера Киргизии // Здравоохранение Киргизии. 1981. N. 2. С. 24–27.
56) Касенов К. У., Сундетов Ж. С. Иммунологические различия в популяциях человека и их эпидемиологическое значение // Изв. АН Каз. ССР. Сер. биол. 1979. N. 5. С. 68.
57) Касенов К.У., Сундетов Ж. С. Типы гаптоглобина среди населения Западного Казахстана и их взаимосвязь с некоторыми гуморальными факторами резистентности организма // Генетика. 1985. Т. 21. N 2. С. 347–349.
58) Коваленко П. П., Маликова Л. П., Труфанова Т. И., Кутаржинская С. В. Распределение антигенов HLA у жителей Ростовской области // Матер. II междунар. совещ. по тканевому типированию. Л: 1981. С. 141.
59) Ковтюх Л. П. Личное сообщение. 1993.
60) Коненков В. И. Иммуногенетика нарушений функций иммунитета при диффузионных заболеваниях соединительной ткани. 1985. 403 с.
61) Коников А. П. К вопросу о гемоагглютинатинах человеческой крови // Моск. мед. журн. 1925. N 5. С. 9.
62) Кузовлева Ю. А. Материалы по генетике дальтонизма // Антропол. журн. 1937. N 3. С. 70.
63) Кучер А. Н., Пузырев В. П., Дуброва Ю. Е., Лемза С. В., Грахова Е. В. Изменчивость иммунологических и биохимических маркеров генов в сельских пришлых популяциях Томской Области // Генетика. 1992. Т. 28. С. 102.
64) Кучер А. Н., Пузырев В. П., Иванова О. Ф., Сюй Ц.Ц., Ху Ц. Ю., Ду Ж. Ф. Изучение субтипов сывороточных белков у русских жителей Томской области // Генетика. 1993. Т. 29. N 5. С. 845–852.
65) Леухина М. В., Лузина Ф. А., Гафаров Н. И., Лотош Е. А., Талыпина Н. В. Наследственный полиморфизм групп крови и сывороточных белков у коренного населения Горного Алтая // Генетика населения и патология. Материалы I итоговой конф. НИИ мед. генетики. Томск: 1989. С. 76–77.
66) Леухина М. В., Лузина Ф. А., Лотош Е. А Секреция АВН-антигенов в популяциях русского населения Горного Алтая // Пробл. генетики человека. Новокузнецк: 1991. С. 63–64.
67) Либман Е. Г. Распределение групп крови среди великоруссов // Тр. III Всесоюз. съезда зоологов, анатомов и гистологов. Л.: 1929. С. 337.
68) Лопатенок А. А., Будяков О. С. Распределение антигенов в крови изосерологических систем АВ0, резус (Rh), Р, Kell, Gm среди некоторых национальностей Советского Союза// Науч. конф. суд. медиков: Тез. Докл. Л.: 1973. С. 96.
69) Лысенко А. Я., Идельсон Л. И., Воронов А. А., Абрашкин-Жучков Р. Т., Алексеева М. И., Бахрамов С. М., Махмудова Н.А., Науймин Н. М., Петраков А. А., Султанова Г. Ф., Маньков А. Н., Федулова Г. А., Кардаш В. С., Аксянова Г. А. Распространение наследственного дефицита гпюкозо-6-фосфатдегидрогеназы среди населения СССР //1 Всесоюз. конф. по мед. генетике: Тез. докл. М.: 1975. С. 23
70) Мелких А. А., Гриншг Ц. Л. Кровяные группы у русских и евреев // Иркут, мед. журн. 1926. Т. 4. N 5–6. С. 5..
71) Мизуров Н. А. К характеристике групповой и резус-принадлежности крови у чувашей // Казан, мед. журн. 1977. Т. 58. N 1. С. 76–77.
72) Мякоткин В. А. Генетическая структура изолированной популяции // Медико-генетическое исследование ревматизма в Тофаларии. Иркутск: 1978. 19 с.
73) Нерсисян В. М., Мартиросян И. Г., Мусаелян Н. О. Установление частоты встречаемости антигенов системы HLA у населения Еревана // Тез. докл. Всесоюз. конф. «Функциональная морфология». Новосибирск: 19846. С. 194.
74) Нерсисян В. М., Мусаелян Н. О., Мартиросян И. Г. Антигенный состав сывороточных белков системы Inv в норме и при гематологических заболеваниях в популяции армян // Гематология и трансфузиология. 1992. Т. 37. N 2. С. 24–26.
75) Орановская Е. Г., Широкова С. Ф. Об испытаниях цветоощущения у железнодорожников — дальтоников цветными сигналами // Здравоохранение на Юго-Восточной железной дороге. Сб. 1. Воронеж: 1936. С. 147.
76) Парин Б. В. Кровяные группы у зырян // Журн. эксперим. биологии и медицины. 1927. Т. 8. С. 532.
77) Парин Б. В. Кровяные группы у пермяков (коми) // Ukrain. Zbl. Blutgruppenforsch. Bd. 3, H. 3. 1928. С. 223.
78) Перевозчиков И. В. Антропология старожилов Камчатки // Проблемы эволюционной морфологии человека и его рас. М.: Наука, 1986. С. 159–165.
79) Петров Г. И. Распределение групп крови у финских народов СССР // Тр. III Всесоюз. съезда зоологов, анатомов и гистологов. Л.: 1928. С. 343.
80) Простакишина В. И., Платонова М. А. Распределение групп крови и резус-фактора у населения Бурятской АССР // Матер. III респ. конф. практич. врачей Бурятии. Улан-Удэ: 1975. С. 139.
81) Рабинович П. Д., Домбрачева Н. И. Некоторые особенности фукогликопротеидов у бурят // Генетика. 1982. Т. 28. С. 668.
82) Рафалович М. В., Бессонова Г. А., Зильберт Н. И., Ледуховская Л. Г., Мазурова А. М., Миниева М. Н., Молоткова Л. С., Тарала Г. Г. Распределение групп крови по системе АВ0 среди населения Карачаево-Черкесской авт. обл. и их корреляция с частотой ишемической болезни сердца // Пробл. гематологии и переливания крови. 1982. Т. 27. N 2. С. 21.
83) Ревазов А. А., Козаченко Б. Н., Тарлычева Л. В., Филиппов И. К. К популяционной генетике населения европейского Севера РСФСР: III. Демографические и генетические характеристики двух сельских советов Пинежского района Архангельской обл // Генетика. 1979. Т. 15. N 5. С. 917–926.
84) Ревазов А. А., Пасеков В. П., Лукашева И. Д. К популяционной генетике населения европейского Севера СССР: II. Данные по распределению некоторых групп крови и антропогенетических признаков в шести деревнях Архангельской области // Генетика. 1975. Т. И. N 7. С. 156..
85) Рогинский Я. Я. Закономерности пространственного распределения групп крови у человека // Тр. Ин-та этнографии АН СССР. Нов. сер. М.: 1947. Т. 1. С. 33.
86) Рубашкин В. Я. Кровяные группы в СССР // Ukrain. Zbl. Blutgruppenforsch. Bd. 1, H. 1. 1927. С. 66..
87) Рычков С. Ю. Распределение частот генов групп крови систем АВ0 и Rhesus по территории Ростовской области: курсовая работа // Ростовский гос. ун-т. Биол. — почв. факультет. Ростов: 1992. С. 15.
88) Саливон И. И., Тегако Л. И., Микулич А. И. Очерки антропологии Беларусии. Минск: 1976. 272 с.
89) Салиев К. К., Сеттарова Д. А., Чуканин Н. Н. Распространение недостаточности глюкозо-б-фосфатдегидрогеназы эритроцитов среди населения Ферганской долины // Пробл. гематологии и переливания крови. 1977. Т. 22. N 8. С. 59.
90) Сахаров С. Взаимосвязь групп крови с нормальной и па тологической конституцией // Днепропетр. мед. журн. 1930. N 7-12. С. 427.
91) Соловенчук Л. Л. Биохимические полиморфные системы в популяциях пришлых жителей Северо-Востока СССР: I. Генетическая структура и ее гетерогенность, обусловленная половым диморфизмом и длительностью проживания этих групп в экстремальных условиях среды // Генетика. 1983. Т. 19. N8. С. 1327–1334.
92) Соловенчук Л. Л., Переверзева В. В., Невретдинова 3. Г. Особенности распределения HLA-антигенов и гаплотипов у пришлых жителей Магадана // Генетика.
93) Спиренкова А. Е., Попов Е. А., Далечин Н. Б., Нелюбин О. В., Левитан Б. Н., Прошина П. П Сравнительная характеристика антигенных профилей системы HLA локусов А и В у различных национальных групп, проживающих на территории Астраханской области // Деп. в ВИНИТИ 09.07.90. N.3778-В90. 1990.
94) Спицын В. А. Антропологические аспекты изучения генетико-биохимического полиморфизма // Дис…. д-ра биол. наук. М.: 1984. 344 с.
95) Спицын В. А., Афанасьева И. С., Агапова R К., Цурикова Г. В., Щекотихина Ю. А., Краузе Д., Куххайзер В. Изучение генетических маркеров у русских и немцев в рамках совместного Российско-Германского исследовательского проекта // Генетика. 1994. Т. 30. N 5. С. 702–708.
96) Спицын В. А., Афанасьева И. С., Боева С. Б., Ирисова О. В., Цудик А. 3. К популяционной генетике С5-варианта псевдохолинэстеразы сыворотки крови // Вопр. антропологии. 1978. Вып. 59. С. 58–63.
97) Спицын В. А., Мухина Н. Н. Распределение типов гаптоглобина у русского населения Мезенского района Архангельской области // Вопр. антропологии. 1975. Вып. 50. С. 179.
98) Спицын В. А., Куххойзер В., Макаров С. В., Бычковская Л. С., Пай Г. В., Балановский О. П., Афанасьева И. С. Генофонд русского народа. Частоты генетических маркеров // Генетика. 2001. Т. 37. N 3. С. 386–401.
99) Старовойтова Р. А. Сывороточные (Нр, Gc, Gm, Tf) и эритроцитарные (АВ0, MN, Rh, Р) системы крови населения среднего Поднепровья УССР (к вопросу о современных генетических связях украинского народа). Автореф. дис…. канд. ист. наук. М.: 1974. 24 с.
100) Старовойтова Р. А. Этническая геногеография Украинской ССР. Киев.: Наукова думка, 1979. 142 с.
101) Сухова А. В. Особенности обонятельной и вкусовой чувствительности у русских школьников Архангельской области // Вопр. антропологии. 1991. Вып. 85.
102) Тегако Л. И., Саливон И. И., Микулич А. И. Биологическое и социальное в формировании антропологических особенностей. Минск.: Наука и техника, 1981. 288 с.
103) Тельнов В. И. Оценка распределения генотипов гаптоглобина у людей, подвергшихся хроническому профессиональному облучению в значительных дозах // Генетика.
104) Тимошенко Л. П., Лавровская Л. Н. Распределение эритроцитарных антигенов и белковых факторов крови среди населения некоторых геногеографических зон Украинской ССР // Цитология и генетика. 1978. Т. 12. N 6. С. 535–540.
105) Тихонов В. П. Содержание и типы гаптоглобина сыворотки крови у больных ревматизмом // Терапевт, арх. 1970. Т. 42. N 4.
106) Торгомян Т. Л. Распределение групп крови среди населения Армянской республики // Сб. науч. трудов НИИ гематологии и переливания крови им. проф. Еоляна. Ереван: 1961. Т. 9. С. 133–137.
107) Трофимова Т. А., Чебоксаров Н. Н. Североукраинская экспедиция Музея антропологии // Краткие сообщения о научных работах НИИ и Музея антропологии за 38–39 гг. М.: 1941. С. 67..
108) Туманов А. К., Томилин В. В. Наследственный полиморфизм изоантигенов и ферментов крови в норме и при патологии человека. М.: 1969.435 с.
109) Фарузджева К. Я., Багдасарова Т. А., Талыбова Л. М. Носительство дефекта активности глюкозо-б-фосфатдегидрогеназы среди детей (по материалам обследования в г. Баку) //1 Всесоюз. съезд гематологов и трансфузиологов: Тез. докл. М.: 1979. С. 230–231.
110) Фишман Р. М. Изогемагтлютинация и конституция среди рабочих завода им. Петровского // Днепропетр. мед. журн. 1929. N 7-12. С. 336.
111) Фридман Л. М. Кровяные группы у грузинских детей и связь с другими наследственными факторами // Ukrain. Zbl. Blutgruppenforsch. Bd. 4, H. 4. 1929. С. 279.
112) Чурикова А. С. Распределение антигенов системы АВ0, MN, резус, Р и Льюис среди населения г. Андижана // Вопросы инфекционной и неинфекционной патологии. Ташкент: 1975. С. 388.
113) Чурикова А. С., Дымшиц Е. Л., Мухатдинова Т.К. Распределние антигенов системы АВ0, MN, резус и Р среди населения Андижанской области // Тр. суд-мед. экспертов Узбекистана. 1978. Т. 5. 96 с.
114) Шилин Я. В. К вопросу о распространении цветоощущения и методах его определения // Рус. офтальмол. журн. 1929. Т. 9. N 1.
115) Шнейдер Ю. В., Тихомирова Е. В., Шильникова И.Н. Материалы по изучению генофонда народов России и сопредельных стран. Русское население Тверской области // Генетика. 1994. Т. 30. N 3. С. 419–427.
116) Шнейдер Ю. В., Тихомирова Е. В., Шильникова И.Н. Материалы по изучению генофонда народов России и сопредельных стран. Русское население Вологодской области // Генетика. 1994. Т. 30. N. 4. С. 549–554.
117) Щерба М. М., Ткачук В. Н., Турин Е. И., Цыкин Д. Б. Распределение типов Нр у жителей Ленинграда // XII Междунар. конгр. по переливанию крови: Тез. докл. М.: 1969. 93 с.
118) Ярхо А. И. Алтае-Саянские тюрки // Антропологический очерк. Абакан: 1947. 148 с.
За пределами Старого Света (табл. 5.2.3.) больше всего поражает резкий сдвиг частот АВ0 в коренном населении Америки повсеместно распространен аллель AB0*0 (q=0.95), а частоты А и В равно близки к нулю. В коренном населении Австралии также очень высока частота AB0*0 (q=0.78) но при этом аллель АВ0*А (д=0.20) заметно преобладает над АВ0*В (д=0.02). В населении Евразии
Впрочем, эта закономерность не всеобщая: например, в Сибири диапазон изменчивости АВ0*А достигает евразийского размаха.
ЕВРАЗИЙСКИЙ ЛАНДШАФТ АВ0*В (рис 5.2.18).
Японии, захватывая Восточную Европу, Урал, юг Западной Сибири, Центральную Азию и почти всю Южную Азию. Поэтому, при обнаружении такого ландшафта с максимумами, разделенными пространством, историей формирования населения и областями иных значений нам не приходит мысль о близком родстве населения Сибири и Западной Европы
Германия, Австрия, Польша на карте неотличимы от среднерусской популяции Однако даже генетические отличия испанцев заметны лишь в общеевропейском масштабе и исчезают, когда мы охватываем взглядом всю Евразию повторимся, что на фоне Евразии вся Европа удивительно похожа на средний русский генофонд. Во всей Центральной и Западной Европе от "среднерусских" значений резке итал! напр
Широкая область светлых тонов фиксирует популяции, наиболее близкие к "среднерусским". Резкий градиент проходит в районе Урала, пересекает Кавказ и далее на юге немного размывается, показывая «слегка русские» Анатолию и Левант.
Третья северная зона — особенно обращает на себя внимание. Она отмечает то — пока еще умеренное — отличие северно-русско1 о генофонда от генофонда усредненно-русского, которое далее переходит уже в резкие отличия финских, саамских и зауральских популяций
Об авторах
Балановская Елена Владимировна — антрополог, доктор биологических наук, заведующий лабораторией популяционной генетики человека МГНЦ РАМН. Более 200 научных публикаций. Уже 33 года изучает генофонды народов Евразии — от Сахалина до Украины, от Памира до Заполярья, от Белого моря до Черного. Но всегда возвращается к разработке методов геногеографии.
Балановский Олег Павлович — генетик, кандидат биологических наук, старший научный сотрудник МГНЦ РАМН. Более 100 научных публикаций. Продолжает семейную и научную традицию, на практике проверяя методы геногеографии. Участник и организатор экспедиций не только на Русской равнине, но и к народам Осетии, Дагестана, Татарстана, Калмыкии, Таджикистана, Афганистана. Но всегда возвращается к генофонду восточных славян.
Лики русского генофонда
НАУЧНЫЕ РЕЦЕНЗЕНТЫ:
Т. И. Алексеева, академик РАН Е. К. Гинтер, академик РАМН И. А. Захаров-Гезехус, чл. — корр. РАН.
Карта на форзаце 3 публикуется с разрешения Владимира Николаева ()
На форзаце 1 — карты России Делиля и Ортелия (-rus-maps.edu.mhost.ru/index.htm) Фотография авторов на задней стороне обложки предоставлена редакцией «National Geographic — Россия», фотограф Кирилл Самурский.
В оформлении задней стороны обложки использованы фотографии из архивов В. М. Щурова и авторов. На обложке книги использована картина Н. К. Рериха Гонец. «Восстал род на род». 1897 г., вёрстка, дизайн обложки, редактирование карт редакция журнала «Самообразование» и МФ «Семигор», 2007 г. Географическая основа для карт М. Ю. Симаков, Авторы.
Примечания
1
Предисловие выражает мнение издателя и не обязательно согласуется с мнением авторов книги.
(обратно)2
Гранты РФФИ: 01-06-80085а «Комплексное геногеографическое изучение русского генофонда: антропология, дерматоглифика, генетика»; 01-07-90041 в «Создание геоинфосистемы 'Русский генофонд' (геногеография данных генетики, антропонимики, дерматоглифики и антропологии)»; 04-04-49664а «Генофонд восточных славян по данным о филогеографии Y хромосомы: молекулярно-генетический и картографический анализ»; 04-06-80260а «Геногеография народов Восточной Европы: сравнительное исследование по данным генетики и антропологии»; 98-04-48842а «Пространственно-временная структура генофонда: фактор подразделённости популяций (5 поколений микроэволюции уникального генофонда адыгов-шапсугов)»; 07-04-00340а «Генофонд евразийской степи: генетический след кочевников Центральной Азии в Европе (анализ Y хромосомы и аутосомных маркёров для 4000 образцов)»; 07-06-00086а «Генофонд украинцев: отражение популяционной истории восточно-славянского этноса тремя системами генетических маркёров (аутосомные, мтДНК, Y хромосомы)»; 07-07-00089а «Создание инфосистемы «Русские фамилии»: разнообразие, география, генетика»; экспедиционные гранты 01-06-88012к, 02-06-88020к, 03-06-88009к, 04-04-63063к, 04-06-88012к, 05-04-63072к, 06-04-63020к.
Гранты РГНФ: 01-06-00146а «Геногеография русских фамилий (создание компьютерного картографического Атласа)»; 04-06-00113а «Комплексное исследование русского генофонда по данным о распространении гаплогрупп Y хромосомы и фамилий»; 04-06-78107а/б «Этническая история и генофонд белорусов: филогеография маркёров Y хромосомы»; 07-06-00448а «Однофамильцы или родственники? Комплексное исследование связи генотипа и фамилии в русском генофонде»; 06-06-00640а «Комплексное изучение восточнославянских народов (эколого-генетический мониторинг)»; 07-01-12114в «Создание информационной системы «Генофонд народов мира»: исследование этногенеза и демографической истории».
(обратно)3
2 «Повесть временных лет». Несторъ — преподобный монахъ Kieвo-Печерского монастыря; род. въ 1056 г.; 17 летъ постригся въ монахи; въ сане дiакона, открылъ въ 1091 г. мощи преп. Ѳеодосия; умеръ въ 1114 г. Н. долгое время приписывалось составление первой русской летописи «Повести временных лет»; несомненно, что перу Н. принадлежатъ: «Сказанiе о Борисе и Глебе» и «Житiе Ѳеодосия». Последнее по полноте и стройности изложенiя считается образцомъ летописной бiографии, оно полно сведенiями о кiево-печерской обители и лицахъ, жившихъ в ней. (XI век) (ПОЛНЫЙ ПРАВ0СЛАВНЫЙ БОГОСЛОВСКИЙ ЭНЦИКЛОПЕДИЧЕСКИЙ СЛОВАРЬ, Том 2. (репринтное издание). «Возрождение». 1992.)
(обратно)4
Сигизмунд Герберштейн «Записки о московитских делах». «Первое в Западной Европе систематическое описание России, основанное на личном знакомстве с ней и подлинными русскими источниками». (XVI век)
(обратно)5
Родоман, 1990.
(обратно)6
Когда я вижу слова «митохондриальная ДНК», я читаю «суперженская ДНК» и тогда понимаю, о чем идет речь. Именно такой термин «суперженская» использовали первооткрыватели. Затем любители запутывать мозги ввели в оборот термин «митохондриальная», который, к сожалению, стал наиболее употребительным. — Прим. изд.
(обратно)7
Системность, в соответствии с теорией систем, предполагает, что система состоит из большого числа компонентов, каждый из которых в отдельности не отражает свойств системы в целом. В отношении популяции это выражается в том, что стабильное воспроизведение её генофонда зача
(обратно)8
Все приводимые синонимы справедливы только в традиции отечественной геногеографической школы. Понимание тех же терминов другими специалистами может отличаться.
(обратно)9
В географии рифты — это глобальные геотектонические элементы, характерная структура растяжения земной коры. Рифтовые зоны образуются в результате горизонтального растяжения земной коры, приводящей к вертикальному опусканию блоков земной коры и поднятию на дневную поверхность вещества мантии.
(обратно)10
Применимости фамилий в качестве аналогов генов в популяционных исследованиях посвящена глава 7.
(обратно)11
Три гранта (1991–2001 гг.) программы ГНТП «Приоритетные направления генетики»: Грант 6.72. (1991–1998 гг.) «Создание компьютерного банка данных о генофонде населения России и сопредельных стран», рук. Е. В. Балановская; грант 6.82. (1991–1995 гг.) «Геногеографическое исследование генофонда народонаселения России и сопредельных стран», рук. Е. В. Балановская; грант 4.18 (1999–2001 гт.) «Создание геоинфосистемы COMPLEX MAPPING», рук. Е. В. Балановская.
(обратно)12
Погост — несколько деревень, под общим управлением и одного прихода; волость; отдельно стоящая на церковной земле церковь с домами попа и причта, с кладбищем [Даль, 1882].
(обратно)13
Приведём примеры забавных недоумений, разлучающих антропологов и генетиков.
Например, «этногеномики» недоумевают, сталкиваясь с обилием расовых классификаций. Их возмущает, что нет простоты и ясности, нет однозначных общепринятых схем: разными авторами могут быть выделены разные антропологические типы, антропологические типы одного и того же региона каждый автор может назвать по-своему, или вложить свое особое содержание в один и тот же термин. Однако на самом деле такая множественность вариантов объективна, она — отражение реалий фенофонда, объективно сложной картины изменчивости антропологических признаков.
Или, например, антропологи привыкли работать с множеством популяционных выборок, каждая из которых насчитывает более сотни индивидов. Им забавна гордость генетиков, когда средний размер нескольких генетических выборок постепенно «переползает» за отметку полусотни индивидов. Однако причина столь резких различий в объёмах выборок не менее объективна, чем множественность расовых классификаций. С одной стороны, малая наследуемость и неполная воспроизводимость в определении антропологических признаков требуют от антропологов значительного увеличения размера их выборок по сравнению с выборками генетиков. С другой стороны, большая сложность сбора образцов крови, высокая трудоёмкость и стоимость определения каждого ДНК маркёра, требуют от генетика вложить в изучение каждого индивида намного больше сил, времени и средств.
Дальше — больше. Разная «трудоёмкость» приводит к разному размеру коллективов, задействованных в изучении популяции. Антропологи вдвоем-втроем проходят путь от экспедиционного обследования до написания обобщающих работ. А для генетического изучения того же региона — организации экспедиций, их проведения, выделения ДНК, ге-нотипирования, анализа полученных данных — необходимо много участников. Но генетические статьи с десятью соавторами вызывают глубокое возмущение антропологов. Не включить же в соавторы участников работы «этногеномик» не может — это означает измену общепринятым в его науке стандартам научной этики. Остается единственный выход — отказаться от публикации в совместных изданиях с антропологами. А значит, и от обмена текущей информацией об изучении одних и тех же народов.
Да что там, даже такие пустяки, как привычка генетиков давать в тексте литературные ссылки в квадратных скобках [так ведь много удобнее осуществлять автоматический поиск ссылок], раздражает антропологов, следующих давней традиции круглых скобочек. Ну, как не вспомнить Свифта: «Император… обнародовал указ, предписывающий всем его подданным под страхом строгого наказания разбивать яйца с острого конца. Этот закон… был причиной шести восстаний…. В течение этих смут императоры Блефуску часто через своих посланников делали нам предостережения, обвиняя нас в церковном расколе путем нарушения основного догмата… Между тем это просто насильственное толкование текста, подлинные слова которого гласят: Все истинно верующие да разбивают яйца с того конца, с какого удобнее.» (Путешествия Гулливера].
(обратно)14
В этом разделе мы приводим (переработав и значительно сократив) текст доклада и публикации, подготовленных Ю. Г. Рычковым и одним из авторов этой книги для конференции «Историческая и эволюционная антропоэкология». Юрий Григорьевич Рычков был не только известным антропологом, но и стоял у истоков антропогенетики при её возрождении в нашей стране. Его авторитет и тот факт, что эти вопросы открыто обсуждались на антропологической конференции, дают нам право привести этот местами жесткий, но, по нашему убеждению, совершенно справедливый взгляд.
(обратно)15
Таксономическая ценность — степень пригодности того или иного признака для решения задач таксономии популяций, для определения места популяции в их исторически сложившейся системе. Так, антропологический словарь определяет как таксономически ценные те признаки, которые «имеют большую древность, компактность и строгую географическую приуроченность ареала по сравнению с дисперсным географическим распределением других признаков» [Антропологический словарь, 2003].
(обратно)16
Эти вопросы изложены одним из авторов в главе «Генетические аспекты концепции «раса» книги [Алексеева и др., 2002].
(обратно)17
В словаре иностранных слов архитектоника определяется так. В архитектуре — «художественное выражение закономерностей строения, присущих конструктивной системе здания». В литературе — «общий эстетический план построения художественного произведения, принципиальная взаимосвязь его частей». В геологии — «общая картина геологического строения, особенностей залегания или нахождения горных пород той или иной местности». В геногеографии — хоть это и не вошло пока в словари
— под архитектоникой понимают общие закономерности структуры генофонда, важнейшие характерные черты его «устройства».
(обратно)18
На самом деле полученное равенство F1=F2 — это частный случай, соответствующий данной популяционной системе. В общем случае ожидаемое соотношение F1=F2 зависит от масштаба выделяемых групп. Чем более мелкие мы выбираем группы этносов, тем больше F2 (если в группы входят всего по два-три из множества этносов мира, то для всего мира F2»F1). Чем крупнее выделяемые группы этносов, тем меньше ожидаемые различия групп в пределах человечества (F2) и больше различия этносов в пределах этих групп (F1), так что F1=F2 или даже F1>F2. Однако важно, что согласно принципу «эквидистантности» для каждого конкретного региона и для каждой классификации можно сначала сформулировать гипотезу ожидаемого соотношения F1 и F2, а затем её проверить.
(обратно)19
Корректнее использовать общепринятую в биологической науке терминологию: «антропологические», а не «расовые» классификации. Антропологические классификации обычно включают иерархию разных уровней — от совсем небольших антропологических типов (например, см. раздел 4.4. где описывается ильменско-белозерский комплекс — один из множества антропологических типов в пределах русского народа) до двухсеми больших рас вида Homo sapiens. «Расоведение» — устаревшее название той ветви антропологии, которая развилась в этническую, а затем в историческую антропологию.
(обратно)20
Точнее даже — это различия между всеми гаплоидными наборами генов, переданными от каждого из родителей. То есть эти различия кроме межиндивидуальной включают еще и внутрииндивидуальную изменчивость, поскольку у каждого индивида имеется два таких набора генов — один полученный от отца, а другой от матери.
(обратно)21
До отвращения (лат.).
(обратно)22
По своей материальной культуре эти археологические памятники несомненно принадлежали к «славянскому» кругу. Однако по антропологическому типу эта восточная окраина огромного славянского мира явно отличалась от основного массива славян, зато обнаруживала преемственность с дославянским «финно-угорским» населением этих территорий. «Славянский» и «финно-угорский» — рабочие термины археологии и палеоантропологии, которые не означают, что в каждом конкретном случае известен язык, на котором говорило население.
(обратно)23
Янус. «В древнеримской мифологии — божество времени, всякого начала и конца, входов и выходов; изображалось с двумя ликами, обращёнными в противоположные стороны» [Словарь иностранных слов, 1989].
(обратно)24
Рассчитать главные компоненты, не картографируя отдельные признаки, было невозможно — потому что разные классические маркёры, с которыми тогда работали, были изучены в разных популяциях.
(обратно)25
Проект РФФИ № 01-06-80085а «Комплексное геногеографическое изучение русского генофонда: антропология, дерматоглифика, генетика», рук. Е. В. Балановская.
Проект РФФИ № 01-07-90045в «Создание геоинфосистемы «Русский генофонд», рук. Е. В. Балановская.
(обратно)26
Далее для объединённых данных Русской антропологической экспедиции и экспедиций М. В. Витова мы используем аббревиатуру «АБВ» — по именам основных исследователей в алфавитном порядке: Алексеева, Бунак, Битов.
(обратно)27
Я Божий раб, и нет раба покорней.
А вы свободны, и гордитесь вы
Свободой веток от ствола и корня,
Свободой плеч от тяжкой головы.
3. А. Миркина
(обратно)28
За пределами этого ареала находится лишь одна популяция, включённая в анализ, — детально изученное население г. Асбеста Свердловской области [Спицын и др., 2002].
(обратно)29
Об уровне строгости см. Приложение.
(обратно)30
Точнее, понятие локальной популяции может быть двояким. Если понимать её как «конкретный небольшой район», то в большинстве случаев локальная популяция всё-таки поддаётся дроблению на «совсем локальные» популяции — конкретные населённые пункты. Если же понимать локальную популяцию именно как отдельный населённый пункт, то несколько локальных популяций часто объединяются в «элементарную популяцию». Это понятие уже чётко разработано в популяционной генетике — популяция, в которой больше 50 % браков заключается между её членами, а с «пришельцами» из других популяций — меньше половины браков. В русском населении элементарные популяции могут быть самого разного «административного» ранга: сельсовет, район или даже край [Па-секов, Ревазов, 1975; Брусинцева и др., 1993; Медико-генетическое описание, 1997; Сорокина, 2005].
(обратно)31
Это Восточная Европа, Кавказ, Урал, Средняя Азия, Сибирь. Специально уточним, что, согласно такому делению, регион «Восточная Европа» не включает в себя ни данные по Северному Кавказу (которые включены в регион «Кавказ»), ни по Приуралью (включены в регион «Урал»).
(обратно)32
Возможное действие отбора оценивалось при сравнении межпопуляционной изменчивости для данного аллеля и селективно-нейтральной изменчивости (см. Приложение). Селективно-нейтральный уровень изменчивости русского генофонда рассчитан в среднем по всем картам 44 аллелей 17 иммуно-биохимических локусов (табл. 5.2.1), наиболее подробно изученных в русском генофонде. Это среднее значение межпопуляционной изменчивости, рассчитанное по картографическим моделям, составило GST=1.36x102. Здесь и далее в разделе 5.2. это значение используется как оценка селективно-нейтральной изменчивости русского генофонда.
(обратно)33
Здесь и далее в тексте указываются абсолютные значения коэффициентов корреляции без указания знака связи (взятые по модулю), поскольку при обсуждении важна сила связи, а не её направление. Точные значения коэффициентов корреляции с указанием знака связи приведены в таблице 5.2.1.
(обратно)34
Популяцию русских Житомирской области Украины с низкой частотой аллеля MN*M мы не принимаем в расчёт из-за крайне малого размера выборки.
(обратно)35
На картах регион Восточной Европы включает и Приуралье, и Северным Кавказ.
(обратно)36
Напомним, что мы отобрали для картографирования все популяции, расположенные от 43° до 70° северной широты и от 24° до 60° восточной долготы.
(обратно)37
Следуя в определении границ «исконного» ареала за В. В. Бунаком [Происхождение…., 1965].
(обратно)38
В разделе 5.1. сравнивались две оценки гетерогенности русского народа: «карточная GST» (расчёт по картам СSТ=1.36) и «табличная GST» (расчёт по исходным табличным данным GST=2.00). Если в картографическом разделе 5.2. мы сравнивали карты с более точной «карточной GST», то в этом разделе мы вынуждены воспользоваться «табличной оценкой» — ведь используемые для сравнения данные по другим народам Евразии рассчитаны по табличным данным.
(обратно)39
Обычно такие точечные замены «букв» в кодирующей части мтДНК тестируются методом ПДРФ (полиморфизм длины рестрикционных фрагментов). Этот метод проще и намного дешевле другого метода — секвенирования, т. е. определения не одного полиморфного нуклеотида, а всех подряд «букв» в их ДНК последовательности.
(обратно)40
Пока эта глава готовилась к печати, в конце 2004 года вышла ещё одна статья Б. А. Малярчука с новыми данными по русским популяциям [Malyarchuk et al., 2004]. Эти популяции, к сожалению, уже не могли быть включены в наш анализ, но чтобы дать читателю полный перечень изученных русских популяций, мы приводим их в таблице 6.2.2.
(обратно)41
Аутосомные гены «диплоидные», т. е. присутствуют в двойном наборе. А у «гаплоидных» однородительских маркёров лишь один набор генов — либо только от матери (мтДНК), либо только от отца (Y хромосома). Поэтому выборка людей для изучения однородительских маркёров и должна быть в два раза больше. Ведь изучив 75 человек по аутосомным маркёрам, мы получаем выборку 150 генов. А по однородительским для выборки 150 генов мы должны изучить 150 человек.
(обратно)42
В популяциях имеется множество гаплотипов, поэтому их частота невелика. И надо увеличивать численность выборки из популяции — тогда появляется шанс, что они в неё попадут. Если частота исчисляется сотыми долями, то и выборка должна быть не меньше 100 человек.
(обратно)43
Публикуется впервые, с любезного разрешения автора.
(обратно)44
Пока эта глава готовилась к печати, вышла статья Б. А. Малярчука с данными по пяти русским популяциям (табл. 6.2.2).
(обратно)45
Во время подготовки книги к печати появились данные ещё по 6 популяциям (см. табл. 6.2.2).
(обратно)46
Этимология этнонимов «казаки», «казахи» одинакова — человек, лишившийся своего скота, угодий и сделавшийся наёмным работником, «перекати поле» [Агеева, 2001].
(обратно)47
Пономарь — низший церковнослужитель, главной обязанностью которого было звонить в колокола, участвовать в клиросном пении и вообще прислуживать при богослужении. (Полный православный богословский энциклопедический словарь, 1992 — репринт).
(обратно)48
d — традиционное в популяционной генетике обозначение для генетического расстояния (от англ. distance). Нижний индекс указывает, между какими именно регионами вычислено расстояние. Например, dN-S — это расстояние между Северным (Northern) и Южным (Southern) регионами; dW-E — это расстояние между Западным (Western) и Восточным (Eastern) регионами; dN-C — это расстояние между Северным (Northern) и Центральным (Central) регионами; a ¯dN — средние расстояния от Северного региона (черта над символом — общепринятое в статистике обозначение для средней величины).
(обратно)49
Тема следов татаро-монгольского ига в русском генофонде затронута в разделе 10.2.
(обратно)50
Такое сокращение «классических» данных до 15 народов мы, конечно же, провели только для статистического анализа — карты классических маркёров построены по полному набору имеющихся данных.
(обратно)51
При неэффективности метода главных компонент все компоненты описывают одинаковую часть общей дисперсии, то есть их информативность равна информативности исходных признаков. Если признаков 10, то каждый описывает десятую часть общей дисперсии, если признаков сто — то сотую, и такая же дисперсия ожидается от главных компонент (новых признаков) при их неэффективности. В нашем случае хотя аллелей сто, но независимых признаков (число степеней свободы) меньше — 67, поскольку в каждом из 33 локусов частоты одного аллеля однозначно задаются частотами прочих аллелей (ведь сумма частот всех аллелей локуса всегда равняется единице). 100-33=67 независимых признаков, и дисперсия первой главной компоненты, ожидаемая при неэффективности метода составляет 1/67=0.149, то есть упомянутые полтора процента.
(обратно)52
Показатели ранговой корреляции Спирмена r приводятся по абсолютной величине, поскольку при корреляции с главными компонентами знак не имеет значения — для положительного и отрицательного полюса их знак условен, и они без последствий могут менять их на противоположные.
(обратно)53
Памятник материальной культуры палеолита — это все те стоянки, жилища, захоронения, временные стойбища, каменные карьеры и прочие знаки обитания человека в древнекаменном веке.
(обратно)54
Грант 6.72. (1991–1998 гг.) «Создание компьютерного банка данных о генофонде населения России и сопредельных стран», рук. Е. В. Балановская.
(обратно)55
То есть на данных не об отдельных «выдержках» о варьирующих фрагментах мтДНК, а о полном тексте всей последовательности нуклеотидов мтДНК.
(обратно)56
Правильнее говорить о Западной Евразии и Восточной Евра
зии, но для краткости мы иногда говорим и об «Азии» и «Европе».
Напомним, что для удобства приводится величина GST, умноженная на 100.
(обратно)57
Положение «границы между Западом и Востоком» несколько по-разному вырисовывается в нескольких разных исследованиях [Генофонд и геногеография…, 2003; Cavalli-Sforza et al., 1994; наша книга]. Подробно это обсуждается в следующем разделе, посвящённом географии главных компонент. Пока же отметим, что ход границы по мтДНК зависит ещё и от того, какие гаплогруппы мы причислим к западно-евразийским, а какие — к восточным. Главная сложность — гаплогруппы, специфичные для Индостана. Мы причисляем их к западным на том основании, что другие (не специфические) индийские гаплогруппы почти все являются западными.
(обратно)58
Напомним, что для удобства приводится величина GST, умноженная на 100.
(обратно)59
Такая постановка проблемы принадлежит профессору Л. Т. Яблонскому, заведующему сектором археологии степей Института археологии РАН, одному из ведущих специалистов по средневековым кочевникам.
(обратно)60
Это общее свойство многих завоеваний. Например, мадьяры (венгры), пришедшие из Зауралья, в конце 1 тысячелетия н. э завоевали Среднедунайскую низменность, населённую главным образом славянами, и смешались с ними. Живущий там народ и сейчас называется венграми и говорит по-венгерски (язык уральской семьи). Но прекрасная венгерская научная школа физической антропологии, несмотря на огромные усилия, практически не находит в физическом облике нынешних венгров явных следов переселенцев с Урала — одни лишь черты прежнего (субстратного) славянского населения. И причина все та же — относительная немногочисленность пришлого населения (суперстрата).
(обратно)61
Азия велика и разнообразна, и некорректно сравнивать с ней маленькую гомогенную Европу. Здесь под «Азией» мы не имеем в виду ни Юго-Западную Азию, которая генетически сходна с Европой, ни Южную Азию (Индостан), а сравниваем Европу с Сибирью, Центральной и Восточной Азией.
(обратно)62
Авторы благодарят одного из посетителей нашего сайта за письмо о любопытной истории этой фразы:
Выражение «Поскреби русского — найдёшь татарина» пришло к нам из французского языка, и в оригинале звучит так: «Grattez le Russe, et vous verrez un Tartare». Это просто краткая версия цитаты из сочинения «Россия в 1839 году» маркиза де Кюстина: «Ведь немногим больше ста лет тому назад они были настоящими татарами. И под внешним лоском европейской элегантности большинство этих выскочек цивилизаций сохранило медвежью шкуру — они лишь надели её мехом внутрь. Но достаточно их чуть-чуть поскрести — и вы увидите, как шерсть вылезает наружу и топорщится». Но со временем, эта сомнительная сентенция «Под тонкой оболочкой напускной культуры в русских по-прежнему скрываются дикари-людоеды» превратилась в мирный и верный в общем-то тезис «Русский с татарином — братья навек».
Получается, что изначально афоризм про русского и татарина вовсе и не имел никакой биологической, генетической подоплёки (не считал же маркиз, что в русском генофонде велик процент медвежьих генов), а касался лишь восприятия европейцем культурных черт России — не имеющих никакой связи с генофондом и, следовательно, с нашей книгой. Так что даже сама фраза про «поскреби русского…», оказывается, говорит вовсе не о влиянии «азиатского» генофонда. Опять «азиатское влияние» оборачивается лишь мифом…
(обратно)63
КоммерсантЪ-Власть «Лицо русской национальности». № 38 (641) 26 сентября 2005 г; опровержение см. на
(обратно)64
Шовинизм (фр. chauvinisme) — провозглашение и пропаганда национальной исключительности, противопоставление интересов одной «титульной», «коренной», «главной» нации интересам всех других наций и меньшинств, распространение национального чванства, разжигание национальной вражды и ненависти. Под шовинизмом понимается политика подавления этнических, национальных и религиозных меньшинств от имени «превосходства», «главенства», «старшего брата» и т. п. В отличие от национализма, шовинизм проявляется лишь у доминирующей, господствующей нации. Ранее шовинизм было принято считать формой национализма, но сейчас исследователи национализма проводят грань между национализмом, представляющим из себя амбивалентную самоидентификацию этноса, и шовинизмом, где самоидентификация группы создаётся «от противного», [].
(обратно)65
Это очень похоже на ситуацию с физической антропологией и расизмом. Данные научного расоведения свидетельствуют что «народы Земли обладают ныне равными биологическими возможностями… В отношении наследственных возможностей, общего умственного развития и способностей к культурным достижениям, так же как и в отношении физических признаков, нельзя оправдать концепцию «высших» и «низших» рас. Изложенные выше биологические данные находятся в явном противоречии с расистскими положениями. Последние никак не могут претендовать на научное обоснование, и долг антропологов прилагать усилия, чтобы противодействовать искажению результатов их исследований в ненаучных целях». [Предложения по биологическим проблемам расовой проблемы ЮНЕСКО. Совещание экспертов по биологическим аспектам расовой проблема, 1964. Цит. по «Хрисанфова, Перевозчиков. Антропология. Изд-во Моск. ун-та, 1999».]. Увы, это не мешает (или недостаточно мешает) иным расистски настроенным ораторам выдергивать отдельные антропологические факты и приводить их в подтверждение своих взглядов.
(обратно)66
На самом деле белорусскому генофонду свойственна широтная изменчивость (север<=>юг) [Балановская и др., в печати].
(обратно)67
Хотя если вдуматься — разве генетическое сходство двух популяций может быть основанием для их политического объединения в одном государстве? Нелепость. Генетическое сходство не становится базой политического единства: сколько крови пролилось и в гражданских войнах, и в братоубийственных войнах родственных народов — «тому в истории мы тьму примеров слышим» (И. А. Крылов).
(обратно)68
Ещё раз повторим важный момент: по данным генетики НИКОГДА нельзя определять границы народа: их определяет сам народ. Использование генетических аргументов в таком определении всегда антинаучно.
(обратно)69
Поскольку книга о русских, то из генофондов других народов мы привлекаем для сравнения только наиболее близкие народы — белорусов и украинцев. Причина не во вкусах авторов, а в задачах книги. Нами детально изучались генофонды и других народов — например адыгейцев (северо-кавказская языковая семья), марийцев (уральская языковая семья) или башкир (алтайская языковая семья). Но нельзя же в одной книге объять необъятное.
(обратно)70
Эти взгляды мы обсудили в докладе на Второй международной школе-семинаре «Проблемы генетической безопасности: научные инновации и их интерпретация», Москва, 2004.
(обратно)71
Например, во время нашей экспедиции в Псковской области мы слышали свидетельства о том, как недавно приехавшие активисты, методами, мягко говоря, незаконными, вынудили уехать в соседнюю Эстонию почти всех представителей народа сету, которых насчитывалось в России лишь несколько тысяч. Это значит, что этого коренного народа России у неё уже нет. История сету (народа, родственного эстонцам, но православного вероисповедования, на земле которого возник знаменитый Псково-Печерский монастырь) полна такими примерами, но грустно, что такое может происходить и в наши дни.
На другом, южном конце России, в одной газете заявлялось: «На кубанской земле отродясь жили казаки». Несомненно, нынешние казаки тут родились, слово «отродясь» тут замечательно уместно. Но их предки — переселенцы, занявшие черкесские земли. И хорошо ли раздувать давний спор, заявляя исключительные права на земли, где давно уже вперемешку живут оба народа?
(обратно)72
Продолжая мысль Валерия Павловича Алексеева («Индивидуум не является носителем расовых свойств, значит попытка определения его расового типа — научная фикция» [Алексеев, 1985, с.246]), тем с большим правом можно утверждать, что индивидуум не является носителем свойств популяции или генофонда народа, поэтому попытка определения принадлежности к народу по генам, как и попытка определения «этнических» генов любого народа — научная фикция.
(обратно)73
Не вздыхай глубоко, не отдадим далеко: хоть за курицу, да на свою улицу, хоть за помело, да в своё село, хоть за петушка, да за милого дружка!
(обратно)74
Подстрочные индексы имеют свой смысл: S обозначает субпопуляцию (Subpopulation), Т — тотальную популяцию (Total population), а индекс ST — соотношение субпопуляции и тотальной популяции. Например, гетерозиготность обозначается буквой Н, тогда HS обозначает гетерозиготность субпопуляции, Нт — гетерозиготность тотальной популяции, a FST — изменчивость (F) субпопуляций в пределах тотальной популяции.
(обратно)75
Выбор генохронологически датируемых событий, Равно как и их описание, были осуществлены профессором Ю. Г. Рычковым и приводятся по работе [Балановская, Рычков, 1990 а]. Все работы проведены в 60е-80е годы его сотрудниками и выполнены под его руководством [Рычков, 1984, 1980].
(обратно)76
Вопросы стационарности генетического процесса мы подробно обсуждали в работе [Балановская, Нурбаев, 1997].
(обратно)77
Даже если сейчас данный аллель селективно-нейтрален — он мог быть адаптивно значимым на прошлых временных срезах, на иных поворотах истории генофонда. При анализе селективной структуры генофонда мира по всем наиболее изученным классическим маркёрам, мы, к своему удивлению, не обнаружили ни одного аллеля, который бы во всех регионах мира и на всех этапах истории был бы селективно-нейтральным! [Рычков, Балановская, 1990 б; Балановская, Рычков, 1997]. Более того, аллели во времени и в пространстве могут не только переходить из селективно-нейтральных в разряд селективно-значимых и наоборот — может меняться даже вектор отбора! То есть один и тот же вариант гена может быть подвержен то стабилизирующему, то дифференцирующему отбору на разных отрезках времени и пространства мирового генофонда.
(обратно)78
Мы здесь приводим для каждого из регионов его реальные наблюдаемые значения FST, полученные нами по классическим маркёрам.
В Средней Сибири разнообразие популяций внутри этноса FST(MS-POP)=4.41, различия между этносами FST(ES-ET)=2.59, a общие различия в пределах региона FST(MS)=7.00. В Восточной Сибири разнообразие популяций внутри этноса FST(ES-POP)=4.01, различия между этносами FST(ES-ET)=2.36, а общие различия в пределах региона FST(ES)=6.37.
(обратно)79
Мы избегаем конкретных ссылок в этом случае. Кто из нас застрахован от таких или иных ошибок?
(обратно)80
Банк данных «Русский генофонд» (номер в Государственном регистре баз данных 022-030-9536) разработан в 2001–2005 годах несколькими программистами под руководством авторов данной книги. Основной вклад в программную реализацию внесен Иваном Борисовичем Горбацевичем. Основное финансирование поступило от Российского фонда фундаментальных исследований: проект РФФИ № 01-07-90045в «Создание геоинфосистемы Русский генофонд», рук. Е. В. Балановская; проект РФФИ № 01-06-80085а «Комплексное геногеографическое изучение русского генофонда: антропология, дерматоглифика, генетика», рук. Е. В. Балановская.
(обратно)81
Коннексия — преобразование данных из разных источников так, чтобы эти данные можно было включить в совместный количественный анализ. Этот процесс аналогичен пересчету температуры, измеренной по Фаренгейту, в шкалу Цельсия.
(обратно)82
Для получения среднерусских характеристик оцениваются средние (невзвешенные по численности каждой русской популяции) значения по всем исследованным популяциям. Получается характеристика абстрактной «среднерусской» популяции, от которой и вычисляются генетические расстояния до всех точек карты.
(обратно)83
HLA*B27 в виде исключения рассмотрен как аналог двуаллельного локуса: частота HLA*B27 (первый аллель) и единица минус частота HLA*B27 (второй «аллель»).
(обратно)84
Во многих деревнях встречаются лишь несколько фамилий. Поэтому слишком велики случайные колебания частот фамилий между отдельными населёнными пунктами. Колебания между соседними «волостями» (объединяющими несколько деревень) значительно меньше.
(обратно)
Комментарии к книге «Русский генофонд на Русской равнине», Елена Владимировна Балановская
Всего 0 комментариев