Селекция и рекомбинация стимулируют эволюцию разнообразия <i>DRB</i>MHC класса II у копытных

Гены, представляющие основной комплекс гистосовместимости (MHC), являются наиболее вариабельными локусами в геномах позвоночных. Предполагается, что совместная эволюция паразита и хозяина поддерживает избыточный полиморфизм в локусах MHC. Однако молекулярные механизмы, лежащие в основе поразительного разнообразия MHC, остаются спорными. Степень, в которой рекомбинация вносит вклад в разнообразие локусов MHC в естественных популяциях, все еще остается спорной, и было проведено лишь несколько сравнительных исследований, дающих количественные оценки скорости рекомбинации. В этом исследовании мы провели сравнительный анализ 15 различных видов копытных животных, чтобы оценить скорость рекомбинации популяции и количественно определить уровни отбора. Как и ожидалось для всех видов, мы наблюдали признаки сильного положительного отбора,и идентифицировали индивидуальные остатки, прошедшие отбор, которые совпадали с остатками, составляющими пептид-связывающую область человека.Ген DRB. Однако, в дополнение к каждому виду, мы также наблюдали скорости рекомбинации, которые значительно отличались от нуля на основе критериев вероятности перестановки и других неколичественных анализов. Паттерны разнообразия синонимичных и несинонимичных последовательностей соответствовали разным демографическим историям разных видов, но недавние имитационные исследования, проведенные другими авторами, показывают, что вывод о выборе и рекомбинации, вероятно, будет устойчивым к таким отклонениям от стандартных моделей. Если высокие скорости рекомбинации обычны для генов MHC других таксонов, может потребоваться переоценка многих основанных на выводах филогенетических анализов локусов MHC, таких как оценки времени дивергенции аллелей и транс-специфического полиморфизма.

Вступление

Гены, представляющие главный комплекс гистосовместимости (MHC) (классы I и II), являются наиболее вариабельными локусами в геномах позвоночных. Молекулы MHC класса I представляют собой белки, которые экспрессируются на поверхности всех ядерных клеток и представляют пептиды CD8 + Т-клеткам. Молекулы MHC класса II, которые состоят из нековалентно связанных α-и β-цепей, экспрессируются только на антигенпрезентирующих клетках, таких как B-клетки, дендритные клетки и макрофаги. Α1 и β1 доменов, которые кодируются отдельными генами, образуют пептид-связывающий участок (PBR), в которых пептиды связываются и признанными CD4 + Т - хелперов. У человека экспрессируются три разные изоформы молекул МНС класса II. Они обозначаются HLA-DR, - DQи - DP. DRB1локус является наиболее полиморфным локусом класса II, известным у людей, с описанием примерно 360 аллелей (Robinson et al., 2003). Считается, что экстремальный уровень полиморфизма, наблюдаемый для этих генов, возникает из-за необходимости распознавать разнообразный репертуар патогенов, которые демонстрируют антагонистическую коэволюцию с хозяином для уклонения от иммунного распознавания (Doherty and Zinkernagel, 1975), а также из-за потенциальной роли в спаривании. распознавание (или избегание инбридинга) для некоторых видов (Jordan, Bruford, 1998; Penn, Potts, 1999; Reusch et al., 2001). Гипотеза отбора, управляемого патогенами, подтверждается характерными паттернами молекулярной эволюции, проявляемыми генами MHC класса I и класса II у большинства видов, включая значительное превышение несинонимичных мутаций над синонимичными мутациями для остатков, участвующих в связывании пептидов,свидетельства балансирующего отбора (Hughes and Nei, 1988) и «трансвидового» способа эволюции, при котором многие аллели кажутся старше, чем виды, у которых они обнаружены (Figueroa et al., 1988; Klein et al., 1993).

В то время как вариация MHC привлекает все большее внимание для растущего числа видов (Bernatchez and Landry, 2003), все еще ведутся споры об относительной важности различных механизмов для генерации большого аллельного разнообразия, наблюдаемого в этих локусах MHC. Начиная с первых исследований MHC на молекулярном уровне, наибольшее внимание уделялось патоген-опосредованному отбору как главному механизму, движущему эволюцию разнообразия MHC. Исследования, посвященные паттерну молекулярной эволюции, демонстрируют явное свидетельство воздействия отбора патогенами (Hughes and Yeager, 1998; Hughes, 2002). Напротив, для естественных или полуестественных популяционных исследований прямая эмпирическая демонстрация дифференциальной пригодности альтернативных генотипов MHC в ответ на патогены была более сложной задачей,при небольшом количестве исследований, обладающих необходимыми подтверждающими данными и статистической мощностью для обнаружения тонких эффектов (Патерсон и др., 1998; Лом и др., 2002; Пенн и др., 2002; Вегнер и др., 2003).

Несмотря на важность рекомбинации в популяционной генетике, очень мало известно о степени и скорости рекомбинации, особенно в диких популяциях. Известно, что скорость рекомбинации изменяется в геноме человека (McVean et al., 2004), но также и между очень близкородственными видами (Ptak et al., 2004). Недавняя работа предположила, что внутригенная рекомбинация также может быть важным механизмом для генерации аллельного разнообразия в локусах MHC класса I и класса II (Gyllensten et al., 1991; She et al., 1991; Andersson and Mikko, 1995; Satta, 1997; Bergstrom et al., 1998; Takahata and Satta, 1998; Mikko et al., 1999; Richman et al., 2003a; Schaschl et al., 2005). В то время как мутации создают новые вариации на отдельных участках,рекомбинация может производить множественные замены на одно событие с потенциалом для большего изменения антигенсвязывающих свойств молекул MHC. Следовательно, новые молекулы, полученные путем рекомбинации, могут иметь большее селективное преимущество (She et al., 1991; Andersson and Mikko, 1995). Оценка относительной важности отбора, рекомбинации и мутации в создании разнообразия, наблюдаемого в генах MHC, зависит от возможности сделать количественные оценки этих параметров, но надежные количественные популяционные генетические оценки количества рекомбинации отсутствовали до недавнего времени. Следовательно, предыдущие исследования рекомбинации в MHC часто полагались на непараметрические методы, которые могут обнаруживать рекомбинацию в выборке последовательностей, но без оценки скорости, с которой она происходит (например, Andersson and Mikko, 1995).Хотя предыдущему количественному анализу рекомбинации препятствовало отсутствие прочной теоретической основы, новые разработки в этой области теперь позволяют прогресс (Hudson, 2001; McVean et al., 2002; Stumpf and McVean, 2003). Подход McVean et al. (2002) представляет собой метод составного правдоподобия (Hudson, 2001), основанный на теории слияния, использующий модель мутаций с конечными сайтами (например, разрешение повторяющихся мутаций) для оценки скорости рекомбинации популяции (4допускают повторяющиеся мутации), чтобы оценить скорость рекомбинации популяции (4допускают повторяющиеся мутации), чтобы оценить скорость рекомбинации популяции (4Ne r). Это сочетается с мощным критерием вероятностной перестановки, чтобы определить, значительно ли наблюдаемые значения 4 Ne rотличаются от нуля. И оценка, и тест значимости устойчивы к некоторым ошибкам в спецификации модели эволюции последовательности (Richman et al., 2003b). Этот новый количественный метод до сих пор применялся к ограниченному числу таксонов для анализа последовательностей MHC. Например, Richman et al. (2003a, 2003b) обнаружили доказательства обширной рекомбинации гена DRBкласса II MHC у оленьих мышей ( Peromyscus) таксоны; скорость рекомбинации популяции значительно отличается от нуля и значительно превышает скорость популяционных мутаций. Однако наблюдалась ли эта закономерность у PeromyscusВид является представителем других таксонов, и важность рекомбинации как общего механизма, участвующего в эволюции разнообразия MHC, еще предстоит продемонстрировать. Более сравнительные исследования нескольких видов являются важным вкладом в эту дискуссию, поскольку демография популяций также играет ключевую роль, а очевидная важность отбора и рекомбинации может измениться после колебаний в размере популяции (Richman et al., 2003a). Количественная оценка относительной важности рекомбинации в генах MHC имеет важное значение для нашего понимания эволюции этих локусов. Неспособность учесть рекомбинацию может существенно повлиять на популяционные генетические и филогенетические выводы (Schierup and Hein, 2000; Schierup et al., 2001), влияя на интерпретацию аллельных генеалогий MHC и оценки силы и способа отбора.

В этой статье мы представляем сравнительный анализ разнообразия DRBMHC класса II у 15 видов копытных и, в частности, проверяем, сыграла ли рекомбинация значительную роль в эволюции разнообразия DRBкласса II MHC .

Материалы и методы

Образцы и выделение ДНК

Образцы печени были получены от 27 альпийских горных козлов ( Capra ibex) из одной популяции в Швейцарии (Альбрис, Кантон Граубюенден, Швейцария), семи испанских горных козлов ( Capra pyrenaica) из популяций Tortosa-Beceite и Parque Natural Sierra de las Nieves - Ronda (Испания). ) и 18 гималайских тар ( Hemitragus jemlahicus) из Новой Зеландии. Эти животные были взяты во время охоты для целей управления популяцией лицензированными управляющими органами и не были убиты специально для этого исследования. Образец крови одной особи тара был взят в зоопарке Шенбрунн (Вена, Австрия). Геномную ДНК экстрагировали из замороженной печени с использованием стандартной экстракции фенол / хлороформ-изоамиловый спирт или с помощью набора для экстракции ДНК Qiagen. Образец крови tahr был использован для выделения мРНК, и она была преобразована в кДНК с использованием системы RT-PCR Titan One Tubeот Roche Diagnostic GmBH, Вена, Австрия.

ПЦР, клонирование и секвенирование

Класс II MHC DRBэкзон 2 ( β1 домен) последовательности были получены с помощью ПЦР с использованием локус-специфических праймеров в ПЦР - seminested подхода , как описано в Schaschl и соавт. (2004). Продукты ПЦР клонировали в ТА-вектор pCR2.1 (Invitrogen Ltd., Карлсруэ, Германия), а затем трансформировали в компетентные клетки Escherichia coli. От каждого индивидуума отбирали от пяти до семи положительных (отбор синих / белых) клонов и выращивали в течение ночи в 3 мл LB-среды. Плазмиды выделяли с помощью набора QIAprep Spin Miniprep Kit (Qiagen) и впоследствии проверяли на правильность вставок с помощью EcoRI-переваривания или второй ПЦР с праймерами M13. Те клоны, которые содержали правильные вставки, были двунаправленно секвенированы с помощью набора для циклического секвенирования Applied Biosystems BigDye Terminator v2.0 Cycle Sequencing Kit с использованием универсальных праймеров M13 и обратных праймеров M13 на секвенсоре ДНК ABI PRISM 377. Образцы с низкой эффективностью клонирования и последовательности, полученные путем рекомбинации ПЦР, отбрасывали. Образцы альпийских козлов были напрямую секвенированы, поскольку мы ожидали низкого уровня гетерозиготности. Однако из пяти случайных образцов продукты ПЦР были клонированы и секвенированы, как описано выше. Данные последовательности были подготовлены для дальнейшего анализа с помощью BioEdit (Hall, 1999).

Анализ последовательности и обнаружение положительного отбора

Последовательности выравнивали с помощью программы ClustalX (Thompson et al., 1997). Селективное давление на аминокислотном уровне измеряется несинонимичным / синонимичным соотношением скоростей ( ω= dN / dS ). Ωбольше , чем соотношение 1 ( & omega= dН / дS >1) указывают на положительный выбор (например, Ян и Bielawski, 2000). Мы использовали программу CODEML из пакета PAML 3.14 (Yang, 1997) для проверки наличия кодонных сайтов, затронутых положительным отбором, и для идентификации этих сайтов с помощью байесовского подхода, реализованного в CODEML. В данном исследовании рассматривались модели M7 (бета) и M8 (бета и ω).) (Ян и др., 2000). Хотя рекомбинация потенциально может генерировать ложноположительные результаты при обнаружении положительного отбора, эти две модели гораздо более устойчивы к возникновению рекомбинации, чем другие модели, реализованные в CODEML (Anisimova et al., 2003). Предсказание Байеса сайтов при положительном отборе также оказывается устойчивым к эффектам рекомбинации (Anisimova et al., 2003). В модели M7 (бета) отношение ωизменяется в соответствии с бета-распределением (с параметрами pи q) и не учитывает положительные выбранные сайты (0 < ωω). Модель M8 добавляет к бета-модели дополнительный класс сайтов для учета сайтов с положительным выбором ( ω>1). Для каждого вида модели M7 и M8 можно сравнить с помощью теста отношения правдоподобия (Nielsen and Yang 1998). Статистика теста отношения правдоподобия вычисляет двойную разницу логарифма правдоподобия (2) по сравнению с распределением χ2 со степенями свободы, равными разнице в количестве параметров между двумя моделями. Чтобы предоставить филогенетическую информацию, необходимую для анализа (Yang, 1997), лучшее дерево для последовательностей DRBдля каждого вида было идентифицировано по максимальной вероятности в рамках модели с одним соотношением (M0) в CODEML. Среднее количество несинонимичных замен на несинонимичный сайт ( dN) и синонимичных замен на синонимичный сайт ( dS ) оценивали с помощью программы MEGA 2.1 (Kumar et al., 2001), используя расстояние Nei и Gojobori (1986) с поправкой Jukes and Cantor (1969) для множественных замен. Стандартные ошибки были рассчитаны по 1000 повторений начальной загрузки.

Оценка популяционного отбора, мутаций и рекомбинации

Поскольку у нас нет информации об эффективном размере популяции для каждого вида, оценки скорости отбора, рекомбинации и мутации должны быть ограничены составными параметрами популяции S, ρи θ, соответственно, которые представляют собой скорости отбора ( ов), рекомбинации на основание ( r) и мутаций на основание ( u), масштабированные на эффективный размер популяции. Однако при попытке оценить эти параметры одновременно возникает внутренняя проблема, заключающаяся в том, что структура модели для оценки Sпредполагает отсутствие рекомбинации, а оценки для ρсделаны в предположении отсутствия выбора. Тем не менее, в ходе этой работы мы показываем, что оба эти процесса влияют на изучаемые последовательности. Текущие методологии не предлагают простого решения этих важных нарушений основных предположений, но были предприняты попытки попытаться количественно оценить возможную систематическую ошибку (Satta, 1997; Fearnhead and Donnelly, 2001; Richman et al., 2003a; Smith and Fearnhead. , 2005). Основная цель этого исследования - попытаться оценить относительные масштабы отбора, рекомбинации и мутации. Существующие имитационные исследования показывают, что, хотя абсолютные значения параметров могут быть скомпрометированы из-за нарушения допущений модели, относительные значения могут быть приняты с большей уверенностью. Поэтому мы продолжаем, признавая вероятные ограничения этой работы,начав с описания основных допущений модели в следующих методах, а затем в заключительной части документа обсудим ограничения существующих статистических методов по сравнению с нашими результатами.

Оценка S

В рамках модели симметричного балансирующего отбора (Kimura and Crow, 1964; Takahata and Nei, 1990) популяционный отбор можно определить как S= 2Ns, где N- количество размножающихся особей (эффективный размер популяции), а s- селективный недостаток. гомозигот. В этой модели существует фиксированное количество аллелей ( n) во времени частоты аллелей примерно равномерно распределены, и происходит аллельный оборот, так что когда возникает новый аллель, он либо заменяет свой родительский аллель в генеалогии, либо одна из других аллельных линий исчезает и заменяется. Здесь «аллели» относятся к функциональным аллелям, и каждый новый аллель возникает в результате единственной несинонимичной мутации в PBR в соответствии с моделью бесконечного аллеля. Дополнительные предположения - конечные сайты, отсутствие рекомбинации и неотъемлемая коррекция множественных мутаций в одном и том же сайте. Takahata et al. (1992) показывают, что в этих условиях Sпропорциональна количеству функциональных аллелей и интенсивности отбора, которую можно оценить как:

где n- количество функциональных аллелей в популяции, а γ- отношение количества несинонимичных замен на несинонимичный сайт к количеству синонимичных замен на синонимичный сайт к (( Kn / Ln ) / ( Ks / Ls )), где nаппроксимируется из Kn , которое представляет собой среднее попарное количество несинонимичных замен в PBR среди последовательностей (Takahata et al., 1992; Richman et al., 2003a). Kn , Ln , Ks и Lsбыли оценены на основе данных с использованием Jukes and Cantor (1969) в рамках программы Mega 2.1 (Kumar et al., 2001). Takahata et al. (1992) утверждают, что, если должна быть сделана поправка на множественные замены, это должно быть сделано путем отбора данных, чтобы включить только «молодые» аллели, в которых сайты не имели шанса испытать насыщение. Однако, поскольку рекомбинация, вероятно, сделает оценку кажущегося возраста аллелей проблематичной, чтобы обеспечить последовательную обработку данных по всем видам (и с данными, используемыми для оценки ρ), при сохранении размеров выборки для видов с низким числом последовательностей, мы выбрали включить все последовательности для каждого вида, а не пытаться исправить.

Оценка ρи θ

Программа LDhat использовалась для оценки скорости популяционных мутаций (по шкале Уотерсона θ, где θ= 4 Ne μ) и популяционной рекомбинации ( ρ, где ρ= 4 Ne r) (см. McVean et al., 2002). Эта программа оценивает рекомбинацию популяции из набора выровненных последовательностей с использованием метода составного правдоподобия (Hudson, 2001) в рамках объединяющей структуры. Для оценки θи ρ, анализ ограничивался биаллельными сайтами, где частота альтернативного аллеля была ≥ 0,1. Этот подход был выбран потому, что метод не учитывает вариации скорости сайтов, а исключение редких аллельных вариантов может повысить эффективность анализа (McVean et al., 2002). Мы использовали подход, основанный на вероятности перестановки, чтобы проверить значимость против нулевой гипотезы об отсутствии рекомбинации (т. Е. 4 Ne r= 0). Программа LDhat восстанавливает точные оценки относительной скорости рекомбинации, даже когда предположения стандартной модели нарушаются, например, в результате действия отбора (Richman et al., 2003a; Smith and Fearnhead, 2005). Однако в этих условиях технически он больше не может быть истинной оценкой скорости рекомбинации популяции (4 Ne r). Мы также рассчитали отношение ρ / θкак оценку относительного количества рекомбинации по сравнению с точечными мутациями, которое снова устойчиво к отклонениям от базовой модели слияния (Fearnhead and Donnelly, 2001), и соответствующего отношения S / θ. Менье и Эйр-Уокер (2001) G4 и Авадалла и др. (1999) r2 статистики, которые оценивают корреляцию неравновесия по сцеплению между парами полиморфных сайтов с расстоянием между ними, были рассчитаны как альтернативные индикаторы рекомбинации. В этих случаях рекомбинация подразумевается, если наблюдается значительный спад неравновесия по сцеплению с расстоянием. Наконец, мы использовали программу DnaSP 4 (Rozas et al., 2003) для расчета минимального числа предполагаемых событий рекомбинации ( RM ) (Hudson and Kaplan, 1985) для каждого вида, которое можно интерпретировать как минимальное количество различных позиции, в которых произошла рекомбинация.

Номенклатура последовательностей и последовательности из GenBank

В соответствии с предложенной номенклатурой для MHC у нечеловеческих видов (Klein et al., 1990) мы обозначили аллели экзона 2 Caib-DRBдля альпийского козерога ( Capra ibex), Capy-DRBдля испанского козерога ( Capra pyrenaica) и Heje-DRBдля гималайского тара ( H. jemlahicus) с прикрепленными серийными номерами. Кроме того, данные последовательности экзона 2 DRBкласса II MHC от различных видов копытных были взяты из GenBank со следующими номерами доступа: альпийская серна ( Rupicapra r. Rupicapra), номера доступа: AY368437 – AY368455; Серна пиренейская ( Rupicapra pyrenaica), инвентарные номера: AY212149 – AY212157; Снежный баран (Ovis canadensis), номера доступа: AF324840 – AF324861; дикая коза ( Capra aegagrus), инвентарные номера: U00183 – U00202; овцы ( O. aries), инвентарные номера: U00204 – U00233; домашний скот ( Bos taurus), инвентарные номера: U00124 – U00144; буйвол ( Bubalus bubalus), номера доступа: AF385473 – AF385480; Африканский буйвол ( Syncerus caffer), инвентарные номера: AF059233 – AF059241 (последовательность AF059236 была позже исключена из анализа из-за возможных артефактов секвенирования); Южноафриканская антилопа, соответствующая двум подвидам бонтебок ( Damaliscus pygargus pygargus) и блесбок ( Damaliscus p. Phillipsi), номера доступа: AJ302736 – AJ302762; белохвостый олень (Odocoileus virginianus), номера доступа: AF082161 – AF082175 и AF407169 – AF407171; северный олень ( Rangifer tarandus), инвентарные номера: AF012716 – AF012724; и лось ( Alces alces), инвентарные номера: X83278 – X83286. Хотя имеется много данных о последовательностях DRBдля других видов копытных, мы ограничиваем этот анализ данными, которые можно считать однозначно полученными из одного локуса и потенциально функционально, чтобы избежать систематической ошибки, которая может быть внесена из-за непреднамеренного включения нескольких локусов, так как может быть возможным, если использовать неспецифические для локуса праймеры для амплификации локусов MHC класса II из геномной ДНК.

Результаты

Анализ последовательностей новых последовательностей экзона 2

Новый DRBэкзона 2 ( & beta ;1 домен) последовательностей , полученных для этого исследования был 284 п.н. в том числе последовательностей праймеров. Нуклеотидные последовательности, за исключением праймеров (236 п.н.) экзона 2 каждого вида, депонированы в GenBank (номера доступа: AY706312 для альпийского горного козла и AY706313 – AY706317 для гималайского тара). В проанализированных образцах у любого человека было обнаружено не более двух последовательностей, и мы уверены, что продукты были амплифицированы из одного DRBкласса II MHC.локус. Мы получили четыре аллеля экзона 2 из гималайского тара из образцов Новой Зеландии и пятый отдельный аллель (как гомозиготный генотип) из образца зоопарка (рис. 1). Среди этих аллелей 15,7% из 236 нуклеотидных сайтов и 29,5% из 78-аминокислотных сайтов были полиморфными. Два аллеля экзона 2 были получены из образцов испанского горного козла (рис. 1). Эти два аллеля соответствовали двум опубликованным последовательностям экзона 2 в GenBank, названным Capy-DRB1-1и Cypy-DRB1-2(инвентарные номера: AF461692 и AF461693; Amills et al., 2004). Еще четыре испанских аллели козерог ( Capy-DRB1-3, Capy-DRB1-4, Capy-DRB1-5и Capy-DRB1-6) были ранее идентифицированы (номера доступа в GenBank: AF461694 – AF461696 и AY351788; Amills et al., 2004). Эти аллели были включены во все последующие анализы. Для этих последовательностей экзона 2 22,9% из 236 нуклеотидных сайтов и 38,5% из 78-аминокислотных сайтов были полиморфными. От 27 особей альпийского козерога мы получили только одну последовательность экзона 2 (рис. 1). Единственная последовательность альпийского козерога была исключена из всех последующих анализов.

Выравнивание предполагаемых аминокислотных последовательностей экзона 2 DRBкласса II MHC из альпийского козерога ( Caib-DRB), испанского козерога ( Capy-DRB) и из гималайского тара ( Heje-DRB). Точки указывают на идентичность аминокислотной последовательности последовательности Консенсусной последовательности,а крестик указывает на кодоны, участвующие в PBR у человека (Brown et al., 1993).

Выявление положительного отбора на сайтах с помощью анализа максимального правдоподобия

Тесты отношения правдоподобия, сравнивающие две модели M7 – M8, показали, что M8 (модель, которая учитывает участки с положительным отбором ( ω>1)) достоверно соответствовала данным по всем видам ( Pωωпревышает 1, что указывает на положительный отбор в последовательностях DRBкласса II MHC . Сайты, идентифицированные как находящиеся под положительным отбором в байесовском анализе, перечислены в таблице 2. Те сайты, которые были идентифицированы как положительно выбранные сайты (с уровнем достоверности 95%), в основном соответствуют сайтам PBR человека (HLA- DRB1).ген) (Brown et al., 1993). Идентификация участков при положительном отборе удивительно последовательна для разных видов, при этом многие участки идентифицированы у большинства видов (например, участок 11 идентифицирован у всех, кроме северного оленя), а большинство участков идентифицировано как минимум у двух видов. Среднее количество синонимичных замен на синонимичный сайт ( dS ) и несинонимичных замен на несинонимичный сайт ( dN ) (плюс se), оцененное для экзона 2, представлено в таблице 1.

Анализ популяционного отбора, мутации и рекомбинации

Оценки популяционного отбора ( S), мутации ( θ) и рекомбинации ( ρ) показывают, что каждый из этих процессов сыграл значительную роль в создании разнообразия, наблюдаемого среди аллелей DRBкопытных животных (Таблица 3). Проверка вероятности перестановки, реализованная в программе LDhat, показала, что оценки ρзначительно отличались от нуля для всех таксонов в исследовании (Таблица 3). За исключением испанского горного козла, у которого была небольшая выборка, все результаты были возвращены с P-значениямиρоценены ( ρ>100). Два альтернативных статистических теста для рекомбинации ( r2, Awadalla et al. (1999); G4, Meunier and Eyre-Walker (2001)) также обнаружили, что в большинстве случаев скорости рекомбинации значительно отличаются от нуля. Для r2 это было у всех видов, за исключением испанского козерога и снежного барана (таблица 3, данные для G4 не показаны). Тест рекомбинации DnaSP выявил события рекомбинации ( RM ) у всех видов (таблица 3). Отношения ρ/ θи S/ θтакже приведены в таблице 3 как индикатор вероятности участия нуклеотидов в рекомбинации и селекции, соответственно, относительно точечной мутации, и они должны быть менее чувствительны к влиянию размера популяции. Они показывают аналогичную картину, обнаруживаемый ри S.

Обсуждение

В этом исследовании мы изучили генетическое разнообразие DRBкласса II MHC.ген и продемонстрировал с помощью нескольких дополнительных подходов к анализу, что рекомбинация внесла значительный вклад в аллельное разнообразие у ряда видов копытных в дополнение к ожидаемой роли положительного отбора. Хотя ранее предполагалась роль рекомбинации в генерации разнообразия MHC, очень немногие исследования смогли предоставить количественные оценки степени рекомбинации (например, Richman et al., 2003a, 2003b). В сочетании с предыдущими результатами для грызунов это исследование предполагает, что рекомбинация, вероятно, будет играть ключевую роль в создании разнообразия MHC для широкого круга таксонов с важными последствиями для интерпретации параметров, относящихся к молекулярной эволюции, или выводов, основанных на генеалогии генов. Аллели MHC.

Как и для большинства других таксонов с хорошо охарактеризованными локусами MHC, мы идентифицировали признак сильного положительного отбора, действующего на аллели DRB, с коэффициентом ω>1 ( dN / dS ; Yang and Bielawski, 2000) у всех видов копытных. . Байесовский анализ идентифицировал отдельные положительно выбранные сайты как совпадающие с сайтами PBR HLA- DRB1человека (Brown et al., 1993), и эти сайты в значительной степени совпадали у разных видов. На важную роль отбора также указывают очень высокие значения Sи S/ θ.(Таблица 3), полученная для всех видов, кроме лося. Заманчиво попытаться оценить относительную важность отбора, рекомбинации и мутации в создании разнообразия DRB, сравнивая значения S, ρи θ. Однако это проблематично по ряду причин, обсуждаемых ниже. Несмотря на это, относительное ранжирование S>ρ>θодинаково для всех видов, кроме лосей (которые, как известно, недавно подверглись серьезному затруднению), что позволяет предположить, что история большинства видов была сформирована аналогичным паттерном эволюционных процессов.

Эффекты демографической истории

Интерпретация этих результатов должна выполняться в контексте демографической истории каждого вида, поскольку изменения в размере популяции потенциально будут иметь важное влияние на величину оценок параметров и их взаимодействие. Копытные - большая и разнообразная группа млекопитающих, насчитывающая более 200 видов. Естественное распространение охватывает все континенты, за исключением Австралии и Антарктиды. Большинство копытных имеют полигинную систему спаривания, и самки обычно выращивают потомство в одиночку. Виды, включенные в это исследование, испытали ряд различных демографических историй, например, у буйволов, вероятно, была относительно стабильная большая популяция, в то время как альпийские горные козлы недавно испытали крайнее узкое место.Наблюдаемая нами картина вариации последовательностей согласуется с такими разными демографическими историями, о чем свидетельствуют заметные различия в нуклеотидном разнообразии и, в частности, молчащие вариации среди 15 изученных копытных (таблица 1), начиная отdS = 0,006 для альпийской серны до dS = 0,106 для водяного буйвола. Более того, у многих видов низкий уровень молчаливой изменчивости присутствует, несмотря на высокий уровень немолчной изменчивости, например, у пиренейского горного козла и белохвостого оленя. Такие паттерны могут возникать благодаря взаимодействию между уравновешивающим отбором и рекомбинацией во время и после узких мест в популяции, так как в комбинации эти процессы действуют для распределения немолочной вариации между аллелями более эффективно, чем тихая вариация. Schierup et al.(2001). В то время как как «тихая», так и «немая» вариация подвержена «узкому месту», «тихая вариация» с меньшей вероятностью будет отобрана и пройдет через сокращение популяции (Richman et al., 2003a), поскольку отбор будет отдавать предпочтение аллелям с функциональными различиями, а не «тихой вариации». . Таким образом, картина потери вариабельности гена DRBу альпийских горных козлов согласуется с серьезным узким местом, которое этот вид испытывал из-за чрезмерной охоты на протяжении 16 и 18 веков, вызывая резкое сокращение, которое привело вид к исчезновению (Maudet et al. др., 2002). Сравнительно низкие уровнивариации DRBкласса II по MHC были обнаружены у других видов жвачных животных, которые столкнулись с серьезными проблемами. Например, у арабского орикса ( Oryx leucoryxs), только три разных аллеля экзона 2 были идентифицированы в гомологичном локусе (Hedrick et al., 2000). У косули ( Capreolus capreolus) в выборках из Норвегии и Швеции было обнаружено только четыре аллеля, а у лосей из Северной Европы и Северной Америки было идентифицировано 10 различных аллелей экзона 2 DRB,вероятно, без скрытого разнообразия (Микко и Андерссон, 1995; Микко и др., 1999). Последнее исследование также показало, что овцебык ( Ovibos moschatus) и лань ( Dama dama) были практически мономорфными в ДРБ.локус. Однако такие низкие уровни разнообразия не являются репрезентативными для копытных животных, как и для других позвоночных, высокие уровни нуклеотидного разнообразия в MHC являются нормой (Mikko et al., 1999).

Ограничения текущих статистических методологий

Мы использовали сравнительный подход и попытались оценить эффективные масштабированные по размеру популяции параметры ( S, ρ, θ), которые количественно определяют разнообразие последовательностей из-за отбора, рекомбинации и мутации. Основная проблема с этими методами заключается в том, что, хотя они в настоящее время являются одними из наиболее изученных подходов, доступных в литературе, они основаны на важных предположениях, таких что ρявляется только оценкой абсолютной скорости рекомбинации популяции в отсутствие отбора, а Sявляется только оценкой абсолютного отбора популяции в отсутствие рекомбинации. Поэтому получение абсолютных оценок для каждого параметра под действием другого проблематично. Это усугубляется отсутствием методов оценки доверительных интервалов для этих параметров. Хотя это очень желательно, по крайней мере , для ρи θ, это неразрешимая проблема в рамках нынешней теоретической основы, используемой для их оценки (McVean et al., 2002). Кроме того, существует дополнительная сложность, заключающаяся в том, что эффективный размер популяции для большинства видов, вероятно, колебался. Следовательно, мы остаемся в положении, когда нелегко быть уверенным в точности абсолютногозначения наших оценок параметров. Однако результаты ряда симуляционных исследований (Satta, 1997; Fearnhead and Donnelly, 2001; Richman et al., 2003b; Smith and Fearnhead, 2005) показывают, что относительныезначения могут быть более устойчивыми к нарушениям модели, и именно они мы больше всего заинтересованы. Таким образом, мы утверждаем, что можем быть уверены в том, что существуют убедительные доказательства разнообразия последовательностей, формирующих селекцию и рекомбинацию, в генах DRBкопытных животных , что лучше всего может быть определено с помощью этих методов. С аналогичной осторожностью следует относиться к исследованиям других таксонов, которые могут быть подвержены таким ошибкам с помощью этих методов.

Влияние нарушения предположения модели на S, возможно, наименее изучено (Satta, 1997; Schierup et al., 2001), и различия в потенциальных смещениях, вероятно, возникнут в разных демографических историях. Во-первых, модель Takahata et al. (1992) имеет ряд ограничительных предположений, которые не обязательно удовлетворяются реальными данными, в частности, предположение о фиксированном количестве аллелей во времени. Модель также предполагает модель бесконечного аллеля, в которой мутация происходит посредством замены отдельных нуклеотидов, тогда как рекомбинация может генерировать аллели, которые различаются во многих положениях относительно родительских аллелей. Предубеждения в SЗатем может возникнуть эффект рекомбинации на количество сегрегационных аллелей в популяции и количество нуклеотидных различий между ними. Согласно модельным предположениям Takahata et al., количество аллелей в популяции должно быть приблизительно равно Kn , среднему количеству попарных несинонимичных различий в PBR между последовательностями (следовательно, Sможно аппроксимировать с помощью Kn, рассчитанного на основе данных). Однако имитационное исследование Satta (1997) показало, что рекомбинация может значительно увеличить количество аллелей в популяции ( n), уменьшая при этом Kn(поскольку рекомбинация в конечном итоге будет действовать для гомогенизации вариаций по длине последовательности). Вследствие этого рекомбинация может смещать Sвверх, если вычисляется непосредственно из n, но может немного смещать его вниз, если nоценивается из Kn . Этот эффект покажет сильную взаимосвязь с демографической историей, поскольку узкие места, в частности, могут иметь существенное влияние на количество аллелей и разнообразие последовательностей между ними. Если узкие места в сочетании с рекомбинацией устраняют синонимичные вариации в локусах при сбалансированном отборе (Schierup et al., 2001; Richman et al., 2003a), то в этих обстоятельствах Sможно было переоценить. Такая картина может быть видна в наших данных, где самые высокие значения S были получены для испанского козерога и альпийской серны, видов, которые, как известно, недавно испытали узкие места. Дополнительные источники ошибок проистекают из потенциальной неправильной идентификации сайтов PBR в этих таксонах, функциональной значимости несинонимичных вариаций за пределами PBR и отсутствия коррекции для множественных совпадений. Все это может потенциально привести к смещению Sвниз, так как они могут привести к недооценке Kn.. Рекомбинация также, вероятно, будет важным фактором при оценке величины положительного отбора, действующего на последовательность, и идентификации отдельных участков, подвергающихся отбору, с использованием филогенетических подходов максимального правдоподобия (Anisimova et al., 2003; Wilson and McVean, 2006). , как и в случае рекомбинации, в последовательности будет несколько эволюционных деревьев. Это может привести к смещению ωи ложные срабатывания для выбранных сайтов. При этом методы, использованные в настоящем исследовании, кажутся относительно надежными (Анисимова и др., 2003). В конечном итоге, хотя следует проявлять осторожность при оценке точности наших оценщиков отбора, тот факт, что сильные сигнатуры отбора получены с помощью различных методов, позволяет нам быть достаточно уверенными в том, что отбор был важным процессом в формировании изменчивости для этих последовательностей.

В недавнем имитационном исследовании Smith and Fearnhead (2005) оценили точность и надежность трех оценок скорости рекомбинации в масштабе популяции, в том числе рассчитанной LDhat. Они пришли к выводу, что, хотя абсолютные значения, вероятно, будут чувствительны к нарушениям стандартных предположений модели, относительные скорости рекомбинации были выведены достаточно хорошо. Хотя сценарий сбалансированного отбора не был включен в их исследование, они исследовали систематическую ошибку из-за выборочной развертки, обнаружив лишь слабое влияние на все три метода, при этом подход, использованный LDhat, показал смещение вверх примерно на 2%. Они также обнаружили, что существуют некоторые свидетельства того, что узкие места могут смещать оценки рекомбинации в сторону понижения примерно на 35–45%, а рост популяции может приводить к р.будет завышена на 10–30%. Эти демографические влияния кажутся правдоподобными, поскольку в популяциях с очень низким разнообразием рекомбинация с меньшей вероятностью приведет к появлению новых аллельных вариантов, чем в случаях, когда некоторые вариации сохраняются. Дальнейшее подтверждение надежности этого подхода к логическим выводам исходит из того факта, что значения ρ,полученные с помощью LDhat, оказались в сильном соответствии с оценками ρ,полученными в результате родословных исследований и экспериментов по типированию сперматозоидов (Myers et al., 2005). Таким образом, наши наблюдения значительных скоростей рекомбинации, вероятно, будут надежными, хотя опять же, абсолютные значения следует интерпретировать с осторожностью. Точно так же Фернхед и Доннелли (2001) продемонстрировали, что отношение ρ/ θтакже устойчив к нарушениям стандартной модели и должен быть менее чувствительным к вариациям N, что в некоторой степени подтверждает наше наблюдение о том, что в целом частота рекомбинации, вероятно, превысит частоту мутаций для копытных (хотя к абсолютным значениям следует относиться осторожно) и , следовательно, эта потенциально рекомбинация может играть более значительную роль, чем мутации, в создании аллельного разнообразия в локусах MHC для этих видов.

Очевидно, что в этой области необходим прогресс, и недавно Wilson и McVean (2006) сообщили о новом методе одновременной оценки ωи ρс использованием объединенной модели, реализованной в байесовской структуре. Их первоначальное применение этого метода к последовательностям для porB3, белка, который считается важным для патогенеза Neisseria meningitidis, по-видимому, имеет большой потенциал для преодоления многих из поднятых здесь проблем, но его общая полезность еще предстоит изучить. Однако объединение количественной интерпретации этой статистики с колебаниями демографии остается проблематичным.

ПОПУЛЯРНЫЕ СТАТЬИ