Полногеномный анализ ассоциаций
Полногено́мный ана́лиз ассоциа́ций (ПГАА; англ. genome-wide association study, GWAS), тип исследований с применением генетических методов, направленный на анализ связи между участками генома организма [чаще всего, однонуклеотидных полиморфизмов (ОНП), различий в последовательности ДНК размером в один нуклеотид, в геноме человека] и какого-либо фенотипического признака (наличия заболевания, индивидуальных особенностей в интеллекте, размере мозга, весе, росте и т. п.).
Метод полногеномного анализа ассоциаций основан на анализе частоты встречаемости разных участков последовательности ДНК в вариабельной части генома групп, отличающихся по какому-то признаку. В отличие от более ранних методов ассоциации генетических и фенотипических характеристик (см., например, метод генов-кандидатов), где для анализа на основании имеющихся теоретических данных выбирался ограниченный участок ДНК (в первую очередь, конкретные гены с предполагаемыми биологическими функциями), метод полногеномного анализа предполагает одновременный поиск ассоциаций для большого диапазона последовательности ДНК, в первую очередь, с помощью применения специальных чипов с уже подобранными для анализа последовательностями. Несмотря на своё название («полногеномный»), метод не позволяет обеспечить поиск ассоциаций со 100 % генетической информации.
Термин «полногеномный анализ ассоциаций» в настоящее время относится к типу исследований, направленных на анализ взаимосвязи между значительным количеством генетической информации и каким-либо фенотипом. Наиболее распространены исследования, в которых сравнивается частота встречаемости ОНП у двух различающихся по какому-либо признаку групп (например, группа людей с определённым заболеванием и группа нормы), но существуют также исследования, в которых признак может широко варьировать у разных участников исследований (например, интеллект).
Активное развитие такого типа исследований стало возможным, во-первых, благодаря реализации в 2002 г. проекта «Геном человека», а во-вторых, благодаря существовавшему в 2002–2010 гг. проекту «Карта гаплотипов человека» (гаплотип – совокупность участков ДНК на одной хромосоме, которые обычно наследуются вместе; используются, например, для генеалогического анализа происхождения человека). В рамках этих двух проектов сначала был проведён анализ нуклеотидной последовательности ДНК человека, а затем положено начало анализу вариабельности участков ДНК у разных людей.
Несмотря на то что чаще всего метод полногеномного анализа ассоциаций применяется для оценки связи между фенотипом и набором ОНП, существуют вариации этого метода, основанные на анализе и других характеристик генома, например, анализе вариаций числа копий генов (copy number variation, CNV). Вне зависимости от конкретных деталей метода в конкретном исследовании, общей характерной чертой анализа полногеномных ассоциаций является одновременный анализ чрезвычайно большого количества участков ДНК (до сотен тысяч или даже миллионов участков), для каждого из которых независимо оценивается статистическая достоверность наличия ассоциации с фенотипом. Столь большое количество статистических тестов приводит к проблеме потенциального возникновения случайно значимых ассоциаций вследствие «множественных сравнений». Для того чтобы избежать этой проблемы, в исследованиях с применением метода полногеномного анализа ассоциаций требуются крайне значительные объёмы выборок, включающие в себя десятки и даже сотни тысяч человек. Одним из ответов на столь значительные требования к размерам выборок стало появление специализированных «биологических банков», включающих в себя популяционные данные, нередко собираемые централизованно на уровне государства. Наиболее масштабным биологическим банком, активно используемым сегодня в GWAS-исследованиях, является Биобанк Великобритании, содержащий данные о более чем полумиллионе человек.
Применение метода полногеномного анализа ассоциаций в психогенетике показало, что подавляющее большинство психологических признаков имеют сложную полигенную природу. Так, последние исследования генетических механизмов интеллекта на выборке из 270 тыс. человек выявляют 205 локусов (участков ДНК), связанных с различиями в интеллекте (Genome-wide association ... 2018).
При этом ни один из выявленных локусов не вносит решающий вклад в интеллект, все вместе они обладают аддитивным (суммирующимся) эффектом, суммарно объясняющим не более 7 % различий в интеллекте в целом. Для увеличения точности предсказания фенотипов на основании данных полногеномного анализа ассоциаций сегодня разрабатываются новые методы, например анализ полигенных индексов.
Первые результаты исследований с использованием метода полногеномного анализа ассоциаций опубликованы в 2002 г. и посвящены генетическим механизмам инфаркта миокарда (Functional SNPs ... 2002). Уже к 2010 г. исследования с применением метода полногеномного анализа ассоциаций составляли больше половины всех опубликованных исследований в одном из ведущих журналов в области генетики – Nature Genetics. К 2021 г. количество опубликованных подобных исследований превышает 3,5 тыс. (GWAS Catalog), и на сегодня этот метод является одним из наиболее частых как в психогенетике, так и в генетических исследованиях в принципе.
В первых исследованиях анализ ассоциаций производился приблизительно для 200 тыс. ОНП ДНК (92,788 ОНП в первом опубликованном исследовании, Functional SNPs … 2002). К настоящему моменту средний размер анализируемых последовательностей вырос до 2 млн. Однако, несмотря на рост количества ОНП для анализа, большинство исследуемых вариантов до сих пор относятся к распространённым полиморфизмам, т. е. к тем, частота встречаемости которых в популяции превышает 1 %. Ряд исследователей предполагает, что низкие предсказательные возможности метода полногеномного анализа ассоциаций в психогенетике связаны именно с отсутствием анализа «редких вариантов» (с частотой встречаемости менее 1 %).
Кроме проблемы распространённых и редких полиморфизмов важным ограничением метода полногеномного анализа ассоциаций является невозможность однозначно утверждать наличие причинно-следственной связи между последовательностью ДНК и фенотипом. Найденная ассоциация может быть следствием, например, близкого расположения разных участков ДНК, только один из которых связан с фенотипом непосредственно. Таким образом, для анализа причинно-следственных взаимоотношений необходимо применение других методов генетики.
Серьёзным недостатком метода также является тот факт, что найденные статистически значимые ассоциации могут оказываться вне функциональных участков ДНК (в первую очередь, генов), располагаясь в некодирующих участках генома. В таких случаях функциональное значение выявленной между ОНП и фенотипом ассоциации может оказываться неинтерпретируемым.
Несмотря на то, что метод полногеномного анализа ассоциаций имеет ряд ограничений, он является одним из самых важных методов современной генетики. Метод полногеномного анализа ассоциаций позволил получить данные о функциональном значении тысяч ОНП и успешно применяется при изучении генетических механизмов более чем 1800 заболеваний и фенотипических признаков. Активное применение метода полногеномного анализа ассоциаций – один из важнейших шагов на пути к персонализации как медицинских технологий, так и связанных с генетикой технологий в психологии и образовании.