Происхождение и когнитивные способности

[Перевод]: Global Ancestry and Cognitive Ability

Аннотация

Используя данные Philadelphia Neurodevelopmental Cohort, мы исследовали, предсказывала ли европейская родословная когнитивные способности и сверх этого — родительский социально-экономический статус (СЭС) и показатели цвета глаз, волос и кожи. Во-первых, используя мультигрупповой факторный анализ, мы проверили, что между самоидентифицированными африканцами и американцами европейского происхождения существует строгая факториальная инвариантность. Различия между этими группами, эквивалентные 14,72 IQ-пунктам, были в основном (75,59%) обусловлены различиями в общих когнитивных способностях - факторе g, что согласуется с гипотезой Спирмена. Мы обнаружили связь между европейской примесью и g. Эта связь существовала в образцах: (а) самоидентифицированных монорасовых афроамериканцев (B = 0,78, n = 2 179), (б) монорасовых афроамериканцев и мультирасовых афро-европейцев с добавлением контроля за самоидентифицированным мультирасовым статусом (B = 0,85, n = 2407), и (в) комбинированных европейских, афро-европейских и афро-американских участников с контролем за самоидентифицированной расой/этничностью (B = 0,75, N = 7 273). Контроль СЭС родителей незначительно ослабил эти отношения, в то время как в контроле измерений кожи, волос и цвета глаз это не наблюдалось. Далее мы проверили четыре набора полигенных показателей для оценки образовательного уровня (eduPGS). MTAG, мульти-признаковый анализ исследования геномных ассоциаций (GWAS) eduPGS (на основе 8442 накладывающихся друг на друга вариантов) предсказал g как в монорасовых афро-американской (r = 0.111, n = 2179, p < 0.001), так и у Европо-американской (r = 0.227, n = 4914, p < 0.001) подвыборках. Мы также обнаружили большие расовые различия для средних значений eduPGS (d = 1.89). Используя скорректированную по происхождению ассоциацию между MTAG eduPGS и g из монорасовой афро-американской выборки в качестве оценки межрасово-объективной достоверности eduPGS (B = 0,124), результаты показывают, что до 20%-25% расовой разницы в g может быть объяснено известными вариациями, связанными с когнитивными способностями. Более того, анализ показал, что eduPGS в значительной степени опосредовал ассоциации между когнитивными способностями и европейским происхождением в афро-американской выборке. Различия по субтестам, как влияния происхождения, так и eduPGS, практически идеально соответствуют g субтестам. Эта находка подтвердила влияние эффекта Дженсена на различия, связанные с происхождением. Наконец, мы подтвердили инвариантность измерений по всему диапазону европейского происхождения в комбинированной выборке с использованием моделирования локальных структурных уравнений. Результаты сходятся на генетике как на потенциальном частичном объяснение групповых средних различий в интеллекте.

Введение

Установлено, что европейско-американская (ЕА) и афро-американская (АА) популяции отличаются в среднем общей когнитивной способностью (или общим интеллектом, g) примерно на одно стандартное отклонение [1,2,3]. Это различие существует, несмотря на то, что наследственность интеллекта является одновременно высокой и практически одинаковой у европейского и афро-американского населения [4]. Аналогичным образом, общие и нераздельные относящиеся к окружающей среде компоненты отклонений g аналогичны в этих группах. Эти находки, в сочетании с другими (см., например, [2,5]), заставили некоторых предположить существование нетривиального генетического влияния на групповые различия в когнитивных способностях (например, [2,6,7,8,9]).

Исследователи разработали различные методы оценки причинно-следственной связи, лежащей в основе этих различий [10,11]. В качестве примеров можно привести исследования межрасовых усыновлений[12,13] (обзор см. в [14,15]), анализ дифференциальной регрессии к среднему значению [7,16,17], исследования гипотезы Спирмена [18,19,20], биометрическую декомпозицию среднегрупповых различий [2,21], исследования мультирасовых людей [11,22], а также различные внутри- и межнациональные сопоставления [8].

Некоторые исследователи предложили использовать анализ примесей(прим. Admixture analysis - это метод определения географического происхождения человека на основе анализа его генетического происхождения.) для оценки связи между генетическим происхождением и когнитивной способностью [10,23,24,25]. Предпосылкой такого подхода является то, что среди особей смешанной популяции, имеющих различные пропорции генетических предков, представители различных популяций будут более или менее похожи на представителей этих популяций, если они получат от них большую или меньшую долю своей генетической родословной. Эта простая генетическая модель предсказывает, что индивидуальное сходство с данной группой в различных значениях (например, рост, внешность, интеллект) будет являться функцией предков этого индивидуума, полученных от этой группы [24,26]. Когда наблюдается разница в уровне некоторой черты между группами, анализ примесей может дать косвенное доказательство того, что генетика играет роль в этой разнице.

В ряде более старых исследований была предпринята попытка оценить связь между родословной и когнитивными способностями у смешанных популяций. Однако в большинстве этих исследований использовались косвенные измерения происхождения, такие как самоотчеты, генеалогические записи или показатели, основанные на физических особенностях, таких как текстура волос или цвет кожи. Эти показатели не являются объективными или надежными индексами предков. Как таковые, они демонстрируют существенную погрешность измерений и, следовательно, могут давать неточные результаты. Это может быть особенно верно, когда меры основываются на фенотипических показателях предков, так как они путаются с потенциально предвзятыми переменными, такими как дискриминация или перекрестное сопоставление по определенным признакам [1,2,27].

Вышеуказанная проблема является общей для всех классических исследованиях примесей. Помимо неопределенности в отношении объема примеси, эти исследования, как правило, также страдают от небольших размеров выборки, отсутствия дублирования, явно непредставительной выборки и молодого возраста при оценке [28]. Вопрос о возрасте при оценке может быть весьма острым, поскольку одним из наиболее рельефно обоснованных выводов о поведенческой генетике интеллекта является то, что наследственность имеет тенденцию к увеличению с возрастом (это было названо эффектом Уилсона; [29]). С ростом наследственности факторы окружающей среды для таких признаков, как интеллект, имеют тенденцию становиться незначительными [30,31]. Если люди разных рас воспитываются в одинаковых условиях, обычно наблюдаемые различия в когнитивных способностях могут не проявиться до взрослого возраста из-за того, что эти общие условия маскируют их в детстве.

Сейчас доступны современные методы оценки примесей, основанные на ДНК, и с их помощью исследователи могут производить точные оценки индивидуального происхождения из многих различных групп. Анализ геномных примесей уже зарекомендовал себя как полезный метод исследования причин групповых различий по разным признакам. Например, Беккер и др. (2011) [32] установили, что среди центрально-африканских пигмеев примесь непигмеев ассоциируется с большим ростом. После того, как первоначальная связь между примесью и признаком окажется устойчивой, доступны другие методы, такие как локальное картирование примесей, для определения конкретных генов и механизмов, лежащих в основе групповых различий. Несколько авторов (см., Например, [33,34,35,36]) применили эти методы к пигмеям, обнаружив, что разница в росте пигмеев и непигмеев частично может быть связана со специфическими различиями в иммунном и нейроэндокринном функционировании.

Анализ добавок применялся ко многим другим признакам, включая диабет [37, 38, 39], гипертонию [40], адаптацию к большой высоте [41], астму [42], глубину сна [43], риск развития рака простаты [44, 45, 46, 47] и миому матки [48]. Эти исследования в целом обнаруживают, что примесь относится к исследуемому признаку сильнее остальных ковариат. Однако иногда включение предполагаемых ковариат — факторов окружающей среды, таких как диета или социально-экономический статус (СЭС), устраняет связь с родословной (например, [ 49]). Это говорит о том, что либо ковариаты среды опосредуют связи между происхождением и результатами, либо происхождение не является причинным коррелятом рассматриваемого признака, который на самом деле вызван чем-то другим. В конечном счете, один лишь контроль не может установить причинно-следственную связь [50].

Четыре известных нам исследования связывают генетически оцененное происхождение с когнитивными способностями в выборках афроамериканцев [24, 25, 51, 52]. Другие сделали это для латиноамериканцев [24 , 25] и различных групп в Латинской Америке [53, 54, 55]. Из них более ранние [51, 52, 53, 54] полагались на оценки происхождения, полученные из групп крови. Использование групп крови подвергалось критике на том основании, что они не могут надежно оценить происхождение [11 , 27].

Недавнее исследование Kirkegaard et al. [24] сосредоточили внимание на связи между генетическим происхождением и g. Авторы проанализировали набор данных Pediatric Imaging, Neurocognition, and Genetics (PING). Они обнаружили, что европейское происхождение было связано с g как среди самоидентифицированных африканцев, так и у испаноязычных американцев (соответственно, r = 0,20, N = 225; r = 0,23, N = 328; таблицы S10 – S11). Они оценили генетическое происхождение с помощью 15 000 SNP, что сделало их индекс очень надежным [56]. Происхождение объяснило как полный разрыв между афроамериканцами и американцами европейского происхождения, так и большую часть разрыва между латиноамериканцами и американцами европейского происхождения в g. Однако у анализа было несколько недостатков. Во-первых, он был основан на относительно небольших выборках. Во-вторых, наследственность g была неизвестна. Поскольку в выборку вошли дети (средний возраст 12 лет), анализ потенциально искажался эффектом Вильсона. В-третьих, строгая факторная инвариантность (SFI) не была установлена, поэтому нельзя однозначно сказать, что групповые различия в g были инвариантными при измерениях. (В наших дополнительных материалах мы показываем, что SFI вместе с сильной версией гипотезы Спирмена верна в данных PING) В-четвертых, выборка была географически рассредоточена. Такой географический разброс может привести к ложной корреляции между происхождением и когнитивными способностями [57], хотя расположение МРТ не повлияло на оценки. Наконец, как отмечают авторы, в исследование не было включено измерение цвета кожи, что открыло возможности для путаницы с дискриминацией по фенотипу.

Эти результаты были воспроизведены в предварительно зарегистрированном исследовании связи европейского происхождения с когнитивными способностями на выборке афро- и латиноамериканцев (r = 0,297, N = 193, [25]). Эта выборка состояла из взрослых и использовала 27 пунктов Международной группы ресурсов по когнитивным способностям [58] как показатель когнитивных способностей. Этот анализ также имел недостатки. Во-первых, это была относительно небольшая выборка людей, набранных онлайн через Qualtrics (онлайн-опросник), и участники самостоятельно сообщили о своей родословной (по оценке коммерческих служб тестирования ДНК, таких как Ancestry.com или 23andMe), что открывало возможности для ошибки и предвзятости в отчетах из-за различий в оценках примесей, полученных от разных компаний. Кроме того, СЭС не измерялся. Более того, как и в случае с Kirkegaard et al. [24], наследуемость в этом образце неизвестна, цвет кожи не измерялся, а образец был рассредоточен по географическому принципу.

Целью настоящего исследования является проведение анализа примесей, способного решить вышеупомянутые проблемы с предыдущими исследованиями. Мы ориентируемся на афроамериканцев и американцев европейского происхождения, потому что первые представляют собой население, в значительной степени смешанное со вторыми. Как правило, у афроамериканцев около 20% европейской ДНК [37, 59, 60, 61, 62]. При условии, что наша афроамериканская выборка достаточно вариабельна с точки зрения европейской примеси, мы должны быть в состоянии определить, существует ли связь между когнитивными способностями и примесью двух родительских популяций (то есть африканцев и европейцев) и, если да, то в какой степени генетическая примесь опосредует наблюдаемую среднюю разницу между группами. Более того, если выборки являются репрезентативными для соответствующих популяций (и статистической мощности достаточно), обнаружение отсутствия связи будет указывать на то, что эволюционно-генетическое объяснение разрыва маловероятно [26, 63].

В настоящей работе используется репрезентативная популяционная выборка из Philadelphia Neurodevelopmental Cohort (PNC), также известной как Complex Phenotypes study (TCP). Благодаря расположению результаты напрямую сопоставимы с результатами Scarr et al. [52]. Наш анализ имеет множество преимуществ по сравнению с более ранними исследованиями примесей. Во-первых, все участники прибыли из одного и того же места, поэтому географическое смешение не является проблемой. Во-вторых, мы оценили инвариантность измерений (MI) для батареи когнитивных тестов с использованием многогруппового подтверждающего факторного анализа (MGCFA; [64]). В-третьих, наследственность g-фактора и баллы по субтестам для этой выборки уже были оценены. В частности, Mollon et al. [65] сообщили о наследственности для g — 0,61 (стандартная ошибка (SE) = 0,14) и 0,72 (SE = 0,07) для неиспаноязычных африканцев и американцев европейского происхождения в этой выборке соответственно. В-четвертых, мы включили оценки цвета кожи, волос и глаз для оценки моделей фенотипической дискриминации (т. е. колоризма) наблюдаемых различий. В-пятых, мы проверили полигенные оценки (PGS), связанные с когнитивными способностями, как для афро-, так и для европейско-американских выборок, и исследовали, в какой степени PGS, связанный с когнитивными способностями и образованием (eduPGS), может объяснять групповые различия. В-шестых, мы проверили эффекты Дженсена в отношении происхождения, наследственности и eduPGS. В-седьмых, мы исследовали, был ли MI приемлемым для всего диапазона европейских предков, используя моделирование локальных структурных уравнений (LSEM).

Материалы и методы

Изначально исследование TCP было предназначено для оценки поведенческих параметров, прогнозирующих риск психических заболеваний [66, 67]. Общая выборка включает данные 9421 генотипированных участников, оцененных в основном с 2010 по 2013 год. Демографически выборка состояла из 51,7% женщин, 55,8% американцев европейского происхождения, 32,9% афроамериканцев и 11,4% других лиц со средним возрастом 14,2 (стандартное отклонение (SD) = 3,7) лет. Участники были набраны из Филадельфии. Лица с тяжелыми когнитивными или медицинскими нарушениями были исключены из окончательной выборки. Объектами исследования были англоговорящие люди в возрасте от 8 до 21 года на момент тестирования. Доступ к данным был получен через dbgap (phs000607.v3.p2).

Когнитивные способности

Участникам была представлена компьютерная нейрокогнитивная батарея Пенна (PCNB; [68]]). Эта батарея была создана, чтобы быть высоконадежной, психометрически устойчивой и включать задачи, связанные с конкретными системами мозга. PCNB состоит из 14 тестов, сгруппированных в пять широких поведенческих областей: исполнительный контроль, эпизодическая память, сложное познание, социальное познание и сенсомоторная скорость. В батарее используются следующие тесты: тест условного исключения Пенна (PCET; предназначен для оценки умственной гибкости), тест непрерывной производительности Пенна (PCPT; внимание), задача Letter N-Back (LNB; рабочая память), задача на запоминание слов (PWMT; вербальная память), задача на память на лица (PFMT; память на лица), тест на изучение визуальных объектов (VOLT; пространственная память), тест на вербальное мышление Пенна (PVRT; языковое мышление), тест на мышление по матрице Пенна (PMRT; невербальное рассуждение), Тест ориентации линии Пенна (PLOT; пространственные способности), Тест идентификации эмоций Пенна (PEIT;Идентификация эмоций), Тест дифференциации эмоций Пенна (PEDT; Emotion Differentiation), Тест моторной практики (MP; сенсомоторная скорость), постукивание пальцем (постукивание; сенсомоторная скорость) и тест на возрастную дифференциацию Пенна (PADT; возрастная дифференциация). Образец также прошел тест на достижения в широком диапазоне (WRAT), который является высоконадежным средством измерения широких возможностей [67].

Примерно 1,4% когнитивных данных отсутствовали. Мы исключили людей, у которых не было данных хотя бы по половине тестов (n = 115). Мы рассчитали значения для остальных случаев, используя IRMI (итеративный расчет на основе робастной модели) [69, 70]. В результате мы получили полные когнитивные данные для 3067 афроамериканцев и 5076 американцев европейского происхождения. Поскольку в данном исследовании мы рассматриваем только африканцев и американцев европейского происхождения, мы сообщаем результаты только для этих групп. Мы резидуализовали переменные когнитивного теста для возраста и пола, используя естественную сплайн-модель.

Чтобы гарантировать беспристрастность этой батареи, мы следовали теоретической конфигурации, описанной Муром и др. (2016) [68] и выполнили MGCFA [64, 71, 72], причем две наши группы являются самоидентифицирующимися американцами афро- и европейского происхождения. В качестве групповых факторов мы использовали исполнительное функционирование (EF), эпизодическую память (EM) и комплексное мышление (CR). Тестами, которыми мы проверяли эти факторы, были LNB, PCET, PCPT (EF), PFMT, PWMT, VOLT (EM), WRAT, PVRT, PLOT и PMAT (CR). В качестве альтернативы мы попытались использовать пятифакторную модель, но факторы социального познания (PEIT, PEDT, PADT) и сенсомоторной скорости (MP, Tap) имели низкие нагрузки и проблемы с идентификацией, поэтому мы удалили эти тесты.

Было обнаружено, что трехфакторная базовая модель хорошо подходит для обеих групп, а добавление бифактора g значительно улучшило соответствие модели. Для этой модели был найден SFI. Сильная и противоположная формы гипотезы Спирмена [2] были отвергнуты, но слабая модель хорошо соответствовала данным. Нашим ограничением при тестировании слабой модели было установление для среднего фактора эпизодической памяти значение 0, в то время как другие средние значения группового фактора были освобождены. Полученные средние различия представлены в таблице 1 .

Происхождение и когнитивные способности, изображение №1

Эти результаты согласуются с предыдущими анализами (например, [2, 73]) , в том , что существует почти одна d разница в когнитивных способностях между африканским и европейскими американцами, и что эта разница сосредоточена на g-факторе. Модель без ограничений для гипотезы Спирмена показывает, что (за вычетом g-фактора) существует преимущество афроамериканцев в исполнительной деятельности и эпизодической памяти. Это воспроизводит закономерности, обнаруженные в предыдущих исследованиях (например, [18, 73]). Более подробно результаты MGCFA обсуждаются в Дополнительных материалах. Для анализа примесей мы использовали g-баллы, поскольку различия были в основном связаны с этим фактором.

Социально-экономический статус родителей

В качестве меры CЭС нам было доступно только образование отцов и матерей. Мы кодировали образование родителей как среднее для каждого из них, оба с z-оценкой в первую очередь. Когда данные были доступны только от одного родителя, использовалось это значение. Затем окончательная оценка снова была оценена по z. Эта переменная использовалась в качестве контроля для СЭС в наших регрессиях примесей, но поскольку мы не смогли проанализировать различные показатели СЭС и извлечь более надежный индикатор [74 , контроль можно рассматривать только как частичный. При этом было обнаружено, что образование родителей более важно для формирования детского интеллекта, чем богатство [75]. Эффект СЭС как фоновой переменной в нашем MGCFA исследуется в наших дополнительных материалах.

Самоидентифицированная раса/этническая принадлежность (SIRE)

Субъекты выбрали свою самоидентифицированную расу/этническую принадлежность (SIRE) на основе вопросов «да/нет», в которых можно было выбрать несколько рас или этнических групп. Выбор был: черный или афроамериканец; Американский индеец или коренной житель Аляски; Азиат; Европейско-американский; Латиноамериканец/Испаноязычный; Коренной житель Гавайев/островов Тихого океана; Другой; и Недоступно/ожидает проверки. Мы кодировали американцев европейского происхождения в соответствии со стандартными процедурами: испытуемые, выбравшие только европейско-американский вариант и не сообщили, что являются латиноамериканцами. Афро-американцы были закодированы таким же образом. Наконец, мы закодировали субъектов, которые выбрали как европейцев, так и афроамериканцев как двухрасовых афро-европейско-американских (AA | EA). Затем мы отфильтровали субъектов с разными идентификациями, уменьшив размер выборки от начального N от 9496 до 8580. Среди включенных участников было 5183 американца европейского происхождения, 3155 афроамериканцев и 242 афро-европейца-американца двух рас.

Процент генетического происхождения

Satterthwaite et al. [76] описали генотипирование набора данных PNC. Вкратце, участники были генотипированы на шести различных массивах от двух разных производителей. Различные массивы охватывают разные варианты. Таким образом, необходимо было вменять их, чтобы получить большие, перекрывающиеся наборы однонуклеотидных полиморфизмов (SNP). Мы условно рассчитали набор данных с помощью Michigan Imputation Server (https://imputationserver.sph.umich.edu/index.html) с алгоритмом вменения Minimac3, 1000G Phase 3 v5 в качестве контрольной панели и Eagle v2.3 Phasing. Всего для анализа было доступно 15,5 млн вариантов. Чтобы сократить время вычислений, мы отфильтровали их по вариантам с частотой минорных аллелей (MAF) не менее 0,05 в интересующей подгруппе (т. е. Объединенной выборке европейцев и афроамериканцев). То есть мы выбрали только варианты, для которых вторые по частоте аллели встречались в популяции с частотой 0,05 или выше. Этот скрининг оставил 6,5M вариантов для вычисления процентов генетической родословной. Обратите внимание, что это было сделано только в контексте расчета баллов примесей. Мы не применяли фильтрацию по MAF при вычислении цветовых оценок, так как мы не хотели терять варианты, которые на них влияли. Эти операции были выполнены с использованием PLINK v1.90b6.8 [77]. Для оценки индивидуального глобального происхождения мы использовали ADMIXTURE версии 1.3.0 DH [78]. Поскольку нас интересовали только европейцы и афроамериканцы, мы запустили ADMIXTURE с k = 2 генетическими кластерами. У некоторых субъектов либо не было доступных генотипов, либо их данные не прошли контроль качества. Таким образом, окончательный размер выборки был уменьшен до 7399. В соответствии с предыдущими исследованиями (например, [59]), SIRE тесно связан с генетическим происхождением. Это можно увидеть на Рисунке 1, который показывает вероятность отождествления с определенной группой SIRE как функция европейской примеси.

Происхождение и когнитивные способности, изображение №2

Цвет кожи, волос и глаз

Данные не включали показатели внешнего вида, поэтому мы решили вменять их на основе генотипов. Для этого мы использовали веб-приложение HIrisPlex-S (https://hirisplex.erasmusmc.nl/ ). Это приложение было разработано Министерством юстиции США для использования в судебных расследованиях. Он рассчитывает вероятности цвета кожи, волос и глаз с высокой степенью точности на основе 41 SNP (с перекрывающимися вариантами: 6 для цвета глаз, 22 для цвета волос и 36 для цвета кожи). Этот инструмент был проверен на тысячах людей из разных регионов мира [79].

Мы фокусируемся на цвете кожи, поскольку теоретики колористов отдают предпочтение этому признаку (например, [80, 81]) и потому что мы смогли вычислить оценки цвета кожи для большей подвыборки, чем для цвета волос или глаз. HIrisPlex-S дает вероятности типа кожи по шкале Фитцпатрика (т. е. тип I, баллы 0–6, «самые бледные, с веснушками»; тип II, баллы 7–13; тип III-IV (комбинированный), баллы 14–27; тип V, 28–34 балла; Тип VI, баллы 35–36, «от темно-коричневого до темно-коричневого с глубокой пигментацией»). Мы взвешивали средний балл каждого типа (например, тип I = 3) по вероятности каждого типа, чтобы создать единую цветовую меру. К сожалению, из-за плохой маркировки соответствующих вариантов в некоторых из массивов, вмененные фенотипы были доступны только для подмножества данных (N = 7321 с когнитивными способностями и происхождением, по сравнению с N= 5533 с когнитивными способностями, происхождением и цветом кожи). По этой шкале более высокие баллы указывают на более темные цвета.

Корреляция между рассчитанной нами цветовой шкалой и европейским происхождением составила -0,87 для объединенной выборки (N = 5585) и -0,39 для выборки только афроамериканцев (N = 1557). На рисунке 2 показан график регрессии для цвета кожи и европейского происхождения с группами SIRE, отмеченными красным (афро-американцы), зеленым (двухрасовые афро-европейско-американские) и синим (европейско-американские). Корреляция, обнаруженная среди афроамериканцев, аналогична той, о которой сообщалось ранее (r 0,25–0,7; медиана: ~ 0,50) для афроамериканцев и других групп африканского происхождения [56, 61, 82, 83]. Кроме того, прогнозируемые значения цвета кожи совпадали с ожидаемыми значениями по шкале Фитцпатрика. Средний балл для американцев европейского происхождения составил 14,70, что поместило их в категорию III (т.е. иногда сгорает на солнце, равномерный загар), граничащую с категорией II (т.е. обычно сгорает на солнце, минимальный загар), а для афроамериканцев - 30,96, что поместило их в категорию категория V (очень редко сгорает на солнце, очень легко загорает).

Происхождение и когнитивные способности, изображение №3

Полигенные баллы, связанные с когнитивными способностями

Мы оценили геномы с помощью PLINK v1.90b6.8 [77] на основе результатов исследования общегеномных ассоциаций (GWAS) по уровню образования, описанных в Lee et al. [84]. Мы сконструировали четыре различных PGS на основе относительного компромисса между смещением распада дифференциального неравновесия (LD) и внутрипопуляционным сигналом. PGS «представляет собой совокупность, обычно в форме суммы, оцененных величин эффекта генетических вариантов в геноме» [85]. LD - это неслучайная ассоциация аллелей в разных локусах в конкретной популяции. Распад LD - это разрыв связи между расходящимися популяциями. Смещение распада LD - это смещение в PGS, которое рассчитывается на основе как причинных вариантов, так и вариантов, связанных с причинными и не причинными, из-за популяций, имеющих разные паттерны ассоциаций между вариантами и связями, которые находятся поблизости (или в связи).

Во-первых, мы использовали eduPGS со всеми вариантами, обученными без когорты 23andMe (n = 7 762 369 SNP, перекрывающихся в текущем наборе данных), чтобы построить предиктор с хорошей внутрипопуляционной достоверностью, но очень высоким смещением распада LD [86, 87]. Во-вторых, мы использовали мульти-признаковый анализ полногеномного исследования ассоциации (MTAG) eduPGS 10k SNP (n = 8442 перекрывающихся варианта), чтобы построить предиктор с хорошей внутрипопуляционной достоверностью, но с высокой систематической ошибкой распада LD. MTAG eduPGS были рассчитаны PGS с использованием MTAG. Это метод анализа статистики полногеномного ассоциативного исследования (GWAS) по различным, но генетически коррелированным признакам (например, образованию и интеллекту). В-третьих, мы использовали SNP отведения MTAG eduPGS для построения eduPGS с умеренной внутрипопуляционной достоверностью и смещением распада LD (n = 1558 перекрывающихся вариантов). Ведущие SNP - это те, которые имеют наиболее значительную связь с образованием/интеллектом в каждом кластере связанных с LD SNP. Причина в том, что, поскольку SNP с более низкими значениями p (т.е. более высокой статистической значимостью) с большей вероятностью являются причинно-следственными [88], и поскольку причинные SNP с большей вероятностью будут иметь трансэтническую валидность [86, 89], использование SNP с более высокой значимостью может повысить трансэтническую валидность eduPGS [90]. В-четвертых, мы использовали предположительно причинные варианты Lee и др. [84] для построения eduPGS с минимальным смещением распада LD и низкой внутрипопуляционной достоверностью (n = 111 перекрывающихся вариантов).

Результаты

Описательная статистика

В таблице 2 представлена описательная статистика для всех групп. AA | EAs были в основном европейцами (80%) по происхождению. Соответственно, они были ближе к EA по СЭС, g и цвету. Разница AA/EA в g составила d = 0,984 (IQ EA = 100 по сравнению с IQ AA = 85,28, с промежуточной оценкой для межрасовой группы 97,96), в то время как разница СЭС составила d = 0,99, а разница в цвете была d = 3,60.

Происхождение и когнитивные способности, изображение №4

Двумерные отношения между переменными

Корреляции между g, родительским СЭС, генетическим происхождением и группой SIRE показаны в Таблице 3 и Таблице 4 . Корреляции, как и ожидалось, основаны на когнитивных различиях и различиях СЭС между разными группами SIRE и сильной корреляции между генетическим происхождением и SIRE. Однако этот двумерный анализ не очень информативен, поскольку результаты смешиваются с негенетическими причинами, а переменные происхождения отрицательно коррелированы по замыслу, поскольку индивидуальное происхождение должно в сумме равняться единице. Связь между родительским СЭС и когнитивными способностями здесь, вероятно, сильнее, чем обычно сообщается (см. [91]; r = 0,29), потому что мы использовали образование обоих родителей и показатель скрытых когнитивных способностей, который уменьшает ошибку, которая обычно ослабляет силу этих отношений.

Происхождение и когнитивные способности, изображение №5

Происхождение и когнитивные способности, изображение №6

Корреляция между когнитивными способностями и цветом кожи и африканским происхождением наиболее высока в комбинированной выборке африканцев, афро-европейцев и европейцев-американцев, промежуточная в комбинированной моно- и двухрасовой выборке афро-американцев и самая низкая в монорасовой Афро-американском образце. Различие в величинах корреляций является результатом того, что первая выборка имеет наибольшее разнообразие предков, а последняя выборка - наименьшую. Эта разница в основном является статистическим артефактом ограничения диапазона, который ослабляет корреляции [92].

ПРОДОЛЖЕНИЕ