PMC

author
17 minutes, 12 seconds Read

Main Text

A hajmorfológia az emberi variáció egyik legszembetűnőbb jellemzője, és különösen változatos az európai felmenőkkel rendelkező emberek körében, akiknek körülbelül 45%-a egyenes, 40%-a hullámos és 15%-a göndör hajú.1 A göndörség mértéke a hajkeratinok eloszlásával és a hajszálon belüli sejttípussal korrelál, a mezokortikális sejtek száma a göndörség fokozódásával csökken.2 A közelmúltban végzett vizsgálatok az EDAR és FGFR2 gének ázsiai specifikus alléljait azonosították, amelyek a sűrű, egyenes hajhoz társulnak, ami arra utal, hogy ezek a változatok az ázsiaiak és az európaiak divergenciája után keletkeztek.3,4 Az európaiak hajának göndörségét (amelyről kimutatták, hogy nagymértékben öröklődik5 ) befolyásoló genetikai változatok azonban nem ismertek.

Genom-széles körű asszociációs elemzéseket végeztünk három ausztrál családi mintán: egy serdülő ikerpárokból és testvéreikből álló mintán (1649 egyén 837 családból) és két felnőtt ikerpárokból álló mintán (S1, 1945 egyén 1210 családból; S2, 1251 egyén 845 családból), amelyeket az általános populációból állapítottunk meg (1. táblázat).5 A serdülő mintában a haj göndörségét egy hárompontos skálán (egyenes, hullámos vagy göndör) értékelték. A felnőtt mintákban a résztvevők arról számoltak be, hogy a hajuk egyenes vagy göndör (S1) vagy egyenes, hullámos vagy göndör (S2). A fenotípusgyűjtés és a minták életkora közötti különbségek figyelembevétele érdekében minden mintát függetlenül elemeztek, és a három eredménycsoport kombinálásához metaanalízist alkalmaztak. Ezeket a vizsgálatokat a megfelelő etikai bizottságok jóváhagyásával és az összes résztvevő tájékozott beleegyezésével végeztük.

A jelenlegi vizsgálatban használt genotípusos adatok egy nagyobb genotipizálási projektből származnak, amely hét genotipizálási hullámot foglalt magában, és amely az 1988-as és 1990-es felnőtt egészségügyi és életmódvizsgálataink6 , valamint a serdülőkori melanoma kockázati tényezőit vizsgáló tanulmányunk7,8 résztvevőit vonzotta.7,8 Az egyes projektek genotípusos adatait a 2. táblázat tartalmazza. Az egyes projektek genotipizálási adataira szabványos minőségellenőrzési szűrőket alkalmaztunk, amelyek az imputálást a magas adatminőségű mintákra és SNP-kre korlátozták (2. táblázat). Az egyéneket nem európai származás szempontjából is átvilágították, ami egy 16 140 genotipizált egyedből álló mintát eredményezett (S2. ábra, online elérhető). Annak érdekében, hogy az imputált adatokba ne kerüljön torzítás, a hét részmintában közös SNP-ket használtak az imputáláshoz (n = 274 604). Az imputálást az európai felmenőkkel rendelkező HapMap-mintákból (CEU; 36. építés, 22. kiadás) és a MACH-ból származó szakaszos adatok felhasználásával végeztük el.9

2. táblázat

A genotipizálás hét hullámára vonatkozó összefoglaló információk és a végzett minőségellenőrzés

Human610-Quad Human610-Quad Human610-Quad

1. projekt: ALCO CIDR Projekt 2: ALCO deCODE Projekt 3: MIG deCODE Projekt 4: EUTWIN Projekt 5: ADOL deCODE Projekt 6: GL_CIDR Projekt 7: WH deCODE
Primer fenotípus Alkoholfogyasztás (lakossági minta) Alkoholfogyasztás (lakossági minta) Migraine (eset/kontrol minta) Lipidszint (lakossági minta) Melanoma kockázati tényezők (lakossági minta) Glaukóma. (populációs minta) Női egészség (eset/kontroll minta)
Genotipizáló labor CIDR deCODE deCODE deCODE University of Helsinki deCODE CIDR deCODE
Illuminia SNP platform HumanCNV370…Quadv3 HumanCNV370-Quadv3 Human610-Quad Human 317K
Nem. genotipizált minták száma 4241 2611 999 462 4391 657 2360
No. genotipizált SNP-k száma 343,955 344,962 592,385 318,210 592,392 589,296 562,193
BeadStudio GenCall score < 0.7 24,494 27,459 46,931 NAa 47,418 36,877 57,589
SNP-k hívási arány < 0.95 11,584 7537 8038 5021 8447 12,455 33,459
SNPs with HWE failure p < 10-6 4318 1194 1221 67 2841 15,474 1763
SNP-k MAF < 0.01/ csak 1 megfigyelt allél 7874 8976 33,347 264 33,347 28,607 24,509
Nem. SNP-k száma a QC után 323093 321,267 530,922 312,937 529,379 531,042 518,948
A genotipizált SNP-k százalékos aránya 93.93% 93,13% 89,62% 98,34% 89,36% 90,11% 92,31%

Minden projekt esetében a DNS kivonása a standard protokolloknak megfelelően történt. A projekteken belül a résztvevők genotipizálása az Illumina 317K, 370K vagy 610K SNP platformokon történt, és a genotípusokat az Illumina BeadStudio szoftverrel hívták le. Az egyes projektek minőségellenőrzése (QC) után a genotipizálás hét hullámából származó adatokat integrálták. Amint az S1. ábrán látható, számos minta duplikálódott a különböző genotipizálási projektek között, ami lehetővé tette a projektek közötti minőségellenőrzést. Az adathalmazok integrálása után az adatokat az egyéneken belüli hiányosságok (>5%, figyelembe véve az egyes egyedeknél genotipizált SNP-k számát), a törzskönyvi és nemi hibák, valamint a mendeli hibák (a hibák észlelésekor egy adott SNP esetében az összes családtag genotípusát eltávolítottuk) szempontjából vizsgáltuk. A QC után azokban az esetekben, amikor egy monozigóta ikerpárból az egyik egyedet genotipizálták, a nem genotipizált ikerpárhoz duplikált genotípusokat rendeltek, ami 16 507 egyedből álló mintát eredményezett. A nem európai származás szűrése után (S2. ábra) ez egy 16 140 egyedből álló végső mintát eredményezett. A HWE a Hardy-Weinburg-egyensúlyt jelöli.

aGenCall-adatok nem álltak rendelkezésre ehhez a mintához.

Az ordinális skálán rendelkezésre álló információk teljes körű kihasználása érdekében az adatokat egy multifaktoriális küszöbmodell segítségével elemeztük, amely a diszkrét tulajdonságokat úgy írja le, mint amelyek a felelősség (vagy hajlam) mögöttes normális eloszlását tükrözik. A hajlam, amely az összes multifaktoriális hatás összegét jelenti, feltételezhetően nagyszámú, egyenként kis hatású gén és környezeti tényező együttes additív hatását tükrözi, és fenotípusos diszkontinuitások jellemzik, amelyek akkor jelentkeznek, amikor a hajlam elér egy adott küszöbértéket.10 A teljes asszociációs tesztet használtuk, amelyben az egyes SNP-k dózisadatait (MACH mldózis) sorban bevontuk a küszöbmodellbe, ami egy additív asszociációs tesztet eredményezett. Ezenkívül a nem és az életkor fix hatásait (lineáris és kvadratikus hatásokat egyaránt), valamint az életkor és nem közötti kölcsönhatásokat minden adatelemzésben a küszöbmodellel együtt szerepeltettük, úgy, hogy az i családból származó j egyén tulajdonságértékét a következőképpen paramétereztük: xij = βdózis + βkor + βkor2 + βszex + βszex-kor + μ. A résztvevők közötti rokonságot explicit módon modelleztük, figyelembe véve a rokon párok nemét, és a fenotípusos varianciákat egységre korlátoztuk. Az asszociációs teszt statisztikáját az adott SNP hatását tartalmazó teljes modell illeszkedésének (mínusz kétszeres log-likelihood) és egy olyan beágyazott modell illeszkedésének (mínusz kétszeres log-likelihood) összehasonlításával számították ki, amelyben az SNP hatását kihagyták a modellből. A log-likelihoodok különbsége aszimptotikus chi-négyzet eloszlást követ, amelynek szabadságfoka megegyezik a két modell becsült paramétereinek különbségével (ebben az esetben egy). A három minta genomikus inflációs faktorai 0,98 és 1,02 között mozogtak (S3 ábra), ami azt jelzi, hogy a teszt helyesen kontrollálta a résztvevők rokonságát, és hogy az esetleges technikai és rétegződési artefaktumok elhanyagolható hatással voltak az eredményekre.

Négy erősen korrelált egynukleotid-polimorfizmus (SNP) (rs17646946, rs11803731, rs4845418, rs12130862; r2 > 0,8, D′ > 0,95 a HapMap CEU mintán belül) az 1q21 kromoszómán.3 (1B ábra) elérte a genom-szerte alkalmazott 5 × 10-8-as szignifikancia küszöbértéket, amely ∼1 millió független közös variánst korrigál a genomban11 (3. táblázat, S4 ábra). Az asszociáció mindhárom mintában megtalálható volt, ami arra utal, hogy a hatás robusztus a minták közötti életkori különbségekkel szemben, és hogy a felelősségi küszöbmodell figyelembe vette a minták fenotípusos meghatározásának különbségeit. A három minta meta-analízise N (egyénekkel) súlyozott elemzéssel a Metalban (lásd Webes források) rendkívül szignifikáns p-értékeket eredményezett azon SNP-k esetében, amelyek ebben a régióban találhatók, és a közvetlenül genotipizált SNP rs17646946 által megjelölt haplotípusra esnek (p = 1,5 × 10-31) (1A. és 1B. ábra, 3. táblázat). Az 1q21.3 régióban az asszociáció a TCHH trichohyalin génre összpontosul, és a variancia ∼6%-áért felelős (1E ábra, 3. táblázat). A további elemzés azt mutatta, hogy a haplotípus szintű asszociáció nem nyújtott további előrejelző erőt. A legjobb SNP-k kovariátorként való bevonása az elemzésekbe nem eredményezett további bizonyítékot az asszociációra, teljes mértékben figyelembe véve a jelet ezen a lókuszon (S5. ábra). Nem találtunk bizonyítékot sem az episztázisra ezen SNP-k és bármely más SNP között a genomban, sem a nemek közötti heterogenitásra (S5. és S6. ábra). Végezetül, bár a serdülő mintában a régió egészére kiterjedő kópiaszám-változás (CNV) elemzése 18 egyednél talált bizonyítékot CNV-re, ez túl ritka volt ahhoz, hogy megmagyarázza a megfigyelt hatást (S2. táblázat). Az S3. táblázat felsorolja az összes olyan SNP-t, amelyek együttes p-értéke 1 × 10-5-nél kisebb volt a metaanalízisben. A 4q21.21-es kromoszómán egy második szuggesztív asszociációs régiót figyeltek meg (rs1268789; p = 6,58 × 10-8), amelynek középpontjában a Fraser-szindróma 1 gén, a FRAS1 áll. A metaanalízisen belül megvizsgáltuk a Fujimoto és munkatársai által közzétett 170 jelölt gént tartalmazó listára4 vonatkozó asszociációs bizonyítékokat is (S4. táblázat). A TCHH régióban megfigyelt asszociáción kívül erős asszociációs jeleket figyeltünk meg a WNT10A-ban, amely az odonto-onycho-dermális diszpláziához társul, amelyet száraz haj és az ektodermális fenotípusok széles skálája jellemez12 (2q35; rs7349332; p = 1.36 × 10-6).

Genomszintű asszociációs eredmények

(A) Manhattan-diagram, amely a hajmorfológiára vonatkozó genomszintű metaanalízis eredményeit mutatja három független mintán keresztül. A p < 10-5 értékű SNP-k zölddel vannak kiemelve.

(B) Az 1. kromoszóma kariotípusa, kiemelve az 1q21 régiót.

(C) Az 1q21 régió regionális asszociációs és kapcsolati egyensúlyi diagramja. A leginkább asszociált genotipizált SNP kék színnel látható, a többi marker színe pedig az egyes panelekben a legfelső SNP-vel való kapcsolódási egyensúlyt (r2) tükrözi (a növekvő r2-vel növekvő vörös árnyalat társul). A rekombinációs ráta (jobb oldali y-tengely) világoskék színnel van ábrázolva, és a CEU HapMap-populáción alapul. Az egyes gének exonjait függőleges sávok ábrázolják, a 2006. márciusi UCSC Genome Browser assembly alapján rendelkezésre álló összes izoforma alapján.

(D) A TCHH SNP rs11803731 minor allélfrekvenciája a Human Genome Diversity Project alapján.29

(E) Az egyenes (narancssárga sávok), hullámos (zöld sávok) és göndör (kék sávok) haj gyakorisága az rs11803731 genotípus függvényében egy nem rokon egyénekből álló mintában (n = 43; n = 493; n = 1132). Több T alléllal nő az egyenes haj aránya. A függőleges sávok a prevalenciára vonatkozó 95%-os konfidenciaintervallumoknak felelnek meg.

3. táblázat

A genomszerte szignifikáns SNP-k részletei az 1q21.3 régióban a három mintában

Allelikus hatás (β)a 0.50

Allelikus hatás (β)a

Minták közötti átlagolt magyarázott varianciab

rs17646946 rs11803731 rs4845418 rs12130862
Pozíció (bp) 150,329,391 150,349,949 150,402,854 150,293,639
Genotipizált vagy imputált genotipizált imputált imputált imputált
Minor (referencia) allél A T C T
Major allél G A G A
Minor allél gyakorisága 18.3% 18,4% 17,3% 18,1%
Hardy-Weinburg egyensúly p értéke 0.73 0,75 0,70 0,79
Rsq (imputációs pontossági metrika) 0.92 0.96 0.98
Adolescent sample (n = 1649)
Allelikus hatás (β)a 0.41 0,42 0,42 0,39
P-érték 1,24 × 10-11 1,76 × 10-11 3,68 × 10-11 7.59 × 10-11
Felnőtt S1 (n = 1945)
0,50 0,49 0,45
P-érték 8,18 × 10-13 2,51 × 10-12 2,22 × 10-11 9.69 × 10-11
Felnőtt S2 (n = 1251)
0.44 0,44 0,43 0,42
P-érték 7,91 × 10-11 1,37 × 10-10 1,15 × 10-9 8.16 × 10-10
Minták közötti számítások
6.11% 6.11% 5.79% 5.22%
Meta analízis (p érték) 1.50 × 10-31 3.18 × 10-31 4.43 × 10-29 3.12 × 10-28
aAz itt közölt allél β-t a felelősségi küszöbmodellre való hivatkozással kell értelmezni, amely az adatokat egy standard normális eloszlásra képezi le, amelyben a kategóriák közötti vágási pontok a z-eloszlásra vannak leképezve. Például egy 0,41-es β azt jelenti, hogy az egyenes és a hullámos kategóriákat elválasztó küszöb 0,41 z egységgel jobbra tolódik minden egyes kockázati allél esetében, amellyel az egyén rendelkezik.
b β2-ként számítva, amelyben p a kisebb allélfrekvencia és β az additív allélhatás.

Az 1q21 régióban található négy leginkább asszociált SNP közül az rs11803731-re (p = 3,2 × 10-31) összpontosítottunk, mivel ez a TCHH harmadik exonjában található kódoló, nem szinonim variáns (bár további munkára van szükség annak megerősítéséhez, hogy ez az oksági variáns). Az rs11803731 T allélja a származtatott állapot, és feltűnő földrajzi specifitást mutat Európára és Nyugat-Közép-Ázsiára, a legnagyobb gyakoriságot az észak-európaiak körében éri el (1E ábra), ami arra utal, hogy a variáns valahol ebben a széles régióban keletkezett. A de novo mutációk modernkori gyakoriságát és eloszlását általában a véletlenszerű genetikai sodródás és a migráció határozza meg. Mivel azonban az rs11803731 egy jól látható fenotípust befolyásol, intuitív módon nyilvánvaló célpontja a természetes vagy szexuális szelekciónak.13 A hajvastagságot szabályozó EDAR gén a pozitív szelekció egyik legmeggyőzőbb jelét mutatja a kelet-ázsiai genomban.4 Az rs11803731 az európaiak és más Hapmap II populációk között a genomban a 2,5% legjobban differenciált SNP-k között van (az FST-alapú lokusz-specifikus ághossz-teszt14 alapján mérve). Bár a Human Genome Diversity Project (HGDP) kohorszban a kiterjesztett haplotípusok homozigozitási mintázatának korábbi elemzése szintén a genetikai stoppolás előzetes bizonyítékát mutatja az 1q21.3 régió genetikai stoppolására néhány európai populációban (hivatkozás 15 és S7. ábra), a szelekció általános bizonyítéka nem egyértelmű. Az egyes lokuszokon történő pozitív szelekció jelenlegi tesztekkel kimutatott genetikai jelei azonban a szelekciós esemény időzítésétől, erősségétől, a régió genomikai jellemzőitől és a szóban forgó fenotípus genetikai architektúrájától (az okozó lokuszok száma, gyakorisága és hatásmérete) függően változnak16 , és így nem biztos, hogy olyan nyilvánvalóak, mint az egyéb felszínes tulajdonságokkal kapcsolatosak. Például az OCA2 gén régiója a szelekció jól ismert célpontja17 , és ismert, hogy befolyásolja az emberi pigmentációs tulajdonságokat, különösen a szemszínt.18,19

Az rs11803731 variáns hatását – a TCHH fehérje 790-es pozíciójában egy leucin metioninnal való cseréjét – in silico elemzésekkel jósolták meg a PolyPhen20 és a PMut programokkal.21 A PolyPhen az L790M változást “jóindulatúnak”, míg a PMut “semlegesnek” jósolta. Más előrejelző programok, köztük a SIFT22 (lásd Webes források) (akár az SNP azonosítóját, akár a felhasznált fehérjeszekvenciát) és az SNPs3D23 (lásd Webes források), amely nem tartalmazott adatot az rs11803731 SNP-ről, nem adtak vissza eredményt. Az ilyen előrejelzések nem zárják ki a funkcionális szerepet, mivel az SNP hatása inkább szabályozó, mint strukturális lehet, különösen mivel az aminosavcsere az α-hélix régiókon kívül esik.23 A felületen exponált metioninokat poszttranszlációsan oxidálhatják a reaktív oxigénfajok, ami, ha nem javítják, a fehérje szerkezetének és aktivitásának megváltozását eredményezheti, és a fehérje megváltozott szabályozásához vezethet.24

Alternatívaként az rs11803731 strukturális variációhoz is társulhat. A TCHH egy egyszálú α-hélix fehérje, fajonként két vagy három erősen ismétlődő régióval (S8. ábra). Juhban a referenciafehérje (CAA79165.1) 1549 aminosav hosszú, de a C-terminális ismétlődő régióban a teljes és részleges ismétlődések számában a különböző törzsekben eltérés tapasztalható.25,26 A humán TCHH fehérjében az ismétlődések hossza körülbelül 6 és 30 aminosav között mozog, ami 18 és 90 bp DNS-szekvenciának felel meg. Számos SNP és inszerciós vagy deléciós polimorfizmus van jelen, különösen az első és a harmadik ismétlődő régióban (dbSNP; lásd webes források), és ez a gén tartalmazhat allélhossz-variánsokat, ahogyan azt juhoknál és egy másik, az emberi kromoszóma 1p21 régiójában található, erősen ismétlődő génnél, az involukrin (IVL) esetében is megfigyelték, ahol az allélok az emberi populációk között mind a rövid tandem ismétlődések számában, mind az ismétlődő szekvencián belüli egybázisú változásokban különböznek27,28. A TCHH esetében ilyen hosszváltozást nem jelentettek, és kísérletileg még meg kell határozni, hogy ez a variáció gyakori-e, befolyásolja-e a fehérje szerkezetét vagy hosszát, és/vagy az ismétlődő régiókat flankáló SNP-k jelölik-e.

Végeredményben egy olyan kvantitatív tulajdonságlokuszról számolunk be, amely befolyásolja a haj formáját az európaiaknál. Az asszociáció a hajmorfológia varianciájának ∼6%-áért felelős ebben a csoportban, és a Trichohyalin génre esik, amelynek ismert szerepe van a hajképzésben. Az allélfrekvenciák mintázata szembetűnő, e változatok legnagyobb gyakorisága az észak-európaiaknál figyelhető meg (1. ábra), párhuzamosan az ázsiai populációkban az egyenes hajú EDAR-változat megfigyelésével (S9. ábra).

Similar Posts

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.