Równania i analiza Hardy’ego-Weinberga
Zgodnie z zasadą Hardy’ego-Weinberga, zmienna p często reprezentuje częstość występowania określonego allelu, zwykle dominującego. Na przykład, załóżmy, że p reprezentuje częstość allelu dominującego, Y, dla żółtych strąków grochu. Zmienna q reprezentuje częstość allelu recesywnego, y, dla zielonych strąków grochu. Jeśli p i q są jedynymi dwoma możliwymi allelami dla tej cechy, to suma ich częstości musi się sumować do 1, czyli 100 procent. Możemy to również zapisać jako p + q = 1.Jeśli częstość allelu Y w populacji wynosi 0,6, to wiemy, że częstość allelu y wynosi 0,4.
Z zasady Hardy’ego-Weinberga i znanych częstości alleli możemy również wnioskować o częstościach genotypów. Ponieważ każdy osobnik posiada dwa allele na gen (Y lub y), możemy przewidzieć częstości tych genotypów za pomocą chi kwadrat. Jeśli dwa allele są losowane z puli genów, możemy określić prawdopodobieństwo każdego genotypu.
W przykładzie, nasze trzy możliwości genotypu są: pp (YY), produkując żółty groszek; pq (Yy), również żółty; lub qq (yy), produkując zielony groszek. Częstość występowania osobników homozygotycznych pp wynosi p2; częstość występowania osobników hereozygotycznych pq wynosi 2pq; a częstość występowania osobników homozygotycznych qq wynosi q2. Jeśli p i q są jedynymi dwoma możliwymi allelami dla danej cechy w populacji, te częstości genotypów będą sumować się do jednego: p2 + 2pq + q2 = 1.
W naszym przykładzie możliwe genotypy to homozygotyczny dominujący (YY), heterozygotyczny (Yy) i homozygotyczny recesywny (yy). Jeśli możemy obserwować tylko fenotypy w populacji, to znamy tylko fenotyp recesywny (yy). Na przykład, w ogrodzie 100 roślin groszku, 86 może mieć żółty groszek, a 16 zielony. Nie wiemy, ile z nich jest homozygotycznych dominujących (Yy) lub heterozygotycznych (Yy), ale wiemy, że 16 z nich jest homozygotycznych recesywnych (yy).
Więc, znając fenotyp recesywny, a tym samym częstotliwość tego genotypu (16 na 100 osobników lub 0,16), możemy obliczyć liczbę innych genotypów. Jeśli q2 reprezentuje częstość homozygotycznych roślin recesywnych, to q2 = 0,16. Ponieważ p + q = 1, to 1 – 0,4 = p, a więc wiemy, że p = 0,6. Częstość występowania homozygotycznych roślin dominujących (p2) wynosi (0,6)2 = 0,36. Na 100 osobników przypada 36 roślin homozygotycznie dominujących (YY). Częstość występowania roślin heterozygotycznych (2pq) wynosi 2(0,6)(0,4) = 0,48. Zatem 48 na 100 roślin jest heterozygotycznie żółtych (Yy).
.