Hardy-Weinberg-ligninger og analyse
I henhold til Hardy-Weinberg-princippet repræsenterer variablen p ofte hyppigheden af en bestemt allel, som regel en dominant allel. Antag f.eks. at p repræsenterer hyppigheden af den dominerende allel, Y, for gule ærtebælg. Variablen q repræsenterer hyppigheden af den recessive allel, y, for grønne ærtebælg. Hvis p og q er de eneste to mulige alleler for denne egenskab, skal summen af frekvenserne være lig med 1, dvs. 100 %. Vi kan også skrive dette som p + q = 1. Hvis hyppigheden af Y-allelen i populationen er 0,6, så ved vi, at hyppigheden af y-allelen er 0,4.
Fra Hardy-Weinberg-princippet og de kendte allelfrekvenser kan vi også udlede genotypernes hyppigheder. Da hvert individ bærer to alleler pr. gen (Y eller y), kan vi forudsige hyppighederne af disse genotyper ved hjælp af et chi kvadrat. Hvis to alleler trækkes tilfældigt fra genpuljen, kan vi bestemme sandsynligheden for hver genotype.
I eksemplet er vores tre genotypemuligheder: pp (YY), som giver gule ærter; pq (Yy), som også giver gule ærter; eller qq (yy), som giver grønne ærter. Hyppigheden af homozygote pp-individer er p2; hyppigheden af hereozygote pq-individer er 2pq; og hyppigheden af homozygote qq-individer er q2. Hvis p og q er de eneste to mulige alleler for en given egenskab i populationen, vil disse genotypers hyppigheder summere til én: p2 + 2pq + q2 = 1.
I vores eksempel er de mulige genotyper homozygot dominant (YY), heterozygot (Yy) og homozygot recessiv (yy). Hvis vi kun kan observere fænotyperne i populationen, så kender vi kun den recessive fænotype (yy). I en have med 100 ærteplanter kan der f.eks. være 86 med gule ærter og 16 med grønne ærter. Vi ved ikke, hvor mange der er homozygote dominerende (Yy) eller heterozygote (Yy), men vi ved, at 16 af dem er homozygote recessive (yy).
Derfor kan vi ved at kende den recessive fænotype og dermed hyppigheden af denne genotype (16 ud af 100 individer eller 0,16) beregne antallet af andre genotyper. Hvis q2 repræsenterer hyppigheden af homozygote recessive planter, så er q2 = 0,16. Derfor er q = 0,4. Fordi p + q = 1, så er 1 – 0,4 = p, og vi ved, at p = 0,6. Hyppigheden af homozygote dominerende planter (p2) er (0,6)2 = 0,36. Ud af 100 individer er der 36 homozygote dominerende (YY) planter. Hyppigheden af heterozygote planter (2pq) er 2(0,6)(0,4)(0,4) = 0,48. Derfor er 48 ud af 100 planter heterozygote gule (Yy).