Tato sekce standardně zobrazuje kanonickou sekvenci proteinu a na vyžádání všechny izoformy popsané v záznamu. Obsahuje také informace vztahující se k sekvenci (sekvencím), včetně délky a molekulové hmotnosti.
Ve výchozím nastavení se zobrazuje proteinová sekvence, ke které se vztahují všechny poziční anotace. Nazýváme ji „kanonická“ sekvence.
Používáme oficiální jednopísmenný kód aminokyselin IUPAC. Pro aminokyseliny selenocystein (Sec; U) a pyrrolyzin (Pyl; O) se řídíme navrženou nomenklaturou.
Pro každou izoformu je uveden její název, délka a molekulová hmotnost v daltonech. Hmotnost je vypočtena na základě aminokyselinového složení celé sekvence. Nezohledňuje PTM, tedy vylučuje jakékoli proteolytické zpracování.
Uvádí se také kontrolní součet zobrazené sekvence. V současné době je kontrolním součtem 64bitová hodnota CRC (Cyclic Redundancy Check) („CRC64“) založená na algoritmu popsaném v normě ISO 3309. Použitý generátorový polynom je x64 + x4 + x3 + x + 1 (viz odkaz). Ačkoli teoreticky mohou mít dvě různé sekvence stejnou hodnotu CRC64, pravděpodobnost, že se tak stane, je velmi nízká.
.