Ta sekcja wyświetla domyślnie kanoniczną sekwencję białka, a na żądanie wszystkie izoformy opisane w danym wpisie. Zawiera również informacje odnoszące się do sekwencji, w tym długość i masę cząsteczkową.
Sekwencja białkowa wyświetlana domyślnie jest sekwencją białkową, do której odnoszą się wszystkie adnotacje pozycyjne. Nazywamy ją sekwencją „kanoniczną”.
Używamy oficjalnego jednoliterowego kodu aminokwasów IUPAC. Dla aminokwasów selenocysteiny (Sec; U) i pirolizyny (Pyl; O) stosujemy proponowaną nomenklaturę.
Dla każdej izoformy podajemy jej nazwę, a także długość i masę cząsteczkową w Daltonach. Masa obliczana jest na podstawie składu aminokwasowego całej sekwencji. Nie uwzględnia ona PTM, a więc wyklucza jakiekolwiek przetwarzanie proteolityczne.
Podawana jest również suma kontrolna wyświetlanej sekwencji. Obecnie suma kontrolna jest 64-bitową wartością CRC (Cyclic Redundancy Check) („CRC64”) opartą na algorytmie opisanym w normie ISO 3309. Zastosowany wielomian generatorowy to x64 + x4 + x3 + x + 1 (patrz odnośnik). Chociaż teoretycznie dwie różne sekwencje mogą mieć taką samą wartość CRC64, prawdopodobieństwo, że tak się stanie, jest bardzo małe.
.