Această secțiune afișează în mod implicit secvența canonică a proteinei și, la cerere, toate izoformele descrise în intrare. De asemenea, include informații pertinente pentru secvența (secvențele), inclusiv lungimea și greutatea moleculară.
Secvența proteică afișată în mod implicit este secvența proteică la care se referă toate adnotările poziționale. Noi o numim secvența „canonică”.
Utilizăm codul oficial IUPAC de aminoacizi cu o literă. Pentru aminoacizii selenocisteină (Sec; U) și pirrolizină (Pyl; O), urmăm nomenclatura propusă.
Pentru fiecare izoformă, se furnizează numele izoformei, precum și lungimea și masa moleculară în Daltoni. Masa este calculată pe baza compoziției în aminoacizi a întregii secvențe. Ea nu ia în considerare PTM-urile, excluzând astfel orice procesare proteolitică.
Se indică, de asemenea, suma de control a secvenței afișate. În prezent, suma de control este o valoare CRC (Cyclic Redundancy Check) pe 64 de biți („CRC64”) bazată pe un algoritm descris în standardul ISO 3309. Polinomul generator utilizat este x64 + x4 + x3 + x + x + 1 (a se vedea referința). Deși, teoretic, două secvențe diferite ar putea avea aceeași valoare CRC64, probabilitatea ca acest lucru să se întâmple este extrem de redusă.
.