Esta sección muestra por defecto la secuencia proteica canónica y, si se solicita, todas las isoformas descritas en la entrada. También incluye información pertinente a la(s) secuencia(s), incluyendo la longitud y el peso molecular.
La secuencia proteica mostrada por defecto es la secuencia proteica a la que se refiere toda la anotación posicional. La llamamos secuencia «canónica».
Utilizamos el código oficial de aminoácidos de la IUPAC de una letra. Para los aminoácidos selenocisteína (Sec; U) y pirrolisina (Pyl; O), seguimos la nomenclatura propuesta.
Para cada isoforma, se proporciona el nombre de la misma, así como su longitud y masa molecular en Daltons. La masa se calcula sobre la base de la composición de aminoácidos de la secuencia completa. No tiene en cuenta los PTM, por lo que excluye cualquier procesamiento proteolítico.
También se proporciona la suma de comprobación de la secuencia mostrada. Actualmente la suma de comprobación es un valor CRC (Cyclic Redundancy Check) de 64 bits (‘CRC64’) basado en un algoritmo descrito en la norma ISO 3309. El polinomio generador utilizado es x64 + x4 + x3 + x + 1 (Ver referencia). Aunque en teoría dos secuencias diferentes podrían tener el mismo valor CRC64, la probabilidad de que esto ocurra es extremadamente baja.