Esta secção mostra por defeito a sequência de proteínas canónicas e, a pedido, todas as isoformas descritas na entrada. Também inclui informações pertinentes à(s) seqüência(s), incluindo comprimento e peso molecular.
A seqüência proteica exibida por padrão é a seqüência proteica à qual toda anotação posicional se refere. Chamamos-lhe a sequência ‘canónica’.
Utilizamos o código oficial de uma letra do aminoácido IUPAC. Para os aminoácidos selenocisteína (Sec; U) e pirrolisina (Pyl; O), seguimos a nomenclatura proposta.
Para cada isoforma, o nome da isoforma é fornecido, bem como o seu comprimento e massa molecular em Daltons. A massa é calculada com base na composição de aminoácidos de toda a sequência. Ela não leva em conta os PTMs, excluindo assim qualquer processamento proteolítico.
O checksum da seqüência exibida também é dado. Actualmente o checksum é um valor CRC (Cyclic Redundancy Check) de 64 bits (‘CRC64’) baseado num algoritmo descrito na norma ISO 3309. O polinómio gerador utilizado é x64 + x4 + x3 + x + 1 (Ver referência). Embora em teoria duas sequências diferentes possam ter o mesmo valor CRC64, a probabilidade de isto acontecer é extremamente baixa.