Sequências

author
1 minute, 0 seconds Read

Esta secção mostra por defeito a sequência de proteínas canónicas e, a pedido, todas as isoformas descritas na entrada. Também inclui informações pertinentes à(s) seqüência(s), incluindo comprimento e peso molecular.

A seqüência proteica exibida por padrão é a seqüência proteica à qual toda anotação posicional se refere. Chamamos-lhe a sequência ‘canónica’.

Utilizamos o código oficial de uma letra do aminoácido IUPAC. Para os aminoácidos selenocisteína (Sec; U) e pirrolisina (Pyl; O), seguimos a nomenclatura proposta.

Para cada isoforma, o nome da isoforma é fornecido, bem como o seu comprimento e massa molecular em Daltons. A massa é calculada com base na composição de aminoácidos de toda a sequência. Ela não leva em conta os PTMs, excluindo assim qualquer processamento proteolítico.

O checksum da seqüência exibida também é dado. Actualmente o checksum é um valor CRC (Cyclic Redundancy Check) de 64 bits (‘CRC64’) baseado num algoritmo descrito na norma ISO 3309. O polinómio gerador utilizado é x64 + x4 + x3 + x + 1 (Ver referência). Embora em teoria duas sequências diferentes possam ter o mesmo valor CRC64, a probabilidade de isto acontecer é extremamente baixa.

Similar Posts

Deixe uma resposta

O seu endereço de email não será publicado.