Séquences

author
1 minute, 13 seconds Read

Cette section affiche par défaut la séquence protéique canonique et sur demande toutes les isoformes décrites dans l’entrée. Elle comprend également des informations pertinentes sur la ou les séquences, notamment la longueur et le poids moléculaire.

La séquence protéique affichée par défaut est celle à laquelle se réfèrent toutes les annotations positionnelles. Nous l’appelons la séquence « canonique ».

Nous utilisons le code officiel à une lettre des acides aminés de l’UICPA. Pour les acides aminés sélénocystéine (Sec ; U) et pyrrolysine (Pyl ; O), nous suivons la nomenclature proposée.

Pour chaque isoforme, le nom de l’isoforme est fourni, ainsi que sa longueur et sa masse moléculaire en Daltons. La masse est calculée sur la base de la composition en acides aminés de la séquence entière. Elle ne tient pas compte des PTM, excluant ainsi toute transformation protéolytique.

La somme de contrôle de la séquence affichée est également indiquée. Actuellement, la somme de contrôle est une valeur CRC (Cyclic Redundancy Check) de 64 bits (‘CRC64’) basée sur un algorithme décrit dans la norme ISO 3309. Le polynôme générateur utilisé est x64 + x4 + x3 + x + 1 (voir référence). Bien qu’en théorie, deux séquences différentes puissent avoir la même valeur CRC64, la probabilité que cela se produise est extrêmement faible.

Similar Posts

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.