Sequenties

author
0 minutes, 54 seconds Read

In dit gedeelte wordt standaard de canonieke eiwitsequentie weergegeven en op verzoek ook alle isovormen die in de ingang worden beschreven. Het bevat ook informatie over de sequentie(s), zoals lengte en moleculair gewicht.

De standaard weergegeven eiwitsequentie is de eiwitsequentie waarnaar alle positionele annotatie verwijst. We noemen dit de ‘canonieke’ sequentie.

We gebruiken de officiële IUPAC aminozuur één-letter code. Voor de aminozuren selenocysteïne (Sec; U) en pyrrolysine (Pyl; O) volgen we de voorgestelde nomenclatuur.

Voor elke isovorm wordt de naam van de isovorm gegeven, alsmede de lengte en de molecuulmassa in Daltons. De massa wordt berekend op basis van de aminozuursamenstelling van de gehele sequentie. Er wordt geen rekening gehouden met PTM’s, zodat proteolytische bewerking wordt uitgesloten.

De checksum van de weergegeven sequentie wordt ook gegeven. Momenteel is de controlesom een 64-bits CRC-waarde (Cyclic Redundancy Check) (“CRC64”), gebaseerd op een algoritme dat in de ISO 3309-norm wordt beschreven. De gebruikte generatorpolynoom is x64 + x4 + x3 + x + 1 (zie referentie). Hoewel in theorie twee verschillende sequenties dezelfde CRC64-waarde zouden kunnen hebben, is de kans dat dit zou gebeuren uiterst gering.

Similar Posts

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.