Sekvenser

author
0 minutes, 56 seconds Read

Detta avsnitt visar som standard den kanoniska proteinsekvensen och på begäran alla isoformer som beskrivs i posten. Det innehåller också information om sekvensen/sekvenserna, inklusive längd och molekylvikt.

Proteinsekvensen som visas som standard är den proteinsekvens som alla positionsangivelser hänvisar till. Vi kallar den den ”kanoniska” sekvensen.

Vi använder IUPAC:s officiella enbokstavskod för aminosyror. För aminosyrorna selenocystein (Sec; U) och pyrrolysin (Pyl; O) följer vi den föreslagna nomenklaturen.

För varje isoform anges namnet på isoformen samt dess längd och molekylmassa i Dalton. Massan beräknas på grundval av aminosyrasammansättningen för hela sekvensen. Den tar inte hänsyn till PTM, vilket utesluter eventuell proteolytisk bearbetning.

Kontrollsumman för den visade sekvensen anges också. För närvarande är kontrollsumman ett 64-bitars CRC-värde (Cyclic Redundancy Check) (”CRC64”) baserat på en algoritm som beskrivs i ISO 3309-standarden. Det generatorpolynom som används är x64 + x4 + x3 + x + x + 1 (se referens). Även om två olika sekvenser i teorin skulle kunna ha samma CRC64-värde är sannolikheten för att detta skulle inträffa extremt liten.

Similar Posts

Lämna ett svar

Din e-postadress kommer inte publiceras.