Sekvence

author
0 minutes, 58 seconds Read

Tato sekce standardně zobrazuje kanonickou sekvenci proteinu a na vyžádání všechny izoformy popsané v záznamu. Obsahuje také informace vztahující se k sekvenci (sekvencím), včetně délky a molekulové hmotnosti.

Ve výchozím nastavení se zobrazuje proteinová sekvence, ke které se vztahují všechny poziční anotace. Nazýváme ji „kanonická“ sekvence.

Používáme oficiální jednopísmenný kód aminokyselin IUPAC. Pro aminokyseliny selenocystein (Sec; U) a pyrrolyzin (Pyl; O) se řídíme navrženou nomenklaturou.

Pro každou izoformu je uveden její název, délka a molekulová hmotnost v daltonech. Hmotnost je vypočtena na základě aminokyselinového složení celé sekvence. Nezohledňuje PTM, tedy vylučuje jakékoli proteolytické zpracování.

Uvádí se také kontrolní součet zobrazené sekvence. V současné době je kontrolním součtem 64bitová hodnota CRC (Cyclic Redundancy Check) („CRC64“) založená na algoritmu popsaném v normě ISO 3309. Použitý generátorový polynom je x64 + x4 + x3 + x + 1 (viz odkaz). Ačkoli teoreticky mohou mít dvě různé sekvence stejnou hodnotu CRC64, pravděpodobnost, že se tak stane, je velmi nízká.

.

Similar Posts

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.