Sequenzen

author
0 minutes, 54 seconds Read

In diesem Abschnitt werden standardmäßig die kanonische Proteinsequenz und auf Anfrage alle im Eintrag beschriebenen Isoformen angezeigt. Er enthält auch relevante Informationen zu der/den Sequenz(en), einschließlich Länge und Molekulargewicht.

Die standardmäßig angezeigte Proteinsequenz ist die Proteinsequenz, auf die sich alle Positionsangaben beziehen. Wir nennen sie die „kanonische“ Sequenz.

Wir verwenden den offiziellen IUPAC-Aminosäure-Ein-Buchstaben-Code. Für die Aminosäuren Selenocystein (Sec; U) und Pyrrolysin (Pyl; O) folgen wir der vorgeschlagenen Nomenklatur.

Für jede Isoform werden der Name der Isoform sowie ihre Länge und Molekularmasse in Dalton angegeben. Die Masse wird auf der Grundlage der Aminosäurezusammensetzung der gesamten Sequenz berechnet. Sie berücksichtigt keine PTMs, schließt also jegliche proteolytische Verarbeitung aus.

Die Prüfsumme der angezeigten Sequenz wird ebenfalls angegeben. Derzeit ist die Prüfsumme ein 64-Bit CRC-Wert (Cyclic Redundancy Check) („CRC64“), der auf einem in der ISO-Norm 3309 beschriebenen Algorithmus beruht. Das verwendete Generatorpolynom ist x64 + x4 + x3 + x + 1 (siehe Referenz). Obwohl theoretisch zwei verschiedene Sequenzen denselben CRC64-Wert haben könnten, ist die Wahrscheinlichkeit, dass dies geschieht, äußerst gering.

Similar Posts

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.