Sekvenssit

author
0 minutes, 44 seconds Read

Tässä osiossa näytetään oletusarvoisesti kanoninen proteiinisekvenssi ja pyynnöstä kaikki tietueessa kuvatut isoformit. Se sisältää myös sekvenssiin (sekvensseihin) liittyvät tiedot, kuten pituuden ja molekyylipainon.

Näytettävä proteiinisekvenssi on oletusarvoisesti proteiinisekvenssi, johon kaikki paikannusmerkinnät viittaavat. Kutsumme sitä ”kanoniseksi” sekvenssiksi.

Käytämme virallista IUPAC:n yksikirjaimista aminohappokoodia. Aminohappojen selenokysteiini (Sec; U) ja pyrrolysiini (Pyl; O) osalta noudatamme ehdotettua nimikkeistöä.

Kunkin isomuodon osalta ilmoitetaan isomuodon nimi sekä pituus ja molekyylimassa Daltoneina. Massa lasketaan koko sekvenssin aminohappokoostumuksen perusteella. Siinä ei oteta huomioon PTM:iä, mikä sulkee pois proteolyyttisen prosessoinnin.

Näytetyn sekvenssin tarkistussumma ilmoitetaan myös. Tällä hetkellä tarkistussumma on 64-bittinen CRC-arvo (Cyclic Redundancy Check) (”CRC64”), joka perustuu ISO 3309 -standardissa kuvattuun algoritmiin. Käytetty generaattoripolynomi on x64 + x4 + x3 + x + 1 (katso viite). Vaikka teoriassa kahdella eri sekvenssillä voisi olla sama CRC64-arvo, sen todennäköisyys on erittäin pieni.

Similar Posts

Vastaa

Sähköpostiosoitettasi ei julkaista.