Információ

Miért különbözik a katalitikus hely atlaszban bemutatott aminosavszekvencia egy adott fehérjétől az RSCB fehérjeadatbankban

Miért különbözik a katalitikus hely atlaszban bemutatott aminosavszekvencia egy adott fehérjétől az RSCB fehérjeadatbankban


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Össze akartam hasonlítani az enzimek aminosavszekvenciáját ebben a projektben, amelyen dolgozom, és össze kell hasonlítanom őket a katalitikus helyükön. Ezért elmentem a Catalitic Site Atlashoz, hogy információkat szerezzek a katalitikus webhelyről, de mivel nem kínálnak egyszerű módszert a strukturális adatok programozott letöltésére, letöltöttem őket az RSCB PDB -ből a fasta szekvencia letöltésével. Amikor a katalitikus helyeket kerestem, nem egyezett a CSA által elmondottakkal, és ekkor jöttem rá, hogy ezek különböző fájlok. Vegyük például a 3nos-t, a CSA a következő sorrendet mutatja be:

MGNLKS…

Míg az EKT a következő sorrendet mutatja be:

PKFPRV…

Miért nem ugyanaz a szekvencia, ha ugyanaz a fehérje?

Elnézést, ha nemes kérdés, nem vagyok biológus, csak informatikus, aki véletlenül szereti a bioinformatikát.

Fontos információ:

A CSA -adatok innen származnak, míg az PDB -adatok innen származnak


A krisztallográfiai eredmények (pdb-fájlok) szinte mindig csonka sorozatot tartalmaznak.

A fehérje mindkét vége gyakran rugalmas (még egy kristályban is), és nem eredményez elegendő adatot a jó illeszkedéshez. A megfelelő maradékok eltávolításra kerülnek a modellből és a szekvenciából, és csak a meghatározott elektronsűrűséget mutató maradékok maradnak.


Az egyik sorozat részben a másikban található (kiemelve).

Tehát a CSA sorozat (FASTA formátum, csonka):

> sp | P29474 | NOS3_HUMAN Salétrom -oxid -szintáz, endoteliális OS = Homo sapiens GN = NOS3 PE = 1 SV = 3
MGNLKSVAQEPGPPCGLGLGLGLGLCGKQGGPATPAPEPSRAPASLLPPAPEHSPPSSPLT QPPEGPKFPRVKNWEVGSITYDTLSAQAQQDGPCTPRRCLGSLVFPRKLQGRPSPGPPAP EQLLSQARDFINQYYSSIKRSGSQAHEQRLQEVEAEVAATGTYQLRESELVFGAKQAWRN

a kényelem kedvéért a http://www.uniprot.org/uniprot/P29474 webhelyről származik.

Míg az EKT a következő:

> 3NOS: A | PDBID | lánc | SORREND PKFPRVKNWEVGSITYDTLSAQAQQDGPCTPRRCLGSLVFPRKLQGRPSPGPPAPEQLLSQARDFINQYYSSIKRSGSQA HEQRLQEVEAEVAATGTYQLRESELVFGAKQAWRNAPRCVGRIQWGKLQVFDARDCRSAQEMFTYICNHIKYATNRGNLR SAITVFPQRCPGRGDFRIWNSQLVRYAGYRQQDGSVRGDPANVEITELCIQHGWTPGNGRFDVLPLLLQAPDEPPELFLL ...

Az Uniprot bejegyzés 3 különböző izoformát említ az alternatív splicing miatt, így talán ez történik itt. Íme a szekvencia -igazítás kimenete (a https://www.ebi.ac.uk/Tools/psa/emboss_matcher/ használatával):

# ======================================= # # Igazított_sorozatok: 2 # 1: NOS3_HUMAN # 2: SEQUENCE # Mátrix: EBLOSUM62 # Gap_penalty: 14 # Extend_penalty: 4 # # Hossz: 240 # Identitás: 240/240 (100,0%) # Hasonlóság: 240/240 (100,0%) # Hézagok: 0/2040 ) # Pontszám: 1294 # # # ======================================= NOS3_HUMAN 66 PKFPRVKNWEVGSITYDTLSAQAQQDGPCTPRRCLGSLVFPRKLQGRPSP 115 |||||||||||||||||^ | 1. SZAKASZ PKFPRVKNWEVGSITYDTLSAQAQQDGPCTPRRCLGSLVFPRKLQGGPSP 50 NOS3_HUMAN 116 GPPAPEQLLSQARDFINQYYSSIKRSGSQAHEQRLQEVEAEVAATGTY | | | | | | | | | | | | | ||||||||| Sorozat 51 GPPAPEQLLSQARDFINQYYSSIKRSGSQAHEQRLQEVEAEVAATGTYQL 100 NOS3_HUMAN 166 RESELVFGAKQAWRNAPRCVGRIQWGKLQVFDARDCRSAQEMFTYICNHI 215 | | | | | | | | | | | | | | | | | | | | | | | | | ||||||||| 101. SZEKVENCIA RESELVFGAKQAWRNAPRCVGRIQWGKLQVFDARDCRSAQEMFTYICNHI 150 NOS3_HUMAN 216 KYATNRGNLRSAITVFPQRCPGRGDFRIWNSQLVRYAGYRQQDGSVRGDP 265|||||||||||||||||||||||||||||||||| ||||||||| 151. SZEKVENCIA KYATNRGNLRSAITVFPQRCPGRGDFRIWNSQLVRYAGYRQQDGSVRGDP 200 NOS3_HUMAN 266 ANVEITELCIQHGWTPGNGRFDVLPLLLQAPDEPPELFLL 305 |||||||||||||||||||||||||||||||| SEQUENCE 201 ANVEITELCIQHGWTPGNGRFDVLPLLLQAPDEPPELFLL 240

Ez a válasz helyes, csak annyit akartam hozzátenni, hogy a helyes sorszámozás megmarad a DBREF rekord PDB -fájljában (amit az PDB szövegszerkesztőben történő megnyitásával láthat):

DBREF 3NOS A 66 492 UNP P29474 NOS3_HUMAN 66 492

Egyszerű angol nyelven az ebben a fájlban bemutatott sorrend (3NOSláncA) maradékoknak felel meg66-492a kapcsolódó UniProt (UNP) bejegyzés (csatlakozás:P29474).