Információ

Rendelkezésre állnak-e eredeti röntgendiffrakciós adatok


Szokás-e, hogy a nyomozók közzéteszik a makromolekuláris szerkezeti meghatározásban használt eredeti röntgendiffrakciós adatokat? Ha nem, miért nem; és ha igen, van-e online adatbázis, ahonnan ezek az adatok letölthetők?


Sok esetben rendelkezésre állnak. A Protein Data Bank (PDB) egyik alapelve az volt, hogy nemcsak a makromolekulák és fehérjék modelljeit (atomi pozícióit és azonosságait), hanem a keletkező röntgenadatokat is tárolja, újabban strukturális tényezőkben.

Ha a kérdés az, hogy „miért csak a szerkezeti tényezőket adják meg, és nem az eredeti adatokat, amelyeket elváltak” - egy ilyen feladat sok gondozási erőfeszítést igényel, és nagyon kevés tudományos hasznot hoz. Az egyes adathalmazok skálázása az érzékelőből korábban egy feladat viselője volt. Az eredeti mioglobin szerkezet az 50-es évek ősi formátumában szkennelt filmeket tartalmazna. Ezt most senki sem tudná használni a képformátum feltörése nélkül, ha nem lenne papírszalagon vagy kártyákon. Valójában ebben az esetben a szerkezeti tényezők nem állnak rendelkezésre. A sok vagy több adatgyűjtemény együttes skálázását gyakran egyedi beállításokkal végezték el a 70-es években, majd a 90-es években az adatgyűjtés rutinszerűbbé vált, de a röntgenérzékelők több generációja népszerűvé vált, majd elhalványult a piacról. Mindegyiknek megvolt a maga különcsége és követelménye a több leolvasásból származó adatkészletek kombinálására.

A rendelkezésre álló szerkezeti faktorok célja, hogy bárki rekonstruálhassa az elektronsűrűséget, és kiértékelje azt az értelmezési műveletet, amely egy peptidet az elektronsűrűségen keresztül követ. Mivel ez a formátum főként független az érzékelőtől és meglehetősen következetes az évek során, jelentős mennyiségű tudományos döbbenetet nyújt.

Ha nyers képadatokat vagy detektorok által védett adatokat szeretne több különböző kristályból származó adathalmaz előtt, mielőtt azokat egyesítették volna, fel kell vennie a kapcsolatot a szerzőkkel, akiknek valószínűleg DVD-tengeren kell átszűrniük, hogy eljussanak hozzájuk. Régebbi esetekben lehet, hogy szalagok.

Tehát, ami a strukturális tényezőket illeti, amelyek lényegében a kombinált és skálázott intenzitásadatok négyzetgyökértékei, rendelkezésre állnak, és a pdb -hez küldött minden beadvány részei:

Tekintse meg az RCSB bármely röntgenszerkezeti oldalát. Például ezt.

Van egy "Kísérleti részletek" nevű doboz, és egy linkre kattintva letöltheti a szerkezeti tényezőket.

Ha egyszerre többet keres, tömeges letöltések is elérhetők a letöltési oldalukon. Jelölje be a "Struktúra tényezők" négyzetet. A nyers intenzitás adatoknak rendelkezésre kell állniuk, ha körül is nézel.

További javaslat: Arra gondoltam, hogy ha megnézi a röntgenérzékelőkhöz tartozó skálázó szoftvert, találhat néhány oktatóanyagot skálázatlan nyers adatokkal. Találtam egy példát a Marresearch -nál - tyúktojásfehérje lizozim.


A makromolekuláris diffrakciós kísérletek nyilvános adatbázisa

Minden pont a kristályon áthaladó röntgensugárzás konstruktív interferenciájából jön létre. Az adatok felhasználhatók a kristály szerkezetének vizsgálatára. Köszönetnyilvánítás: M. Grabowski et al.

A publikált kísérleti eredmények reprodukálhatósága az utóbbi időben számos tudományterületen felkeltette a figyelmet. Az eredeti elsődleges tudományos adatok hiánya jelentős tényező a reprodukálhatósági problémákhoz, azonban a strukturális biológiai közösség jelentős lépéseket tett a kísérleti adatok rendelkezésre bocsátása felé.

A makromolekuláris röntgenkristály-gráfia utat mutatott az atomkoordináták nyilvános terjesztésének és a kísérleti adatoknak a Protein Data Bank (PDB) és hasonló projektek útján történő közzétételéhez, és ezzel a területet a biológiai tudományok egyik leginkább reprodukálhatóvá tette.

Az IUCr 2011-ben megbízta a Diffraction Data Deposition Working Group-ot (DDDWG), hogy megvizsgálja a nyers diffrakciós képek archiválásának előnyeit és megvalósíthatóságát a krisztallográfiában. A 2011–2014-es DDDWG hároméves jelentés több kulcsfontosságú ajánlást fogalmazott meg a nyers diffrakciós adatok megőrzésével kapcsolatban. Az eredeti diffrakciós adatok nyilvános közzétételére azonban továbbra sincs kötelezettség.

Az integrált erőforrás a reprodukálhatósághoz a makromolekuláris kristálytanban (IRRMC) a Nemzeti Egészségügyi Intézet Big Data to Know programjának része, és a diffrakciós kísérletekből származó nyers adatok archiválására, valamint a kapcsolódó metaadatok biztosítására lett kifejlesztve. Az adatbázis [Grabowski et al. (2016). Acta Cryst. D72, 1181-1193; Az erőforrás a http://www.proteindiffraction.org címen érhető el, és egyszerű, áramvonalas felületen különféle kritériumok alapján kereshető. Minden adat korlátlan hozzáféréssel és letöltéssel érhető el. Az erőforrás a koncepció bizonyítékaként szolgál, és bemutatja a nyers diffrakciós adatok és a kapcsolódó metaadatok archiválását a biológiai makromolekulák röntgenkrisztallográfiai vizsgálataiból.

A projektről egy riporterrel beszélgetve Wladek Minor csapatvezető azt mondta: "Annyi kutatás folyik folyamatban, hogy nem lehet mindent publikálni, és gyakran a sikertelen tanulmányok eredményei nem jelennek meg a szakirodalomban. Szerintem a kulcs A siker azt jelenti, hogy tudunk a sikertelen kísérletekről, tudni akarjuk, hogy miért kudarcot vallanak."

A projekt célja az IRRMC kiterjesztése és olyan adathalmazok bevonása, amelyek nem adtak röntgenszerkezeteket. Ez elősegítheti a fehérjék szerkezetének meghatározására szolgáló módszerek javítására irányuló együttműködési erőfeszítéseket, és biztosíthatja az egyes kutatók és/vagy kihalt strukturális genomikai projektek által hátrahagyott "árva" adatok elérhetőségét.


Röntgenpor -diffrakciós (XRD) műszerek - hogyan működik?

A röntgendiffraktométer geometriája olyan, hogy a minta a kollimált röntgensugár útjában θ szögben forog, miközben a röntgendetektor egy karra van szerelve, hogy összegyűjtse a diffrakciós röntgensugarakat, és forogjon. 2 θ szögben. A szög fenntartására és a minta elforgatására használt műszert a goniométer. A tipikus púderminták esetében az adatokat a 2 θ címen gyűjtik

5 °-70 °, a röntgenfelvételen előre beállított szögek.


Rendelkezésre állnak -e eredeti röntgendiffrakciós adatok - Biológia

Az utóbbi években megnőtt az érdeklődés a kristály- és molekulaszerkezetek meghatározásához gyűjtött nyers diffrakciós adatkészletek megőrzése iránt. Ez az érdeklődés spontán módon merült fel a kristálytani közösségben számos fronton. Például a nyers adatkészletek értékesek a struktúrameghatározás új módszereinek kidolgozásához és a szoftveralgoritmusok benchmarkingjához (Terwilliger & Bricogne, 2014), néha fontosak a strukturális jellemzők értelmezésének validálásában, és egyre inkább megtérülnek a közelebbi tanulmányozásban, akár lehetővé teszi az adatok elemzését az eredeti munkában használtnál nagyobb felbontásban, a kristályban jelen lévő több rács jelenlétének megértését, vagy a korrelált mozgások vagy rendellenességek részleteinek levezetését a diffúz szóródásból, amelyet nagyrészt figyelmen kívül hagynak a Bragg-csúcsok pozícióinak és jellemzőinek meghatározásakor.

Ezzel párhuzamosan a tudománypolitika fejlődése a nagyvilágban a kutatási adatkezelés egész gyakorlatának alaposabb vizsgálatát indítja el, és egyre több a megbízás arra, hogy megőrizzék a kísérleti tanulmányok alapjául szolgáló nyers adatokat, és hozzáférhetővé tegyék azokat más kutatók számára. . 2016 elejére az Egyesült Királyság összes tudományos kutatótanácsa kifejtette álláspontját az adatkezeléssel, a hozzáféréssel és a hosszú távú kurátorral kapcsolatban (Digital Curation Center, 2016 Research Councils UK, 2015). Az Egyesült Államok Szövetségi Finanszírozó Ügynöksége tudományos adatkezelésre vonatkozó követelményeinek hasznos összefoglalását a Northwestern University Library (2016) tárolja. Egy figyelemre méltó, nemrégiben tett javaslat európai nyílt tudományos felhő létrehozását szorgalmazza (Jones, 2015).

A különböző közösségeknek különböző elképzeléseik vannak arról, hogy mely adatokat értékelik a legjobban, és hogy mik azok az adatok. Az USA Nemzeti Tudományos Alapítványa (NSF) ezt egyértelműen kifejti a gyakran ismételt kérdésekben (National Science Foundation, 2010):

1. Mi az adatkezelési terv hatálya alá tartozó „adat”?

Hogy mi minősül ilyen adatnak, azt az érdekközösség határozza meg a szakértői értékelés és a programkezelés során. Ide tartozhatnak, de nem kizárólagosan: adatok, publikációk, minták, fizikai gyűjtemények, szoftverek és modellek.

Következésképpen a különböző tudományos diszciplínák között nagyon változatos az adatkezelés és -megőrzés megközelítése, tehát a nyilvános adattárak rendelkezésre állása és a letétbe helyezés, hozzáférés és újrafelhasználás kezelésére szolgáló szoftvereszközök. Mindazonáltal két téma ismétlődik a különböző közzétett megbízatásokban és a bevált gyakorlatokra vonatkozó iránymutatásokban: az állandó azonosítók fontossága az adathalmazok számára, és létfontosságú szükség van arra, hogy ezeket a lehető legteljesebben jellemezzük megfelelő metaadatokkal.

A krisztallográfiát általában olyan tudománynak tekintik, amelynek jól megvan a maga rendje az adatkezelés, az érvényesítés, a hozzáférés és az újrafelhasználás tekintetében. Ez nagyrészt igaz a származtatott adatokra (amelyek alatt az atomi helyzetkoordinátákat és a szerkezetmeghatározásokból származó elmozdulási paramétereket értjük) és a kapcsolódó publikációkat illetően. Vitathatóbb, ha a feldolgozott diffrakciós adatokról van szó, és a kísérlet utáni feldolgozott adatokról (jellemzően strukturális tényezők), amelyek az atom- és molekuláris szerkezet meghatározásának alapját képezik, és ezt követően finomítják a szerkezeti modellt. Egyes folyóiratok megkövetelik a strukturális tényezők letétbe helyezését bármely publikáció és a Protein Data Bank (PDB Berman) támogatására et al. , 2000) megköveteli a strukturális tényezők lerakását az atomkoordinátákkal együtt. Ezek azonban általában a finomítás során használt szerkezeti tényezők végső halmaza, és előfordulhat, hogy hiányoznak az információk, amelyeket a szimmetriával kapcsolatos diffrakciós csúcsok összevonásakor eldobnak, vagy más okokból kizárják őket a finomítás korai ciklusaiból. Az EKT akarat elfogadják a nem összevont feldolgozott intenzitási adatokat, és vannak közösségi ajánlások, amelyek ösztönzik lerakódásukat (International Structural Genomics Organization, 2001), de a gyakorlat még nem univerzális a makromolekuláris krisztallográfiában. A kisméretű egysejtű kristályszerkezetek esetében még a strukturális tényezőket elfogadó folyóiratok sem igényeltek eddig összevont intenzitást. Egyre inkább felismerik azonban, hogy fontosak mind a továbbfejlesztés szempontjából checkCIF a szakértői értékelési folyamat során végzett validálás, sőt, a jövőbeli kutatók ösztönzése a publikált eredmények újratekintésére és újraértékelésére, esetleg amikor új ötletek vagy eszközök válnak elérhetővé (A. Linden, személyes kommunikáció).

Mindazonáltal történelmileg nem volt hagyománya az elektronikus detektorok által gyűjtött nyers röntgendiffrakciós képek megőrzésének, bár a központosított neutron létesítményeknek régóta vannak hagyományai a nyers adatok megőrzésében. Az elmúlt években a neutronlétesítmények által ápolt gyakorlatok a nagyméretű központosított műszeres létesítmények (szinkrotronok és később szabadelektron-lézerek, valamint neutronreaktorok) minden típusának elterjedése a nyers adatok megőrzése felé kezdett elmozdulni. Ezt a tendenciát ösztönözte az elektronikus adatkezelési eljárások gyors javulása.

2011-ben a Nemzetközi Krisztallográfiai Unió (IUCr) munkacsoportot hozott létre, hogy feltárja a kezdeti kísérleti adatok megőrzésének előnyeit és kihívásait. Ez a csoport, a Diffraction Data Deposition Working Group (DDDWG) számos konzultációt, megbeszélést és workshopot tartott a téma feltárására. Ben megjelent cikkek halmaza Acta Crystallographica D. szakasz (Terwilliger, 2014) áttekintést adott a nyers adatok archiválásának okairól a makromolekuláris kristályrajz területén, a rutinszerű vagy nagyszabású modellekről, a jelenlegi gyakorlati kezdeményezésekről és a makromolekuláris szerkezetmodellek javításának lehetséges előnyeiről.

Ezek a tanulmányok arra is rávilágítottak, hogy fontos az állandó azonosítók hozzárendelése az adatkészletekhez, hogy megkönnyítsék azok kezelését és hosszú távú kezelését, és biztosítsák, hogy minden adatkészletet gazdag metaadatok jellemezzenek, mind a felfedezés, mind a hatékony tudományos újrafelhasználás érdekében (Guss &#). 38 McMahon, 2014 Kroon-Batenburg & Helliwell, 2014).

Ennek fennmaradó részében Bevezetés , bemutatunk egy nemrégiben megrendezett workshopot, amely a metaadatokra összpontosított kristálytani és kapcsolódó kísérletekben, áttekintjük a nyers adatok rutinszerű gyakorlatként történő letétbe helyezésének érveit, és ezeket a tevékenységeket a globális tudománypolitikai kezdeményezések összefüggésében helyezzük el. A cikk ezt követően részletesebben megvizsgálja a nyers kísérleti adatok (különösen a röntgendiffrakciós képek) lerakásának jelenlegi és fejlődő mechanizmusait, az archivált adatkészleteket leíró metaadatokra vonatkozó részletes követelményeket, a származtatott tudományos eredmények reprodukálhatóságának biztosítása érdekében. és a következő lépéseknél előre.

1.2. A metaadatok javítása

A metaadatokkal kapcsolatos kérdésekre összpontosítva a DDDWG kétnapos workshopot tartott Horvátországban, Rovinjban, 2015 augusztusában. A műhely teljes nyilvántartása online a http://www.iucr.org/resources/data/dddwg/ címen található. rovinj-workshop és számos, a találkozóból származó cikk előkészítés alatt áll. Itt részletezzük a workshop néhány konkrét eredményét.

1.2.1. Az IUCr Bizottságok erőfeszítései

Az IUCr tudományos küldetését számos bizottságon keresztül irányítja, amelyek mindegyike a kristálytudomány egy adott tématerületéért felel. A DDDWG felkérte minden Bizottságot, hogy vegye fontolóra saját igényeit a nyers kísérleti adatok metaadatainak meghatározásához saját területén. Azok között, akik a legaktívabban válaszoltak erre a kérésre, az XAFS-bizottság (Ravel et al. , 2012) a kisszögű szórással foglalkozó bizottság (Jacques et al. , 2012) a Nagynyomású Bizottság (1. ábra) és a Biológiai makromolekulák bizottsága ( például. Gutmanas et al. , 2013 ).


1.ábra
Diák montázsa Kamil Dziubek rovinji műhelyben tartott előadásából, illusztrálva a nagynyomású diffrakciós kísérleteknek és más, nem környezeti feltételeknek megfelelő aspektusait, amelyeket jól kell jellemezni és rögzíteni. (A grafika Ronald Miletich-Pawliczek, Bécsi Egyetem jóvoltából.)

A Nemzetközi Diffrakciós Adatok Központja (ICDD, Pennsylvania, USA http://www.icdd.com) már régóta tevékenykedik a nyerspor -diffrakciós adatkészletek kihasználásában, és arról számolt be nekünk a rovinji ECM29 -en (2015. augusztus). mostantól több mint 10 és#8197000 nyerspor -diffrakciós adathalmazt építettek be a por -diffrakciós fájlba. Megjegyzik, hogy az egydimenziós adathalmazokat általában meglehetősen jól jellemzik a por CIF (pdCIF) szótárban (Toby, 2005) katalogizált kísérleti metaadatok, de a kétdimenziós diffrakciós képek értelmezését akadályozza a következetesség hiánya. olyan jellemzők jelentésében, mint a goniométer tengelyei, detektor sötétáram, torzítás és egyéb korrekciók (T. Fawcett, személyes kommunikáció, lásd még az 1.2.2. szakaszt). A Pordiffrakciós Bizottság további munkát tervez a neutron-pordiffrakciós nyers adatokkal kapcsolatban, és adott esetben kapcsolatba fog lépni a Neutronszórási Bizottsággal. A Szerkezeti Kémiai Bizottságnak lelkes résztvevői voltak a DDDWG által Madridban, Bergenben és Rovinjban összehívott eseményeken.

1.2.2. A röntgendiffrakciós képek jellemzése

A kísérleti adatkészletek azon osztálya, amely a legjobban illeszkedik a DDDWG eredeti feladatköréhez, a CCD-ből vagy pixeldetektorokból gyűjtött röntgendiffrakciós képek. A nyers képadatfájl értelmezéséhez általában szükséges metaadatok jó katalógusát Kroon-Batenburg és#38 Helliwell (2014) adta. A szükséges egyedi elemek közül sokat az imgCIF szótár határoz meg (Bernstein, 2005), és néhányuk részben megvalósult az úgynevezett „mini-CBF” fejlécekben, amelyeket számos kereskedelmi érzékelőrendszer írt. Ez azonban nem következetes módon történt az eladók között, sőt az egyes gyártók teljes termékpalettáján sem. (A CBF, a krisztallográfiai bináris fájl és az imgCIF, tiszta ASCII megfelelője a diffrakciós képek CIF-ontológiájának egyenértékű megvalósítása.)

Egyre gyakrabban tárolnak képeket a HDF5/NeXus adatformátumban (K önnecke et al. , 2015), és bár az adatfájl fizikai formátuma nem befolyásolhatja a strukturált információk tárolásának képességét (Hester, 2016), némi erőfeszítésre lesz szükség annak biztosítása érdekében, hogy a CIF és a NeXus adatábrázolások egyaránt képesek legyenek a megfelelő tárolására kísérleti metaadatok. Ennek technikai szintű elérése érdekében jelentős erőfeszítéseket tettek, miután a CIF és a CIF kezeléséért felelős szervek, a COMCIFS (CIF -szabvány karbantartási bizottsága) és a NIAC (NeXus nemzetközi tanácsadó bizottság) képviselői részt vettek egy korábbi workshopon. NeXus adatformátumok (Bernstein et al. , 2013). Mindazonáltal a Rovinj Workshopon Kroon-Batenburg (https://youtu.be/XXFDlNn21SY) és Minor (https://youtu.be/eQbs9sB_pOM) előadásai hangsúlyozták, hogy még hosszú utat kell megtenni a számtalan változatig. A kereskedelmi forgalomban kapható elektronikus helyzetérzékelők által létrehozott formátumok tartalmazzák a szükséges közös metaadatokat az egyszerű értelmezés és kezelés érdekében (lásd a további vitát a 3.2 fejezetben).

Az új Dectris Eiger pixelérzékelő megérkezése-a diffrakciós képadatok sebességének kolosszális növekedésével-rávilágított a hatékony adatformátum és metaadatok rögzítésének fontosságára, nemcsak a szinkrotron- vagy röntgen-lézersugaras diffrakciós adatfeldolgozás szempontjából, hanem a létesítményen kívüli későbbi feldolgozáshoz, és végül a nyers adatarchívumból származó szükség szerinti újrafeldolgozáshoz/újraelemzéshez. A különböző kérdéseket részletesen kiemelték a CCP4bb levelezőlistáján 2016. március elején található vitaszálon (többek között G. Winter, A. Förster, H. J. Bernstein, C. Vonrhein és G. Bricogne részvételével).

1.3. A nyers adatok lerakásának esete

Összefoglaljuk a nyers adatok rutinszerű tárolásának és visszakeresésének esetét, hogy hangsúlyozzuk annak lehetséges értékét a közösség számára. Ugyanakkor elismerjük az összes összegyűjtött adatkészlet korlátlan tárolásának költségeit és egyéb gyakorlati korlátait, és nem tudunk határozott jelzést adni arról, hogy hol lehet az egyensúly a nyers adatok archiválása és eldobása között. Az 1.4. szakaszban azonban megmutatjuk, hogy észrevehető tendenciák mutatkoznak a több adathalmaz tárolására, mint amennyit a DDDWG korai munkája során várhattunk volna.

Széles filozófiai nézet létezik a nyers diffrakciós adatokhoz való hozzáférés fontosságáról, nevezetesen, hogy a tudomány megköveteli, hogy az ember saját szemével végezzen átfogó elemzést, és ne valaki más szemüvegén keresztül. A nyers diffrakciós képek számos lehetőséget kínálnak a továbbfejlesztett vagy újszerű tudomány számára. Lehetővé teszik az adatok nagyobb felbontásban történő elemzését, mint az eredeti munkában használták [nemcsak az adatfeldolgozó szoftverek összehasonlítását teszik lehetővé (Tanley et al. , 2013), hanem a struktúra meghatározásának és finomításának hatékonyságában is, a normál határokon túl egyre gyengébb adatokkal]. A nyers adatkészletek benchmarkként szolgálhatnak a továbbfejlesztett elemzési módszerek kifejlesztésében. Lehetővé teszik a kristályok szimmetriájának értelmezésének ellenőrzését, valamint a kristályokban jelenlévő több rácsról való diffrakció részletes elemzését. Általánosabban elősegítik a diffúz szóródás tanulmányozását, amely tükrözi a korrelált mozgásokat vagy az atomok rendellenességeit a kristályokban, nevezetesen a "strukturális dinamikát".

A nyers adatok megőrzése úgy tekinthető, mint amelyek kiegészítik a származtatott adatok kiterjedt archívumát ( azaz sejtparaméterek, molekuláris koordináták, anizotróp elmozdulási paraméterek) és feldolgozott adatok (szerkezeti tényezők, Rietveld finomítási profilok) a krisztallográfiai adatbázisokban. Az előbbi hozzájárulása nagyon jól érthető: a tudományos nyilvántartás részét képezik, adatbázis-vezérelt felfedezéshez vezetnek, például. a fehérje-ligandum kölcsönhatások megértésében új szintézis utakhoz vezetnek, a gyártás javulásához és az energetika jobb megértéséhez, és felhasználhatók azonosítási és indexelési alkalmazásokban ( például. törvényszéki tudományban).

A CIF megjelenéséig és az automatizált szerkezet érvényesítési ellenőrzésekig a checkCIF lakosztály (Strickland et al. , 2005), amely lehetővé tette, sok olyan struktúrát tettek közzé, amelyek későbbi javítást igényeltek. Gyakran az eredmények értelmezése olyan molekulaszerkezeteket eredményezett, amelyek nagyjából helyesek, de figyelmen kívül hagyták a magasabb rácsos szimmetriákat. Az ilyen példákat a legjobban észlelni és korrigálni lehetett a letétbe helyezett szerkezeti tényezőkhöz való hozzáféréssel (Marsh jól illusztrálja) et al. , 2002 ).

Tehát nagy vonalakban a struktúra validálása (a szerkezeti modell hitelessége, mind a geometriai konfiguráció normáihoz való ragaszkodásban, mind a röntgendiffrakciós képekből való származtatásában) elvégezhető a származtatott adatsorok (a szerkezeti koordináták) alapján. és egyedül a szerkezeti tényezők, és ez a gyakorlat a különböző krisztallográfiai folyóiratokban már jó ideje. Azonban a nyers adatok elérhetősége ( azaz eredeti diffrakciós képek) a következő módokon fokozhatják a szerkezet validálását:

(i) A szerkezet újra finomítható, esetleg olyan diffrakciós csúcsok felhasználásával, amelyeket kizártunk, mert a feldolgozott diffrakciós adatokat tetszőleges felbontási határon csonkították. Az eredeti adatok megőrzése lehetővé teszi a tércsoport szimmetria újraértékelését is, amely rendszerint a hagyományos finomítás korai szakaszában jön létre.

(ii) Az adatcsökkentést gyakran a megállapított protokollok szerint hajtják végre, de az eredeti képek megőrzése lehetővé teszi a protokollok tesztelését, különösen akkor, ha felmerül a szisztematikus elfogultság gyanúja. Valójában a tárolt nyers képek gyűjteményének statisztikai elemzése lehetővé teheti olyan szisztematikus torzítások kimutatását, amelyek egyáltalán nem nyilvánvalóak az egyes kísérletekben. Ezenkívül a nyers adatkészletek nagy gyűjteményének elérhetősége lehetővé teszi a megoldási módszerek időszakos újrakalibrálását és új módszerek kifejlesztését a korábban a hagyományos megoldásokkal szemben ellenálló adatkészletek kezelésére.

(iii) A diffrakciós foltok közötti diffúz szórásra való figyelem lehetővé teszi a betekintést a korrelált mozgásokba vagy a kristályok atomjainak rendellenességébe. Ez magában foglalhat kvázikristályos viselkedést, aránytalan moduláció vagy többfázisú reprezentáció meghatározását, makromolekuláris mozgásokat vagy konformációs változásokat stb. .

Megjegyzendő, hogy ezek az előnyök nem minden struktúra esetében nyilvánvalóak, és a rutin lerakódásra vonatkozó politikák költség-haszon kalkulációját továbbra is a közösségnek és a finanszírozó szerveknek kell meghatározniuk (Guss & McMahon, 2014). Előfordulhat, hogy vannak különböző belépési pontok, ahol a lehetséges előnyök a legkönnyebben megvalósíthatók, például. a „nehéz szerkezetek” kísérleti adatainak hozzáférhetővé tételével, amelyeket lehetetlennek bizonyult kielégítően finomítani.

Az elsődleges adatok többé-kevésbé rutinszerű letétbe helyezése azonban hozzájárulna a tudományos rekord minőségének és megbízhatóságának javításához (Kisebb et al. , 2016). Lehetővé tenné a tudományos következtetések szakértői lektorok általi alaposabb vizsgálatát a közzététel előtt, és lehetővé tenné az adatbázisokban már meglévő strukturális modellek áttekintését és felülvizsgálatát, ahogy új technikákat fejlesztenek ki – például. a „makromolekuláris szerkezeti modellek folyamatos javítása” (Terwilliger, 2012) fogalma, amely lehetővé teszi egy szerkezet vagy struktúrák sorozatának újraelemzését a szerző értelmezési elfogultságától függetlenül (BD Bax, személyes kommunikáció), és biztosítja az állítások alátámasztásához szükséges kísérleti bizonyítékokat a kiadó szerzője készítette. Ez utóbbi szerepkörben segít elkerülni a rossz adatkészlet felhasználását, akár tévedésből, akár szándékos szándékból.

1.4. Letétbe helyezési követelmények és lehetőségek

Ahogy korábban említettük, a DDDWG létrehozása óta történtek fejlemények az adatlerakódás és -megosztás éghajlatában, mind a tágabb tudományos világban, mind a krisztallográfia és a kapcsolódó szerkezettudományok területén. A nyílt adatok előnyei ( azaz a közfinanszírozott tudományos kutatásokból származó kutatási adatok összegyűjtése és a végfelhasználó számára díjmentes újrafelhasználásra bocsátása) az elmúlt években megismétlődött nemzetközi, kormányzati és tudománypolitikai vitákban és gyakorlati kezdeményezésekben. Néhány figyelemre méltó portál webhelye az Egyesült Nemzetek adatportálja (UNdata: http://data.un.org), az Egyesült Államok kormányának nyíltadat-portálja (https://www.data.gov) és a szövetségi `Global Science Gateway "http://worldwidescience.org. A végrehajtási felhívások közé tartozik a „The Good Growth Plan” (A jó növekedési terv), amely az Egyesült Királyság Nyílt Adatintézete (ODI https://theodi.org) és a Syngenta, az Európai Nyílt Tudományos Felhő (EOSC) részvételével zajló mezőgazdasági fejlesztési együttműködés, amely a kutatás összekapcsolására irányuló európai uniós stratégia. hálózatok, adattároló létesítmények és számítási erőforrások a kontinensen (Jones, 2015, 2. ábra) és a Nemzetközi Tudományos Tanács (ICSU), az InterAcademy Partnership (IAP), a The World által elindított nyílt adatmegállapodás (Science International, 2015) Tudományos Akadémia (TWAS) és a Nemzetközi Társadalomtudományi Tanács (ISSC).


2. ábra
Az adatok közzétételének és kezelésének munkafolyamatát az EU kutatási infrastrukturális összetevőivel összekötő grafika. Az Európai Nyílt Tudományos Felhőt Kutatásra bemutató előadás része (illusztráció Natalia Manova jóvoltából az Európai OpenAIRE projekthez).

Bár ezek a különböző kezdeményezések célkitűzéseik nagyon változatosak, együttesen az adatok tárházainak vélt fontosságát emelik ki a kutatást finanszírozók, a kutatók számára, akiket bátorítanak vagy bizonyos esetekben megbíznak arra, hogy adataikat megbízható és tartós adattárakban helyezzék el, és más kutatóknak, akik egyre jobban tudatában vannak más adatkészletek elérhetőségének, és ezek potenciális hasznosságának saját munkájukban. Fokozatosan változik a kutatási adatokhoz való kulturális hozzáállás.

A DDDWG 2011-es létrehozása óta számos olyan fejlemény történt, amelyek közül néhányat e magas szintű kezdeményezések katalizáltak, és amelyek növelték a diffrakciós képek lerakásának lehetőségeit:

(i) Bővült az egyetemi adattárak száma és köre.

(ii) Az Európai Szinkrotron Sugárzási Eszköz (ESRF Grenoble, Franciaország) adatarchívumot indított, amelyben minden mért nyers adathalmaz regisztrált DOI -hoz társítható.

(iii) A rendkívül nagy kapacitású CERN tárolórendszeren tárolt Zenodo tudományos adatarchívum lendületet kapott.

(iv) Az amerikai Nemzeti Egészségügyi Intézet BD2K (Big Data to Knowledge) programjának (Grabowski) részeként létrehozták a fehérjeszerkezetek meghatározására használt diffrakciós kísérletek tárházát. et al. , 2016) Wladek Minor csoportja vezeti a Virginia Egyetemen (http://www.proteindiffraction.org/).

v. A strukturális biológiai adatrácsot (SBDG) a strukturális biológia diffrakciós adatainak közzétételi és terjesztési rendszereként hozták létre (Meyer et al. , 2016 ).

(vi) A Protein Data Bank (PDB) most a DOI -t (digitális objektumazonosítót) kéri a nyers adatokhoz és a nyers adatok metaadatait a lerakás során (3. ábra).


3. ábra
Online űrlap, amely lehetővé teszi a PDB letétesek számára, hogy kísérleti adatkészleteket és a hozzájuk kapcsolódó metaadatokat összekapcsolják egy letétbe helyezett makromolekuláris szerkezettel.

vii. IUCrData (egy IUCr adatszolgáltatás, amely kezdetben származtatott adatkészleteket kezel) elindult.

Ezek közül néhányat részletesebben a 2.2. Szakasz ismertet.

2. A nyers diffrakciós adatok megőrzésének mechanizmusai

Áttekintünk néhányat de facto olyan adattárak, amelyek jelenleg kísérleti adatkészleteket tárolnak, és sok esetben hozzáférést biztosítanak azokhoz a domainünkben.

2.1. Intézményi adattárak. Esettanulmány: Manchesteri Egyetem

A Manchesteri Egyetem aprólékos megközelítése miatt egyikünk (JRH) nagyon szerencsésnek érzi magát, hogy ebben a kutatási környezetben dolgozhat. A ciszplatin rákellenes szer hisztidinhez való kötődésének kutatása során [amely nagy érdeklődést váltott ki, lásd például Messori & Merlino (2016)], a JRH kutatócsoportja a nyers diffrakciós adatokat nyílt hozzáférésűvé tette a Manchesteri Egyetem intézményében adattár. A 4. ábra a Library rendszeren belüli adatelérési rekordot mutatja, míg az 5. ábra az ilyen adattárhoz szükséges osztályozási szintű metaadatokat. Ez a fajta intézményi katalogizálás és archiválás egyre inkább jellemző a modern adatarchívum kezdeményezésekre. Ezenkívül betartottuk a szabványos közösségi adatbeviteli követelményeket, amelyek szerint a koordinátákat letétbe helyeztük, és feldolgoztuk a diffrakciós adatokat a Protein Data Bankban. Annak érdekében, hogy munkánkhoz a lehető legszélesebb körben hozzáférhessünk, lehetőségünk volt arra is, keresztül az EPSRC finanszírozásával rendelkezünk, hogy közzé tegyük cikkeink nagy részét, amelyek eredményeinket „arany” nyílt hozzáférésként jelentik ( azaz a teljes lektorált cikkek elérhetők folyóirat-előfizetés nélkül) Acta Crystallographica szakaszok D és F .


4. ábra
A Manchester University Library hozzáférési rekordja egy publikált kutatási cikkhez kapcsolódó kísérleti adatkészletekhez. A linkek a közzétett cikkhez a "Kapcsolódó források" oszlopban találhatók.

5. ábra
A Manchesteri Egyetem Adatkönyvtárában archivált, a kísérleti adathalmazokhoz társított osztályozási szintű metaadatok. Ezek azonosítják az archivált adatkészleteket, és hivatkozásokat biztosítanak a kapcsolódó erőforrásokhoz.

Mivel úttörőkké váltunk mind a nyers diffrakciós adataink, mind az adataink és a modellértelmezéseink teljes megnyitásának (táblázat ف), ezáltal a fókuszált kutatási témán belül ritka szélességű és mélységű nyitottságot értünk el, kutatásaink örömteli részletes érdeklődést kaptak. Ezeket a nyers adatokat sok alkalommal töltötték le, mind az Utrecht Egyetem eredeti weboldaláról, mind később a Manchesteri Egyetemről. Az Utrechtből származó letöltések összesített száma minden évben a következő volt: 2012 17  GB, 2013 47  GB, 2014 57,69  GB és 2015 31,47  GB egyenértékű letöltési információ nem érhető el a Manchesteri Egyetemről. Az egyik ilyen nyers adatletöltés egy új kiadványban (Shabalin et al. , 2015), széles körű kritika a ciszplatin különböző fehérjékhez való kötődésének egész területén. Ez a cikk az előzetes költségvetési tervezetben szereplő három ciszplatin–lizozim modellünk javítását javasolta. keresztül három saját alternatív értelmezésük közül kettő a PDB-ben tárolt feldolgozott diffrakciós adataink (4xan és 4mwk) és az egyik nyers adatunk (4g4a az 1. táblázatban és a 4. ábrán) felhasználását jelentette. Néhány ajánlásukat elfogadtuk, másokat pedig elutasítottunk (Tanley et al. , 2016). Az „adatvita” ezen pontjainak némelyike ​​az érett közösségi normák hiányára utal, még egy folyóiraton belül is (Tanley et al. , 2015), de utat mutatnak a megbeszélésekhez is, például. az IUCr folyóiratokban. Más szempontok szerint ez azt mutatja, hogy milyen előnyökkel jár a továbbfejlesztett elemzési módszerek keresése és a gyenge adatok szerepének jobb megértése a fehérjemodell -finomítások javításában (Diederichs & Karplus, 2013), amelyet részletesen kihasználtunk a Tanley -ben et al. (2016). Ilyen javulások még az elmúlt néhány évben is felmerültek, és a makromolekuláris kristálytanulás „fiatal korát” illusztrálják.

Asztal 1
Példaként tematikus nyers adatgyűjtés: a hisztidinhez kötődő platinokhoz kapcsolódó kutatási tanulmányok, a Manchesteri Egyetem Adatkönyvtárában

2.2. Általános adattárak a szerkezetbiológiához

Az adatrögzítés és archiválás fontosságát világszerte széles körben elismerték, és ma már több adattár is elérhető, ahol szinte bármely kutató elhelyezheti vagy hamarosan elhelyezheti nyersadatait és a kapcsolódó metaadatokat, hogy a világon bárki megtekinthesse és letölthesse. természetesen a fájlméret és a hálózati sávszélesség természetes korlátaitól függően.

Két nagy, államilag finanszírozott adattár az integrált erőforrás a reprodukálhatósághoz a makromolekuláris kristálytanban (http://www.proteindiffraction.org) és a Zenodo adattár (https://zenodo.org) az általános tudományos adatokhoz. Az előbbit a Virginia Egyetem Minor csoportja fejlesztette ki (http://olenka.med.virginia.edu/CrystUVa), és támogatja az Egyesült Államok Nemzeti Egészségügyi Intézete Big Data to Knowledge Initiative (https: // datascience .nih.gov/bd2k). A Zenodót a CERN (http://www.cern.ch) fejlesztette ki az Európai Unió OpenAIREplus kezdeményezésének részeként (http://www.openaire.eu).

Két további privát adattár áll rendelkezésre általános használatra. A harvardi székhelyű SBGrid szervezet (https://sbgrid.org) kifejlesztett egy strukturális biológiai adatrácsot (https://data.sbgrid.org), amelyet az SBGrid bármely tagja használhat nyers adatok és metaadatok archiválására. A ResearchGate tudományos hálózati webhely (https://www.researchgate.net) lehetővé teszi a kutatók számára, hogy megosszák az adatokat (https://www.researchgate.net/blog/post/present-all-your-research-in-a-click) .

2.2.1. Az integrált erőforrás a reprodukálhatósághoz a makromolekuláris kristallográfiában

A reprodukálhatóság integrált erőforrása a makromolekuláris krisztallográfiában (Grabowski et al. , 2016) egy fehérje diffrakciós adatbázis, amely a krisztallográfiai nyers képek archiválásának szükségességére vonatkozik, amint az a fenti vitában és a Acta Cryst. D a közelmúltban megjelent cikkek csoportja (Terwilliger, 2014). Ez az adatbázis jelenleg több mint 2900 nyers krisztallográfiai adatkészletet és kapcsolódó metaadatokat tartalmaz. Ezek többsége a Protein Data Bank letétjéhez kapcsolódik (http://www.pdb.org Berman, 2000), és sokuk a strukturális genomikai projektek munkáit képviseli (http://csgid.org, http: // ssgcid.org, http://www.jcsg.org, http://mcsg.anl.gov, http://thesgc.org). Az adatbázis erősen felépített, minden adathalmazhoz kristálytani metaadatok tartoznak. Ennek a szolgáltatásnak egy nagyon hasznos tulajdonsága, hogy az adatbázis webes kezelőfelülete minden adathalmazból reprezentatív diffrakciós képet mutat, így a kutató gyorsan feljegyezheti az egyes adatkészletekben használt kristályok diffrakciójának jellemzőit, például a sorrendet a diffrakciós mintázat, a diffúz szórás jelenléte és az anizotrópia mértéke a diffrakciós mintában. Az adatbázisban az PDB azonosító, a diffrakció felbontása, az adatok gyűjtésének helye, a szerzők és sok más jellemző alapján lehet keresni. A tervek szerint az adatbázis bárki számára elérhető lesz betétek és letöltések számára. Az adatbázis minden bejegyzéséhez van hozzárendelt DOI, amely felhasználható az adatokra való hivatkozásra, és amely stabil, állandó kapcsolatot biztosít az adatokkal, és a letétbe helyezett adatok fájlmérete nem korlátozott. A nyers adatokhoz társított metaadatok az adatbázis szerves részét képezik, így a jövőben megvalósítható lehet az adatbázisban lévő nyers adatok nagy részének automatikus újrafeldolgozása, amint új adatelemzési algoritmusok válnak elérhetővé ( vö. Terwilliger & Bricogne, 2014).

2.2.2. Zenodo

A Zenodo archívum egy általános tudományos archívum, amelyet a CERN kutatói fejlesztettek ki az Európai Unió 7. keretrendszere keretében. Bármely területen tudományos adatsorokat tárol, és egyedülálló jellemzője, hogy a CERN részeként kivételes adattárolási és archiválási kapacitással rendelkezik. Bár az EU támogatja, a világ bármely pontjáról érkező kutatók archiválhatják adataikat, és bárki hozzáférhet az adatokhoz. A Zenodo archívum célja, hogy erőforrást nyújtson a világ számos kis tudományos projektjéhez, amelyeknek nincs egyszerű módja annak, hogy adataikat a tudományos közösség rendelkezésére bocsássák, és a többi itt tárgyalt adatbázissal ellentétben díjat tervez felszámítani nagyobb -skálázott felhasználók. Az archívum jelenleg több mint 2500 adatkészletet tartalmaz a tudomány minden területéről. Az adathalmazok több fájlt is tartalmazhatnak, általában az 50 és#8197 GB -os teljes méretkorlát legfeljebb 2 és#8197 GB méretű lehet. Minden adatkészlethez DOI van hozzárendelve az állandó archiváláshoz és felfedezéshez, és össze vannak kapcsolva a kutató által biztosított metaadatokkal.

2.2.3. Struktúrbiológiai adatrács

Az SBGrid szervezet a világ számos szerkezeti biológiai laboratóriumában dolgozó kutatók számára hozzáférést biztosít a csomagolt szoftverkészlethez, amely a szerkezeti biológia számos területén használható, beleértve a röntgen-kristálytani, krio-elektronmikroszkópiát, elektrondiffrakciót, kis szögű szórást. és más területeken.Az SBGrid hozzáférést biztosít a felhő alapú számítási erőforrásokhoz is, amelyek szerkezeti biológiai számításokat végeznek. A Structural Biology Data Grid az SBGrid által nemrégiben elindított szolgáltatás, amely lehetővé teszi bármely SBGrid kutató számára, hogy nyers adatokat archiváljon az SBGrid szerkezetbiológiai területei közül. Ez az adatbázis jelenleg több mint 240 adatkészletet tartalmaz 62 különböző intézménytől. Az adatokat bárki megtekintheti, a krisztallográfiai adatkészleteket pedig bárki letöltheti, kivágás és beillesztés szkriptekkel az egyes adatkészletek egyszerű letöltéséhez. Minden adatbejegyzéshez egyedi DOI van hozzárendelve, nincsenek korlátozások a fájlméretekre, és rendelkezésre állnak az adatok elemzését leíró metaadatok.

2.2.4. ResearchGate

A ResearchGate egy kereskedelmi tudományos közösségi hálózati szolgáltatás, amely egyszerű mechanizmust biztosít a kutatók számára, hogy közzétegyék saját magukról szóló tudományos dokumentumaikat és adataikat, a kutatók pedig kommunikáljanak és megvitassák a tudományos témákat. A ResearchGate ezenkívül lehetővé teszi a kutatók számára, hogy archiválják a tudományos adathalmazokat, amelyeket bárki letölthet. Az adatkészletekhez egy DOI van hozzárendelve, és az egyes fájlok mérete korlátozott.

2.3. Szinkrotron, neutron és röntgenlézer lehetőség

Jelenleg számos feltűnő példa van az adatgyűjtés és -kezelés jelenlegi és fejlődő gyakorlatára számos nagyméretű, különféle technikákat és tudományokat magában foglaló létesítményben. Azok között, akikről tudunk, az ausztrál szinkrotron (Clayton, Victoria, Ausztrália), az ESRF, az Institut Laue –Langevin (ILL, Grenoble, Franciaország), a gyémánt fényforrás (Didcot, Egyesült Királyság) és az ISIS neutronforrás Rutherford Appleton Laboratory (Didcot, Egyesült Királyság). Az ausztrál Synchrotron Store -jával vezette a világ szinkrotronjait az adatok archiválásában. Synchrotron adattároló szolgáltatás a makromolekuláris kristályográfiához (Meyer et al. , 2014). A diffrakciós képadatok archiválása mellett támogatja a felhasználókat publikációikban a nyers adatkészletekre való hivatkozással keresztül A DOI regisztrációk és végül az adathalmazok nyilvános elemzésre bocsátása - és ez a neutronközösségben az ILL is. Vannak szép példák is, mint például a Diamond, amely eddig megőrizte minden mért adatát. Az ESRF összefoglalót tett közzé nézeteiről a Big Data korszakáról a szinkrotronsugárzási létesítményekben általában, és azokról a kihívásokról, amelyekkel ma az ESRF is szembesül (ESRF, 2013). Bátorító közelmúltbeli nyilatkozatában proaktív adatarchiválási politikát jelentett be (Andy G ötz és munkatársai az ESRF -ből, személyes kommunikáció).

Az otthoni laboratóriumokban és az olyan közepes méretű szolgáltatók számára, mint az Egyesült Királyság Nemzeti Krisztallográfiai Szolgálata (Southampton, Egyesült Királyság), továbbra is jelentős kihívások elé állítja az adatkezelést. Mindezen helyeken a kísérlet összes adatát az erőforrás -kezelés, a származás, az érvényesítés és a tömeges tárolás összefüggésében kell kezelni, amelyek mindegyike egyre nagyobb mennyiségű metaadatot igényel, amelyeknek meg kell felelniük a széles körben elfogadott szabványoknak.

2.4. Az adatáradat

Az egyik figyelmeztetés, amelyet a tárolómegoldások biztató felmérésére alkalmazunk, az, hogy a technológia fejlődésével a begyűjtött adatok mennyisége drámaian növekszik. Ennélfogva, míg az Utrecht Egyetem teljes letöltése 2015 -ben 31 és#8197 GB volt, a jelenleg szinkrotron sugárvonalon működő Eiger 16M detektor által előállított egyetlen adathalmaz 70 és#8197 GB felett lehet. Ez azt sugallja, hogy a központosított kísérleti létesítmények, nagy adattárolási kapacitásaikkal és gigabites belső hálózataikkal továbbra is fontos szerepet töltenek be, mint elsődleges adattárak az adatkészletek kvázi rutinszerű megőrzéséhez. Szükségessé válhat azonban a „triage” elveinek alkalmazása akár az adatgyűjtés helyén, akár a későbbi hosszú távú tárolási kiosztás során. Az ilyen osztályozás vagy törölhet bizonyos adatkészleteket, vagy megtarthat bizonyos részhalmazokat, számos lehetséges kritériumnak megfelelően. Az ilyen kritériumokra vonatkozó kezdeti javaslatot a DDDWG online fórumán javasolták 2011-ben (http://forums.iucr.org/viewtopic.php?f=21&t=57), de a közösségnek még ki kell dolgoznia. .

3. Metaadatok a nyers adatokra vonatkozó követelményekhez

3.1. Holisztikus metaadat -keretrendszer a kristálytanhoz

A kristálytudománynak és a kapcsolódó szerkezeti tudományoknak szerencséjük van az adatok jellemzésének és kezelésének szabványosított megközelítésével, amelyet Crystallographic Information Framework néven ismerünk (CIF Hall & McMahon, 1995). Ennek két összetevője van: egy szabványos fájlformátum és egy adatmodell (Hall et al. , 1991 Bernstein et al. , 2016), amelyek megkönnyítik a szoftverprogramok, strukturális adatbázisok és kiadói rendszerek közötti adatcserét, valamint egy sor „szótárat”, amely szabályozza az adatértékekhez társított címkék jelentését, és adott esetben korlátozásokat írhat elő az adattípusokra és -értékekre vonatkozóan. Ezek a szótárak együttesen alkotják az ellenőrzött szókincset és a hozzájuk tartozó definíciókat, amelyek egy adatfájl vagy adatfolyam szemantikai jelentését képviselik, és amelyet divatosan egy adott tudományos terület „ontológiájának” neveznek.

Minden CIF-szótár egy adott területre vagy tématerületre vonatkozó definíciókat tartalmaz, mint például az egykristályos diffraktometriával meghatározott kisméretű egysejtes szerkezetek (az úgynevezett „mag” szótár), a por-diffrakció, a biológiai makromolekuláris szerkezetek, a modulált, aránytalan struktúrák, többpólusú elektronsűrűségű vagy diffrakciós képek (Hall & McMahon, 2016). Ezek a témák szerinti összeállítások átfogó képet adnak arról, hogy mit nevezhetünk adatnak. Így az alapvető szótár olyan sokféle elemet tartalmaz, mint egyetlen atompozíciós koordináta, a környezeti hőmérséklet a kísérlet végrehajtásának időpontjában, a legkisebb négyzetek finomításának konvergencia-mutatói, a molekuláris grafika előállításához használt szoftver vagy a teljes szöveg. kapcsolódó tudományos publikáció. Vagyis nincs különbség a „nyers”, „feldolgozott” vagy „származtatott” adatok közé sorolható tételek között, vagy „metaadatként”.

Ennek a megkülönböztetés hiányának az az előnye, hogy összes az adathalmaz értelmezéséhez, érvényesítéséhez vagy újrafelhasználásához szükséges információk egyetlen fájlban tárolhatók, és ez megkönnyíti az ilyen információk gyűjtését és ellenőrzését egy kísérleti munkafolyamat során. A 6. ábra azt szemlélteti, hogy a CIF ontológiák hogyan tájékoztatják a „koherens információáramlást” az információfeldolgozás életciklusának minden szakaszában egy tipikus szerkezetmeghatározási kísérletben. A gyakorlatban nem minden valós munkafolyamat használja a CIF-t tényleges mechanizmusként az adatok és metaadatok rögzítéséhez. Például a nagy műszeres létesítményekben az adott kísérletre vonatkozó információkat össze lehet gyűjteni egy egységes tartalomkezelő rendszerben, amelyet a létesítmény fejlesztett ki a különféle tudományos kísérletek széles skálájának befogadására (Matthews et al. , 2010). Hasonlóképpen, a modern érzékelők nagy áteresztőképességű adatgyűjtési követelményeinek kezeléséhez a képeket bináris HDF5 fájlokként vagy saját formátumban lehet létrehozni.


6. ábra
Koherens információáramlás a kristálytudományban. A CIF ontológiák az információfeldolgozás életciklusának minden szakaszában jellemzik az adatokat, a kísérleti berendezésektől a publikált papírokig és a kurált adatbázis-letétig.

Mindazonáltal minden nyers adathalmaz és a hozzá tartozó metaadatok elvileg átalakíthatók CIF -ábrázolásokká, ami gyakorlati előny lehet archiválási célokra ( azaz hogy egyetlen szabványos reprezentációt használjunk), vagy legalábbis be tudja mutatni, hogy milyen fontos metaadatok hiányoznak, összehasonlítva az átfogó CIF-szótár-összefoglalóval arról, hogy mit lehet és kell gyűjteni.

Különböző IUCr Bizottságok továbbra is CIF-szótárak formájában állítják össze az érdeklődési körüknek megfelelő metaadat-definíciókat. A Hall & McMahon (2016) által felsoroltak mellett a közelmúltban megjelent egy kis szögű szóródási szótár (sasCIF) is (Kachala et al. , 2016) az IUCr mágneses szerkezetekkel foglalkozó bizottsága jó előrehaladást ért el a mágneses szerkezetek és mögöttes szimmetriáik jellemzésére (magCIF), valamint a magasnyomású bizottságnak van egy aktív munkacsoportja, amely meghatározza a nem környezeti kristálytanban szükséges kísérleti beállítás lényeges aspektusait.

Mint korábban említettük, az imgCIF szótár a nyers diffrakciós adatok tárolásának tényleges formátumát írja le. Ugyanakkor tartalmaz egy meglehetősen teljes adategységet is, amelyek teljes feltöltése és a mag- vagy makromolekuláris CIF szótárak más elemeivel együtt történő használata teljes mértékben leírhatja a kísérleti berendezést és működési paramétereket, így lehetővé téve az archivált képek teljes értelmezését ebben a formátumban. Magát az imgCIF formátumot viszonylag kevesen használják, nagyrészt a modern detektorok sebességi követelményei miatt, amelyek eltérő adatgyűjtési stratégiákat igényelnek. Mindazonáltal folyamatosan törekszenek a metaadat -kifejezések meghatározására az egyre gyakoribb NeXus formátumban (K önnecke et al. , 2015), amelyek összhangban vannak az imgCIF szótárban meghatározott kísérleti metaadat -elemekkel.

3.2. A műszerek sokszínűsége

Ebben a részben a hiányzó vagy rosszul jellemzett metaadatokkal a gyakorlatban felmerült problémák egy részének sajátosságait vizsgáljuk. A képfejlécekben található metaadatok elérhetőségéről és szoftverfejlesztők általi értelmezéséről korábban már volt szó (Tanley, Schreurs et al. , 2013 Kroon-Batenburg & Helliwell, 2014). Nyugodtan megállapítható, hogy a metaadatokkal kapcsolatos információk gyakran hiányoznak, vagy kétértelműek, azaz többféleképpen értelmezhető. A hardvergyártók különböző szavakat használhatnak ugyanarra a fizikai paraméterre vagy egységeire, és a szoftverfejlesztők kezében van az, hogy helyesen használják fel a metaadat-információkat, és pótolják a hiányzó részeket, egyszerűen megszerzett tudás vagy próbálkozás és hiba segítségével. . Hivatkozunk a Kroon-Batenburg & Helliwell (2014) cikkének alátámasztó információira a Kay Diederichs, Toine Schreurs és Loes Kroon-Batenburg közötti megbeszéléshez a röntgensugárra nem merőleges tengely körül végzett pásztázásról. fix és#967 goniométeren. Bár elegendő információ állt rendelkezésre a fejlécben, a XDS szoftver (Kabsch, 2010) a legtöbbet figyelmen kívül hagyta, és a (szokásos) műszeres beállítás ismereteit használta fel, ami ebben az esetben nem volt elegendő. Kezdetben a nyers adatokat, amelyek jelenleg a Manchester University Library archívumában találhatók, az Utrechti Egyetem webhelyén tárolták (http://rawdata.chem.uu.nl), és metaadatként hozzáadtuk a kísérleti összeállítás fényképét. feloldja a goniométer kétértelműségét, például. az orsó tengelye felfelé vagy lefelé mutat?

Meg kell különböztetnünk a diffrakciós berendezéseket, amelyeket a gyártó szoftverével együtt kell használni, amely megfelelően kezeli a metaadatokat, és az összeszerelt műszereket, mint például a szinkrotron sugárvonalon. Tanley, Diederichs leírása szerint az első esetben problémákat okozhat, ha az adatokat más helyre viszi harmadik féltől származó szoftverekkel való használatra. et al. (2013). A képfejlécek legfeljebb a goniométer típusát tartalmazzák ( például. ` MACH3 KAPPA -val 'Bruker Proteum esetében), de ritkán adják meg a négy tengely irányait és függőségeit. A második esetben a kereskedelmi detektorok ( például. a Pilatus a Dectris -től) egy sugárvonalra van telepítve, és a sugárvonal -vezérlő szoftver felelős az érzékelő szoftverrel szoros együttműködésben az információk képfejlécekbe történő írásáért. Ebben a vegyes környezetben nem minden metaadat kerül rögzítésre. Általában, de nem mindig, megadják a hullámhosszat, az érzékelő és a minta közötti távolságot, a képpontok méretét és a képpontok számát bármelyik irányban, a forgás kezdőszögét és a lépést, valamint az expozíciós időt.

A metaadatokkal kapcsolatos leggyakoribb problémák azonban a goniométer tengelyeinek és forgási irányainak orientációjához kapcsolódnak, valamint a gyorsabb és lassabb irányok meghatározása a pixelkoordinátákban a laboratóriumi tengelyekhez képest, és a képpontkoordináták eredete különösen zavaró. a sugárközéppont hiánya vagy helytelen (lásd alább). A#1602 táblázat a goniométer definícióit tartalmazza EVAL szoftver (Schreurs et al. , 2010), és bemutatja ezek nagy változatosságát.

2. táblázat
Goniométer típusok megvalósítása in EVAL (Schreurs et al. , 2010 )

Érdekes táblázat a beamline beállításokról a futáshoz autoPROC (Vonrhein et al. , 2011) a http://www.globalphasing.com/autoproc/wiki weboldalon található. Olyan értékek, mint pl BeamCentreFrom = fejléc:x,-y , ReversePhi = "igen" és TwoThetaAxis = "-1" a fent említettekhez hasonló problémák kezelésére szolgálnak (2. táblázat). Nyolc lehetséges módja van annak, hogy a képfájlban található pixelértékek kapcsolódjanak a fizikai érzékelő felületéhez, és az érzékelőgyártók mind a nyolc lehetséges konvenciót használják (Wladek Minor, privát kommunikáció). A rossz sugárközéppont akadályozhatja az indexelést. A sugár középpontját kézi ellenőrzéssel, por -diffrakciós kalibrálással, közvetlen sugárfelvétellel vagy Bragg -foltok eltávolításával és az oldószer diffúz gyűrűjével lehet megbecsülni a sugár középpontjában (Vonrhein et al. , 2011) különben kísérlet -tévedéshez kell folyamodni. A 7. ábra a Dectris által Pilatus detektorokhoz használt mini-CBF fejlécet mutatja. A legtöbb információ jelen van, de néhány paraméter kétértelmű: Beam_xy : lásd a fenti vitát Oszcillációs_tengely úgy van megadva, hogy ' x ': mi a x irány? Polarizáció van 0.990 : melyik síkon az erős intenzitás? Különösen zavaros helyzetbe kerültünk, amikor egy Bruker fix- és#967 goniométert szereltek fel 90 ° elforgatással az Argonne 15ID-B sugárvonalon, miközben a képeket a normál Bruker műszer tájolásra alakították át. Az erős polarizációs irány tehát az oszcillációs tengely mentén látszott, de nem az volt (Jozef Ko ž í šek, privát kommunikáció) CÉLSZINKROTRON a fejlécben figyelmeztetett minket.

Több eleve a diffrakciós képadatok értelmezéséhez gyakran ismeretekre van szükség. Például különböző konvenciók léteznek az elhalt területek rögzítésére az érzékelőn: a Pilatus detektorok érzékelőpanelei közötti csíkokat a `jelzi -1 ', míg az ADSC detektor képfájlokban ezeket a ' jelzi 0 '. Az adatfeldolgozó szoftvernek megfelelően kell értelmeznie az ilyen pixeladatokat. A sötét kép és az egyenetlenség korrekciója negatív intenzitáshoz vezethet, és egyes detektor-kiolvasáskezelők úgynevezett alapvonal-eltolást alkalmaznak: minden pixelintenzitáshoz rögzített egész szám került, hogy ne kelljen negatív számokat tárolni. Az alapvonal-eltolás eltávolítása fontos a nettó Bragg-reflexiós intenzitás szórásának becsléséhez és a Bragg-csúcsok közötti diffúz intenzitások méréséhez. A térbeli torzításokat általában korrigálják, és azokat nem lehet visszavonni vagy javítani szoftverrel, de ezek befolyásolják a szórásokat (Waterman & Evans, 2010), és ezt az információt a metaadatokban kell közölni.

Az érzékelő hardvert nagysebességű soros kristálytani kísérletekhez fejlesztik röntgen szabad elektron-lézer (XFEL) telepítéseknél vagy nagyáramú szinkrotron sugárvonalaknál, amelyek rendkívül gyors adatgyűjtést igényelnek. A konténer HDF5 formátumot, gyakran egy NeXus adatformátum réteggel a tetején, rugalmas és hatékony be-/kimenetre (I/O) tervezték ilyen nagy mennyiségű adathoz. Új adatfeldolgozó szoftvercsomagok, mint pl CrystFEL (Fehér et al. , 2012 ), cctbx.xfel (Sauter et al. , 2013) és HÍVÁSOK (Csónakos et al. , 2013) fejlesztése folyamatban van, és ez lehetőséget ad a metaadatokkal kapcsolatos problémák újbóli kezelésére.

A Dectris számos szinkrotron sugárvonalra telepítette az Eiger -érzékelőt. A metaadatok külön fájlban találhatók ( mester.h5 ) hivatkozással a képadatfájlokra. A NeXus adatábrázolása (K önnecke et al. , 2015), akárcsak a CIF, nagyon rugalmas, és minden szükséges metaadat rögzíthető a NeXus csoportok, mezők és attribútumok meghatározásával. Jó példa arra, hogyan lehet konzisztens és átfogó metaadatokat tárolni egy imgCIF/CBF fájlban, a 8. ábra mutatja be (J örg Kaercher, Bruker AXS, privát kommunikáció). A szabadalmazott Brukerben .sfrm formázza a kezdőszögeket 2 θ , ω , φ és χ (` SZÖGEK: . '). Tengelyirányuk nincs meghatározva, míg CBF formátumban vannak: az irányokat és a függőségeket a 8. ábra bal oldali panelje adja meg ( b ). Ban ben .sfrm a forgástengely " TENGELY: 2 ' a ω jelzést jelzi, a kezdőszög és a növekmény pedig a ` helyen található RAJT: "és" INCREME: ' az egyenértékű értékek a CBF fejlécében találhatók: ` _diffrn_scan_axis.displacement_angle ' és ' _diffrn_scan_axis.displacement_increment "(8. ábra b , jobb oldali panel).

4. A Rovinj -féle diffrakciós adatbeviteli műhelyből származó aggály és intézkedés

A workshopon nyílt megbeszélés során aggodalom hangzott el keresztül a kérdés ` El tudunk távolodni a tudásbázistól a különböző szoftvercsomagokban, és ki tudjuk használni a jól kidolgozott metaadat -formátumokat, például a CIF vagy a NeXus esetében? ', azaz a szabványosított nyers diffrakciós képadatok formátuma megkönnyítené a szoftverfejlesztők életét, de koordinációt igényelne a detektorgyártók között. Ez közvetlenül a megújult felhívásokhoz vezetett, hogy az egész közösségben szabványosított képformátumot nyújtsanak be. Ezzel a kérdéssel összefüggésben a DDDWG a metaadatok minimális követelményeinek meghatározásán dolgozik. Tudomásul vesszük, hogy a képformátumok továbbra is változatosak maradnak (nem utolsósorban az érzékelők meglévő telepített bázisa és az archivált régi adatkészletek miatt), valamint a konverziós segédprogramok, mint pl. eiger2cbf (https://github.com/biochem-fan/eiger2cbf) továbbra is szükség lesz. Mindazonáltal fontos, hogy bárki, aki további új formátumokat szeretne kifejleszteni, nagyon tisztában legyen a metaadatok megfelelő jellemzésének és interoperabilitásának szükségességével, amelyet fentebb leírtunk, és ez a tudatosság mérsékelheti az újabb, különösebb kimutatható érték nélküli formátumok elterjedését.

Egy külön megbeszélés során egyetértettek abban, hogy szükség van egy kritériumrendszerre az alapvető kísérleti metaadatok rögzítésére és validálására a tudományos eredmények reprodukálhatósága érdekében bármely adott nyers adatkészletből. A javaslat ezt "-nek" nevezte checkCIF nyers adatokért ”, és ebben a kérdésben szoros együttműködés alakult ki az IUCr COMCIFS -szel (elnöke James Hester, aki szintén részt vett a Rovinj Workshopon). Ezen ötletek továbbfejlesztése érdekében a DDDWG által szervezett workshopra kerül sor az ACA 2017 konferencián New Orleansban, 2017 májusában.

5. Záró megjegyzések

Ebben a aktuális áttekintésben leírásokat közöltünk a nyers adatok megőrzése és újrafelhasználása iránt gyorsan fejlődő érdeklődésről és tárolási lehetőségekről az IUCr és bizottságai által felügyelt tudományos területen. Kiemeltük a tudománypolitikai döntéshozók kezdeményezéseit egy „nyílt tudomány” modell felé, amelyen belül a kristálytudósok dolgozni fognak a jövőben, ez új finanszírozási lehetőségeket, de új eljárási kódexeket is hoz a nyílt tudomány keretein belül. Szükség lesz a kristálytudósok készségfejlesztésére és képzésére, valamint őszinte vitára. Összességében most már megvannak az eszközök és a szervezet a nyers adataink megőrzésére, de továbbra is sürgető az igény, hogy alaposan átgondoljuk az egyes IUCr Bizottságok metaadatleíróit. Megjegyezzük, hogy a Bizottságok sokféle eszközzel dolgoznak, ezért számos intézkedésre van szükség a jelenlegi helyzet javításához.

Kifejezetten azonosítottuk annak szükségességét, hogy újra áttekintsük a közösségnek a szabványos képformátum elfogadására vonatkozó előírását, és legalább egy minimális számú, a reprodukálhatósághoz szükséges metaadat -készletet kell elfogadnunk. Az imgCIF szótár (Hammersley et al. , 2005) természetes kiindulópontja az előbbinek, valamint a COMCIFS és a NIAC közötti interakciónak (Könnecke et al. , 2015) bemutatja egy közös ontológia alkalmazásának megvalósíthatóságát különböző fizikai formátumokon. Az is optimizmusra ad okot, hogy a ` checkCIF a nyers adatokért ”vonzó lesz mind a kutatók, mind a műszergyártók számára, tekintettel mindkettő lelkes képviseletére a rovinji műhelyben. Mint minden ilyen kezdeményezés esetében, az igénybevétel mértéke a közösségben lévő járművezetőktől függ. Az eredeti esetében " checkCIF „A származtatott adatok esetében a strukturális tudományos folyóiratok (különösen az IUCr folyóirat), amelyek megkövetelték a megfelelő metaadatokat és következetesség -ellenőrzést, egy ilyen fontos hajtóerőt jelentettek. A nyers adatok esetében, amelyek minden későbbi tudományos következtetést és levezetést megalapoznak, bátorítunk a kutatási adatkezelésre vonatkozó új politikákból, amelyeket ebben a cikkben összegeztünk, valamint a számos archiválási kezdeményezésből, amelyek a röntgendiffrakció körül keletkeztek. képek az elmúlt évek során.

Köszönetnyilvánítás

Hálásak vagyunk az IUCr-nek, hogy továbbra is támogatja a DDDWG tevékenységeit, beleértve a rovinji műhelyt, amely ehhez és számos más cikkhez vezetett. Nagyon hálásak vagyunk a különböző kutatóintézeteknek és egyetemeknek, akik elküldték munkatársaikat, hogy részt vegyenek a Workshopon. A technikai szolgáltatások és a kapcsolódó személyzeti költségek támogatását a Dectris, az IUCr Journals, a CODATA, a Cambridge Crystallographic Data Center, a Bruker, a FIZ Karlsruhe/ICSD, az Oxford Cryosystems és a Wiley támogatta, akiknek nagyon hálásak vagyunk. Ezúton is köszönettel tartozunk a Horvát Kristálykutatók Szövetségének, hogy aktívan segítettek abban, hogy a lehető legjobb műhelyt biztosítsák ennek a fontos témának a kezelésére.

Hivatkozások

Berman, H. M., Westbrook, J., Feng, Z., Gilliland, G., Bhat, T. N., Weissig, H., Shindyalow, I. N. & Bourne, P. E. (2000). Nucleic Acids Res. 28 , 235�. Web of Science CrossRef PubMed CAS Google Scholar
Bernstein, H. J. (2005). A képadatok osztályozása és felhasználása . Kristálytani nemzetközi táblázatok , Vol. G, A krisztallográfiai adatok meghatározása és cseréje , szerkesztette S. R. Hall és B. McMahon, 199. o.�. Dordrecht: Springer. Google ösztöndíjas
Bernstein, HJ, Bollinger, JC, Brown, ID, Gražulis, S., Hester, J. R., McMahon, B., Spadaccini, N., Westbrook, JD & Westrip, SP (2016) . J. Appl. Cryst. 49 , 277�. Web of Science CrossRef CAS IUCr Journals Google Scholar
Bernstein, H. J., Sloan, J. M., Winter, G., Richter, T. S., NIAC & COMCIFS (2013). BIG DATA képformátumokkal való megküzdés: CBF, NeXus és HDF5 integrálása . American Crystalographic Association Meeting, 2013. július 20󈞄, Honolulu, Hawaii, USA. Poszter T-16. Google ösztöndíjas
Diederichs, K. & Karplus, P. A. (2013). Acta Cryst. D 69 , 1215 �. Web of Science CrossRef CAS IUCr Journals Google Scholar
Digitális Kurátori Központ (2016). A finanszírozók adatkezelési szabályzatának áttekintése. http://www.dcc.ac.uk/resources/policy-and-legal/overview-funders-data-policies. Google ösztöndíjas
ESRF (2013). ESRFnews , decemberi kiadás, 14. o.󈞁. ESRF, Grenoble, Franciaország. Google ösztöndíjas
Grabowski, M., Langner, KM, Cymborowski, M., Porebski, PJ, Sroka, P., Zheng, H., Cooper, DR, Zimmerman, MD, Elsliger, M.-A., Burley, SK & Minor, W. (2016). Acta Cryst. D 72 , 1181�. Web of Science CrossRef IUCr Journals Google Scholar
Guss, J. M. és#38 McMahon, B. (2014). Acta Cryst. D 70 , 2520 és#82112532. Web of Science CrossRef IUCr Journals Google Scholar
Gutmanas, A., Oldfield, T. J., Patwardhan, A., Sen, S., Velankar, S. & Kleywegt, G. J. (2013). Acta Cryst. D 69 , 710 �. Web of Science CrossRef CAS IUCr Journals Google Scholar
Hall, S. R., Allen, F. H. & Brown, I. D. (1991). Acta Cryst. A 47 , 655�. CSD CrossRef CAS Web of Science IUCr Journals Google Scholar
Hall, S. R. & McMahon, B. (1995). Szerkesztők. Nemzetközi krisztallográfiás táblázatok , Vol. G, Kristálytani adatok meghatározása és cseréje . Dordrecht: Springer. Google ösztöndíjas
Hall, S. R. és#38 McMahon (2016). Data Sci. J. 15 , 3. Google Scholar
Hammersley, A. P., Bernstein, H. J. és#38 Westbrook, J. D. (2005). Képszótár (imgCIF) . Kristálytani nemzetközi táblázatok , Vol. G, A krisztallográfiai adatok meghatározása és cseréje , szerkesztette: S.  R. Hall és B. McMahon, 444�. Dordrecht: Springer. Google ösztöndíjas
Hester, J. R. (2016). Data Sci. J. 15 , 12. CrossRef Google Scholar
Nemzetközi Strukturális Genomikai Szervezet (2001). A strukturális genomika numerikus kritériumaival foglalkozó munkacsoport jelentése. http://www.isgo.org/organization/members07/010410.html. Google ösztöndíjas
Jacques, D. A., Guss, J. M., Svergun, D. I. & Trewhella, J. (2012). Acta Cryst. D 68 , 620�. Web of Science CrossRef CAS IUCr Journals Google Scholar
Jones, B. (2015). Az Európai Nyílt Tudományos Felhő felé . http://doi.org/10.5281/zenodo.16001. Google ösztöndíjas
Kabsch, W. (2010). Acta Cryst. D 66 , 125 �. Web of Science CrossRef CAS IUCr Journals Google Scholar
Kachala, M., Westbrook, J. & Svergun, D. (2016). J. Appl. Cryst. 49 , 302�. Web of Science CrossRef CAS IUCr Journals Google Scholar
K önnecke, M. et al. (2015). J. Appl. Cryst. 48 , 301 �. Web of Science CrossRef IUCr Journals Google Scholar
Kroon-Batenburg, L. M. J. & Helliwell, J. R. (2014). Acta Cryst. D 70 , 2502�. Web of Science CrossRef IUCr Journals Google Scholar
Marsh, R. E., Kapon, M., Hu, S. & Herbstein, F. H. (2002). Acta Cryst. B 58 , 62󈞹. CSD CrossRef CAS IUCr Journals Google Scholar
Matthews, B., Sufi, S., Flannery, D., Lerusse, L., Griffin, T., Gleaves, M. & Kleese, K. (2010). Int. J. Digit. Kurátor , 5 , 106 �. CrossRef Google Scholar
Messori, L. & Merlino, A. (2016). Coord. Chem. Fordulat. 315 , 67 󈟅. Web of Science CrossRef CAS Google Scholar
Meyer, GR, Arag ão, D., Mudie, NJ, Caradoc-Davies, TT, McGowan, S., Bertling, PJ, Groenewegen, D., Quenette, SM, Bond, CS, Buckle, AM & Androulakis , S. (2014). Acta Cryst. D 70 , 2510 és#82112519. Web of Science CrossRef IUCr Journals Google Scholar
Meyer, P. A. et al. (2016). Nat. Commun. 7 , 10882. Web of Science CrossRef PubMed Google Scholar
Minor, W., Dauter, Z., Helliwell, J. R., Jaskolski, M. & Wlodawer, A. (2016). Szerkezet , 24 , 216�. Web of Science CrossRef CAS PubMed Google Scholar
Nemzeti Tudományos Alapítvány (2010). Az adatkezelés és a gyakran ismételt kérdések megosztása (GYIK). http://www.nsf.gov/bfa/dias/policy/dmpfaqs.jsp. Google ösztöndíjas
Északnyugati Egyetemi Könyvtár (2016). Adatkezelés: Szövetségi Finanszírozó Ügynökség követelményei. http://libguides.northwestern.edu/datamanagement/federalfundingagency. Google ösztöndíjas
Ravel, B., Hester, J. R., Sol é, V. A. & Newville, M. (2012). J. Synchrotron Rad. 19 , 869 �. Web of Science CrossRef CAS IUCr Journals Google Scholar
Research Councils UK (2015). Útmutató a kutatási adatok kezelésének legjobb gyakorlatához. http://www.rcuk.ac.uk/documents/documents/rcukcommonprinciplesondatapolicy-pdf/. Google ösztöndíjas
Sauter, N. K., Hattne, J., Grosse-Kunstleve, R. W. & Echols, N. (2013). Acta Cryst. D 69 , 1274 �. Web of Science CrossRef CAS IUCr Journals Google Scholar
Schreurs, A. M. M., Xian, X. & Kroon-Batenburg, L. M. J. (2010). J. Appl. Cryst. 43 , 70 󈞾. Web of Science CrossRef CAS IUCr Journals Google Scholar
Science International (2015). Nyílt adatok egy nagy adatvilágban. Párizs: Nemzetközi Tudományos Tanács (ICSU), Nemzetközi Társadalomtudományi Tanács (ISSC), The World Academy of Sciences (TWAS), InterAcademy Partnership (IAP). Google ösztöndíjas
Shabalin, I., Dauter, Z., Jaskolski, M., Minor, W. & Wlodawer, A. (2015). Acta Cryst. D 71 , 1965 és#82111979. Web of Science CrossRef IUCr Journals Google Scholar
Strickland, P. R., Hoyland, M. A. & McMahon, B. (2005). Kis molekula kristályszerkezetű publikáció CIF használatával . Nemzetközi krisztallográfiás táblázatok , Vol. G, Kristálytani adatok meghatározása és cseréje , szerkesztette: S. R. Hall és B. McMahon, 557. és#8211569. Dordrecht: Springer. Google ösztöndíjas
Tanley, S. W. M., Diederichs, K., Kroon-Batenburg, L. M. J., Levy, C., Schreurs, A. M. M. & Helliwell, J. R. (2015). Acta Cryst. D 71 , 1982�. Web of Science CrossRef IUCr Journals Google Scholar
Tanley, S. W. M., Diederichs, K., Kroon-Batenburg, L. M. J., Schreurs, A. M. M. & Helliwell, J. R. (2013). J. Synchrotron Rad. 20 , 880�. Web of Science CrossRef CAS IUCr Journals Google Scholar
Tanley, S. W. M., Schreurs, A. M. M., Helliwell, J. R. & Kroon-Batenburg, L. M. J. (2013). J. Appl. Cryst. 46 , 108 �. Web of Science CrossRef CAS IUCr Journals Google Scholar
Tanley, S. W. M., Schreurs, A. M. M., Kroon-Batenburg, L. M. J. & Helliwell, J. R. (2016). Acta Cryst. F 72 , 253�. Web of Science CrossRef IUCr Journals Google Scholar
Terwilliger, T. C. (2012). A Macromol ­ekuláris kristályszerkezetek folyamatos fejlesztése . ICSTI Insights: The Living Publication , 16. o.,󈞉 (http://www.icsti.org/IMG/pdf/Living_publication_Final-2.pdf). Párizs: ICSTI. Google ösztöndíjas
Terwilliger, T. C. (2014). Acta Cryst. D 70 , 2500 �. Web of Science CrossRef IUCr Journals Google Scholar
Terwilliger, T. C. & Bricogne, G. (2014). Acta Cryst. D 70 , 2533 �. Web of Science CrossRef IUCr Journals Google Scholar
Toby, B. H. (2005). A por -diffrakciós adatok osztályozása és használata . Nemzetközi krisztallográfiás táblázatok , Vol. G, Kristálytani adatok meghatározása és cseréje , szerkesztette S. R. Hall és B. McMahon, 117. o.�. Dordrecht: Springer. Google ösztöndíjas
Vonrhein, C., Flensburg, C., Keller, P., Sharff, A., Smart, O., Paciorek, W., Womack, T. & Bricogne, G. (2011). Acta Cryst. D 67 , 293 �. Web of Science CrossRef CAS IUCr Journals Google Scholar
Waterman, D. & Evans, G. (2010). J. Appl. Cryst. 43 , 1356�. Web of Science CrossRef CAS IUCr Journals Google Scholar
Waterman, D. G., Winter, G., Parkhurst, J. M., Fuentes-Montero, L., Hattne, J., Brewster, A., Sauter, N. K. & Evans, G. (2013). CCP4 Newsl. Protein Crystallogr. 49 , 16 󈝿. Google ösztöndíjas
White, T. A., Kirian, R. A., Martin, A. V., Aquila, A., Nass, K., Barty, A. & Chapman, H. N. (2012). J. Appl. Cryst. 45 , 335 �. Web of Science CrossRef CAS IUCr Journals Google Scholar

Ez egy nyílt hozzáférésű cikk, amelyet a Creative Commons Attribution (CC-BY) licenc feltételei szerint terjesztenek, amely lehetővé teszi a korlátlan felhasználást, terjesztést és reprodukálást bármilyen médiában, feltéve, hogy az eredeti szerzőket és forrást megjelölik.


Cím: A diffrakciós képadatok elérhetővé tételével kapcsolatos tapasztalatok: milyen metaadatokat kell archiválnunk?

A helyi nyers „diffrakciós adatok képei” archívum elérhetővé vált, és néhány adathalmazt lekértek és újra feldolgoztak, ami két ciszplatinban részben elfoglalt Cl-atom anomális különbségi sűrűségének elemzéséhez, valamint a felbontási határérték újraértékeléséhez vezetett. ezeket a diffrakciós adatokat. A nyers adatok tárolására vonatkozó általános kérdéseket tárgyaljuk. Az is bebizonyosodott, hogy gyakran egyértelmű előzetes ismeretekre van szükség a (bináris) detektorformátum és a goniométer-geometriák beállításához. A közelmúltban az IUCr (International Union of Crystallography) kezdeményezte a diffrakciós adatlerakási munkacsoport létrehozását azzal a céllal, hogy szabványokat dolgozzon ki a strukturális dokumentumok közzétételéhez kapcsolódó nyers diffrakciós adatok ábrázolására. A nyers adatok archiválása több célt is szolgál: javítani a tudomány nyilvántartását, ellenőrizni a reprodukálhatóságot és lehetővé tenni a tudományos adatok részletes ellenőrzését, megvédeni a csalástól, és lehetővé tenni az újranalízist a jövőben továbbfejlesztett technikákkal. A probléma tanulmányozásának egyik eszköze az, hogy példaszerű publikációkat nyújt be a kapcsolódó nyers adatokkal és metaadatokkal. Egy nemrégiben végzett tanulmányban, amely a ciszplatin és a karboplatin hisztidinhez való kötődését lizozimkristályokban, többféle körülmények között hasonlította össze, a berendezés és a röntgendiffrakciós adatfeldolgozó szoftver lehetséges hatásait a ragadozó Pt-vegyületek foglaltságára és B-tényezőire hasonlították össze. Kezdetben 35,3 GB adatot továbbítottak Manchesterből Utrechtbe, hogy feldolgozzák az EVAL segítségével. A metaadatok rendelkezésre állásának részletes leírását és megvitatását közzétették egy dokumentumban, amelyet az Utrechti Egyetem helyi nyersadat -archívumához kapcsoltak, és tükröztek az ausztráliai TARDIS nyersdiffrakciós adatok archívumában. Ha ezeket a nyers diffrakciós adatkészleteket a cikkhez hozzáférhetővé teszi, a diffrakciós közösség saját értékelést készíthet. Ez arra késztette az XDS egyik szerzőjét (K. Diederichs), hogy újra integrálja az állítólag kizárólag megkötött karboplatint tartalmazó kristályok adatait, és ennek eredményeként elemezték a részben elfoglalt klór anomális elektronsűrűségeket a Pt-kötőhelyek közelében, és számos kritérium a diffrakciós felbontási határ alaposabb felméréséhez. A nyers adatok archiválására vonatkozó általános érveket, ennek lehetőségeit és az erőforrásigényt tárgyaljuk. Megvitatjuk a részben ismeretlen kísérleti beállításokkal kapcsolatos problémákat, amelyeket lehetőleg metaadatként kell elérni. Összefoglaljuk az adatok tömörítésével kapcsolatos jelenlegi gondolatokat, amelyek megoldást jelenthetnek különösen a finomszeletelésű pixel-eszköz adatkészletek esetében, amelyek egyébként kezelhetetlen mennyiségű adatot szolgáltathatnak. & laquo kevesebb


A makromolekuláris diffrakciós kísérletek nyilvános adatbázisa

A publikált kísérleti eredmények reprodukálhatósága az utóbbi időben számos tudományterületen felkeltette a figyelmet. Az eredeti elsődleges tudományos adatok hiánya jelentős tényező a reprodukálhatósági problémákhoz, azonban a strukturális biológiai közösség jelentős lépéseket tett a kísérleti adatok rendelkezésre bocsátása felé.

A makromolekuláris röntgenkristály-gráfia utat mutatott az atomkoordináták nyilvános terjesztésének és a kísérleti adatoknak a Protein Data Bank (PDB) és hasonló projektek útján történő közzétételéhez, és ezzel a területet a biológiai tudományok egyik leginkább reprodukálhatóvá tette.

Az IUCr 2011-ben megbízta a Diffraction Data Deposition Working Group-ot (DDDWG), hogy megvizsgálja a nyers diffrakciós képek archiválásának előnyeit és megvalósíthatóságát a krisztallográfiában. A 2011–2014-es DDDWG hároméves jelentés több kulcsfontosságú ajánlást fogalmazott meg a nyers diffrakciós adatok megőrzésével kapcsolatban. Az eredeti diffrakciós adatok nyilvános közzétételére azonban továbbra sincs kötelezettség.

Az integrált erőforrás a reprodukálhatósághoz a makromolekuláris kristálytanban (IRRMC) a Nemzeti Egészségügyi Intézet Big Data to Know programjának része, és a diffrakciós kísérletekből származó nyers adatok archiválására, valamint a kapcsolódó metaadatok biztosítására lett kifejlesztve. Az adatbázis [Grabowski et al. (2016). Acta Cryst. D72, 1181-1193, doi:10.1107/S2059798316014716], az írás idején 3070 makromolekuláris diffrakciós kísérletet (5983 adatkészletet) és a hozzájuk tartozó, részben kurált metaadatokat tartalmaz, amelyek az összes Protein-adatbank körülbelül 3%-át teszik ki. A forrás elérhető a http://www. fehérjediffrakció. org, és különféle kritériumok alapján kereshető egy egyszerű, áramvonalas felületen keresztül. Minden adat korlátlan hozzáféréssel és letöltéssel érhető el. Az erőforrás a koncepció bizonyítékaként szolgál, és bemutatja a nyers diffrakciós adatok és a kapcsolódó metaadatok archiválását a biológiai makromolekulák röntgenkrisztallográfiai vizsgálataiból.

A projektről egy riporterrel beszélgetve Wladek Minor csapatvezető azt mondta: "Annyi kutatás folyik folyamatban, hogy nem lehet mindent publikálni, és gyakran a sikertelen tanulmányok eredményei nem jelennek meg a szakirodalomban. Szerintem a kulcs A siker azt jelenti, hogy tudunk a sikertelen kísérletekről, tudni akarjuk, hogy miért kudarcot vallanak."

A projekt célja az IRRMC kiterjesztése és olyan adathalmazok bevonása, amelyek nem adtak röntgenszerkezeteket. Ez elősegítheti a fehérjék szerkezetének meghatározására szolgáló módszerek javítására irányuló együttműködési erőfeszítéseket, és biztosíthatja az egyes kutatók és/vagy kihalt strukturális genomikai projektek által hátrahagyott "árva" adatok elérhetőségét.

Jogi nyilatkozat: AAAS és EurekAlert! nem vállal felelősséget az EurekAlert -hez közzétett híradások pontosságáért! közreműködő intézmények által vagy bármilyen információ felhasználására az EurekAlert rendszeren keresztül.


Rendelkezésre állnak -e eredeti röntgendiffrakciós adatok - Biológia

a Life Science, Diamond Light Source, Harwell Science and Innovation Campus, Didcot, Oxfordshire OX11 0DE, Egyesült Királyság és b Oxfordi Egyetem Strukturális Biológiai Osztálya, Wellcome Center for Human Genetics, Oxford, Oxfordshire OX3 7BN, Egyesült Királyság
* Levelező e-mail: [email protected], [email protected]

Az utóbbi években egyre fontosabbá vált a módszerek kidolgozása a nagy felbontású szerkezetek mikrométer vagy akár szubmikrométer méretű fehérjekristályokból történő meghatározására. Ez vonatkozik mind a nagy fehérjekomplexekre, mind a membránfehérjékre, ahol a fehérjetermelés és a nagyméretű homogén kristályok későbbi növekedése kihívást jelent, és azokra a mintákra, amelyek csak mikro- vagy nanokristályokat, például amiloid- vagy vírusos polihedrin-fehérjéket termelnek. A Diamond Light Source sokoldalú makromolekuláris krisztallográfiai mikrofókusz (VMXm) sugárvonala mikro- és nanokristályok röntgendiffrakciós mérésére specializálódott. A látható fénymikroszkópia felbontási határát megközelítő kristályos mintákból származó adatok mérésének lehetősége miatt a nyalábvonal-kialakítás egy pásztázó elektronmikroszkópot (SEM) tartalmaz a kristályok megjelenítésére, lokalizálására és pontos központosítására a röntgendiffrakciós kísérletekhez. Annak biztosítására, hogy a pásztázó elektronmikroszkópia megfelelő módszer a minták megjelenítésére, teszteket végeztünk a SEM-sugárzás diffrakciós minőségre gyakorolt ​​hatásának felmérésére. A citoplazmatikus polyhedrosis vírus polihedrin fehérje kristályait elektronmikroszkópos rácsokon kriokondírozták, a röntgendiffrakciós adatok gyűjtése előtt SEM sugárzásnak tették ki. Az adatok feldolgozása után azzal HÍVÁSOK , nem találtunk statisztikailag szignifikáns különbséget az adatminőségben a SEM sugárzásnak kitett és nem kitett kristályokból gyűjtött adatkészletek között. Ez a tanulmány támogatja a SEM használatát a fehérjekristályok vizualizálásának eszközeként és integrált vizualizációs eszközként a VMXm sugárvonalon.

1. Bemutatkozás

Az elmúlt évtizedben a mikrofókuszos röntgensugár-nyalábok elősegítették a szerkezetbiológia fejlődését azáltal, hogy egyre kisebb, intenzívebb röntgensugarakat biztosítottak. A több tíz mikrométeres és néhány mikrométeres nagyságrendű kristályméreteket ma általában hozzáférhetőnek, bár kihívást jelentő célkitűzésnek tekintik a fehérjék szerkezetének biológiai projektjeiben. A sorozatos femtoszekundumos krisztallográfiai röntgen-szabadelektron-lézeres (XFEL) megközelítések szintén kitágították ezt a határt, több tízezer mikrokristály felhasználásával [az áttekintést lásd: Martin-Garcia et al. (2016)], sőt nanokristályok (Gati et al. , 2017) nagy felbontású fehérjeszerkezetek meghatározására. Ennek ellenére az XFEL-alapú technikáknak megvannak a maguk kihívásai, beleértve a szükséges kristályszámot, a forgási adatok gyűjtésének képtelenségét, valamint az XFEL sugárzási idő költségeit és korlátozott rendelkezésre állását. A szinkrotron soros kristályosítási módszerek is fejlődnek, de gyakran ismét meglehetősen nagy mennyiségű kristályt igényelnek (Ebrahim et al. , 2019 Diederichs & Wang, 2017). Az elektrondiffrakció egy másik növekvő technika a szerkezet meghatározására néhány száz nanométer méretű fehérjekristályokból (Shi et al. , 2013 Nannenga et al. , 2014 Yonekura et al. , 2015 Clabbers et al. , 2017 Xu et al. , 2018), a minta vastagságának felső határa: � �  nm (Shi et al. , 2013). A fókuszált ionsugaras őrlés módot ígér ennek a vastagsági határnak a megkerülésére a felesleges kristályminta szelektív eltüntetésével, így vékony (� nm) lamellát kapunk, amelyről adatokat lehet gyűjteni (Duyvesteyn). et al. , 2018 Martynowycz et al. , 2019). Ennek ellenére az alacsony dózisú fehérje-elektron-diffrakciós vizsgálatokhoz dedikált érzékelőkkel és szoftverekkel felszerelt cryoEM mikroszkópok ésszerűek.

A sokoldalú makromolekuláris kristálytani mikrofókusz (VMXm) sugárvonal a Diamond Light Source-ban, a VMX sugárvonal-csomag része, célja, hogy tovább növelje a szinkrotron-alapú röntgen-kristálytani kristályméretek körét. A VMXm -et úgy tervezték, hogy lehetővé tegye a rotációs adathalmazok gyűjtését 0,5 és#8197 és#181 m méretű kristályokból, ezáltal csökkentve a fehérje szerkezetének meghatározásához szükséges mintaanyagot, összehasonlítva a soros módszerekkel, javítva az egyes egyedekről rögzített adatok minőségét. kristály. Ezenkívül a több mikrométer vagy annál kisebb méretű kristályok csökkentett arányú sugárzási károsodást szenvedhetnek a röntgendiffrakciós kísérletek során azáltal, hogy kihasználják a lehetséges fotoelektron-szökési hatásokat (Nave & Hill, 2005). Holton és Frankel (2010) vitája azt sugallta, hogy ideális körülmények között lehetséges a 2.0   Å felbontás szerkezetének meghatározása egyetlen gömb alakú lizozim fehérje kristályából, amelynek átmérője 𕙙.2   & #181m. Ez a szimuláció figyelmen kívül hagyott minden, a kristályon belüli rendezetlen oldószerből származó háttér szóródáshoz való hozzájárulást. A VMXm célja az elmélet és a jelenleg lehetséges makromolekuláris krisztallográfia közötti szakadék megszüntetése szinkrotronröntgen segítségével. Eddig és tudomásunk szerint a Ginn jelentette a legkisebb kristályokat, amelyeket rotációs módszerrel mértünk szinkrotronon, hogy szerkezetet kapjunk et al. (2015), ahol 768 𕙙.0   µm 3 méretű kristályok diffrakciós adatait rögzítették a Diamond beamline I24 -en, elemezték és egyesítették, hogy 2,2   Å felbontásra teljes adatkészletet hozzanak létre.

A VMXm beamline optika 0,3󈝶 µm fókuszált, változtatható függőleges röntgensugarat biztosít egyetlen egyedi profilú fix fókusztávolságú tükör használatával (Laundy et al. , 2016). A 0,5𔃃 µm vízszintes nyalábméreteket kétlépcsős nagyítási sémával és változó másodlagos forrásnyílással kell elérni. A vízszintesen elhajló kettős kristályú monokromator 6 és 28  keV közötti energiát tesz lehetővé, és az optikai konfigurációtól függően 10 11 és 10 12  foton  s 𕒵 közötti energiát szállít a mintához, amikor 12 és#8197keV-on működik. A VMXm mintáit általában elektronmikroszkópos rácsokon készítik el, a cryoEM-ből kölcsönzött technikák alkalmazásával. A szórt röntgensugarak jel-zaj viszonyának további javítása érdekében a mintakörnyezetet 󕽺 𕒺  mbar vákuum alatt tartják. 2020 januárjától befejeződött a gerenda nagy építése, az alkatrészek üzembe helyezése folyamatban van.

A forgatási adatok összegyűjtése, szemben az egyedi állóképekkel, a mikrométernél kisebb fehérjekristályokból számos gyakorlati kihívást jelent, amelyek túlmutatnak a nyilvánvaló sugárzási károsodási korlátokon, különösen az ilyen méretű kristályok helyének meghatározása és központosítása a röntgensugárhoz. Annak érdekében, hogy az ebben a mérettartományban lévő kristályokból forgatási adatokat lehessen gyűjteni, a VMXm célja egy sugárpozíció és egy mintapozíció előállítása, amelyek 50 és#8197 nm közötti tartományban stabilak. Ezek a tervezési előírások a minta helyzetének nagy pontosságú és felbontású képalkotását írják elő, hogy biztosítsák a sugár és a minta egybeesését. Ezért a mikro- és nanokristályok igazításához és megjelenítéséhez, amelyek az optikai fénymikroszkóp felbontóképessége alatt maradhatnak, egy pásztázó elektronmikroszkópot (SEM) építettek be a VMXm végállomás mintakörnyezetébe. Bár más módszereket is vizsgáltak a fehérjekristályok megjelenítésére és központosítására (áttekintést lásd Becker et al. , 2017), a SEM kiváló felbontása és a SEM képminőség függetlensége a kristálytércsoporttól, morfológiától, orientációtól és fehérjeszekvenciától képezte ennek a tervezési döntésnek az alapját. A SEM ilyen módon történő használatánál azonban az egyik szempont a minták elektronkölcsönhatásokból eredő károsodásának lehetősége. Hattne elemzésében et al. (2018) szerint a 200 keV-os elektronnyaláb használatából eredő globális és helyspecifikus sugárzási károk arra utalnak, hogy a beeső 𕙛 e −  Å 𕒶 elektrondózis okozta a veszteséget. nagy felbontású információ (a 3 Å és annál nagyobb felbontás tükröződésének minősül). Ez összhangban van a korábbi elemzésekkel, amelyek a fehérjekristályok elektron által kiváltott sugárzási károsodását értékelték (Chiu, 2006 Henderson, 1995).

A bevonat nélküli biológiai minták CryoSEM alkalmazásai nagyságrendekkel kisebb gerjesztési energiákat használnak, mint a Hattne által leírt transzmissziós elektronmikroszkópos (TEM) módszerek et al. (2018). Ahelyett, hogy be kellene hatolni a teljes kristálytérfogatba, mint a TEM-alapú kísérletekben, a SEM sugárnak csak a kristály felszíni rétegével kell kölcsönhatásba lépnie a képalkotáshoz. Bár kevés publikált adat áll rendelkezésre a fehérjekristályok SEM kölcsönhatási térfogatairól, amikor alacsony (ɝ  keV) beeső energiákat használnak, a Kanaya –Okayama becslése a tiszta amorf szén interakciós féltekéjéről �  nm 2 &# 8197keV (Kanaya & Okayama, 1972). Monte Carlo szimulációk Barnett által et al. azt sugallják, hogy a 2 keV-os elektronok behatolási mélysége a vízjégben � nm, bár ugyanezen csoport további kísérletei azt sugallják, hogy ezek a szimulációk talán alábecsülik ezt a mélységet (Barnett et al. , 2012). Végül a 2  keV elektronok grafénnel bevont kitinnel való kölcsönhatásának szimulációi 140 és#8197 nm maximális behatolási mélységet biztosítottak (Park et al. , 2016). Ezen adatok alapján a fehérjekristályon belüli 2 keV-os elektron kölcsönhatási mélysége valószínűleg 100-200 nm.

Ebben a tanulmányban a poliéderes fehérjekristályok a Lymantria dispar A citoplazmatikus polyhedrosis vírust (CPV14) egy offline SEM segítségével képeztük le, amelynek oszlopát közvetlenül a VMXm végállomásba kell integrálni, hogy lehetővé tegyük a fehérje kristályok jövőbeli megjelenítését és központosítását. Később röntgendiffrakciós adatokat gyűjtöttek ugyanezekből a SEM-képű kristályokból. A cél annak meghatározása volt, hogy a SEM-képek gyűjtése káros-e a CPV14 kristályok diffrakciós minőségére. Ezt úgy végezték el, hogy felmérték, hogy megfigyelhető -e szignifikáns különbség az elektronoknak kitett kristálymintákból mért diffrakciós adatok és azok között, amelyek nem. Bemutatjuk, hogy az alacsony dózisú SEM képalkotás életképes módszer a fehérjekristályok pontos lokalizálására és igazítására anélkül, hogy befolyásolná a diffrakciós minőséget a röntgen adatgyűjtés előtt.

2. Anyagok és módszerek

2.1. Monte Carlo szimulációk

A program KASZINÓ (Hovington et al. , 1997 Drouin et al. , 2007) a fehérje kristályban lévő 2  keV elektronok pályájának és behatolási mélységének szimulálására használták. Összesen 200 elektront szimuláltak 10 nm-es nyalábként. A fehérjekristály mintát 1000 és#8197 nm vastagsággal írták le a C képlettel 1284 H 2695 N 351 O 748 S 12 és sűrűsége 1,35  g  cm 𕒷. Ez a sztöchiometria emulálja a 22% oldószertartalmú CPV14 kristályok kémiai összetételét [PDB ID 5a96 (Ji et al. , 2015 )].

2.2. Fehérje előállítása és kristályosítása

A CPV14 poliédereket expresszáltuk és tisztítottuk a korábban leírtak szerint (Hill et al. , 1999 Anduleit et al. , 2005 Ji et al. , 2015). A tisztított köbös CPV14 kristályok mérete 2 𔃂   µm minden dimenzióban, és hígtrágyaként H -ban tárolták 2 O 4°C-on.

2.3. Mintaszerelés

A CPV14 kristályos szuszpenziót 1: 12 arányban hígítottuk etil- és#173énglikol -oldattal, így 50%-os végső etil- és#173énglikol -koncentrációt kaptunk. v / v ). Etil- és#173énglikolt adtak hozzá, hogy lehetővé tegyék a következő blotolási folyamat finomabb szabályozását, és biztosítsák a kristályok krioprotektív védelmét.

A kristályokat elektronmikroszkópos rácsokon kriohűtöttük a további elemzés előkészítéseként. A Cu 200 mesh rácsokat Quantifoil R 2/2 szénfóliával (Quantifoil) vagy a Cu 400 mesh H7 keresőrácsokat lyukas szénnel (AgarScientific) borították, a minta felvitele előtt izzóan kisütötték. 2   µl 50%-os alikvot ( v / v ) etil- és#173énglikolt vittünk fel a rács Cu oldalára, majd 2   µl hígított kristályos szuszpenziót vittünk fel a szénfóliára. A rácsot ezután 3,0𔃃.5 s-ig lefújtuk a rács Cu-oldaláról Leica EM GP segítségével (20°C, páratartalom 90%). A lefoltozott rácsokat ezután folyékony etánba merítettük. A rácsokat folyékony nitrogén alatt tároltuk, amíg szükség volt rá.

2.4. Mintakezelés

A mintákat négy kezelési csoportra osztottuk: kezeletlen, SEM terhelésű, SEM nem exponált és SEM expozíciós, amelyek részleteit a 2.4.1. És#82112.4.3. Az elektronsugaras expozícióból eredő sugárzási károk felmérésére irányuló vizsgálatokat JEOL JSM-IT100 SEM készülékkel végeztük, amely Quorum PP3000T kriosztázs és kriotranszfer rendszerrel van felszerelve. A PP3000T kriosztályozást, az előkészítési szakaszt (előkészítés) és a szennyeződésgátlót � °C, � °C és � °C -ra hűtöttük. A kísérletek során egy aranybevonatú réz Zeiss pásztázó TEM-transzferrel tartották a mintákat.

2.4.1. Kezeletlen

A kezeletlen mintákat folyékony etánban lefagyasztottuk, és folyékony nitro- és#173gen -ben tároltuk a 2.3.

2.4.2. SEM betöltve

A SEM-mel töltött mintákat a kriotranszfer rendszer segítségével a SEM-be továbbítottuk. Mélyhűtött mintákat töltöttünk az ingajáratba folyékony nitro és#173gen alatt. A kriotranszfer rendszerrel a mintákat a SEM hűtött előkészítő kamrájába vittük át. A transzfert 30 és#8197 másodpercig az előkészítőre helyezték, mielőtt 2 és#8197 percre átszálltak a SEM színpadra. Az űrsiklót ezután további 30 másodpercre visszahúzták az előkészítő szakaszba, mielőtt a vákuumból folyékony nitrogénbe vitték át a kriotranszfer rendszer segítségével. A mintát ezután kivettük a transzferből és folyékony nitro ­gen alatt tároltuk.

2.4.3. SEM nem exponált és SEM exponált

A SEM- és SEM-exponálatlan röntgendiffrakciós kísérletek kristályai mind ugyanazon a rácson voltak, hogy ellenőrizzék a rácsok közötti mintaváltozást a rácskezelés miatt. Ezeket a rácsokat ugyanúgy kezeltük, mint a SEM-be töltött mintákat (lásd a 2.4.2. szakaszt), azonban a SEM szakaszon a 2  perces inkubáció helyett a rácsokat ezen a szakaszon tartották 𕙙.5  óráig, míg a SEM expozíciókat hajtottak végre. A SEM-nek kitett kristályokat 2 és#8197 kV gyorsítófeszültséggel, 40 szondaárammal (tetszőleges egységek) és 10 és#8197 mm működési távolsággal ábrázoltuk. A rács körüli navigáció és a rács minőségének felmérése érdekében a rács globális képét 30 és#215 nagyítással készítették, 0,5 és#8197 másodperces felvételi idővel (teljes dózis, 4,6 × 10 𕒼  e & #8722  Å 𕒶 ). Ezután egyetlen rács négyzetet használtak a fókusz és az asztigmatizmus optimalizálására. Az optimális paraméterek azok voltak, amelyek a szem alapján a legélesebb képet nyújtották. A kép kontrasztját és fényerejét az automatikus kontraszt és fényerő funkció segítségével optimalizáltuk InTouchScope szoftvercsomag (JEOL). A kristályokat tartalmazó egyes rácsnégyzetek képei 1900 × nagyítással készültek 20  s rögzítési idő alkalmazásával (7,6 × 10 𕒷  e −   Å 𕒶). 50 és 75 közötti rácsnégyzetet ábrázoltak ilyen körülmények között, ezeken a képeken a kristályok alkották a SEM-nek kitett populációt. A rács többi részét elektronoknak nem tették ki. Ezeken a területeken a kristályok alkották a SEM-expozíció nélküli populációt. Az ezekhez a képekhez tartozó elektron-dózis számítások leírása megtalálható a támogató információban.

2.5. Röntgen adatgyűjtés

Elektronmikroszkópos rácsokat rögzítettek a sugárvonal goniométerre egy egyedi gyártású mintatű segítségével. A tű egy véredénycsipesz volt (14120 termék, World Precision Instruments) egy szabványos mágneses tűalapon, amelyet a 3M Scotch-Weld Ep­oxy Adhesive 1838 tartott a helyén [lásd a S1( ábrákat). a –S1 ( c ) a Támogató információk között]. A rácsokat folyékony nitrogén alatt helyezték át a csapba, majd lezárták [ábrák. S1 ( d )–S1( f )]. A kupakkal ellátott csapot kézzel szerelték fel a goniométerre, és a kupakot gyorsan eltávolították, így a rács gyorsan ki volt téve a kriosztáramnak, mielőtt a folyékony nitro ­gen lecsapolt volna a kupakról.

Az adatokat a gyémánt fényforrás I24 és I04 sugárvonalain mértük. Az adatokat minden esetben 0,1° oszcillációs szélességgel és 0,05 s expozíciós idővel 5° ékként gyűjtöttük össze. Az I24 adatait egy Dectris PILATUS3 6M detektorral gyűjtöttük, 6 × 9 µ m [teljes szélesség a maximum felénél (FWHM)] 100%-os átvitel és 0,9686&# hullámhossz mellett. 8197 Å, 3.0 × 10 12  fotonok és#8197s 𕒵 fluxus. Az I04 adatait egy Dectris PILATUS 6M-F detektorral vettük fel, amelynek nyalábmérete 11 × 5 µm (FWHM) 100%-os átvitel mellett és 0,9795 Å hullámhossz, 28 fluxust eredményezve. × 10 11  fotók  s 𕒵. A négy feltétel mindegyikére vonatkozóan legalább három egymástól függetlenül készített rácsból gyűjtöttünk adatokat. Legalább 100 kristályt elemeztünk minden állapothoz minden rácson. A SEM-nek kitett kristályok esetében az elektronmikroszkópos képeket a röntgensugár-minta helyzetének optikai mikroszkóp nézeteivel kombinálva használták fel az elektronoknak kitett kristályok azonosítására.

2.6. Adatfeldolgozás és elemzés

Annak érdekében, hogy felmérhessük a diffrakciós minőségben mutatkozó esetleges különbségeket, az adatokat feldolgoztuk HÍVÁSOK (Téli et al. , 2018), majd segítségével elemeztem KEVERÉK (Foadi et al. , 2013). A szintézis módja KEVERÉK Ezt követően az egyes kezelésekből gyűjtött adatok skálázására és egyesítésére használták egyetlen rácsról.

Annak érdekében, hogy a SEM-expozíció és a SEM-expozíció nélküli kezelések között különbségeket keressünk a kezdeti diffrakciós minőségben, minden adatkészletet ugyanabból a sugárvonalból gyűjtöttünk össze, amelyeket sikeresen integráltunk HÍVÁSOK segítségével méretezték össze tárcsázza.skála . A program tárcsázza.cosym a skálázás előtti következetes indexelés biztosítására használták (Gildea & Winter, 2018). A skála tényező és relatív B faktort az egyes adatkészletek első képéhez, majd a tárcsázza.python végrehajtani a Piton a forgatókönyvet házon belül fejlesztették ki.

Három párhuzamos rács három teljes méretezett és egyesített adatkészletet hozott létre mind a négy kezelési csoporthoz. A kulcsfontosságú krisztallográfiai statisztikák átlagértékeit e három ismétlésben egyutas varianciaanalízis (ANOVA) módszerrel hasonlítottuk össze. A SEM-expozíciós és SEM-expozíció nélküli kezelések kulcsstatisztikáinak átlagértékeit Student-féle t-teszttel is összehasonlítottuk egymással. A léptéktényezők és a relatív eloszlások B Az egyes kezelési csoportok adatainak kezdeti képeihez tartozó tényezőket Kolmogorov és#8211Smirnov (KS) tesztek segítségével hasonlítottuk össze. Ezeket a statisztikai elemzéseket a következővel végeztük GraphPad Prizma 8.0 (GraphPad Software, La Jolla, Kalifornia, USA).

3. Eredmények és megbeszélés

3.1. Monte Carlo szimulációk

A 2  keV elektronok átlagos behatolási mélysége egy szimulált CPV14 kristályban 70,0 ± 19,8  nm volt, a maximális behatolási mélység pedig 109,8  nm (S2. Ábra). Meg kell azonban jegyezni, hogy Barnett kísérletei et al. (2012) és#8211, amelyek az amorf víz-jég kristályok elektronbehatolási mélységét értékelték, és azt sugallják, hogy KASZINÓ A szimulációk alulbecsülhetik az elektronok behatolási mélységét ezeken az alacsony gyorsító feszültségeken. Mindazonáltal ezek a szimulációk becslést adnak a CPV14 fehérjekristályok elektronkölcsönhatási térfogatáról. Ezen az alapon egy 2 µm CPV14 kristály (8 µm 3 ) esetében a kristály teljes felületén átpásztázott 2 keV-os elektronok átlagosan a teljes felület 𕙛,5%-át képesek áthatolni. diffrakciós térfogat. 0,5   µm (0,125   µm 3) kristály esetén ez a teljes diffrakciós térfogat 󕽾% -ára nő. Ez az elemzés azonban nem tájékoztat arról, hogy az elektronok milyen hatással vannak a diffrakciós minőségre.

3.2. Mintaelőkészítés és SEM expozíció

A CPV14 kristályok folyékony etánba történő mélyhűtése Leica EM GP-vel reprodukálható módszert biztosított a kristályok krioEM rácsokra való rögzítésére. A kristályok téglatestű morfológiája a kristályok preferált orientációját eredményezte a rácsokon. A kristályok felületük általában párhuzamosan feküdt a rácson lévő szénfilmmel, ritkán a kristályok élen vagy csúcson feküdtek. Bár itt nem fedezték fel, Wennmacher által tervezett módszerek et al. (2019) kimutatták, hogy sikeresen küzdenek a kristályok preferenciális orientációjával elektronmikroszkópos rácsokon. Ezek a módszerek valószínűleg különösen hasznosak lesznek a jövőben olyan esetekben, amikor alacsony szimmetriajú tércsoportokból származó kristályokat érint, amelyek preferenciális orientációt mutatnak. Jelentős kézi kezelésre volt szükség ahhoz, hogy a mélyhűtött rácsokat a SEM-be és onnan ki, majd a röntgensugár-vonalra vigyék, miközben a mintákat krio hőmérsékleten tartották. A mechanikus kezelés és a mintarácsok 1 × 10 𕒺   mbar-os vákuumból történő be- és kiszállításának kombinációja a mintakezelés eltéréseit indukálhatta, és az elektronsugár által okozott kristálytulajdonságokon kívüli különbségeket is okozhat. kitettség. Annak érdekében, hogy ellenőrizzék ezt a rács-rács eltérést a kristályjellemzőkben, amelyek potenciálisan elfedhetik az elektronnyaláb hatásának hatásait, a SEM- és SEM-exponálatlan kristályokra vonatkozó adatokat egyetlen rácsból vettük. . Ezeknél a mintáknál a rács egy része elektronoknak volt kitéve, és az ebben a szakaszban található kristályok a SEM-nek kitett kristályok populációját alkotják. A rács fennmaradó része nem volt kitéve elektronoknak és kristályok ebben a szakaszban alkották a SEM-nek nem exponált populációt.

3.3. Adatgyűjtés

A CPV14 kristályok egy SEM-képe látható az 1. ábrán ( a ). A képen látható kristályok azon kristályok populációjának részét képezik, amelyek a röntgen adatgyűjtés előtt elektronoknak voltak kitéve. Annak érdekében, hogy röntgendiffrakciós adatokat gyűjtsünk ezekből a SEM-expozíciójú kristályokból, minden kristályt meg kell találni és azonosítani kell a röntgen sugárvonalon az optikai mikroszkóp tengelyre néző rendszerével (OAV). Ezt „kereső” elektronmikroszkópos rácsokkal érték el (lásd a 2.3. szakaszt), így minden egyes rácsnégyzet könnyen azonosítható és indexelhető volt mind a SEM, mind az OAV nagyítási sémában. 1. ábra ( b ) a SEM képen látható kristályok megfelelő OAV képét ábrázolja. A felbontás javulása SEM használatakor nyilvánvaló. Könnyebb azonosítani az egyes kristályokat körülvevő üveges kristályos oldatot és a rézrácsrudakhoz közel eső üveges kristályos oldat területeit is.


1.ábra
A CPV14 kristályok elektronok és látható fény mikroszkóppal készültek. ( a ) Példa CPV14 kristályok krioSEM-képe 2 kV gyorsítófeszültségen, 10 mm munkatávolsággal és 7,6 × 10 𕒷  e − ̳&7 #87222. A képen látható kristályok a SEM-expozíciós kezelési csoport részét képezték. Ilyen körülmények között a maximális elérhető felbontás ezzel a mikroszkóppal 𕙠  nm. ( b ) Az OAV optikai mikroszkóppal készített kép az I24 sugárvonalról a megfelelő rácsnégyzetet mutatja a panelen ( a ). A maximális elérhető felbontás ezzel az optikai mikroszkóppal 0,7   µm. A panelen ( b ), a piros szálkereszt jelzi a mikrofókusznyaláb helyzetét az I24-en a röntgendiffrakciós adatgyűjtés előtt egyetlen CPV14 kristályból. Az egyenértékű pozíció a panelen ( a ) szaggatott fehér kör jelzi. Mindkét panelen a skála 10   µm.

A kristályok preferenciális orientációjának leküzdésére a rácsokon összehangolt erőfeszítéseket tettek az adatok összegyűjtésére különböző kiindulási szögek segítségével az 5 ° ék rácsának tájolására vonatkozóan. A rácsok korlátozták a forgásszögeket, amelyekből adatokat lehetett gyűjteni. Mivel a rács a sugárra merőleges, ∼ 䕠 ° adatokat lehetett gyűjteni a rács "elölről" és "hátuljáról", így a � ° teljes elérhető tartománya elérhető. E korlátozás ellenére a CPV14 kristályok nagy szimmetriája miatt még mindig lehetséges volt teljes adatok beszerzése (tércsoport én 23).

3.4. Adatfeldolgozás és elemzés

HÍVÁSOK az 5 és#176 adat ék feldolgozására használták. Ahol az adatok sikeresen integrálhatók voltak, a kapott .mtz fájlokat betáplálták KEVERÉK . Az összes klaszter az elemzési módból KEVERÉK méretezték és egyesítették, mielőtt az egyes rácsokból mért kristályokból egyetlen optimális teljességű adatkészletet vettek volna elő további elemzés céljából. Minden adatkészletnél a nagy felbontású levágást a CC alapján választottuk 1/2 > 0,3 (Karplus & Diederichs, 2015), ami néha a program további futtatását igényelte CÉLTALAN belül KEVERÉK csővezeték. Ennek az adatfeldolgozási lépésnek az eredményeit az 1. és 2. táblázat tartalmazza.

Asztal 1
Adatfeldolgozási statisztikák

A külső héj értékei zárójelben vannak megadva.

2. táblázat
Adatfeldolgozási statisztikák

A külső héj értékeit zárójelben adjuk meg.

A maximális felbontás általános értékei, R p.i.m. és CC 1/2 mind a négy kezelési csoportra gyűjtött adatokra ábrázoltuk (2. ábra). Minden egyes kezelési csoporthoz legalább három teljes adatkészletet gyűjtöttünk. A SEM-expozíciós és a SEM-expozíció nélküli adatkészletek esetében teljes adatkészletet gyűjtöttünk mindkét kezelési csoportra a három ismétlődő rács mindegyikéből, azaz rácsonként egy SEM- és egy SEM-exponálatlan adatkészlet, összesen hat adatkészletet biztosítva. Ezután a fent felsorolt ​​statisztikák mindegyikének átlagértékét kiszámítottuk az egyes mintakezelések ismétléseire. Ezen statisztikák átlagértékeit összehasonlítottuk minden kezelési csoportban egy egyirányú ANOVA módszer alkalmazásával. Ezek az elemzések nem mutattak statisztikailag szignifikáns különbséget a maximális felbontás átlagértékei között, R p.i.m. vagy CC 1/2 bármelyik kezelési csoportban. Egy további Student-féle t-tesztet használtunk ezen statisztikák átlagértékeinek összehasonlítására a SEM- és SEM-exponálatlan adatkészletek között. Ezzel az elemzési módszerrel nem volt statisztikailag szignifikáns különbség ( p > 0,05) a 2 keV-os SEM-nyalábnak előzetesen kitett kristályokról (SEM exponált) és a nem exponált kristályokról (SEM exponálatlan) gyűjtött adatok között mérve.


2. ábra
A négy kezelési csoport egyesített adatkészleteinek legfontosabb adatfeldolgozási statisztikái: kezeletlen (cián), SEM betöltve (zöld), SEM nem exponált (kék) és SEM exponált (piros). Telek ( a ) maximális felbontás, ( b ) R p.i.m. és ( c ) CC 1/2 az egyes adatkészleteket színes körként jelenítse meg, a fekete vonal pedig az átlagértéket jelzi. A SEM-exponálatlan és a SEM-nek kitett minták esetében a körök melletti számok jelzik, hogy a három rács közül melyikből gyűjtötték az adatokat. Az 1. és 2. rács adatait az I24-en, a 3. rács adatait pedig az I04-en gyűjtöttük.

A kristályok SEM-sugárzásnak való előzetes expozíció által okozott lehetséges károsodásának további vizsgálata érdekében az I24-en gyűjtött 1151 integrált adatkészletet összeskálázták. Ezt a segítségével sikerült elérni tárcsázza.cosym (Gildea & Winter, 2018), a következetes indexelési rendszer biztosítása érdekében, majd ezt követően tárcsázza.skála . Annak értékelésére, hogy a mintakezelések jelentősen megváltoztatták -e a kristályok kezdeti diffrakcióját, mind a skálafaktor, mind a relatív B Az egyes adatkészletekből származó kezdeti diffrakciós minta tényezőjét kivontuk az adatokból, ezeket az értékeket hisztogramként ábrázolhatjuk az egyes kezelési csoportokhoz a 3. ábrán.


3. ábra
A kezdeti léptéktényezőket és a relatívt mutató hisztogramok B A különböző kezelések során a kristályokból gyűjtött adatkészletek tényezői. Méretezési tényezők ( a )–( d ) és relatív B tényezők ( e )–( h ) az egyes CPV14 kristályokból gyűjtött adatkészletek első képkockájához az összes 1151 adatkészlet egyetlen méretezési munkáját követően HÍVÁSOK . Ezeket a faktorokat azután hisztogramokként ábrázoltuk, ahol minden hisztogram tartalmazza vagy a kezdeti léptéktényező eloszlását, ill B tényező az adott kezelési csoporton belül. A kezelési csoportok a következők voltak: kezeletlen [cián, ( a ) és ( e )], SEM betöltve [zöld, ( b ) és ( f )], SEM exponálatlan [kék, ( c ) és ( g )] és a keresőoptimalizálás [piros, ( d ) és ( h )].

Ezen eloszlások kezelési csoportok közötti összehasonlítása KS teszttel azt mutatta, hogy mind a skála, mind a B A SEM-exponálatlan és a SEM-expozíciós kezelések tényezői nem különböztek jelentősen egymástól (skálafaktorok p > 0,05 és D = 0,07175, és B tényezői p > 0,05 és D = 0,07613) (ahol D a KS távolság). Ez az elemzés arra enged következtetni, hogy a kristályok előzetes expozíciója az itt használt elektrondózishoz nem változtatta meg jelentősen ezeknek a kristályoknak a diffrakciós minőségét. További KS tesztek a kezdeti skála és a B faktort a többi kezelési csoport között is elvégeztük. A kezeletlen minták skálatényezőinek megoszlása ​​jelentősen különbözött a SEM-terhelésű és a SEM-exponálatlan minták eloszlásától ( p < 0,0001 mindkét tesztben). Ezek az eredmények azt sugallják, hogy a rácsok kezelése, amely a rácsok kriogén hőmérsékleten történő vákuumba helyezésébe és kiürítésébe tartozik, hatással van a kristályok diffrakciós minőségére. Ezenkívül a SEM-vel töltött minták eloszlása ​​jelentősen különbözött a SEM-exponálatlan mintákétól ( p < 0,0001 minden tesztben). Ez azt sugallja, hogy a SEM-expozíció nélküli minták esetében a SEM kriosztázisban töltött többletidő hatással van a kristályok diffrakciós minőségére. Ennek oka lehet a vákuumkörnyezet vagy a minták SEM -ben való hűtése, vagy a kettő kombinációja. A SEM transzfer hőmérsékletének elemzését elvégeztük (az adatokat nem mutatjuk be), ami azt jelzi, hogy a transzfer a transzfer alatt devitrifikációs hőmérséklet alatt van, és a SEM szakaszban azonban nem lehetett méréseket végezni a rács maga az átvitel során. Tekintettel arra, hogy a rács a hatékony hűtés érdekében a transzferrel való termikus érintkezésen alapul, nem zárható ki, hogy a nem hatékony termikus érintkezés és ezáltal a nem megfelelő hűtés hozzájárult ezekhez a jelentős különbségekhez. Ez a tanulmány rávilágít a kriogén kezelési munkafolyamatok részletes jellemzésének fontosságára érzékeny biológiai minták kezelésekor.

Fontos megjegyezni, hogy a CPV14 egy jól diffrakáló minta, és hogy más kristályok, például a nagy molekulatömegű membránfehérjékből képzett kristályok érzékenyebbek lehetnek a sugárzás károsodására. Erre a pontra hivatkozva, Holton és Frankel (2010) kutatása hasznos vitát nyújt, és betekintést nyújt a CPV14 és más potenciálisan rendezetlenebb vagy sugárzásra érzékeny fehérjék közötti lehetséges kapcsolatba. Megbeszélésük a lizozim tesztfehérje-esetét hasonlítja össze egy nagy (10 MDa) fehérjekristállyal Wilson-val. B tényező 61   Å 2. A számítások a cikkben azt sugallják, hogy ez a nagyobb fehérje egy Wilson B A lizozimkristály háromszorosának faktorához közel két nagyságrenddel nagyobb térfogatra van szükség az egyenértékű diffrakciós felbontás és minőség eléréséhez. Ez arra utal, hogy egy ilyen kristály hozzávetőleg két nagyságrenddel érzékenyebb a röntgen dózisára, mint a cikkben leírt lizozim megfelelője. A CPV14 oldható természete és molekulatömege jobban összevethető Holton & Frankel (2010) lizozim példájával, mint a 10 MDa fehérje. Lehetséges tehát, hogy egy rendezetlenebb vagy sugárzásra érzékeny fehérje, például egy membránfehérje körülbelül két nagyságrenddel érzékenyebb lehet a sugárzás károsodására a CPV14-hez képest. Ezt figyelembe véve úgy gondoljuk, hogy az itt használt beeső elektrondózisok még a legérzékenyebb kristályok sérülési küszöbén is belül maradnak, különösen azért, mert a felhasznált alacsony energiájú elektronok várhatóan legfeljebb 150 és#8197 nm-en hatolnak be a minták.

4. Következtetések

Az itt leírt elemzések alátámasztják a kisfeszültségű SEM-képalkotás használatát módszerként a mikrométer méretű fehérjekristályok vizualizálására és megtalálására a röntgendiffrakciós kísérletek előtt. 2  keV elektronokat használva a leírt dózisokban, az itt bemutatott eredmények nem mutatnak szignifikáns különbséget a SEM-sugárzásnak kitett kristályok röntgendiffrakciós adatai minősége között. Ez összhangban van a szakirodalommal, amely kimondja, hogy a 3  e −   Å 𕒶 dózisokra van szükség ahhoz, hogy csökkentse a nagy felbontású tükröződéseket (tükröződések és#60 3   Å felbontás ) (Chiu, 2006 Henderson, 1995 Hattne et al. , 2018). Ezeket a kísérleteket olyan elektrondózisokkal végezték, amelyek több nagyságrenddel alacsonyabbak voltak ennél a 3 e −  Å 𕒶 küszöbnél, és olyan elektronenergiákat használtak, amelyek áthatolatlanul hagyják a fehérjekristályok nagy részét. Valójában a SEM-nek kitett minták statisztikailag szignifikáns vagy mérhető sugárzási károsodásának hiánya támogatja az ilyen dózisok és elektronenergiák használatát a képalkotásban. Összefoglalva, az alacsony feszültségű SEM képalkotás megfelelő módszer a minták vizualizálására és későbbi igazítására az optikai mikroszkópia felbontása alatt.

5. Kapcsolódó irodalom

A következő hivatkozás található a cikkhez tartozó kiegészítő információk között: Zheng et al. (2009).


Kézi értékelés

Bár a szerkezetbiológiai közösség az elmúlt években magas szintű automatizálást ért el az adatgyűjtésben, adatfeldolgozásban és szerkezetmegoldásban, a szerkezetmeghatározás folyamata még mindig kutatói értelmezést igényel. Ez különösen vonatkozik az alacsony minőségű térképekre, amelyek rosszul illeszkednek a kísérleti adatok és a szerkezeti modellek közé. A tapasztalt szerkezeti biológus szemrevételezéses szemrevételezéses vizsgálata továbbra is a legjobb módszer a minőség megítélésére. Ezért a manuális értékeléshez kiválasztjuk az egyes SARS-CoV-2 fehérjék reprezentatív szerkezeteit, valamint azokat, amelyek különösen érdekesek a gyógyszerfejlesztés szempontjából. Bizonyos problémák meglepően gyakoriak, mint például a peptidkötések felborulása (1c., D. Ábra), rotamerhibák, foglaltságproblémák (1e. Ábra) és a kis molekulák vagy ionok téves azonosítása, például a víz magnéziumként és a klorid, mint a cink. Megjegyzendő, hogy a cink fontos szerepet játszik számos SARS-CoV-2 fehérjében. Számos cinkkoordinációs helyet találtunk rosszul modellezettnek, a cinkion hiányzik vagy kiszorul a sűrűségből és/vagy hibás diszulfidkötésekből a koordináló cisztein maradékok között (1a, b, h ábra). Ezenkívül sok koronavírus -fehérje glikozilálódik a felszíni aszparagin -maradékokon, de a glikáncukrot gyakran elfordították a helyes tájolástól N-glikozidos kötés (1f,g ábra). Ez elkerülhető olyan eszközök használatával, mint a Privateer 19 és a Coot 20 automatizált szénhidrát -építő eszköze. Fontos megjegyezni, hogy az elvárt viselkedéstől való eltérés nem mindig hiba, és funkcionálisan releváns jellemző is lehet, például a katalitikus helyeken gyakran előforduló feszített geometriák. Az ilyen eltéréseket azonban erősen alá kell támasztani a kísérleti adatoknak. A manuálisan ellenőrzött struktúrák közül 31 -en lényegesen javíthattunk a modell minősége, az adatminőség vagy mindkettő tekintetében. Az alábbiakban két példát mutatunk be a kísérleti adatok és a kapott modellek gondos vizsgálatának fontosságára.

Minden kép kivéve én képernyőképek a Coot v0.9.9 előzetes kiadásából. A maradék sűrűség és a rekonstrukciós térképek kék-szürke színűek, a különbség elektronsűrűsége piros és zöld. a, SARS-CoV-1 Nsp14–Nsp10 (PDB 5C8T) hisztidin cink-koordinációs hely (B603), a maradék sűrűség kontúr szintje 0,445, az átlagos négyzet eltérés (rmsd) 0,150. b, hisztidin származó a az ISOLDE 25-ben felcserélték, ami a Zn 2+ tetraéderes koordinációjához vezetett, majd a finomítást a PDB-REDO 11 segítségével végezték el, manuálisan hozzáadva a linkeket. c, A Proline A505 modellje ford az RdRp komplexben (PDB 7BV2, balra), de a sűrűség a cisz fő lánc konformációja, látható d. d, A letétbe helyezett EKT-bejegyzést az eredeti szerzőkkel való kapcsolatfelvétel után frissítettük. e, Nagy elektronsűrűség-különbség a SARS-CoV-2 fő proteáz (PDB 5RFA) A165-ös csoportjában, mivel a potenciálinhibitor közelében (balra) csak 0,44, nem pedig 1,00. Maradék térkép kontúr szint 0,54, r.m.s.d. 0,319 különbség sűrűség kontúr szinten 0,35, rm.s.d. 0,114. f, SARS-CoV-2 tüske receptor-kötő domén komplex humán ACE2-vel (PDB 6VW1). Ez N-a kapcsolt glikán kb. 180 ° -kal megfordul N-glikozidos kötés. Miután felvettük a kapcsolatot az eredeti szerzőkkel, ezt a bejegyzést felülvizsgáltuk (látható g). g, A korrekció javítja a cukorlánc sűrűségét. Maradék térkép a kontúr szintjén 0,311, r.m.s.d. 0,265. h, Diszulfidkötés A226 – A189 papain-szerű proteázban (PDB 6W9C), elektronsűrűséggel a kontúr szintjén 0,214, r.m.s.d. 0.136 a másik két cisztein marad koordinálatlan. Míg a sűrűségtérkép nem cinket jelez, ez egy cinkujjtartomány, a többi NCS -példány ebben a helyzetben tartalmaz egy összehangolt cinket. énA SARS-CoV fő proteáz (PDB 2HOB) jéggyűrűk AUSPEX 8 diagramja az intenzitáseloszlás torzításában tükröződik (piros). j, Ramachandran-diagram vagy torziós szögek a peptid gerincében a SARS-CoV Nsp10 – Nsp14 dinamikus komplexhez (PDB 5NFY). Elvileg csak néhány kiugró értéknek kell lennie (piros), mivel a legtöbb peptidkötés a tipikus szögeloszláshoz tapad. Kép: CSTF/insidecorona.net.

Papain-szerű proteáz

A SARS-CoV-2 nem-strukturális fehérje 3 (Nsp3) papain-szerű proteáz domént tartalmaz, amely elengedhetetlen a fertőzéshez, mivel hasítja a vírusos polipeptidet. A SARS-CoV-2 papain-szerű proteáz (PDB 6W9C) első szerkezetét 2020. április 1-jén adták ki, mindössze három hónappal a vírusgenom bejelentése után (GenBank MN908947.2) 21. A szerkezetet azonnal felhasználták a gyógyszertervezés során. A mért adatok teljessége azonban mindössze 57% volt. A https://proteindiffraction.org/ 10 címen elérhető nyers adatok vizsgálata erős sugárzási károkat tárt fel, amelyeket a rossz adatgyűjtési stratégia súlyosbít. Ez nem vezethető le az előzetes költségvetési tervezetből, hangsúlyozva a nyers adatok rendelkezésre bocsátásának fontosságát.

A kristály 3-szoros nem kristályos szimmetriával (NCS) rendelkezik, minden papainszerű proteáz domén monomer funkcionálisan fontos Zn 2+ iont tartalmaz, négy hasonló C-t tartalmazó cisztein oldallánchoz kötve.ß–Sγ–Zn szögek és Zn – Sγ kötéshosszak. A sugárzási károsodás miatt a Zn–S helyek gyenge sűrűségűek. Az egyik NCS példányban a helyet diszulfidkötésként és két szabad cisztein maradékként modellezték (1h ábra), míg a másik két NCS másolat koordinálja a cinkatomot erősen változó Cß–Sγ–Zn szögek és Zn – S kötéshosszak. A képeket az XDS 22 szoftverrel dolgoztuk fel újra, amely egykristályos röntgendiffrakciós képek feldolgozására szolgál. A STARANISO szervert használták a diffrakciós adatok anizotróp határértékének meghatározására és alkalmazására. Ez a gondos kézi beavatkozás javította az adatok általános minőségét és a felbontást 2,7-ről 2,6 Å-re növelte, de a felülvizsgált teljes ellipszoid teljesség csak 44,5% volt. Cink -atomok hozzáadása minden helyhez, a kötéshosszak és szögek korlátozása a várt értékekhez, valamint NCS korlátozások és összességében nagyobb súlyozás az ideális geometria érdekében, valamint az oldalláncok és a vízmolekulák átalakítása, javította az elektronsűrűség -térképeket és csökkentette a R értékeket 4%-kal. Ez példázza az adatgyűjtés, az adatfeldolgozás és a modellépítés közötti összefüggést: még ha az adatgyűjtési stratégia nem is ideális, az ebből adódó problémák figyelembe vétele az adatfeldolgozás és a finomítás során drasztikusan javíthatja a végső modellt.

Egy hónappal később megjelent a papain-szerű proteáz domén (PDB 6WRH) C111S mutánsának szerkezete. Ebben a szerkezetben a cinkhelyek minden alegységben egyértelműen feloldódtak. Időközben azonban a 6W9C PDB -t széles körben használták az in silico gyógyszerek tervezésében. A JEDI COVID19 GrandChallenge, a potenciális COVID-19 gyógyszerek in silico felkutatását célzó verseny több mint 140 kutatócsoportjának 20%-a használta ezt a modellt. A jobb szerkezet egy hónappal korábban elérhetősége növelte volna a siker esélyeit, és megtakarította volna a számítástechnikát és a munkaórákat.

RNS polimeráz komplex

A SARS-CoV-2 megismétli egyszálú RNS-genomját RNS-függő RNS-polimeráz (Nsp12 RdRp), Nsp7 és Nsp8 makromolekuláris komplex segítségével. A SARS-CoV-1 homológok korábbi krio-EM struktúrái (PDB 6NUR, PDB 6NUS) tartalmaznak egy rendezetlen, nem modellezett hurkot, amelyet egy látható, de rövid és szabálytalan hélix és egy rugalmas C terminus követ. Ennek a spirálnak a sűrűsége rosszul volt feloldva, de a modell érvényes geometriával rendelkezett. Az egyenértékű SARS-CoV-2 komplex (PDB 7BTF) egyik első szerkezetének elemzése során kiderült, hogy a szekvencia ebben a C-terminális régióban (az RNS-kötő horony része) kilenc maradékkal van rosszul beállítva (2. ábra) . Ez a hiba minden kapcsolódó SARS-CoV-1 és SARS-CoV-2 struktúrában jelen volt, valószínűleg azért, mert az új struktúra meghatározása általában egy korábbi modellből indul ki, amikor már elérhető.

a, Áttekintés a hiányzó hurokkal szaggatott vonallal (PDB 7BV2) térképként 2.4σ -n. Jobb, a C-terminális spirál részletei 5σ-nál. b, Alacsonyabb felbontású térkép és modell (6NUS PDB). Az oldallánc illeszkedésének megítélése nehéz. c, A nagyobb felbontású térkép és modell (PDB 7BV2) az oldallánc illeszkedése nem optimális a regisztrációs hiba miatt. d, Módosított modell a 7BV2 PDB -hez, az oldalláncok most megfelelnek a sűrűségnek. A regiszter eltolódását a Tyr915 jelzés jelzi. Kép: CSTF/insidecorona.net.

A nukleotidanalóg remdesivirhez (PDB 7BV2 (23. hivatkozás)) kötődő RdRp komplex szerkezete nem sokkal később megjelent, és alapul szolgált a kapcsolódó gyógyszerjelöltek racionális tervezéséhez 24. Ez a szerkezet a kilenc maradék szekvencia-eltérést is tartalmazta. A szerkezetet ISOLDE 25 , CaBLAM 6 és szemrevételezéssel átépítettük, kijavítva néhány elfordult ill. cisz ellen ford peptidek (1c., d. ábra) és három RNS-konformer a remdesivir közelében, beleértve egy visszafelé mutató adenozinbázist. Több maradékot és jó sűrűségű és geometriájú vizet is hozzáadhattunk. A Remdesivir kovalensen kötődik az RNS-hez, de csak a mért molekulák ≤50%-ában van jelen 12 . Ez azt jelenti, hogy az aktív hely legalább két különböző állapot keveréke, így nem meglepő módon a modellezett Mg 2+ ionokat és a pirofoszfátot a kísérleti sűrűség és a lokális kontaktusok gyengén támogatják. Ez aggodalomra ad okot a későbbi in silico dokkolás és a kábítószer -tervezés szempontjából, amelyek gyakran a lerakott struktúra összes atomját rögzített keretként veszik fel. A komplexum átalakított szerkezetei szilárdabb alapot kínálhatnak a gyógyszertervezéshez, még akkor is, ha a

Az aktív webhely 50% -os kihasználtságáról nem beszéltek széles körben 12. Figyelemre méltó, hogy a nagy nyilvántartási hiba és a különböző kisebb problémák ellenére a hagyományos „összefoglaló” mérőszámok alapján a modell rendkívül jónak tűnt, nem tartalmazott Ramachandran vagy rotamer kiugró értékeket és 2 ütközési pontszámot, kiemelve, hogy a közvetlen vizuális ellenőrzésnek továbbra is kulcsfontosságú lépésnek kell maradnia bármilyen modellezési folyamat.

Bár a fent tárgyalt problémák az eredetileg lerakott szerkezetekben is jelen voltak, mára szinte mindegyiket kijavították. Ezt legalább részben azért sikerült elérni, mert honlapunkon elérhetővé tettük a javított modelleket, és részletes leírásokkal felvettük a kapcsolatot ezeknek a struktúráknak az eredeti szerzőivel, támogatva őket, hogy saját belátásuk szerint tegyék át a módosított verziókat a wwPDB -hez.


Cím: Nyers diffrakciós adatok megőrzése és újrafelhasználása: Áttekintés, frissítés a gyakorlati tudnivalókról és a metaadat-követelményekről

Egy aktuális áttekintést mutatunk be a nyers adatok megőrzése és újrafelhasználása iránti gyorsan növekvő érdeklődésről és tárolási lehetőségekről az IUCr és bizottságai tudományos területén, amelyek mindegyike az eszközök sokféleségében működik. A nyers diffrakciós adatok lerakódásának esetéhez egy önéletrajz tartozik. Az átfogó kontextust az határozza meg, hogy kiemeli a tudománypolitikai döntéshozók kezdeményezéseit egy „nyílt tudomány” modell felé, amelyen belül a kristálytudósok egyre inkább dolgozni fognak a jövőben, ez új finanszírozási lehetőségeket, de új eljárási kódexeket is hoz a nyílt tudomány keretein belül. Bővíteni kell a kristálytudósok készségek oktatását és képzését. Összességében ma már megvannak az eszközök és a szervezet a nyers krisztallográfiai diffrakciós adatok megőrzésére különféle típusú archívumokon keresztül, például egyetemeken, tudományág-specifikus tárhelyeken (Integrated Resource for Reproducibility in Macromolecular Crystallography, Structural Biology Data Grid), általános nyilvános adattárak. (Zenodo, ResearchGate) és központosított neutron- és röntgenlétesítmények. Folyamatban van az egyes IUCr -megbízások nyers adattípusaira vonatkozó jobb metaadat -leírók kidolgozása. Néhány részletes példa található. Végül számos konkrét esettanulmányt mutatunk be, köztük egy példakutatási szálat, amely teljes nyílt hozzáférést biztosít és raquo a nyers adatokhoz. & laquo kevesebb


Lábjegyzetek

↵ ¶ Kinek kell levelezést küldeni a * címre. E-mail: chris.jacobsenstonybrook.edu .

A szerző közreműködése: D. Shapiro, T. B., V. E., M. H., C. J., J. K., E. L. és D. Sayre D. Shapiro, P. T., T. B., V. E., M. H., C. J., J. K., E. L., H. M. és A. M. N. kutatást végzett D. Shapiro, P. T., V. E., C. J., E. L., H. M. és A. M. N. elemzett adatok D. Shapiro, P.T., T.B., V.E., M.H., C.J. és E.L. új reagensekkel/analitikai eszközökkel járult hozzá, és D. Shapiro, V. E., M. H., C. J., J. K. és D. Sayre írta a lapot.

Ezt a papírt közvetlenül (II. Pálya) nyújtották be a PNAS irodának.

Rövidítések: XDM, röntgendiffrakciós mikroszkóp CCD, töltéscsatolt eszköz STXM, pásztázó átviteli röntgenmikroszkóp.


Nézd meg a videót: Zračenje (Január 2022).