Munkavégzés a mega-robbanás és a FASTA

  1. Meghatározása transzfer RNS, amely részt vett csatlakozott a negyedik aminosav-maradék a növekvő fehérje lánc AAT_ECOLI.

A negyedik áramkör E. coli aszpartát gyök aszparagin. könnyű meghatározni nézi a sorozatot. Megjegyezzük, hogy ebben az esetben két lehetséges választás: figyelmen kívül hagyja az első metionin, vagy figyelmen kívül hagyja, ha a pontszám (ismert, hogy a start kodon AU (T) G # 150; egyidejűleg metionint kódoló kodon). De mivel nem tudjuk, hogy a funkcionális terhelés az egyenleg (ha hasad poszttranszlációsan vagy végrehajtásához szükséges bármilyen funkciót), elhatározta, hogy tőle. Ezen kívül minden korábbi tanulmányok figyelembe vette az első metionin.

Az egyik a dokumentumokat. információkat tartalmaz a kódoló gén AAT_ECOLI, megtaláljuk a megfelelő kodon. Ez kodon 5'-AAC-3 „(a továbbiakban: alapértelmezett polaritású áramkörök felvétel közben kodon 5” és 3 „vég). A standard genetikai kód táblázat. Megtudtuk, hogy az aszparagin lehet kódolva nemcsak ilyen triplett, de a triplett AAU (T). Más szóval, a degenerált esetben, mivel a legtöbb ember, akkor a harmadik helyen kodon.

Az adatok elemzése azt mondhatjuk, hogy egyrészt a „tökéletes antikodonja” tRNS lehetne vonni a csatlakozás az aszparagin AAT_ECOLI lánc szintézisét, # 150; GUU. Magától értetődő, hogy az első pozíció szinguláris. Másodszor, hipotetikusan aszparagin E. coli kell két isoacceptor tRNS: Check AAC kodon keresztül antikodont AAU GUU és lokalizált keresztül AUU. Tudjuk azonban, hogy a cella valójában típusú tRNS nem, amennyire csak lehetséges szemantikai kodon és kevesebb. Annak kiderítésére, hogy ez megerősíti a mi esetünkben fellebbezett az EMBL.

Használja a UNIX grep parancs dokumentumban található EMBL, amely információkat tartalmaz a teljes genomját az E. coli. ezeket a sorokat, amelyek magukban foglalják a nevét és aszparagin ismertetjük tRNS. Csapat (átirányítást stdout szállítószalag) számára poika aszparagin tRNS rekord így néz ki:
grep kodon * aszparagin ecoli.embl |. Több

Ennek eredményeként azt találtuk, négy bejegyzés (lásd. Az utolsó sor 1. táblázat). Mind a 4 esetben találat. Antikodont teljesen beilleszkedik (azonos az „ideális”), de a kodon felismerte ezt tRNS # 150; AAY # 150; „Tartalmazza” két kodon: AAT és AAC (Y # 150; A leírás pirimidin, pirimidinek) .Ez van, a mi esetünkben ez tRNS alkalmas, de a kodon AAT rájön igaz. Így azt találtuk, hogy az E. coli aszparagin tRNS „egy minden alkalommal”, ahelyett, hogy a két # 150; egy-egy minden lehetséges kodont, például az egyik lehet feltételezni.

Aszparagin E. coli tRNS az azonos típusú, de a genomban kódolódik négy. Mind a négy ezen gének azonosak. azt találtuk, hogy a megszerkesztésével többszörös szekvenciáinak illesztésével extrahált seqret parancsot a teljes genom. Ezért, a választás készült véletlenszerűen ki további tanulmányozásra.

Eredményei vizsgálatok az 1. táblázat tartalmazza.

1. táblázat: meghatározás eredményei a kívánt aszparagin-tRNS

Keresés aszparagin-tRNS: Elmélet és gyakorlat

Aminosav-maradék a 4. pozícióban fehérje AAT_ECOLI

* Megjegyzés 1: be lehet állítani, hogy a 12, a helyzet ugyanaz marad (legalábbis a mi esetünkben).

** 2. megjegyzés: A hossz és a megadott koordinátákat közvetlenül igazítás. azonos megállapításokat adott hosszabb szekvencia (180 bp koordináták 11.440-11.620) a középső része, és amelyek összhangban állnak posledovaelnosti vizsgálták tRNS.

*** 3. megjegyzés: Ez könnyű észrevenni, hogy a teljes hossza a kis területen a jó illesztések több mint kétszerese a hossza a szekvencia aszparagin-tRNS! Ez azt jelenti, hogy az eredmények egy véletlen karakter. Ezen túlmenően, ez a tény tükrözi a működési algoritmusa BLASTN. Magától értetődik, hogy a véletlen az armatúra hossza 11 nukleotid (vett bármely részét a mi tRNS-szekvenciák, mivel az index fájl magában foglalja a különböző horgony hossz 11) egy szegmensét a genom széna Bacillus összehangolás folytatódott mindkét irányban, amíg letört, és ezek a töredékes Eredményeink arra engednek . A visszaigazolás szolgálhat a hossza a szakaszok illesztések: nem rövidebb, mint 11 nukleotid. a legkevésbé # 150; 12: azt is jelentheti, hogy az említett összehangolás, ahol csak egyezik a horgony, és sem jobbra, sem balra nem véletlen volt, de nem jelenik meg. Ez nem függ az e-érték: bevonása a -e opciót, és meghatározza az e-értéke 50, kapott egy új eredmény. területeken, ahol még több, de közülük még mindig nincs összehangolás hossza 11.

UNIX parancsokat, hogy használták a keresés:

  1. FASTA

Úgy tűnt, hogy nem vezetnek be kényelmesebb rész paraméterek egy részét # 150; Ezután egy programot kérdések megválaszolására a különböző paraméterek értékei (a hossza a horgony, a számos bizonyított eredmények és illesztések, stb ..). Még csak abban a szakaszban az írás parancsok láthatók az egyik különbség a FASTA alább BLASTN és MEGABLAST: az utóbbi szüksége az index fájlt, és FASTA nem nélküle, kérve, mint a bázis kíván közvetlenül fasta fájlt a genomban.

  • Segítségével BLASTN

    blastall -p BLASTN -d bs -i tRNA.fasta -o blastn.txt

    Itt tRNA.fasta és blastn.txt # 150; A fájlnevek a kívánt szekvenciát és a fájl eredményt kell. és bs # 150; Az alap neve az index fájlokat.

  • A MegaBLAST.

    megablast -d bs -i tRNA.fasta -o megablast.txt -D 2

    Összehasonlítva a csapat a BLASTN keresés Add-egyetlen lehetőség -D. Annak különböző értékeket (1-4) a fájl nevének módosítása a keresési eredmények között. A 2 érték azért választottuk, mert ez megfelel a megszokott kimeneti formátum (BLAST-formátum). Tény, hogy az eredmények hiányában nem érdekel, milyen formátumban kell választani. Azonban minden lehetőséget kipróbáltak értékek -D és úgy vélte, a megfelelő formátumban. Sajnos ez a keresés nem találtak, és a teljes összehasonlítás nem lehetséges.

    Továbbá azt próbálták a paraméter értéke L -F # 150; szűrés alacsony komplexitású régiók (alacsony komplexitás), tisztában vagyunk dolgozik BLASTP funkciót. Azonban ugyanezen ok miatt (nem „találatok”), nincs különbség nem lehet elkapni.

  • C alkalmazásával discontiguous MegaBlast

    16 megablast -t -W 1 -N 11 -i tRNA.fasta -o dis16_1.fasta -D 2

    Az összehasonlításból a csapatok futnak a rendszeres változata Megablast és discontiguous MegaBlast, egyértelmű, hogy csak abban különböznek paraméterek, amelyek között vannak speciális, a második (nem kötelező). Ez -t és -N. Az első beállítja a „discontiguous szó sablon” # 150; minta hossza (pontosabban, az egyik a három mintát a minta különböző hosszúságú). Nyilvánvaló, hogy minél kisebb ez a hossz, annál érzékenyebb keresést. Néhány más esetben hasznos lenne, de az ötlet discontiguous MegaBlast (és Mega_Blast általában) nem felel meg. E programok nem fontos az érzékenység, a sebesség is fontos. És a csökkentés a hossza a minta növelheti a nem kívánt (nem szignifikáns) találja. Azonban ebben az esetben, a kettő közül a három lehetséges értéket -t (16, 18, 21) válasszuk az eredmények egyaránt kiábrándító. Ez sajnos megakadályozza úgy különbségeket keresni a különböző minták a gyakorlatban.

    -N paraméter megadja, hogy milyen típusú minta (kódoló, nem kódoló, vagy mindkettő) Mivel a kódoló szekvencia nem választotta a második lehetőség (1-es érték). Segítségével ez a mintázat MegaBlast látszó többnyire a középső helyzetben a triplett, és nem az első két, mint abban az esetben a kódolás, figyelmen kívül hagyja a degenerált harmadik pozícióban. Ezen túlmenően, a discontiguous MegaBlast verzió egy bizonyos hosszúságú horgony # 150; 11 vagy 12 nukleotid (-W paraméterértékeket). Azért választottuk az első érték, míg a második eredmények nem változnak.

  • Vita. Hatékonyságának összehasonlítására különböző kutatási programok a nukleotid szekvenciák.

    A kutatás eredményei csalódást okoztak. Természetesen, az első dolog, hogy lehet ajánlani a szerepe egy homológ az aszparaginsav tRNS egy organizmus # 150; aszparaginsav tRNS másik szervezetből. Azonban az egyetlen lényeges megállapítása (amit nyújtott FASTA) # 150; izoleucin tRNS. A többi program vagy nem találtak semmit (opciók MegaBlast), vagy talál egy teljesen jelentéktelen kis területen szekvenciák szétszórva a genomban (BLASTN). Nézd meg minden program külön-külön, majd hasonlítsa össze, és válassza ki a leghatékonyabb keresni nem kódoló szekvencia homológiát.

    Így FASTA. Ez a program bizonyult a legérzékenyebb mind közül. Csak ennek segítségével lehetett megtalálni egy adott értelmes sorrendben. Bár vannak érthetetlen pont: ahelyett, hogy csak akkor vezet összehangolás, vagy legalább a gén, amely tartalmazza az a része talált, ez is vezet a szomszédos szakaszok a szekvenciák (például a gének és az összes el nem látott) megállapítja, növekvő felbontású. A jelenség magyarázata az is nehéz találni, még egy olyan mechanizmus bevezetésével FASTA munkát. Ezért, a leírást úgy csak a gén-szekvencia, amelyen belül fekszik közvetlenül igazítás. Sajnos, ez a szekvencia kódol izoleucin tRNS. Azonnal számos kérdést vet fel: vajon a homológ egy lelet, és miért nem kéne homológok talált # 150; aszparagin-tRNS széna bacillus? Az első kérdés az, hogy nehéz válaszolni: nem tudjuk, hogyan kell ellenőrizni a titkosítatlan homológ szekvenciák, kivéve szintező.

    Találunk segítségével ugyanazt a UNIX grep és seqret csapat a dokumentum teljes genomját subtilis kódoló gének aszparagin-tRNS. Ez a négy hasonló szekvenciákat. Ne illeszkednek a tRNS (lásd itt). A szekvenciák igen közel vannak, miért nem találja őket FASTA? Ahhoz, hogy a képesség (vagy képtelensége), hogy megtalálja őket, nem teszünk kísérletet: elkészíti a „Keresés mini-adatbázis” minden szekvenciák aszparagin-tRNS subtilis. izoleucin-tRNS-gén és a „hosszú” (részeit tartalmazó szomszédos gének) megállapítja, FASTA. Nézzük mi szekvencia benne. váratlan eredmények # 150; Minden aszpartikus tRNS található, és izoleucin is! Ezért a FASTA teljes mértékben képes megtalálni a kisebb, nem kódoló szekvenciák homológjait. de kis adatbázisokban (más különbségek, kivéve a két adatbázis közötti méret nem volt). Ennek a feltételezésnek a megvizsgálásához keresse meg a genomtól a B. subtilis genomból kivont aszpartici-tRNS-t. Az eredmény nagyon érdekes: a kívánt szekvenciát nem találjuk meg, bár ez természetesen a genomban van. Legjobb talál # 150; ismét izoleucin tRNS (valószínűleg valójában homológ az aszpartici-tRNS bélből és széna bacillusból). Az egyetlen dolog, ami felajánlható egy magyarázatra, ismerte a FASTA mechanizmusát # 150; ez egy csekély számú "horgonyzott" horgony a jobb oldali átlóban, ezért nem veszik figyelembe. Azonban miért lehetnek ezek a horgonyok kicsiek, nem nagyon világos.

    A BLASTN egyáltalán nem szembeszállt a feladattal. Rengeteg rövid igazítás található egy kicsivel hosszabb, mint a horgony. Nyilvánvaló, hogy egy ilyen eredmény nem jelent semmilyen értéket. A BLASTN alkalmas nem kódoló szekvenciák keresésére, de nem homológ, de azonos (vagy szinte azonos) szekvenciákra. A B. subtilis genomban az aszparagin-tRNS-re nincs ilyen. Annak érdekében, hogy a BLAST elvileg ne találjon aszparagin-tRNS szénabacilluszt, vessünk egy pillantást a korábban említett összehangolásra. Az egybeeső régiók között nincs olyan, amelynek hossza egyenlő vagy nagyobb 11-nél. Nyilvánvaló, hogy a 11 horgonyhosszúság nem csatolható itt.

    És még inkább a horgony MegaBlast. amely 28 nukleotidból áll. Nyilvánvaló, hogy összehasonlítható szekvenciákban (tRNS és genom) nincs olyan hosszú, feszített, egybeeső szakasz. Ezért a MegaBlast nem talált semmit, és kétséges, hogy megtalálja. Végtére is, ebben a helyzetben is alkalmas, még kisebb, mint a BLASTN mert eredetileg tervezték, hogy megtalálják pontos másolatai szekvenciák és még a legprimitívebb mátrix csere nem.

    A discontiguous MegaBlast változata ez a mátrix is ​​ott van, de a csap kisebb és némileg eltérő kereső (mintát használja, így nem ellenőrzi minden maradék hasonlóságokat, amely gyorsabbá teszi). Az a tény, hogy az ilyen MegaBlast nem találtak semmit, arra a következtetésre jutunk az ő alkalmasságát egy kis nem kódoló szekvenciákat homológ keresést. De azonos vagy nagyon hasonló szekvenciákat talál # 150; a szalagbacillus aszparagin-tRNS-jének szekvenciáját az utóbbi genomjában végeztük. "Talált" mind a négy tRNS gént (e-érték 3 * 10 # 150; 37), és emellett sok apró, elhanyagolható átfedő terület. És ha ugyanazt a keresést használod a "csak" MegaBlast használatával, akkor négy szükséges gén van, és csak azokat. Így ez a program kevésbé érzékeny, mint discontiguous MegaBlast, de a keresési eredményét utóbbi tartalmaz némi felesleges keresésekor pontos másolatai „zaj”.

    A keresés eredménye alapján következtetéseket vonunk le az összehasonlítandó programok hatékonyságáról. Mit kell használni, ha egy nem kódoló szekvencia homológját akarjuk megtalálni? Valószínűleg a FASTA a legalkalmasabb, bár itt is probléma van # 150; a "nagy bázisok" problémáját (lásd fent). A BLASTN, a MegaBlast és a megkülönböztetett MegaBlast nem alkalmasak. Mert sem az egyik, sem a másik, sem a harmadik nem feltételezi a szekvenciák homológjainak keresését. Alacsony érzékenység, nagy hosszúságú csapok (különösen MegaBlast), hiányzik a jó (vagy akár bármilyen) mátrixok helyettesítések nem teszik lehetővé, hogy megtalálják a megváltozott eredményeként egy evolúciós folyamat szekvenciát. A FASTA egy kisebb horgony és egy kicsit más algoritmus, amely valószínűleg lehetővé teszi a további szekvenciák megtalálását. A MegaBlast és a megkülönböztetett MegaBlast mindegyike azonos szekvenciákat keres; mechanizmusaikat részletesen leegyszerűsítik (a horgony 28 nukleotidja) vagy módosulnak ("bináris" keresési minták). Kiderült, hogy a vizsgált személyek között nincs program ideális a nem kódoló nukleotidszekvenciák homológjainak keresésére.