To jest polecenie 2ndscore, które można uruchomić u dostawcy bezpłatnego hostingu OnWorks przy użyciu jednej z naszych wielu darmowych stacji roboczych online, takich jak Ubuntu Online, Fedora Online, emulator online Windows lub emulator online MAC OS
PROGRAM:
IMIĘ
2ndscore - znajdź najlepszą spinkę do włosów zakotwiczoną w każdej pozycji.
STRESZCZENIE
2ndscore in.fasta > out.spinki do włosów
OPIS
Dla każdej pozycji w sekwencji wypisze wiersz:
-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(score) (start .. end) (lewy kontekst) (szpilka do włosów) (prawy kontent)
Dla pozycji w pobliżu końców sekwencji, kontekst może być uzupełniony 'x'
postacie. Jeśli nie można znaleźć szpilki do włosów, wynik będzie „Brak”.
Można podać wiele plików fasta, a w każdym pliku fasta może znajdować się wiele sekwencji. ten
dane wyjściowe dla każdej sekwencji będą oddzielone linią zaczynającą się od '>' i zawierającą
FASTA opis sekwencji.
Ponieważ wyniki spinki do włosów dla nici dodatniej i nici ujemnej mogą się różnić (ze względu na GU
wiązania w RNA), domyślnie 2ndscore wyprowadza dwa zestawy spinek do włosów dla każdej sekwencji:
Spinki do włosów FORWARD i REVERSE. Wszystkie spinki do włosów w przód są wyprowadzane jako pierwsze i
są identyfikowane przez słowo „FORWARD” na końcu poprzedzającego je wiersza „>”.
Podobnie, spinki do włosów REVERSE są wymienione po linii '>' kończącej się na 'REVERSE'. Jeśli ty
chcesz przeszukać tylko jedną lub drugą nić, możesz użyć:
--no-fwd Nie drukuj spinek do włosów DO PRZODU!
--no-rvs Nie drukuj odwróconych spinek do włosów
Możesz ustawić używaną funkcję energii, tak jak w przypadku transterm z opcją --gc, --au, --gu,
--mm, --gap opcje. Obsługiwane są również opcje --min-loop, --max-loop i --max-len.
FORMAT OF THE .TORBA AKTA
Kolumny dla plików .bag są w kolejności:
1. nazwa_genu
2. początek_terminatora
3. terminator_koniec
4. spinka_score
5. wynik_ogona
6. sekwencja_terminatora
7. terminator_confidence: kombinacja wyniku spinki do włosów i ogona, która
bierze pod uwagę prawdopodobieństwo wystąpienia takich wyników w kolejności losowej. Ten
jest głównym „wynikiem” dla terminatora i jest obliczany zgodnie z opisem w
papier.
8. APPROXIMATE_distance_from_end_of_gene: *przybliżona* liczba zasad
pary między końcem genu a początkiem terminatora. Ten
jest przybliżony na kilka sposobów: Po pierwsze (i najważniejsze) TransTermHP
nie zawsze używa prawdziwych końcówek genów. W zależności od opcji, które dajesz
może przyciąć niektóre końce genów, aby obsłużyć terminatory, które
częściowo pokrywają się z genami. Po drugie, gdzie terminator „zaczyna się”
nie jest tak dobrze zdefiniowany. To pole jest przeznaczone tylko do sprawdzenia zdrowego rozsądku
(terminatory uważane za najlepsze pod koniec genów nie powinny być
_zbyt daleko_ od końca genu).
ZA POMOCĄ TRANSTERM BEZ GENOM ADNOTACJE
TransTermHP wykorzystuje znane informacje o genach tylko do 3 rzeczy: (1) tagowania domniemanego
terminatory jako „wewnętrzne geny” lub „międzygeniczne” (2) wybierając tło GC-
procent zawartości do obliczenia wyników, ponieważ geny często mają różną zawartość GC
niż regiony międzygenowe oraz (3) wytwarzają nieco bardziej czytelne dane wyjściowe. Przedmioty (1)
i (3) nie są naprawdę potrzebne, i (2) nie mają żadnego efektu, jeśli twoje geny mają mniej więcej takie same
Zawartość GC jako regiony międzygenowe.
Niestety TransTermHP nie ma jeszcze prostej opcji uruchomienia bez adnotacji
plik (.ptt lub .coords) i wymaga obecności co najmniej 2 genów. Rozwiązanie
jest stworzenie fałszywych, małych genów, które otaczają każdy chromosom. Aby to zrobić, zrób fake.coords
plik zawierający tylko te dwie linie:
fakegene1 1 2 chome_id
fakegene2 L-1 L chrom_id
gdzie L jest długością sekwencji wejściowej, a L-1 jest o 1 mniejsze niż długość wejściowej
sekwencja. „chrom_id” powinno być słowem bezpośrednio po „>” w pliku .fasta
zawierające twoją sekwencję. (Jeśli, na przykład, twój plik .fasta zaczynał się od ">seq1", wtedy
chrom_id = seq1).
Tworzy to „fałszywą” adnotację z dwoma 1-zasadowymi genami flankującymi sekwencję w a
układ ogon-ogon: --> <--. TransTermHP można wtedy uruchomić za pomocą:
transterm -p expterm.dat sekwencja.fasta fake.coords
Jeśli zawartość G/C w twoich regionach międzygenowych jest mniej więcej taka sama jak w twoich genach, to
nie będzie miało zbyt dużego wpływu na wyniki, które otrzymują terminatorzy. Z drugiej strony,
to zastosowanie TransTermHP nie było w ogóle testowane, więc trudno za to ręczyć
dokładność.
Korzystaj z 2ndscore online za pomocą usług onworks.net