זוהי הפקודה ציון 2 שניתן להריץ בספק האירוח החינמי של OnWorks באמצעות אחת מתחנות העבודה המקוונות המרובות שלנו, כגון Ubuntu Online, Fedora Online, אמולטור מקוון של Windows או אמולטור מקוון של MAC OS
תָכְנִית:
שֵׁם
ציון שני - מצא את סיכת השיער הטובה ביותר המעוגנת בכל עמדה.
תַקצִיר
ציון 2 in.fasta > out.shairs
תיאור
עבור כל מיקום ברצף זה יוציא שורה:
-0.6 52 .. 62 TTCCTAAAGGTTCCA GCG CAAAA TGC CATAAGCACCACATT
(ציון) (התחלה .. סוף) (הקשר שמאלי) (סיכת שיער) (הקשר ימני)
עבור מיקומים ליד קצוות הרצפים, ההקשר עשוי להיות מרופד ב-'x'
דמויות. אם לא ניתן למצוא סיכת ראש, הציון יהיה 'ללא'.
ניתן לתת קבצי פאסטה מרובים ורצפים מרובים יכולים להיות בכל קובץ פאסטה. ה
הפלט עבור כל רצף יופרד על ידי שורה המתחילה ב-'>' ומכילה את
תיאור FASTA של הרצף.
מכיוון שציוני סיכות השיער של גדיל פלוס וגדיל מינוס עשויים להיות שונים (עקב GU
מחייב ב-RNA), כברירת מחדל, 2ndscore מוציא שתי קבוצות של סיכות ראש עבור כל רצף: ה
סיכות ראש FORWARD וסיכות ראש REVERSE. כל סיכות השיער הקדמיות יוצאות תחילה, ו
מזוהים על ידי המילה 'FORWARD' בסוף השורה '>' שלפניהם.
באופן דומה, סיכות השיער REVERSE מופיעות אחרי שורה '>' המסתיימת ב-'REVERSE'. אם אתה
רוצה לחפש רק גדיל אחד או אחר, אתה יכול להשתמש ב:
--no-fwd אל תדפיס את סיכות השיער FORWARD
--no-rvs אל תדפיס את סיכות השיער REVERSE
אתה יכול להגדיר את פונקציית האנרגיה שבה נעשה שימוש, בדיוק כמו ב-transterm עם --gc, --au, --gu,
--ממ, --אפשרויות פער. האפשרויות --min-loop, --max-loop ו--max-len נתמכות גם כן.
פורמט OF LA .תיק קבצים
העמודות עבור קובצי ה-.bag הן, לפי הסדר:
1. שם_גן
2. terminator_start
3. terminator_end
4. ציון_סיכת שיער
5. ציון_זנב
6. terminator_sequence
7. terminator_confidence: שילוב של ציון סיכת ראש וזנב ש
לוקח בחשבון את הסבירות לציונים כאלה ברצף אקראי. זֶה
הוא ה"ציון" הראשי עבור המחסל ומחושב כמתואר ב
הנייר.
8. מרחק_בערך מקצה_הגן: המספר ה*משוער* של הבסיס
זוגות בין סוף הגן לתחילתו של המחסל. זֶה
הוא משוער בכמה אופנים: ראשית, (והכי חשוב) TransTermHP
לא תמיד משתמש בקצוות הגנים האמיתיים. תלוי באפשרויות שאתה נותן
זה עשוי לקצץ חלק מהקצוות של הגנים כדי להתמודד עם זה
חפיפה חלקית עם גנים. שנית, היכן "מתחיל" המחסל
לא כל כך מוגדר. שדה זה מיועד רק לבדיקת שפיות
(טרמינטורים שדווחו כטובים ביותר ליד הקצוות של הגנים לא אמורים להיות
_רחוק מדי_ מקצה הגן).
משתמש TRANSTERM ללא GENOME הערות
TransTermHP משתמש במידע גנים ידוע רק ל-3 דברים: (1) תיוג המשוער
terminators כ"גנים פנימיים" או "בין גנים", (2) בחירת הרקע GC-
אחוז תוכן כדי לחשב את הציונים, מכיוון שלגנים יש לרוב תוכן GC שונה
מאשר האזורים הבין-גניים, ו-(3) ייצור פלט קריא מעט יותר. פריטים (1)
ו-(3) לא באמת נחוצים, ו-(2) אין השפעה אם לגנים שלך יש בערך אותו הדבר
תוכן GC כאזורים הבין-גניים שלך.
לרוע המזל, ל-TransTermHP עדיין אין אפשרות פשוטה להפעלה ללא הערה
קובץ (או .ptt או .coords), ומחייב לפחות 2 גנים להיות נוכחים. הפתרון
זה ליצור גנים מזויפים וקטנים שמאגפים כל כרומוזום. כדי לעשות זאת, צור fake.coords
קובץ שמכיל רק את שתי השורות האלה:
fakegene1 1 2 chome_id
fakegene2 L-1 L chrom_id
כאשר L הוא אורך רצף הקלט ו-L-1 קטן ב-1 מאורך הקלט
סדר פעולות. "chrom_id" צריכה להיות המילה ישירות אחרי ה-">" בקובץ ה-fasta
המכיל את הרצף שלך. (אם, למשל, קובץ ה-fasta שלך התחיל ב-">seq1", אז
chrom_id = seq1).
זה יוצר ביאור "מזויף" עם שני גנים באורך בסיס אחד שמאגפים את הרצף ב-
סידור זנב לזנב: --> <--. לאחר מכן ניתן להפעיל את TransTermHP עם:
transterm -p expterm.dat sequence.fasta fake.coords
אם תכולת ה-G/C של האזורים הבין-גניים שלך בערך זהה לגנים שלך, אז זה
לא תהיה השפעה רבה מדי על הציונים שמקבלים מסיימים. מצד שני,
השימוש הזה ב-TransTermHP לא נבדק הרבה בכלל, אז קשה להעיד על כך
דיוק.
השתמש ב-2ndscore באינטרנט באמצעות שירותי onworks.net