From Tomasz Żok

BioinformatykaStrukturalna2: PrzewidywanieStrukturRNAIBiałekMiaryIAlgorytmyPorównywaniaStrukturTrzeciorzędowych

Przewidywanie struktur RNA i białek

Przewidywanie de novo

  1. Wykorzystaj PEP-FOLD w trybie "Demonstration mode" (należy wybrać z menu rozwijanego "Yes" w tym panelu i kliknąć "Run")
    • Kiedy serwer zakończy obliczenia, ściągnij modele w formacie PDB (ikonka dyskietki w sekcjach od Model 1 do Model 5)
  2. Aby przewidzieć strukturę RNA, wykorzystaj Rosetta RNA_Denovo dla następującej struktury:
    >strand_A
    GGGGUGGCUCCCCUAACAGCCG
    ((((.[[..))))......]].

Modelowanie homologiczne

  1. Skopiuj sekwencję aminokwasów w formacie FASTA ze struktury 2ODH
  2. Wykorzystaj SWISS-MODEL do wygenerowania modeli dla tej sekwencji

Podejście hybrydowe

  1. Oprócz dwóch głównych metod opisanych powyżej istnieją też podejścia mieszane
  2. RNAComposer przewiduje strukturę RNA poprzez złożenie jej z odpowiednich bloków strukturalnych (ale bez jednego szablonu)
  3. Wymaga do działania znajomości sekwencji oraz struktury drugorzędowej - użytkownik posiadający tylko sekwencję może zlecić RNAComposerowi by w pierwszym kroku przewidział strukturę drugorzędową
  1. Przy użyciu RNAComposera wygeneruj model dla struktury:
    >strand_A
    GGAACCGGUGCGCAUAACCACCUCAGUGCGAGCAA
    ......(((.{[[....[[)))...].].}.]]..
  2. Ściągnij plik PDB i otwórz go w PyMOL-u
  3. Znajdź w prawym dolnym rogu, na pasku z przyciskami typu stop / play, przycisk S - jego naciśnięcie włącza widok sekwencji
  4. Na widoku sekwencji kliknij w nukleotydy, które łączy dowolna para nawiasów [ oraz ]
  5. Na liście struktur po prawej:
    1. dla all kliknij H (hide) i wybierz everything
    2. dla (sele) kliknij S (show) i wybierz lines
    3. dla (sele) kliknij A (action) i wybierz orient
  6. Powtórz to dla innych nukleotydów, które łączy para nawiasów { i }

Miary i algorytmy porównywania struktur trzeciorzędowych

RMSD

Porównaj dwie struktury t-RNA przy użyciu RMSD:

  1. Uruchom PyMOL (wersja binarna dla Windows)
  2. Wczytaj struktury o PDBid 1EHZ oraz 1EVV (komenda: fetch PDBid)
  3. Najpierw porównaj wizualnie struktury; na liście struktur kliknij w A i wybierz Zoom
  4. Do wykonania superpozycji oraz wyliczenia RMSD służy komenda pair_fit X, Y gdzie X oraz Y to nazwy obiektów w PyMOL-u. Spróbuj wyznaczyć RMSD dla wczytanych struktur
  5. Liczba atomów jest różna, można poradzić sobie z tym problemem na dwa sposoby:
    1. przez ograniczenie atomów do określonego typu:
      • fosfor (dla RNA): pair_fit X and name P, Y and name P
      • atomy łańcucha głównego (dla białek): pair_fit X and name C+CA+N, Y and name C+CA+N)
    2. przez wykonanie dopasowania (ang. alignmentu): align X, Y

MCQ

Porównaj te same cząsteczki co w poprzednim zadaniu przy użyciu MCQ:

  1. Uruchom MCQ4Structures
  2. Wybierz z menu "File" opcję "View structure manager"
  3. Podaj 1EHZ jako PDB id i kliknij "Download from PDB"
  4. Tak samo ściągnij strukturę 1EVV
  5. Wybierz z menu "Distance measure" opcję "Local distances (pair)"
  6. W menu "Distance measure / Select structures to compare" wskaż w lewym panelu 1EHZ łańcuch A i w prawym panelu 1EVV łańcuch A.
  7. Pokaże się okienko z możliwością wyboru kątów torsyjnych zdefiniowanych dla RNA lub białek; na teraz odznacz przyciskiem "Clear" kąty zdefiniowane dla białek, a zostaw domyślnie zaznaczoną wartość MCQ dla RNA.
  8. Pojawi się tabela ze średnią różnicą kątową (MCQ) dla każdej z odpowiadających sobie reszt dla obu RNA
  9. Zobacz pozostałe zakładki z wizualizacjami wyników

INF

Przykład policzenia miary INF

{$$ \begin{eqnarray} PPV & = & \frac{|TP|}{|TP| + |FP|} = \frac{8}{9} \approx 0.89 \\ STY & = & \frac{|TP|}{|TP| + |FN|} = \frac{8}{9} \approx 0.89 \\ INF & = & \sqrt{PPV \cdot STY} \approx 0.89 \end{eqnarray} $$}

Napisz program wyznaczający wartość miary INF. Aby zbudować zbiory {$ S_r $} oraz {$ S_m $} wykorzystaj dane w formacie BPSEQ generowane przez serwer RNApdbee. Powstały program powinien otrzymać dwa argumenty w linii poleceń: ścieżkę do pliku BPSEQ dla struktury referencyjnej oraz ścieżkę do pliku BPSEQ dla modelu. Program ma za zadanie wypisać jedną linię z wartością INF.

Weryfikacja Dla przykładowych danych powyżej zapisanych jako target.bpseq (struktura referencyjna) i model.bpseq (model):

$ ./program target.bpseq model.bpseq
0.8888888888888888

Uwagi:

Proszę o przygotowanie raportu z następujących zadań:

  1. Wykorzystaj swoją implementację INF, a także miary RMSD i MCQ (wykres) żeby porównać:
    • Model z RNAComposer oraz 1DDY (tylko łańcuch A, w PyMOL-u komenda: align 1DDY and chain A, strand_A przy założeniu, że model z RNAComposera zapisany jest w pliku strand_A.pdb)
    • Model z RNA_Denovo oraz 2G1W
  2. Dokonaj analizy porównawczej z wykorzystaniem narzędzia MCQ4Structures (Global MCQ oraz Global RMSD):
    • Modeli z PEP-FOLD oraz 1JBL
    • Modeli ze SWISS-MODEL oraz 2ODH
Czy modele są bardziej podobne do siebie wzajemnie czy do struktury referencyjnej? Czy odpowiedź na to pytanie zależy od metody przewidywania? A może od metody porównywania?
Retrieved from http://www.cs.put.poznan.pl/tzok/wiki/index.php?n=BioinformatykaStrukturalna2.PrzewidywanieStrukturRNAIBia%c5%82ekMiaryIAlgorytmyPor%c3%b3wnywaniaStrukturTrzeciorz%c4%99dowych
Page last modified on 2017 Mar Wed 8 08:00