Dla każdej zasady azotowej w nukleotydzie możemy wyznaczyć trzy krawędzie, przez które tworzyć się mogą wiązania wodorowe:
Dodatkowo, para nukleotydów może być w formacji cis lub trans w zależności od wzajemnego ułożenia:
Te dwie informacje opisują rodzaj interakcji wg notacji Leontisa-Westhofa [1] np. wszystkie pary kanoniczne są cis Watson-Crick Watson-Crick (ale nie działa to w drugą stronę)
[1] Geometric nomenclature and classification of RNA base pairs. N.B. Leontis, E. Westhof. RNA. 2001. 7(4):499–512. doi:10.1017/S1355838201002515
Pary zasad w RNA najczęściej opisuje się w notacji Leontisa-Westhofa trzyliterowym skrótem: cWW, tHS, itd.
Pełen przegląd możliwych kombinacji wygląda następująco:
Przykłady z rzeczywistych struktur można obejrzeć w RNA Basepair Catalog
Pewne kombinacje sekwencji i par niekanonicznych powtarzają się w wielu strukturach
Przyjmują one często charakterystyczny kształt 3D wynikający z kombinacji par niekanonicznych
Lista najbardziej znanych modułów / motywów 3D (na podstawie [2], grafika 2D wykonana przy pomocy RiboSketch [3]):
Nazwa | Wizualizacja | Struktura 2D |
---|---|---|
GNRA | ![]() | |
UNCG | ![]() | |
T-loop | ![]() | |
Sarcin-ricin | ![]() | |
Kink-turn | ![]() | |
Hook-turn | ![]() | |
C-loop | ![]() | |
E-loop | ![]() |
[2] De Novo Discovery of Structural Motifs in RNA 3D Structures through Clustering. P. Ge, S. Islam, C. Zhong, S. Zhang. Nucleic Acids Research. 2018. 46(9):4783–4793. doi:10.1093/nar/gky139
[3] RiboSketch: Versatile Visualization of Multi-Stranded RNA and DNA Secondary Structure. J.S. Lu, E. Bindewald, W.K. Kasprzak, B.A. Shapiro. Bioinformatics. 2018. 34(24):4297–4299. doi:10.1093/bioinformatics/bty468
Ściągnij dane w formacie JSON dla struktury 1RLG
W tablicy pairs
znajdziemy dane o indeksach 9 i 10:
{
"index": 9,
"nt1": "C.C9",
"nt2": "C.G14",
"bp": "C-G",
"name": "WC",
"Saenger": "19-XIX",
"LW": "cWW",
"DSSR": "cW-W"
},
{
"index": 10,
"nt1": "C.G10",
"nt2": "C.A13",
"bp": "G-A",
"name": "Sheared",
"Saenger": "11-XI",
"LW": "tSH",
"DSSR": "tm-M"
},
Mamy zatem parę cWW między nukleotydami C.C9 i C.G14, oraz parę tSH między C.G10 i C.A13
Analizując całe pairs
możemy potwierdzić, że C.A11 i C.A12 nie tworzą żadnych par
W tablicy nts
znajdziemy unikalne indeksy dla tych nukleotydów:
(w ogólności wartość index
obiektów z tablicy nts
nie musi być równa numerowi, który widać w identyfikatorze nukleotydu)
Wypisujemy wynik (są dwie pętle GNRA w strukturze 1RLG):
9 CGAAAG 14
34 CGAAAG 39