Kompleksowa mapa genomu SARS-CoV-2

11.05.2021
Paweł Wernicki

Naukowcy z Massachusetts Institute of Technology (MIT) określili zestaw genów kodujących białka wirusa powodującego COVID-19 i przeanalizowali prawdopodobieństwo tego, że nowe mutacje pomogą wirusowi w adaptacji – informuje “Nature Communications”.

Na początku roku 2020, kilka miesięcy po rozpoczęciu pandemii COVID-19, naukowcom udało się zsekwencjonować pełny genom SARS-CoV-2. Chociaż wiele z jego genów było znanych już w tamtym momencie, dokładna identyfikacja genów kodujących białka wymagała dalszych badań.

Teraz, po przeprowadzeniu szeroko zakrojonych badań porównawczych z zakresu genomiki naukowcy z MIT stworzyli - jak twierdzą - najdokładniejszą i najbardziej kompletną adnotację genów genomu SARS-CoV-2. Adnotacja to określanie funkcji każdego odcinka DNA – trzeba nie tylko wyjaśnić, jakie białko on koduje, ale także dokładnie zbadać strukturę i funkcję tego białka.

Genom SARS-CoV-2 składa się z prawie 30 000 zasad RNA. Naukowcy zidentyfikowali kilka regionów, o których wiadomo, że są tam geny kodujące białka, na podstawie ich podobieństwa do kodujących białka genów występujących w pokrewnych wirusach. Jednocześnie kilka innych regionów, które uważano za kodujące białka okazało się nie kodować żadnych białek.

Aby ustalić, które części genomu SARS-CoV-2 faktycznie zawierają geny, naukowcy przeprowadzili rodzaj badania zwanego genomiką porównawczą, w którym porównują genomy podobnych wirusów. Wirus SARS-CoV-2 należy do podrodzaju wirusów zwanych Sarbecovirus, z których większość infekuje nietoperze. Naukowcy przeprowadzili analizę na SARS-CoV-2, SARS-CoV (który spowodował wybuch epidemii SARS w 2003 r.) i 42 szczepów sarbecowirusów nietoperzy.

„Byliśmy w stanie wykorzystać podejście genomiki porównawczej do sygnatur ewolucyjnych, aby odkryć prawdziwą kodującą białka zawartość tego niezwykle ważnego genomu” - mówił Manolis Kellis, starszy autor badania i profesor informatyki na MIT.

Zespół badawczy przeanalizował również prawie 2000 mutacji, które pojawiły się w różnych izolatach SARS-CoV-2, odkąd zaczął on zakażać ludzi. To pozwoliło ocenić, jak ważną rolę mogą odegrać mutacje w zmianie zdolności wirusa do unikania układu odpornościowego lub stania się bardziej zakaźnym.

Kellis wcześniej opracował techniki obliczeniowe do przeprowadzania tego typu analiz, które jego zespół wykorzystał również do porównania ludzkiego genomu z genomami innych ssaków. Techniki te opierają się na analizie, czy pewne zasady DNA lub RNA są zachowane między gatunkami oraz na porównywaniu ich wzorców ewolucji w czasie.

Korzystając z tych technik, naukowcy potwierdzili sześć genów kodujących białka w genomie SARS-CoV-2 oprócz pięciu, które są dobrze ugruntowane we wszystkich koronawirusach. Ustalili również, że region kodujący gen zwany ORF3a koduje również dodatkowy gen, który nazywają ORF3c. Gen ma zasady RNA, które pokrywają się z ORF3a, ale występują w innej ramce odczytu. Rola nowego genu, a także kilku innych genów SARS-CoV-2, nie jest jeszcze znana.

Naukowcy wykazali również, że pięć innych regionów, które zaproponowano jako możliwe geny, nie koduje funkcjonalnych białka. Dzięki temu inni naukowcy nie będą musieli tracić czasu na prace związane z sekwencjami, które niczego sensownego nie kodują.

„Przeanalizowaliśmy cały genom i jesteśmy pewni, że nie ma innych konserwatywnych genów kodujących białka” - mówi Irwin Jungreis, główny autor badania i naukowiec z MIT Computer Science & Artificial Intelligence Laboratory. „Potrzebne są badania eksperymentalne, aby poznać funkcje niescharakteryzowanych genów, a ustalając, które z nich są prawdziwe, pozwalamy innym badaczom skupić się na tych genach, zamiast spędzać czas na czymś, co nawet nie jest tłumaczone na białko”.

strona 1 z 2
Aktualna sytuacja epidemiologiczna w Polsce Covid - aktualne dane

COVID-19 - zapytaj eksperta

Masz pytanie dotyczące zakażenia SARS-CoV-2 (COVID-19)?
Zadaj pytanie ekspertowi!