Jeden na pięć ludzkich genów nie jest „prawdziwy”

Nowe badania mogą zmienić oblicze biomedycyny; stwierdzono, że ludzki genom zawiera znacznie mniej „rzeczywistych” lub kodujących białka genów, niż wcześniej sądzono.

Nasze DNA może zawierać znacznie mniej „prawdziwych” genów, niż początkowo sądziliśmy.

We wczesnych latach 90-tych naukowcy postanowili zmapować całą sekwencję DNA ludzkiego genomu.

Celem tak zwanego projektu ludzkiego genomu było znalezienie powiązań genetycznych z chorobami oraz zrozumienie funkcji i struktury różnych elementów genomu, takich jak, które geny kodują białka i jakie czynniki regulują ekspresję genów.

Wstępne wyniki projektu Human Genome Project przewidywały, że istnieje 40 000 genów, które mogą kodować białka, duże cząsteczki niezbędne do prawidłowego funkcjonowania tkanek i narządów organizmu.

Jednak, gdy projekt ten dobiegał końca w 2003 r., Szacunki dotyczące tej liczby spadły do ​​około 20 000–25 000 genów kodujących białka.

Od tego czasu naukowcy starali się znaleźć ostateczny proteom - czyli całkowitą liczbę białek, które mogą być wyrażane przez geny - i skupili się na zrozumieniu, w jaki sposób ekspresja genetyczna tych białek jest mutowana w niektórych chorobach.

W tym celu międzynarodowy zespół naukowców pod kierownictwem Michaela Tressa z Oddziału Bioinformatyki Hiszpańskiego Narodowego Centrum Badań nad Rakiem w Madrycie w Hiszpanii zbadał obecnie geny uznawane za kodujące białka w głównych dostępnych bazach danych proteomów.

Tress i współpracownicy opublikowali wyniki swoich badań w czasopiśmie Badania kwasów nukleinowych. Pierwszym autorem artykułu jest Federico Abascal z Wellcome Trust Sanger Institute w Hinxton w Wielkiej Brytanii.

Co najmniej 2000 genów to „pseudogeny”

Naukowcy porównali proteomy z trzech kolekcji sekwencji białek i adnotacji genetycznych: GENCODE / Ensembl, RefSeq i UniProtKB.

Tress i zespół odkryli, że z łącznej liczby 22 210 genów wymienionych jako kodujące białka, tylko 19 446 znalazło się we wszystkich trzech kolekcjach.

Następnie przybliżyli różnicę 2764 genów, badając dowody eksperymentalne i informacje dostępne w adnotacjach.

Dowody sugerowały, że większość tych genów to „geny niekodujące lub pseudogeny”.

Ponadto naukowcy odkryli, że dodatkowe 1470 genów - które zostały wymienione jako kodujące białka w trzech kolekcjach - nie miało cech funkcjonalnych ani typowej ewolucji genów kodujących białka.

Dlatego naukowcy „uważają, że trzy referencyjne bazy danych obecnie przeszacowują liczbę ludzkich genów kodujących o co najmniej 2000, komplikując i dodając szum do eksperymentów biomedycznych na dużą skalę”.

„Określenie, które potencjalne niekodujące geny nie kodują białek, jest trudnym, ale niezwykle ważnym zadaniem, ponieważ ludzki proteom referencyjny jest fundamentalnym filarem większości badań podstawowych i wspiera prawie wszystkie projekty biomedyczne na dużą skalę”.

Kierunki przyszłych badań

Tress opowiada, w jaki sposób badacze posuwają się dalej w swoich odkryciach. „Udało nam się szczegółowo przeanalizować wiele z tych genów”, wyjaśnia, „a ponad 300 genów zostało już przeklasyfikowanych jako niekodujące”.

„Zaskakujące”, dzwoni współautor badania, David Juan, „niektóre z tych niezwykłych genów zostały dobrze zbadane i mają ponad 100 publikacji naukowych opartych na założeniu, że gen wytwarza białko”.

Wyniki mogą zatem zmienić znaną nam dziedzinę biomedycyny. Potrzebne są jednak dalsze badania.

„Nasze dowody”, dodaje Abascal, „sugerują, że ludzie mogą mieć tylko 19 000 genów kodujących, ale nadal nie wiemy, które [te] 19 000 genów są”.

none:  innowacje medyczne reumatyzm dystrofia mięśniowa - als