Narzędzie do adnotacji białek oparte na uczeniu maszynowym przewiduje funkcję białek

Narzędzie do adnotacji białek oparte na uczeniu maszynowym przewiduje funkcję białek

Węzeł źródłowy: 2661019
18 sty 2023 (Wiadomości Nanowerk) Drobnoustroje kierują kluczowymi procesami życia na Ziemi. Wpływają na globalne cykle pierwiastków — ruch węgla, azotu i innych pierwiastków. Pobudzają również wzrost roślin i wpływają na rozwój chorób. Te role są niezbędne w każdym ekosystemie. Badania stale poszerzają bazę danych sekwencji DNA drobnoustrojów, ale nie dostarczają wszystkich informacji biologicznych o białkach. Aby opracować mikroby na potrzeby zrównoważonej bioenergii i innych bioproduktów, naukowcy potrzebują pełniejszego zrozumienia funkcji białek i innych cząsteczek. Naukowcy wnioskują o funkcji białka, porównując je z referencyjnymi bazami danych już scharakteryzowanych białek. Jednak porównania te są trudne i nie skalowalne do ogromnych baz danych. Aby sprostać temu wyzwaniu, naukowcy zastosowali uczenie maszynowe w modelach przewidujących funkcje białek. Rezultatem jest program Snekmer, co pozwala naukowcom szybko modelować rodziny białek. XNUMX PODPIS Badanie biologicznych cząsteczek białek w drobnoustrojach pomoże naukowcom poszukiwać nowych zastosowań dla zmodyfikowanych drobnoustrojów. Snekmer można łatwo wdrożyć w środowiskach obliczeniowych o wysokiej wydajności. Ponadto jest włączony do ww Framework KBase jako nową aplikację, która pozwoli użytkownikom dodawać adnotacje do ich genomu i sekwencji metagenomu. Pomoże to naukowcom lepiej modelować efekty inżynierii mikroorganizmów. Obejmuje to wpływ tych drobnoustrojów na klimat oraz ich korzyści dla zdrowia upraw i bioprodukcji. Snekmer pomoże również naukowcom w badaniu ewolucji drobnoustrojów i wzorców w mikrobiomach. Niezdolność obecnych metod do przewidywania funkcji dla 30-50% sekwencji białek bakteryjnych stanowi istotną przeszkodę w lepszym zrozumieniu złożonych systemów, takich jak mikrobiomy glebowe. Większość protokołów polega na dopasowywaniu parami, które staje się trudne obliczeniowo i trudniejsze do interpretacji w miarę rozszerzania się baz danych. W przypadku modeli rodzin białek opartych na dopasowaniu czułość i dokładność zależą od początkowych zestawów treningowych, które ryzykują dezaktualizację w miarę odkrycia dodatkowej różnorodności sekwencji. Wiele białek bakteryjnych albo nie ma przypisania funkcjonalnego, albo ma przypisaną ogólną funkcję opartą wyłącznie na zrozumieniu taksonomicznym. Aby zaspokoić tę potrzebę, naukowcy z Pacific Northwest National Laboratory, Baylor University i Oregon Health & Science University opracowali Snekmer, narzędzie programowe wykorzystujące redundancję właściwości reszt aminokwasowych w celu zmniejszenia przestrzeni sekwencji i wykorzystujące funkcje krótkich sekwencji białek (kmerów) do uczenia maszynowego do generowania modeli rodziny białek. Użytkownicy Snekmera mogą przekodować sekwencje białek na skrócone alfabetyczne wektory kmer i wykonać konstrukcję nadzorowanych modeli klasyfikacji przeszkolonych na wejściowych rodzinach białek lub funkcjonalną klasyfikację białek opartą na modelach Snekmera. Badania zostały opublikowane w Postępy bioinformatyki („Snekmer: skalowalny rurociąg do pobierania odcisków palców sekwencji białek w oparciu o rekodowanie aminokwasów”).

Znak czasu:

Więcej z Nanowerk