AI2BMD: Precyzyjne Modelowanie Ruchów Biomolekuł na Dużą Skalę z Wykorzystaniem Sztucznej Inteligencji
Symulacje dynamiki biomolekularnej odgrywają kluczową rolę w naukach przyrodniczych, umożliwiając zrozumienie interakcji molekularnych na poziomie atomowym. Chociaż klasyczne symulacje dynamiki molekularnej (MD) są wydajne, to jednak brakuje im precyzji chemicznej. W takich przypadkach metody oparte na teorii funkcjonału gęstości (DFT) oferują większą dokładność, ale są zbyt intensywne obliczeniowo, aby można było je zastosować do dużych biomolekuł. Symulacje MD pozwalają na obserwację zachowań molekularnych, gdzie klasyczne MD wykorzystuje potencjały międzyatomowe, a ab initio MD (AIMD) oblicza siły na podstawie struktur elektronowych. Niestety, AIMD ma problemy ze skalowalnością, co ogranicza jego zastosowanie w badaniach biomolekularnych. Nadzieją na przezwyciężenie tych problemów są pola sił oparte na uczeniu maszynowym (MLFF), które są trenowane na danych DFT. Oferują one obiecującą dokładność przy znacznie niższych kosztach obliczeniowych, choć generalizacja ich działania na różnorodne konformacje molekularne nadal stanowi wyzwanie.
AI2BMD – Nowatorskie podejście do symulacji biomolekuł
Naukowcy z Microsoft Research w Pekinie wprowadzili AI2BMD, system oparty na sztucznej inteligencji, który umożliwia symulację dużych biomolekuł z dokładnością na poziomie ab initio. AI2BMD wykorzystuje technikę fragmentacji białek oraz pole sił oparte na uczeniu maszynowym, co pozwala na precyzyjne obliczanie energii i sił dla białek składających się z ponad 10 000 atomów. W porównaniu do tradycyjnych metod DFT, ten system jest znacznie bardziej wydajny, przyspieszając czas symulacji o rzędy wielkości. AI2BMD jest w stanie przeprowadzać symulacje trwające setki nanosekund, dzięki czemu można obserwować procesy związane ze składaniem, rozkładaniem oraz dynamiką konformacji białek. Jego prognozy termodynamiczne są bardzo zbliżone do danych eksperymentalnych, co czyni go cennym narzędziem wspomagającym badania w laboratoriach biologicznych oraz rozwój badań biomedycznych.
Fragmentacja białek i modelowanie energii
Technika fragmentacji białek stosowana w AI2BMD opiera się na podstawowej strukturze aminokwasów, z których składają się białka. Każdy aminokwas zawiera główny łańcuch atomów (Cα, C, O, N, H) oraz unikalny łańcuch boczny. Aby stworzyć model, który można stosować do różnych białek, każdy aminokwas jest traktowany jako dipeptyd, z zakończeniami zabezpieczonymi grupami Ace i Nme. Dzięki podejściu opartemu na fragmentach dipeptydów, system ten zapewnia pełne pokrycie struktury białka. Łańcuchy białkowe są dzielone na fragmenty przy użyciu przesuwającego się okna, a każdy fragment zawiera główne atomy łańcucha oraz części atomów sąsiadujących aminokwasów. Metoda ta dokładnie oblicza energie białek i siły działające na atomy, dodając wodory tam, gdzie jest to konieczne, oraz optymalizując ich pozycje za pomocą algorytmu quasi-Newtona. Dzięki temu metoda ta jest uniwersalna i można ją systematycznie stosować do wszystkich białek, co zmniejsza złożoność, jednocześnie maksymalizując precyzję modelu.
Trening i implementacja uczenia maszynowego
W celu trenowania modelu AI2BMD, badacze zebrali ogromny zbiór danych, obejmujący miliony konformacji dipeptydów, aby uchwycić różnorodność struktur białkowych. Na podstawie tych danych opracowano głęboki model uczenia maszynowego o nazwie ViSNet, który został wytrenowany do przewidywania energii i sił atomowych na podstawie numerów atomowych i ich współrzędnych. Model ten wykorzystuje specyficzne hiperparametry w celu optymalizacji dokładności i został przeszkolony za pomocą technik wczesnego zatrzymywania, co pozwala uniknąć przetrenowania. Symulacje oparte na modelu AI2BMD są przetwarzane za pomocą programu symulacyjnego wspieranego przez AI, który jest kompatybilny z chmurą, co umożliwia elastyczne wdrażanie w różnych środowiskach obliczeniowych. System ten wspiera procesy symulacyjne działające równolegle oraz automatycznie zapisuje postęp na pamięciach w chmurze, zapewniając niezawodne i efektywne zarządzanie modelowaniem dynamiki białek.
Zastosowanie w analizie właściwości białek
AI2BMD wykazuje znaczący potencjał w szacowaniu właściwości białek, zwłaszcza w analizie termodynamicznej szybko składających się białek. System ten jest w stanie klasyfikować struktury białkowe jako złożone lub niezłożone, symulując różne typy białek i dokładnie przewidując wartości energii potencjalnej. Szacunki temperatury topnienia (Tm) dla białek, takich jak domena WW czy NTL9, były bardzo zbliżone do wyników eksperymentalnych, często przewyższając dokładność tradycyjnych metod mechaniki molekularnej (MM). Dodatkowo, obliczenia AI2BMD dotyczące wolnej energii (ΔG), entalpii oraz pojemności cieplnej były wysoce zgodne z wynikami eksperymentalnymi, co dodatkowo potwierdza jego precyzję. Solidność w szacowaniu termodynamicznym podkreśla wartość AI2BMD jako zaawansowanego narzędzia do analizy białek.
Zastosowanie w badaniach biochemicznych
Oprócz analizy termodynamicznej, AI2BMD okazał się skuteczny w obliczeniach wolnej energii alchemicznej, takich jak prognozowanie wartości pKa, co czyni go cennym narzędziem w badaniach biochemicznych. W przeciwieństwie do tradycyjnych metod QM-MM, które ograniczają obliczenia do z góry ustalonych obszarów, podejście AI2BMD pozwala na modelowanie całych białek bez problemów z granicami, co czyni je wszechstronnym narzędziem do badania złożonych białek i dynamicznych stanów molekularnych. Choć szybkość AI2BMD jest nadal wolniejsza w porównaniu do klasycznych symulacji MD, przyszłe optymalizacje oraz zastosowanie w innych systemach biomolekularnych mogą znacząco zwiększyć wydajność tego systemu. Adaptacyjność AI2BMD czyni go obiecującym narzędziem w odkrywaniu nowych leków, projektowaniu białek oraz inżynierii enzymów, oferując precyzyjne symulacje dla różnych zastosowań biomolekularnych.
Podsumowując, AI2BMD stanowi przełom w dziedzinie symulacji biomolekuł, łącząc dokładność ab initio z wydajnością, co otwiera nowe możliwości w badaniach naukowych oraz przemysłowych.