22 lutego, 2025

Nowy model AI do rozumowania rywalizujący z OpenAI stworzony za mniej niż 50 dolarów

Nowy model AI do rozumowania rywalizujący z OpenAI stworzony za mniej niż 50 dolarów

Nowa era modeli językowych opartych na sztucznej inteligencji

Rozwój modeli językowych opartych na sztucznej inteligencji pokazuje, że technologie te stają się coraz bardziej dostępne, a ich tworzenie nie wymaga już miliardowych inwestycji. Doskonałym przykładem tego trendu jest model S1, opracowany przez badaczy ze Stanford University i University of Washington. W przeciwieństwie do gigantów branży, którzy inwestują fortuny w rozwój swoich algorytmów, S1 powstał przy wykorzystaniu chmury obliczeniowej za mniej niż 200 złotych.

Nowy konkurent dla OpenAI

S1 to bezpośredni rywal modelu o1 od OpenAI – modelu „rozumowania”, który analizuje złożone pytania, rozbijając je na mniejsze etapy, by zapewnić dokładniejsze odpowiedzi. Działanie S1 można zilustrować na przykładzie hipotetycznego pytania dotyczącego kosztów wymiany wszystkich pojazdów Ubera na autonomiczne samochody Waymo. Model ten nie podałby jednej, bezpośredniej odpowiedzi, lecz podzieliłby analizę na kilka kroków, sprawdzając m.in. liczbę pojazdów Ubera na drogach oraz koszt produkcji pojedynczego auta Waymo.

Podstawą S1 jest gotowy model językowy, który został „nauczony myślenia” dzięki analizie pytań i odpowiedzi z modelu Gemini 2.0 Flashing Thinking Experimental od Google. Choć nazwa może budzić wątpliwości co do swojej przystępności, to właśnie ten model pozwolił twórcom S1 na wykorzystanie stosunkowo niewielkiej ilości danych – zaledwie 1000 starannie wybranych pytań wraz z odpowiedziami – by nauczyć go odwzorowywać sposób rozumowania Gemini.

Prostota kluczem do ulepszenia modelu

Jednym z najciekawszych aspektów badań nad modelem S1 jest sposób, w jaki udało się poprawić jego zdolność do rozumowania. Rozwiązanie okazało się wręcz banalne – badacze kazali modelowi… zaczekać.

Dodanie słowa „wait” w trakcie analizy pozwoliło modelowi na uzyskanie dokładniejszych odpowiedzi. To odkrycie sugeruje, że pomimo obaw o ograniczenia sztucznej inteligencji, wciąż istnieje wiele prostych sposobów na poprawę jej skuteczności. Pokazuje to również, jak bardzo obecne modele AI różnią się od ludzkiego sposobu myślenia – zamiast autonomicznie rozumować, działają one na zasadzie przewidywania kolejnych słów w oparciu o prawdopodobieństwo. Umiejętność generowania trafnych odpowiedzi nie wynika więc z prawdziwego procesu myślowego, lecz z odpowiedniego „treningu” i zastosowania skutecznych trików.

Spór o wykorzystanie danych

Rozwój otwartoźródłowych modeli językowych wywołał także kontrowersje w branży AI. OpenAI skrytykowało chiński zespół DeepSeek za wykorzystanie odpowiedzi generowanych przez jego model, sugerując, że było to naruszenie praw autorskich. Nie umknęło to uwadze obserwatorów, którzy zwrócili uwagę na ironiczny charakter tej sytuacji – OpenAI samo trenowało swoje modele na ogromnych zbiorach danych dostępnych w sieci, często bez zgody ich autorów.

Podobny problem dotyczy również Google, które teoretycznie zakazuje konkurencyjnym firmom, takim jak S1, trenowania modeli na danych z Gemini. Jednak biorąc pod uwagę dotychczasową praktykę wielkich korporacji, trudno oczekiwać, że takie zakazy spotkają się ze społeczną aprobatą.

Czy tanie modele AI mogą zagrozić gigantom?

Chociaż sukces modelu S1 jest imponujący, nie oznacza to, że możliwe jest stworzenie od podstaw równie skutecznego systemu za 200 złotych. W rzeczywistości S1 opiera się na ogromnych zasobach wiedzy zgromadzonych przez Google, co można porównać do kompresji obrazu – podobnie jak skompresowany plik JPEG, model ten jest użyteczny, ale wciąż traci część oryginalnej jakości.

Co więcej, choć modele językowe stają się tańsze i bardziej dostępne, to ich realne zastosowanie wciąż wiąże się z wysokimi kosztami. Proces zwany inferencją, czyli rzeczywista analiza i generowanie odpowiedzi na zapytania użytkowników, wymaga ogromnej mocy obliczeniowej. Wraz ze wzrostem popularności AI zapotrzebowanie na infrastrukturę obliczeniową będzie jedynie rosło. Firmy takie jak OpenAI czy Google inwestują miliardy w centra danych, by sprostać temu wyzwaniu – na przykład OpenAI pracuje nad projektem serwerowej infrastruktury obliczeniowej o wartości ponad 2 bilionów złotych.

Przyszłość modeli AI

Obserwując rozwój sztucznej inteligencji, warto zadać sobie pytanie, czy OpenAI i inne giganty technologiczne rzeczywiście są zagrożone przez tańsze, otwarte alternatywy. Zwolennicy OpenAI twierdzą, że modele językowe od początku były skazane na komercjalizację, a przyszłość należy do firm, które będą potrafiły stworzyć wartościowe aplikacje oparte na tych modelach.

Obecnie ponad 300 milionów użytkowników tygodniowo korzysta z ChatGPT, co pokazuje, jak silnie technologia ta wpisała się w codzienne życie internautów. Tym, co naprawdę wyróżnia OpenAI na tle konkurencji, nie jest sam model językowy, ale innowacyjne rozwiązania, takie jak Operator, który pozwala użytkownikom nawigować po sieci, czy dostęp do unikalnych zbiorów danych, np. treści z platformy X (dawniej Twitter).

Podsumowując, choć rozwój tanich modeli AI może zwiastować zmiany w branży, to giganci technologiczni nadal mają przewagę dzięki skalowalności, infrastrukturze i dostępowi do ogromnych ilości danych. Tymczasem otwartoźródłowe inicjatywy, takie jak S1, mogą przyczynić się do dalszej demokratyzacji sztucznej inteligencji i jej upowszechnienia w codziennym życiu.