Wyścig przyśpiesza. GPT-5.4 jest szybszy, tańszy i dokładniejszy

ChatGPT staje się jeszcze lepszy, a drużyna Sama Altmana nadrabia zaległości względem konkurencji. Ich nowy model AI jest lepszy pod każdym względem.

Przemysław Banasiak (Yokai)
0
Udostępnij na fb
Udostępnij na X
Wyścig przyśpiesza. GPT-5.4 jest szybszy, tańszy i dokładniejszy

OpenAI zaprezentowało GPT-5.4. Firma określa go jako najbardziej zaawansowany i wydajny model, zaprojektowany z myślą o profesjonalnej pracy. Nowa generacja AI ma oferować nie tylko wyższą jakość odpowiedzi, ale również znacznie lepszą efektywność działania i niższe koszty wykorzystania w praktycznych zastosowaniach biznesowych.

Dalsza część tekstu pod wideo

Mniej halucynacji oraz lepsza obsługa PC i pakietu biurowego

Do wyboru są dwa warianty. Pierwszy z nich to GPT-5.4 Thinking, który został zoptymalizowany pod kątem zadań wymagających złożonego rozumowania. Drugi to GPT-5.4 Pro, nastawiony przede wszystkim na maksymalną wydajność w środowiskach produkcyjnych. Dla codziennych zapytań i mało skomplikowanych zagadnień jest starszy GPT-5.3 Instant.

Jedną z najważniejszych zmian jest ogromne rozszerzenie kontekstu w API. GPT-5.4 może obsługiwać okna kontekstowe sięgające nawet 1 miliona tokenów. Zrównuje to OpenAI z konkurencją i pozwala modelowi analizować bardzo obszerne dokumenty, rozbudowane bazy danych czy długie konwersacje bez konieczności dzielenia ich na mniejsze fragmenty.

Wyścig przyśpiesza. GPT-5.4 jest szybszy, tańszy i dokładniejszy

Nowa wersja AI została także zoptymalizowana pod względem zużycia tokenów. Według zespołu Sama Altmana GPT-5.4 potrafi rozwiązywać te same zadania co poprzedni model GPT-5.2 przy znacznie mniejszym zapotrzebowaniu na tokeny. W praktyce oznacza to szybsze działanie i niższe koszty korzystania z modelu w systemach opartych o API.

OpenAI chwali się również wynikami w benchmarkach. GPT-5.4 osiągnął rekordowe rezultaty w testach OSWorld-Verified oraz WebArena Verified, które sprawdzają zdolności modeli AI do wykonywania zadań związanych z obsługą komputerów i aplikacji internetowych. Model uzyskał także wynik 83% w wewnętrznym teście GDPval, oceniającym kompetencje w zadaniach związanych z pracą umysłową i analizą informacji.

Wyścig przyśpiesza. GPT-5.4 jest szybszy, tańszy i dokładniejszy

W benchmarku APEX-Agents przygotowanym przez firmę Mercor, GPT-5.4 osiągnął najlepszy wynik w historii testu. Według prezesa Mercor, Brendana Foody’ego, model szczególnie dobrze radzi sobie z przygotowywaniem złożonych materiałów takich jak prezentacje, modele finansowe czy analizy prawne, oferując przy tym wysoką szybkość działania i niższy koszt niż konkurencyjne modele AI.

Wyścig przyśpiesza. GPT-5.4 jest szybszy, tańszy i dokładniejszy

OpenAI kontynuuje także prace nad ograniczaniem tzw. halucynacji, czyli generowania nieprawdziwych informacji przez modele językowe. W porównaniu z GPT-5.2 nowa wersja ma być o 33% mniej podatna na błędy w pojedynczych twierdzeniach. Jednocześnie ogólna liczba odpowiedzi zawierających nieścisłości spadła o około 18%.

GPT-5.4 Thinking i Pro są już dostępne w ramach API oraz trafiły do ChatGPT. Jak zwykle, początkowo skorzystają z nich osoby opłacające abonament - nie wspomniano nic o darmowych użytkownikach. Nowy model będzie pojawiał się na kontach użytkowników falami.