Oprogramowanie
21:50
Wyścig przyśpiesza. GPT-5.4 jest szybszy, tańszy i dokładniejszy
ChatGPT staje się jeszcze lepszy, a drużyna Sama Altmana nadrabia zaległości względem konkurencji. Ich nowy model AI jest lepszy pod każdym względem.
OpenAI zaprezentowało GPT-5.4. Firma określa go jako najbardziej zaawansowany i wydajny model, zaprojektowany z myślą o profesjonalnej pracy. Nowa generacja AI ma oferować nie tylko wyższą jakość odpowiedzi, ale również znacznie lepszą efektywność działania i niższe koszty wykorzystania w praktycznych zastosowaniach biznesowych.
Mniej halucynacji oraz lepsza obsługa PC i pakietu biurowego
Do wyboru są dwa warianty. Pierwszy z nich to GPT-5.4 Thinking, który został zoptymalizowany pod kątem zadań wymagających złożonego rozumowania. Drugi to GPT-5.4 Pro, nastawiony przede wszystkim na maksymalną wydajność w środowiskach produkcyjnych. Dla codziennych zapytań i mało skomplikowanych zagadnień jest starszy GPT-5.3 Instant.
Jedną z najważniejszych zmian jest ogromne rozszerzenie kontekstu w API. GPT-5.4 może obsługiwać okna kontekstowe sięgające nawet 1 miliona tokenów. Zrównuje to OpenAI z konkurencją i pozwala modelowi analizować bardzo obszerne dokumenty, rozbudowane bazy danych czy długie konwersacje bez konieczności dzielenia ich na mniejsze fragmenty.
Nowa wersja AI została także zoptymalizowana pod względem zużycia tokenów. Według zespołu Sama Altmana GPT-5.4 potrafi rozwiązywać te same zadania co poprzedni model GPT-5.2 przy znacznie mniejszym zapotrzebowaniu na tokeny. W praktyce oznacza to szybsze działanie i niższe koszty korzystania z modelu w systemach opartych o API.
OpenAI chwali się również wynikami w benchmarkach. GPT-5.4 osiągnął rekordowe rezultaty w testach OSWorld-Verified oraz WebArena Verified, które sprawdzają zdolności modeli AI do wykonywania zadań związanych z obsługą komputerów i aplikacji internetowych. Model uzyskał także wynik 83% w wewnętrznym teście GDPval, oceniającym kompetencje w zadaniach związanych z pracą umysłową i analizą informacji.
W benchmarku APEX-Agents przygotowanym przez firmę Mercor, GPT-5.4 osiągnął najlepszy wynik w historii testu. Według prezesa Mercor, Brendana Foody’ego, model szczególnie dobrze radzi sobie z przygotowywaniem złożonych materiałów takich jak prezentacje, modele finansowe czy analizy prawne, oferując przy tym wysoką szybkość działania i niższy koszt niż konkurencyjne modele AI.
OpenAI kontynuuje także prace nad ograniczaniem tzw. halucynacji, czyli generowania nieprawdziwych informacji przez modele językowe. W porównaniu z GPT-5.2 nowa wersja ma być o 33% mniej podatna na błędy w pojedynczych twierdzeniach. Jednocześnie ogólna liczba odpowiedzi zawierających nieścisłości spadła o około 18%.
GPT-5.4 Thinking i Pro są już dostępne w ramach API oraz trafiły do ChatGPT. Jak zwykle, początkowo skorzystają z nich osoby opłacające abonament - nie wspomniano nic o darmowych użytkownikach. Nowy model będzie pojawiał się na kontach użytkowników falami.
PRZEMYSłAW BANASIAK