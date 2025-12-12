Debiutuje model językowy GPT-5.2

Wyścig zbrojeń w świecie AI nie zwalnia ani na chwilę. OpenAI pokazał właśnie model GPT-5.2, który ma zostawić rywali w tyle. Twórcy rozwiązania ChatGPT obiecują, że ich nowe dziecko poradzi sobie z zadaniami, które do tej pory wymagały sztabu ludzi.

Myśli jak ekspert

Sercem nowej aktualizacji jest wariant GPT-5.2 Thinking. OpenAI chwali się, że to pierwszy model, który w testach dorównuje ludzkim ekspertom lub ich przewyższa. Firma oparła te twierdzenia na nowym benchmarku o nazwie GDPval. Sprawdza on zdolności AI w 44 różnych zawodach.

GPT‑5.2 Thinking GPT‑5.1 Thinking GDPval (wygrane lub remisy)

Zadania związane z pracą opartą na wiedzy 70,9% 38,8% (GPT‑5) SWE-Bench Pro (public)

Inżynieria oprogramowania 55,6% 50,8% SWE-bench Verified

Inżynieria oprogramowania 80,0% 76,3% GPQA Diamond (bez narzędzi)

Pytania naukowe 92,4% 88,1% Rozumowanie CharXiv (z Python)

Pytania dotyczące wykresów naukowych 88,7% 80,3% HMMT (luty 2025)

Turniej matematyczny 99,4% 96,3% FrontierMath (Poziom 1–3)

Zaawansowana matematyka 40,3% 31,0% ARC-AGI-1 (Verified)

Abstrakcyjne rozumowanie 86,2% 72,8% ARC-AGI-2 (Verified)

Abstrakcyjne rozumowanie 52,9% 17,6% Pokaż więcej

Wyniki robią wrażenie. GPT-5.2 Thinking wygrywa lub remisuje z czołowymi specjalistami w aż 70,9% przypadków. Nie chodzi tu tylko o pisanie wierszy. Model ma świetnie radzić sobie z tworzeniem skomplikowanych prezentacji, arkuszy kalkulacyjnych i zarządzaniem wieloetapowymi projektami. To narzędzie ma realnie zarabiać na siebie w firmach.

Programista na pełen etat

Dobre wieści płyną też dla programistów. GPT-5.2 znacznie lepiej radzi sobie z kodowaniem niż jego poprzednicy. W teście SWE-Bench Pro, który symuluje prawdziwą inżynierię oprogramowania, model osiągnął wynik 55,6%. To nowy rekord w branży.

Szczególnie duży skok jakościowy widać w tworzeniu interfejsów (front-end). Nowy GPT potrafi budować złożone UI, w tym elementy 3D. Testerzy chwalą go za to, że staje się wreszcie użytecznym partnerem w codziennej pracy nad kodem, a nie tylko generatorem prostych skryptów.

Trzy wersje dla każdego

OpenAI nie ogranicza się do jednego modelu. Do użytkowników trafiają trzy warianty:

GPT-5.2 Instant – szybki i lekki, do prostych zadań,

– szybki i lekki, do prostych zadań, GPT-5.2 Thinking – potężny model do głębokiej analizy i "myślenia",

– potężny model do głębokiej analizy i "myślenia", GPT-5.2 Pro – najbardziej zaawansowana wersja dla wymagających.

Nowe modele są już wdrażane do ChatGPT dla użytkowników płatnych planów. Programiści mogą też korzystać z nich poprzez API.