OpenAI kontratakuje. Nowy model miażdży konkurencję
Firma OpenAI odkryła karty i oficjalnie zaprezentowała światu model GPT-5.2. Nowa sztuczna inteligencja ma być odpowiedzią na rosnącą konkurencję i prawdziwym przełomem w pracy zawodowej.
Debiutuje model językowy GPT-5.2
Wyścig zbrojeń w świecie AI nie zwalnia ani na chwilę. OpenAI pokazał właśnie model GPT-5.2, który ma zostawić rywali w tyle. Twórcy rozwiązania ChatGPT obiecują, że ich nowe dziecko poradzi sobie z zadaniami, które do tej pory wymagały sztabu ludzi.
Myśli jak ekspert
Sercem nowej aktualizacji jest wariant GPT-5.2 Thinking. OpenAI chwali się, że to pierwszy model, który w testach dorównuje ludzkim ekspertom lub ich przewyższa. Firma oparła te twierdzenia na nowym benchmarku o nazwie GDPval. Sprawdza on zdolności AI w 44 różnych zawodach.
| GPT‑5.2 Thinking | GPT‑5.1 Thinking | |
| GDPval (wygrane lub remisy) Zadania związane z pracą opartą na wiedzy |
70,9% | 38,8% (GPT‑5) |
| SWE-Bench Pro (public) Inżynieria oprogramowania |
55,6% | 50,8% |
| SWE-bench Verified Inżynieria oprogramowania |
80,0% | 76,3% |
| GPQA Diamond (bez narzędzi) Pytania naukowe |
92,4% | 88,1% |
| Rozumowanie CharXiv (z Python) Pytania dotyczące wykresów naukowych |
88,7% | 80,3% |
| HMMT (luty 2025) Turniej matematyczny |
99,4% | 96,3% |
| FrontierMath (Poziom 1–3) Zaawansowana matematyka |
40,3% | 31,0% |
| ARC-AGI-1 (Verified) Abstrakcyjne rozumowanie |
86,2% | 72,8% |
| ARC-AGI-2 (Verified) Abstrakcyjne rozumowanie |
52,9% | 17,6% |
Wyniki robią wrażenie. GPT-5.2 Thinking wygrywa lub remisuje z czołowymi specjalistami w aż 70,9% przypadków. Nie chodzi tu tylko o pisanie wierszy. Model ma świetnie radzić sobie z tworzeniem skomplikowanych prezentacji, arkuszy kalkulacyjnych i zarządzaniem wieloetapowymi projektami. To narzędzie ma realnie zarabiać na siebie w firmach.
Programista na pełen etat
Dobre wieści płyną też dla programistów. GPT-5.2 znacznie lepiej radzi sobie z kodowaniem niż jego poprzednicy. W teście SWE-Bench Pro, który symuluje prawdziwą inżynierię oprogramowania, model osiągnął wynik 55,6%. To nowy rekord w branży.
Szczególnie duży skok jakościowy widać w tworzeniu interfejsów (front-end). Nowy GPT potrafi budować złożone UI, w tym elementy 3D. Testerzy chwalą go za to, że staje się wreszcie użytecznym partnerem w codziennej pracy nad kodem, a nie tylko generatorem prostych skryptów.
Trzy wersje dla każdego
OpenAI nie ogranicza się do jednego modelu. Do użytkowników trafiają trzy warianty:
- GPT-5.2 Instant – szybki i lekki, do prostych zadań,
- GPT-5.2 Thinking – potężny model do głębokiej analizy i "myślenia",
- GPT-5.2 Pro – najbardziej zaawansowana wersja dla wymagających.
Nowe modele są już wdrażane do ChatGPT dla użytkowników płatnych planów. Programiści mogą też korzystać z nich poprzez API.
Wygląda na to, że OpenAI chce szybko odzyskać palmę pierwszeństwa i pokazać firmie Google, kto tu rządzi. Więcej informacji o GPT-5.2 znajdziesz pod tym adresem.