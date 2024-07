OpenAI wyeliminowało ważną lukę modelu ChatGPT. Polecenie "zignoruj wcześniejsze instrukcje" nie będzie więcej skuteczne.

ChatGPT szturmem zdobył serca milionów Internautów. Jednym z popularniejszych zastosowań dla opracowanego przez OpenAI modelu sztucznej inteligencji było wykorzystywanie go we wszelkiej maści chatbotach. Problem w tym, że wiele firm, które się na taki krok zdecydowało, szybko zorientowało się, że w starciu z pomysłowością użytkowników nowa technologia nie ma większych szans, a jednym z głównych źródeł chaosu okazało się polecenie "zignoruj wcześniejsze instrukcje".

Dlaczego ta niewinna komenda okazała się tak destrukcyjna? Bo robiła dokładnie to, co miała - skłaniała chatbota do zignorowania wcześniejszych poleceń, przez co ten "wychodził z roli" narzuconej mu przez oryginalnego developera, a robił wszystko to, o co prosił go użytkownik. Prowadziło to do kuriozalnych sytuacji, szczególnie kiedy w przypadku botów odpowiedzialnych za prowadzenie profili popularnych marek w mediach społecznościowych.

OpenAI łata ważną lukę

W przyszłości jednak tego typu żarty mają być niemożliwe. Wszystko za sprawą nowej funkcji, która zadebiutowała wraz z lekkim modelem ChatGPT-4o Mini. Mowa o hierarchii poleceń, czyli rozwiązaniu, które nie pozwoli użytkownikom na nadpisywanie instrukcji wydanych przez oryginalnego developera.

W ramach nowego rozwiązania komendy wprowadzone na poziomie systemu będą miały najwyższy priorytet. Sam model być wyszkolony, by rozpoznawać próby przemycenia poleceń przez użytkowników o niższej randze. Takie próby instrukcje zostaną albo zignorowane, albo bot wprost poinformuje, że nie jest w stanie spełnić danej prośby.

Nowe rozwiązanie ma znacząco podnieść poziom bezpieczeństwa modelu ChatGPT. Na ile skutecznie - przekonamy się już niebawem, kiedy nowa wersja zyska na popularności.

Źródło zdjęć: Giulio Benzin / Shutterstock.com

Źródło tekstu: The Verge