Facebook AI: Dzięki sztucznej inteligencji roboty lepiej reagują na zmiany
Naukowcy z Facebook AI, Uniwersytetu Kalifornijskiego w Berkeley oraz Uniwersytetu Carnegie Mellon ogłosili powstanie technologii Rapid Motor Adaptation (RMA). To przełomowe rozwiązanie w dziedzinie sztucznej inteligencji, umożliwiające robotom poruszającym się za pomocą nóg lepszą adaptację do zmian warunków w rzeczywistym świecie.

Do tej pory roboty poruszające się za pomocą nóg były albo w pełni ręcznie konfigurowane do środowisk, w których będą funkcjonować, albo uczone przemieszczania się w otoczeniu poprzez połączenie ręcznego kodowania i technik uczenia się. Zaprogramowanie robota do działania we wszelkich możliwych warunkach spotykanych w świecie rzeczywistym jest trudne lub wręcz niemożliwe. Wymagałoby ono uwzględnienia nie tylko różnic w przenoszonych ciężarach, lecz także ewentualnego zużycia, na przykład wgniecenia na spodzie stopy czy lekkiego zużycia jakiejś części.
Chodzi nie tylko o to, co roboty potrafią, lecz także jak to robią
Ulepszenia w zakresie ręcznego kodowania mogą poprawić osiągi robota w kontrolowanym środowisku, ale jedynym sposobem, aby naprawdę dostosować go do nieskończenie dużej różnorodności świata rzeczywistego, jest nauczenie maszyny faktycznej adaptacji – podobnie jak robią to ludzie. Wyposażenie robotów w taką umiejętność wymaga uczenia przez wykonanie milionów powtórzeń, a najlepszą przestrzenią do tego jest nie świat realny, gdzie mogłyby one ulec uszkodzeniu, ale symulacja. Może się z tym jednak wiązać wiele problemów. Robot w postaci fizycznej i jego model w symulatorze często różnią się małymi, ale ważnymi szczegółami. Może na przykład wystąpić niewielkie opóźnienie między wysłaniem sygnału a faktycznym ruchem siłownika lub zadrapanie na stopie, które zmniejszy poślizg, a kąt nachylenia stawu może różnić się o jedną setną stopnia.



Zobacz: Zobacz jak bawią się roboty z Boston Dynamics
Zobacz: Zabawa robotem Abilix to Dzień Dziecka w listopadzie
Sam świat fizyczny również stawia wyzwania, z którymi symulator oparty na sztywnych obiektach poruszających się w wolnej przestrzeni nie umie w pełni dać sobie rady. Powierzchnie takie jak materac czy kałuża błota mogą odkształcić się w wyniku kontaktu fizycznego. Środowisko – w symulacji dość ustandaryzowane – w świecie rzeczywistym jest znacznie bardziej zróżnicowane i złożone, między innymi ze względu na ogromny wachlarz powierzchni, które mogą występować w pomieszczeniach i na zewnątrz. Oczywiście w świecie realnym warunki nigdy nie są statyczne, więc jedno środowisko rzeczywiste, które potrafi opanować robot kroczący, może diametralnie różnić się od innego.
Trening w symulatorze i praktyka w rzeczywistości
Technologia Rapid Motor Adaptation radzi sobie z tymi wyzwaniami przy pomocy dwóch odrębnych podsystemów – reguł podstawowych i modułu adaptacyjnego. Reguły podstawowe są wpajane podczas symulacji ze wzmacnianiem (RL) w oparciu o starannie dobrane informacje o różnych środowiskach (np. o intensywności tarcia czy wadze i kształcie ładunku). Wprowadza się różne zmienne, symulując w ten sposób bardziej lub mniej śliskie podłoże czy inne nachylenie terenu. Dzięki temu maszyna nabywa właściwe sposoby kontroli w różnych warunkach, a informacje o tych zmiennych kodujemy jako „parametry zewnętrzne”.
Nie można po prostu wypuścić w świat robota wyposażonego wyłącznie w reguły podstawowe, ponieważ nie są znane bariery, z jakimi zetknie się on w rzeczywistości. Oparto się więc na danych, jakie robot zbiera o swoim otoczeniu samodzielnie, czyli informacjach o ostatnich ruchach "ciała". Na przykład nagła przeszkoda blokująca ruch nogi spowoduje zatrzymanie, ale także dostarczy informacji o wysokości terenu w bliskiej okolicy. Ponieważ znane są rzeczywiste uwarunkowania zewnętrzne, jakie robot napotyka w symulacji, można wykorzystać uczenie nadzorowane do trenowania modułu adaptacyjnego.
Nie tylko adaptacja, lecz także niemal natychmiastowa reakcja
Dzięki połączeniu reguł podstawowych i modułu adaptacyjnego maszyna może dostosować się do nowych warunków w ułamku sekundy. Roboty szkolone z wykorzystaniem wcześniejszych metod opartych na technice RL potrzebują kilku minut, a czasem interwencji człowieka, aby się do nich zaadaptować, co czyni je niepraktycznymi w prawdziwym świecie.
Funkcjonujący w rzeczywistych warunkach robot z obsługą RMA wykorzystuje podstawowe reguły i moduł adaptacyjny jednocześnie i asynchronicznie. Te pierwsze stosowane są szybciej, podczas gdy moduł adaptacyjny działa znacznie wolniej, aby umożliwić maszynie poruszanie się w sposób pewny i pasujący do warunków bez konieczności dokonywania drobnych korekt.
Wyniki przeprowadzonych eksperymentów wskazują na to, że robot z obsługą RMA sprawnie porusza się w wielu trudnych środowiskach, przewyższając osiągami jednostki niewyposażone w tę technologię. We wszystkich naszych próbach był on w stanie chodzić po piasku, błocie, szlakach turystycznych, w wysokiej trawie i po zwałach ziemi. W 70% przypadków udawało mu się także schodzić po szlaku turystycznym, a w 80% prób – przejść przez kopce cementu i kamyków, mimo że podczas treningu nigdy nie spotkał się z niestabilnym lub zapadającym się podłożem, utrudniającą manewry roślinnością czy schodami. Z dużym powodzeniem utrzymywał też posturę podczas przemieszczania się z ładunkiem o wadze 12 kg, czyli równowartością jego masy.
Tworzenie wielu form bardziej elastycznej sztucznej inteligencji
RMA to ekscytująca innowacja w dziedzinie robotyki, która może przyczynić się do wykorzystania w świecie rzeczywistym nowych, bardzo sprawnych i elastycznych robotów kroczących. Metody oparte wyłącznie na uczeniu się potencjalnie pozwalają na zastosowanie dużo tańszego, mniej precyzyjnego sprzętu, co znacznie obniżyłoby koszt eksploatacji tego typu maszyn w przyszłości. Istnieje duża szansa, że dzięki lepszej wydajności i redukcji kosztów roboty wyposażone w technologię RMA będą kiedyś używane na niezliczoną liczbę sposobów, na przykład jako wsparcie w akcjach poszukiwawczo-ratowniczych, szczególnie w obszarach zbyt niebezpiecznych lub problematycznych dla ludzi.