Z artykułu badawczego DeepMind na arxiv.org:
W tym artykule stosujemy podobny, ale w pełni ogólny algorytm, który nazywamy AlphaZero , do gier w szachy i shogi oraz Go, bez żadnej dodatkowej wiedzy domenowej z wyjątkiem reguł gry, co pokazuje, że uczenie się przez wzmocnienie ogólnego przeznaczenia algorytm może osiągnąć, tabula rasa, nadludzka wydajność w wielu wymagających domenach.
Czy to oznacza, że AlphaZero jest przykładem AGI (Artificial General Intelligence)?
źródło
Założenia, które mogą być niepoprawne
W tekście artykułu można zidentyfikować dwa założenia.
W pytaniu można zidentyfikować jeszcze dwie.
Wszystkie cztery mogą być prawdziwe, ale żadna z czterech nie jest pewna.
Wydajność AlphaZero
Jeśli nasza szachownica znajduje się na półce gry w naszej szafie, nasza trawa jest długa, a nasza kosiarka jest zepsuta, AlphaZero, jeśli zostanie podłączony do humanoidalnego robota, nie będzie miał zakodowanych reguł gry dla sekwencji zadań.
Dlatego w tym scenariuszu nie ma dla nas żadnej szczególnej wartości dla konsumenta. Niezbyt ogólny.
Nawet gdyby mógł kosić trawnik za pomocą już działającej kosiarki, miałoby to wartość, która nie wymaga zdolności do wygrywania niczego, ale raczej zdolności do posłuszeństwa i wykazywania podludzkiej inteligencji wymaganej, aby nie przejechać przez klombu.
To, że mądrzy ludzie z DeepMind zdecydowali się na użycie łacińskiej tabula rasa zamiast pustej tablicy, jest godne uwagi, ale nie tak imponujące, jak skonstruowanie programu do nauki, który potrafi nauczyć się dobrze grać w trzy gry przy użyciu tylko zakodowanych reguł i rzeczywistej gry jako danych wejściowych.
Aby uznać te programy gier za naprawdę przydatne w przestrzeni produktów, nie można polegać na stałym zainteresowaniu zakupem oprogramowania, które za każdym razem bije kupującego. Aby produkty AI były realne, funkcje uczenia się muszą być zgodne z potocznie zwanym zdrowym rozsądkiem, który wymaga znacznie szerszej i elastycznej wiedzy domenowej niż ustalone reguły gry. Możemy się domyślać, że większość naukowców, którzy osiągnęli kamienie milowe w wygrywaniu uczenia się gry, zmierza w tym kierunku. Oni również wiedzą, że ich wyniki badań muszą zostać ostatecznie wyprodukowane lub prowadzić do zakupu oferty SaaS.
Imponujące dla osób spoza pola jest to, że postępy te można przekierować w przestrzeni centrum danych w celu wygenerowania terapii genowej w celu leczenia raka, opryszczki lub odwrotnej cukrzycy lub choroby Alzheimera. Wtedy moglibyśmy wybaczyć badaczom, że nie udostępnili nam pliku do pobrania, który mógłby opanować robota do czyszczenia naszej łazienki. Z artykułu nie wynika jasno, że AlphaZero odpowiednio wykazał, że wykazuje „nadludzką wydajność w wielu wymagających dziedzinach”.
To, co zrobili, jest nadal imponujące i zgodne z kierunkiem, w którym inni też zrobili postępy. Niewielu z nas odważyłoby się wymyślić grę, której te ogólne programy do nauki gier nie nauczyłyby się szybko i nie pokonałyby nas w ciągu kilku instancji.
Postępy oglądane w perspektywie
Z pewnością dokonując arytmetyki, sortowania poczty, a teraz gry, wynalazki ludzkości rozszerzają możliwości nagiego człowieka, nieobecnego w jego narzędziach. Postęp ten mocno osadza systemy komputerowe w sferze narzędzi. Tylna motyka jest też w pewnym sensie nadludzka. Spróbuj ułożyć kilometr rury bez niej.
I odwrotnie, ludzkość odgrywa rolę dostawcy opieki zdrowotnej dla komputerów. Jeśli zachorują lub zawiodą, jesteśmy zmuszeni usunąć wirusy i robaki lub wymienić ich uszkodzone części. W przeciwnym razie nasze domy i firmy popadną w chaos.
Technologię, podobnie jak wszystkie rzeczy, należy postrzegać z perspektywy.
Rozsądniej byłoby, gdyby ludzie byli mniej zafascynowani grami i bijąc się nawzajem, a bardziej skoncentrowani na zachowaniach społecznych opartych na współpracy, ukierunkowanych na rozwiązywanie problemów społecznych i ekonomicznych za pomocą nowo wynalezionych narzędzi i robienie tego w sposób, który nie stwarza nowych problemów ani nie zaprasza nowe okrucieństwa.
Przypisy
To, co zostało opisane jako ogólna inteligencja istniejąca u ludzi, jest dyskusyjne na podstawie dowodów przeciwnych. Wielu cytowałoby te strategie i trendy jako dowód na ograniczenia ludzkiej inteligencji.
źródło