Czy AlphaZero jest przykładem AGI?

11

Z artykułu badawczego DeepMind na arxiv.org:

W tym artykule stosujemy podobny, ale w pełni ogólny algorytm, który nazywamy AlphaZero , do gier w szachy i shogi oraz Go, bez żadnej dodatkowej wiedzy domenowej z wyjątkiem reguł gry, co pokazuje, że uczenie się przez wzmocnienie ogólnego przeznaczenia algorytm może osiągnąć, tabula rasa, nadludzka wydajność w wielu wymagających domenach.

Czy to oznacza, że ​​AlphaZero jest przykładem AGI (Artificial General Intelligence)?

Siddhartha
źródło

Odpowiedzi:

11

Dobre pytanie!

  • AlphaZero, choć kamień milowy, zdecydowanie nie jest AGI :)

AlphaGo, choć silna w grze Go, jest wąsko silna („silnie wąska sztuczna inteligencja”), zdefiniowana jako siła w pojedynczym problemie lub rodzaju problemu (np. Go i inne nie-przypadkowe, idealne gry informacyjne).

  • AGI musi być co najmniej tak samo silna jak ludzie we wszystkich problemach, nad którymi ludzie pracowali lub rozwiązali.

AGI jest często kojarzone z superinteligencją , definiowaną jako inteligencja przekraczająca poziomy ludzkie.

AGI niekoniecznie oznacza super-inteligencję, w tym sensie, że rozważalibyśmy androida, który może wykonywać wszystkie ludzkie czynności z taką samą zdolnością jak ludzie jako sztuczna inteligencja ogólna .

Ale technicznie AlphaGo jest wąską superinteligencją, ponieważ przewyższa wszelkie ludzkie możliwości w jednym problemie.

DukeZhou
źródło
Nie ma wąskich superinteligencji. Nazywamy to słabą AI :). Żaden człowiek nie może znaleźć półoptymalnych kompilacji Microsoft Word lub Excel w swoim życiu - podczas gdy nowoczesne maszyny mogą to zrobić za kilka godzin.
Quonux
@Quonux Podejrzewam, że zależy od definicji. Definicja superinteligencji Bostrom jest z grubsza analogiczna do sztucznej inteligencji ogólnej, ale sam termin, mówiąc etymologicznie, oznacza po prostu „wyższą inteligencję”, dosłownie „powyżej + inteligencja”. Zgodnie z tą podstawową definicją „silna wąska sztuczna inteligencja” może być synonimem „wąskiej superinteligencji”, ponieważ pierwotną definicją „silnej” była AGI, więc po AlphaGo uczeni zaczęli używać „wąskiego” kwalifikatora.
DukeZhou
@Quonux częścią mojego punktu tutaj jest to, że wraz z pojawieniem się AlphaGo, termin „słaby” dla AI, który przekracza ludzkie możliwości w jednym zadaniu, wydaje się być zastąpiony przez „silnie wąską AI”.
DukeZhou
2

Założenia, które mogą być niepoprawne

W tekście artykułu można zidentyfikować dwa założenia.

  • Wszystkie mentalne wyzwania można sprowadzić do gry o ustalonych zasadach.
  • Maszyny lepsze niż ludzie są tym, czego ludzie naprawdę chcą lub potrzebują.

W pytaniu można zidentyfikować jeszcze dwie.

  • Ogólna inteligencja istnieje u ludzi 1
  • Jeśli istnieje u ludzi, jest zatem wykonalny w komputerach.

Wszystkie cztery mogą być prawdziwe, ale żadna z czterech nie jest pewna.

Wydajność AlphaZero

Jeśli nasza szachownica znajduje się na półce gry w naszej szafie, nasza trawa jest długa, a nasza kosiarka jest zepsuta, AlphaZero, jeśli zostanie podłączony do humanoidalnego robota, nie będzie miał zakodowanych reguł gry dla sekwencji zadań.

  • Wysłuchanie prośby właściciela,
  • Nauczenie się, jak opanować lalkę robota,
  • Lokalizowanie i identyfikowanie wszystkich naszych narzędzi i części zamiennych,
  • Mocowanie kosiarki i
  • Informowanie nas, że kosiarka jest gotowa do użycia.

Dlatego w tym scenariuszu nie ma dla nas żadnej szczególnej wartości dla konsumenta. Niezbyt ogólny.

Nawet gdyby mógł kosić trawnik za pomocą już działającej kosiarki, miałoby to wartość, która nie wymaga zdolności do wygrywania niczego, ale raczej zdolności do posłuszeństwa i wykazywania podludzkiej inteligencji wymaganej, aby nie przejechać przez klombu.

To, że mądrzy ludzie z DeepMind zdecydowali się na użycie łacińskiej tabula rasa zamiast pustej tablicy, jest godne uwagi, ale nie tak imponujące, jak skonstruowanie programu do nauki, który potrafi nauczyć się dobrze grać w trzy gry przy użyciu tylko zakodowanych reguł i rzeczywistej gry jako danych wejściowych.

Aby uznać te programy gier za naprawdę przydatne w przestrzeni produktów, nie można polegać na stałym zainteresowaniu zakupem oprogramowania, które za każdym razem bije kupującego. Aby produkty AI były realne, funkcje uczenia się muszą być zgodne z potocznie zwanym zdrowym rozsądkiem, który wymaga znacznie szerszej i elastycznej wiedzy domenowej niż ustalone reguły gry. Możemy się domyślać, że większość naukowców, którzy osiągnęli kamienie milowe w wygrywaniu uczenia się gry, zmierza w tym kierunku. Oni również wiedzą, że ich wyniki badań muszą zostać ostatecznie wyprodukowane lub prowadzić do zakupu oferty SaaS.

Imponujące dla osób spoza pola jest to, że postępy te można przekierować w przestrzeni centrum danych w celu wygenerowania terapii genowej w celu leczenia raka, opryszczki lub odwrotnej cukrzycy lub choroby Alzheimera. Wtedy moglibyśmy wybaczyć badaczom, że nie udostępnili nam pliku do pobrania, który mógłby opanować robota do czyszczenia naszej łazienki. Z artykułu nie wynika jasno, że AlphaZero odpowiednio wykazał, że wykazuje „nadludzką wydajność w wielu wymagających dziedzinach”.

To, co zrobili, jest nadal imponujące i zgodne z kierunkiem, w którym inni też zrobili postępy. Niewielu z nas odważyłoby się wymyślić grę, której te ogólne programy do nauki gier nie nauczyłyby się szybko i nie pokonałyby nas w ciągu kilku instancji.

Postępy oglądane w perspektywie

Z pewnością dokonując arytmetyki, sortowania poczty, a teraz gry, wynalazki ludzkości rozszerzają możliwości nagiego człowieka, nieobecnego w jego narzędziach. Postęp ten mocno osadza systemy komputerowe w sferze narzędzi. Tylna motyka jest też w pewnym sensie nadludzka. Spróbuj ułożyć kilometr rury bez niej.

I odwrotnie, ludzkość odgrywa rolę dostawcy opieki zdrowotnej dla komputerów. Jeśli zachorują lub zawiodą, jesteśmy zmuszeni usunąć wirusy i robaki lub wymienić ich uszkodzone części. W przeciwnym razie nasze domy i firmy popadną w chaos.

Technologię, podobnie jak wszystkie rzeczy, należy postrzegać z perspektywy.

Rozsądniej byłoby, gdyby ludzie byli mniej zafascynowani grami i bijąc się nawzajem, a bardziej skoncentrowani na zachowaniach społecznych opartych na współpracy, ukierunkowanych na rozwiązywanie problemów społecznych i ekonomicznych za pomocą nowo wynalezionych narzędzi i robienie tego w sposób, który nie stwarza nowych problemów ani nie zaprasza nowe okrucieństwa.


Przypisy

To, co zostało opisane jako ogólna inteligencja istniejąca u ludzi, jest dyskusyjne na podstawie dowodów przeciwnych. Wielu cytowałoby te strategie i trendy jako dowód na ograniczenia ludzkiej inteligencji.

  • Odstraszanie jądrowe jako strategia pokojowa
  • Całkowity brak umiaru w zużyciu skończonych, krytycznych zasobów naturalnych energii
  • Stale rosnąca gęstość wzorców uzależnień na całym świecie
  • Spowodowanie szóstego masowego wyginięcia na ziemi
Douglas Daseeco
źródło
Dzięki za edycję, tak jest lepiej (przynajmniej dla mnie), z większym naciskiem na techniczne części odpowiedzi. Być może istnieje inne pytanie dotyczące tego, jak perfekcyjnie racjonalna lub wysoce wydajna musi być AGI. Podobnie, do jakich standardów zachowania indywidualnego lub grupowego chcemy trzymać ludzi - chociaż nie byłoby tak w przypadku tej witryny, chyba że pytanie dotyczyło konkretnie porównań ze sztuczną inteligencją.
Neil Slater,