Jakie znaczenie ma AIXI w obecnych badaniach nad sztuczną inteligencją?

14

Z Wikipedii:

AIXI [„ai̯k͡siː] to teoretyczny formalizm matematyczny sztucznej inteligencji ogólnej. Łączy indukcję Solomonoffa z sekwencyjną teorią decyzyjną. AIXI został po raz pierwszy zaproponowany przez Marcusa Huttera w 2000 r. [1], a wyniki poniżej zostały udowodnione w książce Huttera z 2005 r. Universal Artificial Intelligence. [2]

Chociaż możliwe są obliczenia, możliwe są aproksymacje, takie jak AIXItl . Znalezienie aproksymacji do AIXI może być obiektywnym sposobem rozwiązania sztucznej inteligencji.

Czy AIXI to naprawdę wielka sprawa w badaniach nad sztuczną inteligencją ogólną ? Czy można to uznać za centralną koncepcję w tej dziedzinie? Jeśli tak, to dlaczego nie mamy więcej publikacji na ten temat (a może mamy i nie jestem ich świadomy)?

rcpinto
źródło

Odpowiedzi:

8

„Obecne badania nad sztuczną inteligencją” to dość szeroka dziedzina. Z miejsca, w którym siedzę, w sferze głównie CS, ludzie skupiają się na wąskiej inteligencji, która może wykonywać ekonomicznie istotną pracę przy wąskich zadaniach. (Oznacza to, przewidywanie, kiedy składniki ulegną awarii, przewidywanie, które reklamy użytkownik kliknie itd.)

W przypadku tego rodzaju narzędzi ogólność formalizmu, takiego jak AIXI, jest słabością, a nie siłą. Nie musisz brać sztucznej inteligencji, która teoretycznie mogłaby obliczyć wszystko, a następnie powoli szkolić ją, aby koncentrowała się na tym, czego chcesz, kiedy możesz po prostu bezpośrednio ukształtować narzędzie, które jest lustrem twojego zadania.

Nie jestem tak zaznajomiony z badaniami AGI, ale mam wrażenie, że AIXI jest do pewnego stopnia najprostszym pomysłem, który mógłby zadziałać - bierze całą trudną rolę i wprowadza ją w obliczenia, więc jest to „tylko wyzwanie inżynierskie . ” (Chodzi tu o „znajdowanie przybliżeń do AIXI”). Powstaje zatem pytanie, czy zaczyna się w AIXI i próbuje przybliżyć mniej lub bardziej owocną ścieżkę badawczą niż zaczynać od czegoś małego i funkcjonalnego i próbować zbudować?

Mam wrażenie, że ta ostatnia jest znacznie bardziej powszechna, ale znowu widzę tylko mały zakątek tej przestrzeni.

Matthew Graves
źródło
W rzeczywistości nie odpowiadasz na pytania w bieżącym poście . Pierwsze pytanie brzmi: „czy AIXI to naprawdę wielka sprawa w badaniach nad sztuczną inteligencją ogólną ?”. Pytanie ściśle dotyczy znaczenia AIXI w badaniach AGI , nie pyta o to, czy uważasz, że inne konkretne narzędzia są lepsze dla odpowiednich zadań zamiast zawężać aproksymacje modeli AGI do tych samych konkretnych zadań. W poście inne pytanie brzmi: „dlaczego nie mamy więcej publikacji na ten temat?” Brak odpowiedzi na to pytanie w swoim poście.
nbro
5

Czy AIXI to naprawdę wielka sprawa w badaniach nad sztuczną inteligencją ogólną?

Tak, to świetny teoretyczny wkład do AGI. AFAIK, jest to najpoważniejsza próba zbudowania teoretycznych ram lub podstaw dla AGI. Podobne prace to Gödel Machines Schmidhubera i architektura SOAR .

AIXI jest abstrakcyjną i nieantropomorficzną strukturą dla AGI, która opiera się na polu uczenia się wzmacniającego, bez kilku typowych założeń (np. Bez założeń Markowa i ergodyczności , co gwarantuje, że agent może łatwo odzyskać wszelkie błędy popełnione w przeszłość). Mimo że niektóre właściwości optymalizacyjne systemu AIXI zostały udowodnione, jest on (Turinga) nieobliczalny (nie można go uruchomić na komputerze), a zatem ma bardzo ograniczoną praktyczną użyteczność. Niemniej jednak w książce Huttera Uniwersalna sztuczna inteligencja: decyzje sekwencyjne oparte na prawdopodobieństwie algorytmicznym(2005), gdzie rygorystycznie udowodniono kilka właściwości AIXI, opisano także obliczalną, ale trudną do uzyskania wersję AIXI, AIXItl. Ponadto w artykule A Monte Carlo AIXI Approximation (2009) autorstwa Joela Venessa i wsp. Wprowadzono obliczalne i możliwe do obliczenia przybliżenie AIXI. Podjęto więc próby praktycznego wykorzystania AIXI.

Artykuł Co to jest AIXI? - Wprowadzenie do General Reinforcement Learning (2015) autorstwa Jana Leike, który jest jednym z autorów projektu i ewolucji frameworka AIXI, stanowi delikatne wprowadzenie do agenta AIXI. Zobacz także Architektura AIXI w Stanford Encyclopedia of Philosophy, aby uzyskać możliwie łagodniejsze wprowadzenie do AIXI.

Czy można to uznać za centralną koncepcję w tej dziedzinie?

Tak, wprowadzenie systemu AIXI i powiązanych badań przyczyniło się do ewolucji pola AGI. Było wiele dyskusji i opublikowanych artykułów, po jego wprowadzeniu w 2000 r. Przez Huttera w artykule Teoria uniwersalnej sztucznej inteligencji opartym na złożoności algorytmicznej .

Patrz np. Sekcja 7, „Przykłady superinteligencji” w artykule Sztuczna inteligencja ogólna i model mentalny człowieka (2012), Roman V. Yampolskiy i Joshua Fox. Zobacz także https://wiki.lesswrong.com/wiki/AIXI, który zawiera dyskusję dotyczącą kilku problemów związanych z AIXI, które należy rozwiązać lub ewentualnie uniknąć w przyszłych platformach AGI. Ponadto zobacz także ten i te artykuły.

Jeśli tak, to dlaczego nie mamy więcej publikacji na ten temat (a może mamy i nie jestem ich świadomy)?

Było kilka publikacji, głównie autorstwa Marcusa Huttera i powiązanych badaczy. Publikacje Marcusa Huttera można zobaczyć na następującej stronie internetowej: http://www.hutter1.net/official/publ.htm .

Jeśli jesteś zainteresowany udziałem w tej teorii, istnieje kilka sposobów. Jeśli jesteś dobrze wykształcony matematycznie, możesz spróbować rozwiązać niektóre z opisanych tutaj problemów ( o których wspomniano również w wyżej wymienionej książce Huttera z 2005 r.). Ponadto można również przyczynić się do nowych przybliżeń lub ulepszeń istniejących przybliżeń agenta AIXI. Wreszcie możesz zbudować nową platformę AGI, unikając problemów związanych ze strukturą AIXI. Zobacz także projekty promowane przez Huttera . Dobrym pomysłem może być wzięcie pod uwagę np. Maszyn Gödela i powiązanych prac przed próbą wprowadzenia nowego frameworka (pod warunkiem, że jesteś do tego zdolny).

Myślę, że ta teoria prawdopodobnie nie przyciągnęła większej liczby ludzi, ponieważ jest wysoce techniczna i matematyczna (więc nie jest łatwo ją zrozumieć, chyba że masz bardzo solidne doświadczenie w uczeniu się przez wzmocnienie, teorii prawdopodobieństwa itp.). Myślę też, że większość ludzi (w społeczności AI) nie jest zainteresowana teoriami, ale kierują się głównie praktycznymi i użytecznymi wynikami.

nbro
źródło
4

AIXI to tak naprawdę ramy koncepcyjne. Nadal pozostaje ciężka praca polegająca na kompresji środowiska.

Aby dalej omawiać pytanie postawione w odpowiedzi Matthew Gravesa: biorąc pod uwagę nasz obecny ograniczony poziom zdolności do reprezentowania złożonych środowisk, wydaje mi się, że nie ma praktycznej różnicy, czy zaczynasz od AIXI jako definicji „góry” system i pracując w dół (np. za pomocą rzekomo uogólnionych metod kompresji) lub zaczynając od „dolnej części” i próbując rozwiązać problemy w jednej domenie za pomocą metod specyficznych dla domeny, które (mam nadzieję) można następnie wyodrębnić w celu zapewnienia kompresji między domenami.

NietzscheanAI
źródło
Drugi akapit jest wynikiem Twojej jedynej opinii. Podajesz zero argumentów / wyjaśnień, dlaczego tak myślisz. Dla mnie „biorąc pod uwagę nasz obecny ograniczony poziom zdolności do reprezentowania złożonych środowisk” zdecydowanie nie jest wystarczającym wyjaśnieniem ani argumentacją.
nbro
@nbro Cytując słynnego badacza AI: „Musimy jeszcze przedstawić choćby jedną koncepcję na komputerze”, z pewnością nie z tego rodzaju plastyczności, która naturalnie przychodzi ludziom. Dlatego w praktyce trudno jest określić użyteczność systemu AIXI, ponieważ nie mamy silnego pojęcia o rodzajach reprezentacji, których potrzebuje do manipulowania, ani o tym, w jaki sposób można by nimi manipulować.
NietzscheanAI