Czy test Turinga lub którykolwiek z jego wariantów jest wiarygodnym testem sztucznej inteligencji?

35

Test Turinga była pierwsza próba sztucznej inteligencji, a obecnie jest nieco nieaktualne. Razem Test Turinga ma być bardziej nowoczesny test, który wymaga znacznie bardziej skomplikowany system. Jakich technik możemy użyć do zidentyfikowania sztucznej inteligencji (słaba AI) i sztucznej inteligencji ogólnej (silna AI)?

Rob Murray
źródło
6
Zdecydowanie wymaga podejścia statystycznego z wieloma uczestnikami. Spotkałem ludzi, którzy nie zdaliby testu Turinga.
SF.
1
To zależy od tego, jak definiujesz inteligencję.
baranskistad

Odpowiedzi:

16

Retoryczny punkt testu Turinga polega na tym, że umieszcza on „test” na „ludzkość” w obserwowalnych wynikach , a nie w elementach wewnętrznych . Jeśli zachowywałbyś się tak samo w interakcji z AI, jak w przypadku osoby, jak mógłbyś to zrobić wiedzieć, różnica między nimi?

Ale to nie znaczy, że jest wiarygodne, ponieważ inteligencja ma wiele różnych elementów i istnieje wiele rodzajów zadań intelektualnych. Test Turinga pod pewnymi względami dotyczy reakcji ludzi na zachowanie, które wcale nie jest wiarygodne - pamiętaj, że wiele osób myślało , ELIZA , bardzo prosty chatbot, był doskonałym słuchaczem i bardzo szybko zaangażował się emocjonalnie. Przywołuje na myśl reklamę Ikei o wyrzucaniu lampy , w której przywiązanie emocjonalne pochodzi raczej od ludzkiego widza (i muzyki) niż od lampy.

Testy Turinga dla określonych rodzajów działalności gospodarczej są o wiele bardziej interesujące - jeśli na przykład można napisać AI, która zastąpi sterownik Ubera, oznacza to, że będzie to o wiele bardziej zrozumiałe, niż gdyby ktoś mógł stworzyć chatbota konwersacyjnego.

Matthew Graves
źródło
10

Problem testu Turinga polega na tym, że testuje on zdolność maszyn do przypominania ludzi. Niekoniecznie każda forma AI musi przypominać ludzi. To sprawia, że ​​test Turinga jest mniej niezawodny. Jednak nadal jest przydatny, ponieważ jest to prawdziwy test. Warto również zauważyć, że istnieje nagroda za zdanie lub zbliżenie się do zdania testu Turinga, nagrody Loebnera .

Definicja inteligencji inteligentnego agenta stwierdza, że ​​agent jest inteligentny, jeśli działa w taki sposób, aby zmaksymalizować oczekiwaną wartość miary wydajności opartej na doświadczeniu i wiedzy z przeszłości. (parafrazowany z Wikipedii ). Ta definicja jest używana częściej i nie zależy od zdolności przypominania ludzi. Jednak trudniej to przetestować.

wythagoras
źródło
7

Klasyczny test Turinga z pewnością ma ograniczenia. Ponieważ nie widzę tu jeszcze wspomnianych słów, zasugeruję przeczytanie o Chińskim Pokoju , który jest jednym z najczęściej cytowanych powodów, dla których Test Turinga rzeczywiście nie jest w stanie ustalić prawdziwej „świadomości”. Chciałbym jednak również zauważyć, że sam Turing, w oryginalnej pracy, w której zaproponowano Test Turinga , wyraźnie stwierdził, że test nie był testem do wykrycia świadomości :

Proponuję rozważyć pytanie: „Czy maszyny mogą myśleć?” Powinno to zaczynać się od definicji znaczenia terminów „maszyna” i „myśl”. Definicje mogą być sformułowane w taki sposób, aby odzwierciedlały w jak największym stopniu normalne użycie słów, ale taka postawa jest niebezpieczna, jeśli znaczenie słów „maszyna” i „myśl” można znaleźć, badając ich powszechne użycie trudno nie dojść do wniosku, że znaczenie i odpowiedź na pytanie „Czy maszyny mogą myśleć?” należy szukać w ankiecie statystycznej, takiej jak sonda Gallupa. Ale to absurdalne. Zamiast próbować takiej definicji, zastąpię pytanie innym, ściśle z nim związanym i wyrażonym względnie jednoznacznymi słowami.

Nową formę problemu można opisać w kategoriach gry, którą nazywamy „imitacją”.

Ta imitacja to test, który dziś znamy (a także inspiracja dla nazwy najnowszego filmu fabularnego z Benedictem Cumberbatchem i Keirą Knightley).

eric.mitchell
źródło
1
Świetna odpowiedź. Podzielam również opinię, że przejście z „imitacji gry” na „test Turinga” doprowadziło do głębokich nieporozumień na temat konsekwencji. (Pornboty cały czas przechodzą Test Turinga;)
DukeZhou
5

Istnieje wiele definicji sztucznej inteligencji na wolności. Wszystkie te definicje są częścią jednego (lub więcej) obszarów. Istnieją cztery główne domeny, a poniższe zdjęcie rzuci na to trochę światła.

wprowadź opis zdjęcia tutaj



Test Turinga obraca się wokół lewej strony liczności, która dotyczy głównie tego, jak ludzie myślą lub działają. Wiemy jednak, że to nie wszystko. Test Turinga nie ma wiele do zaoferowania, jeśli chodzi o sztuczną inteligencję w sensie ogólnym.
Test Turinga, jak twierdzi Wikipedia, został stworzony do testowania maszyn wykazujących zachowania równoważne lub nie do odróżnienia od zachowania człowieka. Sztuczna inteligencja to znacznie więcej niż to, co ludzie mogą zrobić lub jak działają. Istnieje wiele ludzkich czynów uważanych za nieinteligentne, a czasem także nieludzkie.
Argument „Pokój chiński” koncentruje się na czymś bardzo ważnym, jeśli chodzi o „Świadomość v / s Symulacja świadomości”. John Searle argumentował tam, że maszyna (lub człowiek) może przestrzegać ogromnej liczby predefiniowanych reguł (algorytmów) w celu wykonania zadania bez myślenia i posiadania umysłu. Słabe AI są dobre w symulacji zdolności rozumienia, ale tak naprawdę nie rozumieją, co robią. Nie wykazują „samoświadomości” i nie reprezentują siebie. „Chcę tego v / s Wiem, że tego chcę” to dwie różne rzeczy.

Jak głosi Teoria umysłu, dobra sztuczna inteligencja nie powinna jedynie reprezentować świata, nad którym pracuje, ale także innych agentów i bytów na świecie. Te dwie koncepcje samoświadomości i teorii umysłu wyznaczają cienką granicę między słabą a silną AI.

Jeśli chodzi o test Turinga, kończy się niepowodzeniem z wielu powodów, podobnie jak Total Turing Test, który dodaje kolejną warstwę do testu. Większość badaczy uważa, że ​​Test Turinga to tylko odwrócenie uwagi od głównego celu, coś, co utrudnia im owocną pracę. Rozważ to, załóżmy, że zadajesz trudny problem arytmetyczny, aby odróżnić człowieka od maszyny. Jeśli maszyna chce udawać, że jest człowiekiem, kłamie. Nie tego chcemy. Przejście do testu Turinga ustanawia górną granicę sztucznej inteligencji, którą można utworzyć. Również sprawianie, aby sztuczna inteligencja działała i zachowywała się jak ludzie, nie jest zbyt dobrym pomysłem. Ludzie nie są zbyt dobrzy w podejmowaniu właściwych decyzji przez cały czas. To jest powód, dla którego czytamy o wojnach w naszych książkach historycznych. Podejmowane przez nas decyzje są często stronnicze, mają samolubne korzenie itp. Nie „

Nie sądzę, że jest jeden test do przetestowania AI. Jest tak, ponieważ AI ma wiele definicji, wiele typów. Niezależnie od tego, czy sztuczna inteligencja jest słaba, czy silna, można oznaczyć ją, szukając odpowiedzi na pytania typu „Chcę tego v / s, wiem, że tego chcę”, „Kim jestem i co dokładnie robię (z perspektywy maszyny)”, a także kilka innych pytań, o których wspomniałem powyżej.

Ugnes
źródło
3

Zależy to od sposobu przeprowadzenia testu. Na przykład, kiedy ludzie twierdzili, że maszyna kilka lat temu pomyślnie przeszła test Turinga, kryteria były dość słabe. Musiał jedynie oszukać 30% ludzi przez 5 minut. To niewiele z testu. Mówiąc inaczej, prawdopodobnie przy pomocy tych kryteriów prawdopodobnie nie wykryłbyś schizofrenii, autyzmu, trudności w nauce lub demencji.

Pomimo szumu, obecne AI można wykryć w 100% przypadków przy użyciu dość prostych pytań.

naukowy
źródło
Słuszna uwaga. „Biorąc pod uwagę wystarczającą liczbę pytań ...” (Oczywiście test Voight-Kampff wydaje się dość skuteczny przy ograniczonej liczbie pytań;)
DukeZhou
2

Czy test Turinga lub którykolwiek z jego wariantów jest wiarygodnym testem sztucznej inteligencji?

Krótkowzroczność

Tak, jeśli zdefiniujemy termin Sztuczna inteligencja w odniesieniu do imitacji Alana Turinga lub jednego z jego wariantów. Podejście to może być jednocześnie ważne i bardzo ograniczone jako definicja inteligencji, gdy ludzie interpretowali to słowo, zanim pojawiła się sztuczna inteligencja.

Sprawdzona inteligencja

W związku z tym istnieje wiele alternatywnych podejść do pomiaru inteligencji, sztucznej lub innej.

  • Zostanie wielkim mistrzem szachowym
  • Tworzenie zwycięskiego programu szachowego
  • Otrzymanie bardzo selektywnej nagrody międzynarodowej
  • Stworzenie strategii, która wygrywa wojnę lub pokój
  • Przezwyciężenie tysięcy rund eliminacji w biznesie lub polityce, aby zostać prezydentem
  • Tworzenie genialnych artykułów, artykułów, scenariuszy, wykładów, przemówień, książek lub wierszy generujących znaczące zmiany paradygmatu człowieka
  • Wykazanie poziomu genialnego w teście Mensa
  • Stając się jednym z najbogatszych ludzi na świecie

Normalny pomiar normalnej inteligencji

Są to jednak pomiary wyjątkowej inteligencji, głównie dlatego, że liderzy w tych obszarach rzetelnie zastosowali inteligencję w wielu domenach w taki sposób, który doprowadził do niezwykłego sukcesu dzięki wielu scenariuszom z prawdziwego życia. Wiarygodność jest atrybutem osoby posiadającej inteligencję, a nie test samej inteligencji.

Są to bardziej przyziemne, ale być może bardziej wiarygodne i wiarygodne miary inteligencji.

  • Wychowywanie zdrowych i kochających dzieci jako możliwych do zweryfikowania poprzez staranne rozmowy z przyjaciółmi i współpracownikami członków rodziny
  • Powtarzane i skuteczne lekarstwo na wiele stanów różnego rodzaju, które zostały kiedyś zidentyfikowane jako złamane w jakiś namacalny i mierzalny sposób i okazały się mierzalnie poprawione w wyniku zastosowania rozumienia inteligencji, analizy i działań naprawczych
  • Inteligencja konwersacyjna jako wymierna dzięki uczestnikom konwersacji, przypisując swój sukces pomysłom i przykładom przedstawionym przez rozmówcę

Jakie są naprawdę pożądane cele końcowe?

Być może podstawową cechą testu Turinga jest to, że jest sztuczny. Jeśli sztuczna inteligencja jest tym, czego chcemy od oprogramowania AI, to właśnie to otrzymamy. Prawdopodobnie chcemy jednak czegoś znacznie więcej lub znacznie mniej.

Chcemy więcej, ponieważ byłoby miło, że niektóre komputery mogłyby być naszym przyjacielem, mentorem i nieopłacanym pracownikiem o wyjątkowych zdolnościach prowadzących do naszego osobistego sukcesu pod względem dochodów, wpływów, popularności lub dziedzictwa.

Chcemy mniej, ponieważ chcemy, aby niektóre komputery wykonywały zadania specyficzne dla domeny i pozostały jako w pełni podporządkowane narzędzia, być może z pewną osobowością i ciepłem, jak statek lub inne złożone urządzenie, które nadamy ludzkim nazwom, ale bez nieprzewidywalności dalekosiężnych możliwości ludzkiej inteligencji.

Douglas Daseeco
źródło