Czy „Eugene Goostman” naprawdę zdał test Turinga?

18

Mówi się, że „Eugene Goostman”, program komputerowy opracowany w celu symulacji 13-letniego chłopca, zdołał przekonać 33% sędziów, że był człowiekiem, i tym samym zdał Test Turinga.

Program komputerowy, znany również jako chatbot, udawał 13-letniego ukraińskiego chłopca, dla którego angielski był drugim językiem - coś zupełnie innego.

Dla mnie Eugene brzmi dokładnie tak, jak powinien mierny chatbot: powtarzalny, bezsensowny i zaśmiecony niesekwencjonalnymi. Nie wiem, jak przekonało to sędziów (którzy wydają się nieprofesjonalni).

Wiele osób skrytykowało Eugene'a, takiego jak profesor Stevan Harnad, który powiedział „To nonsens” i „Nie zdaliśmy testu Turinga. Nie jesteśmy nawet blisko”.

Opinie są różne, ale naprawdę chciałbym wiedzieć, czy oficjalnie zdał test?

Mówi się również, że:

Dwie jednorazowe nagrody, które nigdy nie zostały przyznane. 25K jest oferowane dla pierwszego chatterbota, którego sędziowie nie mogą odróżnić od prawdziwego człowieka i który może przekonać sędziów, że człowiek jest programem komputerowym. 100 000 USD to nagroda za pierwszego gadającego robota, którego sędziowie nie mogą odróżnić od prawdziwego człowieka w teście Turinga, który obejmuje odszyfrowanie i zrozumienie tekstu, obrazu i dźwięku. Po osiągnięciu tego celu coroczne zawody zakończą się.

Czy to znaczy, że Eugene wygrał 25 000 $?

George Chalhoub
źródło
2
Bardzo ważne jest, aby sędziowie wiedzieli, że są w sytuacji.
Thorbjørn Ravn Andersen
3
2/3 sędziów uważało, że ten bot nie był człowiekiem. Według mnie to mówi, że sztuczny charakter tej interakcji był widoczny dla większości sędziów. Nazwałbym to wyraźną porażką. (A nawet jeśli „Eugene” „wygrał” - jak sztuczna osoba zbiera prawdziwe pieniądze? BitCoin? :-)
Bob Jarvis - Przywróć Monikę
Czy możesz podać przykładową rozmowę? Codziennie kontaktuję się z Ukraińcami, a sposób, w jaki mówią po angielsku, jest łatwo rozpoznawalny.
Stephan Bijzitter,

Odpowiedzi:

18

Nie ma „oficjalnego testu Turinga”, więc nie ma koncepcji „oficjalnego zdania testu”. Turing opisał metodologię, którą można zastosować do oceny sztucznej inteligencji. Organizatorzy wydarzenia, które wygrał Eugene Goostman, wdrożyli tę metodologię w szczególny sposób, a program spełniał kryteria wybrane przez organizatorów. W tym sensie przeszedł test.

Ponieważ nie ma „oficjalnej testu Turinga”, to może być bardziej stosowne powiedzieć, że Eugeniusz Goostman przeszedł do testu Turinga, a nawet przeszedł test Turinga stylu. Jest mało prawdopodobne, że media by podnieść na takie subtelności, zwłaszcza biorąc pod uwagę sławę Turinga i ideę „ w teście Turinga” w świadomości publicznej.

David Richerby
źródło
3
Poza tym Eugene Goostman byłby śmieciem w oryginalnej grze imitującej Turinga ;-)
Steve Jessop
9

Myślę, że nagrody, o których mówisz, to Nagroda Loebnera . Według strony Wikipedii (patrz poprzedni link) zwycięzcą 2014 roku jest „Róża” Bruce'a Wilcoxa. Ten program nie wygrał jednej z nagród jednorazowych, ale otrzymał 4000 $ w nagrodach pieniężnych. „Eugene Goostman” startował w 2005 i 2008 roku, zajmując drugie miejsce za każdym razem.

Zwycięski konkurs „Eugene Goostman” został zorganizowany przez Kevina Warwicka z Coventry University z okazji 60 lat od śmierci Alana Turinga. Nie znam żadnych nagród pieniężnych.

Sprawdź, jak Ray Kurzweil przyjmuje zarówno konkurencję, jak i dany program. Fragment:

Profesor Warwick twierdzi, że test był „nieograniczony”. Jednak fakt, że chatbot twierdzi, że jest 13-letnim dzieckiem i dla którego angielski nie jest pierwszym językiem, jest faktycznie ograniczeniem. Co więcej, interakcje były podobno ograniczone do pięciu minut każda. Istnieje duże prawdopodobieństwo oszukiwania naiwnych sędziów w tak krótkim czasie.

Rozmawiałem z chatbotem Eugeneem Goostmanem i nie byłem pod wrażeniem. Eugene nie śledzi rozmowy, powtarza słowo po słowie i często odpowiada typowymi chatbotami, które nie są sekwencerami.

Uważam również, że jest to miły komentarz: WIRED - ten komputer faktycznie dostał ocenę F w teście Turinga

Eric Hughes
źródło
1
Podobał mi się również Wired, w szczególności „W konkursie w 1991 r. Bot o nazwie PC Therapist był w stanie zdobyć pięciu na 10 sędziów, którzy wierzyli, że to człowiek”. Również w odniesieniu do „specjalnego”> 30% progu oszukiwania: „Więc ojciec testu Turinga nie używał tego jako pewnego progu dla inteligencji, po prostu stwierdził, że jego przewidywania przewidują, że w przyszłości komputery będą miały pięć dekad. „
Fizz
10
Podsumowując: bot Eugene'a „zdał” ten test nie symulując ludzkiej inteligencji, ale symulując ludzką głupotę.
duskwuff
2

Dodanie linku do Wikipedii, aby uzyskać więcej informacji na temat „oryginalnego” testu Turinga . Istnieje wiele testów nazywanych „testem Turinga”. Wikipedia wspomina o „co najmniej 3 wersjach podstawowych”. Test zdany przez Eugeene nie jest żadnym z 3. Test zdany przez Eugeene nie został opracowany przez Alana Turinga, ale był to test o nazwie Test Turinga, zainspirowany przez Alana Turinga, i Eugeene go zdał.

Część wymieniająca co najmniej 3 podstawowe wersje testu Turinga:

Saul Traiger twierdzi, że istnieją co najmniej trzy podstawowe wersje testu Turinga, z których dwie są oferowane w „Maszynach komputerowych i inteligencji” i jedna, którą opisuje jako „Standardową interpretację”. Chociaż toczy się debata na temat tego, czy „Standardowa interpretacja” jest opisana przez Turinga, czy też oparta na błędnym odczytaniu jego pracy, te trzy wersje nie są uważane za równoważne, a ich mocne i słabe strony są wyraźne.

Wersja 1

Oryginalna gra Turinga opisywała prostą partyjną grę z udziałem trzech graczy. Gracz A to mężczyzna, gracz B to kobieta, a gracz C (pełniący rolę śledczego) jest dowolnej płci. W grze imitacyjnej gracz C nie widzi ani gracza A, ani gracza B i może się z nimi komunikować tylko za pomocą pisemnych notatek. Zadając pytania graczowi A i graczowi B, gracz C próbuje ustalić, który z nich jest mężczyzną, a który kobietą. Rolą gracza A jest nakłonienie śledczego do podjęcia niewłaściwej decyzji, podczas gdy gracz B próbuje pomóc śledczemu w podjęciu właściwej decyzji.

Wersja 2

Druga wersja pojawiła się później w artykule Turinga z 1950 r. Podobnie jak w oryginalnym teście gry naśladownictwa, rolę gracza A pełni komputer. Jednak rolę gracza B pełni mężczyzna, a nie kobieta. [...] W tej wersji zarówno gracz A (komputer), jak i gracz B próbują nakłonić przesłuchującego do podjęcia niewłaściwej decyzji.

Wersja 3

Powszechnie wiadomo, że celem testu Turinga nie jest konkretnie ustalenie, czy komputer jest w stanie oszukać interrogatora, aby wierzył, że jest człowiekiem, ale raczej, czy komputer może naśladować człowieka. Chociaż istnieje spór, czy ta interpretacja była zamierzona przez Turinga - Sterrett uważa, że ​​tak było, i dlatego łączy drugą wersję z tą, podczas gdy inne, takie jak Traiger, nie robią tego - doprowadziło to jednak do tego, co można postrzegać jako „ standardowa interpretacja ”. W tej wersji gracz A jest komputerem, a gracz B osobą dowolnej płci. Rolą przesłuchującego nie jest ustalenie, który jest mężczyzną, a który kobietą, ale który jest komputerem, a który człowiekiem. Podstawową kwestią w standardowej interpretacji jest to, że osoba przesłuchująca nie może odróżnić, który respondent jest człowiekiem, a który maszyną. Istnieją kwestie dotyczące czasu trwania, ale standardowa interpretacja ogólnie uważa to ograniczenie za coś, co powinno być uzasadnione.

Natomiast test zdany przez Eugeene sprawił, że sędziowie czatowali z chatbotem przez 5 minut, po czym musieli zdecydować, czy to bot, czy nie.

Peter - Unban Robert Harvey
źródło
0

Tak, wygrał „test” Turinga, który był zgodny z oryginalnym opisem Alana Turinga tak dokładnie, jak to możliwe.
Nie była to jednak wersja z nagrodami pieniężnymi o wartości 25 000 $, czyli Nagroda Loebnera, której specyfikacje różnią się od opisu Alana Turinga.
Co ważniejsze, Alan Turing nigdy nie chciał, aby był to prawdziwy test , więc wynik nie jest dowodem inteligencji, jeśli tak naprawdę chciałeś wiedzieć.

Don Patrick
źródło