Jaki jest związek między korelacją a przyczynowością w uczeniu maszynowym?

13

Powszechnie wiadomo, że „Korelacja nie jest równoznaczna z przyczynowością”, ale uczenie maszynowe wydaje się prawie w całości oparte na korelacji. Pracuję nad systemem do oceny wyników uczniów na podstawie pytań na podstawie ich poprzednich osiągnięć. W przeciwieństwie do innych zadań, takich jak wyszukiwarka Google, nie wygląda to na taki system, w który można łatwo grać - więc związek przyczynowy nie jest tak naprawdę istotny w tym zakresie.

Oczywiście, jeśli chcemy przeprowadzić eksperymenty w celu optymalizacji systemu, będziemy musieli dbać o rozróżnienie korelacja / związek przyczynowy. Ale czy z punktu widzenia samej budowy systemu wybierania pytań, które mogą mieć odpowiedni poziom trudności, to rozróżnienie ma jakieś znaczenie?

Casebash
źródło
Proszę zdefiniować lub przynajmniej odnieść się do tego, co masz na myśli przez związek przyczynowy w „Korelacja nie oznacza związku przyczynowego”
seteropere

Odpowiedzi:

11

Nie wszystkie AI działają na korelację, Bayesian Belief Networks zbudowane są wokół prawdopodobieństwa, że ​​A powoduje B.

Pracuję nad systemem do oceny wyników uczniów na podstawie pytań na podstawie ich poprzednich osiągnięć.

Nie sądzę, że potrzebujesz do tego przyczyn. Dotychczasowe wyniki nie powodują bieżącego działania. Odpowiedź na pierwsze pytanie nie powoduje odpowiedzi na późniejsze pytanie.

Ale z punktu widzenia samej budowy systemu wybierania pytań, które mogą mieć odpowiedni poziom trudności - czy to rozróżnienie ma jakieś znaczenie?

Nie, nie dla twojego przykładu. Myślę, że korelacja (lub nawet zwykła ekstrapolacja) rozwiązałaby twój problem bardzo dobrze. Przypisz poziom trudności do każdego z pytań, a następnie zadawaj pytania uczniom na coraz trudniejszych poziomach (tak działa większość egzaminów), a następnie, gdy uczeń zacznie je mylnie, możesz cofnąć trudność. Jest to algorytm sprzężenia zwrotnego podobny do minimalizacji błędów przeprowadzanej na neuronie w wielowarstwowym perceptronie. Nietrywialna część takich miejsc wejściowych decyduje o tym, jakie trudne pytanie!

Lepszym przykładem związku przyczynowego w AI byłoby:

Mój samochód zwalnia. Mój akcelerator leży na podłodze. Nie ma dużo hałasu. Na desce rozdzielczej znajdują się światła. Jakie jest prawdopodobieństwo, że skończy mi się paliwo?

W takim przypadku brak paliwa spowodował zwolnienie prędkości samochodu. Właśnie taki problem rozwiązują Bayesian Belief Networks.

Dr Rob Lang
źródło
„Nie sądzę, abyś potrzebował do tego przyczyn. Wcześniejszy występ nie powoduje bieżącego wykonania. Odpowiedź na wczesne pytanie nie powoduje odpowiedzi na późniejsze pytanie”. - cóż, fakt, że uczeń ukończył ćwiczenie, może sprawić, że wykona on lepsze ćwiczenie na innym ćwiczeniu (zapewniamy im wskazówki, porady itp.).
Casebash
Ale przypuszczam, że masz rację, nie chodzi tu tyle o korelację a przyczynowość, ale o to, czy jest to skorelowane z przyczynowością (tj. Uczniowie w danej klasie dobrze sobie radzą z zagadnieniami z geometrii, ponieważ nauczyciel szczegółowo to omówił, w porównaniu z uczniami, którzy ukończyli najtrudniejsze tematy, które mają dobre wyniki, ponieważ tylko oni się do tego
nadają
Ach! To interesujące: ukończenie ćwiczenia i poznanie jego wyniku jest przyczyną lepszej odpowiedzi na pytania. Ale tutaj nie można tego zaobserwować. Jedyne, co obserwujesz, to pytania egzaminacyjne, które są ze sobą powiązane. Korelacja nie jest brudna, można powiedzieć, że dwa procesy statystyczne są powiązane.
Dr Rob Lang
Przyczyny B to jedna interpretacja sieci przekonań.
seteropere
6

uczenie maszynowe wydaje się prawie w całości oparte na korelacji

Nie sądzę, przynajmniej ogólnie. Na przykład głównym założeniem algorytmów ML w zakresie analizy PAC i analizy wymiarów VC jest to, że dane szkoleniowe / testowe pochodzą z tego samego rozkładu, co przyszłe dane.

Tak więc w twoim systemie należy założyć, że każdy uczeń narzuca pewien warunkowy rozkład prawdopodobieństwa, który generuje odpowiedzi na określone typy pytań na określone tematy. Kolejnym i bardziej problematycznym założeniem, które musisz przyjąć, jest to, że ten rozkład się nie zmienia (lub nie zmienia się szybko).

BartoszKP
źródło
2

Zgadzam się z wcześniejszymi odpowiedziami.

Jeśli jednak chcesz spojrzeć na korelację / związek przyczynowy w ogólności, dwa elementy, na które możesz chcieć spojrzeć, to:

  • Pearl (tak, ta Pearl ) wydała na ten temat jedną z niewielu porządnych książek.
  • Uczenie się o wzmocnieniu i problem wielorękiego bandyty opierają się wokół aktora, który stara się uzyskać optymalne kierunki działania w nieznanym środowisku - tj. Muszą dowiedzieć się, które „działania” zapewnią im najlepszą „nagrodę”, a zatem w sposób pośredni dokuczać przyczynom relacje.

źródło
2

Oprócz innych odpowiedzi istnieje ciekawy temat - jeśli ręcznie wybierasz funkcje, możesz pomyśleć o „przypadkowej korelacji”, aby zmniejszyć nadmierne dopasowanie, tj. Unikać funkcji, które w jakiś sposób są skorelowane w danych treningowych, ale nie nie powinno być skorelowane w ogólnym przypadku - że nie ma żadnego związku przyczynowego.

Jako przybliżony przykład załóżmy, że weźmiesz tabelę danych historycznych wyników egzaminów i spróbujesz przewidzieć kryteria zaliczenia / zaliczenia; po prostu dołączasz wszystkie dostępne pola danych jako funkcje, a tabela ma również urodziny uczniów. Teraz może istnieć ważna korelacja w danych szkoleniowych, że uczniowie urodzeni 12 lutego prawie zawsze przechodzą, a uczniowie urodzeni 13 lutego prawie zawsze zawodzą ... ale ponieważ nie ma związku przyczynowego, należy to wykluczyć.

W prawdziwym życiu jest to nieco bardziej subtelne, ale pomaga odróżnić korelacje, które pasują do twoich danych do prawidłowych sygnałów, których należy się nauczyć; oraz korelacje, które są po prostu wzorami powodowanymi przez przypadkowy hałas w zestawie treningowym.

Piotr jest
źródło