Ze strony Wikipedii zatytułowanej korelacja nie oznacza związku przyczynowego ,
W przypadku dowolnych dwóch skorelowanych zdarzeń, A i B, możliwe różne zależności obejmują:
- A powoduje B (bezpośredni związek przyczynowy);
- B powoduje A (przyczynowość odwrotna);
- A i B są konsekwencjami wspólnej przyczyny, ale nie powodują siebie;
- Zarówno A, jak i B powodują C, który jest (jawnie lub domyślnie) uwarunkowany .;
- A powoduje B, a B powoduje A (przyczynowość dwukierunkowa lub cykliczna);
- A powoduje C, co powoduje B (przyczynowość pośrednia);
- Nie ma połączenia między A i B; korelacja jest zbiegiem okoliczności.
Co oznacza czwarty punkt. Zarówno A, jak i B powodują C, który jest (jawnie lub domyślnie) uwarunkowany. Jeśli A i B powodują C, dlaczego A i B muszą być skorelowane.
correlation
causality
matowy
źródło
źródło
Odpowiedzi:
„Uwarunkowanie” to słowo z teorii prawdopodobieństwa: https://en.wikipedia.org/wiki/Conditional_probability
Uwarunkowanie na C oznacza, że patrzymy tylko na przypadki, w których C jest prawdziwe. „Niejawnie” oznacza, że możemy nie ujawniać tego ograniczenia wyraźnie, a czasem nawet nie zdawać sobie z tego sprawy.
Ten punkt oznacza, że gdy zarówno A, jak i B powodują C, obserwacja korelacji między A i B w przypadkach, w których C jest prawdziwe, nie oznacza, że istnieje prawdziwy związek między A i B. To po prostu uwarunkowanie na C (być może niechętnie), że tworzy sztuczną korelację.
Weźmy przykład.
W kraju istnieją dokładnie dwa rodzaje chorób, całkowicie niezależne. Zawołanie A: „osoba ma pierwszą chorobę”, B: „osoba ma drugą chorobę”. Załóżmy, że , .P ( B ) = 0,1P.( A ) = 0,1 P.( B ) = 0,1
Teraz każda osoba, która ma jedną z tych chorób, idzie do lekarza i tylko wtedy. Zadzwoń do C: „osoba idzie do lekarza”. Mamy .do= A lub B
Teraz obliczmy kilka prawdopodobieństw:
Oczywiście, gdy uwarunkowane C, i są bardzo dalekie od niezależności. Właściwie uwarunkowane C, wydaje się „przyczyna” .ZA b n O t b
Jeśli korzystasz z listy osób, które zostały nagrane przez lekarza (y) jako źródło danych do analizy, to nie wydaje się być silna korelacja pomiędzy chorobami i . Być może nie zdajesz sobie sprawy z faktu, że twoje źródło danych jest tak naprawdę warunkiem. Jest to również nazywane „nastawieniem selekcyjnym”.ZA b
źródło
Czwarty punkt jest przykładem paradoksu Berksona , znanego również jako warunkowanie na zderzaczu , znanego również jako zjawisko wyjaśniające .
Jako przykład weźmy młodą kobietę, która jest często zapraszana przez młodych mężczyzn na randki i musi zdecydować, czy przyjąć lub odrzucić każdą propozycję daty. Młodzi mężczyźni różnią się pod względem atrakcyjności i uroku i załóżmy, że te dwie cechy są niezależne w populacji mężczyzn proponujących randki. Oczywiście, młoda kobieta jest bardziej skłonna zaakceptować propozycję randki, im bardziej atrakcyjny i czarujący jest mężczyzna. Model przyczynowy dla takiej sytuacji może wyglądać następująco:
źródło
Paradoksalnie Simpsona i paradoksem Berksona każdy może przykładach przedstawiono „A i B powodują C, którym jest (bezpośrednio lub pośrednio) uwarunkowana”
źródło
Akapit zaczyna się od „Dla dowolnych dwóch skorelowanych zdarzeń A i B, ...”, więc domyślam się, że korelacja jest zakładana na początku. Innymi słowy, nie muszą być skorelowane, aby jednocześnie powodować C, ale jeśli były skorelowane i oba spowodowały C, nie oznacza to, że istnieje związek przyczynowy między nimi.
źródło