Patrzyłem na ten zeszyt i zastanawia mnie to stwierdzenie:
Kiedy mówimy o normalności, mamy na myśli, że dane powinny wyglądać jak rozkład normalny. Jest to ważne, ponieważ polega na tym kilka testów statystycznych (np. Statystyki t).
Nie rozumiem, dlaczego statystyka T potrzebuje danych do normalnego rozkładu.
Rzeczywiście Wikipedia mówi to samo:
Rozkład t-Studenta (lub po prostu rozkład t) to dowolny członek rodziny ciągłych rozkładów prawdopodobieństwa, który powstaje przy szacowaniu średniej populacji normalnie rozłożonej
Nie rozumiem jednak, dlaczego to założenie jest konieczne.
Nic z jego formuły nie wskazuje mi, że dane muszą mieć normalny rozkład:
Spojrzałem trochę na jego definicję, ale nie rozumiem, dlaczego warunek jest konieczny.
Myślę, że może być pewne zamieszanie między statystyką i jej formułą, a rozkładem i jej formułą. Możesz zastosować formułę statystyki t do dowolnego zestawu danych i uzyskać „statystykę t”, ale ta statystyka nie będzie dystrybuowana zgodnie z rozkładem t-ucznia, chyba że dane pochodzą z rozkładu normalnego (a przynajmniej nie będą gwarantuję, że tak; przypuszczam, że niestandardowe rozkłady nie wytworzą rozkładu t-studenta, gdy zastosowana zostanie formuła t-statystyki, ale nie jestem tego pewien). Powodem tego jest po prostu to, że rozkład statystyki t jest obliczany na podstawie rozkładu danych, które ją wygenerowały, więc jeśli masz inny podstawowy rozkład, to nie masz gwarancji, że masz taki sam rozkład dla statystyk pochodnych.
źródło