Co to jest francuska analiza danych?

9

Niektóre metody statystyczne - nie pamiętam, czy jest to analiza głównego składnika, czy coś w tym rodzaju - są czasami nazywane „francuską analizą danych”. Co to właściwie jest ? A niektórzy mówią, że to imię jest ironiczne, czy to prawda i dlaczego?

Stéphane Laurent
źródło
1
Dobre pytanie! Dopiero wczoraj zauważyłem, że Analyze des données jest „dodatkowym artykułem” na francuskiej Wikipedii i że jego zawartość bardzo różni się od artykułu dotyczącego analizy danych w angielskiej Wikipedii .
onestop
4
Być może ten artykuł jest interesujący: Analiza danych na wielu odmianach: po francusku
Tim
2
Ten artykuł wydaje się odpowiadać na pytanie - i jest to pierwszy hit w Google. Może to wcale nie było takie dobre pytanie ...
onestop
2
muszą być zaangażowane języki
Aksakal

Odpowiedzi:

16

Analiza danych w stylu francuskim jest zwykle identyfikowana jako praca oparta na analizie korespondencji i innych pracach zorientowanych spektralnie, ale w rzeczywistości jest głębsza. Szczególnie pomocne jest odniesienie Tima do utworu Holmesa.

Nieco szerszym obrazem byłoby stwierdzenie, że styl francuski przyjmuje aksomatyczne, geometryczne i matematyczne podejście do matryc danych, a nie modelowanie statystyczne. Termin musi być trochę ironiczny, ponieważ chociaż CA został spopularyzowany przez Benzecri, LeBart itp. (Francuski), ma prekursory w Hirschfeld (niemiecki) i następców w de Leeuw / Gifi (holenderski) i popularyzatorów w Greenacre (południowoafrykański). Greenacre zauważył również ważne połączenie z uogólnionym SVD i wygenerował dla mnie jedyną czytelną książkę na ten temat. Dyskusje mogą stać się żrące - patrz recenzja Murtagha de Leeuw .

Przydatnym przykładem obserwowania porównawczych konsekwencji stylu jest analiza tabel krzyżowych. Za pomocą prostej tabeli przestawnej można porównać „francuski” styl prostej analizy korespondencji opartej na rozkładzie widmowym odpowiednio przekształconej tabeli, z modelowaniem asocjacji (np. Goodmana, Clogga lub Habermana) opartym na ustrukturyzowanych terminach interakcji w podstawowym logicznym modelu liniowym . W rzeczywistości te dwa podejścia generują bardzo podobne parametryzacje (i parametry!), Ale fokus jest zupełnie inny. Agresti (1990) ma doskonałą dyskusję.

sprzężonyprior
źródło
1
Wspomniałeś o zespole Gifi (aka Leiden univ. Nom de plume ) i że praca Greenacre jest naprawdę dobra! Właśnie czytam książkę, w której autorzy przedstawiają obszerną dyskusję na temat twojego ostatniego akapitu. Mój duży +1.
chl
3

Może „analiza korespondencji”? : http://en.wikipedia.org/wiki/Correspondence_analysis, ponieważ został opracowany przede wszystkim przez francuskiego badacza Jean-Paula Benzecri?

Florian
źródło
1
Jeden powiedział mi, że ta „francuska analiza wielowymiarowa danych” została ironicznie nazwana „francuską analizą danych”, ponieważ w momencie tworzenia tych metod były one niewykonalne (zbyt intensywne obliczeniowo).
Stéphane Laurent
2
Florian> Opracowany przez Benzecri i intensywnie używany przez Bourdieu.
2
@ StéphaneLaurent: mimo że aksjomatyzacja przeszła przez ogrodzenie w typowy francuski sposób, analiza Donnéesa była praktyczna i użyta. Jeśli możesz zdobyć „Cahiers de l'Analyse des Données” , możesz to sprawdzić!
Xi'an