Miałem pytanie dotyczące parametru głębokości interakcji w gbm w R. To może być pytanie nooba, za które przepraszam, ale w jaki sposób parametr, który moim zdaniem oznacza liczbę węzłów końcowych w drzewie, zasadniczo wskazuje X-way interakcja między predyktorami? Próbuję zrozumieć, jak to działa. Dodatkowo dostaję całkiem różne modele, jeśli mam zestaw danych z, powiedzmy, dwiema różnymi zmiennymi czynnikowymi w porównaniu z tym samym zestawem danych, z wyjątkiem tych dwóch zmiennych czynnikowych połączonych w jeden czynnik (np. Poziomy X w czynniku 1, poziomy Y w czynniku 2, zmienna łączona ma Czynniki X * Y). Ta ostatnia jest znacznie bardziej przewidywalna niż pierwsza. Myślałem, że zwiększenie głębi interakcji podniesie ten związek.
źródło
Związek między interakcją. Głębokością a liczbą węzłów końcowych
interaction.depth
interaction.depth
Związek między interakcją. Głębokością a kolejnością interakcji
Powiązanie
interaction.depth
i kolejność interakcji są bardziej nużące.Zamiast rozumowanie z interaction.depth, niech powód z liczbą węzłów końcowych, które będziemy zwanych J .
Przykład: załóżmy, że masz J = 4 węzły końcowe (interakcja.depth = 3), możesz:
źródło
Poprzednia odpowiedź jest nieprawidłowa.
Kikuty będą miały interakcję. Głębokość 1 (i mają dwa liście). Ale interakcja. Głębokość = 2 daje trzy liście.
Tak więc: NumberOfLeaves = interact.depth + 1
źródło
Właściwie poprzednie odpowiedzi są niepoprawne.
co jest równoważne z:
źródło
Możesz spróbować
tabela (przewidywanie (gbm (y ~., data = TrainingData, dystrybucja = "gaussian", verbose = FAŁSZ, n. drzewa = 1, skurcz = 0,01, torba. frakcja = 1, interakcja. głębokość = 1), n. drzewa = 1))
i zobacz, że istnieją tylko 2 unikalne przewidywane wartości. Interakcja.depth = 2 da ci 3 różne przewidywane wartości. I przekonaj się.
źródło